Big5

読み:ビッグファイブ
外語:Big5
品詞:固有名詞

台湾の財團法人資訊工業策進會(資策会)が1984(昭和59)年に規定した漢字文字表(CCS)および符号化方法(CES)の標準。

台湾における主要ソフトベンダ5社共通のコード体系ということで、Big5の名が付けられた。

現在台湾では最も普及している符号であり、様々な亜種がある。

Big5はASCIIの上位互換として作られている符号系の上に、漢字文字表をマッピングする1〜2バイトの不定長コードである。

2バイト文字は、1バイト目は8/1〜15/14、2バイト目は4/0〜7/14と10/1〜15/14である。

このうち規格として文字を割り振るのは1バイト目10/1〜15/9までで、残るもの(8/1〜10/0と15/10〜15/14)は外字用領域である。

主だったものだけでも、5種類がある。

  • Big5:2003
  • Big5:1984
  • Big5-ETen(倚天拡充字集)
  • CP950(Windows)
  • BIG5-IBM

このほかにも、中文數位化技術推廣基金會(CMEX)によるBig-5+やBig-5E、香港による拡張(Big5-HKSCS:1999やBig5-HKSCS:2001)、Apple Mac OSによる実装などがある。

CNS 11643と混同する向きもあるが、両者は本質的に異なるものであり、文字表についても類似点は多いが互いの互換性は無い。

文字コード順に、次のようになっている。カッコ内は日本語訳である。

  • 8140〜A0FE 使用者造字區(外字)
  • A140〜A3FE 標準字(非漢字)
  • A440〜C67E 常用字(第一水準)
  • C6A1〜C8FE 特殊符號(非漢字)
  • C940〜F9FE 次常用字(第二水準)
  • FA40〜FEFE 使用者造字區和新常用字(外字)

当初のBig5すなわちBig5:1984で対応するのは、A140〜A3FEの標準字とA440〜C67Eの常用字だけだった。外字や次常用字、特殊符號には後の版(Big5:2003など)より対応した。

次常用字(第二水準)には2文字(A461とC94A、DCD1とDDFC)について重複したコードが与えられている。