GB 18030

読み:ジービーいちはちまるさんまる
外語:GB 18030
品詞:名詞

2000(平成12)年3月17日に公布された支那の文字エンコード規格の一つ。

支那では、これまでパソコン等ではGBKと呼ばれる符号を利用しており、これはこれでかなりの量の漢字文字が利用できた。

しかし漢字以外の文字を利用するにはUnicode(支那規格GB 13000)等の利用が必要だった。しかしUnicodeの符号(UTF-16UTF-8など)は、既に普及しているGBK符号とは全く互換性がなく、移行するには敷居が高かった。そこで、GBKと完全上位互換になるように工夫しながらUnicodeを飲み込んだものがGB 18030という国家標準である。

具体的には、1バイト目が8/1〜15/14と従来通りで、新たに2バイト目に3/0〜3/9を追加し、この2バイトを二組(つまり4バイト)にして利用する。

こうすることで126×10の更に2乗、つまり157,500文字が新たに利用可能となり、この領域に既にGBKとして2バイト以内で利用できる文字を除いたUnicode文字を順番に割り当てている。