CJK統合漢字

読み:スィージェイケイ・とうごうかんじ
外語:CJK Unified Ideographs: China-Japan-Korea Unified Ideographs
品詞:名詞

Unicodeとして実装されている漢字コードのこと。

これは、Unicode consortiumがUnicodeを制定する際に使用した、支那語(Chinese)・日本語(Japanese)・朝鮮語(Korean)の似た漢字を統合して文字コード数を減らすためのアイディアであった。

一部に古いベトナム(Vietnam)の文字が含まれることから、CJKV統合漢字と呼ぶ向きもあるが一般的でない。

CJK統合漢字はUnicode 1.0においてまず、Unicode表のうち基本多言語面(BMP)のI領域(U+4E00〜U+9FFF)に配置された20,902文字の漢字が最初である。

当然文字が不足するので一部よりUnicode批判が渦巻くことになるが、その後サロゲート領域が拡張され、16ビット範囲に無理に収める必要がなくなったことから、漢字文字の追加も積極的に行なえるようになった。

Unicode 3.0よりBMP領域のU+3400〜U+4DB5にCJK Ideograph Extension A(Ext-A)として6,582文字が拡張され、Unicode 3.1からはサロゲート領域のU+20000〜U+2A6D6にCJK Ideograph Extension B(Ext-B)として42,711字がそれぞれ追加された。

Unicode 5.0.0ではExt-AがU+3400〜U+4DBFと10文字分増やされている。

また将来的に、サロゲート領域にCJK Ideograph Extension C(Ext-C)が追加予定で、これで更に漢字数が増やされる見込みである。