外字

読み:がいじ
外語:external characters , user defined characters
品詞:名詞

利用者が独自に字形を設定して用いる文字のこと。

作成した文字には、外字用の文字番号を割り当て、他の文字と併用できるようにしている。

外字用の文字コードにどのような文字パターンが登録されるかは、利用者ごとに完全にまちまちである。

従って、外字を使用した文書を第三者に渡す場合、その外字のパターン情報なども同時に渡さない限り、他の機械で全く同一に表示・処理することはできない。

情報通信には利用できないという制約はあったが、普通の文字と同様に表示や印刷が出来るという利点があり、単体の機械で表示したりする程度の利用範囲であれば便利な存在といえる。

またフォントデータによってはJISなどの規格で未定義のコードポイントに独自の文字をあらかじめ定義してある場合があり、これをシステム外字もしくは機種依存文字と呼ぶ事がある。

JIS X 0208

JIS X 0208は旧JIS C 6226も含めて、規格として外字領域を規定したことは無い。現在のJIS規格JIS X 0208では外字の使用を明確に禁止している。

しかしシフトJISは、1区から94区までのJIS X 0208より範囲が広いため、実装として、例えばWindowsのシフトJIS環境では95区〜114区相当(0xF040〜0xF9FC)の範囲に合計1,880文字の領域を用意し、外字文字として利用可能とした。

JIS X 0213

JIS X 0213の時代となり、新たに第2面の1区〜94区が追加されたことで大きな問題となった。

JIS X 0213のシフトJIS符号化であるShift_JIS-2004は、第2面について95区〜120区相当の領域を使用するからである。

つまり、シフトJIS環境でJIS X 0213を使用する場合、それと文字コードが重複する外字は使用できないわけである。

Unicode

Unicode環境ではU+E000〜U+F8FFの6,400文字が利用できる。

また仕様上は、15面(U+F0000〜U+FFFFF)と、16面(U+100000〜U+10FFFF)も外字領域として利用可能だが、これに対応した実装は現時点では殆どないものと考えられる。

ISO/IEC 10646

Unicodeを含む国際規格ISO/IEC 10646では、00群224面〜255面(0x00E00000〜0x00FFFFFF)と、96群〜127群 (0x60000000〜0x7FFFFFFF)を外字領域としている。

2,097,152字と536,870,912字、合わせて538,968,064字つまり5億字以上自由に利用可能なようになっている。

これに対応した実装は、現時点では知られていない。