通信用語の基礎知識 IPv4
戻る
参加者募集中

ユーザー定義外字

辞書:通信用語の基礎知識 通信技術文字用語編 (CTCHRY)
読み:ゆーざーていぎがいじ
外語:user defined characters 英語
品詞:名詞
1998/12/04 作成
2011/08/31 更新

利用者が独自に字形を設定して用いる文字(外字)のこと。

作成した文字には、外字用の文字番号を割り当て、他の文字と併用できるようにしている。

外字用の文字コードにどのような文字パターンが登録されるかは、利用者ごとに完全にまちまちである。

従って、外字を使用した文書を第三者に渡す場合、その外字のパターン情報なども同時に渡さない限り、他の機械で全く同一に表示・処理することはできない。

情報通信には利用できないという制約はあったが、普通の文字と同様に表示や印刷が出来るという利点があり、単体の機械で表示したりする程度の利用範囲であれば便利な存在といえる。

またフォントデータによってはJISなどの規格で未定義のコードポイントに独自の文字をあらかじめ定義してある場合があり、これをシステム外字もしくは機種依存文字と呼ぶ事がある。

JIS X 0208/JIS X 0213

未定義

JIS X 0208や旧JIS C 6226、そしてJIS X 0213も含めて、規格として外字領域を規定したことはない。

各実装が、未定義領域を利用して独自に外字領域を設定していた。

シフトJIS

WindowsシフトJIS(CP932)の文字集合Windows-31Jでは、次の領域をユーザー定義外字領域としている。

  • 0xF040〜0xF9FC

20区、1880字分が用意されている。

EUC-JPなど

Windowsの外字文字などは規格外の存在である。しかし、他の符号で情報欠落なく表現することが求められた結果、次のような様々な符号が作られた。

なお、Windowsの標準EUC-JPはCP51932と呼ばれ、これは外字には対応していない。

ISO-2022-JP系符号

EUCだけでなく、ISO-2022-JPでも情報欠落なく表現することが求められた結果、次のような様々な符号が作られた。

CP5022xはWindowsの標準だが、ISO/IEC 2022から外れた異常な符号を用いている。

Unicode

Unicode環境では、次の領域がユーザー定義外字領域とされている。

  • BMP領域 U+E000‐U+F8FF (6,400字)
  • 15面 U+F0000‐U+FFFFD (65,534字)
  • 16面 U+100000‐U+10FFFD (65,534字)

合計137,468字が利用可能となっている。

日本語Windowsで使うシフトJISの0xF040〜0xF9FCは、U+E000〜U+E757に割り当てられている。

Windowsの外字エディターは、文字セットをUnicodeにするとU+E000〜U+F8FFまでを利用できるが、U+E758〜U+F8FFはシフトJISでは表現できないためUnicode専用となる。

ISO/IEC 10646

Unicodeを含む国際規格ISO/IEC 10646では、更に次の領域をユーザー定義外字領域としている。

  • 00群224面〜255面 0x00E00000‐0x00FFFFFF (2,097,152字)
  • 96群〜127群 0x60000000‐0x7FFFFFFF (536,870,912字)

2,097,152字と536,870,912字、Unicodeの137,468字を合わせると539,105,532字、つまり5億字以上自由に利用可能なようになっている。

用語の所属
文字コード
機種依存文字
外字
関連する用語
シフトJIS
Unicode

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.03 (16-May-2019)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club