通信用語の基礎知識 全国のICカードこれひとつ 戻る

非文字
辞書:通信用語の基礎知識 通信技術文字用語編 (CTCHRY)
読み:ひもじ
外語:noncharacters
品詞:固有名詞

文字コードにおいて、文字ではない符号位置のこと。

目次
概要

文字コードでは、物理的に表わすことができる範囲内であっても、文字を定義していない符号位置が存在する。それが非文字である。

未定義で将来的に追加予定の符号位置だけではなく、規格として文字を定義しないと決められた符号位置も存在する。

特徴
Unicodeの非文字

Unicodeでは、幾つかの符号位置が非文字として定義されている。

U+FDD0〜U+FDEF

この符号位置は、Unicode 3.1から非文字となった。根拠は定かではない。

歴史的な事情により「アラビア文字 表示形A」の領域中にあるが、この非文字はアラビア文字でも、「right-to-leftな非文字」でもない。

U+FFFE

この符号位置は、BOM(U+FEFF)とバイトが逆になっている。

識別のため、この符号位置は使用しないことになっている。従って、もし先頭にU+FFFEが見えれば、逆のエンディアンを使って読めば正しく読めることを意味する。

U+FFFF

この符号位置が非文字として保存されている根拠は定かではない。

U+nFFFE、U+nFFFF

サロゲートペアで表わされる領域の末端二文字も、BMPと同様に非文字として予約されている。根拠は定かではない。

この符号位置は、Unicode 3.1から非文字であることが明確化されたが、Unicodeは、それ以前からも非文字だったとしている。根拠は定かではない。

具体的には、つぎの符号位置である。

リンク
関連する用語
文字コード
Unicode

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic