| ア | イ | ウ | エ | オ |
| カ | キ | ク | ケ | コ |
| サ | シ | ス | セ | ソ |
| タ | チ | ツ | テ | ト |
| ナ | ニ | ヌ | ネ | ノ |
| ハ | ヒ | フ | ヘ | ホ |
| マ | ミ | ム | メ | モ |
| ヤ | ユ | ヨ | ||
| ラ | リ | ル | レ | ロ |
| ワ | ヰ | ヴ | ヱ | ヲ |
| ン |
| A | B | C | D | E |
| F | G | H | I | J |
| K | L | M | N | O |
| P | Q | R | S | T |
| U | V | W | X | Y |
| Z | 数字 | 記号 | ||
文字コードにおいて、文字ではない符号位置のこと。
文字コードでは、物理的に表わすことができる範囲内であっても、文字を定義していない符号位置が存在する。それが非文字である。
未定義で将来的に追加予定の符号位置だけではなく、規格として文字を定義しないと決められた符号位置も存在する。
Unicodeでは、幾つかの符号位置が非文字として定義されている。
この符号位置は、Unicode 3.1から非文字となった。根拠は定かではない。
歴史的な事情により「アラビア文字 表示形A」の領域中にあるが、この非文字はアラビア文字でも、「right-to-leftな非文字」でもない。
この符号位置は、BOM(U+FEFF)とバイトが逆になっている。
識別のため、この符号位置は使用しないことになっている。従って、もし先頭にU+FFFEが見えれば、逆のエンディアンを使って読めば正しく読めることを意味する。
この符号位置が非文字として保存されている根拠は定かではない。
サロゲートペアで表わされる領域の末端二文字も、BMPと同様に非文字として予約されている。根拠は定かではない。
この符号位置は、Unicode 3.1から非文字であることが明確化されたが、Unicodeは、それ以前からも非文字だったとしている。根拠は定かではない。
具体的には、つぎの符号位置である。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます