Unicode 3.1
読み:ユニコード-さんてんいち
外語:Unicode 3.1

 Unicodeの版の一つで、Unicode 3.0に対する改訂版である。
目次

概要
 01面以降の面のうち、01面、02面、および14面の面の名前が決定した。
 これに伴い、01面、02面に各種の文字が、14面にタグが、それぞれ追加され、扱える文字の数が大幅に増加した。

沿革

特徴

対応ISO/IEC 10646
 ISO/IEC 10646-2:2001に対応した。これにより、BMP以外の文字が追加された。
 日本語に関係するところでは、CJK統合漢字拡張B(Ext-B)の追加により、JIS X 0213:2000の殆どの文字に対応した。

対応言語
 追加された文字から推定される新規対応言語は、以下の通りである。併記はISO 639-2またはISO 639-3の言語コード。

新規対応
 この版で、次に新規対応した。

追加文字
 3.1から追加された文字は、次の通り(文字コード順)。

改訂
 Unicode 3.1.1は、UCDファイルの幾つかの問題の修正をしたバージョンである。

仕様

タグ
 タグに使うことができる文字がU+E0000〜U+E007Fに追加されている。
 U+E0020〜U+E007EまではASCIIの0x20〜0x7eと同じ配列になっている。
 現時点では、言語タグとして、U+E0001(language tag)から始めると言語を指定するタグとして機能する。
 実用例は皆無だが、RFCでは、RFC 5466に次のような用例の記載がある。
 言語の処理は、文字コードの層ではなく、より上位の層(HTMLやXMLなど)で行なうべきという議論もあり、追加こそされたものの、実際には殆ど使われていない。
 例えばXMLにはxml:lang属性があり、Unicodeの言語タグと併用されると矛盾が発生する。そこでXMLでは、xml:lang属性を使い、Unicodeの言語タグは使用しないということで結論を見ている。

再検索