Unicode 2.0 - 通信用語の基礎知識

Unicodeの版の一つで、Unicode 1.1に対する改訂版である。

概要

Unicode 2.0は、Unicode 1.1に文字の追加や、一部仕様変更を加えた版である。

Unicode 1.1で一旦削除されたチベット文字の再登録や、ハングルの符号位置の変更など、大きな仕様変更も存在する。

Unicodeの大きな仕様変更はこの版を最後としており、以降は原則として追加のみである。

このためUnicodeの最も基本的な集合であるとも言え、もはや陳腐化したとも言えるTRONコードではUnicode 2.0の文字集合に対応する。

沿革

特徴

対応ISO/IEC 10646

発行時期に相違がある(更に全てUnicode 2.0以降に発行)が、Unicode 2.0で採用されたのは、次の追補である。

ISO/IEC 10646-1:1993/Amd.1:1996 (Transformation Format for 16 planes of group 00 (UTF-16))
ISO/IEC 10646-1:1993/Amd.2:1996 (UCS Transformation Format 8 (UTF-8))
ISO/IEC 10646-1:1993/Amd.3:1996 (Code positions for control characters)
ISO/IEC 10646-1:1993/Amd.4:1996 (Removal of annex G (UTF-1))
ISO/IEC 10646-1:1993/Amd.5:1998 (Hangul syllables)
ISO/IEC 10646-1:1993/Amd.6:1997 (Tibetan)
ISO/IEC 10646-1:1993/Amd.7:1997 (33 additional characters)

詳細は後述するが、Amd.1のサロゲートペアを採用し、1.0にはあったチベット文字がAmd.6で復活し、そしてAmd.5でハングルの大移動がなされUnicode 1.xとの互換性を失った。

対応言語

追加されたラテン文字U+1E9Bは、古いアイルランド語で使われていたとされているが、現用ではない。

追加された文字から推定される新規対応言語は、以下の通りである。

追加文字

2.0から追加された文字は、次の通り(文字コード順)。