Unicode 1.0
読み:ユニコード-いってんぜろ
外語:Unicode 1.0

 Unicodeの最初の版。
目次

概要
 Unicode 1.0の仕様書は、Latin部と漢字部の二分冊で出された。
 Latin部のVolume 1は1991(平成3)年10月に、漢字部のVolume 2は1992(平成4)年6月に出版されている。
 そして漢字部が出た際、Addendum(追補)としてUnicode 1.0.1という仕様変更を伴う修正が出されている。
 1.0.1は、6文字の削除と、外字領域の符号位置の変更などがある。削除は、DIS 10646第二版(ISO/IEC 10646-1の前身)で採用されなかったため、とされている。

沿革

特徴

対応言語
 Unicode 1.0.0時点では、まだ漢字に対応していない。CJK統合漢字は、Volume 2である1.0.1から追加された。
 Unicode 1.0.1で利用可能な文字の種類は次のとおりである(文字番号順)。
 記号に近いものとして、次のような文字も収録されている。

削除された6字
 Unicode 1.0.0にあり、Unicode 1.0.1で削除された2字は、次の通りである。
 Unicode 1.0.0にあり、Unicode 1.0.1で統廃合された4字は、次の通りである。

1.0.1での仕様変更
 Unicode 1.0.1では、次の仕様変更が行なわれている。
 このほか、Unicode 1.0.0ではBOMに使われるU+FEFFが「BYTE ORDER MARK」というそのままの名前だったが、Unicode 1.0.1では「ZERO WIDTH NO-BREAK SPACE」という名前に変更されている。

1.1での仕様変更

変更点
 Unicode 1.0から、次の版であるUnicode 1.1で仕様変更になるのは、次の箇所である。
 詳細は、Unicode 1.1の項を参照のこと。

NON-SPACING → COMBINING
 U+03xxなどを中心に存在する「NON-SPACING」(文字送りをしない)文字は、次のUnicode 1.1以降では「COMBINING」(結合)に変更されている。
 名前と若干の機能が変更になっているようである。
 新旧の両者を「同一の文字」と見なせるのかどうかは、議論の対象であろう。

チベット文字
 Unicode 1.0.1までは、U+1000〜U+104Cにチベット文字が存在したが、次のUnicode 1.1では文字が全て削除されている。
 チベット文字は、Unicode 2.0から符号位置をU+0F00〜U+0FFFに変えて、再定義された(配置、文字数などは異なる)。

統廃合
 Unicode 1.1になるに際し、重複等を理由として統合される文字は、次の通りである。
 矢印の左側がUnicode 1.0.0の番号、右がUnicode 1.1の番号だが、右の文字はUnicode 1.0にも存在する。つまり、右の文字番号に統廃合されたことになる。文字の名前は、Unicode 1.0での名称である。
 Unicode 1.0→1.1以降のコンバーターを作る場合は、片方向変換をすることになる。

符号位置変更
 以下の文字は、Unicode 1.1以降で符号位置が変更になる。

再検索