通信用語の基礎知識 全国のICカードこれひとつ 戻る

Unicode 1.0
辞書:通信用語の基礎知識 通信技術文字集合編 (CTCHRS)
読み:ユニコード-いってんぜろ
外語:Unicode 1.0
品詞:固有名詞

Unicodeの最初の版。

目次
概要

Unicode 1.0の仕様書は、Latin部と漢字部の二分冊で出された。

Latin部のVolume 1は1991(平成3)年10月に、漢字部のVolume 2は1992(平成4)年6月に出版されている。

そして漢字部が出た際、Addendum(追補)としてUnicode 1.0.1という仕様変更を伴う修正が出されている。

1.0.1は、6文字の削除と、外字領域の符号位置の変更などがある。削除は、DIS 10646第二版(ISO/IEC 10646-1の前身)で採用されなかったため、とされている。

沿革
特徴
対応言語

Unicode 1.0.0時点では、まだ漢字に対応していない。CJK統合漢字は、Volume 2である1.0.1から追加された。

Unicode 1.0.1で利用可能な文字の種類は次のとおりである(文字番号順)。

記号に近いものとして、次のような文字も収録されている。

削除された6字

Unicode 1.0.0にあり、Unicode 1.0.1で削除された2字は、次の通りである。

Unicode 1.0.0にあり、Unicode 1.0.1で統廃合された4字は、次の通りである。

1.0.1での仕様変更

Unicode 1.0.1では、次の仕様変更が行なわれている。

このほか、Unicode 1.0.0ではBOMに使われるU+FEFFが「BYTE ORDER MARK」というそのままの名前だったが、Unicode 1.0.1では「ZERO WIDTH NO-BREAK SPACE」という名前に変更されている。

1.1での仕様変更

変更点

Unicode 1.0から、次の版であるUnicode 1.1で仕様変更になるのは、次の箇所である。

詳細は、Unicode 1.1の項を参照のこと。


NON-SPACING → COMBINING

U+03xxなどを中心に存在する「NON-SPACING」(文字送りをしない)文字は、次のUnicode 1.1以降では「COMBINING」(結合)に変更されている。

名前と若干の機能が変更になっているようである。

新旧の両者を「同一の文字」と見なせるのかどうかは、議論の対象であろう。


チベット文字

Unicode 1.0.1までは、U+1000〜U+104Cにチベット文字が存在したが、次のUnicode 1.1では文字が全て削除されている。

チベット文字は、Unicode 2.0から符号位置をU+0F00〜U+0FFFに変えて、再定義された(配置、文字数などは異なる)。


統廃合

Unicode 1.1になるに際し、重複等を理由として統合される文字は、次の通りである。

矢印の左側がUnicode 1.0.0の番号、右がUnicode 1.1の番号だが、右の文字はUnicode 1.0にも存在する。つまり、右の文字番号に統廃合されたことになる。文字の名前は、Unicode 1.0での名称である。

Unicode 1.0→1.1以降のコンバーターを作る場合は、片方向変換をすることになる。


符号位置変更

以下の文字は、Unicode 1.1以降で符号位置が変更になる。

リンク
用語の所属
文字コード
Unicode
関連する用語
CJK統合漢字
基本多言語面
Unicode 1.1

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic