通信用語の基礎知識 全国のICカードこれひとつ 戻る

通常PC用 / 人気 更新 今日 カテ
電子計算機 > 文書・書籍 > RFC > 番号 > 〜4999
電子計算機 > 文書・書籍 > RFC > ジョークRFC
電子計算機 > 符号 > 文字 > 符号 > 文字符号(CES) > Unicode系
UTF-9 (RFC)
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE)
読み:ユーティーエフ-ナイン
外語:UTF-9: Unicode Transformation Format-9
品詞:名詞

Unicodeを9ビット文字で表現できるように変換したもの、及びその方法。

本来31ビット固定のもののを9ビット文字の不定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-18がある。

目次
目的

これはDECのPDP-10やIBM-7090、NEC ACOS-6などの36ビットワードマシンのためのもので、これら1バイトが9ビットのコンピューターで効率良くUnicodeが扱えるようになっている。

RFC内のサンプルプログラムはC言語とPDP用アセンブリ言語で書かれている。

ちなみにこのRFCの公開日は2005(平成17)年4月1日である。

仕様
符号化方法

UTF-9ではUnicodeのU+0000〜U+00FFは1バイト(9ビット、以下同)で表現される。

データは末尾寄せとし、末尾バイトのみMSBを0とし、それ以外は1とした2バイト以上の文字列で表現する。

UCS-4 (16進)UTF-9 (2進)
00000000〜000000FF0Xxxxxxxx
00000100〜0000FFFF1Xxxxxxxx 0Xxxxxxxx
00010000〜00FFFFFF1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx
01000000〜7FFFFFFF1Xxxxxxxx 1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx

上記Xはオクテットごとの先頭MSBである.

リンク
用語の所属
UTF
文字集合
ISO/IEC 10646
Unicode
関連する符号化方法
UTF-18
UTF-9 (I-D)

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic