通信用語の基礎知識 全国のICカードこれひとつ 戻る

UTF-5
辞書:通信用語の基礎知識 通信技術識別子編 (CTURI)
読み:ユーティーエフ-ファイブ
外語:UTF-5: Unicode Transformation Format-5
品詞:固有名詞

国際化ドメイン名を実現するために James Seng、Martin Duerst と Tin Wee Tan により提案された符号法の一つ。最終的には不採用となった。

特徴

基本的なコンセプトはUTF-8などと同様で、1ビットの符号部と4ビットのデータ部の不定長となる。

先頭1バイトの最上位ビット(MSB)が1となり、続くバイトのMSBは0としている。

UCS-4 (16進)UTF-5 (2進)
00000000〜0000000F1xxxx
00000010〜000000FF1xxxx 0xxxx
00000100〜00000FFF1xxxx 0xxxx 0xxxx
00001000〜0000FFFF1xxxx 0xxxx 0xxxx 0xxxx
 
10000000〜7FFFFFFF1xxxx 0xxxx 0xxxx …… 0xxxx

こうして得られた5ビットの符号は、次のように文字に割り当てる。

リンク
関連するリンク
I-D[jseng-utf5]
利用環境
国際化ドメイン名
ドメイン名
関連する規格
RACE
BRACE
LACE
base32
Punycode
UTF-8

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic