通信用語の基礎知識 IPv4
戻る
参加者募集中

UTF-6

辞書:通信用語の基礎知識 通信技術識別子編 (CTURI)
読み:ユーティーエフ・スィックス
外語:UTF-6: Yet Another ASCII-Compatible Encoding for IDN 英語
品詞:固有名詞
2006/11/19 作成
2015/03/03 更新

国際化ドメイン名を実現するためにWALID, Inc.のMark WelterとBrian W. Spolarichにより提案された符号法の一つ。最終的には不採用となった。

目次

全ての文字をUTF-16として扱うが、UTF-5UTF-8UTF-7とも違う独特の変換方法を取るのが特徴である。

符号に変換する際に、上位8ビットが同じ場合、その部分を略して符号化することで、全体としての長さを縮めている。

符号の最後の文字は「0123456789abcdef」で、いわゆる16進数である。継続がある場合の部分の文字は「ghijklmopqrstuv」である。但し値が0の場合だけは特例がある。

先頭にwq--の4文字を繋げて他のドメインと区別するのが特徴である。

具体的には、まずUTF-16、つまりUnicodeの4桁の16進数を用意する。

この各桁が0なら無視し、1〜9・A〜Fならそのまま1〜fとする。但し先頭の文字については識別のためにg〜vとする。

0x1000より大きい場合は頭にz、0x0100〜0x0fffなら頭にy、という方法までが考えられていた。0x0010〜0x00ffの場合は不明、0x0000〜0x000fの場合はいきなりg〜vの文字が来るため判断できる。

例えば、I-Dでは次のような例が示されていた。

  • 0x1f4c: hf4c
  • 0x0624: m24
  • 0x0000: g
関連するリンク
I-D[ietf-idn-utf6]
利用環境
国際化ドメイン名
ドメイン名
DUDE

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.03 (16-May-2019)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club