UTF-18

読み:ユーティーエフ・じゅうはち
外語:UTF-18: Unicode Transformation Format-18 英語
品詞:名詞

UnicodeおよびISO/IEC 10646を18ビット文字で表現できるように変換したもの、及びその方法。

本来31ビット固定長のものを、18ビット文字の固定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-9がある。

目次

31ビットのコードを18ビット固定長で表現するため、全範囲を表現することはできない。

表現できるのは、U+0000〜U+2FFFFの範囲と、U+E0000〜U+EFFFFの範囲だけである。これでも0〜2面と14面が網羅されるため、現時点においては必要充分である。

これはDECのPDP-10やIBM-7090、NEC ACOS-6などの36ビットワードマシンのためのもので、これら1バイトが9ビットのコンピューターで効率良くUnicodeが扱えるようになっている。

RFC内のサンプルプログラムはC言語とPDP用アセンブリ言語で書かれている。

ちなみにこのRFCの公開日は2005(平成17)年4月1日である。

具体的には、U+0000〜U+2FFFFの範囲はUTF-18でもそのままの値で用いられ、U+E0000〜U+EFFFFの範囲は0x70000シフトし0x30000〜0x3ffffとして扱う。

関連するリンク
RFC4042日本語訳
用語の所属
UTF
18
関連する符号化方法
UTF-9 (RFC)

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club