UTF-18
読み:ユーティーエフ-じゅうはち
外語:UTF-18: Unicode Transformation Format-18

 UnicodeおよびISO/IEC 10646を18ビット文字で表現できるように変換したもの、及びその方法。
 本来31ビット固定長のものを、18ビット文字の固定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-9がある。
目次

概要
 31ビットのコードを18ビット固定長で表現するため、全範囲を表現することはできない。
 表現できるのは、U+0000〜U+2FFFFの範囲と、U+E0000〜U+EFFFFの範囲だけである。これでも0〜2面と14面が網羅されるため、現時点においては必要充分である。

目的
 これはDECのPDP-10やIBM-7090、NEC ACOS-6などの36ビットワードマシンのためのもので、これら1バイトが9ビットのコンピューターで効率良くUnicodeが扱えるようになっている。
 RFC内のサンプルプログラムはC言語とPDP用アセンブリ言語で書かれている。
 ちなみにこのRFCの公開日は2005(平成17)年4月1日である。

表現方法
 具体的には、U+0000〜U+2FFFFの範囲はUTF-18でもそのままの値で用いられ、U+E0000〜U+EFFFFの範囲は0x70000シフトし0x30000〜0x3ffffとして扱う。

再検索