| ア | イ | ウ | エ | オ |
| カ | キ | ク | ケ | コ |
| サ | シ | ス | セ | ソ |
| タ | チ | ツ | テ | ト |
| ナ | ニ | ヌ | ネ | ノ |
| ハ | ヒ | フ | ヘ | ホ |
| マ | ミ | ム | メ | モ |
| ヤ | ユ | ヨ | ||
| ラ | リ | ル | レ | ロ |
| ワ | ヰ | ヴ | ヱ | ヲ |
| ン |
| A | B | C | D | E |
| F | G | H | I | J |
| K | L | M | N | O |
| P | Q | R | S | T |
| U | V | W | X | Y |
| Z | 数字 | 記号 | ||
国際化ドメイン名を実現するために James Seng、Martin Duerst と Tin Wee Tan により提案された符号法の一つ。最終的には不採用となった。
基本的なコンセプトはUTF-8などと同様で、1ビットの符号部と4ビットのデータ部の不定長となる。
先頭1バイトの最上位ビット(MSB)が1となり、続くバイトのMSBは0としている。
| UCS-4 (16進) | UTF-5 (2進) |
|---|---|
| 00000000〜0000000F | 1xxxx |
| 00000010〜000000FF | 1xxxx 0xxxx |
| 00000100〜00000FFF | 1xxxx 0xxxx 0xxxx |
| 00001000〜0000FFFF | 1xxxx 0xxxx 0xxxx 0xxxx |
| … | |
| 10000000〜7FFFFFFF | 1xxxx 0xxxx 0xxxx …… 0xxxx |
こうして得られた5ビットの符号は、次のように文字に割り当てる。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます