| ア | イ | ウ | エ | オ |
| カ | キ | ク | ケ | コ |
| サ | シ | ス | セ | ソ |
| タ | チ | ツ | テ | ト |
| ナ | ニ | ヌ | ネ | ノ |
| ハ | ヒ | フ | ヘ | ホ |
| マ | ミ | ム | メ | モ |
| ヤ | ユ | ヨ | ||
| ラ | リ | ル | レ | ロ |
| ワ | ヰ | ヴ | ヱ | ヲ |
| ン |
| A | B | C | D | E |
| F | G | H | I | J |
| K | L | M | N | O |
| P | Q | R | S | T |
| U | V | W | X | Y |
| Z | 数字 | 記号 | ||
UnicodeやISO/IEC 10646を、実際に計算機で利用できるように変換した形式の符号化のこと。
RFCなどで定義されているものに、次のようなものがある。
符号長は「バイト単位」だが、このバイトが8ビット(オクテット)とは限らない。
| 名称 | 最大値 | 符号長 | 特徴等 | 典拠 |
|---|---|---|---|---|
| UTF-1 | 0x7FFFFFFF | 1〜5 | 現在は破棄された | ISO/IEC 10646-1:1993 Annex G |
| UTF-2 | 0x7FFFFFFF | 1〜6 | 後にUTF-8となった | |
| UTF-5 | 0x7FFFFFFF | 1〜8 | 国際化ドメイン名用、しかし不採用 | draft-jseng-utf5-01.txt |
| UTF-6 | 0x0000FFFF | 国際化ドメイン名用、しかし未完成 | draft-ietf-idn-utf6-00.txt | |
| UTF-7 | 0x0010FFFF | 電子メール用 | RFC 2152 | |
| UTF-8 | 0x7FFFFFFF | 1〜6 | ファイルシステムや文書ファイル用 | RFC 3629 |
| UTF-EBCDIC | 0x7FFFFFFF | 1〜7 | EBCDICと親和性の高い符号化 | Unicode TR16 |
| UTF-9 (I-D) | 0x7FFFFFFF | 1〜5 | ファイルシステムや文書ファイル用 | draft-abela-utf9-00 |
| UTF-9 (RFC) | 0x7FFFFFFF | 1〜4 | エイプリルフールの冗談 | RFC 4042 |
| UTF-16 | 0x0010FFFF | 1〜2 | RFC 2781 | |
| UTF-18 | 1 | エイプリルフールの冗談 | RFC 4042 | |
| UTF-32 | 0x0010FFFF | 1 | Unicode TR19 |
コメントなどを投稿するフォームは、日本語対応時のみ表示されます