UnicodeやISO/IEC 10646を、実際に計算機で利用できるように変換した形式の符号化のこと。
RFCなどで定義されているものに、次のようなものがある。
符号長は「バイト単位」だが、このバイトが8ビット(オクテット)とは限らない。
| 名称 | 最大値 | 符号長 | 特徴等 | 典拠 |
|---|---|---|---|---|
| UTF-1 | 0x7FFFFFFF | 1〜5 | 現在は破棄された | ISO/IEC 10646-1:1993 Annex G |
| UTF-2 | 0x7FFFFFFF | 1〜6 | 後にUTF-8となった | |
| UTF-5 | 0x7FFFFFFF | 1〜8 | 国際化ドメイン名用、しかし不採用 | draft-jseng-utf5-01.txt |
| UTF-6 | 0x0000FFFF | 国際化ドメイン名用、しかし未完成 | draft-ietf-idn-utf6-00.txt | |
| UTF-7 | 0x0010FFFF | 電子メール用 | RFC 2152 | |
| UTF-8 | 0x7FFFFFFF | 1〜6 | ファイルシステムや文書ファイル用 | RFC 3629 |
| UTF-EBCDIC | 0x7FFFFFFF | 1〜7 | EBCDICと親和性の高い符号化 | Unicode TR16 |
| UTF-9 (I-D) | 0x7FFFFFFF | 1〜5 | ファイルシステムや文書ファイル用 | draft-abela-utf9-00 |
| UTF-9 (RFC) | 0x7FFFFFFF | 1〜4 | エイプリルフールの冗談 | RFC 4042 |
| UTF-16 | 0x0010FFFF | 1〜2 | RFC 2781 | |
| UTF-18 | 1 | エイプリルフールの冗談 | RFC 4042 | |
| UTF-32 | 0x0010FFFF | 1 | Unicode TR19 |