通信用語の基礎知識 IPv4
戻る
参加者募集中

CESU-8

辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE)
読み:スィーイーエスユーはち
外語:CESU-8: Compatibility Encoding Scheme for UTF-16:8-Bit 英語
品詞:固有名詞
2002/01/11 作成
2006/12/19 更新

UTF-8の亜種の一つで、Oracleが使っている不届き千万な仕様の一つ。

本来UTF-8(RFC 2279)では、サロゲートペアは適時解釈してから符号化せねばならない。

しかしこのCESU-8は、サロゲートの各ペアを機械的にUTF-8に変換するのみであり、supplementary characterは6バイトで表現される。これはUTF-8の仕様から外れた手法であるばかりか、公害ともなりうる実装である。

しかしながら、Oracleはこのような実装をしてしまった。それを正当化するために、CESU-8としてエンコーディング登録をしてしまったのである。

関連するリンク
http://www.unicode.org/unicode/reports/tr26/
関連する用語
UTF-8
Oracle

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.01d (17-May-2017)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club