Microsoft Windowsで使われている、EUC-JPの亜種の一つ。
EUC-JPの符号化方式(CES)を使い、符号化文字集合(CCS)にCP932全文字(重複を除くWindows-31Jの文字)を採用した符号である。
Windowsそのものの実装であり、Internet Explorerなどで使われている。
基本的には8ビットで文字を表現する8ビット符号である。
但し、これによって指示される文字集合は、標準ではなく、Windowsの実装に合わせた独自の文字集合である。
成瀬ゆいにより、IANAに次の名前で登録された。
Webサイト等、EUC-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。
Windows内部では、一旦シフトJISに変換してからUnicodeに変換しており、UnicodeからCP51932にする場合はその逆処理をしている。この途中で変換不能な文字があると、それをそのまま残した偽のシフトJIS文字列を内部に作り、これを更にUnicode化するため、他にはない独特の文字化けを起こす。
また、ユーザー定義外字は存在しない。Windowsでこの文字をCP51932として出力しようとすると、ユーザー定義外字(U+E000〜U+E757)がシフトJISの符号(0xF040〜0xF9FC)で出力されてしまうため注意が必要である。
- 8ビットISO/IEC 2022 (ISO-2022-JP)
開始状態
開始状態では、次のように指示されている。
開始状態では、次のように呼び出されている。
関連する用語
ISO/IEC 2022
EUC-JP