通常PC用 / 人気 更新 今日 カテ |
電子計算機 > 符号 > 文字 > 符号 > 文字符号(CES) > 日本語 |
Microsoft Windows Codepage : 50220 |
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
読み:マイクロソフト-ウィンドウズ-コードページ-ごーゼロにーにーゼロ |
外語:CP50220: Microsoft Windows Codepage : 50220 |
品詞:固有名詞 |
Microsoft Windowsで使われている、ISO-2022-JPの亜種の一つ。
|
概要 |
ISO-2022-JPに対し、CP932全文字(重複を除くWindows-31Jの文字)が扱えるよう拡張をした符号である。
Microsoft Outlook Express、Internet Explorerなどで使われている。
仕様 |
基本仕様 |
基本的には7ビットで文字を表現する7ビット符号で、エスケープシーケンスもISO/IEC 2022に準じている。
但し、これによって指示される文字集合は、標準ではなく、Windowsの実装に合わせた独自の文字集合である。
また、一部の文字については、文字のコードレンジが0x7f以上となり、ISO/IEC 2022に準じていない。
IANA |
成瀬ゆいにより、IANAに次の名前で登録された。
特徴 |
電子メール等、ISO-2022-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。
このCP50220は、JIS X 0201 片仮名、いわゆる半角カナは、JIS X 0208、いわゆる全角カナに置換される。
類似符号に、「ESC ( I」でエスケープして出力するCP50221、SI/SOで符号化するCP50222が存在する。
符号化方式(CES) |
但し、ユーザー定義外字領域は、ISO/IEC 2022の仕様から外れている。
符号化文字集合(CCS) |
※を附したものは、入力(読み込み)には対応するが、出力されない。
出力時は、英数文字はUS-ASCII、JIS C 6226はJIS X 0208のエスケープシーケンスが使われ、JIS X 0201 片仮名はJIS X 0208の片仮名に変換して出力される。
各拡張文字は、シフトJISと同じ区に配置されている。
「IBM拡張文字」(115区〜120区)は、存在はするが出力には使われておらず、NEC選定IBM拡張文字の符号位置に変換される。シフトJISの場合はIBM拡張文字の方が優先されるので、若干動作が違っていると言える。
符号の割り当て |
開始状態では、次のように指示されている。
開始状態では、次のように呼び出されている。
G0を英数(ASCII/JIS X 0201 ローマ字)、または日本語(JIS C 6226/JIS X 0208)で切り替えて用いるのはISO-2022-JPと同様である。
但し、この符号系はG0に対する指示に対応して英数モードか日本語モードかを切り替えているに過ぎない。ゆえに、G1に対する指示エスケープシーケンスなどは認識しない。
G0が英数の場合、CP932と完全互換の文字集合となっている。
つまり、より正確にはGRは「JIS X 0201 片仮名」ではなくCP932の右側である。
G0が日本語の場合、ISO-2022-JPにほぼ準じた形でCP932の文字集合を扱うことができる。
つまり、ESC 2/4 4/2(ESC $ B)で指示した場合、本来は含まれていないはずの、NEC特殊文字、NEC選定IBM拡張文字、ユーザー定義外字が文字集合に含まれていて利用できる。
なお、日本語モード時に利用できる95区〜114区は、1バイト目0x7f〜0x92が対応しており、この領域はISO/IEC 2022の範囲を超えている。
エスケープシーケンス |
文字集合 | エスケープシーケンス | CP50220 | Unicode | I/O | ||
---|---|---|---|---|---|---|
1バイト目 | 2バイト目 | |||||
ASCII | ESC 2/8 4/2 | ESC ( B | 0x00〜0x7f | ‐ | U+0000〜U+007F | I/O |
JIS X 0201 ローマ字 | ESC 2/8 4/10 | ESC ( J | IN | |||
JIS X 0201 片仮名 | ESC 2/8 4/9 | ESC ( I | 0x21〜0x5f | U+FF61〜U+FF91 | IN | |
SI/SO | IN | |||||
JIS C 6226-1978 | ESC 2/4 4/0 | ESC $ @ | 0x21〜0x28 0x30〜0x74 | 0x21〜0x7e | ‐ | IN |
JIS X 0208-1983 | ESC 2/4 4/2 | ESC $ B | I/O | |||
NEC特殊文字 | 0x2d | I/O | ||||
NEC選定IBM拡張文字 | 0x79〜0x7c | I/O | ||||
IBM拡張文字 | 0x93〜0x97 | IN | ||||
ユーザー定義外字 | 0x7f〜0x92 | U+E000〜U+E757 | I/O |
この表では書き切れていないが、ESC 2/8 4/2とESC 2/8 4/9は同義である。つまり、ASCIIとJIS X 0201の差異等の処理は存在しない。同様に、ESC 2/4 4/0は、ESC 2/4 4/2と同義として扱われている。つまり、ESC 2/4 4/0としても、JIS C 6226としての機能は無い。
また、ESC 2/4 4/0でもESC 2/4 4/2でも、同様にNEC特殊文字以下を利用することができる。
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |