ISO-2022-CN-EXT

読み:アイエスオウにーまるにーにースィーエン・イーエックスティー
外語:ISO-2022-CN-EXT 英語
品詞:固有名詞

複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。RFC 1922で規定されている。

目次

ISO-2022-CNの上位規格であり、支那語に関連する全仕様に対応する。

ASCIIの英数記号と、大陸支那のGB 2312ほか各種符号、台湾CNS 11643の第一字面から第七字面の全てに対応する。

但しISOに終端文字が定義されていないものがあり、これらは現時点では利用できない。

基本仕様

7ビットで文字を表現する7ビット符号である。文字のコードレンジとしては0x20〜0x7fまでを用いる。

図形文字表はGLのみを用る。一旦呼び出した後は、SI/SOで切り替えて用いる。G2やG3にある文字は、一文字ごとにSS2またはSS3で指示する。

7ビットなので、それぞれ、SI=0x0f、SO=0x0e、SS2=0x1b 0x4e、SS3=0x1b 0x4f、となる。

この符号系では、初期状態は(ASCII)である。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。

改行文字(CR/LF)の前では、必ずSIでASCIIに戻さなければならない。

情報の終了の前でも、必ずSIでASCIIに戻さなければならない。

対応する文字集合

〓印は、終端文字が未定義であるもの。

reg#character setESC sequencedesignated to
6ASCIIESC 2/8 4/2ESC ( BG0
58GB 2312:1980ESC 2/4 2/9 4/1ESC $ ) AG1
 GB 7589:1987ESC 2/4 2/10 〓ESC $ * 〓G2
 GB 7590:1987ESC 2/4 2/11 〓ESC $ + 〓G3
 GB 12345:1990ESC 2/4 2/9 〓ESC $ ) 〓G1
 GB 13131:1990ESC 2/4 2/10 〓ESC $ * 〓G2
 GB 13132:1990ESC 2/4 2/11 〓ESC $ + 〓G3
165ISO-IR-165ESC 2/4 2/9 4/5ESC $ ) EG1
171CNS 11643-1ESC 2/4 2/9 4/7ESC $ ) GG1
172CNS 11643-2ESC 2/4 2/10 4/8ESC $ * HG2
183CNS 11643-3ESC 2/4 2/11 4/9ESC $ + IG3
184CNS 11643-4ESC 2/4 2/11 4/10ESC $ + JG3
185CNS 11643-5ESC 2/4 2/11 4/11ESC $ + KG3
186CNS 11643-6ESC 2/4 2/11 4/12ESC $ + LG3
187CNS 11643-7ESC 2/4 2/11 4/13ESC $ + MG3

終端文字は殆ど定義されていない。また定義される見込みもない。

ISO-2022-CNにしろISO-2022-CN-EXTにしろ、このような使い物にならない仕様をむりやり作ったのは、符号は一つで共通、つまり支那大陸と台湾は一つである、とするような政治思想、侵略計画に基づくものである。

そもそも、大陸はGBKと後継のGB 18030を使っており、台湾ではBig5を使っていて、双方においてこの仕様は使っていないのである。

用語の所属
ISO/IEC 2022
ISO-2022
文字コード
関連する用語
半角カナ
ISO-2022-CN
EUC-CN
EUC-TW
GBK
GB 18030

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club