複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。RFC 1922
で規定されている。
電子メールや支那語環境のIRCなどで使われる。
ISO-2022-CNの上位規格であり、支那語に関連する全仕様に対応する。
ASCIIの英数記号と、大陸支那のGB 2312、GB 7589、GB 7590、GB 12345、GB 13131、GB 13132、ISO-IR-165、台湾ならCNS 11643の第一字面から第七字面の全てに対応する。
但しISOに終端文字が定義されていないものがあり、これらは現時点では利用できない。
〓印は、終端文字が未定義であるもの。
| reg# | character set | ESC sequence | designated to | |
|---|---|---|---|---|
| 6 | ASCII | ESC 2/8 4/2 | ESC ( B | G0 |
| 58 | GB 2312:1980 | ESC 2/4 2/9 4/1 | ESC $ ) A | G1 |
| GB 7589:1987 | ESC 2/4 2/10 〓 | ESC $ * 〓 | G2 | |
| GB 7590:1987 | ESC 2/4 2/11 〓 | ESC $ + 〓 | G3 | |
| GB 12345:1990 | ESC 2/4 2/9 〓 | ESC $ ) 〓 | G1 | |
| GB 13131:1990 | ESC 2/4 2/10 〓 | ESC $ * 〓 | G2 | |
| GB 13132:1990 | ESC 2/4 2/11 〓 | ESC $ + 〓 | G3 | |
| 165 | ISO-IR-165 | ESC 2/4 2/9 4/5 | ESC $ ) E | G1 |
| 171 | CNS 11643-1 | ESC 2/4 2/9 4/7 | ESC $ ) G | G1 |
| 172 | CNS 11643-2 | ESC 2/4 2/10 4/8 | ESC $ * H | G2 |
| 183 | CNS 11643-3 | ESC 2/4 2/11 4/9 | ESC $ + I | G3 |
| 184 | CNS 11643-4 | ESC 2/4 2/11 4/10 | ESC $ + J | G3 |
| 185 | CNS 11643-5 | ESC 2/4 2/11 4/11 | ESC $ + K | G3 |
| 186 | CNS 11643-6 | ESC 2/4 2/11 4/12 | ESC $ + L | G3 |
| 187 | CNS 11643-7 | ESC 2/4 2/11 4/13 | ESC $ + M | G3 |
台湾では、EUC-CN(EUC-TW)やBig5などが関連する符号化法(CES)であるが、ISO-2022-CN-EXTの全機能は利用できない。
大陸支那では、GBKやGB 18030などが関連する符号化法(CES)であるが、ISO-2022-CN-EXTの全機能は利用できない。
終端文字は殆ど定義されていない。また定義される見込みもない。
ISO-2022-CNにしろISO-2022-CN-EXTにしろ、このような使い物にならない仕様をむりやり作ったのは、符号は一つで共通、つまり支那大陸と台湾は一つである、とするような政治思想、侵略計画に基づくものである。
そもそも、大陸はGBKと後継のGB 18030を使っており、台湾ではBig5を使っていて、双方においてこの仕様は使っていないのである。