EUC-CN

読み:イーユースィースィーエン
外語:EUC-CN
品詞:名詞

ISO/IEC 2022のサブセットで、8単位の拡張法を用いているEUCの一種。

EUC-CNとしての定義はRFCには無いが、RFC 1922外部リンクには「CN-GB」と称された8単位符号が述べられており、これは慣例として用いられるEUC-CNと同等である。

また台湾用のものは大陸用と区別するためEUC-TWと呼ぶこともある。

大陸支那

大陸支那では、支那語の文字集合(CCS)であるGB 2312:1980を使う。

  • G0: ASCII
  • G1: GB 2312
  • G2: -
  • G3: -

G2とG3は未使用だが、ISO-2022-CNの仕様上は、次の何れかの選択が可能となっている。

  • G0: ASCII
  • G1: GB 2312・GB 12345
  • G2: GB 7589・GB 13131
  • G3: GB 7590・GB 13132

台湾

台湾では、台湾語の文字集合(CCS)であるCNS 11643を使う。

  • G0: ASCII
  • G1: CNS 11643の第一字面
  • G2: CNS 11643の第二字面
  • G3: CNS 11643の第三字面〜第七字面のいずれか

拡張に、EUCに準拠しない代わりコードレンジを広げて文字数を増やした符号系GBKと、その更なる拡張GB 18030があり、大陸においては、現行のパソコン等ではこの拡張符号系が主に用いられている。

台湾では、EUCとは全く異なる独自のBig5が主流で、EUCはあまり使われていない。