eucJP-open
読み:イーユースィージェイピー-オープン
外語:eucJP-open

 EUC-JPの亜種の一つ。
目次

概要
 TOG日本ベンダ協議会(TOG/JVC)が策定したもので、Windows用シフトJISであるWindows-31J文字集合との相互変換を可能としたもの。
 Windows-31Jの拡張漢字や外字領域が用意されている。
 実際には幾つかの亜種があり、「eucJP-open」という呼称は、これらを包含する総称と考えられる。

仕様

基本仕様
 符号化方法(CES)の仕様はEUC-JPと全く同じである。文字集合(CCS)のみが違う。

拡張文字
 13区の「NEC特殊文字」は、そのまま採用されている。
 拡張漢字は、「IBM拡張文字」が符号位置を変更されG3に存在する。但し元の配列とは異なり、IBM拡張文字のうちでJIS X 0208、JIS X 0212に存在するものは除かれている。
 なお、13区と重複する記号は除外されていないため、拡張文字と13区の記号は13字が重複している。

ユーザー定義外字領域
 WindowsのシフトJISに存在するユーザー定義外字領域が用意されている。
 EUCの文字集合(JIS X 0208)には本来存在しないユーザー定義外字だが、シフトJISには20区分(1880字)の領域が用意されている。
 eucJP-openでは、G1とG3の85区〜94区に各10区、合計20区を割り当てている。

Windows-31Jの考慮点
 Windows-31JとUnicodeの変換表は、通常想定されうるものと若干異なっているため、注意を要する。
 eucJP-ms/ascii/0201の変換と、既にOBSOLETE(破棄)扱いではあるがUnicodeコンソーシアムのJIS0208.TXTの変換、そしてJIS X 0208の文字名から対応づけられるUnicode文字との差異を、以下に示す。
文字EUCeucJP-openJIS0208.TXTJIS X 0208
eucJP-mseucJP-asciieucJP-0201
0xA1B1U+FFE3U+203EU+FFE3U+FFE3U+203E OVERLINE
0xA1BDU+2015U+2014U+2014U+2015U+2014 EM DASH
0xA1C0U+FF3CU+FF3CU+005CU+005CU+005C REVERSE SOLIDUS
0xA1C1U+FF5EU+301CU+301CU+301CU+301C WAVE DASH
0xA1C2U+2225U+2016U+2016U+2016U+2016 DOUBLE VERTICAL LINE
0xA1DDU+FF0DU+2212U+2212U+2212U+2212 MINUS SIGN
0xA1EFU+FFE5U+00A5U+FFE5U+FFE5U+00A5 YEN SIGN
0xA1F0U+FF04U+FF04U+FF04U+FF04U+0024 DOLLAR SIGN
¢0xA1F1U+FFE0U+00A2U+00A2U+00A2U+00A2 CENT SIGN
£0xA1F2U+FFE1U+00A3U+00A3U+00A3U+00A3 POUND SIGN
¬0xA2CCU+FFE2U+00ACU+00ACU+00ACU+00AC NOT SIGN
 文字の名前から、例えば0xA1C0「\」(バックスラッシュ)をU+005Cに変換してしまうことは、理想的ではあるかもしれないが妥当とは言い難い。プログラム中に\を書いたときに\と等価に扱われる可能性があり、様々な問題を生む危険性がある。
 eucJP-openは、このようにUnicodeを介そうとするとシフトJISと同様の問題が生じるため、シフトJISとの間でのみ使うのが最も望ましい利用法であるといえる。

再検索