通信用語の基礎知識 発見!イイお店 戻る

通常PC用 / 人気 更新 今日 カテ
電子計算機 > 符号 > 文字 > 符号 > 文字符号(CES) > ISO-2022系 > ISO-2022-JP系
eucJP-open
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE)
読み:イーユースィージェイピー-オープン
外語:eucJP-open
品詞:固有名詞

EUC-JPの亜種の一つ。

目次
概要

TOG日本ベンダ協議会(TOG/JVC)が策定したもので、Windows用シフトJISであるWindows-31J文字集合との相互変換を可能としたもの。

Windows-31Jの拡張漢字や外字領域が用意されている。

実際には幾つかの亜種があり、「eucJP-open」という呼称は、これらを包含する総称と考えられる。

仕様
基本仕様

符号化方法(CES)の仕様はEUC-JPと全く同じである。文字集合(CCS)のみが違う。

拡張文字

13区の「NEC特殊文字」は、そのまま採用されている。

拡張漢字は、「IBM拡張文字」が符号位置を変更されG3に存在する。但し元の配列とは異なり、IBM拡張文字のうちでJIS X 0208、JIS X 0212に存在するものは除かれている。

なお、13区と重複する記号は除外されていないため、拡張文字と13区の記号は13字が重複している。

ユーザー定義外字領域

WindowsのシフトJISに存在するユーザー定義外字領域が用意されている。

EUCの文字集合(JIS X 0208)には本来存在しないユーザー定義外字だが、シフトJISには20区分(1880字)の領域が用意されている。

eucJP-openでは、G1とG3の85区〜94区に各10区、合計20区を割り当てている。

Windows-31Jの考慮点

Windows-31JとUnicodeの変換表は、通常想定されうるものと若干異なっているため、注意を要する。

eucJP-ms/ascii/0201の変換と、既にOBSOLETE(破棄)扱いではあるがUnicodeコンソーシアムのJIS0208.TXTの変換、そしてJIS X 0208の文字名から対応づけられるUnicode文字との差異を、以下に示す。

文字EUCeucJP-openJIS0208.TXTJIS X 0208
eucJP-mseucJP-asciieucJP-0201
0xA1B1U+FFE3U+203EU+FFE3U+FFE3U+203E OVERLINE
0xA1BDU+2015U+2014U+2014U+2015U+2014 EM DASH
0xA1C0U+FF3CU+FF3CU+005CU+005CU+005C REVERSE SOLIDUS
0xA1C1U+FF5EU+301CU+301CU+301CU+301C WAVE DASH
0xA1C2U+2225U+2016U+2016U+2016U+2016 DOUBLE VERTICAL LINE
0xA1DDU+FF0DU+2212U+2212U+2212U+2212 MINUS SIGN
0xA1EFU+FFE5U+00A5U+FFE5U+FFE5U+00A5 YEN SIGN
0xA1F0U+FF04U+FF04U+FF04U+FF04U+0024 DOLLAR SIGN
¢0xA1F1U+FFE0U+00A2U+00A2U+00A2U+00A2 CENT SIGN
£0xA1F2U+FFE1U+00A3U+00A3U+00A3U+00A3 POUND SIGN
¬0xA2CCU+FFE2U+00ACU+00ACU+00ACU+00AC NOT SIGN

文字の名前から、例えば0xA1C0「\」(バックスラッシュ)をU+005Cに変換してしまうことは、理想的ではあるかもしれないが妥当とは言い難い。プログラム中に\を書いたときに\と等価に扱われる可能性があり、様々な問題を生む危険性がある。

eucJP-openは、このようにUnicodeを介そうとするとシフトJISと同様の問題が生じるため、シフトJISとの間でのみ使うのが最も望ましい利用法であるといえる。

リンク
用語の所属
EUC-JP
EUC
CES
関連する用語
CCS
Windows-31J
eucJP-ms

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic