通信用語の基礎知識 IPv4
戻る
参加者募集中

Microsoft Windows Codepage : 932

辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE)
読み:マイクロソフトウィンドウズ・コードページ・きゅうさんに
読み:マイクロソフトウィンドウズ・コードページ・きゅうひゃくさんじゅうに
外語:CP932: Microsoft Windows Codepage : 932 英語
品詞:名詞
2008/11/20 作成
2009/01/13 更新

Microsoftにより作られ、Microsoft Windowsで採用された符号化方法(CES)。

これはシフトJISの実装の一つである。

文字コードの符号化方法(CES)にシフトJISを用い、文字集合(CCS)に独自の「Windows-31J」などを採用したものを言う。

沿革

コードページ

コードページ」は文字集合を表わす。

かつて、PC DOSMS-DOSでは、このコードページを16ビットの番号で管理した。

「932」は、日本語のシフトJISというCESに与えられた番号である。但し、CCSが異なるものも同じく932となっているため、全ての環境で同じ文字が扱えるとは限らない。

IBM

まず最初に採用されたのはIBMであり、「IBM 5550」というパーソナルコンピューターで最初に採用されたとされている。

基本的な仕様は次の通り。

この仕様は、後に同社のPC DOS(DOS/V)でも採用された。932という番号は、定かではないがこの時に附されたものと考えられる。

NEC MS-DOS

NEC PC-9800シリーズで採用されたMS-DOSでも、ほぼ同じものが採用された。番号も、同じく932となっている。但し文字集合(CCS)は違っている。

NECは、同社の汎用コンピューターACOS2,4系で使われていた文字集合と互換性を持たせることとし、9区〜13区にあった独自の拡張文字をそのまま採用した。

基本的な仕様は次の通り。

外字は、機種により字数が異なるが最大で188字に対応し、最初の94字がJISコードで0x7621〜0x767e、残りの94字が0x7721〜0x777eに割り当てられている。

IBMで115区〜119区に採用された漢字を、符号位置を変えてそのまま採用した。

このため、必要な文字は全て94×94の中に収まっている。

EPSONの互換機では、ベースの文字集合がJIS X 0208である点を除けば、同様の拡張を施してあり、互換性が考慮されている。

Microsoft Windows Codepage : 932

Windowsで日本語対応をするにあたり、IBMとNEC、双方との充分な互換性確保が求められた。結果、両者の主要な拡張をそのまま併合して採用した。

基本となる文字集合は、時代に合わせて「JIS X 0208-1990」としている。

選択基準は次の通り。

  • IBM漢字は、115区〜119区に「IBM拡張文字」388文字としてそのまま採用
  • NECの記号類は、13区のみを「NEC特殊文字」として採用
  • NECの漢字類は、89区〜92区を「NEC選定IBM拡張文字」374文字としてそのまま採用

NECの漢字類はIBMの漢字と同じものであり、つまり少なくとも同じ字が二つのコードポイントに存在するということになる(詳細後述)。

基本的な仕様は次の通り。

こうして作られた文字集合は、Windows-31Jと呼ばれている。

重複問題

状況

IBM拡張文字も、NEC特殊文字も、JIS C 6226-1978に対して追加した文字集合であるため、JIS X 0208に対してすら重複しているものがある。

また、IBM拡張文字とNEC選定IBM拡張文字は、完全に重複している。

これらの文字も、Unicodeでは互換文字として採用され、全てが基本多言語面(BMP)内にあるが、IBM拡張文字とNEC選定IBM拡張文字はUnicode内では一つのコードポイントしか無く、重複はしていない。

IBM拡張文字

全388文字で、うち漢字は360字である。

NEC特殊文字

全83文字である。

  • Windows-31J

    」「≡」「」「√」「⊥」「∠」「」「」「」の9文字が2区と重複している。

    また、「∵」は115区でも重複している。

  • JIS X 0208-1983

    重複状況はWindows-31Jと同じ。

  • JIS X 0212-1990

    「№」が2区で重複している。

  • JIS X 0213:2004

    「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」の9文字は、JIS X 0208と同様に2区のものが使われる。

    この9字を除いたものが、コードポイントそのまま、13区に収録されている。

  • IBM拡張文字

    「Ⅰ」「Ⅱ」「Ⅲ」「Ⅳ」「Ⅴ」「Ⅵ」「Ⅶ」「Ⅷ」「Ⅸ」「Ⅹ」「№」「℡」「㈱」の13文字が重複している。

  • Unicode

    全文字が基本多言語面(BMP)内に登録されている。

関連するリンク
http://www.microsoft.com/globaldev/reference/dbcs/932.htm
用語の所属
シフトJIS
MBCS
関連する用語
JIS X 0201
JIS X 0208
Shift_JIS

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.01d (17-May-2017)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club