U-PRESS

読み:ユープレス
外語:U-PRESS
品詞:名詞

報道機関用に拡張されたUCS-2(Unicode)系文字セット。

UCSの基本多言語面(BMP)のみを用い、日本語の新聞に必要な文字を外字として登録した共通コードとして、様々な新聞社に情報を配信している共同通信社により作られた文字集合(CCS)規格。

BMPのみを使う16ビット系コードで、不足する文字をBMP内の外字領域に格納する。

従って、JIS X 0208JIS X 0212JIS X 0213のBMP収録部分はそのまま、またBMP外にあるJIS X 0213漢字や非漢字、U-PRESS独自の漢字や非漢字がBMPの私用領域に割り当てられる。

U-PRESSはCJK統合漢字とCJK Ideograph Extension A(拡張A)とPrivate Area(外字)に分けて収録されている。Private Areaに収録されている漢字は約300字とされる。

この仕様の誕生経緯は、処理を単純化するために2バイト固定長のUCS-2だけで済ませたかったことがある。

またこの仕様が作られた背景として、JIS X 0213:2004よりも前に作られた仕様という点があり、このためにUnicode 3.1から追加されたCJK Ideograph Extension B(拡張B)を用いておらず、JIS X 0213漢字のうちCJK Ideograph Extension B(拡張B)に配列されている漢字はPrivate Area(外字)に収録されている。

将来Windows等がJIS X 0213を完全サポートしたとき、この仕様は問題となりうる。

新聞業界用のニッチな規格ということで、野球報道用に9回裏サヨナラを表わす1x、2x、3x…といった文字や、縦書きを前提とした文字も登録されているのが特徴といえる。

対応フォントが市販されているほか、Windows用のU-PRESSフォント対応IMEとして、ATOK17 for Windows [U-PRESS対応版]という製品がある(フォントは別売)。