![]() |
![]() |
| 通常PC用 / 人気 更新 今日 カテ |
| 電子計算機 > 符号 > 文字 > 符号 > 文字符号(CES) |
| UCS-4 |
| 辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
| 読み:ユースィーエス-フォー |
| 外語:UCS-4: Universal Multiple-Octet Coded Character Set-4 |
| 品詞:名詞 |
ISO/IEC 10646の全領域を、4オクテットで符号化する符号化方法(CES)。
|
|
| 概要 |
32ビット(実際に使われるのは、最上位ビットを除いた31ビット)の全てを用いる仕様で、理論上21億以上の文字種を表現できる。
そして一部にはUnicodeのコード体系が採用されている。
| 特徴 |
| 由来 |
ISO/IEC 10646にあった二つの符号化方法の一つで、ISO/IEC 10646の全領域が表現できるのが特徴だった。
しかし、Unicodeでは既に採用されていない。Unicodeは00群00面〜00群16面の計17面のみを使用しており、「この制限を加えたUCS-4」とも言えるUTF-32を採用している。
このため、既にUCS-4という符号は、殆ど使われていないものと思われる。
| サロゲート |
初期のISO/IEC 10646とUnicodeにはサロゲートというものはなかった。
Unicodeでは、UCS-2で表現できないUCS-4の範囲を表わすのに、サロゲートという機能文字を用意することになった。
Unicodeの00群01面〜00群16面の文字を、UCS-4でどのように表わすべきかは定かではない。一般的な実装では、そのまま目的の符号位置をUCS-4で表わすことになるが、サロゲート文字二つをそのまま符号化(4オクテット×2で計8オクテット)という方法も不可能ではない。
| リンク |
| 通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |