通信用語の基礎知識 全国のICカードこれひとつ 戻る

サロゲートペア
辞書:通信用語の基礎知識 通信技術文字用語編 (CTCHRY)
読み:サロゲートペア
外語:Surrogates Pair
品詞:名詞

二組のサロゲートを一対(pair)にして用いるということ。

目次
概要

Unicodeの符号化法の一つ、UTF-16で採用された。

Unicodeでは、Unicode 2.0規格以降、サロゲート文字として上位、下位、それぞれに1024字を割り当てた。

特徴

上位サロゲート1,024個(U+D800〜U+DBFF)と下位サロゲート1,024個(U+DC00〜U+DFFF)を組み合わせるのがサロゲートペアである。

上位と下位は常に対に使用される。UTF-16の仕様では、対になっていないサロゲートはエラーと見なされる。

この手法によって、1024×1024=1,048,576字の拡張を実現し、00群01面〜00群16面(U+010000〜U+10FFFF)の文字が利用可能となった。

なお、Unicodeであっても、UTF-8などの符号化法ではサロゲートペアは使用しない。使わなくても、これらの文字を表わすことが可能なように設計されているからである。

リンク
用語の所属
Unicode
サロゲート
サロゲート領域
UTF-16

[再検索] [戻る]


通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club
KisoDic