サロゲートペア

読み:サロゲートペア
外語:Surrogates Pair
品詞:名詞

二組のサロゲートを一対(pair)にして用いるということ。

Unicodeの符号化法の一つ、UTF-16で採用された。

Unicodeでは、Unicode 2.0規格以降、サロゲート文字として上位、下位、それぞれに1024字を割り当てた。

上位サロゲート1,024個(0xD800〜0xDBFF)と下位サロゲート1,024個(0xDC00〜0xDFFF)を組み合わせるのがサロゲートペアである。

上位と下位は常に対に使用される。UTF-16の仕様では、対になっていないサロゲートはエラーと見なされる。

この手法によって、1024×1024=1,048,576字の拡張を実現し、00群01面〜00群16面(U+00010000〜U+0010ffff)の文字が利用可能となった。

なお、Unicodeであっても、UTF-8などの符号化法ではサロゲートペアは使用しない。使わなくても、これらの文字を表わすことが可能なように設計されているからである。