サロゲート領域
読み:サロゲートりょういき
外語:Surrogates

 Unicodeで、サロゲートが置かれた場所の俗称。
目次

概要
 サロゲートは、Unicode 2.0から基本多言語面(BMP)に追加された機能文字の一種である。
 この部分の文字を組み合わせて使う(UTF-16という符号化方法を使う)ことで、00群01面〜00群16面、つまりU+010000〜10FFFFの範囲の文字が利用可能となる。

特徴
 上位サロゲートU+D800〜U+DBFF、下位サロゲートU+DC00〜U+DFFFで、各々1,024個ずつある。
 これを互いに組み合わせる(サロゲートペア)ことで1024×1024=1,048,576字の拡張を実現する。
 派生して、この方法によってアクセス可能となった00群01面〜00群16面までの文字コード領域のこともサロゲート領域という。

再検索