二組のサロゲートを一対(pair)にして用いるということ。
上位サロゲート1,024個(0xD800〜0xDBFF)と下位サロゲート1,024個(0xDC00〜0xDFFF)を組み合わせるのがサロゲートペアである。
上位と下位は常に対に使用される。UTF-16の仕様では、対になっていないサロゲートはエラーと見なされる。
この手法によって、1024×1024=1,048,576字の拡張を実現し、00群01面〜00群16面(U+00010000〜U+0010ffff)の文字が利用可能となった。
なお、Unicodeであっても、UTF-8などの符号化法ではサロゲートペアは使用しない。使わなくても、これらの文字を表わすことが可能なように設計されているからである。