Variation Selector

読み:バリエーションセレクター
外語:Variation Selector
品詞:名詞

Unicodeで用いられる機能文字の一つ。256個分用意されている。Unicode 3.2から正式に追加された。それ以前はVariant Tagとも呼ばれていた。

由来

親字となる文字に対し、異体字や俗字などをバリエーション番号と組み合わせて表現するためのメカニズムと、それを実現するためのUnicode文字である。

例えば「わたなべ」さんの辺の字には多数の異体字があり、一説では65種類もあるとされる。この、それぞれの字に単純に文字番号を付けていたのでは番号が幾つあっても足りず、また検索等の作業も困難である(渡辺、渡邉、渡邊…と、考えうる全ての候補を検索せねばならない)。

Unicodeも、当初は文字の統合を標榜した(例えばCJK統合漢字)。しかし現実には多くの文字を飲み込まざるを得なかったが、やがてこの点が問題となり、原点回帰の意味も込めて再び統合を意識し始めた結果と見られる。

技術

そこで、例えば親字として「辺」だけを使い、あとは別に附番されたバリエーション番号を付け足すこととする。このための機能文字がVariation Selectorである。

例えば、辺+バリエーション1番、のように表わす。Variation Selectorは親字に対し、後置である。先行する文字のバリエーションを表わす。

メリット

このようにすると、検索性を損なうことなく多様な異体字を無理なく表現できる。実際に検索処理を行なう際には、このセレクターを無視することで、辺の異体字を全て同一文字として認識できるわけである。

また別の考え方として、異体字に対するフォントがシステムに無い場合、ベース文字を表示することで「お茶を濁す」ことも容易に可能になるという点がある。

256個中、最初の16個はU+FE00〜U+FE0F、残りの240個はU+E0100〜U+E01EFである。

最初の16個はUnicode 3.2から、残りはUnicode 4.0から追加された。

現時点においては、漢字に対するVariation Selectorの対応については規定されていないようである。そのようなものは一朝一夕に作れるものではないので、実際に漢字にこの機能が使えるようになるのは暫く後と見られる。

但し数学記号などについては既に幾つかの対応が示されている。