TRONコード

読み:トロンコード
外語:TRON code
品詞:名詞

TRONで使われている文字コードの仕様。自由に利用できることもあり、広く用いられている。BTRONである超漢字シリーズでも、標準的にこのコードが使われる。

1文字は16ビットで表現される。

符号体系

コードはISO/IEC 2022を独自にアレンジしたような仕様となっている。

2バイトで構成される16ビットコードのそれぞれが2/1〜7/14、8/0〜15/13の範囲にあり、都合220種類が2バイト構成で計48,400字を表現できる。

これを言語面と呼び、超漢字以降のBTRONでは31面までの言語面に対応する。つまり最大1,500,400字まで扱う事ができる。しかも、言語面は容易に拡張可能で、都合無限の文字を扱えるようになっている。

ゾーン

ISO/IEC 2022とは違い、最初から8ビット単位として設計されているのも特徴である。

各バイトが2/1〜7/14の範囲か8/0〜15/13の範囲かで、都合4つのゾーンに分割されることになり、しかも各ゾーンがISO/IEC 2022と同等の容量を持つ。

そのため、一回の言語面切り換えでISO/IEC 2022の約4倍の文字を扱う事ができることになり、理論上はISO/IEC 2022の約4倍の効率があるといえる。

切り替え式の選択理由

文章では通常、同じ言語面の文字を使い続ける事が多いということから、例えば32ビット等で統一して文字を表わすよりは、16ビットで表現し、必要とあらば言語面を切り換える手法の方が効率が良い。

TRONコードはその通りの仕様になっている。

言語面

  • 第1面: JIS X 0208JIS X 0213JIS X 0212GB 2312KS X 1001、点字
  • 第2面: GT書体
  • 第3面: GT書体
  • 第4面: (予約)
  • 第5面: (予約)
  • 第6面: CNS 11643:1986(Big5)
  • 第7面: (予約)
  • 第8面: 大漢和辞典収録文字
  • 第9面: 大漢和辞典収録文字、記号類
  • 第10面: 支那伝承文字、少数民族文字等
  • 第11面: 今昔文字鏡 (超漢字3以降は廃止)
  • 第12面: 今昔文字鏡 (超漢字3以降は廃止)
  • 第13面: 今昔文字鏡 (超漢字3以降は廃止)
  • 第14面: 今昔文字鏡 (超漢字3以降は廃止)
  • 第15面: (予約)
  • 第16面: Unicode
  • 第17面: Unicode
  • 第18面〜31面: (予約)

なお、第16〜17面のUnicodeに関しては、CJK統合漢字とハングル音節は除外されている。

仕様の問題点

TRONコードは、Unicodeのような文字の統合を嫌い、第1面だけでも日支鮮の文字コードを丸飲みしている。また第16面と第17面にはUnicode(CJK統合漢字とハングル音節を除く)がマッピングされている。

これはつまり、完全に同じ文字に対して、複数のコードが存在することを意味している。

例えば漢数字の1「一」という字を考えても、第一面だけでもJIS X 0208とGB 2312、KS X 1001があり、第2面のGT書体にもあり、第6面のCNS 11643:1986(Big5)にもあり、第8面の大漢和辞典にもあり、そして第11面の今昔文字鏡にもあった(過去形)わけである。

とにかく文字が多ければ良くて、とにかく文字の統合は嫌だ、という思想からこの様な結果になったわけである。コンピュータでの処理のしやすさ等は殆ど考慮されていない。

もし、文書から検索をしようと思えば、一旦同等文字をまとめるためのデータベースなどを介さねばならない。