日本語入力システム

読み:にほんご・にゅうりょく・しすてむ
読み:にっぽんご・にゅうりょく・しすてむ
品詞:名詞

コンピュータで、日本語の入力を行なうための機構のこと。様々な呼ばれ方をしてきたが、最近はこの呼び方に落ち着いているようだ。

おおむね、環境ごとに次のように呼ばれる。

形態素解析

日本語の「かな」から「かな漢字混じり文」を作ることが、日本語入力システムの主たる機能である。

日本語は英語などと違い単語間に空白を入れる「分かち書き」をしないため、仮名文字の羅列から単語の区切りを探し出し、それを単語変換する、という作業が必要になる。これは「形態素解析」と呼ばれている。

これは非常に難しい処理であり、この性能も変換効率に大きく関わってくる。

文節変換

初期の日本語変換システムは形態素解析を諦め、漢字を1文字ずつ辞書引きで変換する「単漢字変換」が普通だった。

やがて、より快適に入力できるよう「文節変換」や「連文節変換」などの一括変換の機能を備えるようになり、入力中の任意の文字編集なども出来るようになっていった。Windowsが登場し、日本語変換システムが「IME」と呼ばれるようになる頃は、連文節変換が半ば当然の時代となっていた。

連文節変換では日本語文の単語切り分けの精度が変換効率において重要な問題となり、速度重視で単純に頭から検索するだけのものから、切り分けた単語ごとに点数を与えてコスト計算を行なうもの、単語間の意味的な繋がりを辞書に搭載するものなどが現われた。

辞書

形態素解析の次に、一般には辞書と呼ばれる単語表を用いる。

解析された品詞と仮名から、適切な漢字を選ぶためには、その品詞+漢字の変換表が必要である。これが辞書と呼ばれている。

メーカーや作者も努力して単語表の強化を続けるが限度があるため、利用者が自由に登録可能となっているものが多い。

主な環境で使われる又は使われていた、主要なものは次の通り(ABC順)。

MS-DOS/Windows

  • ATOK (ジャストシステム)
  • DFJ (デービーソフト)
  • EGBRIDGE (エルゴソフト)
  • Japanist (富士通)
  • MS-IME (Microsoft)
  • OAK(オアシスかな漢字変換) (富士通)
  • skkime (Windows用SKK)
  • Social IME
  • VJE (バックス)
  • WXシリーズ (A.I.SOFT)
  • WXGシリーズ (A.I.SOFT)
  • 松茸 (管理工学研究所)

Mac OS

Mac OSの場合、純正の「ことえり」以外の使用実績、開発実績は、よく分かっていない。

UNIX/Linux

UNIX系OSの場合、Windowsなどと違って、「かな漢字変換サーバ」と、そこにアクセスする「フロントエンド」に分割される例が多い。

  • Anthy系
    • 変換システム(C/Sではなくパイプを採用)
    • フロントエンド
      • anthy.el (付属品)
      • IM-JA
      • Kimera
      • SCIM
      • uim
      • たまご(Tamago、egg)
  • ATOKシリーズ (ジャストシステム)
    • ATOK for Solaris
    • ATOK12 SE for Linux (Turbolinux用)
    • ATOK X3 for Linux (ATOK 2007相当)
  • Canna (NEC)
    • サーバ
    • フロントエンド
      • canuum
      • kinput2(kinput2-canna)
      • かんな/emacs (Mule用)
  • PRIME+suikyo系
    • サーバ
      • prime
    • フロントエンド
      • prime-el (付属品)
      • uim-prime
  • Sj3 (ソニー)
    • サーバ
      • sj3serv
    • フロントエンド
      • sj3
      • kinput2-sj3
  • SKK
    • サーバ
      • skkserv
    • フロントエンド
      • skkinput
  • VJE-Delta for Linux/BSD
    • サーバ
      • vjed
    • クライアント
      • vje
  • Wnn系
    • サーバ
      • Wnn(jserver)
        • FreeWnn
        • Wnn4.2
        • Wnn6
        • Wnn7 (オムロンソフトウェア)
        • Wnn8 for Linux/BSD (オムロンソフトウェア)
    • フロントエンド