通信用語の基礎知識 IPv4
戻る
参加者募集中

日本語入力システム

辞書:電算用語の基礎知識 ソフトカテゴリー編 (PTSOFTC)
読み:にほんご・にゅうりょく・しすてむ
読み:にっぽんご・にゅうりょく・しすてむ
品詞:名詞
2008/04/18 作成
2016/10/21 更新

電子計算機で、日本語の入力を行なうための機構のこと。様々な呼ばれ方をしてきたが、最近はこの呼び方に落ち着いているようだ。

おおむね、環境ごとに次のように呼ばれる。

種類

変換する単位ごとに、次のように分類される。

  • 単漢字変換 ‐ 漢字1字ずつ変換する
  • 単文節変換 ‐ 1文節ずつ変換する
  • 連文節変換 ‐ 複数の文節からなる日本語を変換する

文節変換

初期の日本語変換システムは形態素解析を諦め、漢字を1文字ずつ辞書引きで変換する「単漢字変換」が普通だった。

やがて、より快適に入力できるよう「文節変換」や「連文節変換」などの一括変換の機能を備えるようになり、入力中の任意の文字編集なども出来るようになっていった。Windowsが登場し、日本語変換システムが「IME」と呼ばれるようになる頃は、連文節変換が半ば当然の時代となっていた。

連文節変換では日本語文の単語切り分けの精度が変換効率において重要な問題となり、速度重視で単純に頭から検索するだけのものから、切り分けた単語ごとに点数を与えてコスト計算を行なうもの、単語間の意味的な繋がりを辞書に搭載するものなどが現われた。

形態素解析

日本語の「かな」から「かな漢字混じり文」を作ることが、日本語入力システムの主たる機能である。

現在よく使われているのは連文節変換だが、日本語は英語などと違い単語間に空白を入れる「分かち書き」をしないため、仮名文字の羅列から単語の区切りを探し出し、それを単語変換する、という作業が必要になる。これは「形態素解析」と呼ばれている。

これは非常に難しい処理であり、この性能が変換効率に大きく関わってくる。

辞書

形態素解析の次に、一般には辞書と呼ばれる単語表を用いる。

解析された品詞と仮名から、適切な漢字を選ぶためには、その品詞+漢字の変換表が必要である。これが辞書と呼ばれている。

メーカーや作者も努力して単語表の強化を続けるが限度があるため、利用者が自由に登録可能となっているものが多い。

MS-DOS

元々の由来となるMS-DOSは、そもそもこのようなシステムを想定していない。

しかし、キー入力を奪い取って処理することは容易にできたため、様々なシステムが開発され、様々な製品が販売された。

Windows

Windowsでは、MS-DOSの頃の反省もあり、IMEという形で日本語入力に対応した。

しかし技術的に難易度が高かったこともあり多くの企業が脱落、結局最後まで残ったMS-DOS時代からの企業は、ATOKのジャストシステムだけだった。

iOS

iOSは、OS Xのカーネルを使ったスマートフォン/タブレット用のOSである。

Mac OS Xはインプットメソッドとして様々なものを受け入れたが、iOSは標準以外を受け入れず、さらに、そういったソフトウェアを妨害するようなガードまで掛けるに至った。システムに対してインプットメソッドの実装ができない建て前なので、今後も他社製品が大々的に登場することはないと思われる。

さて、あらゆるOSに姿を現わすジャストシステムのATOKであったが、この環境は流石に苦戦。しかし、ATOKはiOSにはメモアプリとしてリリースされおり、アプリ内に限りATOKらしい変換ができ、コピペで他アプリと連携するという仕様。ジャストシステムの凄まじい執念が感じられる。

概観

MS-DOSの時代には、様々なものが作られ販売されていた。

しかしそれらもWindowsには対応できず、Microsoft製品以外で最後まで残ったのはジャストシステムのATOKだけだった。

主な環境で使われる又は使われていた、主要なものは次の通り(ABC順)。

MS-DOS/Windows

Mac OS 9まで

Mac OSの場合、純正の「ことえり」以外の使用実績、開発実績は、よく分かっていない。

Mac OS X

  • ことえり (標準搭載のもの)
  • ATOK
  • AquaSKK
  • EGBRIDGE (エルゴソフト) 廃盤
  • Google IME
  • MacUIM
    • Anthy
    • PRIME
    • SKK
  • Social IME
  • かわせみ

UNIX/Linux

UNIX系OSの場合、Windowsなどと違って、「かな漢字変換サーバー」と、そこにアクセスする「フロントエンド」に分割される例が多い。

  • Anthy系
    • 変換システム(C/Sではなくパイプを採用)
    • フロントエンド
      • anthy.el (付属品)
      • IM-JA
      • Kimera
      • SCIM
      • uim
      • たまご(Tamago、egg)
  • ATOKシリーズ (ジャストシステム)
    • ATOK for Solaris
    • ATOK12 SE for Linux (Turbolinux用)
    • ATOK X3 for Linux (ATOK 2007相当)
  • Canna (NEC)
    • サーバー
    • フロントエンド
      • canuum
      • kinput2(kinput2-canna)
      • かんな/emacs (Mule用)
  • PRIME+suikyo系
    • サーバー
      • prime
    • フロントエンド
      • prime-el (付属品)
      • uim-prime
  • Sj3 (ソニー)
    • サーバー
      • sj3serv
    • フロントエンド
      • sj3
      • kinput2-sj3
  • SKK
    • サーバー
      • skkserv
    • フロントエンド
      • skkinput
  • VJE-Delta for Linux/BSD
    • サーバー
      • vjed
    • クライアント
      • vje
  • Wnn系
    • サーバー
      • Wnn(jserver)
        • FreeWnn
        • Wnn4.2
        • Wnn6
        • Wnn7 (オムロンソフトウェア)
        • Wnn8 for Linux/BSD (オムロンソフトウェア)
    • フロントエンド
  • Mozc (Google 日本語入力のオープンソース版)

iOS

  • 標準のもの (おそらく「ことえり」相当だが、特に名前はない)
  • ATOK

Android

フリーソフトを含めて様々なものがあるので、以下は一例。

  • ATOKシリーズ (ジャストシステム)
    • ATOK for Android
    • NX!input powered by ATOK (富士通、ATOKベース)
  • FSKAREN (富士ソフト)
  • Google 日本語入力
  • Simeji
  • Slime
  • POBox Touch (Xperia標準搭載)
  • Wnn系
    • FlickWnn
    • iWnn
    • OpenWnn
      • ArtIME 日本語入力
      • OpenWnn Plus
関連する用語
日本語入力FEP
インプットメソッド
IME

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.03 (16-May-2019)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club