予測変換
ユーザーが入力した文字列から次に入力する単語や文を予測し、候補として提示する機能。スマートフォンのキーボードや IME に搭載され、入力効率を大幅に向上させる。
予測変換 (predictive text input) は、ユーザーの入力途中で次に来る単語や文節を予測し、候補リストとして表示する機能です。スマートフォンのソフトウェアキーボード (iOS の QuickType、Android の Gboard) や、PC の日本語入力システム (Google 日本語入力、Microsoft IME、ATOK) に標準搭載されています。
予測変換の仕組みは、統計的言語モデルに基づいています。大量のテキストデータから「ある単語の後にどの単語が来やすいか」の確率を学習し、入力された文字列に続く最も確率の高い候補を提示します。「お疲れ」と入力すると「様です」が候補に出るのは、「お疲れ様です」という文字列が訓練データに高頻度で出現するためです。
日本語の予測変換は、かな漢字変換と組み合わさることで特に強力です。「き」と入力しただけで「今日」「気温」「昨日」「機能」など、文脈に応じた漢字変換候補が表示されます。さらに、過去の入力履歴を学習して個人の語彙や表現パターンに適応するため、使い込むほど予測精度が向上します。
予測変換は文字入力の速度を劇的に向上させます。研究によれば、予測変換を使うことで入力速度が 30〜50% 向上するとされています。特にスマートフォンのフリック入力では、1 文字ずつ入力するよりも予測候補をタップする方が圧倒的に速いため、予測変換の精度がユーザー体験を左右します。
文字数カウントの観点では、予測変換は「少ないキー操作で多くの文字を入力する」技術です。「おつかれさまです」(9 文字) を入力するのに、予測変換なしでは 9 回以上のキー操作が必要ですが、予測変換があれば「おつ」+ 候補選択の 3〜4 操作で済みます。入力効率の指標として「キーストローク/文字」(KSPC: Keystrokes Per Character) が使われ、予測変換の効果を定量的に評価できます。
プライバシーの観点では、予測変換の学習データにはユーザーの入力履歴が含まれるため、個人情報やパスワードが候補に表示されるリスクがあります。他人にスマートフォンを見せる際に予測候補から個人情報が漏れる事例は珍しくありません。パスワード入力フィールドでは予測変換を無効にする (autocomplete="off") のがセキュリティ上の基本です。