あいまい検索 (ファジーマッチング)
完全一致ではなく、類似した文字列を検索する手法。タイプミスや表記揺れに対応できる。
あいまい検索 (ファジーマッチング) とは、完全一致ではなく、類似度が一定の閾値以上の文字列を検索する手法です。タイプミス、表記揺れ、略称などに対応でき、検索エンジンやオートコンプリートで広く使われています。
代表的なアルゴリズムには、レーベンシュタイン距離、n-gram 類似度、Jaro-Winkler 距離、音声類似度 (Soundex、Metaphone) などがあります。検索アルゴリズムの書籍で体系的に学べます。
Elasticsearch の fuzzy クエリや、fuse.js などの JavaScript ライブラリを使えば、Web アプリケーションにあいまい検索を簡単に実装できます。
文字数カウントの観点では、あいまい検索は文字数の微小な違い (1〜2 文字の差異) を許容して検索結果を返すため、文字数の厳密な一致が不要な場面で有用です。情報検索入門の書籍も参考になります。