照合順序 (コレーション)

文字列の比較・並べ替えの規則。言語や文化圏によって異なるソート順を定義する。

照合順序 (コレーション) とは、文字列の比較や並べ替えに使用される規則の集合です。同じ文字でも言語や文化圏によってソート順が異なるため、国際化対応では重要な概念です。

データベースでは、テーブルやカラムごとにコレーションを指定できます。MySQL の utf8mb4_unicode_ci は大文字小文字を区別しない比較を行い、utf8mb4_bin はバイナリ比較を行います。データベース国際化の書籍で詳しく学べます。

日本語のソートでは、ひらがな・カタカナの同一視、濁点・半濁点の扱い、漢字の読み順など、複雑な規則が必要です。Unicode の CLDR (Common Locale Data Repository) がこれらの規則を標準化しています。

文字数カウントの観点では、コレーションは文字の等価性に影響します。例えば「は」と「ば」を同一視するかどうかは、コレーション設定によって変わります。国際化プログラミングの書籍も参考になります。