翻字 (トランスリテレーション)

ある文字体系のテキストを別の文字体系に変換する処理。音韻を保持しながら文字を置き換える。

翻字 (トランスリテレーション) とは、ある文字体系で書かれたテキストを別の文字体系に変換する処理です。翻訳とは異なり、意味ではなく音韻を保持しながら文字を置き換えます。

日本語のローマ字表記 (「東京」→「Tokyo」) は翻字の代表例です。キリル文字からラテン文字への変換 (「Москва」→「Moskva」)、アラビア文字からラテン文字への変換なども翻字に含まれます。言語学・文字体系の書籍で体系的に学べます。

ICU (International Components for Unicode) ライブラリは、多数の文字体系間の翻字ルールを提供しています。プログラミングでは ICU の Transliterator クラスを使って変換を実装できます。

文字数カウントの観点では、翻字により文字数が大きく変化することがあります。漢字 1 文字がローマ字では複数文字になるため、翻字前後で文字数の管理が必要です。多言語テキスト処理の書籍も参考になります。