翻訳時の文字数変化|日英翻訳の膨張率と対策
翻訳を行うと、原文と訳文で文字数が大きく変わることがあります。とくに日本語から英語への翻訳では文字数が約 1.5〜2 倍に膨張する傾向があり、UI デザインやレイアウトに影響を及ぼします。この記事では、言語ペアごとの膨張率、UI 翻訳での対処法、翻訳メモリを活用した文字数管理について解説します。
日英翻訳で文字数が膨張する理由
日本語は漢字を使うことで少ない文字数に多くの情報を圧縮できる言語です。一方、英語はアルファベットの組み合わせで単語を構成するため、同じ意味を表現するのにより多くの文字数を必要とします。
- 漢字 1 文字で表せる概念が英語では複数単語になる (例: 「承認」→ "approval")
- 日本語は助詞 (は、が、を等) が短いが、英語の前置詞や冠詞は文字数を増やす
- 日本語は主語を省略できるが、英語では主語が必須
- 敬語表現は日本語のほうが長くなる場合もあるが、全体的には英語が長い
一般的に、日本語から英語への翻訳では文字数が約 1.5〜2 倍に増加します。逆に英語から日本語への翻訳では文字数が約 0.5〜0.7 倍に減少します。
言語ペアごとの膨張率一覧
翻訳の膨張率は言語の組み合わせによって異なります。以下の表は日本語を基準とした場合の目安です。
| 翻訳方向 | 膨張率 (文字数比) | 備考 |
|---|---|---|
| 日本語 → 英語 | 約 1.5〜2.0 倍 | 技術文書ではさらに膨張しやすい |
| 日本語 → 中国語 (簡体字) | 約 0.9〜1.1 倍 | 漢字圏同士のためほぼ同等 |
| 日本語 → 韓国語 | 約 1.0〜1.2 倍 | 文法構造が近くやや増加 |
| 日本語 → ドイツ語 | 約 1.8〜2.5 倍 | 複合語が長くなる傾向 |
| 日本語 → フランス語 | 約 1.6〜2.2 倍 | 冠詞や前置詞で増加 |
| 日本語 → スペイン語 | 約 1.5〜2.0 倍 | 英語と同程度の膨張 |
| 日本語 → アラビア語 | 約 1.3〜1.8 倍 | 右から左への表記にも注意 |
ドイツ語は複合名詞が非常に長くなるため、膨張率が最も高い言語の一つです。UI 設計では最も長くなる言語を基準にレイアウトを検討する必要があります。
UI 翻訳での文字数制約への対処法
ソフトウェアや Web サイトの多言語対応では、ボタンやラベルの表示領域が限られているため、翻訳後の文字数膨張が深刻な問題になります。
- 可変幅レイアウト: 固定幅ではなく、テキスト量に応じて伸縮するレイアウトを採用する
- 擬似翻訳 (Pseudo-localization): 開発段階で文字列を 1.5〜2 倍に膨張させてレイアウト崩れを事前検出する
- 文字数ガイドライン: 翻訳者に対して「原文の 150% 以内」などの目安を提示する
- 省略表現の活用: 長い翻訳にはツールチップで全文を表示し、ラベルは短縮形にする
- アイコンの併用: テキストだけに頼らず、アイコンで意味を補完する
Apple や Google の多言語ガイドラインでも、翻訳後の文字数膨張を考慮したデザインが推奨されています。
翻訳メモリと文字数管理
大規模な翻訳プロジェクトでは、翻訳メモリ (TM) と用語集を活用して文字数の一貫性を保つことが重要です。
- 翻訳メモリ: 過去の翻訳を蓄積し、同一・類似文の訳文を再利用する仕組み
- 用語集 (ターモロジー): 専門用語の訳語を統一し、文字数のばらつきを抑える
- CAT ツール (Trados、memoQ、Memsource 等) で文字数の自動チェックが可能
- 文字数制限付きセグメント: UI 文字列には最大文字数を設定し、翻訳者に制約を明示する
- 品質チェック (QA): 翻訳後に文字数超過がないか自動検証する工程を組み込む
翻訳メモリを活用することで、プロジェクト全体の翻訳品質と文字数の一貫性を維持できます。
まとめ
翻訳時の文字数変化は言語ペアによって大きく異なり、日英翻訳では約 1.5〜2 倍の膨張が一般的です。UI 翻訳では可変幅レイアウトや擬似翻訳を活用し、文字数膨張に備えた設計が不可欠です。翻訳前後の文字数を正確に把握したいときは、文字カウンタスをぜひご活用ください。