動画キャプション・字幕の文字数設計ガイド

動画コンテンツの爆発的な増加に伴い、キャプションや字幕の重要性はかつてないほど高まっています。YouTube では毎分 500 時間以上の動画がアップロードされ、その多くに字幕が付与されています。字幕は聴覚障害者へのアクセシビリティ確保だけでなく、音声をオフにして視聴するユーザー (通勤中、公共の場など) への対応としても不可欠です。本記事では、プラットフォーム別の字幕文字数基準、表示時間と読みやすさの関係、そして実践的な字幕制作テクニックを解説します。

字幕の基本ルールと文字数制限

字幕制作には、視聴者が無理なく読める文字数と表示時間のバランスが求められます。業界標準として広く採用されている基本ルールを以下に示します。

項目基準値備考
1 行あたりの文字数日本語: 13〜16 文字全角文字基準
最大行数2 行3 行以上は画面を圧迫する
1 画面の最大文字数日本語: 26〜32 文字2 行合計
最短表示時間1 秒短すぎると読めない
最長表示時間7 秒長すぎると次の字幕と混同
読み速度 (日本語)4〜5 文字/秒一般的な読書速度
字幕間の間隔0.1〜0.3 秒字幕の切り替わりを認識するため

日本語の字幕は 1 秒あたり 4〜5 文字が読みやすい速度とされています。つまり、16 文字の字幕であれば 3〜4 秒の表示時間が必要です。英語の場合は 1 秒あたり約 15〜20 文字 (3〜4 単語) が目安で、言語によって最適な文字数は大きく異なります。

プラットフォーム別の字幕仕様

動画プラットフォームごとに字幕の仕様や推奨設定が異なります。主要プラットフォームの比較を以下に示します。

プラットフォーム1 行の文字数上限最大行数ファイル形式自動生成
YouTube制限なし (推奨 32 文字)2 行推奨SRT, VTT, SBVあり (自動字幕)
Netflix日本語 13 文字/行2 行TTML (独自仕様)なし (プロ翻訳)
テレビ放送 (日本)13〜15 文字/行2 行ARIB 規格一部あり
映画 (劇場)13 文字/行2 行DCP 字幕なし
TikTok制限なし (推奨 20 文字)制限なしSRTあり
Instagram Reels制限なし (推奨 20 文字)制限なしSRTあり

Netflix の字幕ガイドラインは業界で最も厳格とされ、日本語字幕は 1 行 13 文字、2 行で最大 26 文字、表示速度は 1 秒あたり 4 文字以内と定められています。この基準は、字幕翻訳者の間で品質の指標として広く参照されています。

YouTube 字幕の文字数最適化

YouTube は世界最大の動画プラットフォームであり、字幕の最適化は視聴者のエンゲージメントに直結します。YouTube の自動字幕機能は便利ですが、精度は完璧ではないため、手動での修正が推奨されます。

YouTube の検索アルゴリズムは字幕テキストもインデックスの対象としています。適切なキーワードを含む字幕は、動画の検索順位向上にも寄与します。

テレビ・映画の字幕制作基準

テレビ放送や映画の字幕は、放送規格や業界慣行に基づく厳密な基準が存在します。日本のテレビ字幕は総務省のガイドラインに準拠し、聴覚障害者向けの字幕放送として整備されています。

字幕翻訳における文字数の課題

字幕翻訳では、原語と翻訳先言語の文字数差が大きな課題となります。同じ内容を表現するのに必要な文字数は言語によって大きく異なるためです。

言語同一内容の文字数比率1 行の推奨文字数特徴
日本語1.0 (基準)13〜16 文字漢字で情報密度が高い
英語1.5〜2.0 倍35〜42 文字スペースを含むため長くなる
中国語 (簡体字)0.8〜1.0 倍13〜16 文字日本語と同程度
韓国語1.0〜1.2 倍16〜18 文字日本語よりやや長い
ドイツ語1.8〜2.5 倍35〜40 文字複合語が長い
アラビア語1.2〜1.5 倍35〜40 文字右から左に表示

英語から日本語への字幕翻訳では、原文の情報量を 60〜70% に圧縮する必要があることが多いです。これは日本語の文字数制限が厳しいためではなく、漢字の情報密度が高いため、少ない文字数で同等の意味を伝えられるからです。逆に、日本語から英語への翻訳では文字数が 1.5〜2 倍に膨らむため、表示時間の調整が必要になります。

アクセシビリティと字幕の文字数

字幕はアクセシビリティの観点からも重要な役割を果たします。WCAG (Web Content Accessibility Guidelines) 2.1 では、動画コンテンツにキャプションを提供することが Level A の要件として定められています。

アクセシビリティ対応の字幕では、通常の字幕よりも情報量が増えるため、1 画面あたりの文字数が多くなりがちです。効果音の説明を含める場合は、本文の字幕を短くして全体のバランスを取ることが重要です。

まとめ

動画字幕の文字数は、日本語で 1 行 13〜16 文字、2 行で最大 32 文字が基本です。表示速度は 1 秒あたり 4〜5 文字を目安とし、プラットフォームごとの仕様に合わせて調整しましょう。字幕の文字数を正確に把握するには、文字数カウントスをぜひご活用ください。