Shift_JIS

日本語向けの文字エンコーディング。レガシーシステムで広く使われているが、現在は UTF-8 への移行が進んでいる。

Shift_JIS は、日本語テキストを表現するための文字エンコーディングです。1982 年に策定され、Windows や古い Web サイトで広く使われてきました。

Shift_JIS では半角英数字は 1 バイト、日本語 (ひらがな・カタカナ・漢字) は 2 バイトで表現されます。UTF-8 の 3 バイトと比べてバイト効率が良い反面、収録文字数が限られています。文字コードの歴史に関する書籍で Shift_JIS の成り立ちを学べます。

現在は UTF-8 への移行が進んでいますが、CSV ファイルのインポートやレガシーシステムとの連携では Shift_JIS が必要になることがあります。

Shift_JIS と UTF-8 の変換時に文字化けが発生することがあります。特に「〜」(波ダッシュ) や「−」(全角マイナス) は変換トラブルの原因になりやすい文字です。レガシーシステム移行の書籍でも文字コード変換は重要なトピックです。