バイト数

テキストデータをエンコーディングした際のバイト単位のサイズ。文字コードによって同じ文字でもバイト数が異なる。

バイト数とは、テキストデータをコンピュータ上で表現する際に必要なバイト (8 ビット) の数です。文字数とバイト数は異なる概念であり、同じ文字でもエンコーディング方式によってバイト数が変わります。

たとえば UTF-8 では、半角英数字は 1 バイト、日本語のひらがな・カタカナ・漢字は 3 バイトです。一方、Shift_JIS では日本語は 2 バイトで表現されます。文字コードの入門書で詳しく学べます。

データベースの VARCHAR 型ではバイト数で上限が設定されることがあり、日本語テキストを格納する際は文字数の 3 倍のバイト数を見積もる必要があります。メール送信でも添付ファイルのサイズ制限はバイト単位です。

バイト数を正確に把握することは、システム設計やデータ転送の最適化に不可欠です。データベース設計の書籍でもバイト数の考慮は重要なトピックです。