CSV

Comma-Separated Values の略で、カンマ区切りでデータを表現するテキスト形式。表形式データの交換に広く使われる。

CSV (Comma-Separated Values) は、各フィールドをカンマで区切り、各レコードを改行で区切るシンプルなテキスト形式です。表計算ソフトやデータベースとのデータ交換に広く使われています。

CSV の仕様は RFC 4180 で定義されていますが、実際にはソフトウェアごとに方言があります。フィールド内にカンマや改行を含む場合はダブルクォートで囲む必要があり、ダブルクォート自体はエスケープが必要です。データ分析入門の書籍で CSV の扱い方を学べます。

日本語環境では文字コードの問題が頻発します。Excel で CSV を開く際、UTF-8 の BOM なしファイルは文字化けすることがあり、Shift_JIS や BOM 付き UTF-8 での出力が求められる場面があります。

文字数カウントの観点では、CSV のカンマや引用符などの区切り文字がデータサイズに影響します。大量データの場合、JSON と比較して CSV のほうがオーバーヘッドが少ない傾向があります。Excel データ活用の書籍も参考になります。