絵文字

Unicode に収録された絵文字記号。テキストコミュニケーションで感情や概念を視覚的に表現する。

絵文字は Unicode に収録された絵文字記号で、テキストコミュニケーションで感情や概念を視覚的に表現するために使われます。2024 年時点で 3,000 以上の絵文字が Unicode に登録されています。

絵文字の文字数カウントは複雑です。多くの絵文字は BMP 外に配置されているため、UTF-16 ではサロゲートペアとして 2 コードユニットを消費します。さらに、肌の色の修飾子や ZWJ (ゼロ幅接合子) シーケンスにより、1 つの絵文字が複数のコードポイントで構成されることがあります。絵文字と Unicode の書籍で詳しく学べます。

UTF-8 では絵文字は 4 バイトを消費します。データベースの VARCHAR 列に絵文字を格納する場合は utf8mb4 エンコーディングが必要です。

SNS の文字数制限では、絵文字は通常 1 文字 (または 2 文字) としてカウントされます。SNS コミュニケーションの書籍でも絵文字の効果的な使い方が紹介されています。