表情符号 (Emoji)
Unicode 中收录的图形符号,用于在文本通信中直观地表达情感和概念。
表情符号是 Unicode 中收录的图形符号,用于在文本通信中直观地表达情感和概念。截至 2024 年,Unicode 中已注册超过 3,000 个表情符号。
表情符号的字符计数很复杂。许多表情符号位于 BMP 之外,在 UTF-16 中需要代理对 (2 个编码单元)。此外,肤色修饰符和 ZWJ (零宽连接符) 序列意味着一个表情符号可能由多个码位组成。表情符号与 Unicode 指南详细解释了这些机制。
在 UTF-8 中,表情符号每个占 4 个字节。数据库的 VARCHAR 列需要 utf8mb4 编码才能存储表情符号。
社交媒体的字符限制通常将表情符号计为 1 个字符 (某些平台计为 2 个)。社交媒体沟通书籍讨论了表情符号的有效使用方法。