码位 (Code Point)

Unicode 中为每个字符分配的唯一编号,以 U+ 加十六进制数字表示,如 U+0041 (A)。

码位是 Unicode 标准中为每个字符分配的唯一编号。以 U+ 加十六进制数字表示:U+0041 (拉丁大写字母 A)、U+3042 (平假名 あ)、U+1F600 (笑脸表情)。

Unicode 定义了约 110 万个可能的码位 (0 到 10FFFF),截至 2024 年已分配约 15 万个字符。Unicode 标准参考书详细解释了码位体系。

在 JavaScript 中,String.codePointAt() 可获取码位,String.fromCodePoint() 可从码位创建字符。

一个码位并不总是对应一个可见字符。组合字符和表情符号序列使用多个码位组成一个书写素簇。Unicode 编程书籍教授准确的字符处理方法。