排序规则
字符串比较和排序的规则。定义因语言和文化而异的排序顺序。
排序规则是用于比较和排序字符串的规则集合。由于相同字符在不同语言和文化中的排序顺序可能不同,它是国际化中的重要概念。
在数据库中,可以按表或列指定排序规则。MySQL 的 utf8mb4_unicode_ci 执行不区分大小写的比较,utf8mb4_bin 执行二进制比较。数据库国际化书籍详细介绍了这个主题。
日语排序需要复杂的规则,包括平假名-片假名等价、浊音/半浊音处理和汉字读音顺序。Unicode 的 CLDR (Common Locale Data Repository) 标准化了这些规则。
从字符计数角度看,排序规则影响字符等价性。例如"は"和"ば"是否视为相同取决于排序规则设置。国际化编程书籍提供了更多背景知识。