常用汉字

日本文化审议会制定的日常生活中使用汉字的参考标准,共收录 2,136 个汉字。作为教育、出版、行政文书中汉字使用的基准,对日语的字数设计产生影响。

常用汉字是 2010 年修订的《常用汉字表》中收录的 2,136 个汉字。其定位是"在法令、公文、报纸、杂志、广播等一般社会生活中,书写现代日语时汉字使用的参考标准"。虽然没有强制力,但日本的报社和出版社都以此为基准来决定汉字的使用与否。

常用汉字表的历史可以追溯到 1946 年的《当用汉字表》(1,850 字)。当用汉字表具有较强的限制性质,建议不使用表外汉字。1981 年改为《常用汉字表》(1,945 字),定位变为较为宽松的"参考标准"。2010 年修订时增加了 196 字、删除了 5 字,形成了现在的 2,136 字。新增的汉字包括"鬱""彙"等日常使用但笔画较多的汉字。

与之对比,中国大陆的《通用规范汉字表》(2013 年发布) 收录了 8,105 个汉字,分为三级:一级字 3,500 个 (常用字)、二级字 3,000 个 (次常用字)、三级字 1,605 个 (专业用字)。日本的常用汉字 2,136 字大致对应中国一级字的范围,但由于简繁体差异和两国用字习惯不同,并非简单的子集关系。

常用汉字与日语的字数设计密切相关。日本报纸原则上在常用汉字范围内撰写文章,对常用汉字表外的汉字加注假名读音或改用假名书写。例如"薔薇"→"ばら"、"蝶"→"チョウ",将汉字替换为假名后字符数会发生变化。一个汉字展开为 2 至 4 个假名字符,因此常用汉字的范围会影响文章的字符数。

在计算机字符编码方面,JIS X 0208 的第一水准汉字 (2,965 字) 包含了全部常用汉字。也就是说,Shift_JIS 和 EUC-JP 编码能够表示所有常用汉字。Unicode 覆盖范围更广,常用汉字全部收录在 BMP (基本多文种平面) 中。中国的 GB 2312 收录 6,763 个汉字,同样完整覆盖了日本常用汉字中对应的简体字形。

从字符计数的实务角度看,常用汉字的知识有助于设计"可读性"指标。常用汉字使用率高的文章对一般读者来说更易读,而常用汉字外的汉字较多的文章则给人专业、晦涩的印象。部分文本分析工具可以计算常用汉字的使用率,以此评估文章的难度等级。

分享这篇文章