EUC-JP
一种在 UNIX 系统上广泛使用的日语字符编码,属于扩展 Unix 编码家族。
EUC-JP (扩展 Unix 日语编码) 是为在 UNIX 操作系统上处理日语文本而开发的字符编码。它使用 2 个字节表示 JIS X 0208 汉字。
在 Linux 和 FreeBSD 等 UNIX 系统上,EUC-JP 曾是日语文本的默认区域设置。Linux 日语环境指南介绍了 EUC-JP 的历史。
EUC-JP 与 ASCII 兼容:半角英文数字占 1 个字节,日语字符占 2 个字节。与 Shift_JIS 不同,EUC-JP 的字节序列更容易进行程序化解析。
如今向 UTF-8 的迁移已基本完成,但在旧系统和日志文件中仍会遇到 EUC-JP。字符编码转换指南解释了不同编码之间的转换方法。