BOM (字节顺序标记)
文件开头的字节序列,用于标识编码类型。UTF-8 为 EF BB BF,UTF-16 为 FF FE 或 FE FF。
BOM (字节顺序标记) 是放置在文本文件开头的特殊字节序列,用于标识编码类型和字节顺序。它是 Unicode 字符 U+FEFF 的编码形式。
在 UTF-16 中,BOM 对于确定字节顺序 (大端序/小端序) 至关重要。在 UTF-8 中,BOM (EF BB BF) 仅用作编码标识,因为 UTF-8 没有字节顺序的概念。文件编码指南详细介绍了 BOM 的细节。
UTF-8 的 BOM 在某些程序中可能被视为多余字节而导致问题。Shell 脚本和 PHP 文件应使用无 BOM 的 UTF-8。
Windows 记事本过去在保存为 UTF-8 时默认添加 BOM,但最新版本已默认为无 BOM。文本编辑器效率书籍讨论了编码设置这一重要话题。