文本压缩
减小文本数据大小的技术。常用 gzip、Brotli 和 deflate 等算法。
文本压缩是利用文本数据中的冗余来减小数据大小的技术。在 Web 上,gzip、Brotli 和 deflate 等算法广泛用于 HTTP 响应压缩。
gzip 是最广泛采用的压缩格式,几乎所有浏览器都支持。Brotli 由 Google 开发,比 gzip 实现高 15-25% 的压缩率。Web 性能优化书籍介绍了压缩的效果。
文本压缩的原理是检测重复模式并用更短的编码替换。HTML、CSS 和 JavaScript 等文本文件压缩率高,预期可减小 60-80% 的大小。
在字符计数中,压缩后的数据是二进制格式,字符数概念不适用。压缩前的字符数和压缩后的字节数是不同的指标。数据压缩算法书籍提供了更多背景知识。