ChatGPT 输出长度指南 - 理解 Token 限制与响应大小

7 分钟阅读

ChatGPT 等大型语言模型以 Token 而非字符或单词来衡量文本。理解这一区别对于获得所需的输出长度至关重要。一个 Token 大约等于英文 4 个字符或 0.75 个单词,但因语言和内容类型而异。本指南涵盖各模型的 Token 限制、控制输出长度的技巧,以及实用的换算公式。大型语言模型入门书籍也可作为参考。

各模型的 Token 限制

模型上下文窗口最大输出 Token约输出词数
GPT-4o128K tokens16,384 tokens~12,000 words
GPT-4 Turbo128K tokens4,096 tokens~3,000 words
GPT-3.5 Turbo16K tokens4,096 tokens~3,000 words
Claude 3.5 Sonnet200K tokens8,192 tokens~6,000 words
Gemini 1.5 Pro1M tokens8,192 tokens~6,000 words

上下文窗口包含输入和输出 Token。128K 上下文窗口配合 10K Token 的提示词,剩余 118K Token 用于对话,但输出仍受最大输出限制的约束。

Token 与字符的换算

语言每 Token 字符数每 Token 词数1,000 Token ≈
英语约 4 字符约 0.75 词750 词 / 4,000 字符
西班牙语 / 法语约 3.5 字符约 0.65 词650 词 / 3,500 字符
日语约 1.5 字符不适用1,500 字符
中文约 1.5 字符不适用1,500 字符
代码 (Python)约 3 字符不适用3,000 字符

控制输出长度的技巧

常见输出长度问题

成本影响

模型输入成本 (每百万 Token)输出成本 (每百万 Token)1,000 词输出成本
GPT-4o$2.50$10.00~$0.013
GPT-4 Turbo$10.00$30.00~$0.040
GPT-3.5 Turbo$0.50$1.50~$0.002

输出 Token 的成本是输入 Token 的 2-4 倍。控制输出长度直接影响 API 成本,尤其是在大规模使用时。

总结

ChatGPT 的输出以 Token 为单位衡量,1 个 Token 大约等于英文 4 个字符。当前模型的输出上限为 4,096 至 16,384 个 Token (约 3,000 至 12,000 个英文单词)。通过明确的字数指令、max_tokens 参数和系统提示词来控制输出长度。使用字符计数器验证提示词和输出的长度。