Hướng dẫn độ dài đầu ra ChatGPT: Hiểu giới hạn Token và kích thước phản hồi

ChatGPT và các mô hình ngôn ngữ lớn khác đo văn bản bằng token thay vì ký tự hoặc từ. Hiểu sự phân biệt này là thiết yếu để có được độ dài đầu ra bạn cần. Một token xấp xỉ 4 ký tự hoặc 0,75 từ trong tiếng Anh, mặc dù con số này thay đổi tùy theo ngôn ngữ và loại nội dung. Hướng dẫn này bao gồm giới hạn token theo từng mô hình, kỹ thuật kiểm soát độ dài đầu ra và các công thức chuyển đổi thực tế.

Giới hạn Token theo mô hình

Mô hìnhCửa sổ ngữ cảnhToken đầu ra tối đaSố từ đầu ra xấp xỉ
GPT-4o128K token16.384 token~12.000 từ
GPT-4 Turbo128K token4.096 token~3.000 từ
GPT-3.5 Turbo16K token4.096 token~3.000 từ
Claude 3.5 Sonnet200K token8.192 token~6.000 từ
Gemini 1.5 Pro1M token8.192 token~6.000 từ

Cửa sổ ngữ cảnh bao gồm cả token đầu vào và đầu ra. Cửa sổ ngữ cảnh 128K với prompt 10K token còn lại 118K token cho hội thoại, nhưng đầu ra vẫn bị giới hạn ở giới hạn đầu ra tối đa.

Chuyển đổi Token sang ký tự

Ngôn ngữKý tự mỗi tokenTừ mỗi token1.000 token ≈
Tiếng Anh~4 ký tự~0,75 từ750 từ / 4.000 ký tự
Tiếng Tây Ban Nha / Pháp~3,5 ký tự~0,65 từ650 từ / 3.500 ký tự
Tiếng Nhật~1,5 ký tựN/A1.500 ký tự
Tiếng Trung~1,5 ký tựN/A1.500 ký tự
Code (Python)~3 ký tựN/A3.000 ký tự

Kỹ thuật kiểm soát độ dài đầu ra

Vấn đề độ dài đầu ra phổ biến

Ảnh hưởng chi phí

Mô hìnhChi phí đầu vào (mỗi 1M token)Chi phí đầu ra (mỗi 1M token)Chi phí đầu ra 1.000 từ
GPT-4o$2.50$10.00~$0.013
GPT-4 Turbo$10.00$30.00~$0.040
GPT-3.5 Turbo$0.50$1.50~$0.002

Token đầu ra đắt hơn 2–4 lần so với token đầu vào. Kiểm soát độ dài đầu ra ảnh hưởng trực tiếp đến chi phí API, đặc biệt ở quy mô lớn.

Kết luận

Đầu ra ChatGPT được đo bằng token, với 1 token xấp xỉ 4 ký tự tiếng Anh. Các mô hình hiện tại giới hạn đầu ra ở 4.096–16.384 token (3.000–12.000 từ). Kiểm soát độ dài đầu ra thông qua chỉ định số từ rõ ràng, tham số max_tokens và system prompt. Sử dụng Bộ đếm ký tự để xác minh độ dài prompt và đầu ra của bạn.