Mã hóa GSM-7

Bảng mã 7-bit được sử dụng trong tin nhắn SMS, cho phép tối đa 160 ký tự mỗi tin nhắn. Khi sử dụng ký tự ngoài bảng GSM-7, hệ thống chuyển sang UCS-2 và giới hạn giảm xuống còn 70 ký tự.

GSM-7 (Global System for Mobile Communications 7-bit encoding) là bảng mã ký tự mặc định cho tin nhắn SMS, được định nghĩa trong tiêu chuẩn 3GPP TS 23.038. Bảng mã này sử dụng 7 bit cho mỗi ký tự, cho phép đóng gói tối đa 160 ký tự vào một tin nhắn SMS đơn lẻ có dung lượng 1.120 bit (140 byte × 8 bit ÷ 7 bit/ký tự = 160 ký tự). Bảng ký tự cơ bản GSM-7 chứa 128 ký tự bao gồm chữ cái Latin, chữ số, một số ký hiệu thông dụng và các ký tự đặc biệt cho ngôn ngữ châu Âu. Bảng mở rộng bổ sung thêm các ký tự như {, }, [, ], nhưng mỗi ký tự mở rộng chiếm 2 vị trí (14 bit) thay vì 1.

Vấn đề lớn nhất với GSM-7 đối với người dùng tiếng Việt là bảng mã này không hỗ trợ các ký tự có dấu đặc trưng của tiếng Việt như ă, â, đ, ê, ô, ơ, ư và các dấu thanh (sắc, huyền, hỏi, ngã, nặng). Khi tin nhắn chứa bất kỳ ký tự nào ngoài bảng GSM-7, toàn bộ tin nhắn sẽ tự động chuyển sang mã hóa UCS-2 (UTF-16), sử dụng 16 bit cho mỗi ký tự và giảm giới hạn xuống còn 70 ký tự mỗi tin nhắn. Điều này có nghĩa hầu hết tin nhắn tiếng Việt đều bị giới hạn ở 70 ký tự, và một tin nhắn dài sẽ bị chia thành nhiều phần với chi phí cao hơn đáng kể. trải nghiệm máy massage đầu trên Amazon để thư giãn sau khi đau đầu tính toán giới hạn SMS.

Tin nhắn SMS dài hơn giới hạn đơn lẻ sẽ được chia thành nhiều phần (concatenated SMS) sử dụng User Data Header (UDH). UDH chiếm 6 byte trong mỗi phần, giảm dung lượng thực tế xuống còn 153 ký tự GSM-7 hoặc 67 ký tự UCS-2 mỗi phần. Ví dụ, một tin nhắn tiếng Việt 200 ký tự sẽ cần 3 phần UCS-2 (67 + 67 + 66), tương đương chi phí gấp 3 lần tin nhắn đơn. Các dịch vụ SMS marketing cần tính toán chính xác số phần tin nhắn để kiểm soát chi phí, và công cụ đếm ký tự hiển thị số phần SMS dự kiến là tính năng thiết yếu cho các nhà tiếp thị.

Sự xuất hiện của emoji càng làm phức tạp thêm vấn đề đếm ký tự SMS. Emoji không nằm trong bảng GSM-7, nên chỉ cần một emoji duy nhất cũng buộc toàn bộ tin nhắn chuyển sang UCS-2. Hơn nữa, nhiều emoji hiện đại nằm ngoài Basic Multilingual Plane (BMP) và cần cặp đại diện (surrogate pair) trong UCS-2, chiếm 4 byte (2 ký tự UCS-2) thay vì 2 byte. Một emoji gia đình với chuỗi ZWJ có thể chiếm tới 15 vị trí ký tự UCS-2, gần bằng một phần tư giới hạn 70 ký tự. Trong thời đại nhắn tin hiện đại, các ứng dụng OTT như Zalo, Messenger hay iMessage đã vượt qua giới hạn SMS truyền thống, nhưng SMS vẫn quan trọng cho xác thực OTP, thông báo hệ thống và tiếp thị. Công cụ đếm ký tự tích hợp bộ đếm SMS giúp người dùng tối ưu hóa nội dung tin nhắn và kiểm soát chi phí. tìm thuốc bổ sinh lực trên Amazon để có năng lượng soạn tin nhắn suốt ngày.

Chia sẻ bài viết này