Input Method (IME)

Phần mềm cho phép gõ ký tự không có sẵn trực tiếp trên bàn phím, như ký tự tiếng Nhật và tiếng Trung.

Input Method Editor (IME) là phần mềm cho phép nhập ký tự cho các ngôn ngữ có hệ thống chữ viết chứa nhiều ký tự hơn phím bàn phím có thể chứa. Tiếng Nhật, tiếng Trung, tiếng Hàn và các ngôn ngữ khác với hàng nghìn đến hàng chục nghìn ký tự không thể ánh xạ trực tiếp mỗi ký tự vào một phím, vì vậy IME chuyển đổi đầu vào ngữ âm hoặc cấu trúc thành ký tự đích.

Cơ chế cơ bản của IME tiếng Nhật bao gồm gõ cách đọc bằng romaji hoặc nhập kana, sau đó nhấn phím chuyển đổi để biến đổi thành văn bản hỗn hợp kanji-kana. Quy trình hiển thị ứng viên, chọn và xác nhận là nền tảng của nhập liệu tiếng Nhật. Trong những năm gần đây, độ chính xác chuyển đổi dự đoán đã cải thiện đáng kể, với ứng viên nhận biết ngữ cảnh xuất hiện chỉ sau vài lần gõ phím. Từ điển đám mây cho phép hỗ trợ nhanh chóng từ mới và danh từ riêng. Hướng dẫn phương pháp nhập liệu tiếng Nhật dạy kỹ thuật gõ nhanh hơn.

Các IME tiếng Nhật chính bao gồm Microsoft IME trên Windows, Japanese Input trên macOS (trước đây là Kotoeri), Google Japanese Input và ATOK. Microsoft IME có cơ sở người dùng lớn nhất vì được cài đặt sẵn với Windows. Google Japanese Input nổi tiếng với độ chính xác chuyển đổi cao tận dụng dữ liệu văn bản web khổng lồ. ATOK, IME trả phí của JustSystems, xuất sắc trong chuyển đổi nhận biết ngữ cảnh và từ điển phong phú. Trong thế giới nói tiếng Trung, nhập Pinyin là chủ đạo, với Sogou Input và Baidu Input được sử dụng rộng rãi.

Trong phát triển ứng dụng web, xử lý sự kiện composition IME là thách thức quan trọng. Khi người dùng đang soạn văn bản với IME, "văn bản chưa xác nhận" xuất hiện trong trường văn bản. Xử lý sự kiện input hoặc keydown trong trạng thái này sẽ tác động lên trạng thái trung gian trước khi chuyển đổi được xác nhận. Mẫu tiêu chuẩn là phát hiện bắt đầu composition với compositionstart, phát hiện xác nhận với compositionend và ngăn chặn xử lý sự kiện ở giữa.

Một vấn đề phổ biến liên quan đến IME là nhập trùng lặp trong tính năng tìm kiếm thời gian thực và tự động hoàn thành. Khi người dùng cố gõ "東京" (Tokyo), các trạng thái trung gian "と", "とう", "とうき"... có thể được gửi tuần tự dưới dạng truy vấn tìm kiếm. Xử lý đúng thuộc tính isComposing và sự kiện composition ngăn chặn vấn đề này. Sách quốc tế hóa ứng dụng web bao gồm các mẫu xử lý IME.

Đối với đếm ký tự, cách xử lý văn bản chưa xác nhận trong quá trình composition IME là cân nhắc thiết kế quan trọng. Bộ đếm ký tự thời gian thực có thể bao gồm hoặc loại trừ văn bản chưa xác nhận, dẫn đến hành vi khác nhau. Hầu hết công cụ đếm ký tự nhắm vào văn bản đã xác nhận, nhưng một số triển khai cũng hiển thị số đếm bao gồm văn bản chưa xác nhận như phản hồi nhập liệu.