Kanji thường dùng (Jouyou Kanji)

Danh sách 2.136 chữ Hán (kanji) được Hội đồng Văn hóa Nhật Bản quy định làm chuẩn mực sử dụng trong đời sống hàng ngày. Đóng vai trò tiêu chuẩn sử dụng chữ Hán trong giáo dục, xuất bản và văn bản hành chính, ảnh hưởng đến thiết kế số ký tự trong tiếng Nhật.

Kanji thường dùng (常用漢字 - jouyou kanji) là 2.136 chữ Hán được liệt kê trong "Bảng Kanji thường dùng" sửa đổi năm 2010. Bảng này được định vị là "chuẩn mực sử dụng chữ Hán khi viết tiếng Nhật hiện đại trong đời sống xã hội thông thường, bao gồm văn bản pháp luật, công văn, báo chí, tạp chí, phát thanh truyền hình". Tuy không có tính bắt buộc, nhưng các tòa soạn báo và nhà xuất bản đều lấy bảng này làm tiêu chuẩn để quyết định sử dụng hay không sử dụng một chữ Hán.

Lịch sử bảng kanji thường dùng bắt đầu từ "Bảng Kanji đương dụng" (当用漢字表) năm 1946 với 1.850 chữ. Bảng đương dụng mang tính hạn chế mạnh, khuyến nghị không sử dụng chữ ngoài bảng. Năm 1981, bảng được sửa đổi thành "Bảng Kanji thường dùng" (1.945 chữ) với định vị nhẹ nhàng hơn là "chuẩn mực". Lần sửa đổi năm 2010 bổ sung 196 chữ và loại bỏ 5 chữ, đạt con số 2.136 chữ hiện tại. Các chữ được bổ sung bao gồm những chữ có nhiều nét nhưng thường dùng như "鬱" (uất) và "彙" (vựng, trong "語彙" - từ vựng).

Kanji thường dùng ảnh hưởng sâu sắc đến thiết kế số ký tự trong tiếng Nhật. Báo chí viết bài trong phạm vi kanji thường dùng, chữ ngoài bảng được ghi kèm furigana (phiên âm) hoặc viết bằng hiragana. Ví dụ: "薔薇" (hoa hồng) → "ばら", "蝶" (bướm) → "チョウ". Khi thay kanji bằng hiragana, số ký tự thay đổi vì 1 chữ Hán thường tương đương 2-4 ký tự hiragana. Điều này tương tự như trong tiếng Việt, khi viết tắt "Thành phố Hồ Chí Minh" thành "TP.HCM" làm giảm đáng kể số ký tự.

Về giáo dục, kanji thường dùng được dạy trong 6 năm tiểu học và 3 năm trung học cơ sở. 1.026 chữ học ở tiểu học gọi là "kanji giáo dục" (教育漢字), phân bổ theo từng lớp: lớp 1 học 80 chữ, lớp 6 học 191 chữ. Khi thiết kế nội dung cho trẻ em Nhật, cần xem xét phạm vi kanji đã học của lứa tuổi mục tiêu. Khái niệm này tương tự việc kiểm soát độ khó từ vựng trong giáo dục tiếng Việt, dù tiếng Việt không có hệ thống phân cấp chữ viết tương đương.

Về mã hóa ký tự, bộ kanji cấp 1 của JIS X 0208 (2.965 chữ) bao gồm toàn bộ kanji thường dùng. Nghĩa là không có kanji thường dùng nào không thể biểu diễn bằng Shift_JIS hoặc EUC-JP. Unicode bao phủ phạm vi rộng hơn nhiều, và toàn bộ kanji thường dùng đều nằm trong BMP (Mặt phẳng đa ngôn ngữ cơ bản).

Trong thực tế đếm ký tự, kiến thức về kanji thường dùng hữu ích cho việc thiết kế chỉ số "dễ đọc". Văn bản có tỷ lệ kanji thường dùng cao dễ đọc với độc giả phổ thông, còn văn bản nhiều kanji ngoài bảng tạo ấn tượng chuyên môn hoặc khó hiểu. Một số công cụ phân tích văn bản tính tỷ lệ sử dụng kanji thường dùng để đánh giá độ khó của văn bản.

Chia sẻ bài viết này