Katakana
Một trong các hệ thống chữ viết ngữ âm tiếng Nhật. Dùng cho từ mượn, từ tượng thanh và thuật ngữ khoa học.
Katakana là một trong hai hệ thống chữ viết ngữ âm tiếng Nhật, bao gồm 46 ký tự cơ bản (thanh trong) cộng với thanh đục, bán đục và âm ghép. Nó được tạo ra trong thời kỳ Heian bằng cách đơn giản hóa các phần của chữ Hán (bộ thủ và thành phần), tạo ra hình dạng góc cạnh, đường thẳng. Trong khi hiragana phát triển từ dạng thảo của kanji, katakana được tạo ra bằng cách trích xuất các phần của ký tự kanji.
Công dụng chính của katakana là viết từ mượn nước ngoài. Các từ mượn từ tiếng Anh và ngôn ngữ khác được viết bằng katakana, như "コンピュータ" (máy tính), "インターネット" (internet) và "プログラミング" (lập trình). Trong lĩnh vực CNTT, từ katakana đặc biệt phổ biến, với các thuật ngữ như "サーバー" (máy chủ), "データベース" (cơ sở dữ liệu) và "アルゴリズム" (thuật toán) chiếm phần đáng kể trong tài liệu kỹ thuật. Sách hệ thống chữ viết tiếng Nhật giải thích chi tiết quy tắc sử dụng katakana.
Ngoài từ mượn, katakana được dùng cho từ tượng thanh (ガタガタ cho tiếng lạch cạch, キラキラ cho lấp lánh), tên khoa học của thực vật và động vật, nhấn mạnh và điện tín. Trong quảng cáo và manga, viết các từ thường bằng hiragana bằng katakana thay thế là kỹ thuật phổ biến để tạo tác động thị giác.
Trong Unicode, katakana toàn chiều rộng chiếm U+30A0 đến U+30FF. Katakana nửa chiều rộng được định nghĩa riêng tại U+FF65 đến U+FF9F, di sản từ máy tính Nhật Bản những năm 1980 nơi katakana có thể được biểu diễn trong một byte duy nhất. Trong katakana nửa chiều rộng, dakuten (dấu thanh đục) và handakuten (dấu bán đục) được coi là ký tự riêng biệt, vì vậy "ガ" trở thành "ガ" (2 ký tự), ảnh hưởng đến số ký tự.
Ký hiệu katakana có nhiều biến thể cần chú ý trong thực tế. Ví dụ, "コンピュータ" so với "コンピューター" và "サーバ" so với "サーバー" khác nhau ở việc có bao gồm dấu nguyên âm dài hay không. Tiêu chuẩn JIS truyền thống bỏ qua nguyên âm dài cuối cho từ có ba âm tiết trở lên, nhưng bản sửa đổi năm 2019 đã hướng tới việc bao gồm chúng. Tài liệu tham khảo tiếng Nhật bao gồm phương pháp nhập và quy ước katakana.
Đối với đếm ký tự, cả katakana toàn chiều rộng và nửa chiều rộng đều đếm là một ký tự. Tuy nhiên, trong UTF-8, cả katakana toàn chiều rộng và nửa chiều rộng đều sử dụng 3 byte mỗi ký tự. Vì dakuten và handakuten nửa chiều rộng là ký tự độc lập (không phải ký tự kết hợp), số ký tự trực quan có thể khác với số đếm thực tế. Áp dụng chuẩn hóa Unicode (NFC/NFKC) để chuyển đổi sang toàn chiều rộng được khuyến nghị cho xử lý văn bản.