Transliteration

Quá trình chuyển đổi văn bản từ hệ thống chữ viết này sang hệ thống khác trong khi bảo toàn ngữ âm.

Chuyển tự là quá trình chuyển đổi văn bản viết trong một hệ thống chữ viết sang hệ thống khác. Khác với dịch thuật thay thế ý nghĩa sang ngôn ngữ khác, chuyển tự bảo toàn ngữ âm (cách phát âm) trong khi chỉ thay thế ký tự. For example, writing the Japanese "東京" as "Tokyo" in Roman letters is a form of transliteration. It is used in many contexts including internationalization, search engines, and passport name notation.

Có nhiều hệ thống tiêu chuẩn cho chuyển tự. Japanese romanization has Hepburn and Kunrei systems, where "し" is written as "shi" in Hepburn but "si" in Kunrei. Cyrillic-to-Latin conversion follows ISO 9, and Chinese Pinyin follows ISO 7098. Passport names use Hepburn romanization, requiring attention to long vowel handling, such as whether "おおの" becomes "ONO" or "OHNO." Linguistics and writing systems books provide systematic coverage.

Cho triển khai lập trình, thư viện ICU (International Components for Unicode) là tiêu chuẩn thực tế. ICU's Transliterator class provides conversion rules between numerous writing systems, such as Latin-to-Katakana and Cyrillic-to-Latin. Python has the unidecode library, JavaScript has the transliteration package, and similar tools exist for other languages. Search engines use transliteration to convert romanized search queries into Japanese for matching.

Chuyển tự và phiên âm thường bị nhầm lẫn. Transliteration is based on character-to-character correspondence and is generally reversible. Transcription is based on pronunciation and may be irreversible. For example, "ふじさん" romanized as "Fujisan" is transliteration, while an English speaker writing the heard sound as "Foojeesan" is closer to transcription.

Một cạm bẫy phổ biến là chuyển tự không phải lúc nào cũng tạo ra ánh xạ ký tự một-một. Japanese "ん" is romanized as "n," but becomes "m" before "b," "m," or "p" (e.g., "新橋" becomes "Shimbashi"), making simple character substitution insufficient. Additionally, tonal marks in Chinese or vowel marks in Arabic may be lost during Latin transliteration.

Về đếm ký tự, chuyển tự có thể thay đổi đáng kể số ký tự. A single kanji character may become multiple Roman letters ("東" becomes "higashi" with 7 characters), so the impact on character limits must be considered before and after transliteration. For social media posts and meta descriptions with character limits, checking post-transliteration character counts is practically important. Multilingual text processing books are also helpful references.