Quy ước viết tiếng Nhật | Dấu câu, ngoặc và định dạng số
Khi viết quy tắc cơ bản về văn bản tiếng Nhật, bạn đã bao giờ không chắc chắn về dấu câu, ngoặc hay định dạng số chưa? Nắm vững các quy ước đúng sẽ tạo ra văn bản dễ đọc và đáng tin cậy. Bài viết này bao gồm mọi thứ từ bối cảnh lịch sử của các quy tắc định dạng đến kỹ thuật kiểm tra thực tế cho mục đích chuyên nghiệp. Để nghiên cứu sâu hơn, hãy khám phá sách hướng dẫn phong cách viết tiếng Nhật.
Lịch sử đáng ngạc nhiên của dấu câu tiếng Nhật
Lần chuẩn hóa chính thức đầu tiên về dấu câu tiếng Nhật (、。) diễn ra vào năm 1946 khi Bộ Giáo dục công bố "Quy tắc về dấu câu" (くぎり符号の使ひ方). Trước đó, không có quy tắc dấu câu thống nhất, và các tài liệu thời Minh Trị hoàn toàn không có dấu câu không phải là điều hiếm gặp.
Dấu câu thực sự được đưa vào văn bản tiếng Nhật vào những năm 1880 (Minh Trị 20). Năm 1906 (Minh Trị 39), Bộ Giáo dục công bố "Dự thảo dấu câu" (句読法案), đề xuất công khai đầu tiên về cách sử dụng dấu câu. Tuy nhiên, dự thảo này không có hiệu lực ràng buộc, và các tờ báo cùng nhà xuất bản đều hoạt động theo quy tắc riêng. Phải đến chỉ thị năm 1946, một tiêu chuẩn toàn quốc mới chính thức được thiết lập.
Kiểu ",." (dấu phẩy và dấu chấm) được sử dụng trong các bài báo học thuật đã lan rộng như một nỗ lực áp dụng dấu phân cách kiểu phương Tây cho văn bản ngang. Năm 1952, Hội đồng Ngôn ngữ Quốc gia quy định rằng văn bản ngang nên sử dụng ",。" trong "Hướng dẫn soạn thảo văn bản công vụ." Tuy nhiên, vào năm 2022, Hội đồng Văn hóa Nhật Bản đã sửa đổi tiêu chuẩn định dạng văn bản công để khuyến nghị sử dụng "、。" ngay cả cho văn bản ngang. Cải cách này đã đẩy nhanh quá trình chuyển đổi từ ",." sang "、。" trong các văn bản chính phủ.
Chọn giữa "、" và "," - Quy tắc thay đổi theo loại tài liệu
Việc chọn kiểu dấu câu phụ thuộc rõ ràng vào loại tài liệu. Bảng sau tóm tắt các kiểu dấu câu tiêu chuẩn cho các loại tài liệu chính.
| Loại tài liệu | Kiểu dấu câu | Cơ sở / Ghi chú |
|---|---|---|
| Nội dung web thông thường | "、。" | Kiểu tiêu chuẩn được sử dụng rộng rãi nhất |
| Văn bản chính phủ (sau 2022) | "、。" | Được khuyến nghị theo sửa đổi của Hội đồng Văn hóa |
| Bài báo học thuật khoa học/kỹ thuật | ",." | Được nhiều hội áp dụng (ví dụ: Hội Vật lý Nhật Bản) |
| Bài báo học thuật nhân văn | "、。" hoặc ",。" | Thay đổi theo hội và tạp chí |
| Văn bản pháp lý | "、。" | Tuân theo quy ước định dạng luật định |
Lưu ý rằng ngay cả trong các bài báo học thuật, quy tắc cũng khác nhau tùy theo hội. Luôn kiểm tra hướng dẫn nộp bài của ấn phẩm mục tiêu.
Quy tắc dấu câu
Dấu câu tiếng Nhật có hai kiểu chính: "、。" (văn bản ngang) và ",." (bài báo học thuật). Nội dung web thông thường sử dụng "、。".
- Chèn dấu phẩy (、) khi câu vượt quá 40–50 ký tự
- Đặt dấu phẩy sau chủ ngữ, sau liên từ và giữa các mục song song
- Luôn kết thúc câu bằng dấu chấm (。); các gạch đầu dòng kết thúc bằng danh từ có thể bỏ qua
- Không đặt dấu phẩy ngay trước dấu ngoặc kép mở (ví dụ: ✕ 彼は、「行く」と言った。→ ○ 彼は「行く」と言った。)
- Việc đặt dấu chấm trước dấu ngoặc kép đóng vẫn còn tranh luận, nhưng thông lệ phổ biến là bỏ qua (ví dụ: 「行きます」)
Các loại ngoặc và cách sử dụng
Tiếng Nhật sử dụng hơn 10 loại ngoặc, nhưng 6 loại sau đây được sử dụng thường xuyên nhất trên thực tế. Chọn sai loại ngoặc có thể khiến ý nghĩa bạn muốn truyền đạt bị hiểu nhầm.
| Ngoặc | Tên | Cách dùng | Ghi chú |
|---|---|---|---|
| 「」 | Kagi-kakko | Hội thoại, trích dẫn, nhấn mạnh | Loại ngoặc cơ bản nhất. Tránh lạm dụng để nhấn mạnh |
| 『』 | Niju kagi-kakko | Tên sách, tên tác phẩm, trích dẫn lồng nhau | Dùng cho trích dẫn bên trong 「」 |
| () | Maru-kakko | Giải thích bổ sung, chú thích | Nửa chiều rộng là tiêu chuẩn cho văn bản ngang |
| 【】 | Sumi-tsuki kakko | Tiêu đề, nhãn danh mục | Tránh dùng trong nội dung chính; chỉ dùng cho tiêu đề |
| 〈〉 | Yama-kakko | Tên tác phẩm, nhấn mạnh (ngành xuất bản) | Đôi khi được dùng thay thế cho kagi-kakko |
| 〔〕 | Kikko-kakko | Bổ sung trong văn bản trích dẫn, ghi chú biên tập | Dùng để thêm từ không có trong văn bản gốc |
Có quy tắc rõ ràng cho việc lồng dấu ngoặc kép. Nguyên tắc là sử dụng 「」 ở bên ngoài và 『』 ở bên trong. Nếu cần lồng ba lớp, cấu trúc câu nên được xem xét lại. Ví dụ: 彼は「先生が『「走れメロス」を読みなさい』と言った」と話した — việc lồng ba lớp như vậy rất khó đọc, và viết lại bằng lời nói gián tiếp sẽ tốt hơn.
Định dạng số
Văn bản ngang thường sử dụng chữ số Ả Rập nửa chiều rộng, trong khi văn bản dọc và các thành ngữ sử dụng chữ số kanji.
- Nửa chiều rộng: 100 yen, 2025, 3 items
- Kanji: 一般的 (thông thường), 四季 (bốn mùa), 七五三 (lễ hội Shichi-Go-San)
Tại sao chữ số nửa chiều rộng được khuyến nghị cho văn bản ngang? Điều này liên quan đến khả năng đọc và mật độ thông tin. Chữ số toàn chiều rộng "12345" chiếm gần gấp đôi chiều rộng so với nửa chiều rộng "12345," và càng nhiều chữ số thì càng khó đọc. Ngoài ra, sự khác biệt giữa ký tự toàn chiều rộng và nửa chiều rộng ảnh hưởng đến việc đếm ký tự, vì vậy cần đặc biệt chú ý trong các tình huống có giới hạn ký tự.
Dưới đây là một số trường hợp thường gây nhầm lẫn cần lưu ý.
| Biểu thức | Khuyến nghị | Lý do |
|---|---|---|
| 一つ / 1つ | Cả hai đều chấp nhận được | Giữ nhất quán trong tài liệu |
| 3か月 / 三か月 | "3か月" cho văn bản ngang | Dùng nửa chiều rộng cho số lượng |
| 第1章 / 第一章 | "第1章" cho văn bản ngang | Nửa chiều rộng là tiêu chuẩn ngay cả cho số thứ tự |
| 一人ひとり | Chữ số kanji | Giữ kanji cho các thành ngữ |
| 100万円 / 1,000,000円 | "100万円" | Dùng từ đơn vị (万, 億) cho số lớn |
Tại sao vị trí dấu phẩy quan trọng
Sự có mặt hay vắng mặt của dấu phẩy có thể thay đổi hoàn toàn ý nghĩa câu. Một ví dụ nổi tiếng là "ここではきものをぬいでください" — có thể có nghĩa là "Xin hãy cởi giày ở đây" (ここで、はきものを) hoặc "Xin hãy cởi kimono ở đây" (ここでは、きものを) tùy thuộc vào vị trí dấu phẩy.
Hướng dẫn chèn dấu phẩy khi câu vượt quá 40–50 ký tự liên quan đến khả năng ghi nhớ ngắn hạn của con người. Trong tâm lý học nhận thức, số lượng khối thông tin mà một người có thể xử lý cùng lúc được cho là 7±2. Khi câu quá dài, người đọc quên phần đầu khi đọc đến cuối. Dấu phẩy đóng vai trò như tín hiệu báo cho não người đọc "bạn có thể xử lý thông tin đến đây."
Các ký hiệu dễ nhầm lẫn
Một số ký hiệu trong văn bản tiếng Nhật đặc biệt dễ gây nhầm lẫn. Chúng trông gần như giống hệt nhau nhưng sử dụng sai có thể ảnh hưởng đến chức năng tìm kiếm và xử lý văn bản.
| Ký hiệu | Tên | Cách dùng | Lỗi thường gặp |
|---|---|---|---|
| ー | Chōon (dấu nguyên âm dài, U+30FC) | Nguyên âm dài katakana (コンピューター) | Nhầm với gạch ngang dài "―" |
| ― | Gạch ngang dài (U+2015) | Chèn ngoặc đơn, phạm vi | Nhầm với chōon "ー" hoặc gạch nối |
| – | Gạch ngang ngắn (U+2013) | Phạm vi số (1–10) | Nhầm với gạch ngang dài |
| 〜 | Dấu sóng (U+301C) | Phạm vi (東京〜大阪) | Nhầm với dấu ngã toàn chiều rộng "~" (U+FF5E) |
| … | Dấu chấm lửng (U+2026) | Lược bỏ, bỏ lửng | Thay thế bằng ba dấu chấm "..." |
Sự nhầm lẫn giữa "ー" (chōon) và "―" (gạch ngang dài) đặc biệt có vấn đề. Nếu bạn gõ nguyên âm dài trong "コンピューター" bằng gạch ngang dài, chức năng tìm kiếm có thể không tìm thấy từ đó.
Lỗi phổ biến
- Lạm dụng dấu phẩy: "Hôm nay, thời tiết, đẹp, nên, tôi, đi, dạo." — dấu phẩy quá nhiều làm văn bản bị phân mảnh và thực tế giảm khả năng đọc. Một đến ba dấu phẩy mỗi câu là phù hợp.
- Trộn lẫn toàn chiều rộng và nửa chiều rộng: Sử dụng toàn chiều rộng "123" và nửa chiều rộng "123" trong cùng một tài liệu trông thiếu chuyên nghiệp. Chuẩn hóa bằng nửa chiều rộng cho văn bản ngang.
- Dấu chấm lửng sai: Dấu chấm lửng đúng trong tiếng Nhật là "……" (hai dấu liên tiếp). Thay thế bằng "..." (ba dấu chấm) hoặc "。。。" (ba dấu kết câu) nên tránh trong cả xuất bản và viết web.
- Nhầm lẫn dấu sóng và dấu ngã: Ký hiệu phạm vi "〜" (dấu sóng, U+301C) và "~" (dấu ngã toàn chiều rộng, U+FF5E) trông gần như giống hệt nhau nhưng là các ký tự Unicode khác nhau. Chúng hiển thị khác nhau tùy thuộc vào hệ điều hành và phông chữ, có thể gây ra vấn đề hỏng ký tự.
Quy tắc định dạng cho văn bản đa ngôn ngữ
Nội dung web ngày càng trộn lẫn tiếng Nhật với tiếng Anh và mã lệnh. Cùng với kiến thức cơ bản về định dạng văn bản tiếng Nhật, hãy lưu ý các điểm sau.
- Chèn khoảng trắng xung quanh ký tự chữ và số: Thêm khoảng trắng nửa chiều rộng giữa tiếng Nhật và văn bản chữ số, như "HTML を学ぶ," cải thiện khả năng đọc.
- Không trộn lẫn dấu câu tiếng Anh và tiếng Nhật: Tránh sử dụng dấu chấm "." hoặc dấu phẩy "," trong câu tiếng Nhật. Sử dụng nhất quán "、。".
- Chuẩn hóa chiều rộng ngoặc: Sử dụng ngoặc nửa chiều rộng () cho cả phần tiếng Anh và tiếng Nhật trong văn bản ngang. Ngoặc toàn chiều rộng()dành cho văn bản dọc.
- Sử dụng ký hiệu đơn vị nửa chiều rộng: Viết "100 kg" và "25 ℃" với khoảng trắng nửa chiều rộng giữa số và đơn vị, sử dụng ký hiệu nửa chiều rộng.
Kỹ thuật chuyên nghiệp
- Kiểm tra bằng cách đọc to: Đọc to văn bản giúp bạn cảm nhận được vị trí dấu phẩy có tự nhiên hay không. Nơi bạn muốn lấy hơi chính là nơi nên đặt dấu phẩy. Các biên tập viên chuyên nghiệp luôn xác minh bằng cách đọc to.
- Danh sách kiểm tra tính nhất quán định dạng: Tạo danh sách kiểm tra các quy tắc như "số nửa chiều rộng," "ngoặc nửa chiều rộng," và "hai dấu chấm lửng liên tiếp," rồi xem lại sau khi viết. Các nhà xuất bản lớn duy trì sổ tay phong cách dài hàng chục trang. Dưới đây là các mục tối thiểu cần kiểm tra.
| Mục kiểm tra | Tiêu chuẩn |
|---|---|
| Số | Nửa chiều rộng cho văn bản ngang; kanji cho thành ngữ |
| Ngoặc | Nửa chiều rộng () cho văn bản ngang |
| Dấu chấm lửng | "……" (hai dấu liên tiếp) |
| Dấu nguyên âm dài | "ー" (U+30FC) |
| Phong cách viết | Nhất quán desu/masu hoặc da/dearu xuyên suốt |
| Dấu câu | Chuẩn hóa "、。" (trừ bài báo học thuật) |
| Khoảng cách | Khoảng trắng nửa chiều rộng xung quanh ký tự chữ và số |
Sử dụng công cụ hiệu đính
Chỉ kiểm tra thủ công chắc chắn sẽ dẫn đến sót lỗi. Sử dụng công cụ hiệu đính kết hợp với kiểm tra thủ công giúp phát hiện sự không nhất quán về định dạng và lỗi một cách hiệu quả. Các sổ tay hiệu đính và biên tập chuyên nghiệp cung cấp phương pháp có hệ thống để đảm bảo chất lượng.
- Tìm kiếm regex trong trình soạn thảo văn bản: Bạn có thể kiểm tra cơ học sự xâm nhập của chữ số toàn chiều rộng ([0-9]) hoặc phát hiện khoảng trắng toàn chiều rộng ([\u3000]) bằng biểu thức chính quy.
- Phần mềm hiệu đính: Các công cụ tự động phát hiện sự không nhất quán về định dạng (như trộn lẫn "サーバー" và "サーバ") cho phép chuẩn hóa hiệu quả ngay cả trên các bộ tài liệu lớn.
- Tệp từ điển tùy chỉnh: Đăng ký các thuật ngữ riêng của dự án (tên sản phẩm, thuật ngữ kỹ thuật) trong tệp từ điển cải thiện độ chính xác của công cụ hiệu đính.
Ảnh hưởng đến việc đếm ký tự
Dấu câu và ngoặc mỗi cái đều được tính là một ký tự. Trong giấy viết bản thảo (genko yoshi), dấu câu không được xuất hiện ở đầu dòng — xử lý "treo" được áp dụng. Khi viết trong giới hạn ký tự, hãy lưu ý đến số lượng dấu câu.
Ngoặc toàn chiều rộng()được tính là 2 ký tự, trong khi ngoặc nửa chiều rộng () có thể được tính là 1 hoặc 2 ký tự tùy thuộc vào môi trường. Trong các tình huống có giới hạn ký tự nghiêm ngặt (quảng cáo, bài đăng mạng xã hội), việc chọn giữa ngoặc toàn chiều rộng và nửa chiều rộng ảnh hưởng trực tiếp đến số ký tự của bạn. Sử dụng Bộ đếm ký tự để xác minh số lượng thực tế trong khi điều chỉnh là cách tiếp cận đáng tin cậy nhất.
Kết luận
Các quy tắc định dạng tiếng Nhật đã được hoàn thiện trong hơn một thế kỷ kể từ khi dấu câu được giới thiệu vào thời Minh Trị. Các quy ước định dạng đúng nâng cao chất lượng văn bản của bạn và tạo nền tảng để giành được sự tin tưởng của người đọc. Sử dụng Bộ đếm ký tự để kiểm tra số ký tự trong khi tạo ra văn bản tiếng Nhật dễ đọc.