Line Break
Quá trình xuống dòng văn bản sang dòng tiếp theo. Được kiểm soát trong CSS bởi thuộc tính word-break và overflow-wrap.
Ngắt dòng là quá trình xuống dòng văn bản từ dòng hiện tại sang dòng tiếp theo. Trong phát triển web, có hai loại: ngắt dòng rõ ràng sử dụng thẻ HTML <br>, và xuống dòng tự động (soft wrap) được trình duyệt thực hiện dựa trên chiều rộng dòng. Bằng cách kết hợp các thuộc tính CSS như word-break, overflow-wrap và white-space, bạn có thể kiểm soát chi tiết hành vi ngắt dòng tự động.
Văn bản CJK (tiếng Trung, tiếng Nhật, tiếng Hàn) có thể ngắt ở hầu hết mọi vị trí ký tự vì từ không được phân tách bằng khoảng trắng. Văn bản tiếng Anh, ngược lại, không nên ngắt giữa từ theo mặc định. Đặt word-break: break-all trong CSS cho phép văn bản tiếng Anh ngắt ở bất kỳ vị trí nào, nhưng điều này giảm khả năng đọc và nên sử dụng cẩn thận. overflow-wrap: break-word cung cấp cách tiếp cận nhẹ nhàng hơn, chỉ ngắt các từ dài sẽ tràn container. Sách quy tắc sắp chữ CJK bao gồm quy tắc cấm ngắt dòng.
Kinsoku là quy tắc ngắt dòng quan trọng trong sắp chữ tiếng Nhật. Nó bao gồm quy tắc ngăn dấu câu và ngoặc đóng xuất hiện ở đầu dòng, và ngoặc mở xuất hiện ở cuối dòng. Thuộc tính CSS line-break kiểm soát mức độ nghiêm ngặt của các quy tắc này qua bốn cấp: auto, loose, normal và strict. Trong chế độ strict, ký tự kana nhỏ cũng tuân theo quy tắc cấm đầu dòng.
Trong lập trình, sự khác biệt mã xuống dòng thường gây ra vấn đề thực tế. Unix/Linux sử dụng LF (0x0A), Mac OS cổ điển sử dụng CR (0x0D) và Windows sử dụng CRLF (0x0D0A). Các vấn đề như diff lớn bất ngờ trong Git hoặc trình phân tích CSV thất bại thường do không khớp mã xuống dòng. Sử dụng .editorconfig hoặc cài đặt core.autocrlf của Git để chuẩn hóa mã xuống dòng là phương pháp tốt nhất phổ biến.
Một quan niệm sai lầm phổ biến là nhầm lẫn ngắt dòng HTML với mã xuống dòng. Trong HTML, xuống dòng trong mã nguồn được coi là khoảng trắng và không tạo ngắt dòng trực quan. Để tạo ngắt dòng trực quan, bạn cần sử dụng thẻ <br> hoặc áp dụng white-space: pre-line trong CSS để tôn trọng ký tự xuống dòng.
Đối với đếm ký tự, mã xuống dòng là ký tự điều khiển vô hình nhưng được đếm là ký tự. LF đếm là 1 ký tự, trong khi CRLF đếm là 2, nghĩa là cùng nội dung văn bản có thể có số ký tự khác nhau tùy thuộc vào loại mã xuống dòng. Khi làm việc với biểu mẫu hoặc tin nhắn có giới hạn ký tự, điều quan trọng là xác minh cách xử lý mã xuống dòng trước. Sách phát triển frontend web giải thích chi tiết kiểm soát hiển thị văn bản.