Tiếng Trung có bao nhiêu ký tự? Con số này thay đổi tùy theo tình huống. Sự thật thú vị về tiếng Trung Khoảng cách giữa các ký tự tiếng Trung

Tiếp tục cuộc trò chuyện của chúng ta về cách viết tiếng Trung phức tạp, chúng ta hãy xem tại sao tiếng Anh lại đơn giản đến vậy. Hãy tưởng tượng thử thách mà một người Trung Quốc trưởng thành bình thường phải đối mặt khi quyết định học tiếng Anh. Anh ấy sẽ cần những gì để thành thạo việc viết lách? Chỉ có 26 chữ cái (tất nhiên, chữ thường và chữ hoa, phông chữ viết tay và một số tùy chọn chính tả. Ngoài ra còn có dấu ngoặc kép, dấu nháy đơn, dấu gạch ngang, dấu ngoặc đơn, v.v. - nhưng bản thân người Trung Quốc có tất cả những thứ này). Làm thế nào để chúng ta viết những lá thư này? Từ trái sang phải. Theo chiều ngang. Với khoảng cách giữa các từ. Nếu bây giờ chúng ta bỏ chính tả sang một bên thì một người Trung Quốc sẽ mất bao lâu để thành thạo cách viết tiếng Anh? Một hoặc hai ngày.

Và bây giờ là tình huống ngược lại: một sinh viên Mỹ quyết định học tiếng Trung. Anh ấy sẽ cần gì? Không có bảng chữ cái, mặc dù tất nhiên có những yếu tố lặp lại tạo nên chữ tượng hình. Có bao nhiêu phần tử như vậy? Tốt hơn là đừng hỏi. Cũng như nhiều câu hỏi khác về tiếng Trung, không có câu trả lời rõ ràng và yên tâm. Nó phụ thuộc vào cách bạn xác định từ "phần tử" (đặc điểm? Chìa khóa?) Và các chi tiết khác. Chỉ cần nói rằng có rất nhiều trong số chúng, nhiều hơn 26. Còn sự kết hợp của những yếu tố này thì sao? Ở bên trái của các yếu tố khác, bên phải của chúng, phía trên, xung quanh, bên trong - hầu hết mọi thứ đều có thể thực hiện được. Và trong quá trình di chuyển trong không gian, các phần tử thay đổi: chúng làm phẳng, kéo dài, nén, co lại, biến dạng - để vừa với không gian được phân bổ cho chúng. Có thể nói, các yếu tố của chữ viết tiếng Trung có hai chiều, trong khi chữ viết chỉ có một chiều.

Ngay cả khi chúng ta không nhớ đến vẻ đẹp của chữ viết, thì một người châu Âu hay người Mỹ sẽ phải mất bao nhiêu thời gian để thành thạo chữ viết Trung Quốc để khi nhìn thấy một ký tự mới, họ biết cách viết ít nhất để đạt được kết quả tốt nhất. công việc của họ ít nhất là giống với nguyên mẫu? Một lần nữa, câu hỏi này rất khó trả lời. Tôi ước tính rằng cần phải mất vài tháng làm việc chăm chỉ để nắm vững những điều cơ bản. Nếu một người vẽ kém thì phải mất một năm hoặc hơn. Trong khi đó, đối thủ Trung Quốc của họ đang học tiếng Anh đã chuyển sang sử dụng phông chữ viết tay. Và họ vẫn còn thời gian để đọc Moby Dick hay thứ gì khác.

Tất nhiên, bảng chữ cái làm cho cuộc sống dễ dàng hơn. Những người Trung Quốc mà tôi biết đã học tiếng Anh được vài năm có thể viết bằng chữ viết tay theo cách mà chữ viết của họ không thể phân biệt được với chữ viết của người Mỹ bình thường. Và đồng thời, chỉ có một số ít người Mỹ có thể viết được chữ trông không giống một tác phẩm vụng về của một học sinh lớp ba Trung Quốc. Ngay cả khi tiếng Trung không có gì khó khăn hơn, thì sự cần thiết tuyệt đối của việc viết các ký tự sẽ khiến nó trở thành một trong những ngôn ngữ khó nhất trên thế giới.

Nhiều người tham gia kỳ thi tin rằng có thể bỏ qua dấu câu và hình thức chung của văn bản, bởi vì họ nói rằng điều này không ảnh hưởng đến điểm số. Tuy nhiên, hãy nhớ rằng phần viết được kiểm tra bởi một người bằng sự đánh giá chủ quan của chính mình chứ không phải bằng máy tính. Các nghiên cứu đã chỉ ra rằng hình thức đẹp mắt của một bài luận và việc sử dụng đúng dấu câu cho thấy người giám khảo có trình độ ngôn ngữ cao và có thể cộng từ 2 đến 10 điểm.

Một diện mạo đẹp trước hết là sự phân chia chính xác thành các đoạn văn và làm nổi bật các tiêu đề.
Nếu bạn chọn viết tiêu đề thì tiêu đề đó phải ở giữa dòng đầu tiên. Nếu bạn muốn đăng ký, chúng tôi sẽ ký vào cuối văn bản hoặc ngay dưới tiêu đề.
Văn bản phải được chia thành các đoạn văn, thụt vào hai ô. . Mỗi suy nghĩ mới = một đoạn văn mới!

Yêu cầu của chúng tôi đối với dấu chấm câu là gì??

Chúng ta hãy nhớ những dấu câu trong tiếng Trung nói chung.

1) Dấu chấm, 句号 (。) truyền tải sự tạm dừng sau khi kết thúc một cụm từ.

2) Dấu phẩy, 逗号 (,) truyền tải sự tạm dừng trong cụm từ, trong khi mọi thứ vẫn như chúng ta có.

3) Bỏ dấu phẩy , 顿号 (、) được đặt khi liệt kê, giữa các thành viên đồng nhất trong câu.
Ví dụ,

  • 我喜欢吃西瓜、苹果、香蕉。- Tôi yêu dưa hấu, táo, chuối.

4) Dấu chấm phẩy 分号 (;) truyền tải sự ngắt quãng giữa các phần của câu phức.

5) Dấu chấm hỏi 问号 (?) - dấu ngắt sau khi kết thúc câu hỏi.

6) Dấu chấm than 感叹号 (!) - dấu ngắt sau khi kết thúc cụm từ truyền tải cảm xúc mạnh mẽ; nó cũng có thể được sử dụng đơn giản sau những từ không tạo thành câu.

7) Dấu hai chấm 冒号 (:) có nghĩa là chuyển sang văn bản sau (ví dụ: trong một bức thư sau khi ghi địa chỉ của người nhận).

8) Dấu ngoặc kép 引号 (“……” hoặc ‘……’) bao quanh một câu trích dẫn, những tên đặc biệt hoặc những phần cần đặc biệt nhấn mạnh.
Chúng cũng có thể, như trong tiếng Nga, có nghĩa bóng và truyền tải sự mỉa mai hoặc phủ nhận:

  • “Người bạn thân nhất này của bạn vừa lấy trộm ví của bạn.

Dấu ngoặc kép thành phần đơn được sử dụng khi phải sử dụng lại dấu ngoặc kép trong dấu ngoặc kép.

9) Và một lần nữa là dấu ngoặc kép, lần này là 书名号 (《……》).
Đúng như tên gọi, những dấu ngoặc kép như vậy bao quanh tên sách, bài báo, bài hát, phim, v.v. được đề cập trong văn bản. Chúng tôi đang dần dần loại bỏ việc người Nga sử dụng bất kỳ loại dấu ngoặc kép nào, cả ở phần đuôi và phần bờm, cũng như tách 书名号 khỏi 引号.
Nhân tiện, 书名号 cũng có một biến thể từ một dấu ngoặc. Ví dụ: khi chúng ta đề cập đến một 《bài viết》 có tiêu đề trong tiêu đề<книги>.

  • 我刚看完了一篇文章叫《莫言小说〈酒国〉中的后现代特征。 - Tôi vừa đọc xong bài viết có tựa đề “Đặc điểm của chủ nghĩa hậu hiện đại ở xứ Rượu Vang” của Mạc Ngôn.

10) Dấu ba chấm 省略号 (……) Đúng vậy, nó bao gồm sáu dấu chấm và chiếm nhiều diện tích hai ô trong văn bản!
Nó biểu thị rằng một số đoạn bị lược bỏ khỏi văn bản, hoặc do dự, một điều gì đó không rõ ràng và không rõ ràng.

11) Dấu gạch ngang 破折号 (--).
Như chúng ta biết, không có dấu gạch nối trong tiếng Trung (nghĩa là “3-4” của chúng ta sẽ được viết là 三四个 và “Trung-Nga” - 汉俄). Nhưng có từ “một, 一”, và để không bị nhầm lẫn với nó, dấu gạch ngang chiếm hai ô.
Dấu gạch ngang nghĩa là bên dưới sẽ có lời giải thích cho nội dung viết ở trên(bằng tiếng Nga, chúng tôi sẽ đặt dấu hai chấm trong trường hợp này!).

12) Thực ra, dấu ngoặc (……)có nghĩa là một nhận xét bên trong văn bản.

Chỉ đặt một điểm ở đâu đó trong một góc là một cách tiếp cận tồi.
Trong tiếng Trung, dấu chấm câu chiếm toàn bộ ô.
Dấu chấm lửng và dấu gạch ngang chiếm toàn bộ hai ô.
Tất cả các dấu câu từ một thành phần (dấu chấm, dấu phẩy, dấu hai chấm, dấu ngoặc kép và dấu ngoặc đóng) không thể xuất hiện đầu tiên trong dòng và dấu ngoặc kép hoặc dấu ngoặc mở đầu không thể xuất hiện cuối cùng trong dòng.

Tất nhiên, có nhiều cách khác để sử dụng dấu câu, nhưng chúng được tìm thấy nhiều hơn trong các văn bản văn học, điều đó có nghĩa là bạn sẽ không cần chúng trong bài kiểm tra!

tái bút Nếu bạn đang thi cấp độ 3 đến 5, hãy đặc biệt chú ý đến nhiệm vụ “đặt câu bằng từ” bạn phải đặt dấu chấm câu (dấu chấm, dấu chấm than hoặc dấu chấm hỏi) ở cuối. Nếu không, điểm của bạn có thể bị giảm.

16

Tôi muốn làm cho tìm kiếm toàn văn bản MySQL hoạt động với văn bản tiếng Nhật và tiếng Trung, cũng như bất kỳ ngôn ngữ nào khác. Vấn đề là những ngôn ngữ này và có lẽ cả những ngôn ngữ khác thường không có khoảng cách giữa các từ. Tìm kiếm không hữu ích khi bạn phải nhập câu giống như trong văn bản.

Tôi không thể đặt dấu cách giữa mỗi ký tự vì tiếng Anh cũng phải có tác dụng. Tôi muốn giải quyết vấn đề này bằng PHP hoặc MySQL.

Tôi có thể định cấu hình MySQL để nhận dạng các ký tự phải là chỉ mục riêng của chúng không? Có mô-đun PHP nào có thể nhận ra các ký tự này để tôi có thể loại bỏ khoảng trắng xung quanh chỉ mục không?

Giải pháp một phần:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00"")."-".json_decode(""\uface"")."]/", " $0 ", $string_without_spaces);

Điều này làm cho lớp nhân vật bị loại bỏ ít nhất một số nhân vật mà tôi cần xử lý cụ thể. Có lẽ tôi nên đề cập đến việc bỏ qua văn bản được lập chỉ mục là có thể chấp nhận được.

Có ai biết tất cả các phạm vi ký tự mà tôi sẽ cần chèn vào đầu dò không?

Ngoài ra, phải có cách nào tốt hơn, di động hơn để thể hiện các ký tự này trong PHP? Mã nguồn ở dạng Literal Unicode không hoàn hảo; Tôi không nhận ra tất cả các nhân vật; chúng có thể không hiển thị trên tất cả các máy tôi cần sử dụng.

3

Các ngôn ngữ hiện đại khác không sử dụng dấu cách giữa các từ là tiếng Thái, tiếng Lào, tiếng Khmer (Campuchia) và tiếng Miến Điện (Myanmar). Trong tiếng Việt có một vấn đề liên quan là khoảng trắng được sử dụng giữa tất cả các âm tiết, trừ từ nước ngoài. - đường mòn hippie 18 tháng 12 10 2010-12-18 12:48:10

  • 2 câu trả lời
  • Sắp xếp:

    Hoạt động

15

Vi phạm từ đối với các ngôn ngữ được đề cập yêu cầu cách tiếp cận ngôn ngữ , ví dụ như một cái sử dụng từ điển cùng với sự hiểu biết cơ bản quy định phát sinh.

Tôi đã nghe nói về các ứng dụng tìm kiếm toàn văn bản tương đối thành công, chỉ cần tách từng ký tự riêng lẻ thành một từ riêng biệt trong tiếng Trung, chỉ cần áp dụng cùng một "mã thông báo" cho tiêu chí tìm kiếm do người dùng cuối cung cấp. Sau đó, công cụ tìm kiếm sẽ cung cấp thứ hạng tốt hơn cho các tài liệu cung cấp ký tự từ theo cùng thứ tự với tiêu chí tìm kiếm. Tôi không chắc liệu điều này có thể mở rộng sang các ngôn ngữ như tiếng Nhật hay không, vì bộ ký tự Hirakana và Katagana khiến văn bản giống với các ngôn ngữ châu Âu hơn với bảng chữ cái ngắn.

BIÊN TẬP:
Tài nguyên
Từ này dùng để chia nhỏ các vấn đề, cũng như các vấn đề liên quan, vậy nên không tầm thường rằng toàn bộ cuốn sách đã được viết về nó. Xem ví dụ Xử lý thông tin CJKV (CJKV là viết tắt của tiếng Trung, tiếng Nhật, tiếng Hàn và tiếng Việt, bạn cũng có thể sử dụng từ khóa CJK vì nhiều văn bản không thảo luận về tiếng Việt). Xem thêm Việc ngắt từ trong tiếng Nhật rất khó đối với một máy nhắn tin về chủ đề này.
Rõ ràng là hầu hết tài liệu về chủ đề này được viết bằng một trong những ngôn ngữ chính là tiếng mẹ đẻ và do đó chỉ dành cho những người không có trình độ tương đối về các ngôn ngữ này. Vì lý do này và để giúp bạn kiểm tra công cụ tìm kiếm, khi bạn bắt đầu triển khai logic ngắt từ, bạn nên tìm kiếm sự trợ giúp từ một hoặc hai người bản ngữ.

Ý tưởng khác nhau
Ý tưởng của bạn xác định các tính năng ngụ ý một cách có hệ thống việc ngắt từ(giả sử dấu ngoặc kép, dấu ngoặc đơn, ký hiệu giống dấu gạch nối, v.v.) là tốt và đây có lẽ là một phương pháp phỏng đoán được sử dụng bởi một số cách ngắt từ chuyên nghiệp. Tuy nhiên, bạn nên tìm kiếm một nguồn có uy tín cho danh sách đó thay vì biên soạn nó từ đầu dựa trên những phát hiện mang tính giai thoại.
Một ý tưởng liên quan là chia các từ thành Chuyển đổi từ Kana sang Kanji(nhưng tôi đoán không phải ngược lại), và có lẽ trong hiragana-sang-katakana hoặc chuyển đổi ngược lại.
Không liên quan đến cái đúng bị hỏng, chỉ mục có thể [-hoặc có thể không- ;-)] được hưởng lợi từ việc chuyển đổi từng ký tự hiragana thành một ký tự katakana tương ứng một cách có hệ thống. Chỉ là một ý tưởng vô học! Tôi không biết đủ về tiếng Nhật để biết liệu điều này có giúp ích gì không; về mặt trực quan, điều này có thể liên quan một cách lỏng lẻo đến việc chuyển đổi có hệ thống các chữ cái có dấu và do đó thành chữ viết không dấu tương ứng, như được thực hiện trong một số ngôn ngữ châu Âu.

Có lẽ ý tưởng mà tôi đã đề cập trước đó về việc lập chỉ mục một cách có hệ thống các ký tự riêng lẻ (và xếp hạng các kết quả tìm kiếm dựa trên sự gần đúng của chúng với cụm từ tìm kiếm) có thể được sửa đổi một chút, ví dụ bằng cách giữ các ký tự kana liên tiếp với nhau và sau đó là một số quy tắc khác... và tạo ra sự không hoàn hảo, nhưng công cụ tìm kiếm khá thực tế.

Đừng thất vọng nếu trường hợp này không xảy ra... Như đã nói, điều này không hề tầm thường và về lâu dài nó có thể giúp bạn tiết kiệm thời gian và tiền bạc bằng cách tạm dừng và đọc một hoặc hai cuốn sách. Một lý do khác để cố gắng tìm hiểu thêm về “lý thuyết” và các phương pháp thực hành tốt nhất là hiện tại bạn dường như đang tập trung vào lời nói vi phạm , nhưng trong tương lai gần, công cụ tìm kiếm cũng có thể được hưởng lợi từ ý thức hệ quả ; thực sự, hai câu hỏi này ít nhất có liên quan về mặt ngôn ngữ và có thể hữu ích khi được xử lý song song.

Chúc bạn may mắn trong nỗ lực khó chịu nhưng xứng đáng này.

0

@Joe: Không có gì. Tôi dường như quan tâm đến ngôn ngữ học và NLP, nhưng có rất ít kiến ​​thức cụ thể về ngôn ngữ CJK. Đọc bản chỉnh sửa của tôi, thêm một số từ khóa và liên kết trực tuyến có thể giúp bạn tìm kiếm may mắn :-) - mjv 22 tháng 10 09

Dấu chấm câu là một phần không thể thiếu của bất kỳ ngôn ngữ nào. Một dấu phẩy thông thường có thể thay đổi hoàn toàn ý nghĩa của một câu: chỉ cần nhớ lại câu chuyện “Không thể tha thứ”. Và công việc của biên dịch viên, biên tập viên đòi hỏi họ phải thông thạo ít nhất hai hệ thống dấu câu.

Ý tưởng cho bài đăng này nảy sinh khi chúng tôi đang thảo luận về việc dịch một bài báo. Trong tài liệu nguồn, dấu phần trăm được phân tách bằng dấu cách với số và điều này khiến tôi chú ý - trong văn bản tiếng Nga trong trường hợp này, dấu cách không được sử dụng (mặc dù tuyên bố vẫn còn gây tranh cãi - các chuyên gia vẫn chưa đi đến một kết luận nào). nhất trí về vấn đề này). Sau đó, chúng tôi quyết định rằng chúng tôi cần phải nói về nó. Các chuyên gia từ Phòng Bản địa hóa Đa ngôn ngữ đã phỏng vấn các đồng nghiệp nước ngoài của chúng tôi và chuẩn bị tài liệu mà chúng tôi hiện đang chia sẻ với bạn. Chúng tôi hy vọng bạn thấy nó hữu ích.

Ở đầu và ở cuối
Chúng ta hãy xem mọi thứ diễn ra như thế nào với vị trí của dấu câu trong câu: dấu chấm, dấu phẩy, dấu hai chấm, dấu chấm phẩy, dấu hỏi và dấu chấm than.

Chúng tôi hy vọng mọi người đều nhớ về tiếng Nga - dấu chấm câu dùng để phân tách các câu với nhau chỉ được đặt ở cuối, dấu chấm. Nếu bạn cần thêm biểu thức (đặc biệt là trong thư từ cá nhân), sự kết hợp của các ký tự sẽ được sử dụng - “!!!”, “?!” và những thứ tương tự. Trong tiếng Anh, tiếng Đức, tiếng Ý, tiếng Pháp, tiếng Canada, tiếng Ả Rập và tiếng Bồ Đào Nha Brazil, dấu chấm, dấu chấm lửng và “đồng chí” của chúng đều tuân theo các quy tắc tương tự.

Các quy tắc khác trong tiếng Pháp: dấu hai chấm, dấu chấm phẩy, dấu chấm than và dấu hỏi được đặt trước bởi dấu cách không ngắt.

Tiếng Tây Ban Nha là ngôn ngữ duy nhất trong lựa chọn của chúng tôi có dấu chấm câu đóng khung các câu: ở đầu cụm từ, dấu hỏi và dấu chấm than được sao chép ở dạng đảo ngược “hơi” - “¿” và “¡”.

Người Trung Quốc có cách tiếp cận khác thường nhất đối với dấu chấm câu theo quan điểm của người châu Âu. Dấu chấm của chúng trông giống như 。, dấu phẩy trông giống như ,, dấu chấm than trông giống như !, và dấu chấm hỏi trông giống như ?. Trong một câu, họ cư xử giống như người Nga, điểm khác biệt duy nhất là người Trung Quốc không sử dụng dấu cách, vì tất cả các ký tự dấu chấm câu đều là byte kép. Chữ tượng hình gõ trên bàn phím rộng gấp đôi bất kỳ chữ cái nào trong bảng chữ cái Latinh. Vì vậy, dấu chấm câu thường chiếm cùng khoảng trống với chữ tượng hình. Tính năng này đã gặp phải bởi những người làm việc trong IME cũ chạy DOS, khi một chữ tượng hình được nhập sai sẽ bị xóa bằng cách nhấn Backspace hai lần. Dấu cách chủ yếu được sử dụng để phân tách các từ và ký tự khỏi các ngôn ngữ khác, chẳng hạn như tiếng Anh.

Đặc điểm dễ thương
Trong tiếng Nga, dấu gạch nối hoặc dấu gạch ngang được sử dụng. Dấu gạch nối ngắn và cần thiết để chuyển và kết nối các từ ghép. Dấu gạch ngang dài hơn đáng kể; nó dùng để phân tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v. Bạn có thể nhớ tất cả sự tinh tế của việc sử dụng những dấu hiệu này bằng cách xem sách giáo khoa tiếng Nga.

Dấu gạch nối và dấu gạch ngang tồn tại trong các điều kiện tương tự bằng tiếng Anh, tiếng Đức, tiếng Pháp và tiếng Bồ Đào Nha Brazil. Hơn nữa, trong tiếng Anh Mỹ, dấu gạch ngang được phân tách ở cả hai bên bằng dấu cách, nhưng trong tiếng Anh Anh thì thường không như vậy:

Bài giảng – là bài giảng thứ ba về chủ đề này trong tháng – sẽ có sự tham gia của các diễn giả đến từ các quốc gia khác nhau. (tiếng Anh Mỹ)

Vườn thú có rất nhiều mèo - sư tử, báo, hổ, báo đốm và báo gêpa - khiến việc chọn con yêu thích trở nên rất khó khăn. (Anh Anh)


Trong tiếng Tây Ban Nha, tiếng Ý và tiếng Ả Rập, dấu gạch ngang và dấu gạch ngang trông giống nhau: "-". Người Trung Quốc hoàn toàn không sử dụng dấu gạch nối - họ chỉ có dấu gạch ngang. Mặc dù bên cạnh các chữ cái trong bảng chữ cái Latinh có thể có dấu gạch nối, dấu gạch ngang dài và dấu gạch ngang ở giữa. Dấu gạch nối ngắn và cần thiết để chuyển và kết nối các từ ghép. Dấu gạch ngang dài hơn đáng kể; nó dùng để phân tách các phần ngữ nghĩa
Ngôn ngữ Dấu gạch nối Dấu gạch ngang (Alt 0151)
tiếng Nga
Anh Mỹ Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v.
Tiếng Anh
người Anh
Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v. Không ngăn cách bởi khoảng trống ở cả hai bên.
tiếng Đức Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v.
người Pháp Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v.
người Canada gốc Pháp Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v.
tiếng Tây Ban Nha Có, trong mọi trường hợp -
tiếng Bồ Đào Nha
người Brazil
Có, để gạch nối và nối các từ ghép Có, để tách các phần ngữ nghĩa: các câu khác nhau, hai phần của một câu, trong các đoạn hội thoại, v.v.
người Ý Có, trong mọi trường hợp -
Ả Rập Có, trong mọi trường hợp -
Tiếng Trung Chỉ bên cạnh các chữ cái trong bảng chữ cái Latinh Có, trong mọi trường hợp
Kiểu chữ ghép đôi

Dấu ngoặc kép tồn tại trong tất cả các ngôn ngữ, nhưng giống như trang phục dân tộc, chúng trông khác nhau. Trong tiếng Nga, có cả "cây Giáng sinh" truyền thống, bắt nguồn từ tiếng Pháp và "bàn chân" tiếng Đức, được sử dụng trong cụm từ bên trong dấu ngoặc kép và khi viết bằng tay. Tiếng Tây Ban Nha, tiếng Bồ Đào Nha của Brazil, tiếng Ý và tiếng Ả Rập sử dụng dấu ngoặc kép.

Người Anh sử dụng dấu ngoặc kép 'đơn' và 'kép': dấu đầu tiên dành cho tiêu đề, dấu thứ hai dành cho trích dẫn. Dấu chấm và dấu phẩy nằm trong dấu ngoặc kép. Trong văn bản tiếng Pháp có "xương cá", với một điểm khác biệt so với tiếng Nga: có một khoảng cách liên tục giữa phần đầu của văn bản được trích dẫn và dấu ngoặc kép mở, cũng như giữa phần cuối của cụm từ và dấu ngoặc kép đóng.

Có ba loại dấu ngoặc kép trong tiếng Trung, phục vụ các mục đích khác nhau. Đây là tên của sách, phim và các tác phẩm khác có quyền tác giả. Đối với tất cả các trường hợp khác, người Trung Quốc sử dụng 「như vậy」. Các dấu ngoặc kép theo truyền thống châu Âu (dù là “cây Giáng sinh”, “bàn chân”, “đơn” hay “kép”) chỉ có thể được tìm thấy trong bản dịch hoặc kết hợp với các cụm từ từ các ngôn ngữ châu Âu. Chúng chưa trở nên phổ biến trong tiếng Trung phồn thể.

Dấu ngoặc kép tồn tại trong tất cả các ngôn ngữ, nhưng giống như trang phục dân tộc, chúng trông khác nhau.

Ngôn ngữ «…» „…“ “…” ‘…’ 《…》 「…」
tiếng Nga Tiêu chuẩn, dấu chấm và dấu phẩy bên ngoài Các lựa chọn thay thế trong cụm từ trong dấu ngoặc kép và khi viết bằng tay Các lựa chọn thay thế khi viết bằng tay - - -
Tiếng Anh
người Mỹ
- - Tiêu chuẩn cho tiêu đề - -
Tiếng Anh
người Anh
- - Chuẩn khi trích dẫn, có dấu chấm và dấu phẩy bên trong Tiêu chuẩn cho tiêu đề - -
tiếng Đức - Tiêu chuẩn - - - -
người Pháp Khoảng cách chuẩn, không ngắt quãng trước dấu ngoặc kép mở và đóng - - - - -
tiếng Tây Ban Nha - - Tiêu chuẩn - - -
tiếng Bồ Đào Nha
người Brazil
- - Tiêu chuẩn - - -
người Ý - - Tiêu chuẩn - - -
Ả Rập - - Tiêu chuẩn - - -
Tiếng Trung Chỉ trong bản dịch hoặc kết hợp với các cụm từ từ các ngôn ngữ Châu Âu Chỉ trong bản dịch hoặc kết hợp với các cụm từ từ các ngôn ngữ Châu Âu Chỉ trong bản dịch hoặc kết hợp với các cụm từ từ các ngôn ngữ Châu Âu Tiêu chuẩn đặt tên sách, phim và các tác phẩm khác của tác giả Tiêu chuẩn cho các trường hợp khác
Chủ nghĩa tượng trưng
Phần trăm và ppm cũng không phải là tiêu chuẩn đặc biệt. Trong tiếng Đức, tiếng Pháp và tiếng Tây Ban Nha, các ký tự này phải được phân tách bằng dấu cách không ngắt. Và bằng tiếng Nga, tiếng Anh, tiếng Ý, tiếng Ả Rập và tiếng Bồ Đào Nha Brazil, hãy viết ngay sau số. Mặc dù với người Nga, như chúng ta nhớ, tình hình rất mơ hồ.

Độ và inch thường được đặt sau số không có khoảng trắng.

Sự thật thú vị: khi người Pháp viết số lớn, họ tách các khối có ba chữ số bằng dấu cách - ví dụ: 987.654.321,12.

Người Trung Quốc có ký tự riêng cho độ (度) và tỷ lệ phần trăm (百分比 và 百分之). Tuy nhiên, ° và % thông thường được sử dụng cùng với chúng mà không có khoảng trắng ở phía trước.

Thiết lập một cuộc đối thoại
Định dạng hội thoại cũng khác nhau tùy theo ngôn ngữ. Trong tiếng Nga, chúng tôi đặt dấu gạch ngang trước mỗi dòng. Những người nói tiếng Bồ Đào Nha ở Brazil cũng làm như vậy.

Trong tiếng Anh, dấu ngoặc kép và dấu ngoặc đơn được sử dụng, ví dụ:

“Đây là một triệu bảng,” Marina nói và đưa cho Simon một chiếc vali.

Marina tiếp tục: 'Tôi đã nói chuyện với Ivan và anh ấy nói, "Simon đang yêu cầu 10 triệu, nhưng như vậy là quá nhiều."'


Trong tiếng Đức, các đoạn hội thoại cũng được định dạng bằng dấu ngoặc kép truyền thống - “bàn chân”. Người Pháp đặt "xương cá", cũng như dấu gạch ngang ngắn, trong trường hợp tác giả của dòng thay đổi. Các phần của cuộc đối thoại cũng được đánh dấu bằng dấu gạch ngang bằng tiếng Tây Ban Nha.

Tiếng Ý và tiếng Ả Rập sử dụng dấu ngoặc kép thẳng để đối thoại.

Người Trung Quốc thường chỉ đặt 「dấu ngoặc kép」 hoặc tiếng Anh tương đương trong đoạn hội thoại của họ.

Lớn hay nhỏ

Trong tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha Brazil và tiếng Ý, mọi thứ đều đơn giản và quen thuộc với những người nói tiếng Nga - chữ in hoa được sử dụng ở đầu câu, để viết tắt và tên riêng.

Tiếng Đức vui hơn nhiều. Danh từ, tên và chức danh, dạng xưng hô lịch sự (Sie) trong mọi trường hợp (Ihr, Ihre, Ihrer, Ihres, Ihrem, Ihren) đều được viết hoa. Tính từ, phân từ và động từ nguyên thể được sử dụng trong câu dưới dạng danh từ kết hợp với mạo từ xác định (das Gute) hoặc không xác định (ein Lächeln), giới từ (trong Blau), đại từ (dein Stottern), chữ số (nichts Aufregendes) hoặc tính từ trong dạng biến cách (lautes Sprechen). Chỉ là tất cả mọi thứ :-)

Bảng chữ cái Ả Rập không phân biệt chữ thường và chữ hoa, nhưng hầu hết các chữ cái đều có hai, ba hoặc bốn cách viết khác nhau: cho phần đầu, phần giữa và phần cuối của một từ, và đôi khi cho một chữ cái duy nhất bên ngoài từ đó. Một tình huống tương tự đã phát triển trong ngôn ngữ Trung Quốc - khó có khả năng phân biệt được chữ thường hoặc chữ in hoa. Và nếu tác giả Trung Quốc cần làm nổi bật phần nào đó của văn bản, họ sẽ gạch chân hoặc sử dụng chữ in đậm.

Thưởng
Thật buồn cười khi nhiều người nói các ngôn ngữ Châu Âu mà chúng tôi phỏng vấn lưu ý rằng họ sử dụng chữ in hoa theo các quy tắc tương tự tồn tại trong tiếng Anh, nhưng không phải với số lượng như vậy. Một trong những đồng nghiệp được phỏng vấn đã trình bày nó theo cách này:
CHÚNG TÔI CỐ GẮNG KHÔNG VỐN QUÁ NHIỀU.

Tôi tự hỏi điều đó có nghĩa là gì? ;-)