Berapa banyak aksara yang terdapat dalam bahasa Cina? Angka itu berbeza-beza bergantung kepada keadaan. Fakta menarik tentang bahasa Cina Ruang antara aksara Cina

Meneruskan perbualan kita tentang tulisan Cina yang kompleks, mari kita lihat mengapa bahasa Inggeris begitu mudah. Bayangkan cabaran yang dihadapi oleh rata-rata orang dewasa Cina yang memutuskan untuk belajar bahasa Inggeris. Apa yang dia perlukan untuk menguasai penulisan? Terdapat hanya 26 huruf (sudah tentu, huruf kecil dan besar, dan fon tulisan tangan, dan beberapa pilihan ejaan. Dan juga tanda petikan, apostrof, sempang, kurungan, dll. - tetapi orang Cina sendiri mempunyai semua ini). Bagaimana kita menulis surat ini? Dari kiri ke kanan. secara mendatar. Dengan ruang antara perkataan. Jika kita mengetepikan ejaan buat masa ini, berapa lamakah masa yang diambil oleh orang Cina untuk menguasai tulisan Inggeris? Sehari dua.

Dan kini keadaan sebaliknya: seorang pelajar Amerika yang memutuskan untuk belajar bahasa Cina. Apa yang dia perlukan? Tidak ada abjad, walaupun, tentu saja, terdapat unsur berulang yang membentuk hieroglif. Berapa banyak unsur tersebut? Lebih baik jangan tanya. Seperti banyak soalan lain tentang bahasa Cina, tiada jawapan yang jelas dan meyakinkan. Ia bergantung pada cara anda mentakrifkan perkataan "elemen" (sifat? kunci?) dan butiran lain. Cukuplah untuk mengatakan bahawa terdapat banyak daripada mereka, lebih daripada 26. Dan bagaimana pula dengan gabungan unsur-unsur ini? Di sebelah kiri elemen lain, di sebelah kanan mereka, di atas, di sekeliling, di dalam - hampir semuanya mungkin. Dan semasa pergerakan mereka di ruang angkasa, elemen berubah: mereka meratakan, meregangkan, memampatkan, mengecut, memesongkan - agar sesuai dengan ruang yang diperuntukkan kepada mereka. Boleh dikatakan unsur-unsur tulisan Cina mempunyai dua dimensi, manakala tulisan abjad hanya satu.

Kalaupun kita tidak ingat keindahan penulisan, berapa lamakah masa yang diambil oleh orang Eropah atau Amerika untuk menguasai tulisan Cina supaya apabila melihat watak baru, mereka tahu sekurang-kurangnya menulisnya supaya hasil daripada kerja mereka sekurang-kurangnya serupa dengan prototaip? Sekali lagi, soalan ini sukar untuk dijawab. Saya menganggarkan bahawa beberapa bulan kerja keras diperlukan untuk menguasai asas. Jika seseorang itu mahir dalam melukis, maka ia akan mengambil masa setahun atau lebih. Sementara itu, saingan Cina mereka, yang belajar bahasa Inggeris, telah beralih kepada fon tulisan tangan. Dan mereka masih mempunyai masa untuk membaca Moby Dick atau sesuatu yang lain.

Sudah tentu, abjad menjadikan hidup lebih mudah. Orang Cina yang saya kenali yang telah belajar bahasa Inggeris selama beberapa tahun boleh menulis dengan tulisan tangan sedemikian rupa sehingga tulisan tangan mereka tidak dapat dibezakan daripada orang Amerika biasa. Dan pada masa yang sama, hanya beberapa orang Amerika yang mampu menulis watak yang tidak kelihatan seperti kerja kekok seorang pelajar kelas tiga Cina. Walaupun tidak ada perkara lain yang sukar tentang bahasa Cina, keperluan untuk menulis aksara akan menjadikannya salah satu bahasa yang paling sukar di dunia.

Ramai peserta peperiksaan percaya bahawa tanda baca dan penampilan umum teks boleh diabaikan, kerana ini, kata mereka, tidak menjejaskan markah. Walau bagaimanapun, mari kita ingat bahawa bahagian bertulis diperiksa oleh seseorang dengan penilaian subjektifnya sendiri, dan bukan oleh komputer. Kajian telah menunjukkan bahawa penampilan esei yang cantik dan penggunaan tanda baca yang betul menunjukkan pemeriksa tahap bahasa anda yang tinggi dan boleh menambah daripada 2 hingga 10 mata.

Penampilan yang cantik, pertama sekali, pembahagian yang betul kepada perenggan dan penonjolan tajuk.
Jika anda memilih untuk menulis tajuk, ia hendaklah berada di tengah-tengah baris pertama. Jika anda ingin melanggan, kami menandatangani sama ada di hujung teks atau betul-betul di bawah tajuk.
Teks mesti dibahagikan kepada perenggan, diinden oleh dua sel. . Setiap pemikiran baru = perenggan baru!

Apakah keperluan kami untuk tanda baca??

Mari kita ingat apakah tanda baca yang terdapat dalam bahasa Cina secara umum.

1) Noktah, 句号 (。) menyampaikan jeda selepas akhir frasa.

2) Tanda koma, 逗号 (,) menyampaikan jeda dalam frasa, manakala segala-galanya adalah seperti yang kita ada.

3) Gugurkan koma , 顿号 (、) diletakkan semasa menyenaraikan, antara ahli homogen ayat.
Sebagai contoh,

  • 我喜欢吃西瓜、苹果、香蕉。- Saya suka tembikai, epal, pisang.

4) Titik koma 分号 (;) menyampaikan jeda antara bahagian ayat kompleks.

5) Tanda tanya 问号 (?) - jeda selepas tamat ayat tanya.

6) Tanda seru 感叹号 (!) - jeda selepas akhir frasa yang menyampaikan perasaan yang kuat ia juga boleh digunakan hanya selepas perkataan yang tidak membentuk ayat.

7) Titik bertitik 冒号 (:) bermaksud peralihan kepada teks berikut (contohnya, dalam surat selepas merujuk kepada penerima).

8) Tanda petikan 引号 (“……” atau ‘……’) mengelilingi petikan, nama khas atau bahagian yang perlu dititikberatkan.
Mereka juga boleh, seperti dalam bahasa Rusia, mempunyai makna kiasan dan menyampaikan sindiran atau penafian:

  • “Kawan baik” anda ini baru sahaja mencuri dompet anda.

Tanda petikan unsur tunggal digunakan apabila tanda petikan mesti digunakan semula dalam petikan.

9) Dan sekali lagi tanda petikan, kali ini 书名号 (《……》).
Seperti namanya, tanda petikan tersebut mengelilingi nama buku, artikel, lagu, filem, dsb., yang disebut dalam teks. Kami sedang menyapih diri daripada penggunaan Rusia apa-apa jenis tanda petikan, baik di ekor dan di surai, dan memisahkan 书名号 daripada 引号.
By the way, 书名号 juga mempunyai varian dari satu kurungan. Contohnya, apabila kita menyebut 《artikel》 yang mempunyai tajuk dalam tajuk<книги>.

  • 我刚看完了一篇文章叫《莫言小说〈酒国〉中的后现代特征》。 - Saya baru sahaja selesai membaca artikel bertajuk “Ciri-ciri Kebiasaan dalam Negara Mo Yan.”

10) Elipsis 省略号 (……) Betul, ia terdiri daripada enam titik dan mengambil sebanyak dua sel dalam teks!
Ia menyatakan bahawa beberapa petikan ditinggalkan daripada teks, atau keraguan, sesuatu yang tidak jelas dan tidak jelas.

11) Sengkang 破折号 (--).
Seperti yang kita ketahui, tiada tanda sempang dalam bahasa Cina (iaitu, "3-4" kami akan ditulis sebagai 三四个, dan "Cina-Rusia" - 汉俄). Tetapi terdapat perkataan "satu, 一", dan untuk tidak dikelirukan dengannya, sengkang mengambil dua sel.
Tanda sempang bermakna di bawah akan ada penjelasan tentang apa yang ditulis di atas(dalam bahasa Rusia kami akan meletakkan titik bertindih dalam kes ini!).

12) Nah, kurungan, sebenarnya, (……)bermaksud ulasan di dalam teks.

Hanya meletakkan satu titik di sudut adalah pendekatan yang tidak baik.
Dalam bahasa Cina, tanda baca mengambil seluruh sel.
Elipsis dan sengkang mengambil dua sel keseluruhan.
Semua tanda baca daripada satu elemen (norak, koma, titik bertindih dan petikan dan kurungan penutup) tidak boleh muncul dahulu dalam baris dan petikan atau kurungan pembuka tidak boleh muncul terakhir dalam baris.

Sudah tentu, terdapat cara lain untuk menggunakan tanda baca, tetapi ia lebih banyak ditemui dalam teks sastera, yang bermaksud anda tidak memerlukannya dalam ujian!

p.s. Jika anda mengambil tahap 3 hingga 5, beri perhatian khusus kepada fakta bahawa dalam tugasan "membuat ayat daripada perkataan" anda mesti meletakkan tanda baca (titik, seruan atau tanda soal) pada akhir. Jika tidak, markah anda mungkin berkurangan.

16

Saya ingin menjadikan carian teks penuh MySQL berfungsi dengan teks Jepun dan Cina, serta mana-mana bahasa lain. Masalahnya ialah bahasa ini, dan mungkin bahasa lain, biasanya tidak mempunyai ruang antara perkataan. Carian tidak berguna apabila anda perlu memasukkan ayat yang sama seperti dalam teks.

Saya tidak boleh meletakkan ruang di antara setiap watak kerana bahasa Inggeris juga perlu berfungsi. Saya ingin menyelesaikan masalah ini dengan PHP atau MySQL.

Bolehkah saya mengkonfigurasi MySQL untuk mengenali aksara yang sepatutnya menjadi indeks mereka sendiri? Adakah terdapat modul PHP yang boleh mengenali aksara ini supaya saya boleh membuang ruang di sekeliling indeks?

Penyelesaian separa:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00"")."-".json_decode(""\uface"")."]/", " $0 ", $string_without_spaces);

Ini menjadikan kelas watak daripada sekurang-kurangnya beberapa watak yang perlu saya layan secara khusus. Saya mungkin perlu menyebut bahawa ia boleh diterima untuk melangkau teks diindeks.

Adakah sesiapa tahu semua julat aksara yang perlu saya masukkan dalam siasatan?

Juga, mesti ada cara yang lebih baik dan mudah alih untuk mewakili aksara ini dalam PHP? Kod sumber dalam Literal Unicode tidak sempurna; Saya tidak mengenali semua watak; ia mungkin tidak muncul pada semua mesin yang perlu saya gunakan.

3

Bahasa moden lain yang tidak menggunakan ruang antara perkataan ialah Thai, Lao, Khmer (Kemboja), dan Burma (Myanmar). Dalam bahasa Vietnam, terdapat masalah yang berkaitan bahawa ruang digunakan antara semua suku kata kecuali perkataan asing. - hippietrail 18 Dis. 10 2010-12-18 12:48:10

  • 2 jawapan
  • Menyusun:

    Aktiviti

15

Pelanggaran perkataan untuk bahasa yang disebut memerlukan pendekatan linguistik , contohnya yang menggunakan kamus bersama dengan pemahaman asas peraturan yang timbul.

Saya pernah mendengar tentang aplikasi carian teks penuh yang agak berjaya yang hanya memisahkan setiap aksara individu sebagai perkataan berasingan dalam bahasa Cina, hanya menggunakan "tokenisasi" kriteria carian yang sama yang disediakan oleh pengguna akhir. Enjin carian kemudiannya menyediakan kedudukan yang lebih baik untuk dokumen yang membekalkan aksara perkataan dalam susunan yang sama seperti kriteria carian. Saya tidak pasti sama ada ini boleh diperluaskan kepada bahasa seperti Jepun, kerana set aksara Hirakana dan Katagana menjadikan teks lebih serupa dengan bahasa Eropah dengan abjad pendek.

EDIT:
Sumber
Perkataan ini adalah untuk memecahkan masalah, serta isu berkaitan, jadi bukan remeh bahawa keseluruhan buku telah ditulis mengenainya. Lihat contohnya Pemprosesan Maklumat CJKV (CJKV adalah singkatan kepada bahasa Cina, Jepun, Korea dan Vietnam, anda juga boleh menggunakan kata kunci CJK kerana banyak teks tidak membincangkan bahasa Vietnam). Lihat juga Pecah Kata dalam bahasa Jepun adalah sukar untuk satu alat kelui mengenai topik ini.
Adalah jelas bahawa kebanyakan bahan yang merangkumi topik ini ditulis dalam salah satu bahasa utama dalam bahasa ibunda dan oleh itu terhad kepada orang yang tidak mempunyai kemahiran relatif dalam bahasa ini. Atas sebab ini, dan untuk membantu anda menguji enjin carian, sebaik sahaja anda mula melaksanakan logik pemecahan perkataan, anda harus mendapatkan bantuan daripada seorang atau dua penutur asli.

Pelbagai idea
Idea awak mengenal pasti ciri-ciri yang secara sistematik membayangkan patah perkataan(katakan petikan, kurungan, simbol seperti sempang dan sebagainya) adalah bagus, dan ini mungkin satu heuristik yang digunakan oleh beberapa patah perkataan profesional. Walau bagaimanapun, anda harus mencari sumber yang bereputasi untuk senarai sedemikian daripada menyusunnya dari awal berdasarkan penemuan anekdot.
Idea yang berkaitan adalah untuk memecahkan perkataan Peralihan kana-ke-kanji(tetapi saya rasa bukan sebaliknya), dan mungkin dalam hiragana-ke-katakana atau sebaliknya peralihan.
Tidak berkaitan dengan patah yang betul, indeks mungkin [-atau mungkin tidak- ;-)] mendapat manfaat daripada menukar secara sistematik setiap, katakan, aksara hiragana kepada aksara katakana yang sepadan. Hanya idea yang tidak berpendidikan! Saya tidak tahu cukup tentang bahasa Jepun untuk mengetahui sama ada ini akan membantu; Secara intuitif, ini akan berkaitan dengan penukaran sistematik huruf beraksen dan dengan itu menjadi skrip tanpa aksen yang sepadan, seperti yang diamalkan dalam beberapa bahasa Eropah.

Mungkin idea yang saya nyatakan sebelum ini untuk mengindeks aksara individu secara sistematik (dan kedudukan hasil carian berdasarkan anggarannya kepada istilah carian) boleh diubah suai sedikit, contohnya dengan mengekalkan aksara kana berturut-turut bersama-sama dan kemudian beberapa peraturan lain... dan mencipta tidak sempurna, tetapi enjin carian yang agak praktikal.

Jangan kecewa jika ini tidak berlaku... Seperti yang dinyatakan, ini jauh dari remeh, dan ia boleh menjimatkan masa dan wang anda dalam jangka masa panjang dengan berhenti seketika dan membaca satu atau dua buku. Satu lagi sebab untuk cuba mempelajari lebih lanjut tentang "teori" dan amalan terbaik ialah pada masa ini anda nampaknya tertumpu pada perkataan melanggar , tetapi dalam masa terdekat, enjin carian juga mungkin mendapat manfaat daripada kesedaran berbangkit ; sesungguhnya, kedua-dua soalan ini sekurang-kurangnya relevan dari segi linguistik, dan mungkin berguna apabila diproses secara serentak.

Semoga berjaya kepada anda dalam usaha yang tidak menyenangkan tetapi patut ini.

0

@Joe: Anda dialu-alukan. Saya nampaknya mempunyai minat dalam linguistik dan NLP, tetapi sangat, sangat sedikit pengetahuan khusus untuk bahasa CJK. Baca suntingan saya sambil menambah beberapa kata kunci dan pautan dalam talian yang boleh membantu carian anda:-) - mjv 22 Okt 09

Tanda baca adalah bahagian penting dalam mana-mana bahasa. Tanda koma biasa boleh mengubah makna ayat secara radikal: ingatlah kisah "Eksekusi tidak boleh diampunkan." Dan kerja penterjemah dan editor memerlukan mereka fasih dalam sekurang-kurangnya dua sistem tanda baca.

Idea untuk siaran ini lahir semasa kami membincangkan terjemahan artikel. Dalam bahan sumber, tanda peratus dipisahkan oleh ruang daripada nombor, dan ini menarik perhatian saya - dalam teks Rusia dalam kes ini, ruang tidak digunakan (walaupun kenyataan itu masih kontroversi - pakar belum datang ke konsensus dalam isu ini). Kemudian kami memutuskan bahawa kami perlu membincangkannya. Pakar dari Jabatan Penyetempatan Berbilang Bahasa menemu bual rakan sekerja asing kami dan menyediakan bahan yang kini kami kongsikan dengan anda. Kami harap anda mendapati ia berguna.

Di awal dan di akhir
Mari lihat bagaimana keadaannya dengan peletakan tanda baca dalam ayat: noktah, koma, titik bertindih, titik bertitik, tanda soal dan tanda seru.

Kami berharap semua orang ingat tentang bahasa Rusia - tanda baca yang memisahkan ayat antara satu sama lain diletakkan hanya pada akhir, titik. Jika anda perlu menambah ungkapan (terutamanya dalam surat-menyurat peribadi), gabungan aksara digunakan - “!!!”, “?!” dan lain-lain. Dalam bahasa Inggeris, Jerman, Itali, Perancis Kanada, Arab dan Portugis Brazil, titik, elips dan "rakan seperjuangan" mereka mengikut peraturan yang sama.

Peraturan lain dalam bahasa Perancis: titik bertindih, koma bertitik, tanda seru dan tanda soal didahului oleh ruang tidak putus.

Bahasa Sepanyol ialah satu-satunya bahasa dalam pilihan kami di mana tanda baca membingkai ayat: pada permulaan frasa, tanda soal dan tanda seru diduplikasi dalam bentuk "sedikit" terbalik - "¿" dan "¡".

Orang Cina mempunyai pendekatan yang paling luar biasa untuk tanda baca dari sudut pandangan Eropah. Tempoh mereka kelihatan seperti ., koma kelihatan seperti ,, tanda seru kelihatan seperti !, dan tanda soal kelihatan seperti ?. Dalam ayat, mereka berkelakuan seperti rakan Rusia mereka, satu-satunya perbezaan ialah orang Cina tidak menggunakan ruang, kerana semua aksara tanda baca adalah dua bait. Hieroglif yang ditaip pada papan kekunci adalah dua kali lebih lebar daripada mana-mana huruf abjad Latin. Oleh itu, tanda baca biasanya menempati ruang yang sama dengan hieroglif. Ciri ini ditemui oleh mereka yang bekerja di IME lama yang menjalankan DOS, apabila hieroglif yang dimasukkan dengan salah telah dialih keluar dengan menekan Backspace dua kali. Ruang digunakan terutamanya untuk memisahkan perkataan dan aksara daripada bahasa lain, seperti bahasa Inggeris.

Ciri-ciri comel
Dalam bahasa Rusia, sama ada tanda sempang atau sempang digunakan. Tanda sempang pendek dan diperlukan untuk memindahkan dan menyambung kata majmuk. Sempang adalah jauh lebih panjang; ia berfungsi untuk memisahkan bahagian semantik: ayat yang berbeza, dua bahagian satu ayat, dalam dialog, dll. Anda boleh mengingati semua kehalusan menggunakan tanda-tanda ini dengan melihat buku teks bahasa Rusia.

Tanda sempang dan sempang wujud dalam keadaan yang sama dalam bahasa Inggeris, Jerman, Perancis dan Portugis Brazil. Selain itu, dalam Bahasa Inggeris Amerika, sempang dipisahkan di kedua-dua belah oleh ruang, tetapi dalam Bahasa Inggeris British biasanya tidak:

Syarahan itu - yang merupakan yang ketiga mengenai topik ini bulan ini - akan merangkumi penceramah dari negara yang berbeza. (Inggeris amerika)

Zoo itu mempunyai banyak kucing-singa, harimau kumbang, harimau, jaguar dan cheetah-yang menyukarkan memilih kegemaran. (Inggeris British)


Dalam bahasa Sepanyol, Itali dan Arab, sempang dan sempang kelihatan sama: "-". Orang Cina tidak menggunakan tanda sempang sama sekali - mereka hanya mempunyai tanda sempang. Walaupun di sebelah huruf daripada abjad Latin mungkin terdapat sempang, sempang panjang dan sengkang tengah. Tanda sempang pendek dan diperlukan untuk memindahkan dan menyambung kata majmuk. Sempang adalah jauh lebih panjang; ia berfungsi untuk memisahkan bahagian semantik
Bahasa Tanda sempang Em dash (Alt 0151)
bahasa Rusia
Inggeris Amerika Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb.
Inggeris
Inggeris
Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb. Tidak dipisahkan oleh ruang di kedua-dua belah.
Jerman Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb.
Perancis Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb.
Kanada Perancis Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb.
bahasa Sepanyol Ya, dalam semua kes -
Portugis
Brazil
Ya, untuk sempang dan cantuman kata majmuk Ya, untuk memisahkan bahagian semantik: ayat berbeza, dua bahagian satu ayat, dalam dialog, dsb.
Itali Ya, dalam semua kes -
Arab Ya, dalam semua kes -
cina Hanya bersebelahan dengan huruf daripada abjad Latin Ya, dalam semua kes
Jenis surat berpasangan

Tanda petikan wujud dalam semua bahasa, tetapi, seperti pakaian kebangsaan, ia kelihatan berbeza. Dalam bahasa Rusia terdapat kedua-dua "pokok Krismas" tradisional, yang berasal dari bahasa Perancis, dan "cakar" Jerman, yang digunakan dalam frasa di dalam tanda petikan dan semasa menulis dengan tangan. Sepanyol, Portugis Brazil, Itali dan Arab menggunakan tanda petikan berganda.

Bahasa Inggeris menggunakan tanda petikan 'single' dan 'double': yang pertama untuk tajuk, yang kedua untuk memetik. Noktah dan koma berada di dalam tanda petikan. Dalam teks Perancis terdapat "tulang herring", dengan satu perbezaan dari bahasa Rusia: terdapat ruang berterusan antara permulaan teks yang dipetik dan tanda petikan terbuka, serta antara akhir frasa dan tanda petikan penutup.

Terdapat tiga jenis tanda petikan dalam bahasa Cina, yang mempunyai tujuan yang berbeza. Ini adalah nama buku, filem dan karya pengarang yang lain. Untuk semua kes lain, orang Cina menggunakan 「sebegitu」. Tanda petikan daripada tradisi Eropah (sama ada "pokok Krismas", "cakar", "tunggal" atau "berganda") hanya boleh didapati dalam terjemahan atau bersama-sama dengan frasa daripada bahasa Eropah. Mereka tidak mendapat populariti dalam bahasa Cina tradisional.

Tanda petikan wujud dalam semua bahasa, tetapi, seperti pakaian kebangsaan, ia kelihatan berbeza.

Bahasa «…» „…“ “…” ‘…’ 《…》 「…」
bahasa Rusia Standard, noktah dan koma di luar Alternatif dalam frasa di dalam tanda petikan dan semasa menulis dengan tangan Alternatif apabila menulis dengan tangan - - -
Inggeris
Amerika
- - Standard untuk tajuk - -
Inggeris
Inggeris
- - Standard apabila petikan, noktah dan koma di dalamnya Standard untuk tajuk - -
Jerman - Standard - - - -
Perancis Ruang standard, tidak pecah sebelum membuka dan menutup sebut harga - - - - -
bahasa Sepanyol - - Standard - - -
Portugis
Brazil
- - Standard - - -
Itali - - Standard - - -
Arab - - Standard - - -
cina Hanya dalam terjemahan atau bersama-sama dengan frasa daripada bahasa Eropah Hanya dalam terjemahan atau bersama-sama dengan frasa daripada bahasa Eropah Hanya dalam terjemahan atau bersama-sama dengan frasa daripada bahasa Eropah Standard untuk tajuk buku, filem dan karya pengarang lain Standard untuk kes lain
Simbolisme
Peratusan dan ppm juga tidak begitu standard. Dalam bahasa Jerman, Perancis dan Sepanyol, aksara ini mesti dipisahkan oleh ruang yang tidak pecah. Dan dalam bahasa Rusia, Inggeris, Itali, Arab dan Portugis Brazil, tulis serta-merta selepas nombor. Walaupun dengan Rusia, seperti yang kita ingat, keadaannya samar-samar.

Darjah dan inci biasanya diletakkan selepas nombor tanpa sebarang ruang.

Fakta menarik: apabila orang Perancis menulis nombor besar, mereka memisahkan blok tiga digit dengan ruang - contohnya: 987,654,321.12.

Orang Cina mempunyai watak mereka sendiri untuk darjah (度) dan peratusan (百分比 dan 百分之). Walau bagaimanapun, ° dan % biasa digunakan bersama-sama dengannya tanpa ruang di hadapannya.

Mewujudkan dialog
Pemformatan dialog juga berbeza mengikut bahasa. Dalam bahasa Rusia, kami meletakkan sengkang em sebelum setiap baris. Penutur Portugis Brazil melakukan perkara yang sama.

Dalam bahasa Inggeris, petikan "double" dan "single" digunakan, sebagai contoh:

'Ini adalah satu juta pound,' kata Marina sambil menghulurkan beg pakaian kepada Simon.

Marina menyambung: 'Saya bercakap dengan Ivan dan dia berkata, "Simon meminta sepuluh juta, tetapi itu terlalu banyak."'


Dalam bahasa Jerman, dialog juga diformat menggunakan tanda petikan tradisional - "cakar". Orang Perancis meletakkan "tulang herring", serta sengkang pendek, dalam kes di mana pengarang baris berubah. Sebahagian daripada dialog juga diselingi dengan tanda sempang en dalam bahasa Sepanyol.

Bahasa Itali dan Arab menggunakan tanda petikan dua lurus untuk dialog.

Orang Cina biasanya hanya meletakkan 「tanda petikan」 atau bahasa Inggeris yang setara dalam dialog mereka.

Besar atau kecil

Dalam bahasa Inggeris, Perancis, Sepanyol, Portugis, Brazil dan Itali, semuanya mudah dan biasa kepada penutur Rusia - huruf besar digunakan pada permulaan ayat, untuk singkatan dan nama khas.

Bahasa Jerman adalah lebih menyeronokkan. Kata nama, nama dan gelaran, bentuk alamat yang sopan (Sie) dalam semua bentuk kes (Ihr, Ihre, Ihrer, Ihres, Ihrem, Ihren) ditulis dengan huruf besar. Kata adjektif, participles dan infinitif yang digunakan dalam ayat sebagai kata nama dalam kombinasi dengan artikel yang pasti (das Gute) atau tidak tentu (ein Lächeln), preposisi (dalam Blau), kata ganti nama (dein Stottern), angka (nichts Aufregendes) atau kata sifat dalam bentuk infleksi (lautes Sprechen). Semuanya sahaja :-)

Abjad Arab tidak membezakan antara huruf kecil dan huruf besar, tetapi kebanyakan huruf mempunyai dua, tiga atau empat ejaan yang berbeza: untuk permulaan, tengah dan akhir perkataan, dan kadang-kadang untuk satu huruf di luar perkataan. Keadaan yang sama telah berkembang dalam bahasa Cina - tidak mungkin untuk membezakan huruf kecil atau huruf besar. Dan jika pengarang Cina perlu menyerlahkan beberapa bahagian teks, mereka menggariskannya atau menggunakan muka tebal.

Bonus
Sungguh melucukan bahawa ramai penutur bahasa Eropah yang kami temu bual menyatakan bahawa mereka menggunakan huruf besar mengikut peraturan yang sama yang wujud dalam bahasa Inggeris, tetapi tidak dalam kuantiti sedemikian. Salah seorang rakan sekerja yang ditemu bual merumuskannya dengan cara ini:
KAMI CUBA UNTUK TIDAK BERMODAL TERLALU BANYAK.

Saya tertanya-tanya apa maksudnya? ;-)