Sejarah aplikasi kaedah matematik dalam linguistik. Projek penyelidikan: "linguistik matematik"

Berapakah kos untuk menulis kertas kerja anda?

Pilih jenis kerja Tesis (sarjana/pakar) Sebahagian daripada tesis Diploma Sarjana Kerja Kursus dengan amalan Teori kursus Abstrak Esei Kerja ujian Objektif Kerja pensijilan (VAR/VKR) Rancangan perniagaan Soalan untuk peperiksaan MBA diploma Tesis (kolej/sekolah teknikal) Lain-lain Kes Kerja makmal, RGR Bantuan dalam talian Laporan amalan Cari maklumat persembahan PowerPoint Abstrak untuk sekolah siswazah Bahan iringan untuk diploma Artikel Lukisan Ujian lagi »

Terima kasih, e-mel telah dihantar kepada anda. Semak e-mel anda.

Adakah anda mahukan kod promosi untuk diskaun 15%?

Terima SMS
dengan kod promosi

Berjaya!

?Berikan kod promosi semasa perbualan dengan pengurus.
Kod promosi boleh digunakan sekali pada pesanan pertama anda.
Jenis kod promosi - " kerja siswazah".

Interaksi matematik dan linguistik


pengenalan

Bab 1. Sejarah aplikasi kaedah matematik dalam linguistik

1.1. Pembentukan linguistik struktural pada permulaan abad ke-19 - ke-20

1.2. Aplikasi kaedah matematik dalam linguistik pada separuh kedua abad kedua puluh

Bab 2. Contoh pilihan penggunaan matematik dalam linguistik

2.1. Terjemah mesin

2.2.Kaedah statistik dalam pembelajaran bahasa

2.3. Mempelajari bahasa menggunakan kaedah logik formal

2.4. Prospek untuk aplikasi kaedah matematik dalam linguistik

Kesimpulan

kesusasteraan

Lampiran 1. Ronald Schleifer. Ferdinand de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

pengenalan


Pada abad kedua puluh, terdapat trend berterusan ke arah interaksi dan interpenetrasi pelbagai bidang ilmu. Sempadan antara sains individu secara beransur-ansur kabur; Terdapat lebih banyak cabang aktiviti mental yang "di persimpangan" pengetahuan kemanusiaan, teknikal dan sains semula jadi.

Satu lagi ciri kemodenan yang jelas ialah keinginan untuk mengkaji struktur dan unsur konstituennya. Sebab tu semua tempat yang lebih besar Matematik diberikan dalam teori saintifik dan dalam amalan. Bersentuhan, di satu pihak, dengan logik dan falsafah, sebaliknya, dengan statistik (dan, akibatnya, dengan sains sosial), matematik menembusi lebih dalam ke dalam bidang-bidang yang untuk masa yang lama dianggap sebagai "kemanusiaan, ” mengembangkan potensi heuristik mereka (jawapan kepada soalan “berapa banyak” selalunya akan membantu menjawab soalan “apa” dan “bagaimana”). Linguistik tidak terkecuali.

Tujuan kerja kursus saya adalah untuk menyerlahkan secara ringkas kaitan antara matematik dan cabang linguistik seperti linguistik. Sejak 50-an abad yang lalu, matematik telah digunakan dalam linguistik untuk mencipta alat teori untuk menerangkan struktur bahasa (semula jadi dan buatan). Walau bagaimanapun, ia harus dikatakan bahawa ia tidak segera menemui aplikasi praktikal sedemikian. Pada mulanya, kaedah matematik dalam linguistik mula digunakan untuk menjelaskan konsep asas linguistik, tetapi dengan perkembangan teknologi komputer, premis teori seperti itu mula digunakan dalam amalan. Menyelesaikan masalah seperti terjemahan mesin, perolehan maklumat mesin dan pemprosesan teks automatik memerlukan pendekatan bahasa yang asasnya baharu. Satu persoalan telah timbul untuk ahli bahasa: bagaimana untuk belajar mewakili corak linguistik dalam bentuk yang boleh digunakan secara langsung kepada teknologi. Istilah "linguistik matematik," yang popular pada zaman kita, merujuk kepada mana-mana penyelidikan linguistik yang menggunakan kaedah tepat (dan konsep kaedah tepat dalam sains sentiasa berkait rapat dengan matematik). Sesetengah saintis tahun lalu percaya bahawa ungkapan itu sendiri tidak boleh dinaikkan kepada pangkat istilah, kerana ia tidak menunjukkan sebarang "linguistik" khas tetapi hanya arah baharu yang tertumpu pada penambahbaikan, peningkatan ketepatan dan kebolehpercayaan kaedah penyelidikan bahasa. Linguistik menggunakan kaedah kuantitatif (algebra) dan bukan kuantitatif, yang membawanya lebih dekat kepada logik matematik, dan, akibatnya, kepada falsafah, dan juga psikologi. Schlegel juga mencatatkan interaksi bahasa dan kesedaran, dan ahli bahasa terkemuka awal abad kedua puluh Ferdinand de Saussure (saya akan bercakap tentang pengaruhnya terhadap perkembangan kaedah matematik dalam linguistik kemudian) menghubungkan struktur bahasa dengan kepunyaannya orang ramai. Penyelidik moden L. Perlovsky pergi lebih jauh, mengenal pasti ciri kuantitatif bahasa (contohnya, bilangan jantina, kes) dengan ciri-ciri mentaliti kebangsaan (lebih lanjut mengenai perkara ini dalam bahagian 2.2, "Kaedah statistik dalam linguistik").

Interaksi matematik dan linguistik adalah topik yang pelbagai, dan dalam kerja saya, saya tidak akan memberi tumpuan kepada semuanya, tetapi, pertama sekali, pada aspek yang diterapkan.

Bab I. Sejarah aplikasi kaedah matematik dalam linguistik


1.1 Pembentukan linguistik struktural pada permulaan abad ke-19 - ke-20


Penerangan matematik bahasa adalah berdasarkan idea bahasa sebagai mekanisme, yang kembali kepada ahli bahasa Switzerland yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.

Tautan awal konsepnya ialah teori bahasa sebagai satu sistem yang terdiri daripada tiga bahagian(bahasa itu sendiri - langue, ucapan - parol, dan aktiviti pertuturan - langage), di mana setiap perkataan (ahli sistem) dianggap bukan dengan sendirinya, tetapi berkaitan dengan ahli lain. Sebagai seorang lagi ahli bahasa terkemuka, Dane Louis Hjelmslev, kemudiannya menyatakan, Saussure "adalah yang pertama menuntut pendekatan struktur bahasa, iaitu, penerangan saintifik bahasa dengan merekodkan hubungan antara unit."

Memahami bahasa sebagai struktur hierarki, Saussure adalah orang pertama yang mengemukakan masalah nilai dan kepentingan unit linguistik. Fenomena dan peristiwa individu (katakan, sejarah asal usul perkataan Indo-Eropah individu) tidak seharusnya dikaji sendiri, tetapi dalam sistem di mana ia dikaitkan dengan komponen yang serupa.

Saussure menganggap unit struktur bahasa sebagai perkataan, "tanda," di mana bunyi dan makna digabungkan. Tiada satu pun daripada unsur-unsur ini wujud tanpa satu sama lain: oleh itu, penutur asli memahami pelbagai warna makna perkataan polisemantik sebagai unsur yang berasingan dalam keseluruhan struktur, dalam bahasa.

Oleh itu, dalam teori F. de Saussure seseorang dapat melihat interaksi linguistik, di satu pihak, dengan sosiologi dan psikologi sosial (perlu diingatkan bahawa pada masa yang sama fenomenologi Husserl, psikoanalisis Freud, teori relativiti Einstein berkembang. , eksperimen sedang berlaku pada bentuk dan kandungan dalam kesusasteraan, muzik dan seni halus), sebaliknya, dengan matematik (konsep sistematik sepadan dengan konsep algebra bahasa). Konsep ini mengubah konsep tafsiran linguistik seperti: Fenomena mula ditafsirkan bukan berkaitan dengan sebab-sebab kejadiannya, tetapi berkaitan dengan masa kini dan masa depan. Tafsiran tidak lagi bebas daripada niat seseorang (walaupun fakta bahawa niat boleh menjadi tidak peribadi, "tidak sedar" dalam erti kata Freudian).

Fungsi mekanisme bahasa dimanifestasikan melalui aktiviti pertuturan penutur asli. Hasil pertuturan ialah apa yang dipanggil "teks yang betul" - urutan unit pertuturan yang mematuhi corak tertentu, yang kebanyakannya membenarkan penerangan matematik. Teori kaedah untuk menerangkan struktur sintaksis berkaitan dengan kajian tentang cara untuk menerangkan teks yang betul secara matematik (terutamanya ayat). Dalam struktur sedemikian, analogi linguistik ditakrifkan bukan dengan bantuan kualiti yang wujud, tetapi dengan bantuan hubungan sistemik ("struktur").

Di Barat, idea Saussure dikembangkan oleh sezaman muda ahli bahasa Switzerland yang hebat: di Denmark - L. Hjelmslev yang telah disebutkan, yang menimbulkan teori algebra bahasa dalam karyanya "Asas Teori Linguistik", di Amerika Syarikat - E. Sapir, L. Bloomfield, C. Harris, di Republik Czech - saintis penghijrah Rusia N. Trubetskoy.

Corak statistik dalam kajian bahasa mula dikaji oleh pengasas genetik, Georg Mendel. Hanya pada tahun 1968 ahli filologi mendapati bahawa, pada tahun-tahun terakhir hidupnya, dia berminat untuk mengkaji fenomena linguistik menggunakan kaedah matematik. Mendel membawa kaedah ini kepada linguistik daripada biologi; pada tahun sembilan puluhan abad kesembilan belas, hanya ahli bahasa dan ahli biologi yang paling berani mengisytiharkan kebolehlaksanaan analisis sedemikian. Dalam arkib biara St. Tomas di Brno, di mana Mendel adalah abbot, helaian ditemui dengan lajur nama keluarga yang berakhir dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan pengiraan. Dalam usaha untuk menemui undang-undang rasmi asal usul nama keluarga, Mendel membuat pengiraan yang rumit, di mana dia mengambil kira bilangan vokal dan konsonan dalam bahasa Jerman, jumlah bilangan perkataan yang dia anggap, bilangan nama keluarga, dan lain-lain.

Di negara kita, linguistik struktur mula berkembang pada masa yang sama seperti di Barat - pada pergantian abad ke-19-20. Serentak dengan F. de Saussure, konsep bahasa sebagai sistem telah dibangunkan dalam karya profesor Universiti Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berkoresponden dengan de Saussure untuk masa yang lama, oleh itu, sekolah linguistik Geneva dan Kazan bekerjasama antara satu sama lain. Jika Saussure boleh dipanggil ahli ideologi kaedah "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan asas praktikal untuk aplikasi mereka. Beliau adalah orang pertama yang memisahkan linguistik (sebagai sains tepat menggunakan kaedah statistik dan pergantungan fungsi) daripada filologi (komuniti disiplin kemanusiaan yang mengkaji budaya rohani melalui bahasa dan pertuturan). Saintis itu sendiri percaya bahawa "linguistik boleh berguna dalam masa terdekat hanya dengan membebaskan dirinya daripada kesatuan wajib dengan filologi dan sejarah kesusasteraan." Fonologi menjadi "tapak ujian" untuk pengenalan kaedah matematik ke dalam linguistik - bunyi sebagai "atom" sistem bahasa, yang mempunyai bilangan sifat yang mudah diukur yang terhad, adalah bahan yang paling mudah untuk kaedah penerangan yang formal dan ketat. Fonologi menafikan kehadiran makna dalam bunyi, jadi faktor "manusia" telah dihapuskan dalam penyelidikan. Dalam pengertian ini, fonem adalah seperti objek fizikal atau biologi.

Fonem, sebagai unsur linguistik terkecil yang boleh diterima untuk persepsi, mewakili sfera yang berasingan, "realiti fenomenologi" yang berasingan. Sebagai contoh, dalam bahasa Inggeris, bunyi "t" boleh disebut dengan cara yang berbeza, tetapi dalam semua kes, seseorang yang berbahasa Inggeris akan menganggapnya sebagai "t". Perkara utama ialah fonem akan melaksanakan fungsi utamanya - membezakan makna. Selain itu, perbezaan antara bahasa adalah sedemikian rupa sehingga jenis satu bunyi dalam satu bahasa mungkin sepadan dengan fonem yang berbeza dalam bahasa lain; contohnya, "l" dan "r" berbeza dalam bahasa Inggeris, manakala dalam bahasa lain ia adalah variasi fonem yang sama (seperti bahasa Inggeris "t", disebut aspirated atau unaspirated). Perbendaharaan kata yang luas bagi mana-mana bahasa semula jadi ialah himpunan gabungan bilangan fonem yang jauh lebih kecil. Dalam bahasa Inggeris, sebagai contoh, hanya 40 fonem digunakan untuk menyebut dan menulis kira-kira sejuta perkataan.

Bunyi bahasa mewakili set ciri yang teratur secara sistematik. Pada tahun 1920-an–1930-an, selepas Saussure, Jacobson dan N.S. Trubetskoy mengenal pasti "ciri-ciri tersendiri" fonem. Ciri-ciri ini berdasarkan struktur organ pertuturan - lidah, gigi, pita suara. Katakan, dalam bahasa Inggeris, perbezaan antara "t" dan "d" ialah kehadiran atau ketiadaan "suara" (ketegangan pita suara) dan tahap suara yang membezakan satu fonem daripada yang lain. Oleh itu, fonologi boleh dianggap sebagai contoh peraturan linguistik umum yang diterangkan oleh Saussure: "Dalam bahasa hanya ada perbezaan." Apa yang lebih penting bukanlah ini: perbezaan biasanya membayangkan keadaan yang tepat di antaranya; tetapi dalam bahasa hanya terdapat perbezaan tanpa syarat yang tepat. Sama ada kita menganggap "menandakan" atau "ditandakan", tiada konsep atau bunyi dalam bahasa yang wujud sebelum sistem bahasa dibangunkan.

Oleh itu, dalam linguistik Saussurean, fenomena yang dikaji difahami sebagai satu set perbandingan dan kontras bahasa. Bahasa adalah kedua-dua ungkapan makna perkataan dan alat komunikasi, dan kedua-dua fungsi ini tidak pernah bertepatan. Kita dapat melihat silih berganti bentuk dan kandungan: kontras linguistik mentakrifkan unit strukturnya, dan unit ini berinteraksi untuk mencipta kandungan bermakna tertentu. Oleh kerana unsur-unsur bahasa adalah rawak, kontras atau gabungan tidak boleh menjadi asas. Ini bermakna dalam sesuatu bahasa, ciri-ciri tersendiri membentuk kontras fonetik pada tahap pemahaman yang berbeza, fonem digabungkan menjadi morfem, morfem menjadi perkataan, perkataan menjadi ayat, dsb. Walau apa pun, keseluruhan fonem, perkataan, ayat, dsb. adalah lebih daripada jumlah bahagiannya.

Saussure mencadangkan idea sains abad kedua puluh yang baru, terpisah daripada linguistik, yang mengkaji peranan tanda dalam masyarakat. Saussure memanggil semiologi sains ini (dari bahasa Yunani "semeоon" - tanda). "Sains" semiotik, yang berkembang di Eropah Timur pada 1920-an-1930-an dan di Paris pada 1950-an-1960-an, meluaskan kajian tentang bahasa dan struktur linguistik kepada penemuan sastera yang digubah (atau dirumuskan) menggunakan struktur ini. Di samping itu, pada senja kerjayanya, selari dengan kursusnya dalam linguistik umum, Saussure memulakan analisis "semiotik" puisi Rom lewat, cuba menemui anagram yang sengaja disusun untuk nama yang betul. Kaedah ini dalam banyak cara bertentangan dengan rasionalisme dalam analisis linguistiknya: ia adalah percubaan untuk mengkaji dalam sistem masalah "kebarangkalian" dalam bahasa. Penyelidikan sedemikian membantu memberi tumpuan kepada "sebelah material" kebarangkalian; "kata kunci", anagram yang Saussure cari, seperti yang dihujahkan Jean Starobinsky, "alat untuk penyair, dan bukan sumber kehidupan puisi itu." Pantun berfungsi untuk menterbalikkan bunyi kata kunci. Menurut Starobinsky, dalam analisis ini "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya terdapat keinginan yang ketara untuk mengelakkan isu-isu yang berkaitan dengan kesedaran: "kerana puisi dinyatakan bukan sahaja dalam kata-kata, tetapi juga dalam apa yang dijana oleh kata-kata ini, ia melampaui kawalan kesedaran dan hanya bergantung pada undang-undang. bahasa” (lihat . Lampiran 1).

Percubaan Saussure untuk mengkaji nama yang betul dalam puisi Rom lewat menekankan salah satu komponen analisis linguistiknya - sifat sewenang-wenang tanda, serta intipati formal linguistik Saussure, yang tidak termasuk kemungkinan menganalisis makna. Todorov menyimpulkan bahawa pada masa kini karya Saussure kelihatan luar biasa konsisten dalam keengganan mereka untuk mengkaji simbol fenomena yang mempunyai makna yang jelas [Lampiran 1]. Apabila mengkaji anagram, Saussure hanya memberi perhatian kepada pengulangan, tetapi tidak kepada varian sebelumnya. . . . Mempelajari Nibelungenlied, dia mengenal pasti simbol hanya untuk memberikannya kepada bacaan yang salah: jika ia tidak disengajakan, simbol tidak wujud. Lagipun, dalam tulisannya tentang linguistik umum, dia mencadangkan kewujudan semiologi yang menggambarkan lebih daripada tanda linguistik sahaja; tetapi andaian ini dihadkan oleh fakta bahawa semiologi hanya boleh menggambarkan tanda-tanda rawak dan sewenang-wenangnya.

Jika ini benar-benar begitu, ia hanya kerana dia tidak dapat membayangkan "niat" tanpa objek; dia tidak dapat sepenuhnya mengatasi jurang antara bentuk dan kandungan - dalam karyanya ini bertukar menjadi persoalan. Sebaliknya, dia merayu kepada "sah linguistik." Terletak di antara, di satu pihak, konsep abad kesembilan belas berdasarkan sejarah dan konjektur subjektif, dan kaedah tafsiran kontinjen berdasarkan konsep ini, dan, sebaliknya, konsep strukturalis yang memadamkan pertentangan antara bentuk dan kandungan (subjek dan objek), makna dan asal usul dalam strukturalisme, psikoanalisis dan juga mekanik kuantum, tulisan Ferdinand de Saussure mengenai linguistik dan semiotik menandakan titik perubahan dalam kajian makna dalam bahasa dan budaya.

Para saintis Rusia juga diwakili di Kongres Antarabangsa Pertama Ahli Bahasa di The Hague pada tahun 1928. S. Kartsevsky, R. Jacobson dan N. Trubetskoy memberikan laporan yang mengkaji struktur hierarki bahasa - dalam semangat idea paling moden pada awal abad yang lalu. Jacobson dalam karyanya mengembangkan idea Saussure bahawa unsur-unsur asas bahasa harus dikaji, pertama sekali, berkaitan dengan fungsinya, dan bukan dengan sebab-sebab kejadiannya.

Malangnya, selepas Stalin berkuasa pada tahun 1924, linguistik domestik, seperti banyak sains lain, telah dibuang ke belakang. Ramai saintis berbakat terpaksa berhijrah, diusir dari negara ini, atau mati di kem. Hanya dari pertengahan 1950-an beberapa teori pluralisme menjadi mungkin - lebih lanjut mengenai perkara ini dalam bahagian 1.2.


1.2 Aplikasi kaedah matematik dalam linguistik pada separuh kedua abad kedua puluh


Menjelang pertengahan abad kedua puluh, empat sekolah linguistik dunia telah terbentuk, masing-masing ternyata menjadi nenek moyang kaedah "tepat" tertentu. Sekolah fonologi Leningrad (pengasasnya ialah pelajar Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis pertuturan penutur asli sebagai kriteria utama untuk generalisasi bunyi dalam bentuk fonem.

Para saintis Bulatan Linguistik Prague, khususnya pengasasnya N.S. Trubetskoy, yang berhijrah dari Rusia, mengembangkan teori tentangan - struktur semantik bahasa digambarkan oleh mereka sebagai satu set unit semantik yang dibina secara bertentangan - keluarga. Teori ini digunakan dalam kajian bukan sahaja bahasa, tetapi juga budaya seni.

Ahli ideologi deskriptivisme Amerika ialah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa telah disampaikan kepada deskriptivis sebagai satu set penyataan ucapan, yang merupakan objek utama penyelidikan mereka. Tumpuan mereka adalah pada peraturan penerangan saintifik (oleh itu nama) teks: kajian organisasi, susunan dan klasifikasi unsur-unsurnya. Pembentukan prosedur analisis dalam bidang fonologi dan morfologi (pembangunan prinsip untuk mempelajari bahasa pada tahap yang berbeza, analisis pengedaran, kaedah komponen langsung, dll.) membawa kepada perumusan soalan umum pemodelan linguistik. Tidak memberi perhatian kepada rancangan kandungan bahasa, serta sisi paradigmatik bahasa, tidak membenarkan deskriptivis mentafsir sepenuhnya bahasa sebagai satu sistem.

Pada tahun 1960-an, teori tatabahasa formal berkembang, yang timbul terutamanya berkat karya ahli falsafah dan ahli bahasa Amerika N. Chomsky. Dia berhak dianggap sebagai salah seorang saintis moden dan tokoh masyarakat yang paling terkenal; banyak artikel, monograf dan juga filem dokumentari penuh didedikasikan untuknya. Selepas cara asas baru untuk menerangkan struktur sintaksis yang dicipta oleh Chomsky - tatabahasa generatif (generatif) - pergerakan yang sepadan dalam linguistik dipanggil generativisme.

Chomsky, keturunan pendatang dari Rusia, belajar linguistik, matematik dan falsafah di University of Pennsylvania dari 1945, kerana dipengaruhi kuat oleh gurunya Zelig Harris - seperti Harris, Chomsky menganggap dan menganggap pandangan politiknya hampir kepada anarkisme (dia masih dikenali sebagai pengkritik sistem politik AS yang sedia ada dan sebagai salah seorang pemimpin rohani anti-globalisme).

Karya saintifik utama pertama Chomsky, tesis sarjananya "The Morphology of Modern Hebrew" (1951), kekal tidak diterbitkan. Chomsky menerima ijazah kedoktorannya dari University of Pennsylvania pada tahun 1955, tetapi kebanyakan penyelidikan yang menjadi asas kepada disertasinya (diterbitkan sepenuhnya hanya pada tahun 1975 di bawah tajuk "Struktur Logik Teori Linguistik") dan monograf pertamanya, "Syntactic Structures” (Syntactic Structures, 1957, Russian. trans. 1962), telah dilakukan di Universiti Harvard pada 1951–1955. Pada tahun 1955 yang sama, saintis itu berpindah ke Institut Teknologi Massachusetts, di mana beliau menjadi profesor pada tahun 1962.

Dalam perkembangannya, teori Chomsky melalui beberapa peringkat.

Dalam monograf pertamanya, "Syntactic Structures," saintis itu membentangkan bahasa sebagai mekanisme untuk menjana bilangan ayat yang tidak terhingga menggunakan set terhingga cara tatabahasa. Untuk menerangkan sifat linguistik, beliau mencadangkan konsep struktur tatabahasa dalam (tersembunyi daripada persepsi langsung dan dihasilkan oleh sistem rekursif, iaitu peraturan yang boleh digunakan berulang kali) dan permukaan (dipersepsikan secara langsung), serta transformasi yang menggambarkan peralihan daripada struktur dalam ke permukaan. Satu struktur dalam mungkin sepadan dengan beberapa struktur permukaan (contohnya, pembinaan pasif Dekri ditandatangani oleh presiden berasal dari struktur dalam yang sama seperti pembinaan aktif Presiden menandatangani dekri) dan sebaliknya (contohnya, kekaburan Ibu mencintai anak perempuannya digambarkan sebagai hasil kebetulan struktur permukaan kembali ke dua kedalaman yang berbeza, di mana ibu adalah orang yang menyayangi anak perempuan itu, dan pada satu lagi, orang yang disayangi oleh anak perempuan itu).

Teori standard Chomsky ialah model Aspek, yang dinyatakan dalam buku Chomsky Aspects of the Theory of Syntax. Dalam model ini, peraturan tafsiran semantik yang memberikan makna kepada struktur yang mendalam diperkenalkan ke dalam teori formal buat kali pertama. Dalam "Aspek", kecekapan linguistik bertentangan dengan penggunaan bahasa (prestasi), apa yang dipanggil hipotesis Katz-Postal tentang pemeliharaan makna semasa transformasi diterima pakai, dan oleh itu konsep transformasi pilihan dikecualikan, dan radas ciri sintaksis yang menerangkan keserasian leksikal diperkenalkan.

Pada tahun 1970-an, Chomsky mengusahakan teori tadbir urus dan mengikat (teori GB - daripada perkataan kerajaan dan mengikat) - lebih umum daripada yang sebelumnya. Di dalamnya, saintis meninggalkan peraturan khusus yang menerangkan struktur sintaksis bahasa tertentu. Semua transformasi telah digantikan oleh satu transformasi langkah sejagat. Dalam rangka kerja teori GB, terdapat juga modul persendirian, yang masing-masing bertanggungjawab untuk bahagian tatabahasanya sendiri.

Baru-baru ini pada tahun 1995, Chomsky mengemukakan program minimalis di mana bahasa manusia digambarkan sebagai serupa dengan bahasa mesin. Ini hanyalah program - bukan model atau teori. Di dalamnya, Chomsky mengenal pasti dua subsistem utama alat bahasa manusia: leksikon dan sistem pengkomputeran, serta dua antara muka - fonetik dan logik.

Tatabahasa formal Chomsky telah menjadi klasik untuk menerangkan bukan sahaja bahasa semula jadi, tetapi juga bahasa buatan - khususnya, bahasa pengaturcaraan. Perkembangan linguistik struktur pada separuh kedua abad kedua puluh boleh dianggap sebagai "revolusi Chomsky."

Sekolah fonologi Moscow, yang wakilnya ialah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori yang sama untuk mengkaji fonetik. Secara beransur-ansur, kaedah "tepat" mula digunakan bukan sahaja untuk fonetik, tetapi juga untuk sintaks. Kedua-dua ahli bahasa dan matematik, baik di sini mahupun di luar negara, mula mengkaji struktur bahasa. Pada tahun 1950-60an, peringkat baru dalam interaksi matematik dan linguistik bermula di USSR, yang dikaitkan dengan pembangunan sistem terjemahan mesin.

Dorongan untuk permulaan kerja ini di negara kita adalah perkembangan pertama dalam bidang terjemahan mesin di Amerika Syarikat (walaupun peranti terjemahan mekanikal pertama oleh P.P. Smirnov-Troyansky telah dicipta di USSR pada tahun 1933, ia, sebagai primitif, tidak meluas). Pada tahun 1947, A. Butt dan D. Britten menghasilkan kod untuk terjemahan perkataan demi perkataan menggunakan komputer setahun kemudian, R. Richens mencadangkan peraturan untuk membahagikan perkataan kepada batang dan penghujung dalam terjemahan mesin. Tahun-tahun itu agak berbeza daripada tahun-tahun moden. Ini adalah mesin yang sangat besar dan mahal yang menempati seluruh bilik dan memerlukan kakitangan jurutera, pengendali dan pengaturcara yang ramai untuk penyelenggaraannya. Pada asasnya, komputer ini digunakan untuk menjalankan pengiraan matematik untuk keperluan institusi ketenteraan - perkara baru dalam matematik, fizik dan teknologi berkhidmat, pertama sekali, hal ehwal ketenteraan. Pada peringkat awal, pembangunan MP disokong secara aktif oleh tentera, manakala (semasa Perang Dingin) arah Rusia-Inggeris berkembang di Amerika Syarikat, dan arah Inggeris-Rusia di USSR.

Pada Januari 1954, "Eksperimen Georgetown" berlaku di Universiti Teknikal Massachusetts - demonstrasi awam pertama terjemahan dari Rusia ke Bahasa Inggeris pada mesin IBM-701. Abstrak mesej tentang kejayaan menyiapkan eksperimen, yang dibuat oleh D.Yu. Panov, muncul dalam Jurnal Matematik Rusia, 1954, No. 10: "Terjemahan dari satu bahasa ke bahasa lain menggunakan mesin: laporan tentang ujian pertama yang berjaya."

D. Yu. Panov (pada masa itu pengarah Institut Maklumat Saintifik - INI, kemudiannya VINITI) menarik I. K. Belskaya untuk bekerja pada terjemahan mesin, yang kemudiannya akan mengetuai kumpulan terjemahan mesin di Institut Matematik Ketepatan dan Sains Komputer Akademi Sains USSR. Pengalaman pertama terjemahan dari bahasa Inggeris ke bahasa Rusia menggunakan mesin BESM bermula pada penghujung tahun 1955. Program untuk BESM telah disusun oleh N.P. Trifonov dan L.N. Korolev, yang tesis PhDnya ditumpukan kepada kaedah untuk membina kamus untuk terjemahan mesin.

Secara selari, kerja pada terjemahan mesin telah dijalankan di Jabatan Matematik Gunaan Institut Matematik Akademi Sains USSR (kini Institut Matematik Gunaan M.V. Keldysh dari Akademi Sains Rusia). Atas inisiatif ahli matematik A.A. Lyapunova. Dia melibatkan pelajar siswazah Steklov Mathematical Institute O.S dalam kerja menterjemah teks menggunakan mesin Strela dari bahasa Perancis ke bahasa Rusia. Kulagin dan pelajarnya T.D. Ventzel dan N.N. Ricco. Idea Lyapunov dan Kulagina tentang kemungkinan menggunakan teknologi untuk terjemahan dari satu bahasa ke bahasa lain diterbitkan dalam jurnal Nature, 1955, No. 8. Sejak akhir tahun 1955, mereka telah disertai oleh T.N. Moloshnaya, yang kemudiannya memulakan kerja bebas pada algoritma untuk terjemahan Inggeris-Rusia.

R. Frumkina, yang pada masa itu terlibat dalam terjemahan algoritma dari bahasa Sepanyol, mengingatkan bahawa pada peringkat kerja ini sukar untuk mengambil sebarang langkah yang konsisten. Lebih kerap saya terpaksa mengikuti pengalaman heuristik - saya sendiri atau rakan sekerja saya.

Walau bagaimanapun, generasi pertama sistem terjemahan mesin adalah sangat tidak sempurna. Kesemuanya adalah berdasarkan algoritma terjemahan berturut-turut "perkataan demi perkataan", "frasa demi frasa" - hubungan semantik antara perkataan dan ayat tidak diambil kira dalam apa cara sekalipun. Sebagai contoh, anda boleh memberikan ayat berikut: “John sedang mencari kotak mainannya. Akhirnya dia jumpa. Kotak itu berada di dalam pen. John sangat gembira. (John sedang mencari kotak mainannya. Akhirnya dia menjumpainya. Kotak itu ada di dalam playpen. John sangat gembira.).” “Pen” dalam konteks ini bukanlah “pen” (alat tulis), tetapi “playpen” (main-pen). Pengetahuan tentang sinonim, antonies dan makna kiasan sukar untuk dimasukkan ke dalam komputer. Arah yang menjanjikan ialah pembangunan sistem mesin yang bertujuan untuk digunakan oleh penterjemah manusia.

Dari masa ke masa, sistem terjemahan langsung digantikan oleh sistem T (dari perkataan Inggeris "pemindahan" - transformasi), di mana terjemahan dijalankan pada tahap struktur sintaksis. Algoritma sistem T menggunakan mekanisme yang membolehkan mereka membina struktur sintaksis mengikut peraturan tatabahasa bahasa ayat input (serupa dengan cara mereka mengajar bahasa asing di sekolah menengah), dan kemudian mensintesis ayat keluaran, mengubah struktur sintaksis dan menggantikan perkataan yang diperlukan daripada kamus.

Lyapunov bercakap tentang terjemahan dengan mengekstrak makna teks terjemahan dan menyampaikannya dalam bahasa lain. Pendekatan untuk membina sistem terjemahan mesin berdasarkan mendapatkan perwakilan semantik ayat input melalui analisis semantik dan sintesis ayat input berdasarkan perwakilan semantik yang terhasil masih dianggap paling maju. Sistem sedemikian dipanggil I-systems (dari perkataan "interlingua"). Walau bagaimanapun, tugas untuk menciptanya, yang bermula pada akhir 50-an dan awal 60-an, masih belum diselesaikan sepenuhnya, walaupun usaha Persekutuan Antarabangsa IFIP, komuniti saintis global dalam bidang pemprosesan maklumat.

Para saintis telah memikirkan bagaimana untuk memformalkan dan membina algoritma untuk bekerja dengan teks, kamus apa yang perlu dimasukkan ke dalam mesin, apakah corak linguistik yang harus digunakan dalam terjemahan mesin. Linguistik tradisional tidak mempunyai idea sedemikian - bukan sahaja dari segi semantik, tetapi juga dari segi sintaksis. Kerana tiada bahasa pada masa itu terdapat senarai struktur sintaksis, syarat keserasian dan kebolehtukarannya tidak dikaji, dan peraturan untuk membina unit besar struktur sintaksis daripada unsur konstituen yang lebih kecil tidak dibangunkan.

Keperluan untuk mencipta asas teori untuk terjemahan mesin membawa kepada pembentukan dan perkembangan linguistik matematik. Peranan utama dalam perkara ini di USSR dimainkan oleh ahli matematik A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, ahli bahasa V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Disertasi Kulagina dikhaskan untuk mengkaji teori tatabahasa formal (secara serentak dengan N. Chomsky di Amerika Syarikat), Kuznetsov mengemukakan masalah aksiomatisasi linguistik, kembali kepada karya F.F. Fortunatova.

Pada 6 Mei 1960, Resolusi Presidium Akademi Sains USSR "Mengenai pembangunan kaedah struktur dan matematik penyelidikan bahasa" telah diterima pakai, dan bahagian yang sepadan telah dibuat di Institut Linguistik dan Institut Bahasa Rusia. Sejak tahun 1960, universiti kemanusiaan terkemuka di negara ini - Fakulti Filologi Universiti Negeri Moscow, Leninrad, Universiti Novosibirsk, Institut Pedagogi Bahasa Asing Negeri Moscow - mula melatih kakitangan dalam bidang pemprosesan teks automatik.

Walau bagaimanapun, kerja pada penterjemahan mesin dari tempoh ini, yang dipanggil tempoh "klasik", adalah lebih bersifat teori daripada kepentingan praktikal. Sistem terjemahan mesin yang menjimatkan kos mula dicipta hanya pada tahun lapan puluhan abad yang lalu. Saya akan bercakap mengenai perkara ini kemudian, dalam bahagian 2.1, "Terjemahan Mesin".

Tahun 1960-an dan 70-an termasuk perkembangan teori yang mendalam menggunakan kaedah teori set dan logik matematik, seperti teori medan dan teori set kabur.

Pengarang teori lapangan dalam linguistik ialah penyair, penterjemah dan ahli bahasa Soviet V.G. Admoni. Dia pada mulanya mengembangkan teorinya berdasarkan bahasa Jerman. Dalam Admoni, konsep "medan" menandakan set unsur linguistik yang tidak kosong (contohnya, "medan leksikal", "medan semantik").

Struktur medan adalah heterogen: ia terdiri daripada teras, unsur-unsur yang mempunyai set lengkap ciri-ciri yang menentukan set, dan pinggiran, unsur-unsur yang mungkin mempunyai kedua-dua ciri set tertentu (bukan semua) dan jiran. Izinkan saya memberi contoh untuk menggambarkan pernyataan ini: katakan, dalam bahasa Inggeris, bidang kata majmuk (“day-dream” - “mimpi” sukar dipisahkan daripada bidang frasa (“gas pemedih mata”)).

Teori set kabur yang telah disebutkan di atas berkait rapat dengan teori medan. Di USSR, pengesahannya dilakukan oleh ahli bahasa V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, tetapi pengasasnya ialah ahli matematik Amerika L. Zade, yang menerbitkan artikel "Fuzzy Logic" pada tahun 1965. Memberi justifikasi matematik bagi teori himpunan kabur, Zadeh menganggapnya menggunakan bahan linguistik.

Dalam teori ini, kita tidak bercakap terlalu banyak tentang kepunyaan elemen kepada set tertentu (AOa), tetapi mengenai tahap keahlian ini (mAOa), kerana elemen persisian boleh, pada satu darjah atau yang lain, tergolong dalam beberapa bidang. Zade (Lofti-zade) berasal dari Azerbaijan, sehingga umur 12 tahun dia telah berlatih berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggeris dan Parsi - dan menggunakan tiga abjad berbeza: Cyrillic, Latin, Arab. Apabila seorang saintis ditanya apakah persamaan teori set kabur dan linguistik, dia tidak menafikan hubungan ini, tetapi menjelaskan: "Saya tidak pasti bahawa kajian bahasa-bahasa ini mempunyai pengaruh yang besar terhadap pemikiran saya. Jika ini berlaku, mungkin secara tidak sedar.” Pada masa mudanya, Zadeh belajar di Tehran di sekolah Presbyterian, dan selepas Perang Dunia II berhijrah ke Amerika Syarikat. "Persoalannya bukan sama ada saya orang Amerika, Rusia, Azerbaijan atau apa sahaja," katanya

Abstrak yang serupa:

Bahasa dan pertuturan sebagai salah satu masalah asas dalam stilistika. Konsep tahap fonem dan fonologi. Konsep bahasa sebagai sistem dan tingkatan sistem bahasa. Konsep morfem dan jenisnya. Ayat sebagai unit sintaksis teks. Tanda-tanda sistem bahasa.

Isi kandungan
pengenalan
Bab 1. Sejarah aplikasi kaedah matematik dalam linguistik
1.1. Pembentukan linguistik struktural pada permulaan abad ke-19 - ke-20
1.2. Aplikasi kaedah matematik dalam linguistik pada separuh kedua abad kedua puluh
Bab 2. Contoh pilihan penggunaan matematik dalam linguistik
2.1. Terjemah mesin
2.2.Kaedah statistik dalam pembelajaran bahasa
2.3. Mempelajari bahasa menggunakan kaedah logik formal
2.4. Prospek untuk aplikasi kaedah matematik dalam linguistik
Kesimpulan
kesusasteraan
Lampiran 1. Ronald Schleifer. Ferdinand de Saussure
Lampiran 2. Ferdinand de Saussure (terjemahan)

pengenalan
Pada abad kedua puluh, terdapat trend berterusan ke arah interaksi dan interpenetrasi pelbagai bidang ilmu. Sempadan antara sains individu secara beransur-ansur kabur; Semakin banyak cabang aktiviti intelektual muncul, terletak di persimpangan bidang kemanusiaan, teknikal dan pengetahuan sains semula jadi.
Satu lagi ciri kemodenan yang jelas ialah keinginan untuk mengkaji struktur dan unsur konstituennya. Oleh itu, tempat yang semakin meningkat seperti dalam teori saintifik, dan dalam amalannya ditumpukan kepada matematik. Bersentuhan, di satu pihak, dengan logik dan falsafah, sebaliknya, dengan statistik (dan, akibatnya, dengan Sains Sosial), matematik menembusi lebih dalam dan lebih dalam ke dalam bidang-bidang yang untuk masa yang lama dianggap sebagai "kemanusiaan" semata-mata, mengembangkan potensi heuristik mereka (jawapan kepada soalan "berapa banyak" selalunya akan membantu menjawab soalan "apa" dan " bagaimana”). Linguistik tidak terkecuali.
Tujuan kerja kursus saya adalah untuk menyerlahkan secara ringkas kaitan antara matematik dan cabang linguistik seperti linguistik. Sejak 50-an abad yang lalu, matematik telah digunakan dalam linguistik untuk mencipta alat teori untuk menerangkan struktur bahasa (semula jadi dan buatan). Walau bagaimanapun, harus dikatakan bahawa dia tidak segera menemui sesuatu yang serupa dengan dirinya. kegunaan praktikal. Pada mulanya, kaedah matematik dalam linguistik mula digunakan untuk menjelaskan konsep asas linguistik, tetapi dengan perkembangan teknologi komputer, premis teori seperti itu mula digunakan dalam amalan. Menyelesaikan masalah seperti terjemahan mesin, perolehan maklumat mesin dan pemprosesan teks automatik memerlukan pendekatan bahasa yang asasnya baharu. Satu persoalan telah timbul untuk ahli bahasa: bagaimana untuk belajar mewakili corak linguistik dalam bentuk yang boleh digunakan secara langsung kepada teknologi. Istilah "linguistik matematik," yang popular pada zaman kita, merujuk kepada mana-mana penyelidikan linguistik yang menggunakan kaedah tepat (dan konsep kaedah tepat dalam sains sentiasa berkait rapat dengan matematik). Sesetengah saintis tahun lalu percaya bahawa ungkapan itu sendiri tidak boleh dinaikkan kepada pangkat istilah, kerana ia tidak menunjukkan sebarang "linguistik" khas tetapi hanya arah baharu yang tertumpu pada penambahbaikan, peningkatan ketepatan dan kebolehpercayaan kaedah penyelidikan bahasa. Linguistik menggunakan kaedah kuantitatif (algebra) dan bukan kuantitatif, yang membawanya lebih dekat kepada logik matematik, dan, akibatnya, kepada falsafah, dan juga psikologi. Schlegel juga mencatatkan interaksi bahasa dan kesedaran, dan ahli bahasa terkemuka awal abad kedua puluh Ferdinand de Saussure (saya akan bercakap tentang pengaruhnya terhadap perkembangan kaedah matematik dalam linguistik kemudian) menghubungkan struktur bahasa dengan kepunyaannya orang ramai. Penjelajah Moden L. Perlovsky pergi lebih jauh, mengenal pasti ciri kuantitatif bahasa (contohnya, bilangan jantina, kes) dengan ciri-ciri mentaliti kebangsaan (lebih lanjut mengenai perkara ini dalam bahagian 2.2, "Kaedah statistik dalam linguistik").
Interaksi matematik dan linguistik adalah topik yang pelbagai, dan dalam kerja saya, saya tidak akan memberi tumpuan kepada semuanya, tetapi, pertama sekali, pada aspek yang diterapkan.

Bab I. Sejarah aplikasi kaedah matematik dalam linguistik
1.1 Pembentukan linguistik struktural pada permulaan abad ke-19 - ke-20
Penerangan matematik bahasa adalah berdasarkan idea bahasa sebagai mekanisme, yang kembali kepada ahli bahasa Switzerland yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.
Tautan awal konsepnya ialah teori bahasa sebagai satu sistem yang terdiri daripada tiga bahagian (bahasa itu sendiri - bahasa, ucapan - kata laluan, dan aktiviti pertuturan – bahasa), di mana setiap perkataan (ahli sistem) dianggap bukan dengan sendirinya, tetapi berkaitan dengan ahli lain. Sebagai seorang lagi ahli bahasa terkemuka, Dane Louis Hjelmslev, kemudiannya menyatakan, Saussure "adalah yang pertama menuntut pendekatan struktur bahasa, iaitu, penerangan saintifik bahasa dengan merekodkan hubungan antara unit."
Memahami bahasa sebagai struktur hierarki, Saussure adalah orang pertama yang mengemukakan masalah nilai dan kepentingan unit linguistik. Fenomena dan peristiwa individu (katakan, sejarah asal usul perkataan Indo-Eropah individu) tidak seharusnya dikaji sendiri, tetapi dalam sistem di mana ia dikaitkan dengan komponen yang serupa.
Saussure menganggap unit struktur bahasa sebagai perkataan, "tanda," di mana bunyi dan makna digabungkan. Tiada satu pun daripada elemen ini wujud tanpa satu sama lain: oleh itu, warna makna yang berbeza jelas kepada penutur asli perkataan polisemantik sebagai elemen yang berasingan dalam keseluruhan struktur, dalam bahasa.
Oleh itu, dalam teori F. de Saussure seseorang dapat melihat interaksi linguistik, di satu pihak, dengan sosiologi dan psikologi sosial(perlu diingatkan bahawa pada masa yang sama, fenomenologi Husserl, psikoanalisis Freud, teori relativiti Einstein sedang berkembang, eksperimen sedang berlaku pada bentuk dan kandungan dalam kesusasteraan, muzik dan seni visual), sebaliknya, dengan matematik ( konsep sistematik sepadan dengan konsep algebra bahasa). Konsep ini mengubah konsep tafsiran linguistik seperti: Fenomena mula ditafsirkan bukan berkaitan dengan sebab-sebab kejadiannya, tetapi berkaitan dengan masa kini dan masa depan. Tafsiran tidak lagi bebas daripada niat seseorang (walaupun fakta bahawa niat boleh menjadi tidak peribadi, "tidak sedar" dalam erti kata Freudian).
Fungsi mekanisme bahasa dimanifestasikan melalui aktiviti pertuturan penutur asli. Hasil pertuturan ialah apa yang dipanggil "teks yang betul" - urutan unit pertuturan yang mematuhi corak tertentu, yang kebanyakannya membenarkan penerangan matematik. Teori kaedah untuk menerangkan struktur sintaksis berkaitan dengan kajian tentang cara untuk menerangkan teks yang betul secara matematik (terutamanya ayat). Dalam struktur sedemikian, analogi linguistik ditakrifkan bukan dengan bantuan kualiti yang wujud, tetapi dengan bantuan hubungan sistemik ("struktur").
Di Barat, idea Saussure dikembangkan oleh sezaman muda ahli bahasa Switzerland yang hebat: di Denmark - L. Hjelmslev yang telah disebutkan, yang menimbulkan teori algebra bahasa dalam karyanya "Asas Teori Linguistik", di Amerika Syarikat - E. Sapir, L. Bloomfield, C. Harris, di Republik Czech - saintis penghijrah Rusia N. Trubetskoy.
Corak statistik dalam kajian bahasa mula dikaji oleh pengasas genetik, Georg Mendel. Hanya pada tahun 1968 ahli filologi mendapati bahawa, pada tahun-tahun terakhir hidupnya, dia berminat untuk mengkaji fenomena linguistik menggunakan kaedah matematik. Mendel membawa kaedah ini kepada linguistik daripada biologi; pada tahun sembilan puluhan abad kesembilan belas, hanya ahli bahasa dan ahli biologi yang paling berani mengisytiharkan kebolehlaksanaan analisis sedemikian. Dalam arkib biara St. Tomas di Brno, di mana Mendel adalah abbot, helaian ditemui dengan lajur nama keluarga yang berakhir dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan pengiraan. Dalam usaha untuk menemui undang-undang rasmi asal usul nama keluarga, Mendel membuat pengiraan rumit yang mengambil kira bilangan vokal dan konsonan dalam bahasa Jerman, jumlah nombor perkataan yang dia anggap, bilangan nama keluarga, dsb.
Di negara kita, linguistik struktur mula berkembang pada masa yang sama seperti di Barat - pada pergantian abad ke-19-20. Serentak dengan F. de Saussure, konsep bahasa sebagai sistem telah dibangunkan dalam karya profesor Universiti Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berkoresponden dengan de Saussure untuk masa yang lama, oleh itu, sekolah linguistik Geneva dan Kazan bekerjasama antara satu sama lain. Jika Saussure boleh dipanggil ahli ideologi kaedah "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan asas praktikal permohonan mereka. Beliau adalah orang pertama yang memisahkan linguistik (as tepat sains yang menggunakan kaedah statistik dan pergantungan fungsi) pada filologi (komuniti disiplin kemanusiaan yang mengkaji budaya rohani melalui bahasa dan pertuturan). Saintis itu sendiri percaya bahawa "linguistik boleh berguna dalam masa terdekat hanya dengan membebaskan dirinya daripada kesatuan wajib dengan filologi dan sejarah kesusasteraan." Fonologi menjadi "tapak ujian" untuk pengenalan kaedah matematik ke dalam linguistik - bunyi sebagai "atom" sistem bahasa, yang mempunyai bilangan sifat yang mudah diukur yang terhad, adalah bahan yang paling mudah untuk kaedah penerangan yang formal dan ketat. Fonologi menafikan kehadiran makna dalam bunyi, jadi faktor "manusia" telah dihapuskan dalam penyelidikan. Dalam pengertian ini, fonem adalah seperti objek fizikal atau biologi.
Fonem, sebagai unsur linguistik terkecil yang boleh diterima untuk persepsi, mewakili sfera yang berasingan, "realiti fenomenologi" yang berasingan. Sebagai contoh, dalam bahasa Inggeris, bunyi "t" boleh disebut dengan cara yang berbeza, tetapi dalam semua kes, seseorang yang berbahasa Inggeris akan menganggapnya sebagai "t". Perkara utama ialah fonem akan melaksanakan fungsi utamanya - membezakan makna. Selain itu, perbezaan antara bahasa adalah sedemikian rupa sehingga jenis satu bunyi dalam satu bahasa mungkin sepadan dengan fonem yang berbeza dalam bahasa lain; contohnya, "l" dan "r" berbeza dalam bahasa Inggeris, manakala dalam bahasa lain ia adalah variasi fonem yang sama (seperti bahasa Inggeris "t", disebut aspirated atau unaspirated). Perbendaharaan kata yang luas untuk sesiapa sahaja bahasa semula jadi ialah satu set gabungan bilangan fonem yang jauh lebih kecil. Dalam bahasa Inggeris, sebagai contoh, hanya 40 fonem digunakan untuk menyebut dan menulis kira-kira sejuta perkataan.
Bunyi bahasa mewakili set ciri yang teratur secara sistematik. Pada tahun 1920-an–1930-an, selepas Saussure, Jacobson dan N.S. Trubetskoy mengenal pasti "ciri-ciri tersendiri" fonem. Ciri-ciri ini adalah berdasarkan struktur organ pertuturan - lidah, gigi, pita suara. Katakan dalam perbezaan bahasa Inggeris antara “t” dan “d” ialah ada atau tidaknya “suara” (ketegangan pita suara) dan tahap suara yang membezakan satu fonem dengan yang lain. Oleh itu, fonologi boleh dianggap sebagai contoh peraturan linguistik umum yang diterangkan oleh Saussure: "Dalam bahasa hanya ada perbezaan." Apa yang lebih penting bukanlah ini: perbezaan biasanya membayangkan keadaan yang tepat di antaranya; tetapi dalam bahasa hanya terdapat perbezaan tanpa syarat yang tepat. Sama ada kita menganggap "menandakan" atau "ditandakan", tiada konsep atau bunyi dalam bahasa yang wujud sebelum sistem bahasa dibangunkan.
Oleh itu, dalam linguistik Saussurean, fenomena yang dikaji difahami sebagai satu set perbandingan dan kontras bahasa. Bahasa adalah kedua-dua ungkapan makna perkataan dan alat komunikasi, dan kedua-dua fungsi ini tidak pernah bertepatan. Kita dapat melihat silih berganti bentuk dan kandungan: kontras linguistik mentakrifkan unit strukturnya, dan unit ini berinteraksi untuk mencipta kandungan bermakna tertentu. Oleh kerana unsur-unsur bahasa adalah rawak, kontras atau gabungan tidak boleh menjadi asas. Ini bermakna dalam sesuatu bahasa, ciri-ciri tersendiri membentuk kontras fonetik pada tahap pemahaman yang berbeza, fonem digabungkan menjadi morfem, morfem menjadi perkataan, perkataan menjadi ayat, dsb. Walau apa pun, keseluruhan fonem, perkataan, ayat, dsb. adalah lebih daripada jumlah bahagiannya.
Saussure mencadangkan idea sains abad kedua puluh yang baru, terpisah daripada linguistik, yang mengkaji peranan tanda dalam masyarakat. Saussure memanggil semiologi sains ini (dari bahasa Yunani "semeîon" - tanda). "Sains" semiotik, yang berkembang di Eropah Timur pada 1920-an-1930-an dan di Paris pada 1950-an-1960-an, meluaskan kajian tentang bahasa dan struktur linguistik kepada penemuan sastera yang digubah (atau dirumuskan) menggunakan struktur ini. Di samping itu, pada senja kerjayanya, selari dengan kursusnya dalam linguistik umum, Saussure memulakan analisis "semiotik" puisi Rom lewat, cuba menemui anagram yang sengaja disusun untuk nama yang betul. Kaedah ini dalam banyak cara bertentangan dengan rasionalisme dalam analisis linguistiknya: ia adalah percubaan untuk mengkaji dalam sistem masalah "kebarangkalian" dalam bahasa. Penyelidikan sedemikian membantu memberi tumpuan kepada "sebelah material" kebarangkalian; "kata kunci", anagram yang Saussure cari, seperti yang dihujahkan Jean Starobinsky, "alat untuk penyair, dan bukan sumber kehidupan puisi itu." Pantun berfungsi untuk menukar tempat bunyi kata kunci. Menurut Starobinsky, dalam analisis ini "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya terdapat keinginan yang ketara untuk mengelakkan isu-isu yang berkaitan dengan kesedaran: "kerana puisi dinyatakan bukan sahaja dalam kata-kata, tetapi juga dalam apa yang dijana oleh kata-kata ini, ia melampaui kawalan kesedaran dan hanya bergantung pada undang-undang. bahasa” (lihat . Lampiran 1).
Percubaan Saussure untuk mengkaji nama yang betul dalam puisi Rom lewat menekankan salah satu komponen analisis linguistiknya - sifat sewenang-wenang tanda, serta intipati formal linguistik Saussure, yang tidak termasuk kemungkinan menganalisis makna. Todorov menyimpulkan bahawa pada masa kini karya Saussure kelihatan luar biasa konsisten dalam keengganan mereka untuk mengkaji simbol fenomena yang mempunyai makna yang jelas [Lampiran 1]. Apabila mengkaji anagram, Saussure hanya memberi perhatian kepada pengulangan, tetapi tidak kepada varian sebelumnya. . . . Mempelajari Nibelungenlied, dia mengenal pasti simbol hanya untuk memberikannya kepada bacaan yang salah: jika ia tidak disengajakan, simbol tidak wujud. Lagipun, dalam tulisannya tentang linguistik umum, dia mencadangkan kewujudan semiologi yang menggambarkan lebih daripada tanda linguistik sahaja; tetapi andaian ini dihadkan oleh fakta bahawa semiologi hanya boleh menggambarkan tanda-tanda rawak dan sewenang-wenangnya.
Jika ini benar-benar begitu, ia hanya kerana dia tidak dapat membayangkan "niat" tanpa objek; dia tidak dapat sepenuhnya mengatasi jurang antara bentuk dan kandungan - dalam karyanya ini bertukar menjadi persoalan. Sebaliknya, dia merayu kepada "sah linguistik." Terletak di antara, di satu pihak, konsep abad kesembilan belas berdasarkan sejarah dan konjektur subjektif, dan kaedah tafsiran kontinjen berdasarkan konsep ini, dan, sebaliknya, konsep strukturalis yang memadamkan pertentangan antara bentuk dan kandungan (subjek dan objek), makna dan asal usul dalam strukturalisme, psikoanalisis dan juga mekanik kuantum, tulisan Ferdinand de Saussure mengenai linguistik dan semiotik menandakan titik perubahan dalam kajian makna dalam bahasa dan budaya.
Para saintis Rusia juga diwakili di Kongres Antarabangsa Pertama Ahli Bahasa di The Hague pada tahun 1928. S. Kartsevsky, R. Yakobson dan N. Trubetskoy membuat laporan yang mereka pertimbangkan struktur hierarki bahasa - dalam semangat idea yang paling moden pada awal abad yang lalu. Jacobson dalam karyanya mengembangkan idea Saussure bahawa unsur-unsur asas bahasa harus dikaji, pertama sekali, berkaitan dengan fungsinya, dan bukan dengan sebab-sebab kejadiannya.
Malangnya, selepas Stalin berkuasa pada tahun 1924, linguistik domestik, seperti banyak sains lain, telah dibuang ke belakang. Ramai saintis berbakat terpaksa berhijrah, diusir dari negara ini, atau mati di kem. Hanya dari pertengahan 1950-an beberapa teori pluralisme menjadi mungkin - lebih lanjut mengenai perkara ini dalam bahagian 1.2.
1.2 Aplikasi kaedah matematik dalam linguistik pada separuh kedua abad kedua puluh
Menjelang pertengahan abad kedua puluh, empat sekolah linguistik dunia telah terbentuk, masing-masing ternyata menjadi nenek moyang kaedah "tepat" tertentu. Sekolah Fonologi Leningrad(pengasasnya ialah pelajar Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis pertuturan penutur asli sebagai kriteria utama untuk menyamaratakan bunyi dalam bentuk fonem.
Para saintis Bulatan Linguistik Prague, khususnya – pengasasnya N.S. Trubetskoy, yang berhijrah dari Rusia, mengembangkan teori tentangan - struktur semantik bahasa digambarkan oleh mereka sebagai satu set yang dibina secara bertentangan unit semantik– sem. Teori ini digunakan dalam kajian bukan sahaja bahasa, tetapi juga budaya seni.
Ahli ideologi deskriptivisme Amerika terdapat ahli bahasa L. Bloomfield dan E. Sapir. Bahasa telah dikemukakan kepada ahli deskriptivis sebagai satu set ujaran ucapan, yang merupakan objek utama kajian mereka. Tumpuan mereka adalah pada peraturan penerangan saintifik (oleh itu nama) teks: kajian organisasi, susunan dan klasifikasi unsur-unsurnya. Pembentukan prosedur analisis dalam bidang fonologi dan morfologi (pembangunan prinsip untuk mempelajari bahasa pada tahap yang berbeza, analisis pengedaran, kaedah komponen langsung, dll.) membawa kepada perumusan soalan umum pemodelan linguistik. Tidak memberi perhatian kepada rancangan kandungan bahasa, serta sisi paradigmatik bahasa, tidak membenarkan deskriptivis mentafsir sepenuhnya bahasa sebagai satu sistem.

Tidak dinafikan bahawa penggunaan kaedah matematik dan logik ("kaedah tepat") dalam linguistik sebahagian besarnya dirangsang oleh tugas-tugas linguistik gunaan. Jika percubaan dibuat untuk menggunakan kaedah ini untuk menyelesaikan masalah yang berkaitan secara langsung dengan bidang linguistik teori, contohnya, untuk membezakan antara fenomena bahasa dan pertuturan *, maka pada masa hadapan (walaupun mungkin tidak selalu jelas dan dekat) mereka masih mempunyai mengambil kira keperluan linguistik gunaan. Dengan cara ini, ini bermakna bahawa penilaian hasil operasi tersebut mesti dijalankan dengan pertimbangan mandatori matlamat linguistik gunaan.

* (Lihat: G. Herdan, Language as Choice and Chance, Groningen, 1956.)

Kejayaan menggunakan kaedah ini sepenuhnya kawasan baru dari sudut pandangan umum, ia sebahagian besarnya ditentukan oleh jawapan kepada soalan sejauh mana dibenarkan untuk mengenal pasti bahasa yang betul secara logik dengan bahasa semula jadi, atau, dalam rumusan lain, adakah mungkin untuk mengurangkan yang kedua kepada yang pertama *. Jawapan kepada soalan ini biasanya diberikan dalam bentuk praktikal - melalui pembinaan statistik, teori maklumat, set-teori, kebarangkalian-teoretik dan model matematik bahasa yang lain, yang, bagaimanapun, tidak selalu berorientasikan kepada tugas tertentu * *. Apabila membina model seperti ini, pengarang mereka sering meneruskan dari andaian (jelas dari sudut pandangan mereka) bahawa sebarang aplikasi radas logik atau matematik formal untuk huraian linguistik dan penyelidikan secara automatik menyumbang kepada peningkatan mereka. Warren Platt berkata ini dengan baik dalam ulasannya tentang karya linguistik matematik: "Jika kita menganggap model bahasa sebagai sistem abstrak unsur diskret, maka pelbagai konsep matematik dan kaedah, bermula daripada idea asas nombor kepada operasi "logik, statistik dan set-teori yang kompleks Walau bagaimanapun, idea bahawa sebarang penggunaan nombor dan operasi matematik untuk menerangkan sistem elemen sedemikian menjadikan pernyataan lebih "tepat" atau lebih. "saintifik" adalah salah sama sekali sistem baru, dengan itu diperoleh adalah model yang lebih memuaskan" daripada sistem asal, sama ada dalam erti kata ia memungkinkan untuk merumuskan pernyataan teori yang lebih mudah dan lebih umum tentang beberapa aspek domain yang dimodelkan, atau kerana operasi pada model memberi penerangan tentang hasil operasi yang sepadan dalam kawasan yang dimodelkan Salah satu bahaya utama yang berkaitan dengan pembinaan model matematik bahasa, terutamanya yang kuantitatif, adalah bahawa penggunaan alat matematik secara sembarangan pasti membawa kepada keputusan yang tidak bermakna dan mengelirukan memahami dengan jelas prasyarat untuk memperkaya linguistik dengan bantuan matematik bukan sahaja pengetahuan tentang bidang matematik yang berkaitan, tetapi juga, sebagai tambahan, pemahaman yang mendalam tentang intipati masalah linguistik, penyelesaian yang kaedah matematik harus ditujukan. " *** .

* (Rabu. kenyataan G. Currie: “Hakikat bahawa terdapat hubungan rapat antara matematik dan logik, di satu pihak, dan bahasa, di sisi lain, telah menjadi jelas sejak dahulu lagi, dan kini fakta ini telah menjadi tumpuan perhatian dalam konseptualisasi yang lebih ketat...” ( N. W. Curry, Some Logical Aspects of Grammatical Structure, dalam Prosiding Simposium "Struktur Bahasa dan Aspek Matematiknya", Providence, 1961, hlm. 57).)

** (Sangat tepat pada masanya dalam hal ini adalah kenyataan P. Garvin (dibuat dalam ulasan buku oleh W. Bar-Hillel, Language and Information: Selected Essays on Their and Application, London, 1964): “Kebanyakan karya mengenai teori pemprosesan maklumat dan aplikasi untuk tujuannya, mesin pengkomputeran benar-benar naif dan, sudah pasti, tidak berguna seperti yang diingini." Menyentuh kedudukan negatif Bar-Hillel mengenai keberkesanan kaedah logik-matematik untuk pemprosesan automatik maklumat ucapan, P. Garvin percaya bahawa ia masih mengandungi unsur-unsur positif, kerana kedudukan ini "akan memaksa sekurang-kurangnya beberapa saintis untuk mengambil teori mereka dengan kurang serius" (majalah " Amerika Dokumentasi," New York," jld 16, No. 2, 1965, hlm.)

*** (W. Plath, Linguistik Matematik. Dalam buku: "Trend in European and American Linguistics 1930-1960", Antwerp, 1961, hlm. 22-2E.)

Agar, jika boleh, untuk mengelakkan bahaya yang ditunjukkan oleh Warren Platt, adalah perlu bukan sahaja untuk mempunyai percubaan empirikal semata-mata untuk menjawab soalan yang dirumuskan di atas, tetapi juga untuk berusaha untuk pemahaman teori umumnya. Malah, persoalan pengurangan bahasa semula jadi kepada satu atau lain model atau tafsiran logik-matematik adalah persoalan utama teori linguistik gunaan, keperluan untuk penciptaan yang dirasakan semakin mendesak. Apabila mempertimbangkan isu ini, pertama sekali, sifat fenomena yang membentuk subjek kajian, di satu pihak, logik dan matematik, dan di sisi lain, bahasa semula jadi, mesti dipertimbangkan, dan kemudian juga kemungkinan kaedah yang digunakan oleh setiap sains ini. Sudah dari kajian perbandingan perkara-perkara ini, adalah mungkin untuk membuat beberapa kesimpulan umum, yang mungkin berguna untuk semua orang yang, jika perlu, perlu menjalankan penyelidikan mereka di persimpangan sains yang disenaraikan.

Pada tahap tertentu, matlamat ini disampaikan oleh simposium "Struktur Bahasa dan Aspek Matematiknya" yang diadakan oleh Persatuan Matematik Amerika *. Tetapi kesemuanya, seperti yang jelas dari tajuk simposium, hanya menyentuh aspek individu dan dalam beberapa kes yang sangat spesifik dari masalah yang menarik minat kita. Walaupun digabungkan, mereka mewujudkan prasyarat yang cukup munasabah untuk menjawab soalan yang sedang kami pertimbangkan, mereka masih kekurangan rumusan yang jelas dan jelas tentang kesimpulan yang diperlukan. Dalam banyak cara, peserta simposium meneruskan barisan percubaan empirikal untuk menyelesaikan isu itu, tanpa secara intrusif menawarkan eksperimen mereka kepada perhatian ahli bahasa dengan harapan mereka sendiri akan mengetahui sejauh mana hipotesis dan penyelesaian yang mereka bentangkan sesuai untuk tujuan mereka. .

* ("Struktur Bahasa dan Aspek Matematiknya". Proc. daripada Soc. daripada Appl. Matematik., 12. Providence, 1961.)

Oleh itu, lebih sesuai sebagai titik permulaan untuk memahami hasil kerja ahli bahasa, ahli logik dan ahli matematik dalam konteks yang kita teliti ialah dua artikel yang diterbitkan dalam koleksi “Bahasa Asli dan Mesin Pengkomputeran” *: M. Maron “The Logician's Sudut Pandangan tentang Pemprosesan Data Linguistik” dan P Garvin dan V. Karash "Linguistik, pemprosesan data linguistik dan matematik." Mereka menggariskan kemungkinan kerja logik dan matematik, hubungannya dengan sains empirikal, kaedah menyelesaikan masalah, dll. Mari kita beralih kepada pertimbangan masalah yang dibangkitkan oleh artikel ini dari sudut pandangan soalan yang telah dirumuskan di atas.

* ("Bahasa Asli dan Komputer", ed. bv P. Garvin, New York, 1963.)

2

Nampaknya kita sudah mempunyai jawapan yang tidak jelas untuk soalan kita. Sebagai contoh, N.D. Andreev dan JI. R. Zinder menulis: "Perwakilan (model) matematik bahasa sama sekali tidak sama dengan bahasa itu sendiri" *. Mereka juga diikuti oleh pengarang buku "Models of Language" I. I. Revzin, yang menunjukkan bahawa sebagai hasil pemodelan hanya "hampiran yang lebih kurang dekat dengan data realiti konkrit" ** boleh muncul. Walau bagaimanapun, untuk mengatakan ini bermakna tidak mengatakan apa-apa, kerana ia masih tidak didedahkan mengapa ini berlaku dan sama ada seseorang masih perlu beralih kepada kaedah pemodelan matematik dan logik, dan jika ya, sejauh mana dan untuk tujuan apa.

* (N. D. Andreev, L. P. Zinder, Masalah asas linguistik gunaan, "Isu linguistik"., 1959, No. 4, hlm.)

** (I. I. Revzin, Models of Language, M., 1962, hlm 8. Dengan cara ini, ungkapan "hampiran dekat" adalah tautologi langsung: penghampiran dekat.)

Untuk menyelesaikan semua persoalan ini, titik permulaan adalah untuk menentukan terlebih dahulu sains - induktif atau deduktif - termasuk linguistik, logik dan matematik. Bagi dua sains terakhir, kedudukannya jelas - sudah pasti mereka tergolong dalam sains deduktif, yang bergantung pada inferens dalam metodologi penyelidikan mereka. Linguistik secara tradisinya ditakrifkan sebagai sains empirikal, yang menunjukkan bahawa yang utama tujuan saintifik adalah huraian fakta. Ini bermakna, nampaknya, linguistik harus diklasifikasikan dalam bidang sains induktif. Ini juga bermakna, cuba menggunakan radas formal logik dan matematik dalam linguistik, mereka cuba menggunakan kaedah penyelidikan deduktif dalam sains induktif.

Namun, sejak beberapa tahun kebelakangan ini, sifat induktif ilmu bahasa - linguistik - mula dipersoalkan secara tidak langsung atau langsung. Ini dilakukan dalam bentuk yang paling dramatik oleh L. Elmslev. Benar, istilah yang digunakannya sangat mengelirukan dan, khususnya, dicirikan oleh pemahaman yang pelik dan sangat peribadi tentang istilah "potongan" dan "induksi" (sebenarnya, dia menafsirkannya sepenuhnya dengan cara yang bertentangan). Walau bagaimanapun, asas-asas teori linguistiknya yang dikemukakannya tidak menimbulkan keraguan tentang intipati metodologinya. Oleh itu, beliau menganggap ia boleh diterima untuk menggunakan mana-mana definisi operasi awal, yang tipikal untuk sains deduktif. Dan dia sendiri mencirikan teorinya dalam istilah berikut: “1 Teori itu sendiri adalah bebas daripada pengalaman, sama ada mengenai kemungkinan penggunaannya atau tentang hubungannya dengan data eksperimen sertakan postulat kewujudan Ia adalah apa yang dipanggil sistem deduktif semata-mata dalam erti kata bahawa ia sahaja boleh digunakan untuk mengira kemungkinan yang timbul daripada premisnya 2 Sebaliknya, teori merangkumi beberapa premis yang diketahui daripada pengalaman sebelumnya mereka memenuhi syarat permohonan kepada beberapa data eksperimen ini adalah yang paling umum dan oleh itu boleh memenuhi syarat permohonan untuk. sebilangan besar data percubaan"*.

* ("Prolegomena kepada Teori Bahasa". Sab. "Baharu dalam Linguistik", jld. 1, M., 1960, hlm. 274-275.)

Seperti yang jelas daripada kenyataan ini, L. Elmslev berusaha untuk mempromosikan idea sifat dua metodologi objek penyelidikan linguistik, dengan penekanan utama pada ciri deduktif mereka. Dia juga harus dikreditkan dengan kaedah yang agak samar-samar itu ("di satu pihak... tetapi di sisi lain..."), yang secara amnya menjadi ciri untuk mempertimbangkan isu ini (dan yang memungkinkan untuk beralih ke mana-mana arah. ). Idea tentang dualiti metodologi linguistik baru-baru ini menerima peredaran yang meluas dan bahkan disampaikan asas teori untuk merumuskan prinsip dan hala tuju terkini dalam ilmu bahasa - linguistik universal (universalisme). “Memorandum mengenai Sejagat Linguistik” berkata dalam hal ini: “Kajian tentang universal linguistik membawa kepada keseluruhan siri generalisasi empirikal berkenaan tingkah laku linguistik - kedua-dua yang masih memerlukan eksperimen dan generalisasi ini mewakili bahan yang berpotensi untuk membina struktur deduktif undang-undang saintifik Walau bagaimanapun, , beberapa dan, mungkin, kebanyakannya masih mempunyai status generalisasi empirikal, yang, memandangkan keadaan semasa pengetahuan kita, adalah tidak mungkin untuk mengaitkan dengan generalisasi atau secara deduktif diperoleh daripada undang-undang yang lebih umum. kepentingan" *. J. Greenberg menyatakan dirinya dengan tidak kurang pasti dalam mukadimahnya kepada koleksi yang dikhaskan untuk universal linguistik. Polemik dengan kata-kata terkenal L. Bloomfield bahawa "satu-satunya generalisasi yang sah mengenai bahasa ialah generalisasi induktif," dia menulis: "Walau bagaimanapun, nampaknya diterima umum bahawa kaedah saintifik bukan sahaja induktif, tetapi juga generalisasi rumusan yang diperolehi oleh penyelidikan induktif membawa kepada hipotesis teori, di mana generalisasi selanjutnya boleh diperoleh melalui deduksi kemudiannya hendaklah tertakluk kepada ujian empirikal." **

* ("Memorandum Concerning Language Universals," Universals of Language, ed. oleh J. Greenberg, Cambridge, Mass., 1963, hlm. 262-263.)

** ("Universal Bahasa", hlm. IX.)

Hakikat bahawa sejarah linguistik bukan sahaja terdiri daripada pengumpulan fakta linguistik dan klasifikasinya, tetapi juga perubahan sudut pandangan pada bahasa itu sendiri, yang tidak dapat tidak membayangkan pendekatan yang berbeza terhadap fakta linguistik dan juga tafsiran teori yang berbeza mengenainya, memaksa beberapa ahli bahasa Soviet untuk membuat kesimpulan tentang dualiti metodologi sains mereka. S.K. Shaumyan lebih suka bercakap tentang kaedah hipotetik-deduktif dan menetapkan ciri-cirinya seperti berikut: “Kaedah hipotetik-deduktif ialah prosedur kitaran yang bermula dengan fakta dan berakhir dengan fakta.

  1. merekod fakta yang memerlukan penjelasan;
  2. mengemukakan hipotesis untuk menjelaskan fakta ini;
  3. terbitan daripada hipotesis ramalan tentang fakta yang terletak di luar bulatan fakta untuk menjelaskan hipotesis mana yang dikemukakan;
  4. menguji fakta yang diramalkan oleh hipotesis dan menentukan kebarangkalian hipotesis.

Kaedah hipotetik-deduktif pada asasnya berbeza daripada kaedah induktif yang digunakan dalam bidang pengetahuan seperti, sebagai contoh, botani deskriptif atau zoologi." , sebagai contoh, J. Greenberg bercakap tentang gabungan kaedah induktif dan deduktif, kemudian S.K. Shaumyan memanggil kaedahnya hypothetico-deductive: sebutan jelas tidak konsisten untuk kaedah yang "bermula dengan fakta dan berakhir dengan fakta."

* (S.K. Shaumyan, Masalah fonologi teori, M., 1962, ms 18-19. Mengenai kaedah hipotetik-deduktif, lihat juga artikel oleh V. S. Shvyrev "Beberapa persoalan analisis logik-metodologi hubungan antara teori dan peringkat empirikal pengetahuan saintifik" dalam koleksi "Masalah logik pengetahuan saintifik" (Moscow, 1964), ms 66-75 (bahagian ke-3 artikel).)

Persoalan di mana linguistik harus diklasifikasikan juga ditanya oleh I. I. Revzin. "Dengan sifatnya," dia menjawab soalan ini, "linguistik mesti pertama sekali menggunakan kaedah induktif ia menerangkan tindakan pertuturan khusus bahasa tertentu ...

Sebaliknya, kehadiran lakuan pertuturan yang tidak terhingga yang dikaji oleh ahli bahasa hampir tidak memungkinkan untuk merumuskan konsep asas sains bahasa melalui generalisasi secara induksi.

Ia berikutan bahawa ahli bahasa bukan sahaja memerlukan kaedah penyelidikan induktif, tetapi juga deduktif untuk mendapatkan sistem pengetahuan am yang membantu memahami data yang diperoleh daripada analisis bahasa tertentu...

Dalam bahagian deduktifnya, linguistik, nampaknya, boleh distrukturkan dengan cara yang sama seperti logik atau matematik distrukturkan, iaitu: bilangan minimum tertentu istilah primer, tidak ditentukan dikenal pasti, dan semua istilah lain ditakrifkan melalui yang utama. Pada masa yang sama, beberapa pernyataan utama tentang kaitan istilah ini antara satu sama lain (aksiom) mesti dirumuskan dengan jelas, dan semua pernyataan lain mesti dibuktikan, iaitu, dikurangkan kepada beberapa pernyataan lain" *.

* (I. I. Revzin, Models of language, M., 1962, ms 7-8.)

Di sini, kaedah deduksi, yang terkandung dalam logik dan matematik, bertindak hanya sebagai satu cara untuk memerintahkan "set lakuan ucapan" untuk tujuan mewujudkan "sistem konsep umum." Walau bagaimanapun, secara langsung bertentangan dengan tugas ini, terdapat pembentangan kaedah deduktif itu sendiri, disyorkan untuk digunakan dalam linguistik. Ia difikirkan sepenuhnya daripada kedua-dua perbuatan dan fakta, dan sebagai titik permulaan untuk membina sistem konsep linguistik umum, ia memerlukan satu set istilah utama yang tidak ditentukan dan, nampaknya, mutlak bersyarat, yang melaluinya semua istilah berikutnya ditakrifkan.

Percanggahan ini bukan kebetulan; ia terletak pada sifat sains yang sedang kita pertimbangkan. Nampaknya kesimpulan bahawa apabila mengkaji objek linguistik gabungan kaedah induktif dan deduktif adalah dibenarkan membuka pintu kepada penggunaan kaedah logik dan matematik dalam linguistik, dan pelaksanaan konkrit kesimpulan ini adalah penciptaan banyak logik dan matematik formal. model bahasa. Tetapi, seperti yang akan jelas daripada apa yang berikut, pendekatan yang dipermudahkan itu tidak dapat memberikan hasil yang memuaskan. Kita boleh bersetuju bahawa dalam penyelidikan linguistik adalah dibenarkan malah perlu untuk menggabungkan kaedah deduktif dan induktif. Pada akhirnya, seperti yang ditulis oleh V. Brøndal, "induksi tidak lebih daripada deduksi yang tersembunyi, dan di sebalik hubungan murni yang ditubuhkan antara fenomena yang diperhatikan, realiti, objek khusus sains tertentu, benar-benar tidak dapat dielakkan." Tetapi ini tidak bermakna bahawa radas formal logik dan matematik harus dipindahkan tanpa syarat dan mekanikal kepada linguistik tanpa sebarang pertimbangan tentang "objek khusus sains tertentu." Seperti yang dinyatakan oleh I.I. Revzin yang sama, "bukti yang diperoleh dengan cara deduktif, tidak kira betapa sempurnanya dari sudut pandangan logik, masih tidak mengatakan apa-apa tentang sifat bahasa sebenar yang diterangkan oleh model" **. Dan untuk menentukan keberkesanan model, beliau mengesyorkan beralih kepada amalan, yang diwakili oleh terjemahan mesin dan "aplikasi praktikal linguistik yang lain."

* (B. Brøndal, Linguistik struktur. Dipetik dari buku: V. A. Vegintsev, Sejarah linguistik pada abad ke-19 dan ke-20. dalam esei dan cabutan, bahagian II, M., 1965, ms 95.)

** (I. I. Revzin, Models of language, M., 1962, hlm 10.)

Dan amalan linguistik gunaan menunjukkan bahawa sekatan yang sangat ketat dikenakan terhadap penggunaan kaedah matematik dan logik dalam kajian fenomena bahasa.

3

Logik memberikan contoh penggunaan kaedah deduktif yang paling konsisten. Matematik sebahagian besarnya mengikut logik dalam hal ini, dan oleh itu ia boleh dipertimbangkan bersama.

Sudah tentu, kedua-dua logik dan matematik tidak mewakili sistem homogen berkenaan dengan kaedah dan tafsiran matlamat mereka. Jadi, sebagai contoh, berhubung dengan logik kita boleh bercakap tentang dialektik, formal, matematik dan, yang lebih penting, logik. dalam erti kata yang sempit, tentang objektif, semantik, fenomenologi, transendental, atau konstruktif, kombinatorial, polisemantik, modal, dsb. Walau bagaimanapun, perlu, kita perlu memikirkan semua bahagian tersebut dan bercakap hanya tentang yang paling garis besar umum, ciri logik dan matematik secara umum, dan terutamanya mengenai ciri-ciri yang paling jelas menunjukkan sifat deduktif kaedah sains ini.

Dengan mengambil kedudukan ini, kami tidak akan menggunakan logik induktif. Mari kita ambil perhatian bahawa kesimpulan dalam logik induktif tidak ditentukan oleh premis - oleh itu ia bukan tautologi. Kesimpulan dalam logik induktif secara langsung bergantung pada fakta, dan yang terakhir ini ditentukan oleh jumlah pengetahuan kita - oleh itu, ia diwujudkan berdasarkan kemungkinan. Kebarangkalian adalah alat metodologi utama logik induktif.

Logik deduktif diwakili sepenuhnya oleh logik formal dan matematik, yang mempunyai banyak persamaan. Logik deduktif ialah sains yang mengkaji pemikiran atau tindakan mental manusia dari sudut struktur atau bentuknya, mengabstraksi daripada kandungan khusus mereka. Oleh itu, logik deduktif berusaha untuk merumuskan undang-undang dan prinsip, yang pematuhannya adalah prasyarat untuk mencapai hasil yang benar dalam proses mendapatkan pengetahuan inferensi. Alat metodologi utama logik deduktif ialah implikasi. Dia menerima pengetahuan inferensi tanpa jalan langsung kepada pengalaman atau amalan, melalui hanya penggunaan undang-undang logik. Dalam proses deduksi, premis menentukan kesimpulan: jika premis itu benar, maka kesimpulannya mestilah benar. Oleh itu, kesimpulan telah pun terkandung dalam premis, dan tujuan deduksi adalah untuk membuktikan apa yang telah tersembunyi dalam premis. Berikutan daripada ini bahawa apa-apa kesimpulan yang diperoleh melalui deduksi adalah tautologi, iaitu, secara logiknya kosong, walaupun dari sudut pandangan lain, sebagai contoh, dalam kes penggunaan alat logik formal untuk tujuan sains lain, ia mungkin baru, tidak dijangka dan asli.

Situasi yang sama berlaku dalam matematik - kesahihan hujah di dalamnya bergantung sepenuhnya pada potongan. Lebih-lebih lagi, dalam matematik, sebagai peraturan, mana-mana sudut pandangan awal, sebarang pendekatan untuk menyelesaikan masalah boleh diterima - selagi ia memenuhi syarat potongan matematik. Matematik mempunyai satu set yang kaya dengan "pandangan awal" dan "pendekatan" yang boleh digunakan oleh penyelidik untuk menyelesaikan masalahnya. Masalah matematik sering diterjemahkan ke dalam bentuk setara yang berbeza, dan setiap satunya melibatkan penggunaan bidang teori matematik yang berbeza untuk menyelesaikan masalah. Oleh itu, ahli matematik mempunyai kebebasan yang hampir tidak terhad untuk memilih premis - dia memilih premis yang, dari sudut pandangannya, mengandungi kemungkinan yang paling menjanjikan untuk penyelesaian yang paling mudah, paling tidak remeh, elegan untuk masalah itu. Bakat dan pengalamannya ditunjukkan dengan tepat dalam pemilihan premis yang berjaya, mereka "mari kita anggap bahawa ..." atau "jika ... maka" yang dengannya karya matematik penuh. Seperti dalam logik, premis matematik - aksiom atau postulat - menentukan takrifan unit yang belum ditentukan.

Kebebasan untuk memilih premis dalam matematik secara langsung bergantung pada fakta bahawa ia beroperasi dengan unit tidak ketara, atau objek - perhatiannya ditujukan kepada hubungan antara mereka. Objek matematik berfungsi sebagai simbol yang menyatakan struktur hubungan tulen. Oleh itu, sistem matematik boleh dianggap sebagai satu set hubungan formal yang wujud hanya berdasarkan pernyataan hubungan ini. Sudah tentu, khususnya, untuk tujuan yang digunakan, penyata perhubungan mungkin bertujuan untuk merangkumi surat-menyurat dengan realiti luaran, tetapi ini tidak sama sekali menjejaskan kenyataan perhubungan itu sendiri - sebaliknya, sebaliknya. Ahli matematik tidak menyiasat "kebenaran" aksiom mereka, walaupun mereka menuntut konsistensi bersama antara mereka. Penyelidikan dalam sistem matematik ialah kajian dan penubuhan perkaitan yang memungkinkan untuk membuktikan bahawa fakta teori A mengandaikan fakta teori B. Akibatnya, persoalan utama dalam matematik bukanlah "apa itu A dan B?", tetapi “adakah A mengandaikan (atau syarat) B ?".

Keadaan dalam linguistik sama sekali berbeza. Dia tertumpu terutamanya pada soalan pertama ini, dan ini tidak memberinya peluang untuk melepaskan diri daripada realiti; ia, oleh itu, beroperasi bukan dengan abstrak, tetapi dengan unit konkrit, walaupun dalam beberapa kes ia berusaha untuk mencipta objek abstrak, seperti konsep fonem atau morfem. Keadaan ini adalah tipikal bukan sahaja untuk linguistik tradisional, tetapi juga untuk sama-sama juga merupakan ciri arah terbaharunya, bersatu di bawah panji strukturalisme. Beberapa kenyataan telah pun disebut di atas yang, semasa cuba menggunakan bukan sahaja kaedah induktif tetapi juga kaedah deduktif (atau kaedah matematik dan logik) dalam sains bahasa, masih belum dapat memintas keperluan untuk menangani fakta linguistik yang sebenar. Sebagai tambahan kepada mereka, satu lagi boleh disebut, yang membawa kejelasan lengkap kepada isu yang sedang dipertimbangkan: "Analisis linguistik," menulis dalam kata sambungan P. Garvin, pada asasnya adalah proses induktif dalam erti kata ia berusaha untuk mewujudkan senarai unsur atau set pernyataan berdasarkan rangsangan linguistik informan atau daripada kajian teks. Ia berdasarkan andaian bahawa dalam kedua-dua sumber maklumat ini adalah mungkin untuk mengenali unsur-unsur yang kerap berlaku. pelbagai jenis dan susunan kerumitan. Klasifikasi jenis ini dan pernyataan syarat pengedaran mereka, yang diperoleh sebagai hasil analisis, membentuk penerangan induktif bahasa" *.

* (P. Garvin, Kajian Kaedah Induktif dalam Sintaks, "Word", vol. 18 (1962), hlm. 107,)

Dalam linguistik, sudah tentu, seseorang juga boleh menggunakan kaedah premis, berdasarkan objek, fakta atau unit bahasa tertentu kemudiannya ditentukan. Tetapi di sini kita berhadapan dengan dua ciri yang membuat pelarasan ketara terhadap penggunaan kaedah ini. Tidak seperti logik dan matematik, dalam kes ini "kebenaran" definisi yang diperoleh dengan cara ini akan dicari, iaitu, korespondensi mereka dengan data pengalaman. Oleh itu, saling kebergantungan premis dan pengetahuan inferensi ditubuhkan: premis menentukan kesimpulan (takrif objek linguistik tertentu dari segi premis), tetapi jika kesimpulan tidak sesuai dengan data pengalaman, maka terdapat perlu menyesuaikan premis itu sendiri. Tetapi pelarasan premis semacam ini tidak ada kaitan dengan kebolehterjemahan ke dalam bentuk yang setara, yang, seperti yang ditunjukkan di atas, dibenarkan dalam matematik, kerana ia tidak ditentukan oleh pertimbangan formal, tetapi oleh data eksperimen. Kesemua di atas memberi alasan untuk membuat kesimpulan bahawa konsep premis dan kebebasan memilihnya mempunyai kekhususan dalam analisis linguistik yang tidak boleh diabaikan apabila menggunakan kaedah deduktif dalam linguistik.

Ahli bahasa tidak boleh menggunakan kaedah "jika" atau "katakan" sebebas ahli matematik. Kebebasan prasyarat mereka sangat terhad. Sejarah sains bahasa mengetahui banyak perubahan dalam "sudut pandang," atau, dengan kata lain, premis awal yang didorong oleh penemuan fakta baru, penyebaran idea saintifik umum kepada linguistik, atau bahkan pembentukan asal. teori. Tetapi bagi ahli bahasa, dalam semua kes sedemikian, perubahan dalam "jika", atau premis awal, adalah perubahan dalam keseluruhan konsep saintifik. Oleh itu, ahli bahasa tidak mengatakan "jika," tetapi mendalilkan pemahamannya tentang premis, iaitu, sebenarnya, pemahaman tentang subjek penyelidikannya, dan, berdasarkan pemahaman ini, memberikan definisi unit bahasa tertentu, menyemak "kebenaran" definisi ini dengan data pengalaman. Keadaan yang terakhir, disebabkan oleh saling kebergantungan premis dan kesimpulan dalam linguistik, berfungsi sebagai cara untuk mengesahkan dan mengesahkan premis itu sendiri, yang berdiri pada permulaan bentuk deduktif analisis linguistik. Oleh itu, jika kita beralih kepada contoh khusus, pada masa lalu bahasa ditafsirkan sebagai organisma semula jadi (oleh Schleicher), sebagai aktiviti psikofisiologi individu (oleh ahli neogrammarian), dll. Amalan penyelidikan berdasarkan konsep ini telah menunjukkan kekurangannya. Pada masa kini, premis permulaan analisis linguistik ialah postulat bahawa bahasa ialah sistem tanda *. Ia tertakluk kepada ujian pengalaman dan amalan yang sama seperti mana-mana konsep lain dalam sains bahasa.

* (Lihat: Paul Garvin, Model Definitif Bahasa. Dalam: Natural Language and the Computer, ed. oleh P. L. Garvin, New York, 1964.)

Pertimbangan awal dan paling umum ini menunjukkan bahawa kaedah deduktif sama sekali tidak dikontraindikasikan dalam linguistik, tetapi penggunaannya memerlukan pematuhan dengan syarat tertentu. Keadaan khusus inilah yang mengenakan sekatan tertentu ke atas pemindahan mekanikal kaedah logik dan matematik ke dalam bidang linguistik. Walau bagaimanapun, jika kita mengehadkan diri kepada kenyataan umum sedemikian, banyak yang masih tidak jelas. Itulah sebabnya adalah perlu untuk mendalami isu yang sedang kita periksa dan, untuk mengukuhkan kesimpulan yang berpotensi, beralih kepada amalan linguistik gunaan, di mana kesahihan premis dan korespondensi kesimpulan yang dibuat berdasarkan mereka kepada data eksperimen adalah paling ditunjukkan dengan jelas.

4

Hubungan antara bahasa dan logik adalah sangat pelik. Wakil sains empirikal, yang termasuk linguistik, mengkaji objek atau fenomena tertentu untuk menerangkan atau menjelaskannya. Mereka merumuskan hasil yang mereka perolehi dalam bahasa yang dipanggil bahasa objek. Ahli logik menggunakan bukti, kesimpulan, penghakiman, dsb., tetapi ia hanya tersedia untuknya dalam bentuk linguistik. Oleh itu, ternyata ahli logik adalah satu langkah lebih jauh dari dunia nyata daripada wakil sains empirikal. Analisisnya tidak ditujukan secara langsung objek sebenar, dikaji oleh sains empirikal, dan dalam bahasa mereka *. Dengan kata lain, dia meneliti bahasa dan merumuskan hasil yang diperoleh dalam bahasa yang dipanggil metalanguage.

* ("Analisis logik pengetahuan saintifik," tulis P. V. Tavanets dan V. S. Shvyrev dalam hal ini, "adalah pertama sekali dan secara langsung analisis bahasa di mana pengetahuan ini dinyatakan." Lihat artikel "Logik Pengetahuan Saintifik" dalam koleksi. "Masalah logik pengetahuan saintifik", M., 1964, ms 161)

Dari sudut logik, unit asas bahasa bukanlah tanda atau objek yang dilambangkannya, tetapi ayat, kerana hanya di dalamnya proses logik boleh berlaku. Itulah sebabnya hanya ayat boleh benar atau salah. Tetapi perkataan itu sendiri tidak boleh mempunyai sifat-sifat ini. Tetapi sebelum kita dapat menentukan sama ada ayat itu benar atau tidak, kita perlu menyatakan bahawa ia mempunyai makna.

Konsep kebenaran dan makna tergolong dalam bidang semantik. Melalui hubungan ini kebenaran atau kepalsuan ayat ditentukan: jika ayat itu menerangkan objek dengan betul, ia adalah benar, dan jika ia salah, ia tidak. Tetapi ungkapan linguistik boleh memasuki hubungan selain daripada yang wujud di antara objek yang mereka nyatakan. Di samping itu, ayat boleh memasuki hubungan dengan ayat lain. Tugas ahli logik adalah untuk mengetahui sifat hubungan antara ungkapan linguistik dan ayat dan untuk mewujudkan peraturan untuk menentukan sama ada prosedur yang ditetapkan dalam kes tertentu diikuti atau tidak. Dalam menyelesaikan soalan terakhir, ahli logik tidak beralih kepada objek yang diterangkan oleh ayat. Dia berminat bentuk linguistik, dan bukan kandungannya, yang, tentu saja, tidak menghalang tafsirannya yang bermakna, mengakibatkan kemunculan bahasa rasmi. Bahasa formal boleh diwakili sebagai sistem abstrak, seperti kalkulus predikat.

Jadi, seorang ahli logik, bergantung kepada objektif kajian, boleh bekerja pada dua peringkat - sintaksis (sintaksis logik) dan semantik (semantik logik). Mari kita pertimbangkan dahulu penggunaan tahap pertama ini kepada bahasa semula jadi.

Walaupun ahli logik yang terlibat dalam kajian bentuk linguistik dan hubungan yang wujud di antara mereka boleh kekal dalam tahap sintaksis, beroperasi dalam istilah bukan substantif, ahli bahasa tidak boleh melakukan ini. Semua peringkat bahasa semula jadi (dengan kemungkinan pengecualian fonemik) adalah bermakna dan oleh itu tidak dapat difikirkan di luar semantik. Lebih-lebih lagi, bahasa semula jadi tidak wujud di luar pragmatik, yang tidak dapat dipisahkan dengan mudah kerana alasan mudah bahawa dalam lakuan pertuturan ia sentiasa ditranspolasi ke dalam semantik. Oleh itu, bahasa semula jadi sentiasa menjadi tafsiran, dan, lebih-lebih lagi, dua peringkat, kerana ia berkaitan dengan kedua-dua semantik dan pragmatik *. Dan tafsiran ini belum lagi sesuai dengan sebarang pemformalkan.

* (Rabu. Kenyataan Niels Bohr mengenai bahasa matematik, di mana "ketidaksamaan definisi yang diperlukan untuk penerangan objektif dicapai dengan menggunakan simbol matematik dengan tepat kerana dengan cara ini rujukan kepada subjek sedar dielakkan, yang meresap dalam bahasa sehari-hari" (Neales Bohr, Atomic Physics dan Kognisi Manusia, M. , 1961, hlm 96).)

Sekarang mari kita beralih ke tahap kedua, apabila tafsiran dikaitkan dengan kalkulus melalui peraturan semantik. Dan dalam hal ini kita akan menerima pendidikan yang sama sekali tidak setanding dengan bahasa semula jadi. Benar, di sini kita berurusan dengan istilah yang bermakna, tetapi dalam bahasa logik dan semula jadi mereka membina hubungan mereka dengan "kebenaran" atas alasan yang sama sekali berbeza. Seperti yang ditulis oleh A. Tarski, "benar," "dalam mana-mana kes dalam tafsiran klasiknya," adalah sedemikian rupa sehingga "bertepatan dengan realiti" *. Tetapi kriteria "kebenaran" ini sebenarnya hanya terpakai kepada bahasa semula jadi, yang sentiasa berorientasikan realiti. Keadaannya berbeza dalam semantik logik. Analisis semantik hanya bergantung pada tafsiran logik sistem dan melibatkan penubuhan peraturan tertentu yang merumuskan syarat kebenaran. Dia menetapkan akibat kepada peraturan ini, tanpa menjawab soalan sejauh mana terdapat "kebetulan dengan realiti" di sini. Di samping itu, tumpuan kepada realiti dilakukan dalam bahasa semula jadi tidak secara langsung, tetapi melalui seseorang, yang sekali lagi menjadikannya perlu untuk beralih ke tahap ketiga - yang pragmatik. "Peralihan ke tahap semantik," kata P. V. Tavanets dan V. S. Shvyrev, "bukan dengan sendirinya kembali kepada bahasa yang hidup dalam kekonkretannya, seperti yang mungkin kelihatan pada pandangan pertama, disebabkan oleh fakta bahawa fungsi semantik bahasa nampaknya. kepada intipati bahasa sebagai "realiti serta-merta pemikiran." Malah, skema asal semantik "bahasa - realiti" belum memberikan gambaran konkrit bahasa sebagai realiti segera pemikiran atas alasan mudah bahawa bahasa disambungkan dengan realiti bukan dengan sendirinya dalam beberapa cara mistik, tetapi melalui seseorang, melalui tindakannya, tingkah lakunya Oleh itu, secara tegasnya, idea khusus bahasa sebagai pembawa pemikiran hanya boleh dicapai pada tahap analisis pragmatiknya. mengikut skema "bahasa - tindakan manusia dengan bahasa dan berdasarkan bahasa - realiti" **.

* (A. Tarski, Grundlegung der Wissenschaftlichen Semantik. "Actes du Congres International de Philosophie Scientique", 1936.)

* (Lihat artikel "Logik Pengetahuan Saintifik" dalam koleksi. "Masalah logik pengetahuan saintifik" (Moscow, 1964, hlm. 16).)

Tetapi bukan itu sahaja. Mengenai isu yang sedang dipertimbangkan, V. M. Glushkov menulis: “Bahasa manusia yang hidup boleh dianggap sebagai bahasa formal hanya selepas sistem peraturan yang ketat telah dirumuskan yang memungkinkan untuk membezakan ungkapan yang boleh diterima dalam bahasa itu daripada semua ungkapan lain, iaitu. , ayat yang bermakna daripada yang tidak bermakna.” " * . Menjelaskan kesukaran yang timbul apabila memformalkan bahasa semula jadi, beliau seterusnya menegaskan bahawa "tidak ada bahasa formal tetap yang boleh mencukupi untuk bahasa manusia yang hidup, kerana yang kedua, tidak seperti yang pertama, sentiasa berkembang dan bertambah baik bahasa manusia yang hidup hanyalah lebih kurang berjaya ialah pelakon segeranya, yang kehilangan persamaannya dengan yang asal apabila bahasa yang terakhir berkembang" ** . Jika semuanya berlaku hanya ini, maka ia tidak akan menjadi begitu buruk. Dalam linguistik gunaan, mereka memikirkan detik-detik perkembangan bahasa, berusaha untuk menganggapnya sebagai sistem yang benar-benar stabil, namun mereka masih gagal mencapai pemformalkan bahasa semula jadi. Ini berlaku atas sebab yang sangat mudah. Sistem formal dan bahasa semula jadi mendasarkan keberkesanannya pada kualiti bertentangan kutub. Mana-mana sistem formal sentiasa sama dengan dirinya sendiri. Kualiti inilah yang membolehkannya melaksanakan fungsinya dalam semua kes khusus penggunaannya. Dan bahasa semula jadi - dari segi kandungannya, semantiknya, atau, seperti yang biasa dikatakan dalam kes ini, dalam istilah bermaklumat - tidak pernah sama dengan dirinya sendiri. Keupayaan inilah yang memungkinkan untuk berfungsi dalam semua kes khusus penggunaannya. Walaupun kekal dalam bahasa yang sama, ia sentiasa berbeza dalam situasi yang berbeza. Pada masa yang sama, dia tidak mempunyai peraturan eksplisit mahupun formatif, mahupun peraturan "kebenaran", mahupun peraturan transformasi untuk menentukan makna berpotensi atau warna makna yang akan diterima oleh perkataan tertentu dalam situasi tertentu. Lebih-lebih lagi, hampir mana-mana perkataan dalam bahasa semula jadi boleh memperoleh makna yang tidak ditetapkan oleh mana-mana bahasa - ia boleh, setelah timbul, menjadi tetap dalam bahasa, tetapi dengan kejayaan yang sama, seperti cahaya yang melarikan diri, menyala, tersesat dalam "ruang" linguistik dan keluar. Dan dengan semua kualiti ini, bahasa semula jadi ternyata menjadi alat yang luar biasa sempurna yang membolehkan kita mencapai pemahaman bersama yang lengkap mengenai perkara yang paling konsep yang kompleks, dan dalam apa jua keadaan. Kenapa ini terjadi?

* (V. M. Glushkov, Pemikiran dan sibernetik, "Soalan Falsafah", 1963, No. 1, ms 37-38.)

** (V. M. Glushkov, Pemikiran dan sibernetik, "Soalan Falsafah", 1963, No. 1, hlm.)

Nampaknya, jawapan kepada soalan ini harus dicari sebahagiannya dalam satu pemikiran pengasas semiotik, Charles Peirce, yang secara gigih dia ulangi dalam banyak karyanya. Ia boleh ditafsirkan dengan cara ini. Dalam linguistik moden, bahasa biasanya ditakrifkan sebagai sistem tanda. Ini adalah premis permulaan untuk semua analisis linguistik. Jika demikian, maka bahasa bukan sekadar sistem tanda, tetapi sistem saling mentafsir tanda yang wujud dalam bahasa sejauh mana ia ditafsirkan dalam tanda lain. C. Peirce merumuskan ini seperti berikut: "Tiada tanda yang boleh berfungsi sebagai tanda melainkan ia ditafsirkan dalam tanda lain Oleh itu, ia sangat penting untuk tanda yang mempengaruhi tanda lain" *. Dan di tempat lain: "Seluruh tujuan tanda ialah ia akan ditafsirkan dalam tanda lain" **. Dan mungkin yang paling penting: "Sesuatu tanda bukanlah tanda melainkan ia mengubah dirinya menjadi tanda lain di mana ia menerima perkembangan yang lebih lengkap" ***.

* (Ch. Peirce, Kertas Terkumpul, Cambridge, Mass., jld. 8, §. 225.)

** (Di sana e, §. 191.)

*** (Ch. Peirce, Kertas Terkumpul, Cambridge, Mass., jld. 5, § 594.)

Akibatnya, bahasa semula jadi adalah sistem tanda yang, melalui tafsiran bersama, dapat bertindak balas kepada semua keperluan manusia dalam ungkapan semantik. Tetapi di sini satu kaveat penting diperlukan. Lagipun, semua keperluan jenis ini ditentukan oleh sikap seseorang terhadap fenomena dunia luar dan persekitaran sosial di mana hidupnya berlaku. Disebabkan oleh keadaan ini, semantik transformasi, jika mungkin untuk menciptanya, tidak boleh bergantung hanya pada peraturan tafsiran bersama tanda dan tidak boleh tertutup dan bersifat terbatas. Ia ternyata merupakan terbitan daripada sejumlah besar kuantiti yang sangat menentang pemformalan *.

* (P. Jakobson menyatakan dalam hal ini: “Kita boleh membina semantik linguistik semata-mata jika kita menerima pendirian Peirce bahawa ciri penting setiap tanda linguistik ialah ia boleh diterjemahkan oleh yang lain. tanda bahasa, tanda yang lebih maju, lebih eksplisit atau, sebaliknya, lebih elips daripada sistem bahasa yang sama atau yang lain. Terima kasih kepada kebolehterjemahan inilah invarian semantik yang kita cari dalam penanda didedahkan. Oleh itu, kita mendapat peluang untuk menyelesaikan masalah semantik bahasa juga dengan bantuan analisis pengedaran" (ucapan di 1st International Symposium "Sign in the Language System", Erfurt, GDR, 1959). Dipetik dari buku: V. A. Vegintsev, Sejarah Linguistik XIX - XX abad dalam esei dan ekstrak, bahagian 2, M., 1965, hlm 398.

Sehubungan dengan perkara di atas, adalah penting untuk mempertimbangkan ciri-ciri prosedur untuk menyelesaikan masalah dan konsep penentuan dalam logik dan matematik, di satu pihak, dan dalam linguistik, di pihak yang lain.

Sebelum sesuatu masalah boleh diselesaikan dalam matematik, ia mesti dirumuskan dalam istilah yang tepat - rumusan ini adalah prasyarat untuk penyelesaian masalah yang berjaya. Pada masa yang sama, seperti yang telah ditunjukkan, seorang ahli matematik boleh secara bebas mengubah rumusan masalah yang diberikan kepada versi yang setara - matematik mempunyai cara yang sesuai untuk ini. Sudah pada peringkat awal metodologi penyelidikan ini, linguistik berbeza dengan ketara daripada matematik. Semasa merumuskan masalahnya, ahli bahasa mempunyai sejumlah data empirikal yang diperhatikan, yang dia tidak boleh selalu memberikan rumusan yang tepat, tetapi, bagaimanapun, dia mesti, mahu tidak mahu, menjadi asas penyelidikannya, sudah dalam proses ini. penyelidikan itu sendiri. Untuk tidak pergi terlalu jauh untuk contoh, kita boleh merujuk kepada makna linguistik, yang menjadi asas kepada semua kerja dalam bidang pemprosesan automatik maklumat ucapan, tetapi pada masa yang sama ditakrifkan dengan sangat samar-samar dan bertentangan. Keadaan inilah yang memaksa penyelidik dalam bidang ini untuk sentiasa mengubah strategi mereka.

Tetapi kini penyelidikan telah bermula dan beberapa keputusan telah dicapai. Apakah maksud ini berkaitan dengan logik dan matematik dan berkaitan dengan linguistik? Logik, seperti yang disebutkan di atas, memungkinkan untuk mengemukakan kesimpulan secara eksplisit yang tersirat dalam premis, tetapi ia tidak mempunyai peraturan, penggunaannya dapat menjamin bahawa penyelesaian yang diinginkan akan diperoleh, kerana ia bukan cara untuk mencapai yang baru. kesimpulan, tetapi hanya teknik menentukan ketepatannya. Dia bukan kunci ajaib kepada semua misteri. Agak jelas bahawa jika logik mempunyai peraturan sedemikian, maka tidak akan ada masalah yang tidak dapat diselesaikan. Ia akan mencukupi untuk menggunakan set peraturan logik tertentu, dan kami secara automatik akan menerima jawapan siap sedia untuk sebarang soalan yang menyeksa kami. Berdasarkan perkara di atas, konsep menyelesaikan masalah atau tugasan juga memperoleh makna tertentu.

Dalam logik dan matematik semua orang keputusan akhir diiktiraf sebagai benar jika tiada peraturan rasmi dilanggar semasa proses pembuktian. Oleh kerana cara pembuktian yang berbeza mungkin, kewujudan penyelesaian yang berbeza adalah dibenarkan. Tetapi kesemuanya boleh tertakluk kepada pengesahan dari sudut pandangan keperluan logik atau matematik. Keadaannya berbeza dalam linguistik. Ia tidak mempunyai radas yang boleh mengesahkan atau membuktikan ketepatan kesimpulan yang diperolehi. Sehubungan itu, kebenaran penyelesaian yang dicapai ditentukan - ia ditubuhkan bukan oleh peraturan formal, tetapi oleh korespondensinya dengan data pengalaman. Di bawah keadaan ini, secara teorinya seseorang akan mengharapkan penyelesaian akhir tunggal. Walau bagaimanapun, dalam amalan, seperti yang dibuktikan oleh definisi linguistik yang bercanggah walaupun kategori asas bahasa, ini tidak berlaku. Subjektiviti tertentu penilaian sentiasa ada dalam kes ini, dan ia pada tahap tertentu ditentukan oleh jumlah fakta (dan, sudah tentu, sifatnya) yang boleh digunakan oleh penyelidik. Ia berikutan bahawa "kebenaran" penyelesaian dalam linguistik sentiasa diberikan dalam beberapa anggaran dan tidak bersifat penentu, tetapi kemungkinan.

Di bawah keadaan ini, adalah sangat penting untuk menundukkan ketepatan definisi dan tafsiran linguistik kepada pengesahan berdasarkan kriteria objektif. Kemungkinan pengesahan sedemikian disediakan oleh kawasan luas linguistik gunaan, di mana bahasa semula jadi ditentang oleh mesin, mewakili dalam pembangkang ini kepentingan logik dan matematik.

5

Untuk menyelesaikan masalah praktikal linguistik gunaan, komputer digital digunakan. Ia mampu melihat, menyimpan, menghantar, mengumpul semula dan mengeluarkan maklumat. Ia mentafsir dan melaksanakan satu set arahan (program arahan), dan juga mengubah suainya semasa pelaksanaan tugas. Dia boleh membuat keputusan sangat masalah yang kompleks, tetapi pada masa yang sama, keseluruhan proses peralihan daripada tugas kepada penyelesaian mesti diterangkan secara komprehensif dan konsisten dari segi urutan operasi asas asas. Maklumat dimasukkan ke dalam mesin menggunakan kod dua digit (perduaan), atau bahasa. Mesin beroperasi dengan perkataan yang dikodkan dengan cara ini, sepadan dengan sambungan logik asas atau fungsi kalkulus proposisi atau predikat. Mesin boleh menyelesaikan masalah matematik yang kompleks dengan tepat kerana operasi matematik yang kompleks boleh dikurangkan kepada urutan operasi aritmetik, dan ini seterusnya, kepada operasi logik. Oleh itu, komputer digital boleh dianggap sebagai mesin logik.

Oleh itu, tidak kira betapa kompleksnya masalah itu, mesin menyelesaikannya menggunakan urutan operasi asas, yang programnya mesti dirumuskan dengan jelas (secara konsisten), tepat, terperinci dan menyeluruh. Dalam erti kata lain, ia tidak boleh melampaui had yang ditetapkan oleh kalkulus proposisi, dan apabila kita bertanya sama ada mesin boleh mengatasi pemprosesan maklumat yang terkandung dalam bahasa semula jadi, pertama sekali kita perlu mengetahui sejauh mana kalkulus proposisi adalah model yang mencukupi untuk bahasa semula jadi.

Memandangkan spesifikasi komputer digital yang diterangkan di atas, perkara pertama yang perlu dilakukan untuk mesin "memahami" tugas dan mula memproses maklumat pertuturan mengikut tugas ini adalah untuk merumuskan semula maklumat yang terkandung dalam bahasa semula jadi ke dalam bahasa logik. Oleh itu, perkara ini adalah mengenai menterjemah bahasa semula jadi ke dalam bahasa kalkulus cadangan logik. Pada masa yang sama, seperti yang ditunjukkan oleh Bar-Hillel *, seseorang itu perlu menghadapi kesukaran sedemikian yang menggambarkan prospek pemprosesan automatik dalam cahaya yang sangat suram melainkan keseluruhan arah pencarian untuk penyelesaian kepada masalah ini diubah. Sekurang-kurangnya, kita perlu mengambil kira halangan berikut, untuk mengatasi yang kita belum mempunyai cara yang diperlukan.

* (Y. Bar-Hillel, Satu Demonstrasi Ketidakbolehlaksanaan Terjemahan Berkualiti Tinggi Automatik Sepenuhnya, "Kemajuan dalam Komputer:", jld. 1, New York, 1960, hlm. 158-163.)

A. Kalkulus logik penyataan terlalu lemah untuk tidak mungkin, walaupun dengan anggaran yang jauh, untuk merumuskan semula bahasa semula jadi, yang sangat kompleks dalam struktur semantiknya, mempunyai sejumlah besar unsur berlebihan dan - yang paling penting - adalah sering dicirikan oleh kekaburan dan ketidakpastian dalam ungkapan "maksud" yang tidak ada logik dua nilai yang mampu mengatasi penciptaan dua tiruan bahasa semula jadi *. Benar, logik, seperti yang dinyatakan, hanya berkaitan dengan bentuk linguistik. Tetapi kerana kita bercakap tentang pemprosesan maklumat automatik, adalah perlu untuk dapat membezakan antara maklumat semantik, dan jika ini tidak dapat dicapai menggunakan cara logik yang kita gunakan, maka bagaimana kita boleh memperoleh keyakinan bahawa terjemahan bahasa semula jadi kita ke dalam logik betul ke?

* (Artikel Ch. Hockett "Tatabahasa untuk Pendengar" memberikan banyak contoh kerumitan jenis ini dalam pemahaman "semula jadi" ayat, yang diselesaikan dengan langkah-langkah analisis yang seterusnya dan meluas (Ch, Hockett, Tatabahasa untuk Pendengar, "Struktur Bahasa dan Aspek Matematiknya" , Providence, 1961, ms 220-236).)

B. Mesin tidak boleh mengambil kira apa yang Bar-Hillel panggil sebagai "latar belakang umum maklumat", yang sebenarnya kekal di luar batasan bahasa semula jadi dan oleh itu tidak boleh diterjemahkan ke dalam bahasa logik. Dalam kes ini, ahli bahasa bercakap tentang kerangka rujukan, yang, tanpa disedari oleh kami, tetapi dengan cara yang sangat tegas, membetulkan atau bahkan memikirkan semula sepenuhnya semua perkataan kami. Lagipun, ini pun frasa mudah, sebagai "Saya akan kembali sebelum gelap," untuk memahaminya dengan tepat dan menentukan petunjuk temporal yang terkandung di dalamnya, sekurang-kurangnya, memerlukan pengetahuan awal tentang bila, di mana ia diucapkan dan pada masa tahun. Hanya maklumat awal seperti ini selalunya satu-satunya cara untuk menjelaskan hubungan intra-frasa yang tidak dapat diatasi oleh kalkulus proposisi mahupun kalkulus predikat. Jadi, ambil contoh dua ayat yang tersiar di akhbar:

Pelajar siswazah universiti dari Kursk;

Inovator Siberia yang dihormati, -

kita melihat bahawa setiap daripada mereka boleh ditafsirkan dalam dua cara. Sekiranya kita hanya mematuhi ciri tatabahasa formal, maka ayat pertama boleh difahami dengan baik sebagai "Seorang pelajar siswazah dari universiti yang terletak di bandar Kursk" dan sebagai "Seorang pelajar siswazah universiti yang tinggal di bandar Kursk (atau berasal dari bandar Kursk). Dan ayat kedua boleh ditafsirkan sebagai "Inovator yang dihormati, yang bidang aktivitinya adalah Siberia" dan sebagai "Inovator yang dihormati yang merupakan penduduk Siberia." Dan hanya pengetahuan awal (maklumat awal) yang tidak dinyatakan dalam apa-apa cara dalam ayat, menyatakan bahawa tidak ada universiti di bandar Kursk dan bahawa "Penginovasi Terhormat" adalah gelaran kehormat yang dianugerahkan di Kesatuan Soviet oleh daerah pentadbiran individu, membuat adalah mungkin untuk memahami cadangan ini dengan betul. Jika anda melihat dengan teliti, di sebalik hampir setiap frasa bahasa yang dituturkan terdapat maklumat awal yang sangat teliti dan bercabang, yang jelas bagi seseorang, tetapi terletak di luar "pemahaman" mesin yang tidak mengenal puak mahupun puak.

B. Mesin tidak boleh membuat kesimpulan semantik intratekstual yang menjangkau beberapa ayat (dan kadang-kadang dengan sengaja ke atas keseluruhan cerita, supaya tidak mendedahkan sepenuhnya watak atau perkembangan plotnya). Ahli bahasa Belanda A. Reichling * menarik perhatian kepada keadaan ini, menggambarkan ideanya dengan contoh berikut. Katakan kita membaca cerita yang bermula dengan ayat: "Saya bermain dengan abang saya." Jika kita berhenti di sini, maka kita tidak akan mempunyai apa-apa data yang boleh kita gunakan untuk mengetahui bagaimana frasa ini harus difahami, jenis permainan yang kita bincangkan di sini. Lagipun, anda boleh bermain untuk wang (kad, dll.), Pada alat muzik, di teater atau di pawagam, dengan mainan, dalam bola sepak, bermain untuk keseronokan, bermain dengan seseorang dan nasibnya, dll. Tetapi di sini kita membaca lebih lanjut: "Saya berkata ini apabila Wilhelm bertemu saya di sebuah bar suatu hari." Sekarang kita lebih berkemungkinan boleh membuat kesimpulan bahawa, nampaknya, kita bercakap tentang bermain untuk wang. Tetapi masih ada kemungkinan lain. Ia meneruskan: "Abang saya datang ke meja, dan dadu dilemparkan." Kini jelas jenis permainan yang sedang kita bicarakan, walaupun tidak ada dalam teks yang menunjukkan maksud sebenar perkataan "permainan" yang diberikan. Kami meneka tentangnya dari keseluruhan tanda-tanda luaran yang diberikan dalam teks dalam ayat yang berbeza. Tanda-tanda ini mengikuti satu demi satu di sini, tetapi dalam naratif bertulis mereka boleh dipisahkan dengan ketara antara satu sama lain. Seseorang boleh memilihnya dari konteks linguistik yang luas (dalam kes ini kita berurusan dengannya), membandingkannya dan kemudian membuat kesimpulan yang sesuai. Kereta dilucutkan peluang ini.

* (Pada kolokium yang dianjurkan pada tahun 1961 oleh Stichting Studiecentrum voor Administrative Automatisering. Terdapat juga terjemahan Jerman bagi laporan itu: A. Reichling, Moglichkeiten und Grenzen der mechanischen Ubersetzung, aus der Sicht des Linguisten, “Beitrage zur Sprachkunde und Informationsverarbeitung”, Heft 1, Wifcn, 1963.)

Tetapi mungkin dia tidak memerlukan ini? Sememangnya, tiada kesukaran tertentu apabila menterjemah ayat-ayat ini ke dalam bahasa Jerman atau Perancis dengan mesin (tetapi kesukaran, sudah tentu, akan timbul apabila menterjemah ayat lain). Apabila menterjemah ke dalam bahasa Jerman, kita boleh menggunakan literalisme: Ich spile mit meinem Bruder. Dengan cara yang sama, dalam bahasa Perancis kita boleh mulakan: Je joue avec... Sudah apabila menterjemah ke dalam bahasa Inggeris, kesukaran tatabahasa timbul, kerana dalam teks yang diberikan tidak ada petunjuk bentuk mana yang harus dipilih oleh mesin: 1. Saya bermain dengan abang saya, 2. Saya bermain dengan abang saya atau 3. Saya akan bermain dengan abang saya? Dan ternyata sangat teruk apabila diterjemahkan ke dalam bahasa Sepanyol, kerana mesin perlu memilih antara sekurang-kurangnya tiga kata kerja: jugar, tocar atau trabajar.

Di sini bahasa logik tidak berdaya.

D. Mesin sebenarnya berurusan dengan pertuturan (atau, lebih tepat lagi, dengan segmen pertuturan) - dalam tulisan dan secara lisan. Setiap bentuk pertuturan ini mempunyai sistem unsur pragmatiknya sendiri, yang juga boleh berubah menjadi semantik (dan peraturan untuk peralihan sedemikian belum dipelajari dan sebahagian besarnya sewenang-wenangnya). Sebagai contoh, pertuturan lisan mempunyai superstruktur suprasegmental seperti intonasi. Kini nampaknya mungkin untuk mengklasifikasikan intonasi mengikut jenis fungsian dan membezakan intonasi interogatif, naratif dan lain-lain. Walau bagaimanapun, adalah benar-benar tidak dapat dipertikaikan bahawa intonasi tidak wujud secara bebas daripada ayat; ia, sudah tentu, berinteraksi dengan makna yang terkandung di dalamnya. Untuk menyokong kenyataan ini, cukup merujuk kepada soalan retorik, iaitu soalan hanya dalam struktur luarannya, tetapi bukan soalan dalam makna: ia tidak memerlukan jawapan daripada pendengar. Oleh itu, satu jenis kesukaran baru timbul yang tidak dapat diatasi oleh bahasa logik.

D. Kaedah pemprosesan automatik maklumat pertuturan (dan, khususnya, terjemahan mesin) adalah berdasarkan andaian bahawa mana-mana ayat, dan bahasa secara keseluruhan, "diuraikan" ke dalam beberapa unit semantik asas (perkataan), dari mana ia kemudiannya mungkin peraturan tertentu"mengumpul" ayat yang diberi. Akibat daripada andaian ini adalah satu lagi, yang menurutnya makna ayat ialah jumlah aritmetik bagi makna perkataan konstituennya. Di sini matematik diambil sebagai model, di mana operasi paling kompleks yang dilakukan oleh komputer akhirnya dikurangkan kepada yang sangat asas. Tetapi dalam bahasa kita berhadapan dengan gambaran yang hampir sepenuhnya bertentangan. Intinya bukan sahaja dalam bahasa yang berbeza ayat secara semantik "dipisahkan" secara berbeza. Sebagai contoh:

Gadis itu sedang berjalan. Gadis itu berdiri. Topi itu sesuai dengan gadis itu. Das Madchen geht. Das Madchen steht. Der Hut steht dem Madchen(secara literal: Topi itu berharga untuk gadis itu).

Intinya ialah, walaupun dalam bahasa yang sama, ia selalunya tidak diperhatikan secara aritmetik hubungan yang betul antara makna ayat dengan makna (makna) perkataan konstituennya. Pada kesempatan ini, E. Benveniste menulis: “Sebuah ayat direalisasikan melalui kata-kata Tetapi kata-kata bukan hanya segmen ayat Satu ayat adalah keseluruhan, tidak dikurangkan kepada jumlah bahagiannya, makna yang wujud dalam keseluruhannya diedarkan atas keseluruhan set komponen” *. Ini bukan tentang simpulan bahasa(seperti: "melakukannya sambil lewa", "menggosok cermin mata seseorang", dsb.), tetapi mengenai ayat yang paling biasa. Mari kita ambil contoh mudah:

Tunggu! - Saya akan pergi ke teater.

Bolehkah dikatakan bahawa maksud ayat ini ialah jumlah aritmetik bagi makna perkataan: tunggu, pergi, teater, saya, dalam? Berdasarkan perwakilan aritmetik ini, kami menjangkakan bahawa sebarang gabungan perkataan ini diwakili secara tatabahasa ayat yang betul, akan mengekalkan makna yang sama - lagipun, jumlah istilah tidak berubah dengan menyusun semula tempat istilah. Tetapi mari kita cuba mengubah suai sedikit cadangan ini:

Saya akan pergi ke teater - tunggu!

Kami melihat bahawa dalam maksudnya ayat kedua ini berbeza dengan ketara daripada yang pertama.

* (E. Benveniste, Les niveaux de G menganalisis linguistique, "Preprints of Papers for the Ninth International Congress of Linguists", Cambridge, Mass., 1962, hlm. 497)

Ini adalah salah satu contoh yang sangat asas, dan jika kita beralih kepada yang lebih kompleks, maka ketidakberdayaan mana-mana peraturan transformasi yang sepatutnya mengawal kes sedemikian akan menjadi sangat jelas. Ia tidak boleh sebaliknya: selepas semua, ayat ialah urutan monosemes, dan monoseme (lihat bahagian "Sistem kajian semantik"), sebagai konfigurasi sintaksis, lebih banyak perkataan. Keadaan ini membawa kepada fakta bahawa ayat, sebagai urutan monosemes, adalah urutan unsur yang saling mendefinisikan yang berkaitan antara satu sama lain dalam pengertian semantik dalam rantaian yang tidak terputus, yang boleh secara skematik dan dalam bentuk yang sangat umum seperti berikut *:

* (Lihat "Lampiran" di penghujung buku.)

Kerana ciri-ciri ayat inilah terdapat perbezaan kualitatif antara yang terakhir dan perkataan. Jika perkataan boleh ditakrifkan sebagai tanda, maka ayat sudah pasti melampaui tahap tanda.

Persoalan "keteruraian" bahasa dan ayat terletak pada yang lebih umum. Terdapat struktur yang boleh melaksanakan fungsinya hanya dalam komposisi kompleksnya. Apabila anda cuba menguraikannya kepada bahagian yang lebih kecil atau mengurangkannya kepada struktur yang lebih asas, ia sebenarnya hancur, tidak wujud seperti itu, dan kehilangan kualiti yang wujud dalam komposisi kompleksnya. Itu bahasanya. V. Humboldt memahami perkara ini (mendekati isu ini, bagaimanapun, dari sudut yang sedikit berbeza) apabila dia menulis: "Agar seseorang dapat memahami sekurang-kurangnya satu perkataan bukan semata-mata sebagai dorongan rohani (iaitu, secara refleksif. - V. Z.), dan sebagai bunyi yang jelas yang menunjukkan konsep, seluruh bahasa sepenuhnya dan dalam semua hubungannya mesti sudah tertanam di dalamnya keseluruhan." Menerjemahkan penghakiman W. Humboldt ini ke dalam bahasa sains moden, kami mendapat rumusan berikut, yang dimiliki oleh M. Taube: “... tidak sukar untuk memahami bahasa itu sebagai sistem simbol yang bermakna, lisan atau bertulis, bukan sistem formal dan tidak boleh dikurangkan kepadanya tanpa memusnahkan sifat sebenar... Apabila bahasa diformalkan, ia tidak lagi menjadi bahasa dan menjadi kod" ** .

* (W. Humboldt, Mengenai kajian perbandingan bahasa berhubung dengan era perkembangan mereka yang berbeza. Dipetik dari buku: V. A. Zvegintsev, Sejarah linguistik abad ke-19 - ke-20 dalam esei dan ekstrak, bahagian I, M., 1964, hlm 79.)

** (M. Taube, Mesin pengkomputeran dan akal sehat, M.* 1964, hlm.)

Tetapi walaupun ada kemungkinan untuk mengatasi kesukaran bahasa yang disenaraikan, masih terdapat halangan dari susunan logik yang ketat - dalam kes ini kita bercakap tentang apa yang dipanggil "peraturan keputusan". Lagipun, jika kita ingin memastikan bahawa mesin itu akan bertindak secara logik dengan sempurna, kita mesti menyediakannya dengan satu set peraturan, mengikut mana ia boleh secara konsisten pergi dari maklumat awal kepada kesimpulan yang diperlukan. Berhubung dengan kalkulus cadangan logik, kita mempunyai peraturan sedemikian, tetapi untuk logik yang lebih kompleks tidak ada peraturan sedemikian, dan, lebih-lebih lagi, ada sebab untuk mempercayai bahawa peraturan sedemikian tidak dapat dijumpai. Jika kita memberi tumpuan kepada peraturan yang sudah sedia ada, maka menggunakannya akan menjadikan proses penyelesaian menjadi sangat rumit (walaupun ketika menggunakan komputer canggih) sehingga permainan tidak akan bernilai lilin *.

* (Untuk menunjukkan jenis kerja yang perlu dilakukan oleh komputer yang beroperasi dengan kaedah langkah berturut-turut, A. L. Samuel beralih kepada contoh permainan dam. Dia menulis: "Untuk mendapatkan komputer untuk bermain dam, kita mesti terlebih dahulu mewakili kedudukan dam di papan dengan cara yang komputer boleh ingat Kemudian akibat dari setiap langkah yang ada mesti dianalisis dengan melihat masa depan , seperti yang biasa dilakukan oleh manusia.” , mempertimbangkan setiap langkah awal secara bergilir-gilir, maka semua gerak balas yang mungkin dilakukan oleh pihak lawan, kemudian bagi setiap daripada mereka semua tindak balas balas, dsb. Walaupun kita secara mental mengangkut diri kita ke masa hadapan, kepada mesin terpantas yang mungkin, hanya tertakluk kepada batasan seperti saiz alam semesta, sifat molekul jirim dan kelajuan cahaya terhingga, maka mesin pengkomputeran sedemikian akan memerlukan berabad-abad, dan mungkin lebih lama daripada usia alam semesta, untuk membuat langkah pertamanya" (A. L. Samuel, Kecerdasan Buatan: Kemajuan dan masalah. Lampiran buku: M. Taube, Computers and common sense, M., 1964* ms. 140-141).)

Beginilah masalah penggunaan kaedah logik dan matematik dalam sains bahasa digambarkan berdasarkan data daripada linguistik gunaan. Apakah kesimpulannya? Kesimpulan telah pun dirumuskan di atas - analisis logik membolehkan gabungan kaedah induktif dengan kaedah deduktif, tetapi apabila kita bercakap tentang penggunaan kaedah deduktif dalam linguistik, semuanya tidak boleh dikurangkan kepada subordinasi buta penyelidikan linguistik kepada logik-matematik. kaedah. Bahasa semula jadi memberontak terhadap keganasan tersebut. Dan amalan linguistik gunaan mengesahkan kesimpulan ini, membuktikan bahawa terdapat perbezaan antara bahasa logik yang diformalkan dan bahasa semula jadi sehingga terjemahan yang agak lengkap (dari segi maklumat) dari yang kedua ke yang pertama adalah mustahil. Adakah ini bermakna bahawa dalam linguistik (dan, khususnya, linguistik gunaan) kita harus meninggalkan penggunaan kaedah logik-matematik? Sudah tentu tidak. Tetapi seseorang tidak boleh melebih-lebihkan keupayaan mereka. Setakat ini mereka agak sederhana. Dan untuk tidak menjadi tidak berasas di sini, mari kita beralih kepada kesaksian ahli matematik dan logik yang, dalam amalan kerja mereka, perlu menggunakan pengetahuan mereka untuk kajian bahasa semula jadi.

Inilah yang dikatakan oleh seorang ahli matematik: "Bantuan matematik dalam kajian bahasa semula jadi masih jauh dari jelas... Sebelum kita boleh berfikir tentang menggunakan matematik untuk kalkulus, adalah perlu untuk menentukan sempadan dan fungsi unit linguistik... Ini sudah keluar masalah matematik, ia adalah sebahagian daripada kaedah induktif dalam linguistik.

Ternyata matematik tidak menggantikan metodologi empirikal, walaupun beberapa ahli bahasa berusaha untuk melakukannya. Sebaliknya, hanya selepas unit dan hubungan bahasa semula jadi telah diwujudkan secara induktif dan disahkan dengan sewajarnya barulah syarat-syarat yang diperlukan diwujudkan untuk aplikasi realistik matematik kepada bahasa semula jadi. Dalam kes ini, ahli matematik sama ada akan mendapati bahawa mereka sedang berhadapan dengan manifestasi baharu sesuatu yang sudah biasa bagi mereka dalam intipatinya, atau mereka akan menerima rangsangan untuk pemikiran matematik bagi susunan baharu."

* (P. Garvin dan W. Karush, Linguistik - Pemprosesan data dan Matematik, "Bahasa Asli dan Komputer", New York, 1963, hlm. 368-369. Lihat juga artikel dalam buku yang sama: W. Ksrush, The Use of Mathematics in the Behavioral Sciences, ms. 64-83.)

Dan inilah yang dikatakan oleh ahli logik: "Prospek pemprosesan automatik maklumat pertuturan sangat baik, tetapi peranan logik dalam bidang ini adalah terhad, bagaimanapun, sebagai alat analisis linguistik, bukan sebagai satu set peraturan untuk membuat kesimpulan , ia membuat janji sebenar” *. Dan dia terus menetapkan strategi penyelidikan mana yang lebih disukai: "Masalah tidak seharusnya diselesaikan dengan pematuhan yang tidak fleksibel kepada satu set peraturan yang ditetapkan oleh ahli logik, tetapi dengan menggunakan teknik heuristik ** ... Pendekatan induktif empirikal kepada automatik pemprosesan maklumat pertuturan harus diutamakan, yang dengannya mencari peraturan kasar untuk menyelesaikan masalah maklumat. bahasa biasa kepada yang logik untuk tujuan pemprosesan berikutnya, tetapi lebih kepada mencari peraturan jenis heuristik yang akan membolehkan seseorang menguasai bahasa semula jadi. Anda harus berhenti mencari kepastian mutlak dan beralih kepada kaedah anggaran, yang, dengan pengumpulan pengalaman, akan diperhalusi dan dipertingkatkan. Kami lebih suka merawat anggaran dengan cara yang sama seperti teori yang dirawat dalam sains, di mana pengubahsuaian dan penambahbaikan dibuat berdasarkan data yang diperoleh daripada eksperimen." *** .

* (M. Maron, A Logician's View of Language - Pemprosesan data, buku yang dipetik, ms 144.)

** (A. L. Samuel memberikan idea yang agak jelas tentang metodologi heuristik. Membezakannya dengan teknik formal prosedur logik, dia menulis bahawa sebaliknya teknik boleh digunakan "di mana beberapa lebih atau kurang prosedur yang dipilih secara sewenang-wenangnya diperiksa dengan cara yang agak tidak lengkap dan masing-masing memberikan beberapa petunjuk sama ada kita berada di jalan yang betul * sehingga, akhirnya, melalui satu siri meneka tidak akan membawa kita untuk merumuskan bukti yang memuaskan Dalam kedua-dua kes ini, kita kadang-kadang boleh mencapai jawapan yang betul atau sekurang-kurangnya sangat baik dalam tempoh masa yang sangat singkat, tetapi. pada masa yang sama tidak ada keyakinan bahawa kita akan pernah mendapat penyelesaian, serta keyakinan bahawa penyelesaian yang dikemukakan kepada kita adalah yang terbaik Kaedah penyelesaian masalah ini dipanggil prosedur "heuristik", berbeza dengan penggunaan "algoritma"... Penyelesaian masalah heuristik, apabila berjaya, sudah tentu, harus dianggap sebagai aktiviti mental yang lebih tinggi daripada menyelesaikan masalah melalui prosedur yang lebih atau kurang automatik." Dipetik daripada terjemahan Rusia: A. L. Samuel, Kecerdasan buatan: kemajuan dan masalah. Lampiran buku: M. Taube, Computers and common sense, M., 1964, ms 136-137.)

*** (M. Maron, op. cit., hlm. 143-144,)

Ini adalah kesimpulan umum. Mereka mengatakan bahawa ahli bahasa memainkan peranan utama dalam kerja bersama dengan ahli logik dan ahli matematik. Tanggungjawab ahli bahasa adalah untuk menyediakan bahan bahasa sedemikian rupa untuk menjadikannya mudah untuk diproses dengan kaedah logik-matematik. Ke arah inilah seseorang harus mencari gabungan realistik dalam linguistik kaedah induktif dengan kaedah deduktif. Dan apabila, apabila menyelesaikan masalah linguistik gunaan, kita bercakap tentang hipotesis heuristik, maka mereka mesti pertama sekali datang dari ahli bahasa, kerana dia lebih dekat dengan bahasa dan, kerana kedudukannya, wajib mengetahui dan memahaminya dengan lebih baik. .

Anufrieva Anastasia, Ivlev Mikhail, Miroshnikov Vsevolod, Artyukh Ekaterina

Hasil kerja pelajar darjah 5. Projek penyelidikan: "Linguistik matematik". Kerja kumpulan dalam mata pelajaran - matematik dan bahasa asing.

Muat turun:

Pratonton:

Jabatan Pendidikan Utama Dewan Bandaraya Novosibirsk

Istana kreativiti untuk kanak-kanak dan pelajar "Junior"

Pertandingan bandar terbuka projek penyelidikan

pelajar darjah 5-8

Arahan: projek natural-matematik

Linguistik matematik

Ivlev Mikhail,

Miroshnikov Vsevolod,

Artyukh Ekaterina

MBOUSOSH No 26, darjah 5

Daerah Kalininsky Novosibirsk

Perunding projek:Yasyurenko Maya Dmitrievna,

Guru matematik dan sains komputer,

Sevastyanova Tatyana Sergeevna,

guru bahasa ingeris

I kategori kelayakan.

Nombor hubungan pengurus:

8-952-924-02-66 (Yasyurenko M.D.)

8-913-896-81-77 (Sevastyanova T.S.)

Novosibirsk 2013

Projek: "linguistik matematik"

Peserta projek:Anufrieva Anastasia, Ivlev Mikhail, Miroshnikov Vsevolod, Artyukh Ekaterina.

Perunding projek:Yasyurenko Maya Dmitrievna, guru matematik dan sains komputer. Sevastyanova Tatyana Sergeevna, guru Bahasa Inggeris I

kategori kelayakan.

Kelas: 5A

Nama, nombor institusi pendidikan di mana projek itu dijalankan:MBOUSOSH No. 26, daerah Kalininsky, bandar Novosibirsk

Bidang subjek:matematik, bahasa asing.

Masa yang dihabiskan untuk projek:November 2012 - Februari 2013 (jangka panjang)

Objektif projek: mencari titik hubungan antara matematik dan linguistik.

Tugasan:

  1. Berkenalan dengan sejarah perkembangan matematik dan pembentukan linguistik.
  2. Cari contoh individu aplikasi matematik dalam linguistik.
  3. Untuk mengkaji prospek penggunaan kaedah matematik dalam linguistik. Buat kesimpulan.

Jenis projek (mengikut aktiviti):carian, penyelidikan

Teknologi yang digunakan: multimedia

Borang Produk Projek:"Linguistik Matematik" (persembahan multimedia).

Kajian:

- pemilihan dan kajian bahan teori mengenai topik ini;

- pemprosesan maklumat yang diterima;

- menentukan prospek untuk aplikasi kaedah matematik dalam linguistik.

Skop hasil projek:pendidikan (matematik, bahasa asing).

Pengenalan………………………………………………………………………………..2

Bab 1. Sejarah aplikasi kaedah matematik dalam linguistik

1.1. Sejarah matematik………………………………………………………………….3

1.2. Pembentukan linguistik…………………………………………………………………………4

1.3. Linguistik Matematik……………………………………………….8

Bab 2. Contoh pilihan penggunaan matematik dalam linguistik

2.1. Mempelajari bahasa menggunakan kaedah logik formal………………………………11

2.2. Prospek aplikasi kaedah matematik dalam linguistik......13

Kesimpulan...……………………………………………………………………………………14

Kesusasteraan………………………………………………………………………………15

pengenalan.

Pada abad kedua puluh, terdapat kecenderungan ke arah interaksi dan interpenetrasi pelbagai bidang ilmu. Sempadan antara sains individu secara beransur-ansur kabur; Terdapat lebih banyak cabang aktiviti mental yang "di persimpangan" pengetahuan kemanusiaan, teknikal dan sains semula jadi.

Satu lagi ciri kemodenan yang jelas ialah keinginan untuk mengkaji struktur dan unsur konstituennya. Oleh itu, tempat yang semakin meningkat baik dalam teori saintifik dan dalam amalan diberikan kepada matematik. Matematik menembusi lebih dalam dan lebih dalam ke dalam bidang-bidang yang untuk masa yang lama dianggap sebagai "kemanusiaan" semata-mata, mengembangkan potensi heuristik mereka (jawapan kepada soalan "berapa banyak" sering membantu menjawab soalan "apa" dan "bagaimana"). Linguistik tidak terkecuali.

Tujuan kerja kami adalah untuk menyerlahkan secara ringkas hubungan antara matematik dan cabang linguistik seperti linguistik. Pada mulanya, kaedah matematik dalam linguistik mula digunakan untuk menjelaskan konsep asas linguistik, tetapi dengan perkembangan teknologi komputer, premis teori seperti itu mula digunakan dalam amalan. Menyelesaikan masalah seperti terjemahan mesin, perolehan maklumat mesin dan pemprosesan teks automatik memerlukan pendekatan bahasa yang asasnya baharu. Satu persoalan telah timbul untuk ahli bahasa: bagaimana untuk belajar mewakili corak linguistik dalam bentuk yang boleh digunakan secara langsung kepada teknologi. Istilah "linguistik matematik," yang popular pada zaman kita, merujuk kepada mana-mana penyelidikan linguistik yang menggunakan kaedah tepat (dan konsep kaedah tepat dalam sains sentiasa berkait rapat dengan matematik). Linguistik menggunakan kaedah kuantitatif (algebra) dan bukan kuantitatif, yang membawanya lebih dekat kepada logik matematik, dan, akibatnya, kepada falsafah, dan juga psikologi. Ahli falsafah dan ahli bahasa Jerman Friedrich Schlegel mencatatkan interaksi bahasa dan kesedaran, dan ahli bahasa terkemuka awal abad kedua puluh Ferdinand de Saussure mengaitkan struktur bahasa dengan kepunyaan orang. Interaksi matematik dan linguistik adalah topik yang pelbagai, dan dalam kerja kami, kami tidak akan memberi tumpuan kepada semuanya, tetapi, pertama sekali, pada aspek yang diterapkan.

Bab 1. Sejarah aplikasi kaedah matematik dalam linguistik.

1.1. Sejarah matematik.

Dalam sejarah ahli matematikSecara tradisinya, terdapat beberapa peringkat dalam perkembangan pengetahuan matematik:

  1. Pembentukan konsepangka geometri Dan nombor Bagaimana idealisasiobjek dan set sebenar objek homogen. Kemunculan pengiraan dan pengukuran, yang memungkinkan untuk membandingkan nombor yang berbeza, panjang, luas dan isipadu.
  2. Ciptaan operasi aritmetik. Pengumpulan pengetahuan tentang sifat secara empirik (secara percubaan dan kesilapan) operasi aritmetik, tentang kaedah mengukur luas danjilidfigura dan badan yang ringkas. Kami telah membuat banyak kemajuan ke arah iniSumeria Babylonia, cina Dan Indiaahli matematik purba.
  3. Penampilan dalam Yunani purbasistem matematik deduktif yang menunjukkan bagaimana untuk mendapatkan kebenaran matematik baru berdasarkan yang sedia ada. Pencapaian kegemilangan matematik Yunani kuno ialah"Elemen" Euclid, yang berfungsi sebagai standard ketegasan matematik selama dua milenium.
  4. Ahli matematik negara Islambukan sahaja mengekalkan pencapaian purba, tetapi juga dapat mensintesiskannya dengan penemuan ahli matematik India, yang maju lebih jauh daripada orang Yunani dalam teori nombor.
  5. Pada abad ke-16-18, matematik Eropah telah dihidupkan semula dan pergi jauh ke hadapan. dia asas konsep Dalam tempoh ini, terdapat keyakinan bahawa model matematik adalah sejenis rangka ideal Alam Semesta, dan oleh itu penemuan kebenaran matematik adalah pada masa yang sama penemuan sifat baharu dunia sebenar. Kejayaan utama di sepanjang laluan ini ialah pembangunan model matematik pergantungan pembolehubah (fungsi) dan teori umum gerakan (analisis infinitesimal). Semua sains semula jadi telah dibina semula berdasarkan model matematik yang baru ditemui, dan ini membawa kepadakemajuan.
  6. DALAM abad XIX-XX Ia menjadi jelas bahawa hubungan antara matematik dan realiti tidak semudah yang dilihat sebelum ini. Tidak ada jawapan yang diterima umum untuk jenis "soalan asas dalam falsafah matematik": untuk mencari sebab bagi "keberkesanan matematik yang tidak dapat difahami dalam sains semula jadi." Dalam hal ini, dan bukan sahaja dalam hal ini, ahli matematik dibahagikan kepada banyak sekolah perbahasan. Beberapa trend berbahaya telah muncul: pengkhususan yang terlalu sempit, pengasingan daripada masalah praktikal, dsb. Pada masa yang sama, kuasa matematik dan prestijnya, disokong oleh keberkesanan penggunaannya, lebih tinggi berbanding sebelum ini.

Sebagai tambahan kepada kepentingan sejarah yang besar, analisis evolusi matematik adalah sangat penting untuk pembangunanfalsafah Dan metodologimatematik. Selalunya, pengetahuan tentang sejarah juga menyumbang kepada kemajuan disiplin matematik tertentu; contohnya kunoMasalah Cina (teorem) pada bakimembentuk keseluruhan bahagianteori nombor.

Rasional untuk matematik

Menjelang permulaan abad ke-19, hanya geometri Euclidean yang mempunyai justifikasi logik (deduktif) yang agak ketat, walaupun ketelitiannya dianggap tidak mencukupi walaupun ketika itu. Sifat objek baharu (contohnya,nombor kompleks, sangat kecildsb.) hanya dianggap pada umumnya sama dengan objek yang telah diketahui; jika ekstrapolasi sedemikian adalah mustahil, sifat telah dipilih secara eksperimen.

Augustin Louis Cauchy

Pembinaan asas matematik bermula dengan analisis. DALAM1821Cauchymenerbitkan "Analisis Algebra", di mana beliau dengan jelas mentakrifkan konsep asas berdasarkan konsep had. Namun begitu, dia melakukan beberapa kesilapan, contohnya, dia menyepadukan dan membezakan siri istilah demi istilah tanpa membuktikan kebolehterimaan operasi tersebut. Analisis asas selesaiWeierstrass, yang mengetahui peranan konsep pentingkesinambungan seragam. Pada masa yang sama, Weierstrass (1860-an) danDedekind(1870-an) memberikan justifikasi untuk teori tersebutnombor nyata.


Kapsyen slaid:

Linguistik matematik Pengarang: Anufrieva Anastasia, Ivlev Mikhail, Miroshnikov Vsevolod, Artyukh Ekaterina MBOUSOSH No. 26, daerah Kalininsky gred ke-5 Novosibirsk Perunding projek: Yasyurenko Maya Dmitrievna, guru matematik dan sains komputer, Sevastyanova Taqual guru Bahasa Inggeris, Sergeevnaova Taqual kategori.

Matlamat projek: untuk mencari titik persamaan antara matematik dan linguistik.

Objektif projek: Untuk membiasakan diri dengan sejarah perkembangan matematik dan pembentukan linguistik. Cari contoh individu aplikasi matematik dalam linguistik. Untuk mengkaji prospek penggunaan kaedah matematik dalam linguistik. Buat kesimpulan.

Pada abad kedua puluh, terdapat kecenderungan ke arah interaksi dan interpenetrasi pelbagai bidang ilmu. Sempadan antara sains individu secara beransur-ansur kabur; Terdapat lebih banyak cabang aktiviti mental yang "di persimpangan" pengetahuan kemanusiaan, teknikal dan sains semula jadi.

Peringkat perkembangan pengetahuan matematik: Pembentukan konsep angka geometri dan nombor sebagai idealisasi objek sebenar dan set objek homogen. Kemunculan pengiraan dan pengukuran, yang memungkinkan untuk membandingkan nombor, panjang, kawasan dan isipadu yang berbeza.

Ciptaan operasi aritmetik. Penampilan dalam Yunani purba sistem matematik deduktif. Ahli matematik dari negara Islam bukan sahaja mengekalkan pencapaian purba, tetapi juga dapat mensintesiskannya dengan penemuan ahli matematik India, yang maju lebih jauh daripada orang Yunani dalam teori nombor.

Pada abad ke-16-18, matematik Eropah telah dihidupkan semula dan pergi jauh ke hadapan. Pada abad ke-19 dan ke-20, menjadi jelas bahawa hubungan antara matematik dan realiti adalah jauh daripada semudah yang dilihat sebelum ini.

Augustin Louis Cauchy

Sejarah linguistik telah melalui 5 zaman dalam perkembangannya. Tempoh pertama - abad ke-5-4. BC. - abad XVI Tempoh ke-2 - abad XVII-XVIII. Tempoh ke-3 - akhir ke-18 - separuh pertama abad ke-19. Tempoh ke-4 – tempoh pembelajaran bahasa yang sistematik – lewat XIX– sepertiga pertama abad ke-20. Tempoh ke-5 - 30-an abad XX. Sehingga kini.

Linguistik matematik: Mengkaji ciri pemodelan semiotik dan matematik bahasa semula jadi (dan pertuturan) dengan tujuan menterjemah maklumat yang terkandung dalam bentuk tidak formal dalam teks ke dalam bentuk formal bahasa buatan(contohnya, ke dalam beberapa bahasa maklumat) berdasarkan radas matematik seperti teori set dan algebra hubungan, teori set kabur dan pembolehubah linguistik, teori kebarangkalian dan statistik matematik, serta unsur-unsur teori maklumat. Berkait rapat dengan linguistik kejuruteraan. Cabang linguistik yang mengkaji kemungkinan mengaplikasikan kaedah matematik untuk kajian dan huraian bahasa.

Metalanguage ialah bahasa yang digunakan untuk menyatakan pertimbangan tentang bahasa lain, bahasa objek. Dengan bantuan metalanguage, mereka mengkaji struktur gabungan simbol (ungkapan) bahasa objek, membuktikan teorem tentang sifat ekspresifnya, tentang hubungannya dengan bahasa lain, dsb.

Linguistik dalam dunia moden telah menjadi asas kepada perkembangan teknologi maklumat. Selagi sains komputer kekal sebagai cabang aktiviti manusia yang berkembang pesat, kesatuan matematik dan linguistik akan terus memainkan peranannya dalam pembangunan sains.

Sepanjang abad yang lalu, linguistik sentiasa disebut sebagai contoh sains yang berkembang pesat dan sangat cepat mencapai kematangan metodologi. Sudah pada pertengahan abad yang lalu, sains muda dengan yakin mengambil tempatnya dalam lingkaran sains yang mempunyai tradisi seribu tahun, dan salah seorang wakilnya yang paling menonjol - A. Schleicher - mempunyai keberanian untuk mempercayai bahawa dengan karyanya dia sedang melukis garisan akhir.<113>Sejarah linguistik, bagaimanapun, telah menunjukkan bahawa pendapat sedemikian adalah terlalu tergesa-gesa dan tidak wajar. Pada akhir abad ini, linguistik mengalami kejutan besar pertama yang dikaitkan dengan kritikan terhadap prinsip neogrammatik, yang diikuti oleh orang lain. Perlu diingatkan bahawa semua krisis yang dapat kita dedahkan dalam sejarah sains bahasa, sebagai peraturan, tidak menggoncang asasnya, tetapi, sebaliknya, menyumbang kepada pengukuhan dan akhirnya membawa penjelasan dan penambahbaikan. kaedah penyelidikan linguistik, berkembang bersama-sama dengan mereka dan isu-isu saintifik.

Tetapi sains lain, termasuk sejumlah besar yang baru, juga hidup dan berkembang bersama linguistik. terutamanya perkembangan pesat Pada zaman kita, sains fizikal, kimia dan teknikal (yang dipanggil "tepat") telah diperoleh, dan asas teorinya, matematik, telah menguasai kesemuanya. Sains tepat bukan sahaja telah menggantikan segala-galanya ilmu kemanusiaan, tetapi pada masa ini mereka cuba "membawa mereka ke dalam iman mereka," menundukkan mereka kepada adat mereka, dan mengenakan kaedah penyelidikan mereka ke atas mereka. Memandangkan situasi semasa, menggunakan ungkapan Jepun, kita boleh mengatakan bahawa kini ahli bahasa dan ahli filologi mencemarkan pinggir tikar, di mana sains tepat, yang dipimpin oleh matematik, terletak dengan penuh kejayaan dan bebas.

Bukankah lebih suai manfaat dari sudut pandangan kepentingan saintifik umum untuk menyerah kepada matematik, untuk menyerah sepenuhnya kepada kuasa kaedahnya, kerana beberapa suara sudah secara terbuka menyeru, 5 9 dan dengan itu, mungkin, mendapat kekuatan baru? Untuk menjawab soalan-soalan ini, kita mesti terlebih dahulu melihat apa yang dikatakan oleh matematik untuk dilakukan dalam kes ini, dalam bidang apa kaedah matematik linguistik digunakan, sejauh mana ia konsisten dengan spesifik bahan linguistik, dan sama ada ia mampu memberi atau bahkan hanya mencadangkan jawapan kepada soalan-soalan yang ditetapkan oleh ilmu bahasa itu sendiri.

Dari awal lagi, perlu diingatkan bahawa di kalangan peminat hala tuju matematik baru dalam linguistik<114>Dalam penyelidikan saintifik tidak ada konsensus mengenai matlamat dan objektifnya. Ahli akademik A. A. Markov, yang pertama menggunakan kaedah matematik untuk bahasa, Boldrini, Yul, Mariotti menganggap elemen linguistik sebagai bahan ilustrasi yang sesuai untuk membina kaedah kuantitatif, atau untuk teorem statistik, tanpa bertanya sama sekali sama ada hasil penyelidikan tersebut menarik minat ahli bahasa 6 0 . Ross percaya bahawa teori kebarangkalian dan statistik matematik mewakili alat atau, seperti yang mereka lebih suka katakan sekarang, model matematik untuk menyemak dan mengesahkan kesimpulan linguistik yang membenarkan tafsiran berangka. Oleh itu, kaedah matematik hanya difikirkan sebagai alat bantu penyelidikan linguistik 6 1 . Lebih banyak lagi yang dituntut oleh Kherdan, yang dalam bukunya bukan sahaja meringkaskan dan menyusun semua percubaan pada kajian matematik masalah bahasa, tetapi juga cuba memberi mereka orientasi yang jelas berhubung dengan kerja selanjutnya. Dia menumpukan pembentangan semua bahan dalam bukunya pada "memahami statistik sastera (seperti yang dia panggil kajian teks dengan kaedah statistik matematik. - PADA 3.) sebagai bahagian integral linguistik” 6 2, dan intipati dan objektif bahagian baru dalam linguistik ini dirumuskan dalam perkataan berikut: “Statistik sastera sebagai falsafah kuantitatif bahasa boleh digunakan untuk semua cabang linguistik. Pada pendapat kami, statistik sastera ialah linguistik struktural, dinaikkan ke peringkat sains kuantitatif atau falsafah kuantitatif. Oleh itu, adalah tidak betul untuk menentukan keputusannya sebagai tidak berkaitan dengan bidang tersebut<115>linguistik atau menganggapnya sebagai alat bantu untuk penyelidikan" 6 3.

Adalah tidak wajar untuk membuat teori sama ada sah dalam kes ini untuk bercakap tentang kemunculan cabang linguistik baru dan menyelesaikan isu tuntutannya, tanpa terlebih dahulu beralih kepada pertimbangan tentang apa yang sebenarnya telah dilakukan dalam ini. kawasan, dan untuk menjelaskan ke arah mana penggunaan kaedah baharu 6 4. Ini akan membantu kita memahami kepelbagaian pendapat.

Penggunaan kriteria matematik (atau, lebih tepat lagi, statistik) untuk menyelesaikan isu linguistik bukanlah sesuatu yang baru dalam sains bahasa dan, pada satu tahap atau yang lain, telah lama digunakan oleh ahli bahasa. Lagipun, pada dasarnya, konsep linguistik tradisional seperti hukum fonetik (dan yang berkaitan<116>sesuatu yang berbeza daripadanya adalah pengecualian kepada undang-undang), produktiviti unsur tatabahasa (contohnya, akhiran membentuk kata) atau bahkan kriteria untuk hubungan yang berkaitan antara bahasa adalah pada tahap tertentu berdasarkan ciri statistik relatif. Lagipun, lebih tajam dan lebih jelas kontras statistik kes yang diperhatikan, lebih banyak sebab kita perlu bercakap tentang akhiran yang produktif dan tidak produktif, tentang hukum fonetik dan pengecualian kepadanya, tentang kehadiran atau ketiadaan hubungan yang berkaitan antara bahasa. Tetapi jika dalam kes sedemikian prinsip statistik digunakan lebih kurang secara spontan, kemudian ia mula digunakan secara sedar dan dengan penetapan matlamat tertentu. Oleh itu, pada zaman kita, apa yang dipanggil kamus kekerapan perbendaharaan kata dan ungkapan bahasa individu 6 5 atau bahkan makna perkataan berbilang bahasa dengan "fokus umum pada realiti" 6 6 telah tersebar luas. Data daripada kamus ini digunakan untuk menyusun buku teks bahasa asing (teks yang berdasarkan perbendaharaan kata yang paling biasa digunakan) dan kamus minimum. Pengiraan statistik mendapati penggunaan linguistik khas dalam kaedah leksikostatistik atau glottokronologi oleh M. Swadesh, di mana, berdasarkan formula statistik yang mengambil kira kes-kes kehilangan kata-kata asas daripada bahasa, adalah mungkin untuk mewujudkan kronologi mutlak pembahagian keluarga bahasa 6 7 .

Dalam tahun-tahun kebelakangan ini, kes-kes menggunakan kaedah matematik untuk bahan linguistik telah meningkat dengan ketara, dan arah yang lebih atau kurang pasti telah muncul dalam jisim percubaan tersebut. Mari beralih kepada<117>untuk mempertimbangkannya secara berurutan, tanpa pergi ke butiran.

Mari kita mulakan dengan arah yang diberi nama stylostatistics. Dalam kes ini, kita bercakap tentang mentakrifkan dan mencirikan ciri gaya karya individu atau pengarang melalui hubungan kuantitatif unsur linguistik yang digunakan. Asas pendekatan statistik kepada kajian fenomena stilistik ialah pemahaman gaya sastera sebagai cara individu untuk menguasai cara bahasa. Pada masa yang sama, penyelidik benar-benar terganggu dari persoalan kepentingan kualitatif unsur-unsur linguistik yang boleh dikira, menumpukan semua perhatiannya hanya pada bahagian kuantitatif; sisi semantik unit linguistik yang dikaji, beban emosi dan ekspresif mereka, serta berat khusus mereka dalam fabrik karya seni - semua ini kekal di luar perakaunan dan merujuk kepada fenomena yang dipanggil berlebihan. Oleh itu, karya seni muncul dalam bentuk keseluruhan mekanikal, pembinaan khusus yang mendapati ekspresinya hanya melalui hubungan berangka unsur-unsurnya. Wakil-wakil statistik gaya tidak menutup mata kepada semua keadaan yang diperhatikan, membezakan kaedah stilistika tradisional, yang sudah pasti termasuk unsur-unsur subjektiviti, dengan satu kualiti tunggal kaedah matematik, yang, pada pendapat mereka, membayar semua kekurangannya. - objektiviti keputusan yang dicapai. "Kami berusaha," tulis, sebagai contoh, V. Fuchs, "...untuk mencirikan gaya ungkapan linguistik dengan cara matematik. Untuk tujuan ini, kaedah mesti dicipta, yang hasilnya mesti mempunyai objektiviti pada tahap yang sama seperti hasil sains tepat... Ini mengandaikan bahawa kita, sekurang-kurangnya pada mulanya, hanya akan mengambil berat tentang kualiti struktur formal, dan bukan dengan kandungan semantik ungkapan linguistik . Dengan cara ini kita akan memperoleh satu sistem perhubungan ordinal, yang secara keseluruhannya akan mewakili asas dan titik permulaan teori gaya matematik” 6 8 .<118>

Jenis pendekatan statistik yang paling mudah untuk mengkaji bahasa penulis atau karya individu ialah mengira perkataan yang digunakan, kerana kekayaan perbendaharaan kata, nampaknya, harus dengan cara tertentu mencirikan pengarang itu sendiri. Walau bagaimanapun, hasil pengiraan sedemikian memberikan hasil yang agak tidak dijangka dalam hal ini dan tidak sama sekali menyumbang kepada pengetahuan estetik dan penilaian karya sastera, yang tidak kurang daripada tugas stilistika. Berikut adalah beberapa data mengenai jumlah perkataan yang digunakan dalam beberapa karya:

Bible (Latin). . . . . . . . . . 5649 patah perkataan

Alkitab (Ibrani). . . . 5642 patah perkataan

Demosthenes (ucapan). . . . . . . . . . . . 4972 patah perkataan

Sallust. . . . . . . . . . . . . . . . . 3394 patah perkataan

Horace. . . . . . . . . . . . . . . . . . . .6084 patah perkataan

Dante (The Divine Comedy) 5860 patah perkataan

(ini termasuk 1615 nama khas dan nama geografi)

Tasso (Furious Orland). . . . 8474 patah perkataan

Milton. . . . . . . . . . . . . . . . . . . . .8000 patah perkataan (lebih kurang data)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 patah perkataan

(kira-kira, menurut sumber lain, 20,000 perkataan)

O. Jespersen menegaskan bahawa perbendaharaan kata Zola, Kipling dan Jack London jauh melebihi perbendaharaan kata Milton, iaitu bilangannya ialah 8000 6 9 . Pengiraan kamus ucapan oleh Presiden AS William Wilson mendapati bahawa ia lebih kaya daripada Shakespeare. Untuk ini perlu ditambah data daripada ahli psikologi. Oleh itu, Terman, berdasarkan pemerhatian sejumlah besar kes, menetapkan bahawa perbendaharaan kata kanak-kanak purata adalah kira-kira 3,600 perkataan, dan pada usia 14 tahun ia sudah 9,000 Orang dewasa purata menggunakan 11,700 perkataan, dan orang yang "kecerdasan tinggi". menggunakan sehingga 13,500 7 0 . Oleh itu, data berangka itu sendiri tidak menyediakan sebarang asas untuk mengenal pasti kualiti gaya karya dan hanya "secara objektif" menentukan<119>Mereka menyatakan penggunaan bilangan perkataan yang berbeza oleh pengarang yang berbeza, yang, seperti yang ditunjukkan oleh pengiraan di atas, tidak berkaitan dengan nilai artistik relatif karya mereka.

Pengiraan kekerapan relatif penggunaan perkataan di kalangan pengarang individu dibina agak berbeza. Dalam kes ini, bukan sahaja jumlah keseluruhan perkataan, tetapi juga kekerapan penggunaan perkataan individu. Pemprosesan statistik bahan yang diperoleh dengan cara ini bermakna perkataan dengan kekerapan penggunaan yang sama dikumpulkan ke dalam kelas (atau pangkat), yang membawa kepada penubuhan taburan kekerapan semua perkataan yang digunakan oleh pengarang tertentu. Kes khas pengiraan jenis ini ialah penentuan kekerapan relatif perkataan khas (contohnya, perbendaharaan kata Romantik dalam karya Chaucer, seperti yang dilakukan oleh Mersand 7 1). Kekerapan relatif perkataan yang digunakan oleh pengarang mengandungi maklumat objektif yang sama tentang gaya pengarang individu seperti pengiraan ringkasan di atas, dengan satu-satunya perbezaan bahawa hasilnya adalah data berangka yang lebih tepat. Tetapi ia juga digunakan untuk tarikh karya individu pengarang yang sama berdasarkan pengiraan awal kekerapan relatif penggunaan perkataan dalam tempoh yang berbeza dalam hidupnya (berdasarkan karya bertarikh oleh pengarang sendiri). Satu lagi jenis penggunaan data daripada pengiraan sedemikian adalah untuk menentukan ketulenan kepengarangan karya yang soalan ini nampaknya meragukan 7 2 . Dalam kes terakhir ini, semuanya berdasarkan perbandingan formula statistik untuk kekerapan penggunaan dalam karya tulen dan kontroversi. Tidak perlu bercakap tentang relativiti yang sangat hebat dan anggaran keputusan yang diperolehi oleh kaedah sedemikian. Lagipun, kekerapan relatif penggunaan berubah bukan sahaja dengan umur pengarang, tetapi juga bergantung pada genre, plot, serta persekitaran sejarah karya (rujuk, sebagai contoh, "Roti" dan "Peter I ” oleh A. Tolstoy).<120>

Memperdalam kaedah yang diterangkan di atas, stilostatistik mula menggunakan kriteria kestabilan kekerapan relatif perkataan yang paling biasa sebagai ciri gaya. Kaedah yang digunakan dalam kes ini boleh digambarkan oleh pemprosesan statistik cerita Pushkin "The Captain's Daughter", yang dijalankan oleh Jesselson dan Epstein di Institut Bahasa Slavik di Universiti Detroit (AS) 7 3 . Keseluruhan teks cerita (kira-kira 30,000 kes penggunaan perkataan) telah diperiksa, dan kemudian petikan yang mengandungi kira-kira 10,000 dan 5,000 kes penggunaan. Seterusnya, untuk menentukan kestabilan kekerapan relatif penggunaan perkataan, untuk 102 perkataan yang paling biasa (dengan kekerapan dari 1160 kali hingga 35), kekerapan relatif yang dikira (dibuat berdasarkan petikan sampel) dibandingkan dengan yang sebenar. Sebagai contoh, kata hubung "dan" digunakan sebanyak 1,160 kali sepanjang cerita. Dalam petikan yang mengandungi 5,000 kemunculan semua perkataan, kami menjangkakan kata hubung ini digunakan 5,000 x 1,160:30,000, atau kira-kira 193 kali, dan dalam petikan yang mengandungi 10,000 kemunculan semua perkataan, ia dijangka digunakan 10,000 kali x 1,160: 30,000, atau 386 kali. Perbandingan data yang diperoleh menggunakan pengiraan seperti ini dengan data sebenar menunjukkan sisihan yang sangat tidak ketara (dalam 5%). Berdasarkan pengiraan yang sama, didapati bahawa dalam cerita ini oleh Pushkin kata depan "k" digunakan dua kali lebih kerap daripada "y", dan kata ganti "anda" digunakan tiga kali lebih kerap daripada "mereka", dll. Oleh itu, walaupun Walaupun terdapat pelbagai liku-liku plot, baik sepanjang keseluruhan cerita dan bahagian individunya, terdapat kestabilan dalam kekerapan relatif penggunaan perkataan. Apa yang diperhatikan berhubung dengan beberapa perkataan (paling biasa) mungkin boleh digunakan berhubung dengan semua perkataan yang digunakan dalam karya. Ia berikutan bahawa gaya pengarang boleh dicirikan oleh nisbah tertentu kebolehubahan purata kekerapan penggunaan sesuatu perkataan kepada jumlah untuk bahasa tertentu.<121>kekerapan penggunaannya. Nisbah ini dianggap sebagai ciri kuantitatif objektif gaya pengarang.

Unsur formal struktur bahasa yang lain dikaji dengan cara yang sama. Sebagai contoh, V. Fuchs tertakluk kepada pemeriksaan perbandingan dan statistik ciri-ciri metrik karya Goethe, Rilke, Caesar, Sallust dan lain-lain

Kriteria kestabilan kekerapan relatif penggunaan perkataan, sambil menjelaskan teknik pencirian kuantitatif gaya, tidak memperkenalkan sesuatu yang secara asasnya baru berbanding dengan kaedah yang lebih primitif yang dibincangkan di atas. Semua kaedah stilostatistik akhirnya menghasilkan hasil yang sama, meluncur di atas permukaan bahasa dan berpaut hanya pada semata-mata tanda-tanda luaran keputusan "objektif". Kaedah kuantitatif, nampaknya, tidak dapat memberi tumpuan kepada perbezaan kualitatif dalam bahan yang dikaji dan sebenarnya meratakan semua objek yang dikaji.

Di mana spesifikasi maksimum diperlukan, kriteria yang paling umum dicadangkan; ciri kualitatif dinyatakan dalam bahasa kuantiti. Ini bukan sahaja percanggahan logik, tetapi juga perselisihan dengan sifat sesuatu. Sebenarnya, apa yang berlaku jika kita cuba mendapatkan ciri gaya perbandingan (iaitu, oleh itu, kualitatif) karya Alexander Gerasimov dan Rembrandt berdasarkan nisbah kuantitatif cat merah dan hitam pada kanvas mereka? Nampaknya, ini adalah karut sama sekali. Sejauh manakah maklumat kuantitatif "objektif" sepenuhnya tentang data fizikal seseorang mampu memberi kita gambaran tentang segala-galanya yang mencirikan seseorang dan membentuk intipatinya yang sebenar? Jelas sekali, tiada. Mereka hanya boleh berfungsi sebagai tanda individu yang membezakan seseorang daripada yang lain, seperti kesan belitan pada ibu jari. Keadaannya sama dengan ciri kuantitatif gaya sastera. Jika anda melihat dengan teliti, mereka menyediakan data yang sama sedikit untuk menilai gaya sebenar<122>kualiti bahasa pengarang, serta penerangan tentang lilitan jari untuk kajian psikologi manusia.

Kepada semua yang telah dikatakan, perlu ditambah bahawa pada masa lalu, dalam apa yang dipanggil sekolah kritikan sastera formal, percubaan telah dibuat untuk mengkaji secara kuantitatif gaya penulis, apabila pengiraan dibuat dengan julukan, metafora, dan unsur berirama dan melodi pantun. Walau bagaimanapun, percubaan ini tidak dikembangkan lagi.

Satu lagi bidang aplikasi kaedah matematik untuk kajian fenomena linguistik boleh digabungkan di bawah nama statistik linguistik. Ia bertujuan untuk menceroboh persoalan asas teori bahasa dan dengan itu memperoleh panggilan dalam bidang linguistik yang betul. Untuk membiasakan diri dengan arahan ini, adalah lebih baik untuk beralih kepada karya Herdan yang telah disebutkan, dalam kata-kata salah satu daripada banyak pengulasnya, "buku yang sangat megah" 7 5 , yang bagaimanapun mendapat sambutan yang meluas dalam kalangan ahli bahasa 7 6 . Disebabkan fakta bahawa Kherdan (seperti yang telah dinyatakan di atas) berusaha untuk mengumpulkan dalam bukunya semua yang paling penting dalam bidang aplikasi kaedah matematik untuk masalah linguistik, dalam bukunya kita sebenarnya tidak berurusan dengan Kherdan, tetapi dengan arah keseluruhan. Seperti yang ditunjukkan oleh tajuk buku itu sendiri - "Bahasa sebagai Pilihan dan Kebarangkalian" - perhatian utamanya adalah bertujuan untuk mengetahui apa dalam bahasa yang diserahkan kepada pilihan bebas penutur dan apa yang ditentukan oleh struktur bahasa yang kekal, hanya kerana ia adalah dalam menentukan hubungan kuantitatif antara unsur-unsur tertib pertama dan kedua. Buku Herdan menyediakan maklumat yang hampir lengkap tentang semua kerja di kawasan ini yang dijalankan oleh wakil pelbagai kepakaran<123>(ahli falsafah, ahli bahasa, ahli matematik, juruteknik), tetapi tidak terhad kepada ini dan merangkumi banyak pemerhatian, pertimbangan dan kesimpulan asal pengarang sendiri. Sebagai karya sumatif, ia memberikan idea yang baik tentang kaedah kuantitatif yang digunakan dan hasil yang dicapai dengan bantuan mereka. Isu yang kami gabungkan secara bersyarat ke dalam bahagian statistik linguistik ditangani dalam bahagian kedua dan keempat buku.

Daripada banyak kes menggunakan kaedah statistik matematik untuk kajian isu linguistik, kami akan memberi tumpuan kepada yang paling umum, yang pada masa yang sama boleh dianggap sebagai yang paling tipikal. Menggunakan data daripada pengarang lain - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Diway 8 1 dan lain-lain, serta memetik penyelidikan mereka sendiri yang menentukan kekerapan relatif taburan fonem, huruf, panjang perkataan (diukur dengan bilangan huruf dan suku kata), bentuk tatabahasa dan unsur metrik dalam heksameter Latin dan Yunani, Herdan menetapkan fakta kestabilan frekuensi relatif unsur linguistik sebagai ciri umum semua struktur linguistik. Dia memperoleh peraturan berikut: “Perkadaran unsur linguistik kepunyaan satu atau satu lagi peringkat atau sfera pengekodan linguistik - fonologi, tatabahasa, metrik - kekal lebih kurang tetap untuk bahasa tertentu, dalam waktu ini perkembangannya dan dalam had pemerhatian yang agak meluas dan tidak berat sebelah” 8 2. Peraturan ini, yang Herdan panggil sebagai undang-undang asas bahasa, dia berusaha untuk mentafsir dan mengembangkan dengan cara tertentu. “Ia,” tulis Herdan tentang undang-undang ini, “adalah ungkapan fakta bahawa di sini pun, di mana kehendak manusia dan kebebasan memilih diberikan<124>rangka kerja yang paling luas, di mana pilihan sedar dan bermain riang jelas silih berganti antara satu sama lain, secara keseluruhannya terdapat kestabilan yang agak besar... Penyelidikan kami telah mendedahkan satu lagi faktor susunan umum: persamaan yang meluas antara ahli komuniti linguistik yang sama diperhatikan bukan sahaja dalam sistem fonem, dalam kamus dan dalam tatabahasa, tetapi juga berkaitan dengan kekerapan penggunaan fonem tertentu, unit leksikal (perkataan) dan fonem dan binaan tatabahasa; dalam erti kata lain, persamaan itu bukan sahaja pada apa yang digunakan, tetapi juga pada kekerapan ia digunakan." 8 3 Keadaan ini disebabkan oleh sebab yang jelas, tetapi ia menimbulkan kesimpulan baru. Apabila meneliti teks atau segmen yang berbeza dalam bahasa tertentu, sebagai contoh, seseorang mendapati bahawa frekuensi relatif penggunaan fonem tertentu itu (atau unsur pertuturan lain) oleh orang yang berbeza pada dasarnya tetap sama. Ini membawa kepada tafsiran bentuk pertuturan individu sebagai turun naik tertentu dalam kebarangkalian berterusan menggunakan fonem berkenaan dalam bahasa tertentu. Oleh itu ternyata bahawa dalam aktiviti pertuturan manusia tertakluk kepada undang-undang kebarangkalian tertentu mengenai bilangan unsur linguistik yang digunakan. Dan kemudian, apabila kita memerhatikan sejumlah besar unsur linguistik dalam koleksi teks atau segmen ucapan yang besar, kita mendapat kesan pergantungan kausal dalam erti kata bahawa dalam kes ini terdapat juga penentuan berhubung dengan penggunaan linguistik tertentu. elemen. Dalam erti kata lain, ternyata dibenarkan untuk menegaskan bahawa dari sudut pandangan intuitif yang kelihatan sebagai hubungan sebab akibat adalah, dari segi kuantitatif, kebarangkalian 8 4 . Adalah jelas bahawa semakin besar jumlahnya<125>teks atau segmen ucapan yang diperiksa, lebih jelas kestabilan kekerapan relatif penggunaan unsur linguistik juga akan dimanifestasikan dalam penggunaan individu (hukum nombor besar). Dari sini kesimpulan umum baru dibuat bahawa bahasa adalah fenomena jisim dan harus diperlakukan sedemikian.

Kesimpulan ini, yang dicapai berdasarkan pengiraan kekerapan unsur-unsur fonetik, perkataan dan bentuk tatabahasa yang bersama-sama membentuk bahasa, kemudian digunakan untuk "tafsiran statistik" pembahagian Saussure kepada "bahasa" (lalangue) dan "pertuturan" (laparole) . Menurut Saussure, "bahasa" ialah satu set tabiat linguistik yang membolehkan komunikasi antara ahli komuniti linguistik tertentu. Ini adalah realiti sosial, "fenomena massa", wajib bagi semua orang yang bercakap bahasa tertentu. Herdan, seperti yang ditunjukkan, berpendapat bahawa ahli-ahli komuniti linguistik tunggal adalah serupa antara satu sama lain bukan sahaja kerana mereka menggunakan fonem, unit leksikal dan bentuk tatabahasa yang sama, tetapi juga kerana semua elemen ini digunakan dengan frekuensi yang sama. Oleh itu, takrifan statistik "bahasa" beliau mengambil bentuk berikut: "bahasa" (lalangue) ialah keseluruhan unsur linguistik biasa ditambah kebarangkalian relatifnya untuk digunakan.

Takrifan "bahasa" ini juga merupakan titik permulaan untuk tafsiran statistik yang sepadan bagi "ucapan," yang, menurut Saussure, merupakan ujaran individu. Membezakan "bahasa" sebagai fenomena sosial dengan "pertuturan" sebagai fenomena individu, Saussure menulis: "Pertuturan adalah tindakan kehendak dan pemahaman individu, di mana seseorang mesti membezakan: 1. kombinasi dengan bantuan subjek yang bercakap menggunakan kod linguistik untuk menyatakan pemikiran peribadinya; 2. mekanisme psikofizikal yang membolehkannya untuk membantah kombinasi ini” 8 5. Oleh kerana "bahasa" dalam statistik linguistik dianggap sebagai satu set elemen dengan saudara tertentu<126>kebarangkalian tertentu penggunaannya, sehingga ke tahap yang merangkumi populasi statistik atau kumpulan (populasi) sebagai ciri penting dan boleh dipertimbangkan dalam aspek ini. Selaras dengan ini, "ucapan" bertukar menjadi sampel berasingan yang diambil daripada "bahasa" sebagai agregat statistik. Kebarangkalian dalam kes ini ditentukan oleh hubungan "pertuturan" dengan "bahasa" (dalam pemahaman "kuantitatif" mereka), dan taburan kekerapan relatif penggunaan unsur-unsur bahasa yang berbeza ditafsirkan sebagai hasil kolektif “pilihan” dalam tempoh kronologi tertentu kewujudan bahasa itu. Menyedari bahawa tafsiran perbezaan antara "bahasa" dan "pertuturan" masih dibina di atas asas yang sama sekali berbeza daripada Saussure, Herdan menulis dalam hal ini: "Pengubahsuaian kecil konsep Saussure ini mempunyai akibat penting bahawa "bahasa" ( lalangue) kini memperoleh ciri penting dalam bentuk agregat statistik (populasi). Populasi ini dicirikan oleh frekuensi relatif tertentu atau kebarangkalian turun naik, dengan mengingati bahawa setiap unsur linguistik tergolong dalam tahap linguistik tertentu. Dalam kes ini, "ucapan" (laparole), mengikut maknanya, ternyata menjadi istilah untuk mentakrifkan sampel statistik yang diambil daripada "bahasa" sebagai populasi statistik. Menjadi jelas bahawa pilihan muncul di sini dalam bentuk hubungan "pertuturan" dengan "bahasa", sebagai hubungan sampel rawak dengan jumlah statistik (populasi). Susunan taburan kekerapan, sebagai simpanan aktiviti pertuturan komuniti linguistik selama berabad-abad, mewakili unsur pilihan, tetapi bukan pilihan individu, seperti dalam gaya, tetapi pilihan kolektif. Menggunakan metafora, kita boleh bercakap di sini tentang pilihan yang dibuat oleh semangat bahasa, jika kita memahami dengan ini prinsip-prinsip komunikasi linguistik, yang sesuai dengan kompleks data mental ahli-ahli komuniti linguistik tertentu. Kestabilan siri adalah hasil kebarangkalian (peluang)” 8 6 .

Kes khas penggunaan prinsip yang dinyatakan<127>PA ialah perbezaan dalam bahasa fenomena normatif daripada "pengecualian" (penyimpangan). Dalam linguostatistik dikatakan bahawa kaedah statistik membolehkan kita menghapuskan kekaburan yang wujud dalam isu ini dan mewujudkan kriteria yang jelas untuk membezakan antara fenomena ini. Jika norma itu difahami sebagai agregat statistik (dalam erti kata di atas), dan pengecualian (atau ralat) ialah sisihan daripada frekuensi yang ditunjukkan oleh agregat statistik, maka penyelesaian kuantitatif kepada soalan mencadangkan dirinya sendiri. Semuanya berpunca daripada hubungan statistik antara "populasi" dan "varians." Jika frekuensi yang diperhatikan dalam sampel tunggal menyimpang daripada kebarangkalian yang tersirat oleh populasi statistik dengan lebih daripada yang akan ditentukan oleh satu siri kiraan sampel, maka kita wajar untuk membuat kesimpulan bahawa garis persempadanan antara "sama" (norma) dan "tidak sama" (pengecualian) ternyata dilanggar.

Perbezaan kuantitatif antara "bahasa" dan "pertuturan" juga digunakan untuk membezakan antara dua jenis unsur linguistik: tatabahasa dan leksikal. Titik permulaan untuk menyelesaikan masalah ini, yang sering menimbulkan kesukaran besar dari sudut linguistik, adalah andaian bahawa darjah kekerapan unsur tatabahasa adalah berbeza daripada unit leksikal. Ini sepatutnya dikaitkan dengan "generalisasi" unsur tatabahasa, bagaimana ia berbeza daripada konsep yang ditetapkan oleh unit leksikal. Di samping itu, unsur tatabahasa sepatutnya, sebagai peraturan, jauh lebih kecil dalam volum: sebagai kata bebas (kata ganti nama, preposisi, kata hubung dan perkataan fungsi) mereka biasanya terdiri daripada sebilangan kecil fonem, dan dalam bentuk "bentuk berangkai" - satu atau dua fonem 8 7 . Semakin kecil unsur linguistik, semakin kurang mampu "panjang"nya (momen kuantitatif) untuk berfungsi sebagai ciri yang menentukan dan semakin penting "kualiti" fonem untuk tujuan ini. Apakah kaedah yang dicadangkan untuk menyelesaikan masalah yang sedang dipertimbangkan? Ia diselesaikan dengan merayu kepada konsep tatabahasa kuantitatif semata-mata<128>memuatkan, "Andaikan," tulis Kherdan dalam hal ini, "bahawa kami berminat untuk membandingkan dua bahasa dalam hal ini. Bagaimanakah kita menentukan, dengan tahap objektiviti tertentu, "beban tatabahasa" yang ditanggung oleh bahasa? Adalah jelas bahawa beban ini akan bergantung kepada kedudukan garis persempadanan yang memisahkan tatabahasa daripada kosa kata. Pertimbangan pertama yang mungkin terlintas di fikiran kita adalah untuk menentukan betapa "kompleks" tatabahasa bahasa tertentu. Lagipun, "kerumitan" adalah ciri kualitatif, dan konsep "beban tatabahasa" adalah ciri kuantitatif. Benar, beban bergantung pada tahap tertentu pada kerumitan, tetapi tidak sepenuhnya. Bahasa boleh diberi ganjaran yang sangat besar tatabahasa yang kompleks, tetapi hanya sebahagian kecil daripadanya digunakan dalam aktiviti bahasa. Kami mentakrifkan "beban tatabahasa" sebagai keseluruhan tatabahasa yang dibawa oleh bahasa apabila ia dalam tindakan, yang segera meletakkan masalah kami dalam bidang linguistik struktur dalam erti kata di mana disiplin ini ditakrifkan oleh Saussure. Dalam pembentangan berikut, kaedah kuantitatif digunakan untuk menentukan perbezaan antara bahasa bergantung pada di mana sempadan yang memisahkan tatabahasa daripada kosa kata terletak” 8 8 . Dalam erti kata lain, perbezaan antara bahasa dalam kes ini harus dikurangkan kepada perbezaan dalam hubungan berangka antara unsur tatabahasa dan leksikal.

Bahan-bahan yang kami gunakan melukis gambar berikut. Dalam bahasa Inggeris (hanya "perkataan tatabahasa" diambil kira: kata ganti nama, atau, sebagaimana ia juga dipanggil, "pengganti", preposisi, kata hubung dan kata kerja bantu) dalam segmen termasuk 78,633 kes penggunaan semua perkataan (1027 perkataan berbeza), 53,102 kes penggunaan unsur tatabahasa, atau, lebih tepat lagi, "kata tatabahasa" (149 perkataan yang berbeza), iaitu 67.53% dengan 15.8% perkataan berbeza. Ini adalah data Diway 8 9 . Data lain menunjukkan peratusan yang berbeza<129>nisbah: 57.1% dengan 5.4% perkataan berbeza 9 0. Percanggahan yang ketara ini dijelaskan oleh perbezaan antara bahasa bertulis dan bahasa lisan. Bentuk bahasa bertulis (data pertama) kononnya menggunakan lebih banyak unsur tatabahasa daripada bentuk lisan (kes kedua). Dalam Komedi Ilahi Dante (berdasarkan asal Itali), Mariotti menetapkan 54.4% daripada kes penggunaan "kata tatabahasa".

Cara lain dan nampaknya lebih maju untuk menentukan beban tatabahasa sesuatu bahasa ialah dengan mengira fonem yang termasuk dalam unsur tatabahasa. Dalam kes ini, bukan sahaja perkataan tatabahasa bebas diambil kira, tetapi juga borang berkaitan. Pelbagai pilihan boleh didapati di sini. Sebagai contoh, menentukan kekerapan relatif penggunaan fonem konsonan individu dalam unsur tatabahasa dan membandingkannya dengan kekerapan jumlah penggunaan fonem yang sama ini (data akhir untuk nisbah sedemikian dalam bahasa Inggeris memberikan perkadaran 99.9% hingga 100,000 - jumlah penggunaan); atau perbandingan konsonan yang serupa mengikut kumpulan pengelasan individu (labial, palatal, velar dan fonem lain). Nisbah akhir di sini mengambil bentuk bahagian 56.47% (dalam unsur tatabahasa) hingga 60.25% (dalam jumlah penggunaan); atau perbandingan fonem konsonan awal yang sama (dalam kes ini, nisbahnya ialah 100.2% dalam perkataan tatabahasa kepada 99.95 dalam jumlah penggunaan). Operasi statistik lain yang lebih kompleks juga boleh dilakukan, yang bagaimanapun, menghasilkan ungkapan kuantitatif yang serupa bagi masalah yang dikaji.

Data kuantitatif yang dibentangkan berfungsi sebagai asas untuk kesimpulan umum. Ia berpunca daripada fakta bahawa taburan fonem dalam unsur tatabahasa menentukan sifat taburan (dalam istilah berangka, sudah tentu) fonem dalam bahasa secara keseluruhan. Dan ini, seterusnya, membolehkan kita menyimpulkan bahawa penggunaan unsur tatabahasa bergantung pada tahap yang paling sedikit pada pilihan individu dan merupakan sebahagian daripada ungkapan linguistik yang mungkin dikawal.<130>ness. Kesimpulan spekulatif ini disahkan oleh pengiraan bentuk tatabahasa dalam bahasa Rusia yang dibuat oleh Jesselson 9 1 . Kajian itu merangkumi 46,896 perkataan yang diambil daripada sumber II (karya Griboyedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfitheatrov, Gusev-Orenburgsky, Ehrenburg, Simonov dan N. Ostrovsky). Mereka dibahagikan kepada perkataan yang dituturkan (17,756 perkataan, atau 37.9%) dan perkataan yang tidak dituturkan (29,140 perkataan, atau 62.1%). Kemudian keseluruhan set perkataan dibahagikan kepada 4 kumpulan bergantung kepada sifat tatabahasanya: kumpulan pertama termasuk kata nama, kata adjektif, kata sifat sebagai kata nama, kata ganti nama dan angka infleksi; dalam kumpulan ke-2 - kata kerja; dalam kumpulan ke-3 - participles verbal, participles sebagai kata sifat dan kata nama dan gerund; dalam kumpulan ke-4 - bentuk kata keterangan, preposisi, kata sendi dan partikel yang tidak boleh diubah. Keputusan keseluruhan (jadual dengan data mengenai pengarang individu juga disediakan) memberikan nisbah berikut:

kumpulan pertama

kumpulan ke-2

kumpulan ke-3

kumpulan ke-4

bahasa sehari-hari

tak terucap

Herdan mencirikan pertimbangan data kuantitatif yang diperolehi dalam perkataan berikut: “Mereka membenarkan kesimpulan bahawa unsur tatabahasa harus dipertimbangkan sebagai faktor yang menentukan kebarangkalian ungkapan linguistik. Kesimpulan ini mengelakkan kelayakan yang membebankan setiap perkataan yang digunakan. Adalah jelas bahawa, memandangkan tatabahasa dan perbendaharaan kata tidak disimpan dalam cangkerang kalis air, begitu juga pilihan tulen atau peluang tulen. Kedua-dua tatabahasa dan perbendaharaan kata mengandungi kedua-dua unsur, walaupun dalam perkadaran yang berbeza-beza secara ketara” 9 2.<131>

Sebilangan besar buku Herdan dikhaskan untuk mengkaji dualiti atau dualiti dalam bahasa, dan konsep dualitas adalah berdasarkan ciri-ciri matematik.

Oleh itu, teorem dalam geometri projektif boleh disusun dalam dua baris, supaya setiap teorem satu baris boleh diperolehi daripada beberapa teorem baris lain dengan menggantikan perkataan antara satu sama lain. titik Dan lurus. Sebagai contoh, jika proposisi diberikan: "mana-mana titik berbeza kepunyaan satu dan hanya satu baris," maka kita boleh mendapatkan daripadanya proposisi yang sepadan: "mana-mana dua garis berbeza tergolong dalam satu dan hanya satu titik." Kaedah lain untuk menentukan dualiti adalah dengan memplot satah berbeza bagi fenomena yang dikaji di sepanjang paksi absis dan ordinat. Sebagai contoh, Yul melakukan 9 3, pelbagai frekuensi penggunaan dikira sepanjang paksi-x, dan bilangan unit leksikal yang frekuensi ditentukan, dsb., dikira sepanjang paksi ordinat Beginilah konsepnya dualitas ditafsirkan, kononnya sama terpakai untuk penyelidikan .linguistik.

Di bawah konsep dualitas yang ditakrifkan dengan cara ini, yang dalam semua kes sebenarnya mempunyai ciri kod binari dan yang juga dianggap sebagai ciri yang paling penting dalam struktur linguistik, fenomena kualitatif yang sangat berbeza dirumuskan, membolehkan penentangan pada dua peringkat. : taburan penggunaan kata mengikut sifat unit leksikal dan taburan unit leksikal mengikut kekerapan penggunaan kata; bentuk ucapan bertulis dan lisan; unsur leksikal dan tatabahasa; sinonim dan antonim; fonem dan perwakilan grafiknya; ditakrifkan dan ditakrifkan (Saussure's signifiant and signifiy), dsb.

Selepas kajian kuantitatif tentang dualitas satu atau satu lagi perkara, fenomena linguistik atau "teks" terhad, kesimpulan biasanya dibuat yang mana kualiti kesejagatan linguistik dikaitkan. Sifat kesimpulan sedemikian dan cara ia dibuktikan boleh dikesan menggunakan contoh<132>penyelidikan ke dalam dualiti perkataan dan konsep (sebenarnya, kita bercakap tentang hubungan antara panjang perkataan dan kelantangan konsep - kita mesti ingat bahawa penggunaan linguistik dan istilah lain yang sangat bebas dalam karya sedemikian sering menjadikan pemahaman sangat sukar). Adalah penting untuk diperhatikan bahawa bahan yang berfungsi sebagai sumber pemerhatian jenis dualitas linguistik ini digunakan: tatanama penyakit antarabangsa (kira-kira 1000 nama) dan daftar umum penyakit untuk England dan Wells untuk 1949. Dalam kes ini , kesimpulan umum berikut dibuat: " Setiap konsep yang menunjukkan idea umum mempunyai apa yang boleh dipanggil "sfera" atau "isipadu." Ia membolehkan, melalui mediumnya, untuk memikirkan banyak objek atau konsep lain yang terletak dalam "sfera"nya. Sebaliknya, semua item yang diperlukan untuk menentukan konsep membentuk apa yang dipanggil "kandungan"nya. Jilid dan kandungan saling berkorelasi - lebih kecil kandungan dan, oleh itu, lebih abstrak konsep, lebih besar skop atau volumnya, iaitu, lebih banyak objek diletakkan di bawahnya. Ini boleh dilihat sebagai analogi (dalam sfera konseptual) kepada prinsip pengekodan, mengikut mana panjang simbol dan kekerapan penggunaan adalah saling bergantung” 9 4.

Prinsip dualitas juga digunakan untuk masalah tertentu. Sebagai contoh, apabila menetapkan padanan makna perkataan dua perbezaan bahasa. Hasil daripada kajian kamus Inggeris-Jerman Muhret - Zanders menggunakan kaedah matematik lelaran, disimpulkan bahawa kebarangkalian menggunakan perkataan Inggeris dengan satu atau lebih nilai dalam terjemahan Jerman kekal malar untuk setiap huruf awal di seluruh kamus 9 5 . Pertimbangan susunan perkataan dalam kamus Cina membawa kepada kesimpulan bahawa ia bersifat taksonomi, kerana bilangan sebatan dalam aksara menunjukkan tempatnya (sebagai radikal bebas atau subkelas khusus yang berada di bawah radikal). Taksonomi ialah prinsip klasifikasi subordinat yang digunakan dalam zoologi dan botani. Herdan menyatakan bahawa<133>asas leksikografi Cina juga dibina berdasarkan prinsip taksonomi 9 6, dsb.

Apabila membuat penilaian umum tentang arah penggunaan kaedah matematik ini kepada kajian masalah linguistik (iaitu, statistik linguistik), nampaknya perlu untuk meneruskan dari kedudukan yang telah dirumuskan oleh Ettinger: "Matematik boleh digunakan dengan berkesan dalam perkhidmatan. linguistik hanya apabila ahli bahasa jelas had sebenar penggunaannya, serta keupayaan model matematik yang digunakan” 9 7. Dalam erti kata lain, kita boleh bercakap tentang linguistik matematik apabila kaedah matematik membuktikan kesesuaiannya untuk menyelesaikan masalah linguistik dengan betul, yang secara keseluruhannya membentuk sains bahasa. Jika ini tidak berlaku, walaupun ini mungkin membuka aspek penyelidikan saintifik baru, maka dalam kes ini kita boleh bercakap tentang apa sahaja, tetapi bukan tentang linguistik - dalam kes ini kita tidak bermaksud jenis yang berbeza linguistik gunaan (yang akan dibincangkan di bawah), tetapi linguistik saintifik, atau teoritis. Berdasarkan kedudukan ini, perlu diperhatikan bahawa dari sudut pandangan ahli bahasa, banyak dalam statistik linguistik menimbulkan keraguan dan juga kebingungan.

Mari kita beralih kepada analisis hanya dua contoh (supaya tidak mengacaukan pembentangan), membuat tempahan bahawa bantahan yang sangat ketara boleh dibuat kepada setiap daripada mereka. Di sini kita mempunyai perbezaan kuantitatif antara unit tatabahasa dan leksikal. Ternyata untuk membuat perbezaan sedemikian, adalah perlu untuk mengetahui terlebih dahulu apa yang termasuk dalam bidang tatabahasa dan apa yang menjadi perbendaharaan kata, kerana "beban tatabahasa" bahasa (iaitu, keseluruhan unsur tatabahasa yang digunakan dalam pertuturan), seperti yang ditunjukkan dalam petikan di atas, "bergantung pada garis penandaan yang memisahkan perbendaharaan kata daripada tatabahasa." Tanpa mengetahui di mana garis ini terletak, oleh itu adalah mustahil untuk membuat perbezaan yang ditunjukkan. Apakah pula maksud kaedah kuantitatif membezakan leksikal daripada tatabahasa<134>matic? Walau bagaimanapun, bagi Kherdan, dia tidak terlalu memikirkan isu ini dan dengan berani mengklasifikasikan unsur-unsur linguistik, mengklasifikasikan sebagai unsur tatabahasa "bentuk yang berkaitan", yang, berdasarkan pembentangan, sepatutnya bermaksud infleksi luaran, dan "kata-kata tatabahasa", yang merangkumi preposisi. , kata hubung, kata kerja bantu dan kata ganti nama - yang terakhir disebabkan oleh fakta bahawa mereka adalah "pengganti". Tetapi jika kita hanya bercakap tentang kualiti kata ganti ini dan atas dasar ini mengaitkannya dengan unsur tatabahasa, maka jelas perkataan seperti "disebut", "bernama", "diberi", dll. juga harus dimasukkan ke dalamnya, jadi bagaimana mereka juga bertindak sebagai pengganti. Sehubungan dengan kaedah mengasingkan unsur-unsur tatabahasa yang digunakan dalam statistik linguistik, persoalan secara semula jadi timbul tentang bagaimana menangani dalam kes ini dengan fenomena tatabahasa "tanpa bentuk" seperti susunan kata, nada, morfem sifar, hubungan paradigmatik (beberapa fenomena ini, oleh caranya, didapati tercermin dalam bahasa-bahasa yang dipelajari menggunakan kaedah matematik)? Bagaimana untuk membuat perbezaan dalam bahasa dengan infleksi dalaman yang kaya (seperti, sebagai contoh, dalam bahasa Semitik), di mana ia menjalankan bukan sahaja pengubahsuaian tatabahasa akar (radikal), tetapi juga memberikannya kewujudan leksikal, sejak akar tanpa kata semula tiada kewujudan sebenar dalam bahasa? Apakah yang perlu difahami oleh kerumitan tatabahasa sesuatu bahasa, apakah kriteria ia ditentukan? Jika titik kuantitatif, yang dalam kes ini sangat ditekankan, maka salah satu bahasa yang paling kompleks dari segi tatabahasa ialah bahasa Inggeris, yang mempunyai pembinaan seperti IshallhavebeencallingorHewouldhavebeencalling. Dalam ayat ini, hanya panggilan boleh diklasifikasikan sebagai leksikal, dan semua yang lain, oleh itu, harus dianggap tatabahasa. Apakah alasan yang wujud untuk mengaitkan kekerapan penggunaan unsur tatabahasa dengan keumuman atau keabstrakan makna perkataan tatabahasa? Lagipun, agak jelas bahawa kekerapan penggunaan unsur tatabahasa yang agak tinggi ditentukan oleh fungsinya dalam pembinaan ayat, dan bagi keabstrakan makna, sangat mudah untuk mencari yang besar.<135>bilangan unsur leksikal yang mudah bersaing dengan unsur tatabahasa dalam hal ini, yang sebahagian besarnya lebih rendah daripadanya dalam kekerapan (contohnya, wujud, kewujudan, lanjutan, ruang, zat dan lain-lain).

Jenis kemustahilan yang serupa dihadapi kita dalam hal mentakrifkan dualiti perkataan dan konsep. Seseorang mesti mempunyai pemahaman yang sangat unik tentang intipati struktur bahasa untuk menundukkannya kepada penyelidikan menggunakan tatanama penyakit dan daftar penyakit hospital, yang, seperti yang dinyatakan di atas, berfungsi sebagai bahan sumber untuk kesimpulan linguistik yang sangat penting. Tanpa memikirkan penggunaan istilah bukan linguistik yang sama sekali tidak jelas seperti sfera, kelantangan dan kandungan sesuatu konsep (omong-omong, makna leksikal perkataan dan konsep yang dilambangkan oleh istilah saintifik adalah sangat keliru), mari kita beralih kepada kesimpulan yang dibuat dalam kes ini. Seperti yang dinyatakan di atas, kami berurusan dengan pernyataan bahawa "volum dan kandungan saling berkorelasi." Seluruh garis penaakulan yang menyediakan asas untuk kesimpulan sedemikian, serta kaedah manipulasi matematik fakta linguistik, jelas menunjukkan bahawa dalam kes ini satu kualiti bahasa yang sangat penting diabaikan sepenuhnya, yang membatalkan semua pengiraan yang dibuat: keupayaan untuk menyatakan perkara yang sama "kandungan" oleh unit linguistik "isipadu" yang berbeza, yang pastinya juga mempunyai frekuensi relatif penggunaan yang berbeza. Jadi, kita boleh menamakan orang yang sama seperti Petrov, kenalan saya, dia, Muscovite, lelaki muda, pekerja universiti, abang isteri saya, lelaki yang kami temui di jambatan, dll. Berdasarkan fakta sedemikian, keraguan adalah tidak hanya menimbulkan kesimpulan tertentu, yang, bagaimanapun, seperti yang ditunjukkan, diberi kepentingan sejagat, tetapi juga kesesuaian untuk menggunakan kaedah kuantitatif itu sendiri untuk masalah linguistik seperti ini.

Tetapi kadang-kadang ahli bahasa ditawarkan kesimpulan yang kesahihannya tidak diragui. Ini adalah "undang-undang asas bahasa", yang terdiri daripada fakta bahawa dalam bahasa terdapat kestabilan tertentu unsur-unsurnya dan kekerapan relatif kejadiannya.<136>penggunaan. Masalah dengan penemuan seperti ini, bagaimanapun, adalah bahawa mereka telah lama diketahui oleh ahli bahasa. Lagipun, agak jelas bahawa jika bahasa itu tidak mempunyai kestabilan tertentu dan setiap ahli komuniti linguistik tertentu secara bebas mengubah unsur-unsur bahasa itu, maka komunikasi bersama tidak akan dapat dilakukan dan kewujudan bahasa itu akan menjadi tidak bermakna. . Bagi pengagihan kekerapan relatif penggunaan unsur bahasa individu, ia mendapati ungkapannya dalam linguistik dalam bentuk mengenal pasti kategori perbendaharaan kata dan tatabahasa pasif dan aktif, yang L. V. Shcherba memberi perhatian yang begitu banyak. Dalam kes ini, kaedah statistik hanya boleh membantu ahli bahasa dalam mengagihkan unsur linguistik tertentu ke dalam kategori kekerapan relatif penggunaannya, tetapi tidak mempunyai alasan untuk menuntut penemuan sebarang corak baharu yang bernilai untuk linguistik teori.

Sebaliknya, statistik linguistik menawarkan beberapa kesimpulan yang benar-benar "asli" yang sangat menunjukkan sifat pemikiran saintifik penganutnya. Oleh itu, kaedah statistik yang kompleks digunakan untuk mengkaji "perbendaharaan kata politik" dalam karya Churchill, Benes, Halifax, Stresemann dan lain-lain, dan terjemahan karya mereka ke dalam bahasa Inggeris digunakan dalam pengiraan untuk pengarang bukan berbahasa Inggeris. Keputusan pengiraan dibentangkan dalam bentuk pelbagai jadual, formula matematik dan persamaan. Tafsiran linguistik data kuantitatif dalam kes ini hanya bermuara kepada fakta bahawa penggunaan "perbendaharaan kata politik" oleh Churchill adalah yang paling tipikal (?) untuk kumpulan pengarang ini dan penggunaan kata-kata Churchill dalam kes-kes di mana dia membimbangkan isu politik adalah. tipikal komuniti pertuturan Inggeris 9 8 .

Dalam kes lain, selepas manipulasi statistik yang sesuai, disimpulkan bahawa Hitler, dalam penggunaan perkataan Nazi Jerman, melanggar dualiti antara "bahasa" dan "pertuturan" dalam pemahaman kuantitatif istilah ini. Satu kes khas pemusnahan dualitas ini ialah pemahaman literal<137>penggunaan frasa metafora (contohnya, "tuang garam ke dalam luka terbuka"). Nazi Jerman telah menjenamakan dirinya dengan begitu banyak tindakan tidak berperikemanusiaan sehingga hampir tidak ada keperluan untuk mensabitkannya dengan kekejaman bahasa ini 9 9 . Menurut Kherdan, definisi Marx tentang bahasa sebagai realiti pemikiran segera juga membawa kepada pelanggaran dualiti linguistik, dan undang-undang dialektik mengenai peralihan fenomena ke sebaliknya adalah, pada pendapatnya, undang-undang linguistik dualitas yang salah faham. daripada bahasa 100. Tafsiran semacam ini bercakap untuk diri mereka sendiri.

Akhir sekali, kelemahan umum, ciri semua kes di atas kaedah kuantitatif mengkaji bahan linguistik dan dengan itu memperoleh ciri metodologi, adalah pendekatan kepada elemen linguistik sebagai satu set fakta mekanikal yang benar-benar bebas antara satu sama lain, mengikut mana, walaupun jika beberapa atau corak, maka ia hanya berkaitan dengan hubungan berangka pengedaran fakta autonomi, di luar kebergantungan sistem mereka. Benar, J. Whatmough berusaha dalam setiap cara yang mungkin untuk memastikan bahawa matematik adalah lebih baik daripada mana-mana jenis analisis struktur linguistik yang mampu mendedahkan ciri-ciri struktur bahasa. "Matematik moden," tulisnya, "tidak mementingkan pengukuran dan kalkulus, yang ketepatannya oleh sifatnya adalah terhad, tetapi terutamanya dengan struktur. Inilah sebabnya mengapa matematik sangat kondusif kepada ketepatan pembelajaran bahasa - sehingga satu tahap yang penerangan yang berasingan, malah lebih terhad oleh sifatnya, tidak mampu... Sama seperti dalam fizik, unsur matematik digunakan untuk menggambarkan dunia fizikal , kerana ia diandaikan bersesuaian dengan unsur-unsur dunia fizikal, dan dalam linguistik matematik unsur-unsur matematik mungkin mesti sepadan dengan unsur-unsur dunia pertuturan" 1 01. Tetapi rumusan soalan sedemikian tidak menyelamatkan keadaan, kerana ia boleh dilakukan<138>memberikan analisis bahasa sama ada sebagai struktur fizikal, yang masih jauh daripada mencukupi untuk bahasa, dan akhirnya mempunyai ciri mekanistik yang sama, atau sebagai struktur logik-matematik, dan ini memindahkan bahasa ke satah yang berbeza dan sebahagian besarnya asing 102. Ia tidak berlebihan untuk diperhatikan bahawa Watmough meramalkan kejayaan linguistik matematik hanya pada masa hadapan, dan untuk keputusan sebenar mereka, dia menilai mereka dalam perkataan berikut: "... hampir semua kerja yang dilakukan sehingga kini oleh Herdan, Zipf, Yule, Guiraux dan lain-lain sama sekali tidak boleh dikritik daripada kedua-dua linguistik dan matematik; ia adalah amaturisme ke tahap yang besar” 1 03 . Oleh itu, jika kita tidak cuba meramal masa depan kaedah matematik dalam penyelidikan linguistik, tetapi cuba menilai dengan betul apa yang kita ada hari ini, maka kita semestinya perlu mengakui bahawa matematik sebenarnya setakat ini terhad dalam bidang linguistik sahaja "pengukuran dan pengiraan," dan saya tidak dapat memberikan analisis kualitatif tentang bahasa yang menyelidiki strukturnya.<139>

Kami tetap akan cuba bersikap objektif yang mungkin. Pada tahap tertentu, data kuantitatif nampaknya boleh digunakan oleh linguistik, tetapi hanya sebagai tambahan dan terutamanya dalam masalah yang mempunyai orientasi praktikal. Berkenaan dengan kebanyakan kaedah kuantitatif untuk mengkaji fenomena linguistik individu, kesimpulan umum R. Brown tidak diragukan lagi dibenarkan: "Mereka boleh dianggap sebagai pandangan Herdan, tetapi apakah maksud semua ini?" 1 04 . Bayangkan kita bertanya soalan: "Apakah pokok-pokok di taman ini?" Dan sebagai tindak balas kami menerima: "Terdapat seratus pokok di taman ini." Adakah ini jawapan kepada soalan kami dan adakah ia benar-benar masuk akal? Tetapi berhubung dengan banyak soalan linguistik, kaedah matematik memberikan jawapan seperti ini dengan tepat.

Walau bagaimanapun, terdapat bidang aktiviti penyelidikan yang luas yang menggunakan kaedah matematik dan pada masa yang sama memfokuskannya pada bahan linguistik, di mana kemungkinan gabungan sedemikian tidak menimbulkan keraguan. "Maksud" aktiviti penyelidikan ini, kepentingannya ditentukan oleh matlamat yang diusahakannya. Ia telah pun diuji dalam amalan. Dalam kes ini kita bercakap tentang masalah yang berkaitan dengan penciptaan mesin maklumat, struktur untuk terjemahan mesin bertulis teks ilmiah, automasi terjemahan ucapan lisan dari satu bahasa ke bahasa lain dan dengan semua tugasan yang kompleks yang digabungkan dalam isu linguistik sibernetik. Keseluruhan set masalah tersebut biasanya diberi nama umum linguistik gunaan. Oleh itu, ia dibezakan daripada apa yang dipanggil linguistik matematik, yang merangkumi bidang kerja yang ditetapkan di atas sebagai statistik gaya dan statistik linguistik, walaupun ia sama sekali tidak mengelakkan pemprosesan statistik bahan linguistik. Mungkin ciri yang paling penting dalam linguistik gunaan, yang memisahkannya daripada linguistik matematik seperti yang digariskan di atas, ialah yang pertama mempunyai orientasi yang bertentangan: bukan matematik untuk linguistik, tetapi linguistik.<140>(diformalkan oleh kaedah matematik) untuk pelbagai masalah praktikal.

Tidak perlu mendedahkan kandungan masalah individu yang termasuk dalam bidang linguistik gunaan yang kini sangat luas. Berbeza dengan linguistik matematik, masalah ini dibincangkan secara aktif dalam kesusasteraan linguistik Soviet dan betul-betul mula menduduki tempat yang semakin menonjol dalam masalah saintifik institut penyelidikan 1 05 . Oleh itu, mereka sudah cukup dikenali oleh komuniti linguistik kita. Keadaan ini, bagaimanapun, tidak membebaskan kita daripada keperluan untuk menundukkan mereka kepada pemahaman, khususnya, dari sudut pandangan prinsip sains bahasa. Ini sudah pasti akan membantu menghapuskan salah faham yang semakin timbul antara wakil sains yang sangat jauh antara satu sama lain, mengambil bahagian dalam kerja mengenai masalah linguistik gunaan, dan akan menggariskan cara untuk penumpuan mereka, di satu pihak, dan persempadanan bidang penyelidikan. , sebaliknya. Tidak perlu dikatakan bahawa pertimbangan berikut akan mewakili sudut pandangan ahli bahasa, dan adalah perlu bahawa ahli matematik bukan sahaja cuba mengasimilasikannya, tetapi, berkaitan dengan soalan yang dibangkitkan, memberi mereka tafsiran mereka sendiri.

Seorang ahli teori bahasa tidak boleh dengan apa-apa cara berpuas hati dengan fakta bahawa dalam semua kes penyelidikan<141>bahasa untuk tujuan yang ditetapkan oleh linguistik gunaan, ia adalah berdasarkan model matematik. Selaras dengan ini, pemerhatian terhadap fenomena bahasa dan keputusan yang diperoleh dinyatakan dalam istilah dan konsep matematik, iaitu melalui persamaan dan rumus matematik. Mari lihat contoh untuk kejelasan. Condon 1 06 dan Zipf 1 07 menetapkan bahawa logaritma frekuensi ( f) penggunaan perkataan dalam teks yang besar terletak hampir pada garis lurus jika ia dikaitkan pada rajah dengan logaritma pangkat atau kategori ( r) perkataan ini. Persamaan f = c: r, di mana Dengan adalah pemalar, mencerminkan hubungan ini dalam erti kata terhad bahawa c:r untuk nilai tertentu r menghasilkan semula kekerapan yang diperhatikan dengan anggaran yang besar. Hubungan antara f Dan r, dinyatakan oleh formula matematik, adalah model untuk hubungan antara nilai yang diperhatikan kekerapan penggunaan dan pangkat, atau kategori, perkataan. Ini adalah salah satu kes pemodelan matematik. 

Keseluruhan teori maklumat adalah sepenuhnya berdasarkan model matematik proses komunikasi yang dibangunkan oleh K. Shannon 1 08 . Ia ditakrifkan sebagai "disiplin matematik yang dikhaskan untuk kaedah mengira dan menganggar jumlah maklumat yang terkandung dalam mana-mana data, dan untuk mengkaji proses menyimpan dan menghantar maklumat" (TSB, vol. 51, ms 128). Sehubungan itu, konsep asas teori maklumat menerima ungkapan matematik Maklumat diukur dalam binit atau unit binari (kod yang diumpamakan bahasa, dengan dua isyarat berkemungkinan sama bersyarat menghantar satu unit maklumat perduaan apabila menghantar setiap simbol). ditakrifkan sebagai “perbezaan antara kapasiti penghantaran yang mungkin secara teori - kod dan jumlah purata maklumat yang dihantar<142>formasi. Lebihan dinyatakan sebagai peratusan daripada jumlah kapasiti penghantaran kod” 1 09, dsb. Dengan cara yang sama, terjemahan mesin memerlukan pembangunan algoritma untuk memaparkan unsur-unsur satu bahasa dalam bahasa lain, dsb. 1 10. Ini adalah kes pemodelan lain.

Penggunaan model di luar apa-apa kepentingan boleh memberikan bantuan yang sangat penting, khususnya, dalam semua kemungkinan, dalam menyelesaikan masalah yang ditetapkan untuk dirinya sendiri. linguistik gunaan. Walau bagaimanapun, untuk linguistik teori, hakikat bahawa model abstrak, sebagai peraturan, tidak menghasilkan semula semua ciri fenomena sebenar, semua kualiti fungsinya, adalah sangat penting. Oleh itu, seorang arkitek, sebelum membina sebuah rumah, boleh mencipta modelnya yang menghasilkan semula rumah yang direka bentuk dalam semua butiran terkecil, dan ini membantunya menyelesaikan beberapa isu praktikal yang berkaitan dengan pembinaan rumah itu sendiri. Tetapi model rumah sedemikian, tidak kira betapa tepatnya, tidak mempunyai "fungsi" itu dan tujuan semua rumah dibina secara umum - ia tidak mampu menyediakan perumahan kepada seseorang. Keadaannya sama dengan bahasa, di mana model tidak selalu dapat menghasilkan semula semua kualitinya. Dalam kes ini, perkara ini menjadi lebih rumit oleh fakta bahawa ukuran matematik dan bukannya linguistik digunakan untuk membina model. "Model matematik..." tulis A. Ettinger, "memainkan peranan yang sangat penting dalam semua bidang teknologi, tetapi kerana ia adalah alat sintesis, kepentingannya untuk linguistik, yang terutamanya merupakan disiplin sejarah dan deskriptif, secara semula jadi terhad. ” 1 11 .<143>

Pemodelan matematik sesuatu bahasa sebenarnya hanya terpakai kepada keadaan statiknya, yang bagi seorang ahli bahasa adalah bersyarat dan sebenarnya bercanggah langsung dengan kualiti asas bahasa, bentuk kewujudannya ialah pembangunan. Tidak boleh dikatakan bahawa kajian statik bahasa tidak sama sekali dikecualikan daripada linguistik dan merupakan asas kepada penyusunan tatabahasa dan kamus normatif, tatabahasa deskriptif, tatabahasa praktikal dan kamus yang menjadi panduan untuk pembelajaran amali bahasa asing, dsb. Walau bagaimanapun, dalam semua karya tersebut, yang kebanyakannya bersifat gunaan, ahli bahasa secara sedar mengehadkan bidang penyelidikan dan tidak menutup mata kepada aspek lain bahasa 1 12 . Dalam pemeriksaan statik bahasa, khususnya, kualiti bahasa yang dikaitkan dengan sifat dinamiknya seperti produktiviti, pergantungan pada bentuk pemikiran, interaksi yang luas dengan faktor budaya, sosial, politik, sejarah dan lain-lain hilang sepenuhnya dari bidang pandangan penyelidik. Hanya pada tahap segerak bahasa boleh dianggap sebagai sistem tanda atau kod konvensional, yang bagaimanapun, ternyata benar-benar menyalahi undang-undang sebaik sahaja kita mengambil sudut pandangan yang lebih dinamik untuk bahasa. Dalam proses pembangunan, kualiti bahasa seperti motivasi, polisemi perkataan tanpa sempadan yang stabil, ketidak-autonomian makna perkataan dan cangkang bunyinya, potensi kreatif perkataan yang dikaitkan dengan konteks ditunjukkan. , dan semua ini bercanggah dengan ciri asas kod atau tanda 1 13 . Jelas sekali, dalam linguistik gunaan adalah mungkin juga untuk berfikir di luar semua kualiti bahasa ini dan, untuk tujuan praktikal, berpuas hati dengan, boleh dikatakan, "gambar" bahasa, yang masih mampu memberikan idea yang agak anggaran. tentang mekanisme fungsinya.<144>ning. Walau bagaimanapun, setiap "snapshot" sedemikian jika dianggap sebagai fakta bahasa, dan bukan sebagai fakta sistem kod konvensional, mesti dimasukkan dalam proses pergerakan yang tidak berkesudahan di mana bahasa sentiasa berada 1 14 . Ia tidak boleh dikaji di luar keadaan khusus yang mencirikan pergerakan ini, yang meninggalkan tanda pada keadaan bahasa yang diberikan dan menentukan potensi untuk perkembangan selanjutnya. Di sini terdapat perbezaan yang sama seperti antara gambar segera seseorang dan potretnya yang dilukis dengan berus artis sejati. Dalam karya artis kita melihat gambaran umum seseorang dalam semua keaslian bukan sahaja penampilan fizikalnya, tetapi juga kandungan rohani dalamannya. Daripada potret artistik kita boleh membaca masa lalu orang yang digambarkan di atasnya dan menentukan apa yang dia mampu dalam tindakannya. Dan gambar segera, walaupun mampu memberikan imej yang lebih tepat tentang penampilan asal, tidak mempunyai kualiti ini dan sering menangkap kedua-dua jerawat rawak yang telah muncul di hidung dan<145>pose atau ekspresi yang sama sekali tidak seperti ciri, yang akhirnya membawa kepada herotan yang asal.

Perlu diingatkan bahawa kaedah "snapshot" sudah tentu boleh digunakan untuk fakta perkembangan bahasa. Tetapi dalam kes ini, kita sebenarnya hanya akan berurusan dengan keadaan bahasa individu, yang, apabila dicirikan secara kuantitatif, ternyata bersambung tidak lebih daripada ciri kuantitatif perbandingan bahasa yang berbeza. "Dinamik" kuantitatif seperti ini tidak akan mengandungi apa-apa yang organik, dan hubungan antara keadaan bahasa individu hanya bergantung pada perbandingan hubungan berangka. Jika kita menggunakan analogi dalam kes ini, kita boleh merujuk kepada pertumbuhan kanak-kanak. Perkembangannya, tentu saja, boleh dibentangkan dalam bentuk dinamik data berangka tentang berat, ketinggian, perubahan nisbah isipadu bahagian badannya, tetapi semua data ini benar-benar terpisah daripada segala-galanya yang merupakan intipati individu. seseorang - watak, kecenderungan, tabiat, citarasa, dsb.

Satu lagi sisi negatif "pemodelan" matematik sesuatu bahasa ialah hakikat bahawa ia tidak boleh berfungsi sebagai prinsip umum yang berdasarkannya penerangan sistematik yang komprehensif dan komprehensif tentang bahasa itu boleh dijalankan. Hanya pendekatan matematik terhadap fenomena bahasa, sebagai contoh, tidak akan memungkinkan untuk menjawab soalan asas seperti itu (tanpanya kewujudan sains bahasa tidak dapat difikirkan) seperti: apakah bahasa, apakah fenomena yang harus diklasifikasikan. sebagai fenomena linguistik, bagaimana perkataan atau ayat ditakrifkan, apakah konsep asas dan kategori bahasa, dll. Sebelum beralih kepada kaedah matematik penyelidikan bahasa, adalah perlu untuk mempunyai jawapan terlebih dahulu (walaupun dalam bentuk kerja hipotesis) kepada semua soalan ini. Tidak perlu menutup mata kita kepada fakta bahawa dalam semua kes yang kita ketahui tentang mengkaji fenomena linguistik menggunakan kaedah matematik, semua konsep dan kategori ini tidak dapat tidak perlu diterima kerana ia ditakrifkan oleh kaedah tradisional atau, secara relatifnya, kaedah kualitatif.

Ciri kaedah matematik dalam aplikasi linguistik mereka ini telah diperhatikan oleh Spang-Hanssen apabila<146>sal: "Perlu diingat bahawa fakta yang diperhatikan yang menerima ungkapan kuantitatif ... tidak mempunyai nilai melainkan ia menjadi sebahagian daripada huraian, dan untuk tujuan linguistik ini mestilah penerangan yang sistematik, berkait rapat dengan huraian dan teori linguistik kualitatif" 1 15 . Dalam ucapan lain oleh Spang-Hanssen kita dapati penjelasan tentang pemikiran ini: "Sehingga kemungkinan untuk membina sistem kuantitatif terbukti, dan selagi ada yang diterima umum. sistem kualiti untuk bidang penyelidikan tertentu, kiraan kekerapan dan ciri berangka lain dengan titik linguistik penglihatan tidak bermakna” 1 16 . Uldall menyatakan idea-idea yang sama, agak tidak disangka-sangka menghubungkannya dengan perkembangan asas teori umum glosematik: “Apabila seorang ahli bahasa mengira atau mengukur semua yang dikira dan diukurnya, dengan sendirinya tidak ditentukan secara kuantitatif; sebagai contoh, perkataan, apabila ia dikira, ditakrifkan, jika ia ditakrifkan sama sekali, dalam istilah yang sama sekali berbeza” 1 17 .<147>

Oleh itu, ternyata bahawa kedua-dua dari segi teori dan dalam aplikasi praktikalnya, kaedah matematik secara langsung bergantung kepada konsep dan kategori linguistik yang ditakrifkan oleh kaedah tradisional, filologi, atau, seperti yang disebutkan di atas, kaedah kualitatif. Dari segi linguistik gunaan, adalah penting untuk merealisasikan pergantungan ini, dan oleh itu membiasakan diri dengan keseluruhan set kategori asas linguistik tradisional.

Walau bagaimanapun, tiada sebab untuk menyalahkan wakil sains tepat yang bekerja dalam bidang linguistik gunaan kerana tidak menggunakan data linguistik moden. Ini tidak sesuai dengan keadaan sebenar. Mereka bukan sahaja mengetahui dengan baik, tetapi juga menggunakan secara meluas dalam kerja mereka sistem ciri kebezaan yang ditubuhkan oleh ahli bahasa, ciri bahasa yang berbeza, pengedaran dan susunan unsur linguistik dalam sistem bahasa tertentu, pencapaian fonetik akustik, dll. Tetapi dalam kes ini, tempahan yang sangat penting diperlukan . Malah, wakil sains tepat menggunakan data dari satu arah sahaja dalam linguistik - apa yang dipanggil linguistik deskriptif, yang dengan sengaja memisahkan diri daripada masalah tradisional linguistik teori, jauh daripada merangkumi keseluruhan bidang penyelidikan linguistik, dari sudut linguistik itu sendiri, mempunyai kelemahan metodologi yang ketara, yang membawanya kepada krisis yang baru-baru ini muncul 1 18 , dan, sebagai tambahan, mempunyai orientasi praktikal semata-mata sepadan dengan kepentingan linguistik gunaan. Semua cadangan dan celaan yang dibuat di atas mengenai pertimbangan statik bahasa terpakai kepada linguistik deskriptif. Pendekatan sebelah pihak linguistik deskriptif boleh, penyiasat<148>Walau bagaimanapun, hanya dibenarkan oleh tugas-tugas yang ditetapkan oleh linguistik yang diterapkan itu sendiri, ia jauh dari meletihkan keseluruhan kandungan ilmu bahasa.

Dalam proses membangunkan isu linguistik gunaan, masalah teori baru mungkin timbul dan, sebenarnya, telah pun timbul. Beberapa masalah ini berkait rapat dengan masalah khusus linguistik gunaan dan bertujuan untuk mengatasi kesukaran yang timbul dalam menyelesaikan masalah ini. Masalah lain berkaitan secara langsung dengan linguistik teori, membolehkan perspektif baru melihat idea tradisional atau membuka bidang penyelidikan linguistik, konsep dan teori baru. Antara yang terakhir ini, sebagai contoh, adalah masalah mencipta bahasa "mesin" (atau bahasa perantara), yang paling rapat berkait dengan set kompleks isu kardinal linguistik teoritis seperti hubungan konsep dan makna leksikal, logik dan tatabahasa, diakroni dan sinkroni, sifat tanda bahasa, intipati makna linguistik, prinsip membina bahasa buatan, dsb. 1 19. Dalam kes ini, adalah amat penting untuk mewujudkan persefahaman dan kerjasama bersama dalam kerja bersama wakil-wakil disiplin linguistik dan sains tepat. Bagi sisi linguistik, perbualan dalam kes ini, nampaknya, tidak sepatutnya mengehadkan terlebih dahulu usaha, sebagai contoh, pereka mesin penterjemahan” dan cuba mewujudkan keupayaan kerja mesin sedemikian dengan puisi N. Gribachev atau prosa V. Kochetov 1 20 . Mesin itu sendiri akan menemui had keupayaannya, dan keuntungan akan menemui had penggunaannya. Tetapi ahli bahasa, sebagai sumbangan mereka kepada tujuan bersama, mesti membawa pengetahuan mereka tentang keistimewaan struktur bahasa, kepelbagaian bahasa, hubungan persilangan dalaman unsur-unsurnya, serta hubungan luas dan pelbagai hala bahasa dengan fizikal, fisiologi, mental dan logik<149>fenomena mi, pola fungsi tertentu dan perkembangan bahasa. Keseluruhan set pengetahuan ini diperlukan untuk pereka bentuk mesin yang sepadan, agar tidak bersiar-siar ke arah yang salah, tetapi untuk menjadikan carian bertujuan dan berorientasikan dengan jelas. Malah gambaran yang sangat ringkas mengenai kes-kes penggunaan kaedah matematik untuk masalah linguistik, yang dibuat dalam esei ini, meyakinkan bahawa pengetahuan sedemikian tidak akan berlebihan untuk wakil-wakil sains tepat.

Berdasarkan semua pertimbangan di atas, kita jelas boleh membuat beberapa kesimpulan umum.

Jadi, linguistik matematik? Jika ini bermakna penggunaan kaedah matematik sebagai kunci induk universal untuk menyelesaikan semua masalah linguistik, maka dakwaan tersebut harus dianggap sama sekali tidak wajar. Segala yang dilakukan ke arah ini setakat ini hanya menyumbang sedikit atau tidak sama sekali kepada penyelesaian masalah tradisional dalam ilmu bahasa. Dalam kes yang paling teruk, penggunaan kaedah matematik disertai dengan kemustahilan yang jelas atau, dari sudut linguistik, tidak bermakna sama sekali. Paling baik, kaedah matematik boleh digunakan sebagai teknik tambahan untuk penyelidikan linguistik, diletakkan dalam perkhidmatan tugas linguistik yang khusus dan terhad. Tidak boleh bercakap tentang apa-apa "falsafah bahasa kuantitatif" di sini. Pada satu ketika, fizik, psikologi, fisiologi, logik, sosiologi, dan etnologi menceroboh kebebasan sains bahasa, tetapi mereka tidak dapat menundukkan linguistik. Perkara sebaliknya berlaku - linguistik mengambil kesempatan daripada pencapaian sains ini dan mula menggunakan bantuan mereka setakat yang diperlukan, dengan itu memperkayakan senjata teknik penyelidikannya. Sekarang, nampaknya, tiba giliran matematik. Adalah diharapkan bahawa komuniti baru ini juga akan menyumbang kepada pengukuhan sains bahasa, menambah baik kaedah kerjanya, dan meningkatkan kepelbagaian mereka. Oleh itu, adalah wajar untuk bercakap tentang linguistik matematik pada tahap yang sama seperti linguistik fizikal, linguistik fisiologi, linguistik logik, linguistik psikologi dan<150>dan lain-lain. Tidak ada linguistik seperti itu; hanya ada satu linguistik, yang menggunakan data sains lain sebagai alat penyelidikan tambahan. Oleh itu, tidak ada sebab untuk berundur sebelum serangan sains baru dan dengan mudah menyerah kepadanya kedudukan yang diperolehi. Di sini adalah sangat sesuai untuk mengingati kata-kata A. Martinet: “Mungkin tergoda untuk bergabung dengan menggunakan beberapa istilah yang dipilih dengan baik untuk pergerakan pemikiran utama ini atau itu, atau untuk mengisytiharkan dengan beberapa formula matematik keteguhan penaakulan seseorang. . Walau bagaimanapun, masanya telah tiba untuk ahli bahasa menyedari kebebasan sains mereka dan membebaskan diri mereka daripada kompleks rendah diri yang memaksa mereka untuk mengaitkan mana-mana tindakan mereka dengan satu atau satu lagi prinsip saintifik umum, akibatnya kontur realiti sentiasa menjadi. hanya lebih kabur, bukannya menjadi lebih jelas” 1 21.

Oleh itu, matematik itu sendiri dan linguistik itu sendiri. Ini sama sekali tidak mengecualikan bantuan bersama atau pertemuan mesra mereka dalam kerja bersama mengenai masalah biasa. Tempat seperti ini di mana usaha bersepadu kedua-dua sains diterapkan adalah keseluruhan pelbagai masalah yang termasuk dalam linguistik gunaan dan kepentingan ekonomi negara yang besar. Seseorang hanya perlu berharap bahawa dalam kerja bersama mereka kedua-dua sains menunjukkan persefahaman bersama yang maksimum, yang sudah pasti akan menyumbang kepada hasil maksimum kerjasama mereka.<151>