Đối tượng và phương pháp của ngôn ngữ học toán học. Từ điển bách khoa ngôn ngữ

Trong thế kỷ trước, ngôn ngữ học luôn được coi là một ví dụ về một ngành khoa học phát triển nhanh chóng và rất nhanh chóng đạt đến độ chín về phương pháp luận. Vào giữa thế kỷ trước, khoa học non trẻ đã tự tin chiếm một vị trí trong giới khoa học có truyền thống hàng nghìn năm và một trong những đại diện nổi bật nhất của nó - A. Schleicher - đã can đảm tin rằng với những công trình của mình, ông đã tóm tắt dòng cuối cùng.<113>Tuy nhiên, lịch sử ngôn ngữ học đã chỉ ra rằng quan điểm như vậy là quá vội vàng và thiếu căn cứ. Vào cuối thế kỷ này, ngôn ngữ học phải chịu cú sốc lớn đầu tiên liên quan đến sự chỉ trích các nguyên tắc tân ngữ pháp, sau đó là những nguyên tắc khác. Cần lưu ý rằng tất cả các cuộc khủng hoảng mà chúng ta có thể tiết lộ trong lịch sử khoa học ngôn ngữ, như một quy luật, không làm lung lay nền tảng của nó, mà trái lại, góp phần củng cố và cuối cùng mang lại sự làm rõ và cải tiến. của các phương pháp nghiên cứu ngôn ngữ, mở rộng cùng với những vấn đề đó và vấn đề khoa học.

Nhưng các ngành khoa học khác, bao gồm một số lượng lớn các ngành khoa học mới, cũng tồn tại và phát triển cùng với ngôn ngữ học. Các ngành khoa học vật lý, hóa học và kỹ thuật (được gọi là “chính xác”) đã nhận được sự phát triển đặc biệt nhanh chóng trong thời đại chúng ta và cơ sở lý thuyết của chúng, toán học, đã thống trị tất cả chúng. Các ngành khoa học chính xác không chỉ đã thay thế toàn bộ ngành nhân văn mà còn đang cố gắng “đưa họ vào đức tin của họ”, phục tùng họ theo phong tục của họ và áp đặt các phương pháp nghiên cứu của họ lên họ. Với tình hình hiện tại, sử dụng cách diễn đạt của người Nhật, chúng ta có thể nói rằng hiện nay các nhà ngôn ngữ học và nhà ngữ văn đang xâm phạm đến rìa của tấm thảm, nơi các ngành khoa học chính xác, dẫn đầu bởi toán học, đang chiến thắng và tự do định vị.

Chẳng phải tốt hơn là, từ quan điểm lợi ích khoa học nói chung, nên đầu hàng toán học, đầu hàng hoàn toàn trước sức mạnh của các phương pháp của nó, như một số tiếng nói đã công khai kêu gọi, 5 9 và nhờ đó, có lẽ, đạt được những thành tựu mới? sức mạnh? Để trả lời những câu hỏi này, trước tiên chúng ta phải xem toán học tuyên bố sẽ làm gì trong trường hợp này, các phương pháp toán học được sử dụng trong lĩnh vực ngôn ngữ học nào, chúng phù hợp với đặc điểm cụ thể của tài liệu ngôn ngữ ở mức độ nào và liệu chúng có khả năng đưa ra hoặc thậm chí chỉ gợi ý câu trả lời cho những câu hỏi mà khoa học ngôn ngữ tự đặt ra.

Ngay từ đầu, cần lưu ý rằng trong số những người đam mê xu hướng toán học mới trong ngôn ngữ học<114>Trong nghiên cứu khoa học, không có sự đồng thuận về mục đích và mục tiêu của nó. Viện sĩ A. A. Markov, người đầu tiên áp dụng các phương pháp toán học vào ngôn ngữ, Boldrini, Yul, Mariotti coi các yếu tố ngôn ngữ là tài liệu minh họa phù hợp để xây dựng các phương pháp định lượng hoặc cho các định lý thống kê mà không hỏi liệu kết quả của nghiên cứu đó có được quan tâm hay không. nhà ngôn ngữ học 6 0 . Ross tin rằng lý thuyết xác suất và thống kê toán học cung cấp một công cụ hoặc, như ngày nay họ thường nói, một mô hình toán học để kiểm tra và xác nhận các kết luận ngôn ngữ cho phép diễn giải bằng số. Vì vậy, các phương pháp toán học chỉ được coi là phương tiện phụ trợ cho nghiên cứu ngôn ngữ6 1 . Herdan đã khẳng định nhiều hơn thế, người trong cuốn sách của mình không chỉ tóm tắt và hệ thống hóa mọi nỗ lực nghiên cứu toán học về các vấn đề ngôn ngữ mà còn cố gắng cung cấp cho chúng một định hướng rõ ràng liên quan đến công việc tiếp theo. Ông tập trung trình bày tất cả tài liệu trong cuốn sách của mình vào việc “hiểu thống kê văn học (như ông gọi việc nghiên cứu văn bản bằng phương pháp thống kê toán học. - V. 3.) như một bộ phận không thể thiếu của ngôn ngữ học”6 2, và bản chất cũng như mục tiêu của phần mới này trong ngôn ngữ học được trình bày như sau: “Thống kê văn học với tư cách là một triết lý định lượng về ngôn ngữ có thể áp dụng cho tất cả các ngành ngôn ngữ học. Theo chúng tôi, thống kê văn học là ngôn ngữ học cấu trúc, được nâng lên tầm khoa học định lượng hoặc triết học định lượng. Vì vậy, việc xác định kết quả của nó là không liên quan đến lĩnh vực này cũng không kém phần sai lầm.<115>ngôn ngữ học hoặc coi nó như một công cụ phụ trợ cho nghiên cứu" 6 3.

Hầu như không nên đi vào lý thuyết xem liệu trong trường hợp này có hợp pháp hay không khi nói về sự xuất hiện của một nhánh ngôn ngữ học mới và giải quyết vấn đề mà nó tuyên bố mà không chuyển sang xem xét những gì đã thực sự được thực hiện trong lĩnh vực này. và làm rõ hướng áp dụng các phương pháp mới 6 4. Điều này sẽ giúp chúng ta hiểu được sự đa dạng của các ý kiến.

Việc sử dụng tiêu chí toán học (hay chính xác hơn là thống kê) để giải quyết các vấn đề ngôn ngữ không hề mới đối với khoa học ngôn ngữ và ở mức độ này hay mức độ khác, đã được các nhà ngôn ngữ học sử dụng từ lâu. Xét cho cùng, về bản chất, những khái niệm truyền thống về ngôn ngữ học như quy luật ngữ âm (và các khái niệm liên quan)<116>một cái gì đó khác với nó là một ngoại lệ của pháp luật), năng suất của các yếu tố ngữ pháp (ví dụ: hậu tố tạo thành từ) hoặc thậm chí các tiêu chí cho mối quan hệ liên quan giữa các ngôn ngữ ở một mức độ nhất định dựa trên các đặc điểm thống kê tương đối. Rốt cuộc, độ tương phản thống kê của các trường hợp được quan sát càng sắc nét và khác biệt thì chúng ta càng có nhiều lý do để nói về các hậu tố hữu ích và không hữu ích, về quy luật ngữ âm và các ngoại lệ đối với nó, về sự hiện diện hay vắng mặt của các mối quan hệ liên quan giữa các ngôn ngữ. Nhưng nếu trong những trường hợp như vậy, nguyên tắc thống kê được sử dụng ít nhiều một cách tự phát, thì sau này nó bắt đầu được sử dụng một cách có ý thức và với một mục tiêu nhất định. Vì vậy, ở thời đại chúng ta, cái gọi là từ điển tần số của từ vựng và cách diễn đạt của từng ngôn ngữ 6 5 hoặc thậm chí là nghĩa của các từ đa ngôn ngữ với “tập trung chung vào thực tế” 6 6 đã trở nên phổ biến. Dữ liệu từ các từ điển này được sử dụng để biên soạn sách giáo khoa ngoại ngữ (văn bản trong đó dựa trên những từ vựng được sử dụng phổ biến nhất) và các từ điển tối thiểu. Các tính toán thống kê đã tìm thấy cách sử dụng ngôn ngữ đặc biệt trong phương pháp thống kê từ vựng hoặc thống kê niên đại của M. Swadesh, trong đó, trên cơ sở các công thức thống kê có tính đến các trường hợp biến mất của các từ cơ bản khỏi ngôn ngữ, có thể thiết lập niên đại tuyệt đối của sự phân chia các họ ngôn ngữ 6 7 .

TRONG những năm gần đây các trường hợp áp dụng các phương pháp toán học vào tài liệu ngôn ngữ đã tăng lên đáng kể, và ít nhiều đã xuất hiện những hướng đi rõ ràng trong hàng loạt những nỗ lực như vậy. Hãy quay lại<117>xem xét chúng một cách tuần tự mà không đi sâu vào chi tiết.

Hãy bắt đầu với hướng được đặt tên là thống kê kiểu dáng. Trong trường hợp này, chúng ta đang nói về việc xác định và mô tả các đặc điểm phong cách của từng tác phẩm hoặc tác giả thông qua các mối quan hệ định lượng của các yếu tố ngôn ngữ được sử dụng. Cơ sở của phương pháp thống kê để nghiên cứu các hiện tượng phong cách là sự hiểu biết về phong cách văn học như một cách cá nhân để làm chủ các phương tiện ngôn ngữ. Đồng thời, nhà nghiên cứu hoàn toàn bị phân tâm khỏi câu hỏi về ý nghĩa định tính của các yếu tố ngôn ngữ đếm được, chỉ tập trung toàn bộ sự chú ý vào khía cạnh định lượng; khía cạnh ngữ nghĩa của các đơn vị ngôn ngữ đang được nghiên cứu, tải trọng cảm xúc và biểu cảm của chúng, cũng như tỷ lệ của chúng trong kết cấu của một tác phẩm nghệ thuật - tất cả những điều này vẫn nằm ngoài tính toán và đề cập đến cái gọi là hiện tượng dư thừa. Do đó, một tác phẩm nghệ thuật xuất hiện dưới dạng một tổng thể máy móc, cấu trúc cụ thể của nó chỉ được thể hiện thông qua các mối quan hệ số học của các phần tử của nó. Các đại diện của thống kê phong cách không nhắm mắt làm ngơ trước tất cả các trường hợp đã lưu ý, đối lập với các phương pháp của phong cách truyền thống, chắc chắn bao gồm các yếu tố chủ quan, với một phẩm chất duy nhất của phương pháp toán học, theo quan điểm của họ, bù đắp cho tất cả những thiếu sót của nó - tính khách quan của kết quả đạt được. Ví dụ: “Chúng tôi cố gắng,” V. Fuchs viết, “... để mô tả phong cách diễn đạt ngôn ngữ bằng các phương tiện toán học. Vì mục đích này, các phương pháp phải được tạo ra, kết quả của chúng phải có tính khách quan ở mức độ tương tự như kết quả của các khoa học chính xác... Điều này giả định rằng, ít nhất ban đầu, chúng ta sẽ chỉ quan tâm đến những phẩm chất cấu trúc hình thức, và không phải với nội dung ngữ nghĩa của các biểu thức ngôn ngữ. Bằng cách này, chúng ta sẽ thu được một hệ thống các quan hệ thứ tự, mà toàn bộ hệ thống này sẽ đại diện cho cơ sở và điểm khởi đầu của lý thuyết toán học về phong cách”6 8 .<118>

Cách tiếp cận thống kê đơn giản nhất để nghiên cứu ngôn ngữ của các nhà văn hoặc từng tác phẩm là đếm số từ được sử dụng, vì sự phong phú của từ vựng, theo một cách nào đó, sẽ đặc trưng cho bản thân tác giả. Tuy nhiên, kết quả của những tính toán như vậy mang lại những kết quả hơi bất ngờ về mặt này và không đóng góp gì vào kiến ​​thức thẩm mỹ và đánh giá tác phẩm văn học, vốn không kém phần quan trọng trong các nhiệm vụ của phong cách học. Dưới đây là một số dữ liệu về tổng số từ được sử dụng trong một số tác phẩm:

Kinh thánh (tiếng Latinh). . . . . . . . . . 5649 từ

Kinh thánh (tiếng Do Thái). . . . 5642 từ

Demosthenes (bài phát biểu). . . . . . . . . . . . 4972 từ

Sallust. . . . . . . . . . . . . . . . . 3394 từ

Horace. . . . . . . . . . . . . . . . . . . .6084 từ

Dante (Thần khúc) 5860 từ

(bao gồm 1615 tên riêng và tên địa lý)

Tasso (Orland giận dữ). . . . 8474 từ

Milton. . . . . . . . . . . . . . . . . . . . 0,8000 từ (dữ liệu xấp xỉ)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 từ

(khoảng, theo các nguồn khác, 20.000 từ)

O. Jespersen chỉ ra rằng vốn từ vựng của Zola, Kipling và Jack London vượt xa đáng kể so với Milton, tức là con số này là 8000 6 9 . Tính toán từ điển diễn văn của Tổng thống Mỹ William Wilson cho thấy nó phong phú hơn của Shakespeare. Để làm điều này, cần phải thêm dữ liệu từ các nhà tâm lý học. Do đó, Terman, dựa trên quan sát một số lượng lớn các trường hợp, đã xác định rằng vốn từ vựng trung bình của một đứa trẻ là khoảng 3.600 từ, và ở tuổi 14, con số này đã là 9.000 từ. Một người trưởng thành trung bình sử dụng 11.700 từ và là một người có “trí thông minh cao”. sử dụng tới 13.500 7 0 . Như vậy, bản thân những số liệu số liệu đó không cung cấp bất kỳ cơ sở nào để xác định phẩm chất phong cách của tác phẩm mà chỉ xác định một cách “khách quan”<119>Họ nêu rõ việc các tác giả khác nhau sử dụng số lượng từ khác nhau, như các tính toán trên cho thấy, điều này không liên quan đến giá trị nghệ thuật tương đối của tác phẩm của họ.

Việc tính toán tần suất sử dụng từ tương đối giữa các tác giả được xây dựng hơi khác nhau. Trong trường hợp này, không chỉ tổng số từ được tính đến mà còn tính đến tần suất sử dụng của từng từ riêng lẻ. Việc xử lý thống kê tài liệu thu được theo cách này có nghĩa là các từ có tần suất sử dụng như nhau sẽ được nhóm thành các lớp (hoặc xếp hạng), dẫn đến việc thiết lập sự phân bố tần suất của tất cả các từ được sử dụng bởi một tác giả nhất định. Trường hợp đặc biệt của kiểu tính toán này là việc xác định tần suất tương đối của các từ đặc biệt (ví dụ, Từ vựng Lãng mạn trong các tác phẩm của Chaucer, như Mersand 7 1 đã thực hiện). Tần suất tương đối của các từ được tác giả sử dụng chứa cùng thông tin khách quan về phong cách của từng tác giả như các phép tính tóm tắt ở trên, với điểm khác biệt duy nhất là kết quả là dữ liệu số chính xác hơn. Nhưng nó cũng được sử dụng để xác định niên đại của từng tác phẩm của cùng một tác giả trên cơ sở tính toán sơ bộ về tần suất sử dụng từ ngữ tương đối của ông trong các giai đoạn khác nhau của cuộc đời (dựa trên các tác phẩm do chính tác giả ghi niên đại). Một cách sử dụng dữ liệu khác từ những tính toán như vậy là để thiết lập tính xác thực về quyền tác giả của những tác phẩm mà câu hỏi này có vẻ nghi ngờ 7 2 . Trong trường hợp sau này, mọi thứ đều dựa trên sự so sánh các công thức thống kê về tần suất sử dụng trong các tác phẩm chân thực và gây tranh cãi. Không cần phải nói về tính tương đối rất lớn và tính chất gần đúng của kết quả thu được bằng các phương pháp như vậy. Xét cho cùng, tần suất sử dụng tương đối thay đổi không chỉ theo độ tuổi của tác giả mà còn tùy thuộc vào thể loại, cốt truyện cũng như môi trường lịch sử của tác phẩm (ví dụ: “Bread” và “Peter I ” của A. Tolstoy).<120>

Đi sâu hơn vào phương pháp được mô tả ở trên, các nhà thống kê kiểu dáng bắt đầu sử dụng tiêu chí về sự ổn định của tần số tương đối của các từ phổ biến nhất như một đặc điểm về phong cách. Phương pháp được sử dụng trong trường hợp này có thể được minh họa bằng quá trình xử lý thống kê câu chuyện “Con gái của thuyền trưởng” của Pushkin, do Jesselson và Epstein thực hiện tại Viện Ngôn ngữ Slav thuộc Đại học Detroit (Hoa Kỳ) 7 3 . Toàn bộ văn bản của câu chuyện (khoảng 30.000 trường hợp sử dụng từ) đã được kiểm tra, sau đó là các đoạn trích chứa khoảng 10.000 và 5.000 trường hợp sử dụng. Tiếp theo, để xác định tính ổn định của tần suất sử dụng từ tương đối, đối với 102 từ thông dụng nhất (có tần suất từ ​​1160 đến 35 lần), tần số tương đối được tính toán (dựa trên các đoạn văn mẫu) được so sánh với tần số tương đối được tính toán (dựa trên các đoạn văn mẫu). một thực tế. Ví dụ: từ “và” được sử dụng 1.160 lần trong suốt câu chuyện. Trong một đoạn văn chứa 5.000 lần xuất hiện của tất cả các từ, chúng ta mong đợi sự kết hợp này sẽ được sử dụng 5.000 x 1.160:30.000, hoặc khoảng 193 lần, và trong một đoạn văn chứa 10.000 lần xuất hiện của tất cả các từ, nó sẽ được sử dụng 10.000 lần x 1.160: 30.000, hay 386 lần. So sánh dữ liệu thu được bằng cách sử dụng loại tính toán này với dữ liệu thực tế cho thấy độ lệch rất không đáng kể (trong vòng 5%). Dựa trên các tính toán tương tự, người ta thấy rằng trong câu chuyện này của Pushkin, giới từ “k” được sử dụng thường xuyên gấp đôi so với “y” và đại từ “bạn” được sử dụng thường xuyên hơn ba lần so với “họ”, v.v. bất chấp tất cả những khúc mắc của cốt truyện, cả trong toàn bộ câu chuyện và từng phần riêng lẻ của nó, vẫn có sự ổn định trong tần suất sử dụng từ tương đối. Những gì được quan sát liên quan đến một số từ (phổ biến nhất) có lẽ có thể áp dụng được đối với tất cả các từ được sử dụng trong tác phẩm. Theo đó, phong cách của tác giả có thể được đặc trưng bởi một tỷ lệ nhất định về sự thay đổi giữa tần suất sử dụng trung bình của một từ với tần suất chung của một ngôn ngữ nhất định.<121>tần suất sử dụng nó. Tỷ lệ này được coi là một đặc điểm định lượng khách quan trong phong cách của tác giả.

Các yếu tố hình thức khác của cấu trúc ngôn ngữ cũng được nghiên cứu theo cách tương tự. Ví dụ, V. Fuchs đã tiến hành kiểm tra so sánh và thống kê các đặc điểm đo lường trong các tác phẩm của Goethe, Rilke, Caesar, Sallust và những người khác.

Tiêu chí về tính ổn định của tần suất sử dụng từ tương đối, đồng thời làm rõ kỹ thuật mô tả định lượng của văn phong, không đưa ra điều gì mới về cơ bản so với các phương pháp nguyên thủy hơn đã thảo luận ở trên. Tất cả các phương pháp thống kê cuối cùng đều mang lại những kết quả “khách quan” bình đẳng như nhau, trượt trên bề mặt ngôn ngữ và chỉ bám vào những đặc điểm thuần túy bên ngoài. Rõ ràng, các phương pháp định lượng không thể tập trung vào sự khác biệt về chất trong vật liệu đang được nghiên cứu và thực sự san bằng tất cả các đối tượng đang được nghiên cứu.

Khi cần có thông số kỹ thuật tối đa thì tiêu chí tổng quát nhất sẽ được đề xuất; những đặc tính về chất được thể hiện bằng ngôn ngữ của số lượng. Đây không chỉ là sự mâu thuẫn về mặt logic mà còn là sự bất đồng với bản chất của sự vật. Trên thực tế, điều gì sẽ xảy ra nếu chúng ta cố gắng đạt được đặc điểm phong cách so sánh (tức là chất lượng) trong các tác phẩm của Alexander Gerasimov và Rembrandt dựa trên tỷ lệ định lượng của màu sơn đỏ và đen trên bức vẽ của họ? Rõ ràng, đây là điều vô nghĩa tuyệt đối. Ở mức độ nào thì thông tin định lượng hoàn toàn “khách quan” về dữ liệu vật lý của một người có khả năng cho chúng ta ý tưởng về mọi thứ đặc trưng cho một người và cấu thành nên bản chất thực sự của người đó? Rõ ràng là không có. Chúng chỉ có thể đóng vai trò như một dấu hiệu riêng biệt để phân biệt người này với người khác, giống như dấu vết của các nếp gấp trên ngón tay cái. Tình hình cũng tương tự với đặc điểm định lượng của phong cách văn học. Nếu bạn xem xét cẩn thận, chúng sẽ cung cấp những dữ liệu tương đối ít ỏi để đánh giá phong cách thực tế.<122>phẩm chất ngôn ngữ của tác giả, cũng như mô tả các nếp gấp trên ngón tay để nghiên cứu tâm lý con người.

Đối với tất cả những gì đã nói, cần phải nói thêm rằng trong quá khứ, trong cái gọi là trường phái phê bình văn học chính thức, người ta đã nỗ lực nghiên cứu một cách định lượng phong cách của các nhà văn, khi các tính toán được thực hiện bằng các tính từ, ẩn dụ và yếu tố nhịp điệu, du dương của câu thơ. Tuy nhiên, nỗ lực này đã không được phát triển thêm.

Một hướng ứng dụng phương pháp toán học vào nghiên cứu hiện tượng ngôn ngữ có thể được kết hợp dưới tên thống kê ngôn ngữ. Nó tìm cách xâm nhập vào các câu hỏi cơ bản của lý thuyết ngôn ngữ và do đó có được một thiên chức trong lĩnh vực ngôn ngữ riêng. Để làm quen với hướng đi này, tốt nhất bạn nên xem lại tác phẩm đã được đề cập của Herdan, theo lời của một trong nhiều người đánh giá nó, “một cuốn sách kiêu kỳ một cách quái dị” 7 5 , tuy nhiên, đã nhận được sự hưởng ứng rộng rãi từ các nhà ngôn ngữ học 7 6 . Do Kherdan (như đã chỉ ra ở trên) đã tìm cách thu thập trong cuốn sách của mình mọi thứ cần thiết nhất trong lĩnh vực ứng dụng các phương pháp toán học vào các vấn đề ngôn ngữ, nên trong cuốn sách của ông, chúng ta thực sự không đề cập nhiều đến Kherdan mà là với cả một hướng. Như tiêu đề của cuốn sách đã thể hiện - “Ngôn ngữ là sự lựa chọn và xác suất” - trọng tâm chính của nó là tìm hiểu những gì trong một ngôn ngữ được để cho người nói tự do lựa chọn và những gì được xác định bởi cấu trúc nội tại của ngôn ngữ, giống như đó là việc xác định mối quan hệ định lượng giữa các yếu tố thuộc loại thứ nhất và thứ hai. Cuốn sách của Herdan cung cấp thông tin gần như đầy đủ về tất cả công việc trong lĩnh vực này được thực hiện bởi đại diện của các chuyên ngành khác nhau.<123>(các nhà triết học, ngôn ngữ học, toán học, kỹ thuật viên), nhưng không giới hạn ở điều này và bao gồm nhiều quan sát, cân nhắc và kết luận ban đầu của chính tác giả. Là một tác phẩm tổng hợp, nó đưa ra ý tưởng hay về các phương pháp định lượng được sử dụng và kết quả đạt được với sự trợ giúp của chúng. Các vấn đề mà chúng tôi kết hợp có điều kiện vào phần thống kê ngôn ngữ sẽ được xử lý trong phần thứ hai và thứ tư của cuốn sách.

Trong số nhiều trường hợp áp dụng phương pháp thống kê toán học vào nghiên cứu các vấn đề ngôn ngữ, chúng tôi sẽ tập trung vào những vấn đề tổng quát nhất, đồng thời có thể coi là điển hình nhất. Sử dụng số liệu của tác giả khác - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Diway 8 1 và những người khác, cũng như trích dẫn nghiên cứu của riêng họ xác định tần số tương đối của sự phân bố âm vị, chữ cái, độ dài từ (được đo bằng số lượng chữ cái và âm tiết), các hình thức ngữ pháp và các yếu tố vận luật trong hệ lục ngữ tiếng Latinh và tiếng Hy Lạp, Herdan xác lập tính ổn định của tần số tương đối của các yếu tố ngôn ngữ như một đặc điểm chung của tất cả các cấu trúc ngôn ngữ. Ông rút ra quy tắc sau: “Tỷ lệ các yếu tố ngôn ngữ thuộc về cấp độ này hay lĩnh vực mã hóa ngôn ngữ khác - âm vị học, ngữ pháp, số liệu - ít nhiều giữ nguyên không đổi đối với một ngôn ngữ nhất định, tại một giai đoạn phát triển nhất định của nó và trong phạm vi giới hạn của những quan sát đủ sâu rộng và khách quan » 8 2 . Quy tắc này, mà Herdan gọi là quy luật cơ bản của ngôn ngữ, ông tìm cách diễn giải và mở rộng theo một cách nhất định. Herdan viết về luật này: “Nó là sự thể hiện một thực tế rằng ngay cả ở đây, nơi ý chí và quyền tự do lựa chọn của con người được trao cho<124>khuôn khổ rộng nhất, trong đó sự lựa chọn có ý thức và trò chơi vô tư xen kẽ một cách sống động với nhau, nhìn chung có sự ổn định đáng kể... Nghiên cứu của chúng tôi đã tiết lộ một yếu tố khác của trật tự chung: người ta quan sát thấy những điểm tương đồng sâu rộng giữa các thành viên của cùng một cộng đồng ngôn ngữ không chỉ trong hệ thống âm vị, từ điển và ngữ pháp mà còn liên quan đến tần suất sử dụng các âm vị cụ thể, đơn vị từ vựng (từ), âm vị và cấu trúc ngữ pháp; nói cách khác, sự giống nhau không chỉ ở cái gì được sử dụng mà còn ở mức độ thường xuyên sử dụng nó." 8 3 Tình trạng này có nguyên nhân hiển nhiên nhưng lại dẫn đến những kết luận mới. Ví dụ, khi kiểm tra các văn bản hoặc phân đoạn khác nhau của một ngôn ngữ nhất định, người ta thấy rằng tần suất sử dụng tương đối âm vị cụ thể đó (hoặc các thành phần lời nói khác) của những người khác nhau về cơ bản vẫn giống nhau. Điều này dẫn đến việc giải thích các hình thức nói riêng lẻ là những biến động nhất định về xác suất liên tục sử dụng âm vị được đề cập trong một ngôn ngữ nhất định. Vì vậy, hóa ra trong hoạt động nói của mình, một người phải tuân theo các quy luật xác suất nhất định liên quan đến số lượng yếu tố ngôn ngữ được sử dụng. Và sau đó, khi chúng ta quan sát một số lượng lớn các yếu tố ngôn ngữ trong một tập hợp lớn các văn bản hoặc đoạn lời nói, chúng ta có ấn tượng về mối quan hệ nhân quả theo nghĩa là trong trường hợp này cũng có sự xác định liên quan đến việc sử dụng một số ngôn ngữ nhất định. các phần tử. Nói cách khác, hóa ra có thể khẳng định rằng những gì theo quan điểm trực quan dường như là mối quan hệ nhân quả, về mặt định lượng, là một xác suất 8 4 . Rõ ràng là tổng số càng lớn<125>của các văn bản hoặc đoạn lời nói được kiểm tra thì tính ổn định của tần suất sử dụng tương đối của các yếu tố ngôn ngữ cũng sẽ được thể hiện rõ ràng hơn trong cách sử dụng cá nhân (luật số lớn). Từ đây đưa ra một kết luận chung mới rằng ngôn ngữ là một hiện tượng đại chúng và cần được giải thích như vậy.

Những kết luận này, đạt được trên cơ sở tính toán tần số của các yếu tố ngữ âm, từ và hình thức ngữ pháp cùng nhau tạo thành ngôn ngữ, sau đó được áp dụng cho “giải thích thống kê” về sự phân chia của Saussure thành “ngôn ngữ” (lalangue) và “lời nói” (laparole) . Theo Saussure, “ngôn ngữ” là tập hợp các thói quen ngôn ngữ giúp cho việc giao tiếp giữa các thành viên của một cộng đồng ngôn ngữ nhất định có thể thực hiện được. Đây là một thực tế xã hội, một “hiện tượng đại chúng”, bắt buộc đối với tất cả những người nói một ngôn ngữ nhất định. Herdan, như đã chỉ ra, lập luận rằng các thành viên của một cộng đồng ngôn ngữ giống nhau không chỉ ở chỗ họ sử dụng cùng âm vị, đơn vị từ vựng và hình thức ngữ pháp mà còn ở chỗ tất cả các yếu tố này được sử dụng với cùng tần suất. Do đó, định nghĩa thống kê của ông về “ngôn ngữ” có dạng sau: “ngôn ngữ” (lalangue) là tổng thể các yếu tố ngôn ngữ chung cộng với xác suất sử dụng tương đối của chúng.

Định nghĩa về “ngôn ngữ” này cũng là điểm khởi đầu cho cách giải thích thống kê tương ứng về “lời nói”, mà theo Saussure, là một lời nói riêng lẻ. Đối chiếu “ngôn ngữ” như một hiện tượng xã hội với “lời nói” như một hiện tượng cá nhân, Saussure viết: “Lời nói là một hành động cá nhân của ý chí và sự hiểu biết, trong đó người ta phải phân biệt: 1. sự kết hợp với sự trợ giúp của nó mà chủ thể nói sử dụng mật mã ngôn ngữ để diễn đạt tư tưởng cá nhân; 2. một cơ chế tâm sinh lý cho phép anh ta khách quan hóa những sự kết hợp này” 8 5. Vì “ngôn ngữ” trong thống kê ngôn ngữ học được coi là một tập hợp các yếu tố có quan hệ họ hàng nhất định.<126>một xác suất nhất định về việc sử dụng chúng, trong phạm vi nó bao gồm một quần thể thống kê hoặc một quần thể (quần thể) như một đặc điểm cơ bản và có thể được xem xét ở khía cạnh này. Theo đó, “lời nói” biến thành một mẫu riêng biệt được lấy từ “ngôn ngữ” dưới dạng tổng hợp thống kê. Xác suất trong trường hợp này được xác định bởi mối quan hệ giữa “lời nói” với “ngôn ngữ” (theo cách hiểu “định lượng” của chúng) và sự phân bố tần suất sử dụng tương đối của các yếu tố khác nhau của ngôn ngữ được hiểu là kết quả của một tập thể “sự lựa chọn” trong một khoảng thời gian nhất định của sự tồn tại của ngôn ngữ. Nhận thấy rằng cách giải thích như vậy về sự khác biệt giữa “ngôn ngữ” và “lời nói” vẫn được xây dựng trên những nền tảng hoàn toàn khác so với của Saussure, Herdan viết về vấn đề này: “Sự sửa đổi nhỏ này đối với khái niệm của Saussure có hệ quả quan trọng là “ngôn ngữ” ( lalangue) hiện đang có được một đặc điểm thiết yếu dưới dạng tổng hợp thống kê (dân số). Dân số này được đặc trưng bởi tần số tương đối hoặc xác suất biến động nhất định, hãy nhớ rằng mỗi yếu tố ngôn ngữ thuộc về một cấp độ ngôn ngữ nhất định. Trong trường hợp này, “lời nói” (laparole), theo đúng nghĩa của nó, hóa ra là một thuật ngữ để xác định các mẫu thống kê được lấy từ “ngôn ngữ” như một quần thể thống kê. Rõ ràng là sự lựa chọn xuất hiện ở đây dưới dạng mối quan hệ giữa “lời nói” với “ngôn ngữ”, là mối quan hệ của một mẫu được lấy ngẫu nhiên với tổng thể thống kê (dân số). Chính thứ tự phân bố tần số, như một bản ghi nhớ hoạt động lời nói của một cộng đồng ngôn ngữ qua nhiều thế kỷ, đại diện cho một yếu tố lựa chọn, nhưng không phải là sự lựa chọn cá nhân, như trong phong cách, mà là sự lựa chọn tập thể. Sử dụng một phép ẩn dụ, ở đây chúng ta có thể nói về sự lựa chọn của tinh thần ngôn ngữ, nếu chúng ta hiểu theo cách này các nguyên tắc giao tiếp ngôn ngữ, phù hợp với sự phức tạp của dữ liệu tinh thần của các thành viên trong một cộng đồng ngôn ngữ cụ thể. Tính ổn định của chuỗi là kết quả của xác suất (cơ hội)” 8 6 .

Trường hợp đặc biệt của việc áp dụng nguyên tắc đã nêu<127>PA là sự phân biệt trong ngôn ngữ của hiện tượng quy phạm với “ngoại lệ” (độ lệch). Trong thống kê ngôn ngữ, người ta cho rằng phương pháp thống kê cho phép loại bỏ sự mơ hồ tồn tại trong vấn đề này và thiết lập các tiêu chí rõ ràng để phân biệt giữa các hiện tượng này. Nếu định mức được hiểu là tổng hợp thống kê (theo nghĩa trên) và một ngoại lệ (hoặc lỗi) là độ lệch so với tần số được hiển thị bởi tổng hợp thống kê, thì giải pháp định lượng cho câu hỏi sẽ tự gợi ý. Tất cả đều bắt nguồn từ mối quan hệ thống kê giữa “dân số” và “phương sai”. Nếu tần số quan sát được trong một mẫu đơn lẻ khác với xác suất mà dân số thống kê ngụ ý nhiều hơn mức sẽ được xác định bởi một loạt số lượng mẫu, thì chúng ta có lý khi kết luận rằng ranh giới giữa “giống nhau” (chuẩn mực) và “không giống nhau” (ngoại lệ) hóa ra bị vi phạm.

Sự khác biệt về lượng giữa “ngôn ngữ” và “lời nói” cũng được dùng để phân biệt hai loại yếu tố ngôn ngữ: ngữ pháp và từ vựng. Điểm khởi đầu để giải quyết vấn đề này, thường gây ra nhiều khó khăn lớn từ quan điểm ngôn ngữ học, là giả định rằng mức độ tần số của các yếu tố ngữ pháp khác với mức độ tần số của các đơn vị từ vựng. Điều này được cho là có liên quan đến việc “khái quát hóa” các yếu tố ngữ pháp, chúng khác với các khái niệm được cố định bởi các đơn vị từ vựng như thế nào. Ngoài ra, các yếu tố ngữ pháp, theo quy luật, được cho là có khối lượng nhỏ hơn nhiều: là các từ độc lập (bao gồm đại từ, giới từ, liên từ và từ chức năng), chúng thường bao gồm một số lượng nhỏ các âm vị và ở dạng “các dạng liên kết”. ” - từ một hoặc hai âm vị 8 7 . Yếu tố ngôn ngữ càng nhỏ thì “độ dài” (thời điểm định lượng) của nó càng ít có khả năng đóng vai trò là đặc điểm xác định và “chất lượng” của âm vị càng trở nên quan trọng hơn cho mục đích này. Những phương pháp nào được đề xuất để giải quyết vấn đề đang được xem xét? Nó được giải quyết bằng cách chuyển sang khái niệm định lượng thuần túy về ngữ pháp.<128>tải, “Giả sử,” Kherdan viết về vấn đề này, “rằng chúng tôi quan tâm đến việc so sánh hai ngôn ngữ về mặt này. Làm thế nào để chúng ta xác định, với một mức độ khách quan nhất định, “gánh nặng ngữ pháp” mà một ngôn ngữ mang theo? Rõ ràng tải trọng này sẽ phụ thuộc vào vị trí của ranh giới ngăn cách ngữ pháp với từ vựng. Việc cân nhắc đầu tiên có thể xuất hiện trong đầu chúng ta là xác định mức độ “phức tạp” của ngữ pháp của một ngôn ngữ nhất định. Xét cho cùng, “độ phức tạp” là một đặc điểm định tính và khái niệm “tải ngữ pháp” là một đặc điểm định lượng. Đúng, tải ở một mức độ nhất định phụ thuộc vào độ phức tạp, nhưng không hoàn toàn. Một ngôn ngữ có thể được trời phú cho một ngữ pháp cực kỳ phức tạp, nhưng chỉ một phần tương đối nhỏ của nó được sử dụng trong hoạt động của ngôn ngữ. Chúng tôi định nghĩa "gánh nặng ngữ pháp" là toàn bộ ngữ pháp được ngôn ngữ mang theo khi nó hoạt động, điều này ngay lập tức đặt vấn đề của chúng tôi vào lĩnh vực ngôn ngữ học cấu trúc theo nghĩa mà bộ môn này đã được Saussure định nghĩa. Trong phần trình bày sau đây, các phương pháp định lượng được sử dụng để xác định sự khác biệt giữa các ngôn ngữ tùy thuộc vào ranh giới phân tách ngữ pháp và từ vựng nằm ở đâu” 8 8 . Nói cách khác, sự khác biệt giữa các ngôn ngữ trong trường hợp này nên được giảm xuống thành sự khác biệt về mối quan hệ số giữa các yếu tố ngữ pháp và từ vựng.

Các vật liệu mà chúng tôi sử dụng sẽ vẽ nên bức tranh sau đây. Trong ngôn ngữ tiếng Anh (chỉ tính đến “các từ ngữ pháp”: đại từ, hoặc, như chúng còn được gọi là “từ thay thế”, giới từ, liên từ và động từ phụ), trong một phân đoạn bao gồm 78.633 lần xuất hiện của tất cả các từ (1.027 từ khác nhau). ), 53.102 trường hợp phát hiện có sử dụng yếu tố ngữ pháp, hay chính xác hơn là “từ ngữ pháp” (149 từ khác nhau), chiếm 67,53% với 15,8% từ khác nhau. Đây là dữ liệu của Diway 8 9 . Dữ liệu khác hiển thị một tỷ lệ phần trăm khác<129>tỷ lệ: 57,1% với 5,4% từ khác nhau 9 0. Sự khác biệt đáng kể này được giải thích bởi sự khác biệt giữa ngôn ngữ viết và ngôn ngữ nói. Các dạng ngôn ngữ viết (dữ liệu đầu tiên) được cho là sử dụng nhiều yếu tố ngữ pháp hơn dạng nói (trường hợp thứ hai). Trong Thần khúc của Dante (dựa trên nguyên tác tiếng Ý), Mariotti tìm thấy 54,4% công dụng của “từ ngữ pháp”.

Một cách khác và dường như tiên tiến hơn để xác định tải trọng ngữ pháp của một ngôn ngữ là đếm các âm vị có trong các thành phần ngữ pháp. Trong trường hợp này, không chỉ các từ ngữ pháp độc lập được tính đến mà còn cả các hình thức liên quan. Có thể có nhiều lựa chọn khác nhau ở đây. Ví dụ: xác định tần suất tương đối của việc sử dụng các âm vị phụ âm riêng lẻ trong các yếu tố ngữ pháp và so sánh chúng với tần suất sử dụng tổng thể các âm vị đó (dữ liệu cuối cùng về tỷ lệ như vậy trong tiếng Anh cho tỷ lệ từ 99,9% đến 100.000). - tổng mức sử dụng); hoặc so sánh tương tự các phụ âm theo các nhóm phân loại riêng lẻ (môi môi, vòm miệng, vòm miệng và các âm vị khác). Tỷ lệ cuối cùng ở đây có dạng tỷ lệ từ 56,47% (về các yếu tố ngữ pháp) đến 60,25% (trong tổng số cách sử dụng); hoặc so sánh tương tự các âm vị phụ âm đầu (trong trường hợp này, tỷ lệ là 100,2% về mặt ngữ pháp so với 99,95 trong tổng số lần sử dụng). Tuy nhiên, các hoạt động thống kê phức tạp hơn khác cũng có thể thực hiện được, tuy nhiên, chúng dẫn đến các biểu thức định lượng tương tự của vấn đề đang nghiên cứu.

Dữ liệu định lượng được trình bày làm cơ sở cho kết luận chung. Nó tóm tắt lại thực tế là sự phân bố các âm vị trong các yếu tố ngữ pháp quyết định bản chất của sự phân bố (tất nhiên là về mặt số lượng) của các âm vị trong toàn bộ ngôn ngữ. Và điều này, đến lượt nó, cho phép chúng ta kết luận rằng việc sử dụng các yếu tố ngữ pháp phụ thuộc ở mức độ ít nhất vào sự lựa chọn của cá nhân và tạo thành một phần của biểu thức ngôn ngữ có thể được kiểm soát.<130>ness. Kết luận suy đoán này được xác nhận bằng cách đếm các hình thức ngữ pháp trong tiếng Nga do Jesselson 9 1 thực hiện. Nghiên cứu bao gồm 46.896 từ được lấy từ các nguồn II (tác phẩm của Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfitheatrov, Gusev-Orenburgsky, Ehrenburg, Simonov và N. Ostrovsky). Chúng được chia thành từ nói (17.756 từ, tương đương 37,9%) và từ không nói (29.140 từ, tương đương 62,1%). Sau đó, toàn bộ tập hợp từ được chia thành 4 nhóm tùy theo tính chất ngữ pháp: Nhóm 1 bao gồm danh từ, tính từ, tính từ dưới dạng danh từ, đại từ và các chữ số biến cách; ở nhóm thứ 2 - động từ; ở nhóm thứ 3 - phân từ bằng lời nói, phân từ như tính từ, danh từ và danh động từ; trong nhóm thứ 4 - các dạng trạng từ, giới từ, liên từ và hạt không thể thay đổi. Kết quả tổng thể (bảng có dữ liệu về từng tác giả cũng được cung cấp) cho tỷ lệ sau:

nhóm thứ nhất

nhóm thứ 2

nhóm thứ 3

nhóm thứ 4

thông tục

không nói ra

Herdan mô tả việc xem xét dữ liệu định lượng thu được bằng những từ sau: “Họ biện minh cho kết luận rằng các yếu tố ngữ pháp nên được coi là một yếu tố xác định xác suất diễn đạt ngôn ngữ. Kết luận này tránh được sự đánh giá nặng nề của từng từ được sử dụng. Rõ ràng là vì ngữ pháp và từ vựng không được cất giữ trong những lớp vỏ không thấm nước nên cũng không phải là sự lựa chọn thuần túy hay cơ hội thuần túy. Cả ngữ pháp và từ vựng đều chứa đựng cả hai yếu tố, mặc dù với tỷ lệ khác nhau đáng kể” 9 2.<131>

Một phần lớn cuốn sách của Herdan được dành để nghiên cứu tính đối ngẫu hoặc tính đối ngẫu trong ngôn ngữ, và chính khái niệm về tính đối ngẫu cũng dựa trên các đặc điểm toán học.

Do đó, các định lý trong hình học xạ ảnh có thể được sắp xếp thành hai hàng, sao cho mỗi định lý của một hàng có thể thu được từ một định lý nào đó của hàng khác bằng cách thay thế các từ bằng nhau. dấu chấmthẳng. Ví dụ, nếu cho mệnh đề: “bất kỳ điểm nào khác nhau đều thuộc về một và chỉ một đường thẳng”, thì từ đó chúng ta có thể rút ra mệnh đề tương ứng: “hai đường thẳng khác nhau bất kỳ thuộc về một và chỉ một điểm”. Một phương pháp khác để xác định tính đối ngẫu là vẽ đồ thị các mặt phẳng khác nhau của hiện tượng đang được nghiên cứu dọc theo trục hoành và trục tọa độ. Ví dụ, Yul thực hiện 9 3, các tần số sử dụng khác nhau được tính dọc theo trục x và số lượng đơn vị từ vựng mà tần số được xác định, v.v., được tính dọc theo trục tọa độ. tính hai mặt được giải thích, được cho là trong bằng nhau cũng có thể áp dụng cho nghiên cứu ngôn ngữ.

Theo khái niệm nhị nguyên được định nghĩa theo cách này, trong mọi trường hợp thực sự có đặc điểm của mã nhị phân và cũng được coi là đặc điểm cơ bản nhất của cấu trúc ngôn ngữ, các hiện tượng định tính cực kỳ khác nhau được gộp lại, cho phép đối lập ở hai cấp độ: sự phân bố cách sử dụng của từ theo tính chất của các đơn vị từ vựng và sự phân bố của các đơn vị từ vựng theo tần suất sử dụng của từ; các hình thức nói và viết; yếu tố từ vựng và ngữ pháp; từ đồng nghĩa và trái nghĩa; âm vị và biểu diễn đồ họa của nó; được định nghĩa và xác định (signifiy và signifiy của Saussure), v.v.

Sau một nghiên cứu định lượng về tính hai mặt của một hiện tượng ngôn ngữ cụ thể hoặc một “văn bản” hạn chế, như một quy luật, người ta rút ra một kết luận về những phẩm chất của tính phổ quát ngôn ngữ. Bản chất của những kết luận đó và phương pháp chứng minh chúng có thể được tìm ra bằng cách sử dụng ví dụ<132>nghiên cứu tính hai mặt của từ và khái niệm (trên thực tế, chúng ta đang nói về mối quan hệ giữa độ dài của một từ và khối lượng của một khái niệm - phải lưu ý rằng việc sử dụng cực kỳ tự do ngôn ngữ và các thuật ngữ khác trong các tác phẩm đó thường làm cho việc hiểu rất khó khăn). Điều quan trọng cần lưu ý là tài liệu dùng làm nguồn quan sát loại đối ngẫu ngôn ngữ này đã được sử dụng: danh pháp quốc tế về bệnh tật (khoảng 1000 tên) và danh sách chung về bệnh tật của England và Wells năm 1949. Trong trường hợp này , kết luận chung sau đây được đưa ra: “Mọi khái niệm biểu thị một ý tưởng chung đều có cái có thể được gọi là “hình cầu” hoặc “khối lượng”. Nó cho phép, thông qua phương tiện của nó, suy nghĩ về nhiều đối tượng hoặc khái niệm khác nằm trong “quả cầu” của nó. Mặt khác, tất cả các mục cần thiết để xác định một khái niệm đều tạo thành cái được gọi là “nội dung” của nó. Khối lượng và nội dung có mối tương quan lẫn nhau - nội dung càng nhỏ và theo đó, khái niệm càng trừu tượng thì phạm vi hoặc khối lượng của nó càng lớn, tức là càng có nhiều đối tượng được gộp vào trong đó. Điều này có thể được coi là sự tương tự (trong phạm vi khái niệm) với các nguyên tắc mã hóa, theo đó độ dài của ký hiệu và tần suất sử dụng phụ thuộc lẫn nhau”9 4.

Nguyên tắc nhị nguyên cũng được áp dụng cho những vấn đề cụ thể. Ví dụ: khi thiết lập sự tương đương về nghĩa của các từ trong hai ngôn ngữ khác nhau. Qua nghiên cứu từ điển Muhre-Zanders Anh-Đức bằng phương pháp toán học lặp lại, người ta kết luận rằng xác suất sử dụng một từ tiếng Anh có một hoặc nhiều nghĩa trong bản dịch tiếng Đức không đổi đối với mỗi chữ cái đầu tiên trong toàn bộ từ điển 9 5 . Việc xem xét thứ tự các từ trong từ điển tiếng Trung dẫn đến kết luận rằng nó có tính phân loại về bản chất, vì số nét trong một ký tự biểu thị vị trí của nó (với tư cách là một gốc độc lập hoặc một lớp con cụ thể phụ thuộc vào gốc). Phân loại học là một nguyên tắc phân loại phụ được sử dụng trong động vật học và thực vật học. Herdan nói rằng<133>nền tảng của từ điển học tiếng Hán cũng được xây dựng trên các nguyên tắc phân loại 9 6, v.v.

Khi đưa ra đánh giá chung về hướng ứng dụng các phương pháp toán học vào nghiên cứu các vấn đề ngôn ngữ (tức là thống kê ngôn ngữ), rõ ràng cần phải xuất phát từ quan điểm đã được Ettinger đưa ra: “Toán học có thể được sử dụng một cách hiệu quả trong phục vụ của ngôn ngữ học chỉ khi các nhà ngôn ngữ học hiểu rõ giới hạn thực sự của ứng dụng của nó, cũng như khả năng của các mô hình toán học được sử dụng” 9 7. Nói cách khác, chúng ta có thể nói về ngôn ngữ học toán học khi các phương pháp toán học chứng minh được sự phù hợp của chúng trong việc giải quyết các vấn đề ngôn ngữ một cách thích hợp, mà về tổng thể, chúng tạo thành khoa học về ngôn ngữ. Nếu không phải như vậy, mặc dù điều này có thể mở ra những khía cạnh mới của nghiên cứu khoa học, thì trong trường hợp này chúng ta có thể nói về bất cứ điều gì, ngoại trừ về ngôn ngữ học - trong trường hợp này chúng tôi không muốn nói đến các loại ngôn ngữ học ứng dụng khác nhau (chúng ta sẽ nói về sau này sẽ có bài phát biểu dưới đây), nhưng là ngôn ngữ học khoa học hoặc lý thuyết. Dựa trên quan điểm này, cần lưu ý rằng theo quan điểm của một nhà ngôn ngữ học, nhiều thống kê về ngôn ngữ học đặt ra những nghi ngờ, thậm chí là hoang mang.

Chúng ta hãy chuyển sang phân tích chỉ hai ví dụ (để không làm lộn xộn phần trình bày), bảo lưu rằng có thể đưa ra những phản đối rất quan trọng đối với mỗi ví dụ. Ở đây chúng ta có sự phân biệt về số lượng giữa các đơn vị ngữ pháp và từ vựng. Hóa ra, để phân biệt được như vậy, cần phải biết trước cái gì thuộc lĩnh vực ngữ pháp và cái gì thuộc từ vựng, vì “gánh nặng ngữ pháp” của ngôn ngữ (tức là tổng thể các yếu tố ngữ pháp được sử dụng trong lời nói), như đã được trích dẫn ở trên, “phụ thuộc vào ranh giới phân chia từ vựng với ngữ pháp”. Nếu không biết đường này nằm ở đâu thì không thể phân biệt được. Vậy thì ý nghĩa của phương pháp định lượng để phân biệt từ vựng với ngữ pháp là gì?<134>matic? Tuy nhiên, đối với Kherdan, ông không đặc biệt nghĩ đến vấn đề này và mạnh dạn phân loại các yếu tố ngôn ngữ, phân loại thành các yếu tố ngữ pháp là “các hình thức liên quan”, mà xét theo cách trình bày thì có nghĩa là biến tố bên ngoài và “từ ngữ pháp”, bao gồm giới từ. , liên từ, động từ phụ trợ và đại từ - đại từ sau do thực tế chúng là những từ thay thế. Nhưng nếu chúng ta chỉ nói về đặc tính này của đại từ và trên cơ sở đó gán chúng cho các yếu tố ngữ pháp, thì rõ ràng những từ như “được đề cập”, “được đặt tên”, “được cho”, v.v. đóng vai trò là người thay thế. Liên quan đến phương pháp tách biệt các yếu tố ngữ pháp được sử dụng trong thống kê ngôn ngữ, câu hỏi đặt ra một cách tự nhiên là làm thế nào để giải quyết trong trường hợp này những hiện tượng ngữ pháp “vô hình thức” như trật tự từ, thanh điệu, hình thái số 0, quan hệ hệ biến hóa (một số hiện tượng này, bằng cách Nhân tiện, được phản ánh trong những ngôn ngữ được nghiên cứu bằng phương pháp toán học)? Làm thế nào để tạo sự khác biệt trong các ngôn ngữ có biến tố nội tại phong phú (chẳng hạn như trong ngôn ngữ Semitic), trong đó nó không chỉ thực hiện sửa đổi ngữ pháp của gốc (căn bản), mà còn mang lại cho nó sự tồn tại từ vựng, vì gốc không viết lại thì không tồn tại thực sự trong ngôn ngữ? Nên hiểu độ phức tạp về mặt ngữ pháp của một ngôn ngữ là gì, nó được xác định bởi tiêu chí nào? Nếu điểm định lượng, trong trường hợp này được nhấn mạnh, thì một trong những ngôn ngữ phức tạp nhất về mặt ngữ pháp sẽ là tiếng Anh, có các cấu trúc như Ishallhavebeencalling hoặc Willhavebeencalling. Trong những câu này, chỉ cách gọi mới có thể được phân loại là từ vựng và mọi thứ khác do đó phải được coi là ngữ pháp. Cơ sở nào tồn tại để liên kết tần suất sử dụng các yếu tố ngữ pháp với tính tổng quát hoặc tính trừu tượng của ý nghĩa của các từ ngữ pháp? Xét cho cùng, khá rõ ràng rằng tần suất sử dụng các yếu tố ngữ pháp tương đối cao được xác định bởi chức năng của chúng trong việc xây dựng câu, và đối với tính trừu tượng của ý nghĩa, rất dễ dàng tìm thấy một lượng lớn các yếu tố ngữ pháp.<135>số lượng các yếu tố từ vựng có thể dễ dàng cạnh tranh với các yếu tố ngữ pháp về mặt này, phần lớn kém hơn chúng về tần suất (ví dụ: tồn tại, tồn tại, mở rộng, không gian, chất vân vân).

Một loại phi lý tương tự đối mặt với chúng ta trong trường hợp xác định tính hai mặt của một từ và một khái niệm. Người ta phải có một sự hiểu biết cực kỳ độc đáo về bản chất cấu trúc của ngôn ngữ để đưa nó vào nghiên cứu bằng cách sử dụng danh pháp bệnh tật và sổ đăng ký bệnh tật của bệnh viện, như đã nêu ở trên, được dùng làm tài liệu nguồn cho các kết luận ngôn ngữ học rất quan trọng. Không tập trung vào việc sử dụng hoàn toàn không rõ ràng các thuật ngữ phi ngôn ngữ như phạm vi, khối lượng và nội dung của một khái niệm (nhân tiện, ý nghĩa từ vựng của từ và khái niệm được biểu thị bằng thuật ngữ khoa học bị nhầm lẫn một cách rõ ràng), chúng ta hãy chuyển sang kết luận được rút ra trong trường hợp này. Như đã nêu ở trên, chúng tôi đang giải quyết tuyên bố rằng “khối lượng và nội dung có mối tương quan lẫn nhau”. Toàn bộ dòng lý luận làm cơ sở cho kết luận như vậy, cũng như phương pháp vận dụng toán học đối với các sự kiện ngôn ngữ, cho thấy rõ ràng rằng trong trường hợp này, một phẩm chất rất quan trọng của ngôn ngữ đã bị bỏ qua hoàn toàn, điều này làm đảo lộn mọi tính toán đang được thực hiện: khả năng diễn đạt cùng một “nội dung” bằng các đơn vị ngôn ngữ có “khối lượng” khác nhau, chắc chắn cũng có tần suất sử dụng tương đối khác nhau. Vì vậy, chúng ta có thể chỉ định cùng một người như Petrov, người quen của tôi, anh ta, một người Muscovite, một chàng trai trẻ, một nhân viên đại học, anh trai vợ tôi, người đàn ông chúng tôi gặp trên cầu, v.v. Tuy nhiên, không chỉ đưa ra những kết luận cụ thể, tuy nhiên, như đã chỉ ra, có ý nghĩa phổ quát, mà còn mang lại lợi ích của việc áp dụng chính các phương pháp định lượng cho loại vấn đề ngôn ngữ này.

Nhưng đôi khi các nhà ngôn ngữ học đưa ra những kết luận có giá trị không còn nghi ngờ gì nữa. Đây là “quy luật cơ bản của ngôn ngữ”, bao gồm thực tế là trong một ngôn ngữ có sự ổn định nhất định của các yếu tố và tần suất xuất hiện tương đối của chúng.<136>sự tiêu thụ. Tuy nhiên, vấn đề với kiểu khám phá này là nó đã được các nhà ngôn ngữ học biết đến từ lâu. Xét cho cùng, khá rõ ràng là nếu ngôn ngữ không có tính ổn định nhất định và mỗi thành viên của một cộng đồng ngôn ngữ nhất định có thể tự do thay đổi các thành phần của ngôn ngữ thì việc giao tiếp lẫn nhau sẽ không thể thực hiện được và sự tồn tại của ngôn ngữ sẽ trở nên vô nghĩa. . Đối với sự phân bổ tần suất sử dụng tương đối của các yếu tố ngôn ngữ riêng lẻ, nó được thể hiện trong ngôn ngữ học dưới hình thức xác định các phạm trù từ vựng và ngữ pháp thụ động và chủ động, điều mà L. V. Shcherba rất chú ý. Trong trường hợp này phương pháp thống kê có thể hỗ trợ các nhà ngôn ngữ học chỉ trong việc phân phối các yếu tố ngôn ngữ cụ thể thành các loại tần suất sử dụng tương đối của chúng, nhưng không có cơ sở để khẳng định việc khám phá ra bất kỳ mô hình mới nào có giá trị cho ngôn ngữ học lý thuyết.

Mặt khác, thống kê ngôn ngữ đưa ra một số kết luận thực sự “nguyên bản” thể hiện rõ bản chất tư duy khoa học của những người theo nó. Do đó, các phương pháp thống kê phức tạp được sử dụng để nghiên cứu “từ vựng chính trị” trong các tác phẩm của Churchill, Benes, Halifax, Stresemann và những người khác, và bản dịch các tác phẩm của họ sang tiếng Anh được sử dụng trong tính toán cho các tác giả không nói tiếng Anh. Kết quả tính toán được trình bày dưới dạng nhiều bảng biểu, công thức toán học và phương trình. Việc giải thích ngôn ngữ của dữ liệu định lượng trong trường hợp này chỉ đơn giản tóm gọn lại thực tế là việc Churchill sử dụng “từ vựng chính trị” là điển hình nhất (?) cho nhóm tác giả này và việc Churchill sử dụng từ ngữ trong những trường hợp ông quan tâm đến các vấn đề chính trị là điển hình của cộng đồng nói tiếng Anh 9 8 .

Trong một trường hợp khác, sau khi thao tác thống kê thích hợp, người ta kết luận rằng Hitler, theo cách sử dụng từ của Đức Quốc xã, đã vi phạm tính hai mặt giữa “ngôn ngữ” và “lời nói” trong cách hiểu định lượng các thuật ngữ này. Một trường hợp đặc biệt của sự phá hủy tính nhị nguyên này là sự hiểu biết theo nghĩa đen<137>việc sử dụng các cụm từ ẩn dụ (ví dụ: “đổ muối vào vết thương hở”). Đức Quốc xã đã tự dán nhãn cho mình bằng nhiều hành động vô nhân đạo đến mức khó có thể kết tội nó về hành vi tàn bạo về ngôn ngữ này 9 9 . Theo Kherdan, định nghĩa của Marx về ngôn ngữ là hiện thực trực tiếp của tư duy cũng dẫn đến sự vi phạm tính đối ngẫu của ngôn ngữ, và quy luật biện chứng về sự chuyển một hiện tượng thành đối lập của nó, theo ông, là một quy luật ngôn ngữ bị hiểu sai về tính đối ngẫu. của ngôn ngữ 100. Những kiểu giải thích này đã nói lên điều đó.

Cuối cùng, một nhược điểm chung, đặc trưng của tất cả các trường hợp trên của phương pháp định lượng nghiên cứu vật liệu ngôn ngữ và từ đó mang tính chất phương pháp luận, là cách tiếp cận các yếu tố ngôn ngữ như một tập hợp máy móc các sự kiện hoàn toàn độc lập với nhau, theo đó, thậm chí nếu một số hoặc các mẫu, thì chúng chỉ liên quan đến các mối quan hệ bằng số của việc phân bổ các sự kiện tự trị, bên ngoài các phụ thuộc hệ thống của chúng. Đúng, J. Whatmough cố gắng bằng mọi cách có thể để đảm bảo rằng toán học tốt hơn bất kỳ loại phân tích cấu trúc ngôn ngữ nào có khả năng tiết lộ các đặc điểm cấu trúc của ngôn ngữ. Ông viết: “Toán học hiện đại không quan tâm đến phép đo và phép tính, mà độ chính xác của chúng về bản chất là hạn chế, mà chủ yếu liên quan đến cấu trúc. Đây là lý do tại sao toán học rất có lợi cho việc nghiên cứu ngôn ngữ một cách chính xác - đến một mức độ mà một mô tả riêng biệt, thậm chí còn bị hạn chế hơn bởi bản chất của nó, không thể đạt được... Cũng giống như trong vật lý, các yếu tố toán học được sử dụng để mô tả các tính chất vật lý. thế giới, vì chúng được cho là tương ứng với các yếu tố của thế giới vật chất, và trong ngôn ngữ học toán học, các yếu tố toán học có lẽ phải tương ứng với các yếu tố của thế giới lời nói" 1 01. Nhưng cách đặt câu hỏi như vậy không cứu vãn được tình thế, vì trong trường hợp tốt nhất nó có thể<138>đưa ra một phân tích về ngôn ngữ dưới dạng cấu trúc vật lý, vẫn chưa đủ cho ngôn ngữ và cuối cùng có cùng đặc tính cơ học, hoặc dưới dạng cấu trúc logic-toán học, và điều này chuyển ngôn ngữ sang một bình diện khác và phần lớn xa lạ102. Không thừa khi lưu ý rằng Watmough chỉ thấy trước những thành công của ngôn ngữ học toán học trong tương lai, và về kết quả thực sự của chúng, ông đánh giá chúng bằng những từ sau: “... gần như tất cả công việc được thực hiện cho đến nay bởi Herdan, Zipf, Yule, Guiraux và những người khác hoàn toàn không nằm ngoài sự chỉ trích của cả ngôn ngữ học và toán học; nó có vẻ mang tính nghiệp dư ở mức độ lớn” 1 03 . Vì vậy, nếu chúng ta không cố gắng dự đoán tương lai của các phương pháp toán học trong nghiên cứu ngôn ngữ mà cố gắng đánh giá đúng những gì chúng ta có ngày nay, thì chúng ta nhất thiết phải thừa nhận rằng toán học thực sự cho đến nay chỉ giới hạn trong lĩnh vực ngôn ngữ học. “đo lường và đếm”, và tôi không thể đưa ra phân tích định tính về ngôn ngữ đi sâu vào cấu trúc của nó.<139>

Chúng tôi vẫn sẽ cố gắng khách quan nhất có thể. Ở một mức độ nhất định, dữ liệu định lượng rõ ràng có thể được sử dụng bởi ngôn ngữ học, nhưng chỉ như một dữ liệu phụ trợ và chủ yếu trong các vấn đề có định hướng thực tiễn. Đối với hầu hết các phương pháp định lượng để nghiên cứu các hiện tượng ngôn ngữ cá nhân, kết luận chung của R. Brown chắc chắn là hợp lý: “Chúng có thể được coi là cách Herdan nhìn nhận chúng, nhưng ý nghĩa của tất cả những điều này là gì?” 1 04 . Hãy tưởng tượng rằng chúng ta đặt câu hỏi: “Những cây trong khu vườn này là gì?” Và đáp lại chúng tôi nhận được: “Có một trăm cây trong khu vườn này.” Đây có phải là câu trả lời cho câu hỏi của chúng tôi và nó có thực sự hợp lý không? Nhưng liên quan đến nhiều câu hỏi ngôn ngữ, các phương pháp toán học cung cấp chính xác loại câu trả lời này.

Tuy nhiên, có một lĩnh vực hoạt động nghiên cứu rộng lớn chủ yếu sử dụng các phương pháp toán học, đồng thời tập trung vào tài liệu ngôn ngữ, trong đó tính khả thi của sự kết hợp như vậy không gây ra bất kỳ nghi ngờ nào. “Ý nghĩa” của hoạt động nghiên cứu này, tầm quan trọng của nó được xác định bởi các mục tiêu mà nó phấn đấu. Nó đã được thử nghiệm trong thực tế. Trong trường hợp này, chúng ta đang nói về các vấn đề liên quan đến việc tạo ra các máy thông tin, cấu trúc dịch máy các văn bản khoa học bằng văn bản, tự động hóa việc dịch lời nói từ ngôn ngữ này sang ngôn ngữ khác và với toàn bộ nhiệm vụ phức tạp được kết hợp trong các vấn đề ngôn ngữ của điều khiển học. Toàn bộ những vấn đề như vậy thường được đặt tên chung là ngôn ngữ học ứng dụng. Do đó, nó được phân biệt với cái gọi là ngôn ngữ học toán học, bao gồm các lĩnh vực công việc đã được chỉ định ở trên là thống kê phong cách và thống kê ngôn ngữ, mặc dù nó hoàn toàn không tránh được việc xử lý thống kê tài liệu ngôn ngữ. Có lẽ đặc điểm quan trọng nhất của ngôn ngữ học ứng dụng, giúp phân biệt nó với ngôn ngữ học toán học như đã nêu ở trên, đó là ngôn ngữ học ứng dụng có định hướng ngược lại: không phải toán học dành cho ngôn ngữ học, mà là ngôn ngữ học.<140>(được chính thức hóa bằng phương pháp toán học) cho nhiều bài toán thực tế.

Không cần thiết phải tiết lộ nội dung của các vấn đề riêng lẻ trong lĩnh vực ngôn ngữ học ứng dụng vô cùng rộng rãi hiện nay. Ngược lại với ngôn ngữ học toán học, những vấn đề này được thảo luận tích cực trong văn học ngôn ngữ học Liên Xô và bắt đầu chiếm một vị trí ngày càng nổi bật trong các vấn đề khoa học của các viện nghiên cứu1 05. Vì vậy, chúng đã khá nổi tiếng đối với cộng đồng ngôn ngữ của chúng ta. Tuy nhiên, hoàn cảnh này không giải phóng chúng ta khỏi nhu cầu phải hiểu chúng, đặc biệt, từ quan điểm của các nguyên tắc khoa học ngôn ngữ. Điều này chắc chắn sẽ giúp loại bỏ những hiểu lầm đang ngày càng nảy sinh giữa các đại diện của các ngành khoa học rất xa nhau, tham gia vào công việc giải quyết các vấn đề của ngôn ngữ học ứng dụng, và một mặt sẽ vạch ra những cách để họ hội tụ và phân định các lĩnh vực nghiên cứu. , mặt khác. Không cần phải nói rằng những cân nhắc sau đây sẽ thể hiện quan điểm của nhà ngôn ngữ học, và điều cần thiết là các nhà toán học không chỉ cố gắng tiếp thu nó mà còn liên quan đến các câu hỏi được đặt ra, đưa ra cách giải thích riêng cho chúng.

Một nhà lý luận ngôn ngữ học không thể hài lòng với thực tế là trong mọi trường hợp nghiên cứu<141>ngôn ngữ cho các mục đích do ngôn ngữ học ứng dụng đặt ra, chúng dựa trên mô hình toán học. Theo đó, các quan sát về hiện tượng ngôn ngữ và kết quả thu được được thể hiện bằng các thuật ngữ và khái niệm toán học, tức là thông qua các phương trình và công thức toán học. Chúng ta hãy xem một ví dụ cho rõ ràng. Condon 1 06 và Zipf 1 07 đã xác định rằng logarit của tần số ( f) việc sử dụng các từ trong một văn bản lớn gần như nằm trên một đường thẳng, nếu chúng tương quan trên sơ đồ với logarit của thứ hạng hoặc danh mục ( r) những từ này. phương trình f = c:r,Ở đâu Với là một hằng số, phản ánh mối quan hệ này theo nghĩa hạn chế là c:r cho một giá trị nhất định r tái tạo tần số quan sát được với độ gần đúng lớn. Mối quan hệ giữa fr,được thể hiện bằng một công thức toán học, là mô hình cho mối quan hệ giữa các giá trị quan sát được về tần suất sử dụng và thứ hạng hoặc danh mục của các từ. Đây là một trong những trường hợp của mô hình toán học. 

Toàn bộ lý thuyết về thông tin hoàn toàn dựa trên mô hình toán học của quá trình giao tiếp được phát triển bởi K. Shannon 1 08. Nó được định nghĩa là “một môn toán dành cho các phương pháp tính toán và ước tính lượng thông tin chứa trong bất kỳ dữ liệu nào cũng như nghiên cứu các quá trình lưu trữ và truyền thông tin” (TSB, tập 51, trang 128). Theo đó, các khái niệm cơ bản của lý thuyết thông tin nhận được một biểu thức toán học. Thông tin được đo bằng binits hoặc đơn vị nhị phân (một mã tương tự như một ngôn ngữ, với hai tín hiệu có điều kiện có khả năng xảy ra như nhau truyền một đơn vị thông tin nhị phân khi truyền mỗi ký hiệu Dự phòng). được định nghĩa là “sự khác biệt giữa khả năng truyền tải có thể về mặt lý thuyết của mã và lượng thông tin trung bình được truyền<142>sự hình thành. Sự dư thừa được biểu thị bằng phần trăm của tổng công suất truyền của mã” 1 09, v.v. Tương tự như vậy, dịch máy yêu cầu phát triển thuật toán để hiển thị các phần tử của ngôn ngữ này sang ngôn ngữ khác, v.v. 1 10. Đây là những trường hợp khác của mô hình hóa.

Việc sử dụng các mô hình vượt ra ngoài bất kỳ ý nghĩa nào có thể mang lại sự hỗ trợ rất đáng kể, đặc biệt, rất có thể, trong việc giải quyết các vấn đề mà ngôn ngữ học ứng dụng tự đặt ra. Tuy nhiên, đối với ngôn ngữ học lý thuyết, việc một mô hình trừu tượng, như một quy luật, không tái tạo tất cả các đặc điểm của một hiện tượng thực tế, tất cả các phẩm chất chức năng của nó, là rất có ý nghĩa. Vì vậy, một kiến ​​​​trúc sư trước khi xây một ngôi nhà có thể tạo ra một mô hình mô phỏng ngôi nhà được thiết kế đến từng chi tiết nhỏ nhất và điều này giúp anh ta giải quyết một số vấn đề thực tế liên quan đến việc xây dựng ngôi nhà. Nhưng một mô hình ngôi nhà như vậy, cho dù nó có chính xác đến đâu, cũng không có “chức năng” đó và mục đích mà tất cả các ngôi nhà được xây dựng nói chung - nó không có khả năng cung cấp nhà ở cho một người. Tình huống tương tự với ngôn ngữ, trong đó mô hình không phải lúc nào cũng có thể tái tạo tất cả các đặc tính của nó. Trong trường hợp này, vấn đề còn phức tạp hơn bởi thực tế là các biện pháp toán học thay vì ngôn ngữ được sử dụng để xây dựng mô hình. “Các mô hình toán học…” A. Ettinger viết, “đóng một vai trò cực kỳ quan trọng trong mọi lĩnh vực công nghệ, nhưng vì chúng là một công cụ tổng hợp nên tầm quan trọng của chúng đối với ngôn ngữ học, vốn chủ yếu là một môn học lịch sử và mô tả, đương nhiên bị hạn chế. ” 1 11 .<143>

Mô hình toán học của một ngôn ngữ trên thực tế chỉ có thể áp dụng cho trạng thái tĩnh của nó, mà đối với một nhà ngôn ngữ học là có điều kiện và trên thực tế là mâu thuẫn trực tiếp với chất lượng cơ bản của ngôn ngữ, hình thức tồn tại của nó là sự phát triển. Không cần phải nói rằng nghiên cứu tĩnh về ngôn ngữ không hề bị loại trừ khỏi ngôn ngữ học và là cơ sở để biên soạn các ngữ pháp và từ điển quy chuẩn, ngữ pháp mô tả, ngữ pháp thực hành và từ điển làm hướng dẫn cho việc nghiên cứu thực tế ngoại ngữ, v.v. Tuy nhiên, trong tất cả các công trình như vậy, mang tính chất ứng dụng là chủ yếu, các nhà ngôn ngữ học cố tình hạn chế lĩnh vực nghiên cứu và không làm ngơ trước các khía cạnh khác của ngôn ngữ 1 12 . Đặc biệt, trong việc kiểm tra tĩnh của ngôn ngữ, những phẩm chất ngôn ngữ gắn liền với bản chất năng động của nó như năng suất, sự phụ thuộc vào các hình thức tư duy, sự tương tác rộng rãi với các yếu tố văn hóa, xã hội, chính trị, lịch sử và các yếu tố khác hoàn toàn biến mất khỏi tầm nhìn của ngôn ngữ. nhà nghiên cứu. Chỉ ở cấp độ đồng bộ, ngôn ngữ mới có thể được coi là một hệ thống các ký hiệu hoặc mã thông thường, tuy nhiên, điều này hóa ra hoàn toàn trái pháp luật ngay khi chúng ta có quan điểm năng động phù hợp hơn với ngôn ngữ. Chính trong quá trình phát triển, những phẩm chất của ngôn ngữ như động lực, tính đa nghĩa của từ không có ranh giới ổn định, tính không tự chủ về nghĩa của từ và vỏ âm thanh của nó, tiềm năng sáng tạo của từ gắn liền với ngữ cảnh được thể hiện. , và tất cả điều này mâu thuẫn sâu sắc với các đặc điểm cơ bản của mã hoặc ký hiệu 1 13 . Rõ ràng, trong ngôn ngữ học ứng dụng, người ta cũng có thể nghĩ về tất cả những phẩm chất này của một ngôn ngữ và, vì những mục đích thực tế, có thể nói là bằng lòng với một “ảnh chụp nhanh” của ngôn ngữ, vẫn có khả năng đưa ra một ý tưởng khá gần đúng. về cơ chế hoạt động của nó.<144>Ninh. Tuy nhiên, mỗi “ảnh chụp nhanh” như vậy, nếu được coi là một thực tế của ngôn ngữ, chứ không phải là một thực tế của một hệ thống mật mã quy ước, phải được đưa vào quá trình vận động vô tận trong đó ngôn ngữ luôn cư trú1 14. Nó không thể được nghiên cứu bên ngoài những điều kiện cụ thể đặc trưng cho phong trào này, những điều kiện để lại dấu ấn trong trạng thái nhất định của ngôn ngữ và quyết định tiềm năng phát triển hơn nữa của nó. Ở đây có sự khác biệt tương tự như giữa một bức ảnh chụp nhanh một người và bức chân dung của người đó được vẽ bằng bút lông của một nghệ sĩ thực thụ. Trong tác phẩm của người nghệ sĩ, chúng ta thấy hình ảnh khái quát của một con người với tất cả sự độc đáo không chỉ về ngoại hình mà còn cả nội dung tinh thần bên trong của anh ta. Từ một bức chân dung nghệ thuật, chúng ta có thể đọc được quá khứ của người được miêu tả trên đó và xác định khả năng hành động của người đó. Và một bức ảnh chụp tức thì, mặc dù có khả năng mang lại hình ảnh chính xác hơn về diện mạo của ảnh gốc nhưng lại không có những đặc điểm này và thường ghi lại cả một nốt mụn ngẫu nhiên xuất hiện trên mũi và<145>một tư thế hoặc biểu cảm hoàn toàn không đặc trưng, ​​cuối cùng dẫn đến làm biến dạng bản gốc.

Tất nhiên, cần lưu ý rằng phương pháp “chụp nhanh” có thể được áp dụng cho thực tế phát triển ngôn ngữ. Nhưng trong trường hợp này, chúng ta thực sự sẽ chỉ đề cập đến các trạng thái ngôn ngữ riêng lẻ, mà khi được đặc trưng về mặt định lượng, hóa ra không được kết nối nhiều hơn các đặc điểm định lượng so sánh của các ngôn ngữ khác nhau. Loại “động lực” định lượng này sẽ không chứa bất cứ thứ gì hữu cơ, và mối liên hệ giữa các trạng thái ngôn ngữ riêng lẻ sẽ chỉ dựa trên sự so sánh các mối quan hệ số học. Nếu chúng ta sử dụng một phép loại suy trong trường hợp này, chúng ta có thể đề cập đến sự lớn lên của một đứa trẻ. Tất nhiên, sự phát triển của anh ta có thể được trình bày dưới dạng động lực của dữ liệu số về cân nặng, chiều cao, tỷ lệ thay đổi về thể tích của các bộ phận trên cơ thể anh ta, nhưng tất cả những dữ liệu này hoàn toàn tách biệt khỏi mọi thứ chủ yếu cấu thành nên bản chất cá nhân. của một người - tính cách, khuynh hướng, thói quen, thị hiếu, v.v.

Một mặt tiêu cực khác của “mô hình hóa” toán học của một ngôn ngữ là nó không thể đóng vai trò là nguyên tắc chung để có thể thực hiện mô tả ngôn ngữ một cách có hệ thống và toàn diện. Chẳng hạn, chỉ có cách tiếp cận toán học đối với các hiện tượng ngôn ngữ sẽ không thể trả lời ngay cả những câu hỏi cơ bản như vậy (nếu không có những câu hỏi đó thì không thể tưởng tượng được sự tồn tại của khoa học ngôn ngữ), chẳng hạn như: ngôn ngữ là gì, hiện tượng nào nên được phân loại như hiện tượng ngôn ngữ, từ hoặc câu được định nghĩa như thế nào, những khái niệm, phạm trù cơ bản của ngôn ngữ là gì, v.v.. Trước khi chuyển sang các phương pháp toán học nghiên cứu ngôn ngữ, cần phải có câu trả lời trước (ngay cả khi ở dạng công trình). giả thuyết) cho tất cả những câu hỏi này. Không cần phải nhắm mắt làm ngơ trước một thực tế là trong mọi trường hợp mà chúng ta đã biết khi nghiên cứu các hiện tượng ngôn ngữ bằng phương pháp toán học, tất cả các khái niệm và phạm trù này chắc chắn phải được chấp nhận vì chúng được xác định bằng các phương pháp truyền thống hoặc nói một cách tương đối là phương pháp định tính.

Đặc điểm này của các phương pháp toán học trong ứng dụng ngôn ngữ của chúng đã được Spang-Hanssen lưu ý khi<146>sal: “Cần lưu ý rằng các sự kiện được quan sát nhận được biểu hiện định lượng ... không có giá trị trừ khi chúng là một phần của mô tả, và vì mục đích ngôn ngữ, đây phải là một mô tả có hệ thống, liên quan chặt chẽ đến lý thuyết và mô tả ngôn ngữ định tính” 1 15 . Trong một bài phát biểu khác của Spang-Hanssen, chúng tôi thấy suy nghĩ này được làm rõ: “Cho đến khi khả năng xây dựng một hệ thống định lượng được chứng minh và miễn là có một hệ thống định tính được chấp nhận rộng rãi cho một lĩnh vực nghiên cứu nhất định, số tần số và các số khác đặc điểm từ quan điểm ngôn ngữ nhìn thấy không có ý nghĩa" 1 16. Uldall bày tỏ những ý tưởng tương tự, có phần bất ngờ kết nối chúng với sự phát triển của nền tảng lý thuyết chung của ngữ pháp học: “Khi một nhà ngôn ngữ học đếm hoặc đo lường mọi thứ mà anh ta đếm và đo lường, bản thân nó không được xác định một cách định lượng; ví dụ, các từ, khi chúng được đếm, sẽ được xác định, nếu chúng được định nghĩa, theo những thuật ngữ hoàn toàn khác nhau” 1 17 .<147>

Do đó, hóa ra cả về mặt lý thuyết và ứng dụng thực tế, các phương pháp toán học đều phụ thuộc trực tiếp vào các khái niệm và phạm trù ngôn ngữ được xác định bằng các phương pháp truyền thống, ngữ văn hoặc như đã đề cập ở trên. Về mặt ngôn ngữ học ứng dụng, điều quan trọng là phải hiểu sự phụ thuộc này và do đó làm quen với toàn bộ các phạm trù cơ bản của ngôn ngữ học truyền thống.

Tuy nhiên, không có lý do gì để đổ lỗi cho các đại diện của các ngành khoa học chính xác làm việc trong lĩnh vực ngôn ngữ học ứng dụng vì đã không sử dụng dữ liệu của ngôn ngữ học hiện đại. Điều này không tương ứng với tình hình thực tế. Họ không chỉ biết rất rõ mà còn sử dụng rộng rãi trong công việc của mình các hệ thống đặc điểm khác biệt do các nhà ngôn ngữ học thiết lập, đặc điểm của các ngôn ngữ khác nhau, sự phân bố và sắp xếp các yếu tố ngôn ngữ trong các hệ thống ngôn ngữ cụ thể, những thành tựu của ngữ âm học âm thanh, v.v. trường hợp này, một sự đặt trước rất quan trọng là cần thiết. Trên thực tế, các đại diện của các ngành khoa học chính xác chỉ sử dụng dữ liệu theo một hướng trong ngôn ngữ học - cái gọi là ngôn ngữ học mô tả, vốn cố tình phân biệt mình với các vấn đề truyền thống của ngôn ngữ học lý thuyết, không bao trùm toàn bộ lĩnh vực nghiên cứu ngôn ngữ và từ lĩnh vực ngôn ngữ học. Bản thân quan điểm này có những thiếu sót đáng kể về mặt phương pháp luận, dẫn đến cuộc khủng hoảng mới xuất hiện gần đây, hơn nữa, nó còn mang tính định hướng thực tiễn thuần túy, phù hợp với lợi ích của ngôn ngữ học ứng dụng. Tất cả những dè dặt và trách móc được đưa ra ở trên liên quan đến việc xem xét tĩnh tại của ngôn ngữ đều áp dụng cho ngôn ngữ học mô tả. Cách tiếp cận một chiều như vậy của ngôn ngữ học mô tả có thể, nhà nghiên cứu<148>Tuy nhiên, chỉ được chứng minh bằng những nhiệm vụ mà ngôn ngữ học ứng dụng tự đặt ra, nó không làm cạn kiệt toàn bộ nội dung của khoa học ngôn ngữ.

Trong quá trình phát triển các vấn đề của ngôn ngữ học ứng dụng, những vấn đề lý thuyết mới có thể nảy sinh và trên thực tế đã nảy sinh. Một số vấn đề này có liên quan chặt chẽ đến các vấn đề cụ thể của ngôn ngữ học ứng dụng và nhằm mục đích khắc phục những khó khăn nảy sinh trong việc giải quyết những vấn đề này. Các vấn đề khác liên quan trực tiếp đến ngôn ngữ học lý thuyết, cho phép có một góc nhìn mới để xem xét các ý tưởng truyền thống hoặc mở ra các lĩnh vực nghiên cứu ngôn ngữ mới, các khái niệm và lý thuyết mới. Ví dụ, trong số này có vấn đề tạo ra một ngôn ngữ “máy” (hoặc ngôn ngữ trung gian), liên quan chặt chẽ nhất đến một tập hợp phức tạp các vấn đề cốt lõi của ngôn ngữ học lý thuyết như mối quan hệ giữa các khái niệm và ý nghĩa từ vựng, logic và ngữ pháp, lịch đại và đồng đại, bản chất ký hiệu của ngôn ngữ, bản chất ý nghĩa ngôn ngữ, nguyên tắc xây dựng ngôn ngữ nhân tạo, v.v. 1 19. Trong trường hợp này, điều đặc biệt quan trọng là thiết lập sự hiểu biết và hợp tác lẫn nhau trong công việc chung của đại diện các ngành ngôn ngữ và khoa học chính xác. Về mặt ngôn ngữ, cuộc trò chuyện trong trường hợp này rõ ràng không nên tập trung vào việc hạn chế nỗ lực của những người thiết kế máy dịch chẳng hạn” và cố gắng thiết lập khả năng làm việc của những chiếc máy đó bằng thơ của N. Gribachev hay văn xuôi của V. Kochetov 1 20 . Bản thân chiếc máy sẽ tìm ra những giới hạn về khả năng của nó và khả năng sinh lời sẽ tìm ra những giới hạn trong việc sử dụng nó. Nhưng các nhà ngôn ngữ học, với sự đóng góp của họ cho sự nghiệp chung, phải mang đến kiến ​​thức về đặc thù của cấu trúc ngôn ngữ, tính linh hoạt của nó, mối quan hệ giao thoa nội tại của các yếu tố của nó, cũng như các mối liên hệ rộng rãi và đa phương của ngôn ngữ với các đặc tính vật lý, sinh lý. , tinh thần và logic<149>hiện tượng mi, các mô hình hoạt động và phát triển ngôn ngữ cụ thể. Toàn bộ bộ kiến ​​​​thức này là cần thiết đối với những người thiết kế các máy móc tương ứng, để không đi sai hướng mà giúp cho việc tìm kiếm có mục đích và định hướng rõ ràng. Ngay cả cái nhìn tổng quan rất ngắn gọn về các trường hợp áp dụng các phương pháp toán học vào các vấn đề ngôn ngữ được đưa ra trong bài tiểu luận này cũng thuyết phục rằng những kiến ​​​​thức đó sẽ không thừa đối với những người đại diện cho các ngành khoa học chính xác.

Dựa trên tất cả những cân nhắc ở trên, rõ ràng người ta có thể đi đến một số kết luận chung.

Vì vậy, ngôn ngữ học toán học? Nếu điều này có nghĩa là việc sử dụng các phương pháp toán học như một chìa khóa tổng quát để giải quyết mọi vấn đề ngôn ngữ, thì những tuyên bố như vậy nên được coi là hoàn toàn phi lý. Tất cả những gì đã được thực hiện theo hướng này cho đến nay đã đóng góp rất ít hoặc thậm chí không hề đóng góp gì cho việc giải quyết các vấn đề truyền thống trong khoa học ngôn ngữ. Trong trường hợp xấu nhất, việc sử dụng các phương pháp toán học đi kèm với những điều phi lý rõ ràng hoặc, xét từ góc độ ngôn ngữ học, là hoàn toàn vô nghĩa. Tốt nhất, các phương pháp toán học có thể được sử dụng như những kỹ thuật phụ trợ cho nghiên cứu ngôn ngữ, phục vụ cho các nhiệm vụ ngôn ngữ cụ thể và có giới hạn. Không thể nói đến bất kỳ “triết học định lượng nào về ngôn ngữ” ở đây. Có một thời, vật lý, tâm lý học, sinh lý học, logic học, xã hội học và dân tộc học đã xâm phạm tính độc lập của khoa học ngôn ngữ, nhưng chúng không thể khuất phục được ngôn ngữ học. Điều ngược lại đã xảy ra - ngôn ngữ học đã tận dụng những thành tựu của các ngành khoa học này và bắt đầu sử dụng sự trợ giúp của chúng ở mức độ cần thiết, từ đó làm phong phú thêm kho kỹ thuật nghiên cứu của mình. Bây giờ rõ ràng là đến lượt toán học. Người ta hy vọng rằng cộng đồng mới này cũng sẽ góp phần củng cố khoa học ngôn ngữ, cải thiện phương pháp làm việc và tăng tính đa dạng của chúng. Vì vậy, thật hợp lý khi nói về ngôn ngữ học toán học ở mức độ tương tự như ngôn ngữ học vật lý, ngôn ngữ học sinh lý, ngôn ngữ học logic, ngôn ngữ học tâm lý và<150>v.v. Không có ngôn ngữ học như vậy; chỉ có một ngôn ngữ học duy nhất sử dụng dữ liệu của các ngành khoa học khác làm công cụ nghiên cứu phụ trợ một cách hữu ích. Vì vậy, không có lý do gì để rút lui trước sự tấn công dữ dội của khoa học mới và dễ dàng nhường chỗ cho nó những quan điểm đã đạt được. Ở đây rất thích hợp để nhớ lại những lời của A. Martinet: “Có lẽ thật hấp dẫn khi tham gia bằng cách sử dụng một vài thuật ngữ được lựa chọn kỹ lưỡng cho phong trào tư tưởng chính này hoặc phong trào tư tưởng chính kia, hoặc tuyên bố bằng một số công thức toán học về tính chặt chẽ của lý luận của một người. . Tuy nhiên, đã đến lúc các nhà ngôn ngữ học nhận ra tính độc lập của khoa học của họ và thoát khỏi mặc cảm tự ti buộc họ phải liên kết bất kỳ hành động nào của họ với nguyên tắc khoa học chung này hay nguyên tắc khoa học chung khác, do đó, các đường viền của hiện thực luôn trở nên phức tạp hơn. chỉ mơ hồ hơn thay vì trở nên rõ ràng hơn” 1 21.

Vì vậy, bản thân nó là toán học và ngôn ngữ học. Điều này hoàn toàn không loại trừ sự hỗ trợ lẫn nhau hoặc cuộc gặp gỡ thân thiện trong công việc chung về các vấn đề chung. Nơi áp dụng những nỗ lực phối hợp của hai ngành khoa học này là toàn bộ các vấn đề thuộc ngôn ngữ học ứng dụng và có ý nghĩa kinh tế quốc gia to lớn. Chúng ta chỉ có thể mong muốn rằng trong công việc chung của mình, cả hai ngành khoa học đều thể hiện sự hiểu biết lẫn nhau tối đa, điều này chắc chắn sẽ góp phần mang lại hiệu quả tối đa cho sự hợp tác của họ.<151>

Sự thâm nhập của các phương pháp toán học và “tinh thần toán học” vào ngôn ngữ học đã góp phần đưa ngôn ngữ học phát triển theo hướng chính xác và khách quan. Tuy nhiên, có những trở ngại nghiêm trọng cho sự phát triển hơn nữa của nó theo hướng này. Tác giả suy nghĩ về nguyên nhân của sự hội tụ giữa ngôn ngữ học và toán học, về những hạn chế trong khả năng ứng dụng của các phương pháp toán học trong ngôn ngữ học và về bản chất của các yếu tố cản trở sự hiểu biết lẫn nhau giữa các nhà toán học và ngôn ngữ học.

Vào nửa sau của thập niên 50, khi một số nhà ngôn ngữ học trẻ nghĩ đến việc sử dụng các phương pháp toán học để nghiên cứu cấu trúc ngôn ngữ và bắt đầu hợp tác với các nhà toán học, điều này đã gây ngạc nhiên, thậm chí sốc cho nhiều đồng nghiệp của họ - xét cho cùng, ngay từ nhỏ họ đã tin rằng các ngành nhân văn, một trong số đó là ngôn ngữ học, toán học và các ngành khoa học “chính xác” khác có và không thể có điểm chung.

Trong khi đó, sự hiện diện của mối liên hệ chặt chẽ giữa ngôn ngữ tự nhiên và toán học hoàn toàn không phải là một khám phá mới vào thời điểm đó. L. S. Vygotsky đã viết trong cuốn sách “Tư duy và lời nói” xuất bản năm 1934: “Người đầu tiên nhìn thấy trong toán học tư duy bắt nguồn từ ngôn ngữ nhưng đã vượt qua nó, rõ ràng là Descartes” và tiếp tục: “Ngôn ngữ đàm thoại thông thường của chúng ta, do tính chất của nó. những biến động và mâu thuẫn cố hữu về mặt ngữ pháp và tâm lý, đang ở trạng thái cân bằng chuyển động giữa các lý tưởng về toán học và sự hài hòa tuyệt vời và trong sự chuyển động không ngừng, mà chúng ta gọi là sự tiến hóa.

Học thuyết về các phạm trù ngữ pháp nảy sinh ở Hy Lạp cổ đại đã là sự mô tả một số khía cạnh quan trọng nhất của cấu trúc ngôn ngữ bằng cách sử dụng các mô hình trừu tượng, có phong cách tương tự như các mô hình được các nhà toán học Hy Lạp cổ đại tạo ra để mô tả các dạng không gian; Chỉ có sự quen thuộc của các khái niệm như trường hợp, giới tính, v.v., như H. Steinthal đã viết, đã trở thành “bản chất thứ hai của chúng ta” mới ngăn cản chúng ta hiểu được mức độ tư duy trừu tượng cao mà việc tạo ra chúng đòi hỏi. Vì vậy, người ta sẽ ngạc nhiên hơn khi những nỗ lực đầu tiên sử dụng các phương tiện toán học thực sự để mô tả “sự hài hòa toán học lý tưởng” về mặt ngôn ngữ chỉ được thực hiện vào giữa thế kỷ XX.

Có thể xác định được hai lý do cho sự “trì hoãn” này. Thứ nhất, khoa học ngôn ngữ, sau những bước tiến quan trọng từ thời cổ đại, chỉ bắt đầu thực sự phát triển trở lại vào thế kỷ 19, nhưng trong suốt thế kỷ này, sự chú ý chính của các nhà ngôn ngữ học đã chuyển sang lịch sử ngôn ngữ, và chỉ trong thế kỷ tiếp theo, Nói chung là thế kỷ của chủ nghĩa cấu trúc đối với nhân văn, ngôn ngữ học lần đầu tiên sau thời kỳ cổ đại chuyển sang nghiên cứu cấu trúc ngôn ngữ, nhưng ở một cấp độ mới. Khi các nhà ngôn ngữ học nhận ra rằng ngôn ngữ, theo cách nói của F. de Saussure, là một “hệ thống các quan hệ thuần túy”, tức là một hệ thống các dấu hiệu mà bản chất vật lý của nó là không quan trọng và chỉ có các mối quan hệ giữa chúng là có ý nghĩa, thì sự song hành giữa ngôn ngữ và các công trình toán học đã trở nên hoàn toàn rõ ràng, cũng là “các hệ thống quan hệ thuần túy”, và vào đầu thế kỷ XX, chính de Saussure đã mơ ước nghiên cứu ngôn ngữ bằng các phương tiện toán học.

Thứ hai, trong toán học vào đầu thời hiện đại, các phương pháp định lượng đã xuất hiện và chỉ đến thế kỷ 19, các nhà toán học mới bắt đầu xây dựng lại các mô hình trừu tượng phi định lượng, khác với các mô hình cổ xưa ở mức độ trừu tượng cao hơn, và - đặc biệt quan trọng đối với chủ đề của chúng ta - ở chỗ chúng có thể được sử dụng để mô tả phạm vi hiện tượng rộng hơn nhiều so với các dạng không gian; Thông thường những mô hình như vậy hóa ra là một phương tiện thuận tiện và thậm chí cần thiết để nghiên cứu các hiện tượng mà các nhà toán học xây dựng chúng không hề nghĩ tới và thậm chí không biết về sự tồn tại của chúng. Trong số những mô hình này có những mô hình sau đó được sử dụng trong ngôn ngữ học; Sự phát triển đặc biệt chuyên sâu của các ngành toán học, nội dung của chúng là việc xây dựng chúng, diễn ra vào nửa đầu thế kỷ XX. Vì vậy, sự gặp gỡ của toán học và ngôn ngữ học vào giữa thế kỷ này là điều khá tự nhiên.

Một trong những kết quả của cuộc họp này là sự xuất hiện của một ngành toán học mới - ngôn ngữ học toán học, chủ đề của nó là phát triển một bộ máy toán học để nghiên cứu ngôn ngữ. Vị trí trung tâm của ngôn ngữ học toán học là lý thuyết ngữ pháp hình thức, về bản chất của bộ máy được sử dụng trong nó, gần giống với logic toán học và đặc biệt là lý thuyết về thuật toán. Nó cung cấp các phương pháp hình thức để mô tả các đơn vị ngôn ngữ chính xác ở các cấp độ khác nhau, cũng như quan trọng nhất là các phương pháp hình thức để mô tả các biến đổi của các đơn vị ngôn ngữ - cả ở một cấp độ và xuyên cấp độ. Bên cạnh lý thuyết ngữ pháp hình thức là lý thuyết về cấu trúc cú pháp, đơn giản hơn nhiều về mặt bộ máy nhưng không kém phần quan trọng đối với các ứng dụng ngôn ngữ. Trong ngôn ngữ học toán học, các mô hình phân tích ngôn ngữ cũng được phát triển, trong đó, trên cơ sở dữ liệu nhất định - được coi là đã biết - về “văn bản chính xác”, các cấu trúc hình thức được tạo ra, kết quả của nó là mô tả một số “ thành phần“cơ chế ngôn ngữ. Bằng cách này, có thể có được sự mô tả chính thức về một số khái niệm ngữ pháp truyền thống. Điều này cũng phải bao gồm phần mô tả ý nghĩa của câu bằng cách sử dụng bộ máy logic tăng cường (“ngữ nghĩa Montague”).

Tất nhiên, với sự trợ giúp của một bộ máy toán học, người ta chỉ có thể mô tả một trong hai lý tưởng của ngôn ngữ mà Vygotsky đã nói đến; Do đó, những phản đối thường được nghe thấy đối với việc sử dụng mô hình toán học này hay mô hình toán học kia (hoặc các mô hình toán học nói chung) với lý do nó không bao gồm các trường hợp cụ thể này là không có ý nghĩa: để mô tả “sự dao động và không nhất quán” vốn có trong một ngôn ngữ, chúng ta cần những phương tiện hoàn toàn khác, phi toán học, và chỉ một mô tả rõ ràng về “lý tưởng toán học” có thể giúp tìm ra chúng, vì nó có thể giúp phân biệt rõ ràng “tuyệt vời” với “toán học” trong ngôn ngữ. Nhưng đây vẫn là vấn đề của tương lai.

Không kém, và có lẽ còn quan trọng hơn sự xuất hiện của ngôn ngữ học toán học, là sự thâm nhập trực tiếp vào ngôn ngữ học của các ý tưởng và khái niệm toán học cơ bản - chẳng hạn như tập hợp, hàm số, đẳng cấu. Trong ngữ nghĩa ngôn ngữ hiện đại, các khái niệm vị ngữ và lượng từ xuất phát từ logic toán học, đóng một vai trò quan trọng. (Điều đầu tiên trong số chúng nảy sinh trong logic ngay cả khi nó không được phân biệt với ngôn ngữ học, và hiện đã quay trở lại ngôn ngữ học ở dạng tổng quát và được xử lý bằng toán học.)

Và cuối cùng, việc làm rõ ngôn ngữ của nghiên cứu ngôn ngữ có tầm quan trọng rất lớn, xảy ra do sự thâm nhập của “tinh thần toán học” vào ngôn ngữ học, không chỉ trong những lĩnh vực có thể sử dụng các ý tưởng và phương pháp toán học. Tất cả điều này có thể được tóm tắt ngắn gọn như sau: ngôn ngữ học đang trở thành một ngành khoa học ngày càng chính xác và khách quan hơn - tất nhiên, không ngừng là một khoa học nhân đạo.

Tuy nhiên, con đường phát triển tự nhiên này của ngôn ngữ học gặp phải những trở ngại nghiêm trọng có thể làm chậm nó trong thời gian dài. Nguyên nhân chính là sự “tách biệt các khoa” nảy sinh vào đầu Thời đại mới: một mặt là các nhà khoa học tự nhiên và toán học và mặt khác là các nhà khoa học nhân văn không quan tâm đến công việc của các đồng nghiệp “ở khoa khác” và hơn thế nữa , sâu thẳm và thường công khai coi thường họ. Các nhà toán học và nhà khoa học tự nhiên (và thậm chí nhiều “nhà công nghệ”) có xu hướng coi nghiên cứu nhân văn chỉ là một kiểu “trang trí” hoặc thậm chí là “lời nói suông”, trong khi “các nhà nhân văn” sẵn sàng chấp nhận toán học và khoa học tự nhiên chỉ vì mục đích thực tiễn. lợi ích và tin chắc rằng họ không thể giúp gì để hiểu được bản chất của tinh thần con người.

Chỉ đến giữa thế kỷ 19, theo lời của nhà sinh vật học và nhà tư tưởng vĩ đại Konrad Lorenz, “bức tường xấu xa giữa khoa học tự nhiên và con người (die böse Mauer zwischen Natur- und Geistwissenschaften)” mới là sự vi phạm đầu tiên. được thực hiện ở nơi mỏng nhất tách biệt logic khỏi toán học. Vào thế kỷ 20, những vết nứt khác đã xuất hiện - trong số đó có vết nứt mà các nhà toán học và ngôn ngữ học của cả hai bên đã tạo ra - nhưng chúng vẫn còn rất ít, bức tường vẫn còn vững chắc và cả hai bên không thiếu nỗ lực để củng cố và vá lại nó hơn nữa. lên các lỗ. Thường thì những nỗ lực này khá thành công; “thành tựu” mới nhất theo hướng này - “giáo dục chuyên biệt” ở trường trung học, nơi ngay từ thời thơ ấu đã chia những người có năng lực và quan tâm thành “các khoa” và dạy họ tự hào về sự thiếu hiểu biết của mình về các ngành khoa học “nước ngoài” - có thể cản trở rất nhiều cho việc phát triển hơn nữa. việc xích lại gần nhau giữa khoa học tự nhiên và nhân văn, rất cần thiết cho sự phát triển bình thường của cả hai. Một trong những hậu quả của việc dựng lên một bức tường là “các nhà nhân văn”, bao gồm đại đa số các nhà ngôn ngữ học, thậm chí không biết gì về những điều cơ bản của chính những nhánh toán học quan trọng nhất đối với nhân loại (và hãy tưởng tượng một nhà toán học là một người chỉ tham gia vào các lĩnh vực này). trong tính toán).

Một trở ngại khác là đặc điểm chạy đua điên cuồng của tình trạng khoa học hiện nay, việc không ngừng theo đuổi ngày càng nhiều “kết quả” mới, khiến tầm nhìn của một người bị thu hẹp và không còn thời gian để suy nghĩ về những vấn đề sâu hơn hoặc tham gia vào nghiên cứu nghiêm túc về một vấn đề liên quan và , đặc biệt, không hoàn toàn liên quan đến ngành khoa học. Điều này áp dụng như nhau cho các nhà ngôn ngữ học và toán học - thực tế cũng như cho tất cả những người tham gia khoa học một cách chuyên nghiệp.

Và thứ ba là quán tính, hay đơn giản hơn là sự lười biếng. Thoạt nhìn, sự lười biếng và đua xe điên cuồng không tương thích với nhau, nhưng trên thực tế, chúng rất ăn ý với nhau, hơn nữa còn hỗ trợ, kích thích lẫn nhau. Khi một người quá lười biếng để thực hiện một nhiệm vụ khó khăn, anh ta sẽ nắm lấy thứ gì đó dễ dàng hơn và “đáng tin cậy” hơn, thành công của việc đó sẽ biện minh và khuyến khích sức ì của anh ta. Thái độ kiêu ngạo đối với những “đứa em” tụ tập bên kia bức tường cũng khuyến khích và khuyến khích sự lười biếng. Ví dụ, khi một nhà toán học đề xuất xem xét lại tất cả các ý tưởng về lịch sử cổ đại, nếu không chịu khó làm quen ít nhất một chút với các ngôn ngữ cổ, thì chính sự lười biếng của người mẹ phần lớn là nguyên nhân gây ra điều này.

Mối nguy hiểm đối với sự phát triển của khoa học do những trở ngại này gây ra nghiêm trọng hơn nhiều so với những gì thoạt nhìn. Khi sự thiếu hiểu biết về khoa học “nước ngoài” trở thành nguồn gốc của sự kiêu ngạo, điều này đương nhiên dẫn đến sự hời hợt và thiếu hiểu biết về “của chúng ta”. Từ lâu đã có nhiều “khoa” hơn hai, số lượng của chúng tăng dần qua từng năm, và mỗi khoa được ngăn cách với những khoa khác; Những bức tường cũng xuất hiện bên trong các khoa. Tầm nhìn của các nhà nghiên cứu đang dần bị thu hẹp; Đúng vậy, bộ máy nghiên cứu ngày càng trở nên tinh tế và tinh vi hơn, nhưng hầu như chỉ có những vật thể nhỏ lọt vào tầm nhìn của nó, và ý tưởng càng được củng cố rằng chỉ có chúng mới xứng đáng được nghiên cứu. Có mọi lý do để nói về một cuộc khủng hoảng trong khoa học, và ngôn ngữ học cũng không ngoại lệ. Với tôi, bây giờ có vẻ là lúc để nhìn lại và suy ngẫm.

Các nhà ngôn ngữ học theo hướng gắn với mô hình “Nghĩa – Văn” đã tụ họp về đây. Mô hình này, được tạo ra vào những năm 60 của thế kỷ trước, là một trong những kết quả đầu tiên và tốt nhất của sự gặp gỡ giữa ngôn ngữ học và toán học, sau đó hai thế hệ nhà ngôn ngữ học lớn lên, quen với tư duy chính xác từ những năm sinh viên. Nhưng thật không may, họ không thoát khỏi quán tính, điều này ngăn cản họ nhận ra sự tồn tại của một cuộc khủng hoảng và suy nghĩ về cách vượt qua nó. Trong khi đó, trong số tất cả các nhà ngôn ngữ học - và có lẽ thậm chí trong số tất cả những người liên quan đến nhân văn - họ có những cơ hội khách quan nhất để nhận thức được điều đó và chúng tôi hy vọng rằng họ sẽ tận dụng được những cơ hội này.

Nội dung của báo cáo được cung cấp bởi A.V. Gladkiy và nhà xuất bản

I CÁC KHÍA CẠNH TOÁN HỌC CỦA CẤU TRÚC NGÔN NGỮ

TRONG.ZvegintsevỨNG DỤNG CÁC PHƯƠNG PHÁP TOÁN LOGIC TRONG NGÔN NGỮ HỌC

].

Không còn nghi ngờ gì nữa, việc sử dụng các phương pháp toán học và logic trong ngôn ngữ học phần lớn được kích thích bởi các nhiệm vụ của ngôn ngữ học ứng dụng. Nếu người ta cố gắng áp dụng những phương pháp này để giải quyết các vấn đề liên quan trực tiếp đến lĩnh vực ngôn ngữ học lý thuyết, chẳng hạn như để phân biệt giữa các hiện tượng ngôn ngữ và lời nói, thì trong tương lai (mặc dù có lẽ không phải lúc nào cũng rõ ràng và gần gũi) nhu cầu về ngôn ngữ học ứng dụng.

Sự thành công của việc sử dụng các phương pháp này trong một lĩnh vực hoàn toàn mới với điểm chung tầm nhìn phần lớn được xác định bởi câu trả lời cho câu hỏi ở mức độ nào được phép xác định ngôn ngữ chính xác về mặt logic với ngôn ngữ tự nhiên, hoặc, trong một công thức khác, có thể giảm ngôn ngữ thứ hai xuống ngôn ngữ đầu tiên 2 . Câu trả lời cho câu hỏi này thường được đưa ra ở dạng thực tế. - thông qua việc xây dựng các mô hình thống kê, lý thuyết thông tin, lý thuyết tập hợp, lý thuyết xác suất và các mô hình ngôn ngữ khác, tuy nhiên, không phải lúc nào cũng hướng tới các nhiệm vụ cụ thể. Khi xây dựng các mô hình thuộc loại này, các tác giả của chúng thường tiến hành từ giả định (rõ ràng theo quan điểm của họ) rằng bất kỳ ứng dụng nào của bộ máy logic hoặc toán học hình thức vào mô tả và nghiên cứu ngôn ngữ đều tự động góp phần vào sự cải tiến của chúng. Qua cái này tốt

1 Xem G. Herdan,

2 Ngôn ngữ là sự lựa chọn và cơ hội, Gronigen, 1956. - Thứ Tư. Nhận xét của G. Curry: “Một mặt, thực tế là có mối liên hệ chặt chẽ giữa toán học, logic và ngôn ngữ 98).

Warren Plath đã nói trong bài đánh giá về công việc nghiên cứu ngôn ngữ học toán học: “Nếu các mô hình ngôn ngữ được coi là hệ thống trừu tượng của các phần tử rời rạc, thì có thể áp dụng nhiều khái niệm và phương pháp toán học khác nhau cho chúng, từ ý tưởng cơ bản về số đến phức tạp. các hoạt động logic, thống kê và lý thuyết tập hợp. Tuy nhiên, quan điểm cho rằng việc sử dụng các con số và các phép toán để mô tả các hệ thống phần tử như vậy sẽ làm cho các phát biểu trở nên “chính xác” hơn hoặc “khoa học” hơn là hoàn toàn sai lầm. Trước tiên, phải chứng minh rằng hệ thống mới thu được là một mô hình thỏa đáng hơn hệ thống ban đầu, theo nghĩa là nó có thể hình thành các phát biểu lý thuyết đơn giản và tổng quát hơn về một số khía cạnh của lĩnh vực được mô hình hóa, hoặc bởi vì các hoạt động trên mô hình làm sáng tỏ kết quả của các hoạt động tương ứng trên vùng mô hình. Một trong những mối nguy hiểm lớn nhất liên quan đến việc xây dựng các mô hình toán học của ngôn ngữ, đặc biệt là các mô hình định lượng, là việc sử dụng bừa bãi các công cụ toán học chắc chắn sẽ dẫn đến những kết quả vô nghĩa và sai lệch. Vì vậy, cần phải hiểu rõ ràng rằng điều kiện tiên quyết để làm phong phú ngôn ngữ học với sự trợ giúp của toán học không chỉ là kiến ​​thức về các lĩnh vực liên quan của toán học mà còn là sự hiểu biết sâu sắc về bản chất của các vấn đề ngôn ngữ, cách giải quyết chúng. nên hướng tới các phương pháp toán học.”3.

Để tránh, trong chừng mực có thể, mối nguy hiểm mà Warren Plath chỉ ra, không chỉ cần có những nỗ lực thuần túy thực nghiệm để trả lời câu hỏi được nêu ở trên mà còn phải cố gắng đạt được sự hiểu biết lý thuyết chung về nó. Trên thực tế, câu hỏi về khả năng quy giản ngôn ngữ tự nhiên thành mô hình hoặc cách giải thích logic-toán học này hay cách giải thích khác là câu hỏi chính của lý thuyết ngôn ngữ học ứng dụng, nhu cầu tạo ra nó ngày càng được cảm nhận cấp bách hơn. Để giải quyết vấn đề này, trước hết phải xem xét bản chất của những hiện tượng cấu thành đối tượng nghiên cứu, một mặt là logic và toán học.

3 Xem bài Phí trong bộ sưu tập này, trang 202.

và mặt khác - ngôn ngữ tự nhiên, và sau đó là khả năng của các phương pháp mà mỗi ngành khoa học này sử dụng. Từ việc nghiên cứu so sánh những điểm này, người ta có thể rút ra một số kết luận chung. Cái sau có thể không phải là vô ích đối với tất cả những ai, khi cần thiết, phải tiến hành nghiên cứu của mình ở điểm giao thoa của các ngành khoa học này.

Ở một mức độ nhất định, mục tiêu này cũng được theo đuổi bởi hội nghị chuyên đề “Cấu trúc của ngôn ngữ và các khía cạnh toán học của nó” do Hiệp hội Toán học Hoa Kỳ tổ chức. Các bài viết được chọn từ hội nghị chuyên đề này gồm có phần sau. Nhưng tất cả chúng, như đã rõ ngay từ tên của hội nghị chuyên đề, chỉ đề cập đến các khía cạnh cá nhân và trong một số trường hợp rất cụ thể của vấn đề mà chúng ta quan tâm. Mặc dù kết hợp lại với nhau, chúng tạo ra những điều kiện tiên quyết hợp lý để trả lời câu hỏi mà chúng tôi đã đặt ra, nhưng chúng vẫn thiếu một công thức rõ ràng và rõ ràng về những kết luận cần thiết. Theo nhiều cách, những người tham gia hội nghị chuyên đề tiếp tục nỗ lực thực nghiệm để giải quyết vấn đề này mà không đưa ra kinh nghiệm của họ một cách xâm phạm để thu hút sự chú ý của các nhà ngôn ngữ học với hy vọng rằng chính họ sẽ tìm ra mức độ phù hợp của các giả thuyết và giải pháp được cung cấp cho họ đối với mục đích của ngôn ngữ học.

2.

Có vẻ như chúng ta đã có câu trả lời rõ ràng cho câu hỏi của mình. Vì vậy, N.D. Andreev và L.R. Zinder viết: “Việc biểu diễn (mô hình) toán học của các ngôn ngữ hoàn toàn không giống với chính ngôn ngữ đó”4 . Ý tưởng này cũng được phát triển bởi tác giả cuốn sách “Mô hình ngôn ngữ” I. I. Revzin, người chỉ ra rằng kết quả của mô hình hóa chỉ có thể là “sự gần đúng ít nhiều của dữ liệu của thực tế cụ thể”5 . Tuy nhiên, nói điều này có nghĩa là chưa nói gì cả, vì nó vẫn còn

4 N. D. Andreev, L. R. Zinder, Những vấn đề chính của ngôn ngữ học ứng dụng, “Những vấn đề về ngôn ngữ học”, 1959, Số 4, tr.

5 I. I. Revzin, Mô hình ngôn ngữ, Moscow, 1962, trang 8. Nhân tiện, cách diễn đạt “gần đúng” là một phép lặp trực tiếp: gần đúng.

vẫn chưa được tiết lộ lý do tại sao lại như vậy và liệu người ta có nên sử dụng phương pháp mô hình toán học và logic hay không và nếu có thì ở mức độ nào và cho mục đích gì.

Trước khi bắt đầu giải quyết những vấn đề này, trước tiên chúng ta phải xác định những ngành khoa học nào - quy nạp hay diễn dịch - bao gồm ngôn ngữ học, logic và toán học. Đối với hai ngành khoa học cuối cùng, vị trí của chúng rất rõ ràng - chúng chắc chắn thuộc về khoa học suy diễn, vốn dựa vào suy luận trong phương pháp nghiên cứu của chúng. Ngôn ngữ học theo truyền thống được định nghĩa là một khoa học thực nghiệm, vì người ta tin rằng mục tiêu khoa học chính của nó là mô tả các sự kiện. Rõ ràng điều này có nghĩa là ngôn ngữ học nên được xếp vào lĩnh vực khoa học quy nạp. Điều này cũng có nghĩa là, cố gắng sử dụng bộ máy logic và toán học hình thức trong ngôn ngữ học, họ đang cố gắng áp dụng các phương pháp nghiên cứu diễn dịch trong khoa học quy nạp.

Tuy nhiên, trong những năm gần đây, bản chất quy nạp của khoa học ngôn ngữ đã bị nghi ngờ một cách gián tiếp hoặc trực tiếp. Điều này đã được L. Elmslev thực hiện dưới hình thức ấn tượng nhất. Đúng vậy, thuật ngữ anh ấy sử dụng rất khó hiểu và đặc biệt, được đặc trưng bởi sự hiểu biết đặc biệt và rất cá nhân về các thuật ngữ diễn dịch và quy nạp (trên thực tế, anh ấy diễn giải chúng theo nghĩa ngược lại). Tuy nhiên, nền tảng lý thuyết ngôn ngữ của ông không còn nghi ngờ gì về bản chất phương pháp luận của nó. Vì vậy, ông cho rằng việc sử dụng bất kỳ định nghĩa hoạt động ban đầu nào điển hình cho khoa học suy diễn là có thể chấp nhận được. Và bản thân ông đã mô tả lý thuyết của mình bằng những cách diễn đạt sau: “1. Lý thuyết theo nghĩa của chúng ta tự nó độc lập với kinh nghiệm. Bản thân nó không nói gì về khả năng ứng dụng hoặc về mối quan hệ của nó với dữ liệu thử nghiệm. Nó không bao gồm một định đề tồn tại. Nó đại diện cho cái được gọi là một hệ thống suy diễn thuần túy, theo nghĩa là chỉ có nó mới có thể được sử dụng để tính toán các khả năng xuất phát từ các tiền đề của nó. 2. Mặt khác, một lý thuyết bao gồm một số tiền đề đã được biết từ kinh nghiệm trước đó để thỏa mãn các điều kiện áp dụng đối với một số dữ liệu thực nghiệm. Những tiền đề này mang tính tổng quát nhất và do đó có thể thỏa mãn các điều kiện để áp dụng cho một số lượng lớn dữ liệu thực nghiệm”6.

Như đã rõ từ tuyên bố này, L. Elmslev tìm cách thúc đẩy ý tưởng về bản chất phương pháp luận kép của các đối tượng nghiên cứu ngôn ngữ với sự nhấn mạnh chính vào các đặc điểm suy diễn của chúng. Anh ta cũng nên được ghi nhận với phương pháp khá mơ hồ (“một mặt..., nhưng mặt khác…”), phương pháp nói chung đã trở thành đặc điểm của việc xem xét vấn đề này (và khiến cho người ta có thể đưa ra bất kỳ quan điểm nào). phương hướng). Ý tưởng về tính đối ngẫu về mặt phương pháp của ngôn ngữ học gần đây đã trở nên phổ biến và thậm chí còn được dùng làm cơ sở lý thuyết để hình thành các nguyên tắc của hướng mới nhất trong khoa học ngôn ngữ. - ngôn ngữ học của những cái phổ quát (chủ nghĩa phổ quát). “Bản ghi nhớ về những phổ quát ngôn ngữ” nêu rõ về chủ đề này: “Việc nghiên cứu những phổ quát ngôn ngữ dẫn đến một loạt những khái quát hóa mang tính thực nghiệm về hành vi ngôn ngữ. - cả những thứ vẫn cần thử nghiệm và những thứ đã được thiết lập. Những khái quát hóa này đại diện cho chất liệu tiềm năng để xây dựng cấu trúc diễn dịch của các quy luật khoa học. Tuy nhiên, một số và có lẽ hầu hết trong số chúng vẫn chỉ có trạng thái khái quát hóa theo kinh nghiệm, mà xét theo trình độ hiểu biết hiện tại của chúng ta, không thể tương quan với những khái quát hóa hoặc rút ra một cách diễn dịch từ các quy luật có ý nghĩa tổng quát hơn”7 . J. Gryanberg thể hiện bản thân một cách không kém phần chắc chắn trong lời nói đầu cho tuyển tập về những phổ quát ngôn ngữ. Ông viết chính trị bằng câu nói nổi tiếng của L. Bloomfield rằng “những khái quát hóa hợp pháp duy nhất liên quan đến ngôn ngữ là những khái quát hóa quy nạp”, “Tuy nhiên, dường như người ta thường chấp nhận rằng phương pháp khoa học không chỉ phải mang tính quy nạp mà còn phải diễn dịch. Việc xây dựng các khái quát hóa thu được bằng nghiên cứu quy nạp dẫn đến các giả thuyết lý thuyết dựa trên

6 L. E l m slev, Prolegomena tới lý thuyết ngôn ngữ, Thứ bảy. "Mới trong ngôn ngữ học", tập. I, M., 1960, trang 274-275.

7 "Bản ghi nhớ về ngôn ngữ phổ quát", V. "Sự phổ quát của ngôn ngữ", ed. của J. Greenberg, Cambridge, Mass., 1963, tr. 262 - 263.

từ đó những khái quát hóa sâu hơn có thể được rút ra bằng cách diễn dịch. Sau đó, những điều này phải được thử nghiệm theo kinh nghiệm." 8

Thực tế là lịch sử ngôn ngữ học không chỉ bao gồm sự tích lũy các sự kiện ngôn ngữ và phân loại của chúng, mà còn bao gồm sự thay đổi quan điểm về chính ngôn ngữ, điều này chắc chắn bao hàm những cách tiếp cận khác nhau đối với các sự kiện ngôn ngữ và thậm chí cả những cách giải thích lý thuyết khác nhau về chúng, buộc một số nhà ngôn ngữ học Liên Xô cũng phải đi đến kết luận về tính hai mặt về phương pháp luận trong khoa học của họ. Tuy nhiên, S.K. Shaumyan thích nói về phương pháp giả thuyết-suy diễn hơn và trình bày các đặc điểm của nó như sau: “Phương pháp giả thuyết-suy diễn là một quy trình tuần hoàn bắt đầu bằng các sự kiện và kết thúc bằng các sự kiện. Có bốn giai đoạn trong thủ tục này:

1) ghi lại những sự kiện cần giải thích;

2) đưa ra các giả thuyết để giải thích những sự thật này;

3) xuất phát từ các giả thuyết dự đoán về các sự kiện nằm ngoài vòng sự kiện để giải thích những giả thuyết nào được đưa ra;

4) kiểm tra các sự kiện được dự đoán bởi các giả thuyết và xác định xác suất của các giả thuyết.

Phương pháp giả thuyết-suy diễn về cơ bản khác với phương pháp quy nạp được sử dụng trong các lĩnh vực kiến ​​thức như thực vật học mô tả hoặc động vật học” 9. Phương pháp của S.K. Shaumyan lặp lại hoàn toàn phương pháp ngôn ngữ học phổ quát của J. Greenberg. Sự khác biệt duy nhất là tên. Ví dụ, nếu J. Greenberg nói về sự kết hợp giữa phương pháp quy nạp và suy diễn, thì S. K. Shaumyan gọi phương pháp của ông là giả thuyết-suy diễn. - việc chỉ định rõ ràng là không phù hợp với một phương pháp “bắt đầu bằng sự thật và kết thúc bằng sự thật”.

Câu hỏi về việc nên phân loại ngôn ngữ học ở đâu cũng được I. I. Revzin đặt ra. “Về bản chất, - từ-

8 «Các ngôn ngữ phổ quát p. IX.

9 S. K-Shaumyan, Các vấn đề về âm vị học lý thuyết, M., 1962, c. 18-19. Về phương pháp giả thuyết-suy diễn, xem thêm bài viết của V. S. Shvyrev, Một số câu hỏi phân tích logic-phương pháp luận về mối quan hệ giữa cấp độ lý thuyết và cấp độ thực nghiệm của tri thức khoa học, trong tuyển tập “Các vấn đề về logic của tri thức khoa học”, M. , " Khoa học",

1964, tr. 66-75 (phần 3 của bài viết).

Ông trả lời câu hỏi này: ngôn ngữ học trước hết phải sử dụng phương pháp quy nạp; nó mô tả các hành vi lời nói cụ thể của các ngôn ngữ cụ thể...

Theo đó, các nhà ngôn ngữ học không chỉ cần các phương pháp nghiên cứu quy nạp mà còn cần cả phương pháp nghiên cứu suy diễn để có được một hệ thống kiến ​​thức tổng quát giúp hiểu được dữ liệu thu được từ việc phân tích các ngôn ngữ cụ thể...

Trong phần suy diễn của nó, ngôn ngữ học, rõ ràng, có thể được cấu trúc theo cách tương tự như cấu trúc logic hoặc toán học, cụ thể là: một số lượng tối thiểu nhất định các thuật ngữ chính, không xác định được xác định và tất cả các thuật ngữ khác được xác định thông qua các thuật ngữ chính. Đồng thời, một số mệnh đề cơ bản về mối liên hệ giữa các thuật ngữ này với nhau (các tiên đề) phải được xây dựng rõ ràng, còn tất cả các mệnh đề khác phải được chứng minh, tức là rút gọn thành một số mệnh đề khác”10.

Ở đây, phương pháp suy luận, được thể hiện bằng logic và toán học, chỉ đóng vai trò như một phương tiện sắp xếp “tập hợp các hành vi lời nói” nhằm mục đích tạo ra một “hệ thống các khái niệm chung”. Tuy nhiên, mâu thuẫn trực tiếp với nhiệm vụ này là cách trình bày bản thân phương pháp suy diễn, được khuyến nghị sử dụng trong ngôn ngữ học. Nó hoàn toàn được nghĩ ra từ cả hành động và sự kiện, và là điểm khởi đầu để xây dựng một hệ thống các khái niệm ngôn ngữ tổng quát, nó cần một tập hợp các thuật ngữ cơ bản không xác định và dường như hoàn toàn có điều kiện, qua đó tất cả các thuật ngữ tiếp theo được xác định.

Sự mâu thuẫn này không phải ngẫu nhiên; nó nằm ngay trong bản chất của các ngành khoa học mà chúng ta đang xem xét. Có vẻ như kết luận rằng khi nghiên cứu các đối tượng ngôn ngữ, sự kết hợp giữa các phương pháp quy nạp và suy diễn được cho phép sẽ mở ra cơ hội cho việc sử dụng các phương pháp logic và toán học trong ngôn ngữ học, và việc thực hiện cụ thể kết luận này là tạo ra nhiều

10 I. I. R e vzin, Các mô hình ngôn ngữ, M., 1962, trang 7-8.

mô hình hình thức-logic và toán học của ngôn ngữ. Tuy nhiên, như sẽ được trình bày sau, cách tiếp cận đơn giản hóa như vậy không thể mang lại kết quả khả quan. Chúng ta có thể đồng ý rằng trong nghiên cứu ngôn ngữ, việc kết hợp các phương pháp diễn dịch và quy nạp là được phép và thậm chí cần thiết. Cuối cùng, như V. Brøndal đã viết, “quy nạp không gì khác hơn là một suy luận trá hình, và đằng sau những mối liên hệ thuần túy được thiết lập giữa các hiện tượng được quan sát, một thực tế, một đối tượng cụ thể của một khoa học nhất định, hoàn toàn không thể tránh khỏi được giả định”11 . Nhưng điều này không có nghĩa là bộ máy logic và toán học hình thức nên được chuyển giao một cách máy móc và vô điều kiện sang ngôn ngữ học mà không có bất kỳ sự xem xét nào đến “đối tượng cụ thể của một khoa học nhất định”. Như I. I. Revzin đã lưu ý một cách đúng đắn, “bằng chứng thu được bằng phương tiện suy diễn, cho dù chúng có thể hoàn hảo đến đâu theo quan điểm logic, vẫn không nói lên điều gì về các đặc tính của ngôn ngữ thực được mô tả bởi mô hình”12 . Và để xác định tính hiệu quả của các mô hình, ông khuyên nên chuyển sang thực hành, được thể hiện bằng dịch máy và “các ứng dụng thực tế khác của ngôn ngữ học”.

Và thực tiễn ngôn ngữ học ứng dụng cho thấy những hạn chế rất nghiêm ngặt đối với việc sử dụng các phương pháp toán học và logic trong nghiên cứu các hiện tượng ngôn ngữ.

Logic cung cấp một ví dụ về cách sử dụng nhất quán nhất của phương pháp suy diễn. Toán học phần lớn tuân theo logic về mặt này, và do đó chúng có thể được xem xét cùng nhau.

Tất nhiên, cả logic và toán học đều không đại diện cho các hệ thống đồng nhất về phương pháp và cách giải thích mục tiêu của chúng. Vì vậy, ví dụ, liên quan đến logic, chúng ta có thể nói về logic biện chứng, logic hình thức, logic toán học và, theo nghĩa hẹp hơn, về chủ đề, ngữ nghĩa, hiện tượng học, siêu việt hoặc mang tính xây dựng, tổ hợp, đa giá trị, động-

11 V. Brondal, Ngôn ngữ học cấu trúc. Trích dẫn Qua
cuốn sách của V. A. Zvegintsev “Lịch sử ngôn ngữ học trong thế kỷ 19 và 20.” trong phác thảo
kah và các đoạn trích”, phần II, M., Uchpedgiz, 1960, trang 41-42.

12 I. I. Revzin, Mô hình ngôn ngữ, M., 1962, tr.

xa xôi, v.v. Tuy nhiên, tất yếu, chúng ta sẽ phải gạt bỏ mọi sự phân chia như vậy sang một bên và chỉ nói về những đặc điểm chung nhất vốn có trong logic và toán học nói chung, và chủ yếu là về những đặc điểm thể hiện rõ ràng nhất bản chất suy diễn của các phương pháp suy luận. những khoa học này.

Do đó, đảm nhận vị trí này, chúng tôi sẽ không sử dụng logic quy nạp. Chúng ta chỉ cần lưu ý rằng các kết luận trong logic quy nạp không được xác định bởi các tiền đề - do đó chúng không mang tính lặp thừa. Các kết luận trong logic quy nạp phụ thuộc trực tiếp vào các sự kiện và những sự kiện này được xác định bởi khối lượng kiến ​​​​thức của chúng ta - do đó, chúng được thiết lập trên cơ sở xác suất. Xác suất là công cụ phương pháp chính của logic quy nạp.

Logic suy diễn được thể hiện đầy đủ nhất bằng logic hình thức và logic toán học, chúng có nhiều điểm chung. Logic suy diễn là một khoa học nghiên cứu suy nghĩ hoặc hành vi tinh thần của con người từ quan điểm về cấu trúc hoặc hình thức của chúng, trừu tượng hóa nội dung cụ thể của chúng. Do đó, logic suy diễn tìm cách hình thành các quy luật và nguyên tắc, việc tuân thủ chúng là điều kiện tiên quyết để đạt được kết quả thực sự trong quá trình thu thập kiến ​​​​thức suy luận. Công cụ phương pháp chính của logic suy diễn là hàm ý. Cô ấy nhận được kiến ​​thức suy luận mà không cần dựa trực tiếp vào kinh nghiệm hay thực hành, chỉ thông qua việc áp dụng các định luật logic. Trong quá trình suy luận, tiền đề quyết định kết luận: nếu tiền đề đúng thì kết luận phải là ĐÚNG VẬY. Như vậy, kết luận đã có sẵn trong tiền đề và mục đích của suy luận là làm rõ những gì đã ẩn giấu trong tiền đề. Theo đó, bất kỳ kết luận nào thu được thông qua suy luận đều có tính chất lặp lại, nghĩa là nó trống rỗng về mặt logic, mặc dù từ những quan điểm khác, chẳng hạn như trong trường hợp áp dụng bộ máy logic hình thức cho mục đích của các ngành khoa học khác, nó có thể mới, bất ngờ và nguyên bản.

Một tình huống tương tự cũng xảy ra trong toán học - giá trị của các lập luận trong đó hoàn toàn dựa vào suy luận. Hơn nữa, trong toán học, như một quy luật, mọi quan điểm ban đầu, mọi cách tiếp cận giải quyết vấn đề đều có thể chấp nhận được - miễn là chúng thỏa mãn các điều kiện của suy luận toán học. Toán học có một tập hợp phong phú các “quan điểm ban đầu” và “các cách tiếp cận” mà nhà nghiên cứu có thể sử dụng để giải quyết vấn đề của mình. Các vấn đề toán học thường được dịch sang các dạng tương đương khác nhau và mỗi vấn đề liên quan đến việc sử dụng các lĩnh vực khác nhau. lý thuyết toán họcđể giải quyết vấn đề. Do đó, nhà toán học hầu như có quyền tự do vô hạn trong việc lựa chọn các tiền đề - anh ta chọn những tiền đề mà theo quan điểm của mình, chứa đựng những khả năng hứa hẹn nhất cho giải pháp đơn giản nhất, không tầm thường nhất, tao nhã nhất cho vấn đề. Tài năng và kinh nghiệm của ông được thể hiện chính xác trong việc lựa chọn thành công các tiền đề “chúng ta hãy giả sử rằng …” hoặc “nếu ... thì” mà các công trình toán học có rất nhiều. Giống như trong logic, các tiền đề toán học - tiên đề hoặc định đề - xác định định nghĩa của các đơn vị chưa được xác định.

Quyền tự do lựa chọn các tiền đề trong toán học phụ thuộc trực tiếp vào các đơn vị hoặc đối tượng vô hình mà nó vận hành - sự chú ý của nó hướng đến các mối quan hệ giữa chúng. Các đối tượng toán học đóng vai trò là biểu tượng thể hiện cấu trúc của các quan hệ thuần túy. Do đó, một hệ thống toán học có thể được coi là một tập hợp các quan hệ hình thức chỉ tồn tại nhờ phát biểu các quan hệ này. Tất nhiên, đặc biệt đối với các mục đích ứng dụng, các tuyên bố về mối quan hệ có thể nhằm mục đích thể hiện sự tương ứng với thực tế bên ngoài, điều này sẽ không có bất kỳ tác động nào đến bản thân các tuyên bố này, mà ngược lại. Các nhà toán học không điều tra “sự thật” của các tiên đề của họ, mặc dù họ yêu cầu sự nhất quán lẫn nhau giữa chúng. Nghiên cứu trong một hệ thống toán học là nghiên cứu và thiết lập các kết nối giúp có thể chứng minh rằng thực tế của lý thuyết A giả định thực tế của lý thuyết B. Do đó, câu hỏi chính trong toán học không phải là “A và B là gì” mà là “ A có giả định trước (hoặc điều kiện) B không?

Tình hình trong ngôn ngữ học lại hoàn toàn khác - nó chủ yếu tập trung vào câu hỏi đầu tiên trong số những câu hỏi này, và điều này không tạo cơ hội cho nó thoát khỏi thực tế; do đó, nó hoạt động không phải bằng trừu tượng mà bằng các đơn vị cụ thể, mặc dù trong một số trường hợp, nó cố gắng tạo ra các đối tượng trừu tượng như khái niệm âm vị hoặc hình vị. Tình trạng này không chỉ là đặc trưng của ngôn ngữ học truyền thống mà còn đặc trưng không kém của những hướng đi mới nhất của nó, thống nhất dưới ngọn cờ của chủ nghĩa cấu trúc. Một số tuyên bố đã được trích dẫn ở trên, các tác giả của chúng, khi cố gắng sử dụng không chỉ các phương pháp quy nạp mà cả các phương pháp suy diễn (hoặc các phương pháp toán học và logic) trong khoa học ngôn ngữ, vẫn không thể bỏ qua nhu cầu giải quyết một vấn đề ngôn ngữ thực sự. sự thật. Ngoài chúng, có thể trích dẫn thêm một điều nữa, điều này mang lại sự rõ ràng hoàn toàn cho vấn đề đang được xem xét. “Phân tích ngôn ngữ- P. Garvin viết về mối liên hệ này,- Về cơ bản, đây là một quá trình quy nạp theo nghĩa là nó tìm cách thiết lập một danh sách các yếu tố hoặc một tập hợp các tuyên bố từ sự kích thích ngôn ngữ của người cung cấp thông tin hoặc từ việc kiểm tra văn bản. Nó dựa trên giả định rằng trong cả hai nguồn thông tin này đều có thể nhận ra các yếu tố xuất hiện thường xuyên. nhiều loại và các mệnh lệnh phức tạp. Việc phân loại các loại này và tuyên bố về điều kiện phân bố của chúng, thu được từ kết quả phân tích, tạo thành một mô tả quy nạp của ngôn ngữ”13.

Tất nhiên, trong ngôn ngữ học, người ta cũng có thể sử dụng phương pháp tiền đề, trên cơ sở đó các đối tượng, sự kiện hoặc đơn vị ngôn ngữ cụ thể được xác định. Nhưng ở đây chúng ta phải đối mặt với hai tính năng tạo ra những điều chỉnh đáng kể đối với việc sử dụng phương pháp này. Không giống như logic và toán học, trong trường hợp này, người ta sẽ tìm kiếm “sự thật” của các định nghĩa thu được theo cách này, tức là sự tương ứng của chúng với dữ liệu kinh nghiệm. Như vậy, sự phụ thuộc lẫn nhau giữa tiền đề và tri thức suy luận được xác lập: tiền đề quyết định kết luận (định nghĩa một đối tượng ngôn ngữ cụ thể dưới dạng tiền đề), nhưng nếu kết luận không tương ứng với dữ liệu kinh nghiệm thì sẽ có cần phải điều chỉnh tiền đề của chính nó. Nhưng kiểu điều chỉnh tiền đề này không liên quan gì đến khả năng chuyển đổi thành các dạng tương đương, mà như đã chỉ ra ở trên, được cho phép trong toán học, vì chúng không được xác định

13 P. Garvin, Nghiên cứu phương pháp quy nạp trong cú pháp, "Word", tập. 18, 1962, tr. 107.

những cân nhắc chính thức mà là dữ liệu kinh nghiệm. Tất cả những điều trên đưa ra lý do để kết luận rằng chính khái niệm tiền đề và quyền tự do lựa chọn nó có tính đặc thù trong phân tích ngôn ngữ không thể bỏ qua khi sử dụng phương pháp suy diễn trong ngôn ngữ học.

Các nhà ngôn ngữ học không thể sử dụng phương pháp "nếu" hoặc "hãy nói" một cách tự do như các nhà toán học. Quyền tự do đưa ra các điều kiện tiên quyết của họ bị hạn chế rất nghiêm ngặt. Lịch sử khoa học ngôn ngữ chứng kiến ​​nhiều thay đổi về “quan điểm” hay nói cách khác là những tiền đề ban đầu được thúc đẩy bởi việc phát hiện ra những sự kiện mới, sự truyền bá các ý tưởng khoa học nói chung sang ngôn ngữ học, hay thậm chí là sự hình thành các lý thuyết gốc. . Nhưng đối với một nhà ngôn ngữ học, trong mọi trường hợp như vậy, sự thay đổi trong “nếu”, hay tiền đề ban đầu, là sự thay đổi trong toàn bộ khái niệm khoa học. Do đó, nhà ngôn ngữ học không nói “nếu”, mà đặt ra sự hiểu biết của mình về tiền đề, tức là trên thực tế, sự hiểu biết về chủ đề nghiên cứu của mình, và dựa trên sự hiểu biết này, đưa ra định nghĩa về các đơn vị ngôn ngữ cụ thể, kiểm tra các định nghĩa này với dữ liệu từ kinh nghiệm. Tình huống sau, do sự phụ thuộc lẫn nhau giữa tiền đề và kết luận trong ngôn ngữ học, đóng vai trò như một phương tiện để xác minh và xác nhận bản thân tiền đề, đứng đầu của một hình thức phân tích ngôn ngữ diễn dịch. Vì vậy, nếu chúng ta xem xét các ví dụ cụ thể,V.Trước đây, ngôn ngữ được hiểu như là sự biểu hiện bản chất tinh thần của con người (ở Humboldt), như một cơ thể tự nhiên (ở Schleicher), như một hoạt động tâm sinh lý cá nhân (ở những người theo chủ nghĩa tân ngữ pháp), v.v. Thực tiễn nghiên cứu dựa trên những khái niệm này đã có đã bộc lộ sự thiếu sót của mình. Ngày nay, tiền đề khởi đầu của phân tích ngôn ngữ là tiền đề cho rằng ngôn ngữ là một hệ thống các ký hiệu. Nó phải chịu sự kiểm tra kinh nghiệm và thực hành giống như bất kỳ khái niệm nào khác trong khoa học ngôn ngữ.

Những cân nhắc sơ bộ và tổng quát nhất này đã cho thấy rằng các phương pháp suy diễn hoàn toàn không bị chống chỉ định trong ngôn ngữ học, nhưng việc sử dụng chúng đòi hỏi phải tuân thủ các điều kiện cụ thể. Chính những điều kiện cụ thể này đã đặt ra những hạn chế nhất định đối với việc chuyển giao một cách máy móc các phương pháp logic và toán học sang lĩnh vực ngôn ngữ học. Tuy nhiên, nếu chúng ta chỉ giới hạn ở một tuyên bố chung chung như vậy thì vẫn còn nhiều điều chưa rõ ràng. Đó là lý do tại sao cần phải đào sâu câu hỏi mà chúng ta đang xem xét và để củng cố các kết luận tiềm năng, hãy chuyển sang thực hành ngôn ngữ học ứng dụng, trong đó tính hợp pháp của các tiền đề và sự tương ứng của các kết luận được đưa ra trên cơ sở dữ liệu thực nghiệm. được thể hiện rõ ràng nhất.

Mối quan hệ giữa ngôn ngữ và logic rất đặc biệt. Đại diện của khoa học thực nghiệm, bao gồm ngôn ngữ học, nghiên cứu một đối tượng hoặc hiện tượng cụ thể để mô tả hoặc giải thích nó. Họ xây dựng các kết quả họ thu được bằng một ngôn ngữ gọi là ngôn ngữ đối tượng. Nhà logic học sử dụng bằng chứng, suy luận, phán đoán, v.v., nhưng chúng chỉ có sẵn đối với anh ta ở dạng ngôn ngữ. Vì vậy, hóa ra nhà logic học còn cách xa thế giới thực một bước so với những đại diện của khoa học thực nghiệm. Phân tích của ông không hướng trực tiếp vào đối tượng thực tế được nghiên cứu bởi các khoa học thực nghiệm mà vào ngôn ngữ của họ14. Nói cách khác, anh ta kiểm tra ngôn ngữ và hình thành các kết quả thu được bằng một ngôn ngữ gọi là ngôn ngữ kim loại.

Từ quan điểm logic, đơn vị cơ bản của ngôn ngữ không phải là một ký hiệu hay đối tượng mà nó biểu thị, mà là một câu, vì chỉ trong đó quá trình logic mới có thể diễn ra. Đó là lý do tại sao chỉ một câu có thể đúng hoặc sai. Nhưng bản thân từ ngữ không thể có những phẩm chất này. Nhưng trước khi có thể khẳng định một câu có đúng hay không, chúng ta phải khẳng định rằng nó có ý nghĩa.

Các khái niệm về chân lý và ý nghĩa thuộc lĩnh vực ngữ nghĩa học, nghiên cứu mối quan hệ giữa ngôn ngữ và đối tượng mà nó biểu thị. Thông qua những mối quan hệ này, tính đúng hay sai của một câu được xác định: nếu câu mô tả đúng đối tượng thì câu đó đúng, còn nếu câu sai thì không. Nhưng các biểu thức ngôn ngữ có thể có những mối quan hệ khác với những mối quan hệ

14 P. V. Tavanets và V. S. Shvyrev viết về vấn đề này: “Việc phân tích logic về kiến ​​thức khoa học trước hết là sự phân tích trực tiếp về ngôn ngữ mà kiến ​​thức này được thể hiện”. Xem bài “Lý luận” kiến thức khoa học“Trong tuyển tập “Các vấn đề về logic của tri thức khoa học”, M., “Khoa học”, 1964, tr. 161.

tồn tại giữa các đối tượng mà chúng chỉ định. Ngoài ra, câu còn có thể có mối quan hệ với các câu khác. Nhiệm vụ của nhà logic học là tìm ra bản chất của mối quan hệ giữa các biểu thức ngôn ngữ và câu và thiết lập các quy tắc để xác định xem thủ tục quy định trong một trường hợp nhất định có được tuân theo hay không. Khi giải quyết điều này câu hỏi cuối cùng nhà logic học không đề cập đến các đối tượng được mô tả trong câu. Anh ấy quan tâm đến hình thức ngôn ngữ chứ không phải nội dung của nó, điều này tất nhiên không ngăn cản việc giải thích nội dung của nó, dẫn đến sự xuất hiện của một ngôn ngữ hình thức hóa. Một ngôn ngữ hình thức hóa có thể được biểu diễn dưới dạng một hệ thống trừu tượng, chẳng hạn như phép tính vị từ.

Vì vậy, một nhà logic học, tùy thuộc vào mục tiêu của nghiên cứu, có thể làm việc ở hai cấp độ - cú pháp (cú pháp logic) và ngữ nghĩa (ngữ nghĩa logic). Đầu tiên chúng ta hãy xem xét việc áp dụng cấp độ đầu tiên vào ngôn ngữ tự nhiên.

Nếu một nhà logic học, tham gia nghiên cứu các hình thức ngôn ngữ và các mối quan hệ tồn tại giữa chúng, có thể duy trì ở cấp độ cú pháp, hoạt động với các thuật ngữ vô nghĩa, thì một nhà ngôn ngữ học không thể làm được điều này. Tất cả các cấp độ của ngôn ngữ tự nhiên (có thể có ngoại trừ âm vị) đều có ý nghĩa và do đó không thể tưởng tượng được ngoài ngữ nghĩa. Và hơn nữa, ngôn ngữ tự nhiên không tồn tại ngoài ngữ dụng học, không thể dễ dàng tách rời khỏi nó vì lý do đơn giản là trong hành động nói, nó liên tục được chuyển sang ngữ nghĩa. Vì vậy, ngôn ngữ tự nhiên luôn là một sự diễn giải và hơn thế nữa, là một ngôn ngữ hai giai đoạn, vì nó được kết nối với cả ngữ nghĩa và ngữ dụng15. Và cách giải thích này vẫn chưa phù hợp với bất kỳ hình thức hóa nào.

Bây giờ chúng ta chuyển sang cấp độ thứ hai, khi việc diễn giải được quy cho phép tính thông qua các quy tắc ngữ nghĩa. Và trong trường hợp này, chúng ta sẽ nhận được một nền giáo dục không thể so sánh được với ngôn ngữ tự nhiên. Có thật không,

15 Thứ Tư. Nhận xét của Niels Bohr về ngôn ngữ toán học, trong đó “sự rõ ràng của các định nghĩa cần thiết cho một mô tả khách quan đạt được bằng cách sử dụng các ký hiệu toán học một cách chính xác do thực tế là theo cách này tránh được việc đề cập đến chủ thể có ý thức, điều này thấm vào ngôn ngữ hàng ngày" (Nin Bor, Vật lý nguyên tử và nhận thức của con người, M., IL, 1961, tr.Ở đây chúng ta đang xử lý các thuật ngữ có ý nghĩa, nhưng bằng ngôn ngữ logic và tự nhiên, chúng xây dựng mối quan hệ với “sự thật” trên những cơ sở hoàn toàn khác nhau. Như A. Tarski viết, “đúng”, “trong mọi trường hợp, theo cách giải thích cổ điển của nó,” đến mức nó “trùng khớp với thực tế”16. Nhưng tiêu chí về sự thật này thực ra chỉ áp dụng được cho các ngôn ngữ tự nhiên, vốn luôn hướng đến thực tế. Tình hình là khác nhau về mặt ngữ nghĩa logic. Phân tích ngữ nghĩa chỉ dựa vào việc diễn giải logic của hệ thống và liên quan đến việc thiết lập TRÊN - Tôinhững quy tắc nhất định hình thành các điều kiện của sự thật,TôiÔng quy định việc tuân thủ các quy tắc này mà không trả lời câu hỏi ở đây có “sự trùng hợp” ở mức độ nào.Tôiliên hệ với thực tế.” Ngoài ra, việc tập trung vào thực tế được thực hiện bằng ngôn ngữ tự nhiên không phải trực tiếp mà thông qua con người, điều này một lần nữa khiến cần phải chuyển sang cấp độ thứ ba,- thực dụng. “...Chuyển sang cấp độ ngữ nghĩa,- Bang P. V. Tavanets và V. S. Shvyrev,- bản thân nó không phải là sự trở lại với ngôn ngữ sống trong tính cụ thể của nó, như thoạt nhìn có vẻ như do chức năng ngữ nghĩa của ngôn ngữ, như nó vốn có, là bản chất của ngôn ngữ với tư cách là “hiện thực trực tiếp của tư duy”. Trên thực tế, sơ đồ ban đầu của ngữ nghĩa “ngôn ngữ - hiện thực" vẫn chưa đưa ra một hình ảnh cụ thể về ngôn ngữ như là hiện thực trực tiếp của tư duy vì lý do đơn giản là ngôn ngữ được kết nối với hiện thực không phải tự nó theo một cách thần bí nào đó, mà thông qua con người, qua hành động, hành vi của anh ta. Do đó, nói một cách chính xác, một ý tưởng cụ thể về ngôn ngữ với tư cách là người vận chuyển tư tưởng chỉ có thể đạt được ở cấp độ phân tích thực dụng của nó theo sơ đồ “ngôn ngữ”. - hành động của con người với và dựa trên ngôn ngữ - thực tế” 17.

Nhưng đó không phải là tất cả. Liên quan đến vấn đề này, V. M. | Glushkov viết: “Ngôn ngữ sống của con người chỉ có thể được coi là ngôn ngữ hình thức sau khi một hệ thống quy tắc chặt chẽ được hình thành, cho phép

16A. T a g s k i, Grundlegung der Wissenschaftlichen Semantik
(Acts du
Congrès International de Philosophie Scientifique, 1936).

17 Xem bài “Logic của tri thức khoa học” trong tuyển tập “Pro-
vấn đề logic của tri thức khoa học”, M., “Khoa học”,
1964, tr.

phân biệt các cách diễn đạt được phép trong ngôn ngữ với tất cả các cách diễn đạt khác, tức là các câu có ý nghĩaTừvô nghĩa" 18. Giải thích những khó khăn nảy sinh khi hình thức hóa một ngôn ngữ tự nhiên, ông chỉ ra thêm rằng “... không có ngôn ngữ hình thức cố định nào có thể tương xứng với ngôn ngữ sống của con người, vì ngôn ngữ sau, không giống như ngôn ngữ trước, không ngừng phát triển và cải tiến. Vì vậy, bất kỳ sự hình thức hóa nào của bất kỳ ngôn ngữ sống nào của con người cũng chỉ là sự diễn đạt ít nhiều thành công ngay lập tức của nó, mất đi sự giống với ngôn ngữ gốc khi ngôn ngữ sau phát triển”19. Nếu mọi chuyện chỉ dừng lại ở mức này thì mọi chuyện sẽ không tệ đến thế. Trong ngôn ngữ học ứng dụng, họ nghĩ về những thời điểm phát triển ngôn ngữ, cố gắng coi nó như một hệ thống hoàn toàn ổn định, nhưng họ vẫn không đạt được việc hình thức hóa ngôn ngữ tự nhiên. . Điều này xảy ra vì một lý do rất đơn giản. Hệ thống hình thức và ngôn ngữ tự nhiên có hiệu quả dựa trên những phẩm chất đối lập nhau. Bất kỳ hệ thống chính thức nào cũng luôn đồng nhất với chính nó. Chính phẩm chất này giúp cô ấy có thể thực hiện được mọi chức năng của mình trường hợp cụ thể các ứng dụng của nó. Và một ngôn ngữ tự nhiên - về mặt nội dung, ngữ nghĩa của nó, hay như người ta thường nói trong những trường hợp này, về mặt thông tin - không bao giờ giống hệt chính nó. Chính khả năng này của anh ấy đã giúp anh ấy có thể hoạt động trong mọi trường hợp cụ thể trong ứng dụng của mình. Mặc dù vẫn giữ nguyên ngôn ngữ nhưng nó luôn khác nhau trong các tình huống khác nhau. Đồng thời, anh ta không có quy tắc rõ ràng hay hình thành, cũng không có quy tắc chân lý, cũng không có quy tắc chuyển đổi để xác định ý nghĩa tiềm ẩn hoặc sắc thái ý nghĩa nào mà một từ nhất định sẽ nhận được trong một tình huống nhất định. Hơn nữa, hầu như bất kỳ từ nào trong ngôn ngữ tự nhiên đều có thể mang một ý nghĩa mà không ngôn ngữ nào cố định - nó có thể phát sinh và trở nên cố định trong ngôn ngữ, nhưng với cùng một thành công, giống như một ánh sáng chạy trốn, bùng lên, lạc vào vũ trụ ngôn ngữ và đi ra ngoài.

18 V. M. Glushkov, Tư duy và điều khiển học, “Các vấn đề vật lý”
losophy”, 1963, số 1, tr. 37-38

19 Như trên, trang 38.

Và với tất cả những phẩm chất này, ngôn ngữ tự nhiên hóa ra lại là một công cụ hoàn hảo đến kinh ngạc cho phép chúng ta đạt được sự hiểu biết lẫn nhau hoàn toàn về hầu hết các vấn đề. khái niệm phức tạp và trong mọi tình huống. Tại sao điều này lại xảy ra?

Rõ ràng, câu trả lời cho câu hỏi này nên được tìm kiếm một phần trong một trong những suy nghĩ của người sáng lập ký hiệu học, Charles Peirce, điều mà ông đã kiên trì lặp lại trong nhiều tác phẩm của mình. Nó đi xuống này. Trong ngôn ngữ học hiện đại, ngôn ngữ thường được định nghĩa là một hệ thống các ký hiệu. Đây là tiền đề khởi đầu cho mọi phân tích ngôn ngữ. Nếu đúng như vậy thì ngôn ngữ không chỉ là một hệ thống các dấu hiệu, mà là một hệ thống các dấu hiệu diễn giải lẫn nhau tồn tại trong nó trong chừng mực chúng được diễn giải bằng các dấu hiệu khác. C. Peirce nói như thế này: “Không có dấu hiệu nào có thể hoạt động như một dấu hiệu trừ khi nó được diễn giải bằng một dấu hiệu khác. Do đó, việc một dấu hiệu này ảnh hưởng đến một dấu hiệu khác là điều hoàn toàn cần thiết”20 . Và chỗ khác: “Toàn bộ mục đích của một dấu hiệu là nó sẽ được diễn giải bằng một dấu hiệu khác” 21. Và cuối cùng, có lẽ là quan trọng nhất: “Một dấu hiệu không phải là một dấu hiệu trừ khi nó tự chuyển hóa thành một dấu hiệu khác trong đó nó nhận được sự phát triển hoàn thiện hơn”22.

Do đó, ngôn ngữ tự nhiên là một hệ thống các dấu hiệu, thông qua sự giải thích lẫn nhau, có thể đáp ứng mọi nhu cầu của con người về mặt diễn đạt ngữ nghĩa. Nhưng ở đây cần có một lưu ý thiết yếu. Xét cho cùng, mọi nhu cầu thuộc loại này đều được quyết định bởi thái độ của một người đối với các hiện tượng của thế giới bên ngoài và môi trường xã hội nơi cuộc sống của anh ta diễn ra. Do hoàn cảnh này, ngữ nghĩa chuyển đổi, nếu có thể được tạo ra, không thể chỉ dựa vào các quy tắc diễn giải lẫn nhau của các dấu hiệu, nghĩa là đóng và hữu hạn. Hóa ra nó là dẫn xuất của một số lượng rất lớn các đại lượng chống lại sự hình thức hóa mạnh mẽ.

20 Ch. R e i g s e , Các giấy tờ được sưu tầm, Cambridge, Mass., tập. 8,
P. 225.

21 Như trên, tập. 8, tr. 191.

22 Như trên, tập. 5, tr. 594.

Liên quan đến những vấn đề trên, điều quan trọng là phải xem xét các đặc điểm của quy trình giải quyết vấn đề và khái niệm về khả năng giải quyết trong logic và toán học, một mặt, và mặt khác trong ngôn ngữ học.

Trước khi giải một bài toán trong toán học, bài toán đó phải được phát biểu một cách chính xác. Bản thân công thức này là điều kiện tiên quyết để giải quyết thành công vấn đề. Đồng thời, như đã chỉ ra, nhà toán học có thể tự do chuyển đổi công thức của bài toán này thành một phiên bản tương đương; cô ấy cũng có các phương tiện thích hợp cho việc này. Ở giai đoạn đầu tiên của phương pháp nghiên cứu, ngôn ngữ học khác biệt đáng kể với toán học. Khi hình thành các vấn đề của mình, nhà ngôn ngữ học có một lượng dữ liệu thực nghiệm quan sát được nhất định mà anh ta không phải lúc nào cũng đưa ra một công thức chính xác, tuy nhiên, dù muốn hay không, anh ta cũng phải tạo thành cơ sở cho nghiên cứu của mình - ngay trong quá trình nghiên cứu này. , các công thức được làm rõ, thường là mục tiêu của nghiên cứu. Để không đi xa về các ví dụ, chúng ta có thể tham khảo ý nghĩa ngôn ngữ, vốn là nền tảng nghiên cứu trong lĩnh vực xử lý tự động thông tin lời nói, nhưng đồng thời được định nghĩa rất mơ hồ và thiếu nhất quán. Chính hoàn cảnh đó buộc các nhà nghiên cứu trong lĩnh vực này phải liên tục thay đổi chiến lược của mình.

Nhưng bây giờ nghiên cứu đã bắt đầu và một số quyết định đã đạt được. Điều này có ý nghĩa gì liên quan đến logic, toán học và liên quan đến ngôn ngữ học? Logic, như đã nêu ở trên, cho phép trình bày rõ ràng các kết luận tiềm ẩn trong các tiền đề. Tuy nhiên, logic không có quy tắc, việc sử dụng chúng có thể đảm bảo rằng sẽ thu được giải pháp mong muốn, vì nó không phải là phương tiện để đạt được kết luận mới mà chỉ là một kỹ thuật để xác định tính đúng đắn của chúng. Cô ấy không phải là chiếc chìa khóa thần kì mở ra mọi bí ẩn. Rõ ràng là nếu logic có những quy tắc như vậy thì sẽ không có vấn đề nào chưa được giải quyết. Chỉ cần áp dụng một bộ quy tắc logic nhất định là đủ và chúng ta sẽ tự động nhận được câu trả lời có sẵn cho bất kỳ câu hỏi nào khiến chúng ta đau khổ. Do đó, khái niệm về khả năng giải quyết một vấn đề hoặc nhiệm vụ cũng mang một ý nghĩa cụ thể.

Trong logic và toán học, mọi kết quả cuối cùng đều được công nhận là đúng nếu không có quy tắc hình thức nào bị vi phạm trong quá trình chứng minh. Vì có thể có nhiều cách chứng minh khác nhau nên cho phép tồn tại các nghiệm khác nhau. Nhưng tất cả chúng đều có thể được xác minh theo quan điểm về các yêu cầu của logic hoặc toán học. Tình hình lại khác trong ngôn ngữ học. Nó không có thiết bị để người ta có thể xác minh hoặc chứng minh tính đúng đắn của các kết luận thu được. Theo đó, tính xác thực của các giải pháp đạt được được xác định - nó được thiết lập không phải bởi các quy tắc chính thức mà bởi sự tương ứng của nó với dữ liệu kinh nghiệm. Trong những điều kiện này, về mặt lý thuyết người ta sẽ mong đợi một giải pháp cuối cùng duy nhất. Tuy nhiên, trong thực tế, bằng chứng là các định nghĩa ngôn ngữ trái ngược nhau của ngay cả những phạm trù cơ bản của ngôn ngữ, điều này đã không xảy ra. Trong trường hợp này, luôn có một tính chủ quan nhất định trong các đánh giá, điều này phần lớn được xác định bởi khối lượng dữ kiện mà nhà nghiên cứu có được. Theo đó, tính đúng đắn của một giải pháp trong ngôn ngữ học luôn được đưa ra ở một mức độ gần đúng nào đó và không mang tính chất xác định mà mang tính chất xác suất.

Trong những điều kiện này, việc kiểm tra tính đúng đắn của các định nghĩa và diễn giải ngôn ngữ dựa trên các tiêu chí khách quan là rất quan trọng. Khả năng xác minh như vậy được cung cấp bởi lĩnh vực ngôn ngữ học ứng dụng rộng lớn, trong đó ngôn ngữ tự nhiên bị phản đối bởi một cỗ máy đại diện cho lợi ích của logic và toán học.

Để giải quyết các vấn đề thực tế của ngôn ngữ học ứng dụng, máy tính kỹ thuật số được sử dụng. Nó có khả năng nhận thức, lưu trữ, truyền tải, tập hợp lại và đưa ra thông tin. Nó diễn giải và thực thi một tập hợp các lệnh (chương trình lệnh) và cũng sửa đổi chúng trong quá trình thực hiện tác vụ. Nó có thể giải quyết các vấn đề rất phức tạp, nhưng đồng thời toàn bộ quá trình chuyển đổi từ nhiệm vụ sang giải pháp phải được mô tả một cách thấu đáo và nhất quán theo trình tự các thao tác cơ bản cơ bản. Thông tin được nhập vào máy bằng mã hoặc ngôn ngữ gồm hai chữ số (nhị phân). Máy hoạt động với các từ được mã hóa theo cách này, tương ứng với các kết nối logic cơ bản . hoặc các hàm của phép tính mệnh đề hoặc vị ngữ. Một chiếc máy có thể giải quyết các vấn đề toán học phức tạp một cách chính xác bởi vì các phép toán phức tạp có thể được rút gọn thành một chuỗi các phép toán số học, và các phép toán sau này lại thành các phép toán logic. Vì vậy, máy tính số có thể được coi giống như một máy logic.

Vì vậy, dù vấn đề có phức tạp đến đâu, máy vẫn giải quyết nó bằng cách sử dụng một chuỗi các thao tác cơ bản, chương trình của chúng phải được xây dựng một cách tuyệt đối rõ ràng (nhất quán), chính xác, chi tiết và đầy đủ. Nói cách khác, nó không được vượt quá những giới hạn được thiết lập bởi phép tính logic của các mệnh đề; và khi chúng ta hỏi liệu một chiếc máy có thể xử lý được việc xử lý thông tin chứa trong ngôn ngữ tự nhiên hay không, trước tiên chúng ta cần tìm hiểu xem phép tính logic của các mệnh đề là mô hình phù hợp cho ngôn ngữ tự nhiên ở mức độ nào.

Xem xét các chi tiết cụ thể của kỹ thuật số máy tính, đã mô tả ở trên, điều đầu tiên cần làm để máy “hiểu” được nhiệm vụ và bắt đầu xử lý thông tin lời nói theo nhiệm vụ này là định dạng lại thông tin có trong ngôn ngữ tự nhiên thành ngôn ngữ logic. Chúng ta đang nói về việc chuyển ngôn ngữ tự nhiên sang ngôn ngữ của phép tính mệnh đề logic.

Đồng thời, như Bar-Hillel 23 đã chỉ ra, người ta phải đối mặt với những khó khăn khiến triển vọng xử lý thông tin tự động trở nên u ám trừ khi toàn bộ hướng tìm kiếm giải pháp cho vấn đề này được thay đổi. Ít nhất, chúng ta sẽ phải tính đến những trở ngại được liệt kê dưới đây mà chúng ta chưa có đủ phương tiện cần thiết để vượt qua.

A. Khả năng tính toán logic của các mệnh đề quá kém nên không thể thực hiện được, ngay cả với điều khiển từ xa

23 Y. V a g - H i 1 1 e 1, Chứng minh tính không khả thi của bản dịch chất lượng cao hoàn toàn tự động, Những tiến bộ trong máy tính, ed. của F. Alt., tập. TÔI, N. Y., 1960, tr. 158-163.

gần hơn, để định dạng lại một ngôn ngữ tự nhiên, cực kỳ phức tạp trong cấu trúc ngữ nghĩa của nó, sở hữu một khối lượng lớn các yếu tố dư thừa và - quan trọng nhất - thường được đặc trưng bởi sự mơ hồ và không chắc chắn trong cách diễn đạt “ý nghĩa” mà không logic hai giá trị nào có thể làm được. đối phó với việc tạo ra một ngôn ngữ tự nhiên nhân tạo 24 . Đúng, logic, như đã lưu ý, chỉ liên quan đến hình thức ngôn ngữ. Nhưng vì chúng ta đang xử lý việc xử lý thông tin tự động, nên cần có khả năng phân biệt giữa thông tin ngữ nghĩa và nếu điều này không thể đạt được bằng cách sử dụng các phương tiện logic mà chúng ta có, thì làm sao chúng ta có thể có được “niềm tin rằng bản dịch của chúng ta từ thông tin tự nhiên”. ngôn ngữ sang ngôn ngữ logic là chính xác?

B. Máy không thể tính đến những gì Bar-Hillel gọi là “thông tin chung trước đó”.(gênerai nền thông tin),thực sự nằm ngoài ranh giới của ngôn ngữ tự nhiên và do đó không thể dịch sang ngôn ngữ logic. Các nhà ngôn ngữ học trong những trường hợp này nói về bối cảnh ngoài ngôn ngữ(khung tham chiếu), mà chúng tôi không để ý, nhưng theo một cách rất dứt khoát, sửa chữa hoặc thậm chí suy nghĩ lại hoàn toàn tất cả những lời nói của chúng tôi. Rốt cuộc, ngay cả một cụm từ đơn giản như “Tôi sẽ trở lại trước khi trời tối”, để hiểu chính xác nó và xác định dấu hiệu thời gian chứa trong đó, ít nhất, cũng cần có kiến ​​​​thức trước về nơi nó được thốt ra và vào thời điểm nào. ngày và năm. Chỉ loại thông tin sơ bộ này thường là phương tiện duy nhất để hiểu các mối quan hệ nội pha mà cả phép tính mệnh đề lẫn phép tính vị từ đều không thể giải quyết được. Vì vậy, ví dụ như hai câu lóe lên trên báo:

Sinh viên tốt nghiệp đại học từ Kursk. Nhà đổi mới được vinh danh của Siberia,

chúng ta thấy rằng mỗi trong số chúng có thể được giải thích theo hai cách. Nếu chúng ta chỉ tuân theo hình thức

24 Bài viết “Ngữ pháp cho người nghe” của C. Hockett, trong phần này, đưa ra nhiều ví dụ về loại phức tạp này trong cách hiểu “tự nhiên” về một câu, được giải quyết bằng các bước phân tích sâu rộng và tiếp theo.

về đặc điểm ngữ pháp thì câu đầu tiên có thể được hiểu rõ ràng là “Một sinh viên tốt nghiệp của một trường đại học ở thành phố Kursk” và là “Một sinh viên tốt nghiệp của một trường đại học sống ở thành phố Kursk (hoặc có nguồn gốc từ thành phố Kursk) ).” Và câu thứ hai có thể được hiểu vừa là “Nhà đổi mới được vinh danh, có lĩnh vực hoạt động là Siberia” vừa là “Nhà đổi mới được vinh danh là cư dân của Siberia”. Và chỉ những kiến ​​​​thức sơ bộ (thông tin sơ bộ) không được thể hiện dưới bất kỳ hình thức nào trong câu nói rằng không có trường đại học nào ở thành phố Kursk và điều đó sự hợp lý hóa xứng đáng của tình trạng tắc nghẽn ở Liên Xô có một danh hiệu danh dự do các khu hành chính riêng lẻ trao tặng, điều này giúp người ta có thể hiểu chính xác những đề xuất này. Nếu bạn nhìn kỹ, đằng sau hầu hết mọi cụm từ của ngôn ngữ nói đều có thông tin sơ bộ rất kỹ lưỡng và phân nhánh, điều này là hiển nhiên đối với một người, nhưng lại nằm ngoài tầm “hiểu biết” của một cỗ máy không biết thị tộc hay bộ lạc.

B. Máy không thể đưa ra các kết luận ngữ nghĩa nội văn kéo dài qua nhiều câu (và đôi khi thậm chí có chủ ý trên toàn bộ câu chuyện, để không bộc lộ đầy đủ tính cách hoặc diễn biến cốt truyện của nó). Nhà ngôn ngữ học người Hà Lan A. Reichling 25 đã thu hút sự chú ý đến tình huống này, minh họa ý tưởng của mình bằng ví dụ sau. Giả sử chúng ta đang đọc một câu chuyện bắt đầu bằng câu: “Tôi đang chơi với anh trai tôi”. Nếu chúng ta dừng lại ở đây, thì chúng ta sẽ không có bất kỳ dữ liệu nào để tìm hiểu xem cụm từ này nên được hiểu như thế nào, chúng ta đang nói đến loại trò chơi nào ở đây. Rốt cuộc, bạn có thể chơi để kiếm tiền (đánh bài, v.v.), trên một nhạc cụ, trong rạp hát hoặc trong rạp chiếu phim, với đồ chơi, trong bóng đá, chơi để giải trí, chơi với một người và số phận của người đó, v.v. chúng ta đọc thêm: “Tôi đã nói điều này khi Wilhelm gặp tôi vào một ngày nọ

25 Tại hội thảo "Stichting Studiecentrum cho Tự động hóa hành chính",được tổ chức vào năm 1961. Ngoài ra còn có bản dịch tiếng Đức của báo cáo: A. R e i c h 1 i n g, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, “Beiträge zur Sprachkunde und Informationsverarbeitung”, Heft I., Wien, 1963.

ở quán bar." Bây giờ với nhiều khả năng hơn chúng ta có thể kết luận rằng rõ ràng là chúng ta đang nói về việc chơi để kiếm tiền. Nhưng vẫn còn những khả năng khác. Nó tiếp tục: "Anh trai tôi đến bàn và ném xúc xắc." Bây giờ đã rõ chúng ta đang nói về loại trò chơi nào, mặc dù không có chỗ nào trong văn bản chỉ ra chính xác ý nghĩa thực sự của từ “trò chơi” được đưa ra. Chúng tôi đoán về nó từ tổng số các dấu hiệu bên ngoài được đưa ra trong văn bản ở các câu khác nhau. Ở đây, những dấu hiệu này nối tiếp nhau, nhưng trong một câu chuyện bằng văn bản, chúng có thể tách biệt đáng kể với nhau. Một người có thể chọn chúng từ bối cảnh ngôn ngữ rộng, so sánh chúng và sau đó đưa ra kết luận phù hợp. Máy bị tước đi cơ hội này.

Nhưng có lẽ điều này không quá quan trọng? Thật vậy, không có khó khăn đặc biệt nào khi dịch những câu này sang tiếng Đức hoặc tiếng Pháp bằng máy (nhưng tất nhiên khó khăn có thể nảy sinh khi dịch các câu khác). Khi dịch sang tiếng Đức chúng ta có thể sử dụng nghĩa đen:Tôi nói chuyện với tôi Bruder.Theo cách tương tự trong tiếng Pháp, chúng ta có thể bắt đầu: Tôi yêu bạn... Khi dịch sang tiếng Anh, sẽ nảy sinh những khó khăn về ngữ pháp, vì trong văn bản đã cho không có dấu hiệu nào cho biết máy nên chọn dạng nào: 1. Tôi đang chơi với anh trai tôi, 2. Tôi chơi với anh trai tôi, hoặc 3. Tôi sẽ chơi với anh trai tôi. Và mọi thứ sẽ thực sự tồi tệ khi dịch sang tiếng Tây Ban Nha, vì máy sẽ phải chọn giữa ít nhất ba động từ: jugar, tocar hoặc trabajar.

Ở đây ngôn ngữ logic là bất lực.

D. Máy thực sự xử lý lời nói (hay chính xác hơn là xử lý các đoạn giọng nói) - ở dạng viết và nói. Mỗi hình thức nói này đều có hệ thống các yếu tố thực dụng riêng, cũng có thể chuyển đổi thành các yếu tố ngữ nghĩa (và các quy tắc chuyển đổi như vậy chưa được nghiên cứu và phần lớn là tùy tiện). Ví dụ, lời nói bằng miệng có cấu trúc thượng tầng siêu phân đoạn như ngữ điệu. Bây giờ dường như có thể phân loại ngữ điệu theo các loại chức năng, phân biệt ngữ điệu nghi vấn, trần thuật và các ngữ điệu khác. Tuy nhiên, hoàn toàn rõ ràng rằng ngữ điệu không tồn tại tách biệt khỏi câu. Tất nhiên, nó tương tác với ý nghĩa chứa đựng trong chúng. Để khẳng định điều này, chỉ cần nhắc đến một câu hỏi tu từ là một câu hỏi chỉ có cấu trúc bên ngoài chứ không có ý nghĩa. - nó không yêu cầu phản hồi từ những người đang lắng nghe. Đây là những khó khăn mới mà ngôn ngữ logic không có cách nào giải quyết được.

D. Nhưng ngay cả khi có thể giải quyết được những khó khăn về ngôn ngữ được liệt kê thì vẫn có những trở ngại về trật tự logic chặt chẽ - trong trường hợp này chúng ta đang nói về cái gọi là “quy tắc suy luận quyết định”(quy tắc quyết định). Rốt cuộc, nếu chúng ta muốn chắc chắn rằng cỗ máy sẽ hoạt động hoàn hảo về mặt logic, chúng ta phải cung cấp cho nó một bộ quy tắc, theo đó nó có thể đi từ thông tin ban đầu đến những kết luận cần thiết một cách nhất quán. Liên quan đến phép tính logic mệnh đề, chúng ta có những quy tắc như vậy, nhưng đối với những logic phức tạp hơn thì không có những quy tắc như vậy, và hơn nữa, có lý do để tin rằng không thể tìm thấy những quy tắc như vậy. Nếu chúng ta dựa vào các quy tắc mà chúng ta đã có sẵn, thì việc sử dụng chúng sẽ khiến quá trình giải quyết trở nên phức tạp (ngay cả khi sử dụng máy tính tiên tiến) đến mức trò chơi sẽ không có giá trị gì.

Đây là cách mô tả vấn đề áp dụng các phương pháp logic và toán học trong khoa học ngôn ngữ trên cơ sở dữ liệu từ ngôn ngữ học ứng dụng. Kết luận là gì? Các kết luận đã được đưa ra ở trên - Phân tích ngôn ngữ học cho phép kết hợp các phương pháp quy nạp với các phương pháp suy diễn, nhưng khi nói về việc sử dụng các phương pháp suy diễn trong ngôn ngữ học, không nên coi mọi thứ là sự phụ thuộc mù quáng của nghiên cứu ngôn ngữ vào các phương pháp toán học logic. Ngôn ngữ tự nhiên nổi dậy chống lại bạo lực như vậy. Và thực tiễn ngôn ngữ học ứng dụng đã xác nhận những kết luận này, chứng minh rằng có những khác biệt giữa ngôn ngữ logic hình thức và ngôn ngữ tự nhiên đến mức nó khá đầy đủ (về mặt thông tin), việc chuyển đổi cái thứ hai sang cái thứ nhất là không thể. Phải chăng điều này có nghĩa là trong ngôn ngữ học và đặc biệt là ngôn ngữ học ứng dụng, chúng ta nên từ bỏ việc sử dụng các phương pháp toán học logic? Tất nhiên là không. Nhưng bạn không nên hoàn toàn dựa vào chúng mà hãy kết hợp chúng với những thứ khác. Và để không bị vô căn cứ, chúng ta hãy quay sang lời chứng của các nhà toán học và logic học, những người trong thực tế phải áp dụng kiến ​​thức của mình vào việc nghiên cứu ngôn ngữ tự nhiên.

Đây là những gì nhà toán học nói: “Sự trợ giúp của toán học trong việc nghiên cứu ngôn ngữ tự nhiên vẫn còn chưa rõ ràng... Trước khi chúng ta có thể nghĩ đến việc sử dụng toán học để tính toán, cần phải xác định ranh giới và chức năng của các đơn vị ngôn ngữ.. . Cái này - một vấn đề phi toán học, nó là một phần của phương pháp quy nạp trong ngôn ngữ học.

Hóa ra toán học không thay thế phương pháp thực nghiệm, mặc dù một số nhà ngôn ngữ học cố gắng làm điều đó. Ngược lại, chỉ sau khi các đơn vị và quan hệ của ngôn ngữ tự nhiên được thiết lập một cách quy nạp và được xác minh một cách thích hợp thì các điều kiện cần thiết mới được tạo ra cho việc ứng dụng thực tế của toán học vào ngôn ngữ tự nhiên. Trong trường hợp này, các nhà toán học sẽ khám phá ra rằng họ đang giải quyết một biểu hiện mới của những gì đã quen thuộc với họ về bản chất, hoặc họ sẽ nhận được sự kích thích để tư duy toán học về một trật tự mới”26.

Và đây là những gì nhà logic học nói: “Triển vọng cho việc xử lý tự động thông tin giọng nói là rất tốt, nhưng vai trò của logic trong lĩnh vực này còn hạn chế. Tuy nhiên, với tư cách là một công cụ phân tích ngôn ngữ, chứ không phải là một bộ quy tắc để rút ra kết luận, nó đưa ra những hứa hẹn thực sự”27. Và sau đó, anh ấy thiết lập chiến lược nghiên cứu nào thích hợp hơn trong trường hợp này: “Các vấn đề cần được giải quyết không phải thông qua việc tuân thủ một cách cứng nhắc một bộ quy tắc do nhà logic học thiết lập, mà là nhờ sự trợ giúp của các kỹ thuật heuristic... Để xử lý tự động các dữ liệu thông tin lời nói, cách tiếp cận thực nghiệm, quy nạp được ưu tiên, trong đó các quy tắc sơ bộ để giải quyết các vấn đề về thông tin. Người ta không nên cố gắng dịch ngôn ngữ thông thường sang ngôn ngữ logic nhằm mục đích xử lý thêm mà nên tìm kiếm các quy tắc kiểu heuristic sẽ cho phép người ta đối phó với ngôn ngữ tự nhiên. Cần thiết ngừng tìm kiếm

26 P. Garvin và W. K a g u s h, Ngôn ngữ học, Xử lý dữ liệu-
hát và Toán học, “Ngôn ngữ tự nhiên và máy tính,” N.Y.,
1963, tr. 368-369.
Cm . cũng trong cuốn sách đó có một bài viết của W. K a g bạn à,
Việc sử dụng toán học trong khoa học hành vi, tr. 64-83.

27 M. M a g o n, Quan điểm của một nhà logic học về các quá trình dữ liệu-ngôn ngữ-
hát,
cuốn sách nói, trang.

144.

Đây là những kết luận chung. Họ nói rằng các nhà ngôn ngữ học đóng vai trò chủ đạo trong công việc chung với các nhà logic học và toán học. Trách nhiệm của các nhà ngôn ngữ học là chuẩn bị tài liệu ngôn ngữ sao cho có thể xử lý được bằng các phương pháp toán học logic. Theo hướng này, người ta nên tìm kiếm sự kết hợp thực tế trong ngôn ngữ học của các phương pháp quy nạp với các phương pháp diễn dịch. Và khi giải quyết các vấn đề của ngôn ngữ học ứng dụng, chúng ta đang nói về các giả thuyết heuristic, thì trước hết chúng phải đến từ một nhà ngôn ngữ học, vì anh ta gần ngôn ngữ hơn và do vị trí của anh ta nên có nghĩa vụ phải biết và hiểu nó tốt hơn. .

Các bài viết trong phần này nên được tiếp cận với những cân nhắc nêu trên. Như đã chỉ ra, chúng được lấy từ bộ sưu tập tài liệu của hội nghị chuyên đề về toán học ứng dụng, “Cấu trúc của ngôn ngữ và các khía cạnh toán học của nó” (hội nghị chuyên đề được tổ chức tại New York vào tháng 4 năm 1960, tài liệu của hội nghị chuyên đề được xuất bản vào năm 1961 ).

Hội nghị chuyên đề có sự tham dự của các nhà toán học, nhà logic học và nhà ngôn ngữ học, tức là đại diện của những ngành khoa học có công trình chung được đề cập ở trên. Chủ đề của hội nghị chuyên đề, được xây dựng khá tự do, đã tạo cơ hội cho những người tham gia thảo luận về những vấn đề rất cụ thể và đặc biệt cũng như về những vấn đề khá chung chung mà không cam kết với bất kỳ vấn đề nào. sự hiểu biết chung nhiệm vụ của các vấn đề đang được xem xét cũng như đánh giá tầm quan trọng cụ thể của chúng trong toàn bộ vấn đề. Có lẽ nguyên tắc lý thuyết duy nhất gắn kết những người tham gia hội nghị chuyên đề là luận điểm do R. Jacobson đưa ra trong “Lời tựa” cho các tài liệu mà ngôn ngữ học tuân theo

28 Như trên, trang 143-144.

nên được coi là cầu nối giữa các ngành toán học và nhân văn. Mặt khác, mỗi tác giả của báo cáo đều phát biểu theo sở thích cá nhân và phù hợp với định hướng công việc nghiên cứu của mình.

Do giới hạn trang nhất định của bộ sưu tập này, không thể sử dụng tất cả các bài viết có trong tài liệu hội nghị chuyên đề. Cần phải lựa chọn một số tác phẩm, nhưng theo cách sao cho độc giả Liên Xô có cơ hội sáng tác đủ. xem toàn bộ về các xu hướng chung trong việc nghiên cứu vấn đề nêu trong tiêu đề của hội thảo. Về chất lượng thông tin, tất cả các bài viết trong phần này đều mang lại sự quan tâm không thể phủ nhận đối với cả lý thuyết ngôn ngữ học và thực tiễn nghiên cứu ngôn ngữ học ứng dụng.

TRONG.Zvegintsev

một môn toán có chủ đề là phát triển một bộ máy hình thức để mô tả cấu trúc của ngôn ngữ tự nhiên và một số ngôn ngữ nhân tạo. Có nguồn gốc từ những năm 50. thế kỷ 20; một trong những động lực chính cho sự xuất hiện của M. l. là một nhu cầu cấp thiết trong ngôn ngữ học để làm rõ các khái niệm cơ bản của nó. Phương pháp M. l. có nhiều điểm chung với các phương pháp logic toán học - một môn toán học nghiên cứu cấu trúc của lý luận toán học - và đặc biệt là các phần như lý thuyết về thuật toán và lý thuyết về automata. Được sử dụng rộng rãi trong M. l. Cũng phương pháp đại số. M. l. phát triển trong sự tương tác chặt chẽ với ngôn ngữ học. Đôi khi thuật ngữ "M. tôi." cũng được sử dụng để chỉ bất kỳ nghiên cứu ngôn ngữ nào trong đó một số loại công cụ toán học được sử dụng.

Mô tả toán học của ngôn ngữ dựa trên ý tưởng coi ngôn ngữ như một cơ chế, quay trở lại F. de Saussure, chức năng của nó được thể hiện trong hoạt động lời nói của người nói; kết quả của nó là “văn bản chính xác” - chuỗi các đơn vị lời nói tuân theo các mẫu nhất định, nhiều mẫu trong số đó cho phép mô tả toán học. Việc phát triển và nghiên cứu các phương pháp mô tả toán học các văn bản chính xác (chủ yếu là các câu) là nội dung của một trong những phần của văn học toán học. - lý thuyết về cách mô tả cấu trúc cú pháp. Để mô tả cấu trúc của một câu - chính xác hơn là cấu trúc cú pháp của nó - người ta có thể đánh dấu trong đó thành phần- các nhóm từ có chức năng như các đơn vị cú pháp tách rời hoặc chỉ ra cho mỗi từ những từ phụ thuộc trực tiếp vào từ đó (nếu có). Vì vậy, trong câu “Người đánh xe ngồi trên xà” (A.S. Pushkin), khi miêu tả theo cách 1, các thành phần sẽ là cả câu P, mỗi từ riêng lẻ và từng nhóm từ A = ngồi trên xà. dầm và B = trên dầm (xem Hình 1; các mũi tên chỉ “gắn trực tiếp”); mô tả theo phương pháp thứ 2 đưa ra sơ đồ như trong Hình. 2. Đối tượng toán học phát sinh trong trường hợp này được gọi là hệ thống thành phần(phương pháp 1) và cây phụ cú pháp(phương pháp thứ 2).

Chính xác hơn, một hệ thống các thành phần là một tập hợp các phân đoạn câu chứa các thành phần của toàn bộ câu và tất cả các lần xuất hiện của các từ trong câu này (“các phân đoạn một từ”) và có đặc tính mà hai phân đoạn có trong đó không có. giao nhau, hoặc một trong số chúng được chứa trong cái khác; Cây phụ thuộc cú pháp, hay đơn giản là cây phụ thuộc, là một cây có nhiều nút là nhiều lần xuất hiện của các từ trong một câu. cây trong toán học, một tập hợp được gọi, giữa các phần tử mà chúng được gọi là nút- một mối quan hệ nhị phân được thiết lập - nó được gọi là mối quan hệ phụ thuộc và được biểu thị bằng đồ họa bằng các mũi tên đi từ các nút cấp dưới đến các nút cấp dưới - sao cho: 1) trong số các nút có chính xác một - nó được gọi là gốc, - không phụ thuộc vào bất kỳ nút nào; 2) mỗi nút còn lại phụ thuộc chính xác vào một nút; 3) không thể bắt đầu từ bất kỳ nút nào dọc theo mũi tên để quay lại cùng một nút. Các nút của cây phụ là sự xuất hiện của các từ trong câu. Khi được mô tả bằng đồ họa, hệ thống các thành phần (như trong Hình 1) cũng có dạng cây ( cây thành phần). Cây phụ hoặc hệ thống các thành phần được xây dựng cho một câu thường được gọi là cấu trúc cú pháp dưới dạng cây phụ (hệ thống các thành phần). Hệ thống các thành phần được sử dụng chủ yếu trong mô tả các ngôn ngữ có trật tự từ cứng nhắc, cây phụ - trong mô tả các ngôn ngữ có trật tự từ tự do (đặc biệt là tiếng Nga), chính thức, cho mỗi câu (không quá ngắn), Có thể xây dựng nhiều cấu trúc cú pháp khác nhau thuộc bất kỳ loại nào trong hai loại, nhưng trong số chúng, chỉ có một hoặc nhiều cấu trúc đúng. Gốc của một cây phụ thuộc chính xác thường là vị ngữ. Một câu có nhiều hơn một cấu trúc cú pháp đúng (cùng loại) được gọi là đồng âm về mặt cú pháp; Theo quy luật, các cấu trúc cú pháp khác nhau sẽ tương ứng với các ý nghĩa khác nhau của câu. Ví dụ: câu “Học sinh từ Rzhev đến Torzhok” cho phép có hai cây phụ đúng (Hình 3, a, b); cái đầu tiên trong số chúng tương ứng với ý nghĩa “Học sinh Rzhev đã đi (không nhất thiết phải từ Rzhev) đến Torzhok,” cái thứ hai - “Học sinh (không nhất thiết là Rzhev) đã đi từ Rzhev đến Torzhok.”

Trong tiếng Nga và một số ngôn ngữ khác, cây phụ thuộc của câu “phong cách kinh doanh” thường phụ thuộc vào định luật xạ ảnh, bao gồm thực tế là tất cả các mũi tên có thể được vẽ trên dòng mà câu được viết, sao cho không có hai mũi tên nào giao nhau và gốc sẽ không nằm dưới bất kỳ mũi tên nào. Trong ngôn ngữ tiểu thuyết, đặc biệt là trong thơ ca, những sai lệch so với quy luật phóng chiếu là được phép và thường phục vụ mục đích tạo ra một hiệu ứng nghệ thuật nhất định. Như vậy, trong câu “Những người bạn thời cổ đại đẫm máu của chiến tranh nhân dân” (Pushkin), tính không phóng chiếu dẫn đến việc nhấn mạnh từ “dân gian”, đồng thời dường như làm chậm lời nói, từ đó tạo ấn tượng. có sự hân hoan và trang trọng nhất định. Có những đặc điểm hình thức khác của cây phụ thuộc có thể được sử dụng để mô tả phong cách. Ví dụ: số lượng mũi tên lồng nhau tối đa đóng vai trò là thước đo mức độ “cồng kềnh về mặt cú pháp” của một câu (xem Hình 4).

Để mô tả đầy đủ hơn về cấu trúc của câu, các thành phần thường được đánh dấu bằng các ký hiệu của các phạm trù ngữ pháp (“cụm danh từ”, “nhóm động từ chuyển tiếp”, v.v.) và các mũi tên của cây phụ được đánh dấu bằng các ký hiệu của quan hệ cú pháp (“dự đoán”, “dứt khoát”, v.v.).

Bộ máy cây phụ và hệ thống thành phần còn được dùng để biểu diễn cấu trúc cú pháp sâu của câu, tạo thành cấp độ trung gian giữa cấu trúc ngữ nghĩa và cấu trúc cú pháp thông thường (cấu trúc sau thường gọi là cú pháp bề mặt).

Một cách trình bày hoàn hảo hơn về cấu trúc cú pháp của một câu (tuy nhiên, đòi hỏi một bộ máy toán học phức tạp hơn) được cung cấp bởi hệ thống nhóm cú pháp, bao gồm cả cụm từ và kết nối cú pháp, không chỉ giữa các từ mà còn giữa các cụm từ. Hệ thống nhóm cú pháp giúp kết hợp tính chặt chẽ của mô tả chính thức về cấu trúc câu với tính linh hoạt vốn có trong các mô tả truyền thống, không chính thức. Cây phụ và hệ thống thành phần là những trường hợp cực kỳ đặc biệt của hệ thống nhóm cú pháp.

Một phần khác của M. l., chiếm vị trí trung tâm trong đó, là lý thuyết ngữ pháp hình thức, bắt đầu từ tác phẩm của N. Chomsky. Cô nghiên cứu các cách mô tả các mẫu không chỉ đặc trưng cho một văn bản mà là toàn bộ tập hợp các văn bản chính xác của một ngôn ngữ cụ thể. Những mẫu này được mô tả bằng cách sử dụng ngữ pháp chính thức- một “cơ chế” trừu tượng cho phép, bằng cách sử dụng một quy trình thống nhất, thu được các văn bản chính xác của một ngôn ngữ nhất định cùng với các mô tả về cấu trúc của chúng. Loại ngữ pháp hình thức được sử dụng rộng rãi nhất là ngữ pháp sáng tạo, hay ngữ pháp Chomsky, là một hệ có thứ tự Г = ⟨ V, W, П, R ⟩, trong đó V và W là các tập hữu hạn rời nhau, được gọi tương ứng chủ yếu, hoặc phần cuối, Và phụ trợ, hoặc không có thiết bị đầu cuối, bảng chữ cái(các phần tử của chúng được gọi tương ứng là chính hoặc đầu cuối và phụ trợ hoặc không đầu cuối, biểu tượng), P - phần tử W, gọi là ký tự bắt đầu và R là một tập hữu hạn quy tắc có dạng φ → ψ, trong đó φ và ψ là các chuỗi (chuỗi hữu hạn) gồm các ký hiệu chính và phụ. Nếu φ → ψ là quy tắc ngữ pháp Г và ω 1 thì ω 2 là chuỗi ký hiệu chính và phụ, người ta nói chuỗi ω 1 ψω 2 suy luận trực tiếp trong Г từ ω 1 φω 2 . Nếu ξ 0, ξ 1, ..., ξ n là các chuỗi và với mỗi i = 1, ..., n chuỗi ξ i được suy ra trực tiếp từ ξ i−1, chúng ta nói rằng ξ n có thể suy luận được trong Г từ ξ 0 . Tập hợp các chuỗi ký hiệu cơ bản có thể được suy ra từ Γ từ ký hiệu ban đầu của nó được gọi là ngôn ngữ được tạo ra bởi ngữ phápГ và được ký hiệu là L(Г). Nếu tất cả các quy tắc Γ có dạng η 1 Aη 2 → η 1 ωη 2 , thì Γ được gọi ngữ pháp của các thành phần(hoặc thành phần trực tiếp), viết tắt NS- ngữ pháp; nếu trong mỗi quy tắc của chuỗi có η 1 và η 2 ( bối cảnh bên phải và bên trái) trống thì ngữ pháp được gọi không có ngữ cảnh(hoặc không có ngữ cảnh), viết tắt là B- ngữ pháp(hoặc KS- ngữ pháp). Trong cách hiểu ngôn ngữ thông dụng nhất, ký hiệu chính là từ, ký hiệu phụ là ký hiệu của phạm trù ngữ pháp, ký hiệu đầu tiên là ký hiệu của phạm trù “câu”; trong trường hợp này, ngôn ngữ do ngữ pháp tạo ra được hiểu là tập hợp tất cả các câu đúng ngữ pháp của một ngôn ngữ tự nhiên nhất định. Trong ngữ pháp NN, đầu ra của một câu cung cấp cho nó một cây các thành phần, trong đó mỗi thành phần bao gồm các từ “có nguồn gốc” từ một ký hiệu phụ trợ duy nhất, sao cho mỗi thành phần được đưa ra phạm trù ngữ pháp của nó. Vì vậy, nếu ngữ pháp có, trong số những quy tắc khác, P → S x, y, im, V y → Vi y O, O → S x, y, câu, V i y → ngồi, S chồng, đơn vị, im → trên , người đánh xe, S chồng, số ít, câu. → chiếu xạ thì câu “Người lái xe ngồi trên chiếu xạ” có kết luận như hình 2. 5, trong đó các mũi tên đi từ phần bên trái của quy tắc được áp dụng đến các phần tử của phần bên phải. Hệ thống các thành phần tương ứng với kết luận này trùng khớp với hệ thống trong hình. 1. Cũng có thể có những cách giải thích khác: ví dụ, các ký hiệu cơ bản có thể được hiểu là hình thái, ký hiệu phụ là ký hiệu của các loại hình thái và chuỗi hình thái được chấp nhận, ký hiệu ban đầu là ký hiệu của loại “dạng từ” và ngôn ngữ được ngữ pháp tạo ra dưới dạng một tập hợp các dạng từ thông thường (giải thích hình thái); Giải thích hình thái và âm vị học cũng được sử dụng. Trong các mô tả thực tế của ngôn ngữ, ngữ pháp "đa cấp độ" thường được sử dụng, chứa các quy tắc cú pháp, hình thái và hình thái-âm vị học hoạt động tuần tự.

Một loại ngữ pháp hình thức quan trọng khác là ngữ pháp thống trị, tạo ra nhiều chuỗi, thường được hiểu là các câu cùng với cấu trúc cú pháp của chúng dưới dạng cây phụ. Ngữ pháp của các nhóm cú pháp tạo ra nhiều câu cùng với cấu trúc cú pháp của chúng, có dạng hệ thống các nhóm cú pháp. Ngoài ra còn có nhiều khái niệm khác nhau ngữ pháp chuyển đổi (ngữ pháp cây), phục vụ không phải để tạo ra câu mà để biến đổi cây, được hiểu là cây phụ hoặc cây thành phần. Một ví dụ là Δ- ngữ pháp- một hệ thống các quy tắc chuyển đổi cây, được hiểu là cây phụ thuộc câu “thuần túy”, tức là cây phụ thuộc không có trật tự từ tuyến tính.

Họ đứng cách xa nhau Ngữ pháp Montague, dùng để mô tả đồng thời cấu trúc cú pháp và ngữ nghĩa của câu; họ sử dụng bộ máy toán học và logic phức tạp (cái gọi là logic sâu sắc).

Ngữ pháp hình thức được sử dụng để mô tả không chỉ các ngôn ngữ tự nhiên mà còn cả ngôn ngữ nhân tạo, đặc biệt là ngôn ngữ lập trình.

Ở M. l. cũng đang được phát triển mô hình phân tích ngôn ngữ, trong đó, trên cơ sở dữ liệu nhất định về lời nói được coi là đã biết, các cấu trúc chính thức được tạo ra, kết quả của nó là mô tả các khía cạnh nhất định của cấu trúc ngôn ngữ. Những mô hình này thường sử dụng một bộ máy toán học đơn giản - khái niệm đơn giản lý thuyết tập hợp và đại số; Đây là lý do tại sao các mô hình phân tích ngôn ngữ đôi khi được gọi là lý thuyết tập hợp. Trong các mô hình phân tích thuộc loại đơn giản nhất, dữ liệu ban đầu là một tập hợp các câu đúng và một hệ thống môi trường xung quanh- tập hợp các “từ” thuộc một từ vị (ví dụ: (nhà, nhà, nhà, nhà, nhà, nhà, nhà, nhà, nhà, nhà)). Khái niệm rút ra đơn giản nhất trong các mô hình như vậy là khả năng thay thế: từ Một có thể thay thế bằng từ b, nếu mọi câu đúng đều có sự xuất hiện của từ đó Một, vẫn đúng khi thay thế sự xuất hiện này bằng sự xuất hiện của từ b. Nếu như MỘT có thể thay thế bằng bb TRÊN Một, họ nói thế Mộtb có thể hoán đổi cho nhau. (Ví dụ: trong tiếng Nga từ “blue” được thay thế bằng từ “goluboy”; các từ “sinego” và “golubogo” có thể hoán đổi cho nhau.) Lớp từ có thể hoán đổi cho nhau được gọi là gia đình. Từ các khu dân cư và gia đình, một số cách phân loại từ có ý nghĩa về mặt ngôn ngữ khác có thể được rút ra, một trong số đó gần tương ứng với hệ thống truyền thống các phần của lời nói. Trong một loại mô hình phân tích khác, thay vì sử dụng một tập hợp các câu đúng, mối quan hệ tiềm ẩn giữa các từ được sử dụng, nghĩa là khả năng một trong số chúng phụ thuộc vào câu kia trong các câu đúng. Trong các mô hình như vậy, đặc biệt có thể thu được các định nghĩa chính thức về một số loại ngữ pháp truyền thống - ví dụ: định nghĩa chính thức về cách viết danh từ, đây là một quy trình cho phép bạn khôi phục hệ thống trường hợp ngôn ngữ, chỉ biết mối quan hệ của sự phụ thuộc tiềm năng, hệ thống lân cận và tập hợp các từ là dạng danh từ.

Các mô hình ngôn ngữ phân tích sử dụng các khái niệm đơn giản từ lý thuyết tập hợp và đại số. Gần với các mô hình phân tích ngôn ngữ mô hình giải mã- các thủ tục cho phép, từ một kho văn bản đủ lớn bằng một ngôn ngữ chưa biết mà không có bất kỳ thông tin sơ bộ nào về nó, có được một số dữ liệu về cấu trúc của nó.

Theo mục đích của nó, M. l. chủ yếu là một công cụ của ngôn ngữ học lý thuyết. Đồng thời, các phương pháp của nó được sử dụng rộng rãi trong nghiên cứu ngôn ngữ ứng dụng - xử lý văn bản tự động, dịch tự động và các phát triển liên quan đến cái gọi là giao tiếp giữa con người và máy tính.

  • Kulagina O. S., Một cách định nghĩa các khái niệm ngữ pháp trên cơ sở lý thuyết tập hợp, trong: Các vấn đề của Điều khiển học, v. 1, M., 1958;
  • Chomsky N., Cấu trúc cú pháp, trong: “Mới trong ngôn ngữ học”, v. 2, M., 1962;
  • Trơn tru A.V., Melchuk I. A., Các yếu tố của ngôn ngữ học toán học, M., 1969 (lit.);
  • của riêng họ, Ngữ pháp cây cối, I, II, trong: Các vấn đề thông tin về ký hiệu học, ngôn ngữ học và dịch tự động, in. 1, 4, M., 1971-74 (lit.);
  • Marcus S., Mô hình lý thuyết tập hợp của ngôn ngữ, trans. từ tiếng Anh, M., 1970 (lit.);
  • Trơn tru A.V., Ngữ pháp và ngôn ngữ chính thức, M., 1973 (lit.);
  • của anh ấy, Nỗ lực định nghĩa chính thức các khái niệm về cách viết và giới tính của một danh từ, trong bộ sưu tập: Các vấn đề về mô hình ngữ pháp, M., 1973 (lit.);
  • của anh ấy, Cấu trúc cú pháp của ngôn ngữ tự nhiên trong hệ thống truyền thông tự động, M., 1985 (lit.);
  • Sukhotin B.V., Phương pháp tối ưu hóa cho nghiên cứu ngôn ngữ. M., 1976 (lit.);
  • Sevbo I.P., Biểu diễn đồ họa của cấu trúc cú pháp và chẩn đoán văn phong, K., 1981;
  • Buổi tiệc B. Kh., Ngữ pháp của Montagu, những biểu hiện tinh thần và hiện thực, trong cuốn: Ký hiệu học, M., 1983;
  • người Montague R., Triết học hình thức, New Haven - L., 1974(sáng.).

Giới thiệu

Chương 1. Lịch sử ứng dụng các phương pháp toán học trong ngôn ngữ học

1.1. Sự hình thành của ngôn ngữ học cấu trúc bước sang thế kỷ 19– Thế kỷ XX

1.2. Ứng dụng các phương pháp toán học trong ngôn ngữ học nửa sau thế kỷ XX

Chương 2. Những ví dụ chọn lọc về ứng dụng toán học trong ngôn ngữ học

2.1. Dịch máy

2.2.Phương pháp thống kê trong học ngoại ngữ

2.3. Học một ngôn ngữ bằng các phương pháp logic hình thức

2.4. Triển vọng ứng dụng các phương pháp toán học trong ngôn ngữ học

Phần kết luận

Văn học

Phụ lục 1. Ronald Schleifer. Ferdinand de Saussure

Phụ lục 2. Ferdinand de Saussure (bản dịch)

Giới thiệu

Trong thế kỷ 20, xu hướng tiếp tục hướng tới sự tương tác và thâm nhập lẫn nhau của nhiều lĩnh vực kiến ​​thức khác nhau. Ranh giới giữa các ngành khoa học riêng lẻ đang dần mờ nhạt; Ngày càng có nhiều nhánh hoạt động trí óc xuất hiện, nằm ở “điểm nối” của tri thức nhân văn, kỹ thuật và khoa học tự nhiên.

Một đặc điểm rõ ràng khác của thời hiện đại là mong muốn nghiên cứu các cấu trúc và các yếu tố cấu thành của chúng. Vì vậy, toán học ngày càng có một vị trí ngày càng cao cả về lý thuyết khoa học và thực tế. Một mặt, tiếp xúc với logic và triết học, mặt khác với thống kê (và do đó, với các khoa học xã hội), toán học ngày càng thâm nhập sâu hơn vào những lĩnh vực mà từ lâu được coi là thuần túy “nhân đạo, ” mở rộng tiềm năng khám phá của họ (câu trả lời cho câu hỏi “bao nhiêu” thường sẽ giúp trả lời các câu hỏi “cái gì” và “như thế nào”). Ngôn ngữ học cũng không ngoại lệ.

Mục đích của khóa học của tôi là nêu bật ngắn gọn mối liên hệ giữa toán học và một nhánh ngôn ngữ học như ngôn ngữ học. Từ những năm 50 của thế kỷ trước, toán học đã được sử dụng trong ngôn ngữ học để tạo ra một bộ máy lý thuyết mô tả cấu trúc của ngôn ngữ (cả tự nhiên và nhân tạo). Tuy nhiên, cần phải nói rằng nó chưa tìm thấy ngay ứng dụng thực tế như vậy. Ban đầu, các phương pháp toán học trong ngôn ngữ học bắt đầu được sử dụng để làm rõ các khái niệm cơ bản của ngôn ngữ học, nhưng với sự phát triển của công nghệ máy tính, tiền đề lý thuyết như vậy bắt đầu được sử dụng trong thực tế. Việc giải quyết các vấn đề như dịch máy, truy xuất thông tin máy và xử lý văn bản tự động đòi hỏi một cách tiếp cận ngôn ngữ mới về cơ bản. Một câu hỏi đã được đặt ra cho các nhà ngôn ngữ học: làm thế nào để học cách biểu diễn các mẫu ngôn ngữ ở dạng mà chúng có thể được áp dụng trực tiếp vào công nghệ. Thuật ngữ “ngôn ngữ học toán học” rất phổ biến ở thời đại chúng ta, dùng để chỉ bất kỳ nghiên cứu ngôn ngữ nào sử dụng các phương pháp chính xác (và khái niệm về các phương pháp chính xác trong khoa học luôn liên quan chặt chẽ đến toán học). Một số nhà khoa học trong những năm qua tin rằng bản thân cách diễn đạt này không thể được nâng lên thành một thuật ngữ, vì nó không biểu thị bất kỳ “ngôn ngữ học” đặc biệt nào mà chỉ là một hướng mới tập trung vào việc cải thiện, tăng độ chính xác và độ tin cậy của các phương pháp nghiên cứu ngôn ngữ. Ngôn ngữ học sử dụng cả phương pháp định lượng (đại số) và phi định lượng, đưa nó đến gần hơn với logic toán học, và do đó, với triết học và thậm chí cả tâm lý học. Schlegel cũng lưu ý đến sự tương tác giữa ngôn ngữ và ý thức, và nhà ngôn ngữ học nổi tiếng đầu thế kỷ XX Ferdinand de Saussure (tôi sẽ nói về ảnh hưởng của ông đối với sự phát triển các phương pháp toán học trong ngôn ngữ học sau này) đã kết nối cấu trúc của một ngôn ngữ với thuộc tính của nó. mọi người. Nhà thám hiểm hiện đại L. Perlovsky còn đi xa hơn, xác định các đặc điểm định lượng của một ngôn ngữ (ví dụ: số lượng giới tính, trường hợp) với đặc điểm của tâm lý dân tộc (xem thêm điều này ở phần 2.2, “Các phương pháp thống kê trong ngôn ngữ học”).

Sự tương tác giữa toán học và ngôn ngữ học là một chủ đề nhiều mặt, và trong công việc của mình, tôi sẽ không tập trung vào tất cả chúng mà trước hết là các khía cạnh ứng dụng của nó.

Chương I. Lịch sử ứng dụng các phương pháp toán học trong ngôn ngữ học

1.1 Sự hình thành ngôn ngữ học cấu trúc đầu thế kỷ 19 - 20

Mô tả toán học của ngôn ngữ dựa trên ý tưởng coi ngôn ngữ như một cơ chế, được quay trở lại với nhà ngôn ngữ học nổi tiếng người Thụy Sĩ đầu thế kỷ XX, Ferdinand de Saussure.

Mối liên kết ban đầu trong khái niệm của ông là lý thuyết về ngôn ngữ như một hệ thống gồm ba phần (bản thân ngôn ngữ - ngôn ngữ, lời nói - mật khẩu và hoạt động lời nói – ngôn ngữ), trong đó mỗi từ (thành viên của hệ thống) không được coi là tự nó mà có liên quan đến các thành viên khác. Như một nhà ngôn ngữ học nổi tiếng khác, Dane Louis Hjelmslev, sau này đã lưu ý, Saussure “là người đầu tiên yêu cầu một cách tiếp cận cấu trúc đối với ngôn ngữ, tức là một mô tả khoa học về ngôn ngữ bằng cách ghi lại mối quan hệ giữa các đơn vị”.

Hiểu ngôn ngữ như một cấu trúc thứ bậc, Saussure là người đầu tiên đặt ra vấn đề về giá trị và ý nghĩa của các đơn vị ngôn ngữ. Các hiện tượng và sự kiện riêng lẻ (chẳng hạn như lịch sử nguồn gốc của các từ Ấn-Âu riêng lẻ) không nên được nghiên cứu riêng lẻ mà trong một hệ thống trong đó chúng có mối tương quan với các thành phần tương tự.

Saussure coi đơn vị cấu trúc của ngôn ngữ là từ, “dấu hiệu”, trong đó âm thanh và ý nghĩa được kết hợp với nhau. Không có yếu tố nào trong số này tồn tại mà không có nhau: do đó, người bản xứ có thể hiểu rõ các sắc thái ý nghĩa khác nhau từ đa nghĩa như một yếu tố riêng biệt trong tổng thể cấu trúc, trong ngôn ngữ.

Như vậy, trong lý thuyết của F. de Saussure, một mặt có thể thấy sự tương tác của ngôn ngữ học với xã hội học và tâm lý học xã hội (cần lưu ý rằng cùng lúc đó hiện tượng học của Husserl, phân tâm học của Freud, thuyết tương đối của Einstein đang phát triển). , các thí nghiệm diễn ra về hình thức và nội dung trong văn học, âm nhạc và mỹ thuật), mặt khác – với toán học (khái niệm về tính hệ thống tương ứng với khái niệm đại số của ngôn ngữ). Khái niệm này đã thay đổi khái niệm diễn giải ngôn ngữ như sau: Các hiện tượng bắt đầu được giải thích không liên quan đến lý do xuất hiện của chúng, mà liên quan đến hiện tại và tương lai. Việc diễn giải không còn độc lập với ý định của một người (mặc dù thực tế là ý định có thể mang tính khách quan, “vô thức” theo nghĩa của từ này).

Hoạt động của cơ chế ngôn ngữ được thể hiện thông qua hoạt động nói của người bản ngữ. Kết quả của lời nói là cái gọi là “văn bản chính xác” - chuỗi các đơn vị lời nói tuân theo các mẫu nhất định, nhiều trong số đó cho phép mô tả toán học. Lý thuyết về các phương pháp mô tả cấu trúc cú pháp liên quan đến việc nghiên cứu các cách mô tả toán học các văn bản chính xác (chủ yếu là các câu). Trong một cấu trúc như vậy, các phép loại suy ngôn ngữ được xác định không phải nhờ vào những phẩm chất vốn có của chúng mà với sự trợ giúp của các mối quan hệ (“cấu trúc”) mang tính hệ thống.

Ở phương Tây, các ý tưởng của Saussure được phát triển bởi những người trẻ cùng thời với nhà ngôn ngữ học vĩ đại người Thụy Sĩ: ở Đan Mạch - L. Hjelmslev đã được đề cập, người đã phát triển lý thuyết đại số của ngôn ngữ trong tác phẩm “Cơ sở lý thuyết ngôn ngữ học” của ông, ở Hoa Kỳ - E. Sapir, L. Bloomfield, C. Harris, ở Cộng hòa Séc - nhà khoa học di cư người Nga N. Trubetskoy.

Các mô hình thống kê trong nghiên cứu ngôn ngữ bắt đầu được nghiên cứu bởi không ai khác ngoài người sáng lập ngành di truyền học, Georg Mendel. Chỉ đến năm 1968, các nhà ngữ văn mới phát hiện ra rằng, trong những năm cuối đời, ông rất thích nghiên cứu các hiện tượng ngôn ngữ bằng phương pháp toán học. Mendel đưa phương pháp này vào ngôn ngữ học từ sinh học; vào những năm 1990 của thế kỷ 19, chỉ những nhà ngôn ngữ học và nhà sinh vật học táo bạo nhất mới tuyên bố tính khả thi của một phân tích như vậy. Trong kho lưu trữ của tu viện St. Tomas ở Brno, nơi Mendel là trụ trì, người ta đã tìm thấy những tờ giấy có cột họ kết thúc bằng “mann”, “bauer”, “mayer”, cùng với một số phân số và phép tính. Trong nỗ lực khám phá các quy luật chính thức về nguồn gốc của họ, Mendel thực hiện các phép tính phức tạp, trong đó ông tính đến số nguyên âm và phụ âm trong tiếng Đức, tổng số từ mà ông xem xét, số lượng họ, vân vân.

Ở nước ta, ngôn ngữ học cấu trúc bắt đầu phát triển cùng thời điểm với ở phương Tây - đầu thế kỷ 19-20. Đồng thời với F. de Saussure, khái niệm ngôn ngữ như một hệ thống đã được phát triển trong các tác phẩm của giáo sư F.F. Fortunatov và I.A. Baudouin de Courtenay. Sau này đã trao đổi thư từ với de Saussure trong một thời gian dài; do đó, trường phái ngôn ngữ học Geneva và Kazan đã hợp tác với nhau. Nếu Saussure có thể được gọi là nhà tư tưởng học về các phương pháp “chính xác” trong ngôn ngữ học thì Baudouin de Courtenay đã đặt nền móng thực tiễn cho việc áp dụng chúng. Ông là người đầu tiên tách biệt ngôn ngữ học (như chính xác một ngành khoa học sử dụng các phương pháp thống kê và sự phụ thuộc chức năng) vào ngữ văn (một cộng đồng các ngành nhân đạo nghiên cứu văn hóa tâm linh thông qua ngôn ngữ và lời nói). Bản thân nhà khoa học tin rằng “ngôn ngữ học chỉ có thể hữu ích trong tương lai gần bằng cách thoát khỏi sự kết hợp bắt buộc với ngữ văn và lịch sử văn học”. Âm vị học trở thành “nơi thử nghiệm” cho việc đưa các phương pháp toán học vào ngôn ngữ học - âm thanh là “nguyên tử” của hệ thống ngôn ngữ, sở hữu một số lượng hạn chế các thuộc tính dễ đo lường, là chất liệu thuận tiện nhất cho các phương pháp mô tả hình thức, chặt chẽ. Âm vị học phủ nhận sự hiện diện của ý nghĩa trong âm thanh nên yếu tố “con người” đã bị loại bỏ trong nghiên cứu. Theo nghĩa này, âm vị giống như các vật thể vật lý hoặc sinh học.

Âm vị, với tư cách là những yếu tố ngôn ngữ nhỏ nhất được chấp nhận để nhận thức, đại diện cho một lĩnh vực riêng biệt, một “hiện thực hiện tượng học” riêng biệt. Ví dụ, trong tiếng Anh, âm "t" có thể được phát âm theo nhiều cách khác nhau, nhưng trong mọi trường hợp, người nói tiếng Anh sẽ cảm nhận nó là "t". Điều quan trọng là âm vị sẽ thực hiện chức năng chính – phân biệt nghĩa – của nó. Hơn nữa, sự khác biệt giữa các ngôn ngữ là sự đa dạng của một âm thanh trong một ngôn ngữ có thể tương ứng với các âm vị khác nhau trong ngôn ngữ khác; ví dụ: "l" và "r" khác nhau trong tiếng Anh, trong khi ở các ngôn ngữ khác, chúng là các biến thể của cùng một âm vị (như "t" trong tiếng Anh, được phát âm là bật hơi hoặc không bật hơi). Vốn từ vựng phong phú của bất kỳ ngôn ngữ tự nhiên nào cũng là tập hợp các tổ hợp của số lượng âm vị nhỏ hơn nhiều. Ví dụ, trong tiếng Anh, chỉ có 40 âm vị được sử dụng để phát âm và viết khoảng một triệu từ.

Âm thanh của một ngôn ngữ đại diện cho một tập hợp các đặc điểm được tổ chức một cách có hệ thống. Trong những năm 1920–1930, theo Saussure, Jacobson và N.S. Trubetskoy đã xác định “những đặc điểm riêng biệt” của âm vị. Những đặc điểm này dựa trên cấu trúc của cơ quan phát âm - lưỡi, răng, dây thanh âm. Giả sử, trong tiếng Anh, sự khác biệt giữa “t” và “d” là sự hiện diện hay vắng mặt của “giọng nói” (độ căng của dây thanh âm) và mức độ của giọng nói để phân biệt âm vị này với âm vị khác. Như vậy, âm vị học có thể được coi là một ví dụ về quy luật chung của ngôn ngữ được Saussure mô tả: “Trong ngôn ngữ chỉ có những khác biệt”. Điều quan trọng hơn thậm chí không phải là điều này: sự khác biệt thường bao hàm những điều kiện chính xác mà nó nằm giữa; nhưng trong ngôn ngữ chỉ có sự khác biệt mà không có điều kiện chính xác. Cho dù chúng ta xem xét “ký hiệu” hay “được biểu đạt”, không có khái niệm hay âm thanh nào trong ngôn ngữ tồn tại trước khi hệ thống ngôn ngữ phát triển.

Như vậy, trong ngôn ngữ học Saussure, hiện tượng được nghiên cứu được hiểu là một tập hợp những so sánh, đối lập của ngôn ngữ. Ngôn ngữ vừa là sự thể hiện ý nghĩa của từ, vừa là phương tiện giao tiếp và hai chức năng này không bao giờ trùng khớp với nhau. Chúng ta có thể nhận thấy sự xen kẽ giữa hình thức và nội dung: sự tương phản ngôn ngữ xác định các đơn vị cấu trúc của nó và các đơn vị này tương tác với nhau để tạo ra một nội dung có ý nghĩa nhất định. Vì các yếu tố của ngôn ngữ là ngẫu nhiên nên cả sự tương phản lẫn sự kết hợp đều không thể là cơ sở. Vì vậy, trong ngôn ngữ đặc điểm nổi bật hình thành sự tương phản về ngữ âm ở các mức độ hiểu khác nhau, âm vị được kết hợp thành hình vị, hình vị thành từ, từ thành câu, v.v. Trong mọi trường hợp, toàn bộ âm vị, từ, câu, v.v. nhiều hơn tổng các phần của nó.

Saussure đề xuất ý tưởng về một ngành khoa học mới của thế kỷ XX, tách biệt khỏi ngôn ngữ học, nghiên cứu vai trò của các dấu hiệu trong xã hội. Saussure gọi khoa học này là ký hiệu học (từ tiếng Hy Lạp “semeîon” - ký hiệu). "Khoa học" về ký hiệu học, phát triển ở Đông Âu vào những năm 1920-1930 và ở Paris trong những năm 1950-1960, đã mở rộng việc nghiên cứu ngôn ngữ và cấu trúc ngôn ngữ sang những phát hiện văn học được sáng tác (hoặc hình thành) bằng cách sử dụng các cấu trúc này. Ngoài ra, vào thời kỳ chạng vạng của sự nghiệp, song song với khóa học về ngôn ngữ học tổng quát, Saussure bắt đầu phân tích “ký hiệu học” về thơ La Mã thời kỳ cuối, cố gắng khám phá những cách đảo chữ được cố tình sáng tác cho các tên riêng. Phương pháp này về nhiều mặt trái ngược với chủ nghĩa duy lý trong phân tích ngôn ngữ của nó: đó là một nỗ lực nghiên cứu trong một hệ thống vấn đề "xác suất" trong ngôn ngữ. Nghiên cứu như vậy giúp tập trung vào “khía cạnh vật chất” của xác suất; “từ khóa”, một phép đảo chữ mà Saussure đang tìm kiếm, như Jean Starobinsky lập luận, “một công cụ dành cho nhà thơ, chứ không phải nguồn sống của bài thơ”. Bài thơ có tác dụng đảo ngược âm thanh của từ khóa. Theo Starobinsky, trong bài phân tích này "Saussure không đi sâu vào việc tìm kiếm những ý nghĩa ẩn giấu." Ngược lại, trong các tác phẩm của ông có một mong muốn rõ ràng là tránh những vấn đề liên quan đến ý thức: “vì thơ không chỉ được thể hiện bằng lời nói mà còn ở những gì những từ này tạo ra, nó vượt ra ngoài tầm kiểm soát của ý thức và chỉ phụ thuộc vào quy luật.” của ngôn ngữ” (xem Phụ lục 1).

Nỗ lực nghiên cứu tên riêng trong thơ La Mã thời kỳ cuối của Saussure nhấn mạnh một trong những thành phần trong phân tích ngôn ngữ của ông - bản chất độc đoán của các dấu hiệu, cũng như bản chất hình thức của ngôn ngữ học Saussure, vốn loại trừ khả năng phân tích ý nghĩa. Todorov kết luận rằng ngày nay các tác phẩm của Saussure dường như nhất quán một cách bất thường ở chỗ chúng miễn cưỡng nghiên cứu các biểu tượng của một hiện tượng có ý nghĩa được xác định rõ ràng [Phụ lục 1]. Khi nghiên cứu đảo chữ, Saussure chỉ chú ý đến sự lặp lại mà không chú ý đến các biến thể trước đó. . . . Khi nghiên cứu Nibelungenlied, ông chỉ xác định các ký hiệu để gán chúng cho những cách đọc sai: nếu chúng vô tình, thì các ký hiệu đó không tồn tại. Rốt cuộc, trong các bài viết của mình về ngôn ngữ học đại cương, ông gợi ý về sự tồn tại của một ký hiệu học mô tả nhiều thứ hơn là chỉ các dấu hiệu ngôn ngữ; nhưng giả định này bị hạn chế bởi thực tế là ký hiệu học chỉ có thể mô tả các dấu hiệu ngẫu nhiên, tùy ý.

Nếu thực sự là như vậy thì đó chỉ là do anh ta không thể tưởng tượng được “ý định” nếu không có đối tượng; ông không thể vượt qua hoàn toàn khoảng cách giữa hình thức và nội dung - trong các tác phẩm của ông, điều này đã trở thành một câu hỏi. Thay vào đó, ông kêu gọi “tính hợp pháp về mặt ngôn ngữ”. Một mặt, nằm giữa các khái niệm thế kỷ 19 dựa trên lịch sử và phỏng đoán chủ quan, với các phương pháp diễn giải ngẫu nhiên dựa trên các khái niệm này, và mặt khác, các khái niệm cấu trúc luận xóa bỏ sự đối lập giữa hình thức và nội dung (chủ đề và tượng), ý nghĩa và nguồn gốc của chủ nghĩa cấu trúc, phân tâm học và thậm chí cả cơ học lượng tử, các tác phẩm về ngôn ngữ học và ký hiệu học của Ferdinand de Saussure đánh dấu một bước ngoặt trong việc nghiên cứu ý nghĩa trong ngôn ngữ và văn hóa.

Các nhà khoa học Nga cũng có đại diện tại Hội nghị lần thứ nhất đại hội quốc tế nhà ngôn ngữ học ở The Hague năm 1928. S. Kartsevsky, R. Yakobson và N. Trubetskoy đã đưa ra một báo cáo trong đó họ cho rằng cấu trúc phân cấp ngôn ngữ - theo tinh thần của những ý tưởng hiện đại nhất vào đầu thế kỷ trước. Jacobson trong các tác phẩm của mình đã phát triển ý tưởng của Saussure rằng các yếu tố cơ bản của ngôn ngữ cần được nghiên cứu, trước hết, liên quan đến chức năng của chúng chứ không phải lý do xuất hiện của chúng.

Thật không may, sau khi Stalin lên nắm quyền vào năm 1924, ngôn ngữ học trong nước, giống như nhiều ngành khoa học khác, đã bị đẩy lùi. Nhiều nhà khoa học tài năng bị buộc phải di cư, bị trục xuất khỏi đất nước hoặc chết trong trại. Chỉ từ giữa những năm 1950, một số lý thuyết đa nguyên mới trở thành hiện thực - nhiều hơn về điều này ở phần 1.2.

1.2 Ứng dụng phương pháp toán học trong ngôn ngữ học nửa sau thế kỷ XX

Đến giữa thế kỷ XX, bốn trường phái ngôn ngữ học thế giới đã hình thành, mỗi trường phái đều là tổ tiên của một phương pháp “chính xác” nhất định. Trường âm vị học Leningrad(người sáng lập nó là L.V. Shcherba, sinh viên của Baudouin de Courtenay) đã sử dụng một thí nghiệm tâm lý học dựa trên phân tích lời nói của người bản xứ làm tiêu chí chính để khái quát hóa âm thanh dưới dạng âm vị.

Các nhà khoa học Vòng tròn ngôn ngữ Praha, đặc biệt – người sáng lập N.S. Trubetskoy, người di cư từ Nga, đã phát triển lý thuyết về sự đối lập - cấu trúc ngữ nghĩa của ngôn ngữ được họ mô tả như một tập hợp các đơn vị ngữ nghĩa được xây dựng đối lập nhau - các họ. Lý thuyết này được sử dụng trong nghiên cứu không chỉ ngôn ngữ mà còn cả văn hóa nghệ thuật.

Các nhà tư tưởng chủ nghĩa mô tả Mỹ có nhà ngôn ngữ học L. Bloomfield và E. Sapir. Ngôn ngữ được giới thiệu với các nhà mô tả như một tập hợp các cách phát âm, là đối tượng nghiên cứu chính của họ. Trọng tâm của họ là các quy tắc mô tả khoa học (do đó có tên như vậy) của văn bản: nghiên cứu về tổ chức, sắp xếp và phân loại các yếu tố của chúng. Việc chính thức hóa các quy trình phân tích trong lĩnh vực âm vị học và hình thái học (phát triển các nguyên tắc nghiên cứu ngôn ngữ ở các cấp độ khác nhau, phân tích phân bố, phương pháp thành phần trực tiếp, v.v.) đã dẫn đến việc hình thành các câu hỏi chung về mô hình ngôn ngữ. Việc không chú ý đến kế hoạch nội dung của ngôn ngữ, cũng như khía cạnh nghịch lý của ngôn ngữ, đã không cho phép các nhà mô tả giải thích đầy đủ ngôn ngữ như một hệ thống.

Vào những năm 1960, lý thuyết về ngữ pháp hình thức đã phát triển, nảy sinh chủ yếu nhờ các tác phẩm của nhà triết học và ngôn ngữ học người Mỹ N. Chomsky. Ông được coi là một trong những nhà khoa học hiện đại và nhân vật của công chúng nổi tiếng nhất; nhiều bài báo, chuyên khảo và thậm chí cả một bộ phim tài liệu dài tập được dành riêng cho ông. Sau cách mô tả cấu trúc cú pháp mới về cơ bản do Chomsky phát minh - ngữ pháp tạo sinh (sáng tạo) - phong trào tương ứng trong ngôn ngữ học được gọi là chủ nghĩa sáng tạo.

Chomsky, hậu duệ của những người nhập cư từ Nga, học ngôn ngữ học, toán học và triết học tại Đại học Pennsylvania từ năm 1945, chịu ảnh hưởng mạnh mẽ từ thầy Zelig Harris - giống như Harris, Chomsky xem xét và coi quan điểm chính trị của mình gần với chủ nghĩa vô chính phủ (ông vẫn được biết đến là người theo chủ nghĩa vô chính phủ). là nhà phê bình hệ thống chính trị hiện tại của Hoa Kỳ và là một trong những nhà lãnh đạo tinh thần chống chủ nghĩa toàn cầu).

Công trình khoa học quan trọng đầu tiên của Chomsky, luận án thạc sĩ của ông “Hình thái học của tiếng Do Thái hiện đại” » (1951), vẫn chưa được xuất bản. tiến sĩ Chomsky theo học tại Đại học Pennsylvania vào năm 1955, nhưng hầu hết các nghiên cứu đều làm nền tảng cho luận án của ông (chỉ được xuất bản đầy đủ vào năm 1975 với tựa đề “Cấu trúc logic của lý thuyết ngôn ngữ”) và chuyên khảo đầu tiên của ông, “Cú pháp”. Structures” (Cấu trúc cú pháp, 1957, bản dịch tiếng Nga) 1962), được trình diễn tại Đại học Harvard vào năm 1951–1955. Cùng năm 1955, nhà khoa học chuyển đến Viện Công nghệ Massachusetts, nơi ông trở thành giáo sư vào năm 1962.

Trong quá trình phát triển, lý thuyết của Chomsky đã trải qua nhiều giai đoạn.

Trong chuyên khảo đầu tiên của mình, “Cấu trúc cú pháp”, nhà khoa học đã trình bày ngôn ngữ như một cơ chế tạo ra vô số câu bằng cách sử dụng một tập hợp hữu hạn các phương tiện ngữ pháp. Để mô tả các đặc tính ngôn ngữ, ông đề xuất các khái niệm về cấu trúc ngữ pháp sâu (ẩn khỏi nhận thức trực tiếp và được tạo ra bởi một hệ thống đệ quy, tức là các quy tắc có thể được áp dụng nhiều lần) và cấu trúc ngữ pháp bề mặt (nhận thức trực tiếp), cũng như các phép biến đổi mô tả sự chuyển đổi từ cấu trúc sâu tới cấu trúc bề mặt. Một cấu trúc sâu có thể tương ứng với một số cấu trúc bề mặt (ví dụ: cấu trúc thụ động Sắc lệnh được Chủ tịch nước ký bắt nguồn từ cấu trúc sâu giống như cấu trúc hoạt động Tổng thống ký sắc lệnh) và ngược lại (vì vậy, sự mơ hồ Mẹ yêu con gáiđược mô tả là kết quả của sự trùng hợp của các cấu trúc bề mặt quay trở lại hai cấu trúc sâu sắc khác nhau, một bên là mẹ là người yêu con gái và bên kia là người con gái yêu).

Lý thuyết tiêu chuẩn của Chomsky là mô hình Các khía cạnh, được trình bày trong cuốn sách Các khía cạnh của lý thuyết cú pháp của Chomsky. Trong mô hình này, các quy tắc giải thích ngữ nghĩa gán ý nghĩa cho các cấu trúc sâu sắc lần đầu tiên được đưa vào lý thuyết hình thức. Trong “Các khía cạnh”, năng lực ngôn ngữ trái ngược với việc sử dụng ngôn ngữ (hiệu suất), cái gọi là giả thuyết Katz-Postal về việc bảo tồn ý nghĩa trong quá trình chuyển đổi đã được thông qua, và do đó khái niệm về chuyển đổi tùy chọn bị loại trừ, và một bộ máy của các tính năng cú pháp mô tả khả năng tương thích từ vựng được giới thiệu.

Vào những năm 1970, Chomsky nghiên cứu lý thuyết về kiểm soát và ràng buộc (lý thuyết GB - từ chữ chính phủràng buộc) – tổng quát hơn cái trước. Trong đó, nhà khoa học đã bỏ đi những quy tắc cụ thể mô tả cấu trúc cú pháp của các ngôn ngữ cụ thể. Tất cả các phép biến đổi đã được thay thế bằng một phép biến đổi chiêu thức phổ quát. Trong khuôn khổ lý thuyết GB, cũng có các mô-đun riêng, mỗi mô-đun chịu trách nhiệm về một phần ngữ pháp riêng của mình.

Gần đây nhất là năm 1995, Chomsky đã đưa ra một chương trình tối giản trong đó ngôn ngữ của con người được mô tả là tương tự như ngôn ngữ máy. Đây chỉ là một chương trình - không phải là một mô hình hay một lý thuyết. Trong đó, Chomsky xác định hai hệ thống con chính của bộ máy ngôn ngữ của con người: từ vựng và hệ thống máy tính, cũng như hai giao diện - ngữ âm và logic.

Các ngữ pháp chính thức của Chomsky đã trở thành kinh điển để mô tả không chỉ các ngôn ngữ tự nhiên mà còn cả ngôn ngữ nhân tạo - đặc biệt là ngôn ngữ lập trình. Sự phát triển của ngôn ngữ học cấu trúc trong nửa sau thế kỷ XX có thể được coi một cách chính đáng là một “cuộc cách mạng Chomsky”.

Trường âm vị Moscow, đại diện của họ là A.A. Reformasky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, đã sử dụng lý thuyết tương tự để nghiên cứu ngữ âm. Dần dần, các phương pháp “chính xác” bắt đầu được áp dụng không chỉ cho ngữ âm mà còn cho cả cú pháp. Cả các nhà ngôn ngữ học và toán học, cả trong và ngoài nước, đều đang bắt đầu nghiên cứu cấu trúc của ngôn ngữ. Vào những năm 1950-60, một giai đoạn mới trong sự tương tác giữa toán học và ngôn ngữ học bắt đầu ở Liên Xô, gắn liền với sự phát triển của hệ thống dịch máy.

Động lực cho sự khởi đầu của công việc này ở nước ta là những phát triển đầu tiên trong lĩnh vực dịch máy ở Hoa Kỳ (mặc dù thiết bị dịch cơ giới hóa đầu tiên của P.P. Smirnov-Troyansky đã được phát minh ở Liên Xô vào năm 1933, nhưng nó vẫn còn thô sơ, chưa được phổ biến rộng rãi). Năm 1947, A. Butt và D. Britten nghĩ ra mã dịch từng từ bằng máy tính; một năm sau, R. Richens đề xuất quy tắc chia từ thành thân và đuôi trong dịch máy. Những năm đó khá khác biệt so với những năm hiện đại. Đây là những cỗ máy rất lớn và đắt tiền, chiếm toàn bộ phòng và cần một lượng lớn kỹ sư, người vận hành và lập trình viên để bảo trì. Về cơ bản, những máy tính này được sử dụng để thực hiện các phép tính toán học cho nhu cầu của các tổ chức quân sự - những điều mới trong toán học, vật lý và công nghệ, trước hết phục vụ cho các vấn đề quân sự. Trong giai đoạn đầu, sự phát triển của MP được quân đội hỗ trợ tích cực, trong khi (trong Chiến tranh Lạnh) hướng Nga-Anh phát triển ở Hoa Kỳ và hướng Anh-Nga ở Liên Xô.

Vào tháng 1 năm 1954, “Thí nghiệm Georgetown” diễn ra tại Đại học Kỹ thuật Massachusetts - cuộc trình diễn công khai đầu tiên về dịch thuật từ tiếng Nga sang tiếng Anh trên máy IBM-701. Tóm tắt thông điệp về việc hoàn thành thành công thử nghiệm của D.Yu. Panov, xuất hiện trên Tạp chí Toán học Nga, 1954, số 10: “Dịch từ ngôn ngữ này sang ngôn ngữ khác bằng máy: báo cáo về bài kiểm tra thành công đầu tiên”.

D. Yu. Panov (lúc đó là giám đốc Viện Thông tin Khoa học - INI, sau này là VINITI) đã thu hút I. K. Belskaya về làm việc về dịch máy, người sau này đứng đầu nhóm dịch máy tại Viện Toán học Chính xác và Khoa học Máy tính của Viện. Viện Hàn lâm Khoa học Liên Xô. Trải nghiệm dịch thuật đầu tiên từ tiếng Anh sang tiếng Nga bằng máy BESM bắt đầu từ cuối năm 1955. Các chương trình BESM được biên soạn bởi N.P. Trifonov và L.N. Korolev, luận án tiến sĩ của ông tập trung vào các phương pháp xây dựng từ điển cho dịch máy.

Song song, công việc dịch máy được thực hiện tại Khoa Toán ứng dụng của Viện Toán học thuộc Viện Hàn lâm Khoa học Liên Xô (nay là Viện Toán ứng dụng M.V. Keldysh của Viện Hàn lâm Khoa học Nga). Theo sáng kiến ​​​​của nhà toán học A.A. Lyapunova. Ông đã lôi kéo sinh viên tốt nghiệp của Viện Toán học Steklov O.S. vào công việc dịch các văn bản bằng máy Strela từ tiếng Pháp sang tiếng Nga. Kulagin và các học trò của ông T.D. Ventzel và N.N. Ricco. Ý tưởng của Lyapunov và Kulagina về khả năng sử dụng công nghệ để dịch từ ngôn ngữ này sang ngôn ngữ khác đã được công bố trên tạp chí Nature, 1955, số 8. Từ cuối năm 1955, họ có sự tham gia của T.N. Moloshnaya, người sau đó đã bắt đầu nghiên cứu độc lập về thuật toán dịch thuật tiếng Anh-Nga.

R. Frumkina, người vào thời điểm đó đang tham gia dịch thuật thuật từ tiếng Tây Ban Nha, nhớ lại rằng ở giai đoạn này của công việc, rất khó để thực hiện bất kỳ bước nhất quán nào. Tôi thường xuyên phải tuân theo trải nghiệm tự khám phá - của chính tôi hoặc đồng nghiệp của tôi.

Tuy nhiên, thế hệ đầu tiên của hệ thống dịch máy rất không hoàn hảo. Tất cả đều dựa trên các thuật toán dịch liên tiếp “từng từ”, “từng cụm từ” - các mối liên hệ ngữ nghĩa giữa các từ và câu không được tính đến dưới bất kỳ hình thức nào. Ví dụ: có thể cho các câu sau: “ John đang tìm hộp đồ chơi của mình.Cuối cùng anh đã tìm thấy nó. Chiếc hộp nằm trong chiếc bút.John đã rất hạnh phúc. (John đang tìm hộp đồ chơi của mình. Cuối cùng anh ấy đã tìm thấy nó. Chiếc hộp nằm trong cũi. John rất vui.).” “Bút” trong ngữ cảnh này không phải là “bút” (dụng cụ viết), mà là “bút chơi” ( bút chơi). Kiến thức về từ đồng nghĩa, trái nghĩa và nghĩa bóng rất khó để nhập vào máy tính. Một hướng đi đầy hứa hẹn là phát triển các hệ thống máy móc nhằm mục đích sử dụng cho người phiên dịch.

Theo thời gian, hệ thống dịch trực tiếp đã được thay thế bằng hệ thống T (từ tiếng Anh “chuyển” - chuyển đổi), trong đó việc dịch thuật được thực hiện ở cấp độ cấu trúc cú pháp. Các thuật toán T-system đã sử dụng cơ chế cho phép xây dựng cấu trúc cú pháp theo các quy tắc ngữ pháp của ngôn ngữ đầu vào (tương tự như cách người ta dạy ngoại ngữ ở trường phổ thông), sau đó tổng hợp câu đầu ra, chuyển đổi cấu trúc cú pháp và thay thế các từ cần thiết trong từ điển.

Lyapunov nói về dịch thuật bằng cách trích xuất ý nghĩa của văn bản dịch và trình bày nó bằng ngôn ngữ khác. Cách tiếp cận để xây dựng hệ thống dịch máy dựa trên việc thu được biểu diễn ngữ nghĩa của câu đầu vào thông qua phân tích ngữ nghĩa và tổng hợp câu đầu vào dựa trên biểu diễn ngữ nghĩa thu được vẫn được coi là tiên tiến nhất. Những hệ thống như vậy được gọi là hệ thống I (từ chữ “interlingua”). Tuy nhiên, nhiệm vụ tạo ra chúng, được đặt ra từ cuối những năm 50 và đầu những năm 60, vẫn chưa được giải quyết triệt để, bất chấp nỗ lực của Liên đoàn Quốc tế IFIP, một cộng đồng toàn cầu gồm các nhà khoa học trong lĩnh vực xử lý thông tin.

Các nhà khoa học đã nghĩ đến việc làm thế nào để chính thức hóa và xây dựng các thuật toán để làm việc với văn bản, những từ điển nào nên được nhập vào máy, những mẫu ngôn ngữ nào nên được sử dụng trong dịch máy. Ngôn ngữ học truyền thống không có những ý tưởng như vậy - không chỉ về mặt ngữ nghĩa mà còn về mặt cú pháp. Không có ngôn ngữ nào vào thời điểm đó có danh sách các cấu trúc cú pháp, các điều kiện về tính tương thích và khả năng thay thế lẫn nhau của chúng không được nghiên cứu và các quy tắc xây dựng các đơn vị cấu trúc cú pháp lớn từ các yếu tố cấu thành nhỏ hơn không được phát triển.

Nhu cầu tạo dựng nền tảng lý thuyết cho dịch máy đã dẫn tới sự hình thành và phát triển của ngôn ngữ học toán học. Vai trò chủ đạo trong vấn đề này ở Liên Xô do các nhà toán học A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, nhà ngôn ngữ học V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformasky, I.A. Melchuk, V.V. Ivanov. Luận án của Kulagina tập trung nghiên cứu lý thuyết hình thức về ngữ pháp (đồng thời với N. Chomsky ở Hoa Kỳ), Kuznetsov đưa ra vấn đề tiên đề hóa ngôn ngữ học, quay trở lại các công trình của F.F. Fortunatova.

Vào ngày 6 tháng 5 năm 1960, Nghị quyết của Đoàn chủ tịch Viện Hàn lâm Khoa học Liên Xô “Về sự phát triển các phương pháp cấu trúc và toán học trong nghiên cứu ngôn ngữ” đã được thông qua và các bộ phận tương ứng được thành lập tại Viện Ngôn ngữ học và Viện Ngôn ngữ Nga. Từ năm 1960, các trường đại học nhân đạo hàng đầu của đất nước - Khoa Ngữ văn của Đại học Quốc gia Moscow, Đại học Leninrad, Novosibirsk, Học viện Sư phạm Ngoại ngữ Quốc gia Moscow - bắt đầu đào tạo nhân sự trong lĩnh vực xử lý văn bản tự động.

Tuy nhiên, công việc dịch máy từ thời kỳ này, được gọi là thời kỳ “cổ điển”, mang tính lý thuyết hơn là thực tiễn. Các hệ thống dịch máy tiết kiệm chi phí chỉ bắt đầu được tạo ra vào những năm 80 của thế kỷ trước. Tôi sẽ nói về vấn đề này sau, trong phần 2.1, “Dịch máy”.

Những năm 1960 và 70 bao gồm những phát triển lý thuyết sâu sắc bằng cách sử dụng các phương pháp lý thuyết tập hợp và logic toán học, chẳng hạn như lý thuyết trường và lý thuyết tập mờ.

Tác giả của lý thuyết trường trong ngôn ngữ học là nhà thơ, dịch giả và nhà ngôn ngữ học Liên Xô V.G. khuyên răn. Ban đầu ông phát triển lý thuyết của mình trên cơ sở tiếng Đức. Trong Admoni, khái niệm “trường” biểu thị một tập hợp các phần tử ngôn ngữ tùy ý, không trống (ví dụ: “trường từ vựng”, “trường ngữ nghĩa”).

Cấu trúc của trường không đồng nhất: nó bao gồm lõi, các phần tử trong đó có tập hợp đầy đủ các đặc điểm xác định tập hợp và ngoại vi, các phần tử có thể có cả hai đặc điểm của một tập hợp nhất định (không phải tất cả) và những người lân cận. Hãy để tôi đưa ra một ví dụ để minh họa cho nhận định này: chẳng hạn, trong tiếng Anh, trường từ phức tạp (“giấc mơ ban ngày” - “giấc mơ” rất khó tách khỏi trường cụm từ (“hơi cay”).

Lý thuyết tập mờ nêu trên có liên quan chặt chẽ với lý thuyết trường. Ở Liên Xô, việc chứng minh nó được thực hiện bởi các nhà ngôn ngữ học V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, nhưng người sáng lập ra nó lại là nhà toán học người Mỹ L. Zade, người đã xuất bản bài báo “Logic mờ” vào năm 1965. Đưa ra sự chứng minh toán học cho lý thuyết về tập mờ, Zadeh xem xét chúng bằng cách sử dụng vật liệu ngôn ngữ.

Trong lý thuyết này, chúng ta không nói nhiều về sự thuộc về của các phần tử đối với một tập hợp nhất định (AÎa), mà là về mức độ thành viên (mAÎa), vì các phần tử ngoại vi có thể, ở mức độ này hay mức độ khác, thuộc về một số trường. Zade (Lofti-zade) là người gốc Azerbaijan, cho đến năm 12 tuổi anh đã thực hành giao tiếp bằng bốn thứ tiếng - tiếng Azerbaijan, tiếng Nga, tiếng Anh và tiếng Ba Tư - và sử dụng ba bảng chữ cái khác nhau: Cyrillic, Latin, Ả Rập. Khi một nhà khoa học được hỏi lý thuyết tập mờ và ngôn ngữ học có điểm gì chung, ông không phủ nhận mối liên hệ này mà nói rõ: “Tôi không chắc việc nghiên cứu những ngôn ngữ này có ảnh hưởng lớn đến suy nghĩ của tôi hay không. Nếu điều này xảy ra, có lẽ nó diễn ra trong tiềm thức.” Khi còn trẻ, Zadeh học ở Tehran tại một trường Trưởng lão, và sau Thế chiến thứ hai di cư sang Hoa Kỳ. “Câu hỏi không phải là liệu tôi là người Mỹ, người Nga, người Azerbaijan hay ai khác,” anh nói trong một cuộc trò chuyện, “Tôi được hình thành bởi tất cả các nền văn hóa và dân tộc này và cảm thấy khá thoải mái khi ở giữa mỗi người trong số họ.” Trong những từ này có điều gì đó giống với đặc điểm của lý thuyết về tập mờ - khác xa với những định nghĩa rõ ràng và những phạm trù rõ ràng.

Ở nước ta, vào những năm 70, các tác phẩm của các nhà ngôn ngữ học phương Tây thế kỷ 20 đã được dịch và nghiên cứu. I.A. Melchuk đã dịch các tác phẩm của N. Chomsky sang tiếng Nga. N.A. Slyusareva trong cuốn sách “Lý thuyết của F. de Saussure dưới ánh sáng của ngôn ngữ học hiện đại” đã kết nối các định đề trong giảng dạy của Saussure với các vấn đề ngôn ngữ học hiện tại của thập niên 70. Đang có một xu hướng mới nổi hướng tới việc toán học hóa ngôn ngữ học sâu hơn. Các trường đại học hàng đầu trong nước cung cấp đào tạo về chuyên ngành “Ngôn ngữ học toán học (lý thuyết, ứng dụng)”. Đồng thời, ở phương Tây đang có bước phát triển vượt bậc về công nghệ máy tính, đòi hỏi nền tảng ngôn ngữ ngày càng mới.

Vì vậy, trong suốt thế kỷ 20 đã có sự hội tụ của các ngành khoa học chính xác và nhân văn. Sự tương tác của toán học với ngôn ngữ học ngày càng được ứng dụng thực tế. Thông tin thêm về điều này trong chương tiếp theo.

Chương 2. Những ví dụ chọn lọc về ứng dụng toán học trong ngôn ngữ học

2.1 Dịch máy

Ý tưởng dịch từ ngôn ngữ này sang ngôn ngữ khác bằng cơ chế phổ quát đã nảy sinh sớm hơn vài thế kỷ so với những phát triển đầu tiên trong lĩnh vực này - vào năm 1649, Rene Descartes đã đề xuất ý tưởng về một ngôn ngữ trong đó các ý tưởng tương đương của các ngôn ngữ khác nhau ​sẽ được thể hiện bằng một ký hiệu duy nhất. Những nỗ lực đầu tiên để thực hiện ý tưởng này vào những năm 1930-40, sự khởi đầu của sự phát triển lý thuyết vào giữa thế kỷ này, sự cải tiến của hệ thống dịch thuật sử dụng công nghệ trong những năm 1970-80, sự phát triển nhanh chóng của công nghệ dịch thuật trong thập kỷ qua - những nỗ lực này là những giai đoạn phát triển của dịch máy như một ngành công nghiệp. Chính nhờ công việc dịch máy mà ngôn ngữ học tính toán đã phát triển như một môn khoa học.

Với sự phát triển của công nghệ máy tính vào cuối những năm 70 và đầu những năm 80, các nhà nghiên cứu đặt ra cho mình những mục tiêu thực tế hơn và tiết kiệm chi phí hơn - máy móc không trở thành đối thủ cạnh tranh (như giả định trước đây) mà trở thành trợ lý cho người phiên dịch. Dịch máy không còn phục vụ riêng cho mục đích quân sự (tất cả các phát minh và nghiên cứu của Liên Xô và Mỹ, tập trung chủ yếu vào tiếng Nga và tiếng Anh, đã góp phần vào Chiến tranh Lạnh ở mức độ này hay mức độ khác). Năm 1978, các từ ngôn ngữ tự nhiên được truyền qua mạng Arpa và sáu năm sau, chương trình dịch thuật đầu tiên cho máy vi tính xuất hiện ở Hoa Kỳ.

Vào những năm 70, Ủy ban Cộng đồng Châu Âu đã mua phiên bản tiếng Anh-Pháp của máy dịch Systran, đặt hàng cả phiên bản Pháp-Anh và Ý-Anh cũng như hệ thống dịch Nga-Anh được Lực lượng Vũ trang Hoa Kỳ sử dụng. Đây là cách đặt nền móng cho dự án EUROTRA.

Về sự hồi sinh của dịch máy vào những năm 70-80. Các sự kiện sau đây chỉ ra: Ủy ban Cộng đồng Châu Âu (CEC) mua phiên bản Systran tiếng Anh-Pháp, cũng như hệ thống dịch từ tiếng Nga sang tiếng Anh (hệ thống sau được phát triển sau báo cáo ALPAC và tiếp tục được US Air sử dụng Lực lượng và NASA); Ngoài ra, CEC còn ủy quyền phát triển các phiên bản tiếng Pháp-Anh và tiếng Ý-Anh. Đồng thời, có sự mở rộng nhanh chóng các hoạt động tạo ra hệ thống dịch máy tại Nhật Bản; tại Hoa Kỳ, Tổ chức Y tế Liên Mỹ (PAHO) ra lệnh phát triển hướng Tây Ban Nha-Anh (hệ thống SPANAM); Lực lượng Không quân Hoa Kỳ đang tài trợ cho việc phát triển hệ thống dịch máy tại Trung tâm Nghiên cứu Ngôn ngữ học tại Đại học Texas ở Austin; Nhóm TAUM ở Canada đang đạt được tiến bộ đáng kể trong việc phát triển hệ thống METEO (để dịch các báo cáo thời tiết). Một số dự án bắt đầu vào những năm 70-80. sau đó được phát triển thành các hệ thống thương mại chính thức.

Trong giai đoạn 1978-1993, Hoa Kỳ đã chi 20 triệu đô la cho nghiên cứu lĩnh vực dịch máy, 70 triệu đô la ở châu Âu và 200 triệu đô la ở Nhật Bản.

Một trong những phát triển mới là công nghệ TM (bộ nhớ dịch), hoạt động theo nguyên tắc tích lũy: trong quá trình dịch, đoạn gốc (câu) và bản dịch của nó được lưu lại, dẫn đến hình thành cơ sở dữ liệu ngôn ngữ; Nếu tìm thấy một đoạn giống hệt hoặc tương tự với bản gốc trong văn bản mới dịch, nó sẽ được hiển thị cùng với bản dịch và chỉ báo phần trăm khớp. Sau đó, người dịch sẽ đưa ra quyết định (sửa, từ chối hoặc chấp nhận bản dịch), kết quả được hệ thống lưu trữ nên không cần phải dịch cùng một câu hai lần. Hiện nay, nhà phát triển hệ thống thương mại nổi tiếng dựa trên công nghệ TM là hệ thống TRADOS (thành lập năm 1984).

Hiện nay, có hàng chục công ty đang phát triển hệ thống dịch máy thương mại, bao gồm: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Phần mềm Ata; Lingvistica b.v. v.v. Hiện nay có thể sử dụng dịch vụ của trình dịch tự động trực tiếp trên Web: alphaWorks; Trình dịch trực tuyến của PROMT; LogoMedia.net; Dịch vụ dịch thuật Babel Fish của AltaVista; InfiniT.com; Dịch Internet.

Hệ thống dịch thuật có hiệu quả về mặt thương mại xuất hiện vào nửa cuối thập niên 80 ở nước ta. Khái niệm dịch máy đã được mở rộng (nó bắt đầu bao gồm “việc tạo ra một số hệ thống và thiết bị tự động và tự động thực hiện tự động hoặc bán tự động toàn bộ chu trình dịch thuật hoặc các nhiệm vụ riêng lẻ trong cuộc đối thoại với một người”), và phân bổ của chính phủ cho sự phát triển của ngành công nghiệp này đã tăng lên.

Ngôn ngữ chính của hệ thống dịch thuật trong nước là tiếng Nga, tiếng Anh, tiếng Đức, tiếng Pháp và tiếng Nhật. Trung tâm dịch thuật toàn Liên minh (VTsP) đã phát triển hệ thống dịch từ tiếng Anh và tiếng Đức sang tiếng Nga trên máy tính EC-1035 - ANRAP. Nó bao gồm ba từ điển - nhập tiếng Anh và tiếng Đức và đầu ra tiếng Nga - trong một phần mềm duy nhất. Có một số từ điển chuyên ngành có thể hoán đổi cho nhau - về công nghệ máy tính, lập trình, điện tử vô tuyến, cơ khí, nông nghiệp, luyện kim. Hệ thống có thể hoạt động ở hai chế độ - tự động và tương tác, khi màn hình hiển thị văn bản nguồn và bản dịch, từng cụm từ mà một người có thể chỉnh sửa. Tốc độ dịch văn bản sang ANRAP (từ khi bắt đầu đánh máy đến khi kết thúc in) là khoảng 100 trang/giờ.

Năm 1989, một nhóm dịch giả thương mại như SPRINT được thành lập, làm việc với tiếng Nga, tiếng Anh, tiếng Đức và tiếng Nhật. Ưu điểm chính của chúng là khả năng tương thích với PC IBM - do đó các hệ thống dịch máy trong nước đã đạt đến chất lượng quốc tế. Đồng thời, hệ thống dịch máy từ tiếng Pháp sang tiếng Nga FRAP đang được phát triển, bao gồm 4 giai đoạn phân tích văn bản: đồ họa, hình thái, cú pháp và ngữ nghĩa. Trong Học viện sư phạm bang Leningrad được đặt theo tên. Herzen đang làm việc trên hệ thống bốn ngôn ngữ (Anh, Pháp, Tây Ban Nha, Nga) SILOD-MP (từ điển Anh-Nga và Pháp-Nga được sử dụng trong chế độ công nghiệp.

Để dịch các văn bản chuyên ngành về kỹ thuật điện, đã có hệ thống ETAP-2. Việc phân tích văn bản đầu vào trong đó được thực hiện ở hai cấp độ - hình thái và cú pháp. Từ điển ETAP-2 chứa khoảng 4 nghìn mục; giai đoạn chuyển đổi văn bản - khoảng 1000 quy tắc (96 quy tắc chung, 342 quy tắc riêng, còn lại là từ điển). Tất cả điều này đảm bảo chất lượng dịch đạt yêu cầu (ví dụ, tiêu đề của bằng sáng chế “Thiết bị ghép và sắp xếp lưới pha quang học có cách sắp xếp như vậy” được dịch là “Thiết bị sắp xếp và ghép lưới pha quang học với một thiết bị như vậy” - bất chấp thuật ngữ lặp, nghĩa được giữ nguyên).

Tại Viện Ngoại ngữ Sư phạm Minsk, một hệ thống dịch tiêu đề máy đã được phát minh trên cơ sở từ điển các dạng từ và cụm từ tiếng Anh-Nga), và tại Viện Nghiên cứu Phương Đông của Viện Hàn lâm Khoa học, một hệ thống dịch thuật từ tiếng Nhật sang tiếng Nga đã được phát minh. Dịch vụ từ điển và thuật ngữ tự động đầu tiên (SLOTERM) dành cho công nghệ và lập trình máy tính, được tạo ra tại Viện Nghiên cứu Hệ thống Tự động hóa Moscow, chứa khoảng 20.000 thuật ngữ trong từ điển giải thích và từ điển đặc biệt cho việc nghiên cứu ngôn ngữ.

Hệ thống dịch máy dần dần bắt đầu được sử dụng không chỉ cho mục đích đã định mà còn là một thành phần quan trọng của hệ thống học tự động (để dạy dịch, theo dõi kiến ​​thức chính tả và ngữ pháp).

Thập niên 90 kéo theo sự phát triển nhanh chóng của thị trường PC (từ máy tính để bàn đến loại bỏ túi) và công nghệ thông tin cũng như việc sử dụng rộng rãi Internet (ngày càng trở nên quốc tế và đa ngôn ngữ). Tất cả điều này làm cho nó trở nên phổ biến phát triển hơn nữa hệ thống dịch tự động. Từ đầu những năm 1990. Các nhà phát triển trong nước cũng đang tham gia vào thị trường hệ thống PC.

Vào tháng 7 năm 1990, tại triển lãm Diễn đàn PC ở Moscow, lần đầu tiên ở Nga hệ thống thương mại dịch máy có tên PROMT (Dịch máy của PROgrammer). Năm 1991, CJSC PROJECT MT được thành lập và vào năm 1992, công ty PROMT đã giành chiến thắng trong cuộc thi của NASA về việc cung cấp hệ thống MP (PROMT là công ty duy nhất không phải của Mỹ trong cuộc thi này) Năm 1992, PROMT đã phát hành cả một dòng hệ thống dưới tên mới STYLUS để dịch từ tiếng Anh, tiếng Đức, tiếng Pháp, tiếng Ý và tiếng Tây Ban Nha sang tiếng Nga và từ tiếng Nga sang tiếng Anh, và vào năm 1993, hệ thống đầu tiên được tạo ra trên cơ sở STYLUS. hệ thống dịch máy thế giới dành cho Windows. Năm 1994, phiên bản STYLUS 2.0 được phát hành cho Windows 3.X/95/NT, và vào năm 1995-1996, thế hệ thứ ba của hệ thống dịch máy, STYLUS 3.0 đầy đủ 32-bit cho Windows 95/NT, được giới thiệu, đồng thời, việc phát triển các hệ thống dịch máy Nga-Đức và Nga-Pháp hoàn toàn mới, đầu tiên trên thế giới đã được hoàn thành thành công.

Năm 1997, một thỏa thuận đã được ký kết với công ty Softissimo của Pháp để tạo ra hệ thống dịch từ tiếng Pháp sang tiếng Đức và tiếng Anh và ngược lại, và vào tháng 12 năm nay, hệ thống dịch thuật tiếng Đức-Pháp đầu tiên trên thế giới đã được phát hành. Cùng năm đó, công ty PROMT đã phát hành một hệ thống được triển khai bằng công nghệ Gigant, hỗ trợ một số hướng ngôn ngữ trong một shell, cũng như một trình dịch đặc biệt để làm việc trên Internet, WebTranSite.

Năm 1998, toàn bộ loạt chương trình đã được phát hành với tên mới PROMT 98. Một năm sau, công ty PROMT phát hành hai sản phẩm mới: gói phần mềm độc đáo để làm việc trên Internet - PROMT Internet và trình dịch cho hệ thống thư của công ty - Trình dịch thư PROMT. Vào tháng 11 năm 1999, PROMT đã được công nhận hệ thống tốt nhất bản dịch máy trong số những bản dịch được tạp chí PC Expert của Pháp kiểm tra, đánh bại các đối thủ cạnh tranh về tổng chỉ số 30%. Các giải pháp máy chủ đặc biệt cũng đã được phát triển cho khách hàng doanh nghiệp - máy chủ dịch thuật doanh nghiệp PROMT Translation Server (PTS) và giải pháp Internet PROMT Internet Translation Server (PITS). Năm 2000, PROMT cập nhật toàn bộ dòng sản phẩm phần mềm, phát hành thế hệ hệ thống MP mới: PROMT Translation Office 2000, PROMT Internet 2000 và Magic Gooddy 2000.

Dịch trực tuyến với sự hỗ trợ của hệ thống PROMT được sử dụng trên một số trang web trong và ngoài nước: Online Translator của PROMT, InfiniT.com, Translate.Ru, Lycos, v.v., cũng như trong các tổ chức có nhiều hồ sơ dịch thuật kinh doanh khác nhau tài liệu, bài viết và thư từ (có hệ thống dịch thuật được tích hợp trực tiếp vào Outlook Express và các ứng dụng email khác).

Ngày nay, các công nghệ dịch máy mới đang nổi lên, dựa trên việc sử dụng các hệ thống trí tuệ nhân tạo, phương pháp thống kê Phần sau sẽ được thảo luận trong phần tiếp theo.

2.2 Phương pháp thống kê trong học ngoại ngữ

Sự chú ý đáng kể trong ngôn ngữ học hiện đại được dành cho việc nghiên cứu các hiện tượng ngôn ngữ bằng các phương pháp toán học định lượng. Dữ liệu định lượng thường giúp hiểu sâu hơn về các hiện tượng đang được nghiên cứu, vị trí và vai trò của chúng trong hệ thống hiện tượng liên quan. Câu trả lời cho câu hỏi “bao nhiêu” giúp trả lời các câu hỏi “cái gì”, “như thế nào”, “tại sao” - đây là tiềm năng phỏng đoán của các đặc tính định lượng.

Phương pháp thống kê đóng một vai trò quan trọng trong việc phát triển hệ thống dịch máy (xem phần 2.1). Trong phương pháp thống kê, vấn đề dịch thuật được xem xét dưới dạng kênh nhiễu. Hãy tưởng tượng rằng chúng ta cần dịch một câu từ tiếng Anh sang tiếng Nga. Nguyên tắc kênh tiếng ồn đưa ra cho chúng ta lời giải thích sau đây về mối quan hệ giữa một cụm từ tiếng Anh và tiếng Nga: một câu tiếng Anh không gì khác hơn là một câu tiếng Nga bị biến dạng bởi một số tiếng ồn. Để xây dựng lại câu tiếng Nga gốc, chúng ta cần biết chính xác những gì mọi người thường nói bằng tiếng Nga và các cụm từ tiếng Nga bị biến dạng sang tiếng Anh như thế nào. Quá trình dịch được thực hiện bằng cách tìm kiếm một câu tiếng Nga tối đa hóa tích của xác suất vô điều kiện của câu tiếng Nga và xác suất của câu tiếng Anh (bản gốc) cho câu tiếng Nga đã cho. Theo định lý Bayes, câu tiếng Nga này rất có thể là bản dịch từ tiếng Anh:

trong đó e là câu dịch và f là câu gốc

Vì vậy chúng ta cần một mô hình nguồn và một mô hình kênh, hoặc một mô hình ngôn ngữ và một mô hình dịch thuật. Mô hình ngôn ngữ nên chỉ định điểm xác suất cho bất kỳ câu nào của ngôn ngữ đích (trong trường hợp của chúng tôi là tiếng Nga) và mô hình dịch thuật sẽ chỉ định điểm xác suất cho câu gốc. (xem bảng 1)

Nhìn chung, hệ thống dịch máy hoạt động ở hai chế độ:

1. Huấn luyện hệ thống: lấy một kho dữ liệu huấn luyện gồm các văn bản song song và sử dụng lập trình tuyến tính, các giá trị của bảng dịch tương ứng được tìm kiếm để tối đa hóa xác suất (ví dụ) phần tiếng Nga của kho ngữ liệu cho tiếng Anh hiện có phần theo mô hình dịch đã chọn. Một mô hình tiếng Nga được xây dựng trên phần tiếng Nga của cùng kho ngữ liệu đó.

2. Hoạt động: dựa trên dữ liệu thu được, một câu tiếng Nga được tìm kiếm một câu tiếng Anh không quen thuộc nhằm tối đa hóa tích các xác suất được gán bởi mô hình ngôn ngữ và mô hình dịch thuật. Chương trình được sử dụng cho tìm kiếm này được gọi là bộ giải mã.

Mô hình dịch thống kê đơn giản nhất là mô hình dịch nghĩa đen. Trong mô hình này, người ta giả định rằng để dịch một câu từ ngôn ngữ này sang ngôn ngữ khác, chỉ cần dịch tất cả các từ là đủ (để tạo ra một “túi từ”) và việc sắp xếp chúng theo đúng thứ tự sẽ được đảm bảo bởi mô hình. Để giảm P(a, f | e) thành P(a | e , f), tức là xác suất sắp xếp cho trước của một cặp câu cho trước, mỗi xác suất P(a, f | e) được chuẩn hóa bằng tổng các xác suất của tất cả các cách sắp xếp của một cặp câu cho trước:

Việc thực hiện thuật toán Viterbi dùng để huấn luyện Model số 1 như sau:

1. Toàn bộ bảng xác suất tương ứng dịch thuật được điền với các giá trị giống nhau.

2. Đối với tất cả các biến thể có thể có của cách kết nối từng cặp từ, xác suất P(a, f | e) được tính:

3. Các giá trị P(a, f | e) ​​được chuẩn hóa để thu được các giá trị P(a | e, f).

4. Tần suất của mỗi cặp chuyển được tính toán, có trọng số bằng xác suất của từng tùy chọn căn chỉnh.

5. Các tần số có trọng số thu được sẽ được chuẩn hóa và một bảng mới về xác suất tương ứng dịch thuật được hình thành

6. Thuật toán được lặp lại từ bước 2.

Ví dụ: chúng ta hãy xem xét việc đào tạo một mô hình tương tự trên kho ngữ liệu gồm hai cặp câu (Hình 2):

Nhà Trắng


Sau đó số lượng lớn lặp lại chúng ta nhận được một bảng (Bảng 2.), từ đó có thể thấy rằng việc dịch được thực hiện với độ chính xác cao.


Ngoài ra, các phương pháp thống kê được sử dụng rộng rãi trong nghiên cứu từ vựng, hình thái, cú pháp và phong cách. Các nhà khoa học từ Đại học bang Perm đã tiến hành một nghiên cứu dựa trên sự khẳng định rằng sự kết hợp từ ngữ khuôn mẫu là “vật liệu xây dựng” quan trọng của văn bản. Những cụm từ này bao gồm các từ lặp lại “cốt lõi” và các từ cụ thể hóa phụ thuộc và có màu sắc phong cách rõ rệt.

Theo phong cách khoa học, các từ “hạt nhân” có thể được gọi là: nghiên cứu, nghiên cứu, nhiệm vụ, vấn đề, câu hỏi, hiện tượng, thực tế, quan sát, phân tích v.v... Trong báo chí, những từ “hạt nhân” sẽ là những từ khác có giá trị gia tăng đặc biệt cho nội dung của tờ báo: thời gian, người, quyền lực, vấn đề, hành động, pháp luật, cuộc sống, lịch sử, địa điểm vân vân. (tổng cộng 29)

Mối quan tâm đặc biệt của các nhà ngôn ngữ học cũng là sự khác biệt về mặt chuyên môn của ngôn ngữ quốc gia và cách sử dụng từ vựng và ngữ pháp độc đáo tùy thuộc vào loại nghề nghiệp. Được biết, các tài xế sử dụng dạng sh trong lời nói chuyên nghiệp fer, các bác sĩ đang nói chuyện với Klush thay vì Sò bạn w – có thể đưa ra những ví dụ tương tự. Nhiệm vụ của thống kê là theo dõi sự biến đổi của cách phát âm và những thay đổi trong chuẩn mực ngôn ngữ.

Sự khác biệt về chuyên môn không chỉ dẫn đến sự khác biệt về ngữ pháp mà còn cả từ vựng. Tại Đại học bang Yakut được đặt theo tên. M.K. Ammosov đã phân tích 50 bảng câu hỏi với những phản ứng phổ biến nhất đối với một số từ nhất định của các bác sĩ và thợ xây dựng (Bảng 3).

Người xây dựng

Nhân loại

bệnh nhân (10), tính cách (5)

người đàn ông (5)

Tốt

giúp đỡ (8), giúp đỡ (7)

ác quỷ (16)

mạng sống

cái chết (10)

đẹp (5)

cái chết

xác chết (8)

cuộc sống (6)

ngọn lửa

nhiệt (8), đốt cháy (6)

lửa (7)

ngón tay

tay (14), tội phạm (5)

ngón cái (7), ngón trỏ (6)

mắt

thị lực (6), học sinh, bác sĩ nhãn khoa (mỗi người 5)

nâu (10), lớn (6)

cái đầu

tâm trí (14), bộ não (5)

lớn (9), thông minh (8), thông minh (6)

thua

ý thức, cuộc sống (4 cái)

tiền (5), tìm (4)


Có thể lưu ý rằng các bác sĩ thường xuyên đưa ra các hiệp hội liên quan đến hoạt động nghề nghiệp của họ hơn là các bác sĩ xây dựng, vì các từ kích thích được đưa ra trong bảng câu hỏi liên quan đến nghề nghiệp của họ thái độ hơn hơn là nghề thợ xây.

Các mẫu thống kê trong ngôn ngữ được sử dụng để tạo ra các từ điển tần số - các từ điển chứa đặc điểm số tần suất xuất hiện của một từ trong văn bản có độ dài nhất định thường được sử dụng như một đặc điểm của cách sử dụng

Một mô hình nhận thức giọng nói là không thể nếu không có từ điển là thành phần thiết yếu nhất của nó. Khi nhận thức lời nói, đơn vị vận hành chính là từ. Cụ thể, từ đó, mỗi từ của văn bản được cảm nhận phải được xác định bằng đơn vị tương ứng của vốn từ vựng bên trong của người nghe (hoặc người đọc). Điều tự nhiên là giả định rằng ngay từ đầu việc tìm kiếm chỉ giới hạn trong một số lĩnh vực phụ nhất định của từ điển. Theo hầu hết các lý thuyết hiện đại về nhận thức lời nói, việc phân tích ngữ âm thực tế của một văn bản phát âm trong một trường hợp điển hình chỉ cung cấp một phần thông tin về sự xuất hiện âm vị học có thể có của một từ và loại thông tin này được trả lời không phải bởi một người mà bởi một số người nhất định. NHIỀU từ trong từ điển; Do đó, có hai vấn đề phát sinh:

(a) chọn bộ tương ứng theo các thông số nhất định;

(b) trong tập hợp được mô tả (nếu được chọn phù hợp), “sàng lọc” tất cả các từ ngoại trừ từ duy nhất tương ứng nhất với một từ nhất định của văn bản được nhận dạng. Một trong những chiến lược sàng lọc là loại bỏ những từ có tần số thấp. Từ điển nhận biết lời nói là từ điển tần số. Nhiệm vụ ban đầu của dự án được trình bày là tạo ra một phiên bản máy tính của từ điển tần số của tiếng Nga.

Có 5 từ điển tần số dựa trên tiếng Nga (không tính từ điển ngành). Chúng ta hãy chỉ lưu ý một số thiếu sót chung của các từ điển hiện có.

Tất cả đều nổi tiếng từ điển tần số của tiếng Nga được xây dựng trên việc xử lý các mảng văn bản viết (in). Một phần vì lý do này, khi việc nhận dạng một từ chủ yếu dựa trên sự trùng hợp về mặt hình thức, hình ảnh thì ngữ nghĩa không được tính đến đầy đủ. Kết quả là các đặc tính tần số bị dịch chuyển và méo mó; Ví dụ: nếu trình biên dịch từ điển tần số bao gồm các từ trong tổ hợp “nhau” trong thống kê chung về việc sử dụng từ “bạn bè”, thì điều này khó có thể biện minh: có tính đến ngữ nghĩa, chúng ta phải thừa nhận rằng những điều này vốn đã là những từ khác nhau, hay đúng hơn, chúng là một đơn vị từ vựng độc lập, chỉ là sự kết hợp tổng thể.

Ngoài ra, trong tất cả các từ điển hiện có, các từ chỉ được đặt ở dạng cơ bản: danh từ ở dạng số ít, trường hợp chỉ định, động từ ở dạng nguyên thể, v.v. Một số từ điển cung cấp thông tin về tần suất xuất hiện của các dạng từ, nhưng thông thường chúng thực hiện việc này một cách không đầy đủ và không đầy đủ. Tần số của các dạng từ khác nhau của cùng một từ rõ ràng không trùng nhau. Người phát triển mô hình nhận thức giọng nói phải tính đến rằng trong quá trình nhận thức thực tế, đó là một dạng từ cụ thể “đắm chìm” trong văn bản có thể được nhận dạng: dựa trên phân tích phần đầu tiên của số mũ dạng từ, nhiều từ có phần mở đầu giống nhau được hình thành và phần đầu của dạng từ không nhất thiết phải giống với phần đầu của dạng từ điển. Đó là dạng từ có cấu trúc nhịp điệu cụ thể, đây cũng là một thông số cực kỳ quan trọng đối với việc lựa chọn từ ngữ theo cảm tính. Cuối cùng, trong cách thể hiện cuối cùng của phát ngôn được nhận biết, các từ lại được thể hiện bằng các dạng từ tương ứng.

Có rất nhiều công trình chứng minh tầm quan trọng của tần số trong quá trình nhận thức lời nói. Nhưng chúng tôi không biết bất kỳ tác phẩm nào sử dụng tần số của các dạng từ - ngược lại, tất cả các tác giả thực tế đều bỏ qua tần số của các dạng từ riêng lẻ, chỉ chuyển sang từ vị. Nếu kết quả họ thu được không được coi là tạo tác, chúng ta phải giả định rằng người bản xứ bằng cách nào đó có quyền truy cập vào thông tin về mối quan hệ giữa tần số của dạng từ và dạng từ điển, tức là trên thực tế, từ vị. Hơn nữa, tất nhiên, kiểu chuyển đổi từ dạng từ sang từ vị này không thể được giải thích bằng kiến ​​thức tự nhiên về mô hình tương ứng, vì thông tin về tần số phải được sử dụng trước khi xác định cuối cùng của từ, nếu không nó sẽ mất đi ý nghĩa của nó.

Dựa trên các đặc điểm thống kê cơ bản, có thể xác định, với một lỗi tương đối nhất định, phần từ vựng bao gồm các từ có tần suất xuất hiện cao, bất kể loại văn bản. Cũng có thể, bằng cách đưa thứ tự từng bước vào từ điển, để có được một loạt từ điển bao gồm 100, 1000, 5000 đầu tiên, v.v. của các từ thông dụng. Các đặc điểm thống kê của từ điển được quan tâm liên quan đến việc phân tích ngữ nghĩa của từ vựng. Việc nghiên cứu các nhóm chủ thể-tư tưởng và các trường ngữ nghĩa cho thấy các liên kết từ vựng được hỗ trợ bởi các kết nối ngữ nghĩa tập trung xung quanh các từ vựng có ý nghĩa tổng quát nhất. Việc mô tả ý nghĩa trong trường từ vựng-ngữ nghĩa có thể được thực hiện bằng cách xác định các từ có từ vựng trừu tượng nhất. Rõ ràng, các đơn vị từ vựng “trống” (theo quan điểm của hiệu lực danh nghĩa) tạo thành một lớp đồng nhất về mặt thống kê.

Từ điển cho từng thể loại cũng không kém phần giá trị. Nghiên cứu mức độ giống nhau của chúng và bản chất của phân bố thống kê sẽ cung cấp thông tin thú vị về sự phân tầng định tính của từ vựng tùy thuộc vào phạm vi sử dụng lời nói.

Việc biên soạn các từ điển tần số lớn đòi hỏi phải sử dụng công nghệ máy tính. Việc đưa cơ giới hóa và tự động hóa một phần vào quá trình làm việc trên từ điển được quan tâm như một thử nghiệm trong quá trình xử lý từ điển bằng máy cho các văn bản khác nhau. Một cuốn từ điển như vậy đòi hỏi một hệ thống chặt chẽ hơn để xử lý và tích lũy tài liệu từ vựng. Ở dạng thu nhỏ, đây là một hệ thống truy xuất thông tin có khả năng cung cấp thông tin về các mặt khác nhau văn bản và từ điển. Một số truy vấn cơ bản đối với hệ thống này đã được lên kế hoạch ngay từ đầu: tổng số từ trong kho, đặc điểm thống kê của một từ và toàn bộ từ điển, thứ tự các vùng thường xuyên và hiếm trong từ điển, v.v. Chỉ mục thẻ máy cho phép bạn tự động xây dựng từ điển đảo ngược cho từng thể loại và nguồn riêng lẻ. Nhiều thông tin thống kê hữu ích khác về ngôn ngữ sẽ được trích xuất từ ​​mảng thông tin tích lũy. Từ điển tần số máy tính tạo ra cơ sở thử nghiệm cho quá trình chuyển đổi sang tự động hóa rộng rãi hơn công việc từ điển.

Dữ liệu thống kê từ từ điển tần số có thể được sử dụng rộng rãi để giải quyết các vấn đề ngôn ngữ khác - ví dụ: trong phân tích và xác định các phương tiện hình thành từ tích cực của ngôn ngữ Nga hiện đại, giải quyết các vấn đề cải thiện đồ họa và chính tả, liên quan đến việc tính đến thống kê thông tin về thành phần từ vựng (điều quan trọng là phải tính đến các đặc điểm xác suất của sự kết hợp biểu đồ, các loại kết hợp chữ cái được thực hiện trong từ), phiên âm và phiên âm thực tế. Các thông số thống kê của từ điển cũng sẽ hữu ích trong việc giải quyết các bài toán tự động hóa in ấn, nhận dạng và đọc tự động văn bản chữ cái.

Từ điển và ngữ pháp giải thích hiện đại của tiếng Nga chủ yếu được xây dựng trên cơ sở các văn bản văn học và nghệ thuật. Có từ điển tần số của ngôn ngữ A.S. Pushkina, A.S. Griboyedova, F.M. Dostoevsky, V.V. Vysotsky và nhiều tác giả khác. Tại Khoa Lịch sử và Lý thuyết Văn học của Đại học bang Smolensk. Trường Đại học Sư phạm đã biên soạn từ điển tần số các văn bản thơ và văn xuôi trong nhiều năm. Đối với nghiên cứu này, từ điển tần số của tất cả lời bài hát của Pushkin và hai nhà thơ nữa của thời kỳ hoàng kim đã được chọn - “Woe from Wit” của Griboyedov và tất cả thơ của Lermontov; Pasternak và năm nhà thơ khác tuổi bạc- Balmont 1894-1903, “Những bài thơ về một quý cô xinh đẹp” của Blok, “Hòn đá” của Mandelstam, “Cột lửa” của Gumilyov, “Anno Domini MCMXXI” của Akhmatova và “Chị gái của đời tôi” của Pasternak và bốn nhà thơ khác của Thời đại đồ sắt - “Những bài thơ của Yury Zhivago”, “Khi trời quang đãng”, toàn bộ lời bài hát của M. Petrovs, “Con đường còn xa”, “Windshield”, “Farewell to the Snow” và “Horseshoe” của Mezhirov, “Antimirov” của Voznesensky và “Snow Woman” của Rylenkov.

Cần lưu ý rằng những từ điển này khác nhau về bản chất: một số đại diện cho từ vựng của một tác phẩm kịch, một số khác - một tập lời bài hát, hoặc một số cuốn sách, hoặc toàn bộ kho thơ của một nhà thơ. Các kết quả phân tích được trình bày trong nghiên cứu này cần được xem xét một cách thận trọng; chúng không thể được coi là tuyệt đối. Tuy nhiên, với sự trợ giúp của các biện pháp đặc biệt, sự khác biệt về bản chất bản thể của văn bản có thể được giảm bớt ở một mức độ nhất định.

Trong những năm gần đây, sự tương phản giữa lời nói thông tục và lời nói trong sách ngày càng được nhận ra rõ ràng hơn. Vấn đề này đặc biệt được tranh luận sôi nổi giữa các nhà phương pháp luận, những người yêu cầu chuyển đổi cách giảng dạy sang ngôn ngữ nói. Tuy nhiên, các chi tiết cụ thể của lời nói vẫn chưa được giải thích.

Việc xử lý từ điển được thực hiện bằng cách tạo một ứng dụng tùy chỉnh trong môi trường chương trình văn phòng EXCEL97. Ứng dụng này bao gồm bốn bảng tính trong sách EXCEL - “Bảng tiêu đề”, một bảng “Từ điển” với dữ liệu ban đầu, “Các khoảng cách gần” và “Khoảng cách” có kết quả, cũng như một bộ macro.

Thông tin ban đầu được nhập vào tờ “Từ điển”. Từ điển của các văn bản đã học được viết vào ô EXCEL, cột S cuối cùng được hình thành từ kết quả thu được và bằng số từ tìm được trong các từ điển khác. Các bảng Khoảng cách và Khoảng cách chứa các số đo được tính toán về khoảng cách M, tương quan R và khoảng cách D.

Macro ứng dụng là các quy trình dựa trên sự kiện được viết bằng Visual Basic for Application (VBA). Các quy trình này dựa trên các đối tượng thư viện VBA và các phương pháp xử lý chúng. Do đó, đối với các thao tác với trang tính của ứng dụng, đối tượng khóa Trang tính và phương thức kích hoạt trang tính tương ứng Kích hoạt sẽ được sử dụng. Việc đặt phạm vi dữ liệu nguồn được phân tích trên trang “Từ điển” được thực hiện bằng phương thức Chọn của đối tượng Phạm vi và việc chuyển các từ dưới dạng giá trị cho các biến được thực hiện dưới dạng thuộc tính Giá trị của cùng một đối tượng Phạm vi.

Mặc dù thực tế là phân tích tương quan thứ hạng khiến chúng tôi thận trọng về sự phụ thuộc của chủ đề giữa các văn bản khác nhau, nhưng hầu hết các từ thường gặp nhất trong mỗi văn bản đều trùng khớp với một hoặc nhiều văn bản khác. Cột S hiển thị số lượng từ như vậy trong số 15 từ thường gặp nhất của mỗi tác giả. Những từ xuất hiện trong bảng của chúng tôi chỉ ở một nhà thơ được tô đậm. Blok, Akhmatova và Petrovs không có từ nào được đánh dấu cả; họ có S = 15. Đối với ba nhà thơ này, cả 15 từ thường gặp nhất đều giống nhau, chúng chỉ khác nhau ở vị trí trong danh sách. Nhưng ngay cả Pushkin, người có vốn từ vựng nguyên bản nhất cũng có S = 8 và 7 từ được đánh dấu.

Kết quả cho thấy có một lớp từ vựng nhất định tập trung vào các chủ đề chính của thơ. Theo quy định, những từ này rất ngắn: từ tổng số(225) cách sử dụng từ: một âm tiết 88, hai âm tiết 127, ba âm tiết 10. Thông thường những từ này đại diện cho các thần thoại chính và có thể được chia thành các cặp: đêm - ngày, đất - trời (mặt trời), Thiên Chúa - con người (con người), sự sống - cái chết, thể xác - linh hồn, La Mã - thế giới(từ Mandelstam); có thể được kết hợp thành những thần thoại ở cấp độ cao hơn: bầu trời, ngôi sao, mặt trời, trái đất; ở một người, như một quy luật, cơ thể, tim, Máu, cánh tay, Chân, Má, đôi mắt được phân biệt. Trong số các trạng thái của con người, giấc ngủ và tình yêu được ưu tiên hơn. Ngôi nhà và thành phố thuộc về thế giới loài người - Moscow, Rome, Paris. Sự sáng tạo được thể hiện bằng từ vựng từbài hát.

Griboyedov và Lermontov hầu như không có từ nào biểu thị thiên nhiên trong số những từ thường gặp nhất. Họ có số lượng từ ngữ biểu thị một người nhiều gấp ba lần, các bộ phận trên cơ thể anh ta, các yếu tố trong thế giới tâm linh của anh ta. Ở Pushkin và các nhà thơ của thế kỷ XX. chỉ định của con người và thiên nhiên được chia gần như bằng nhau. Ở khía cạnh quan trọng này của chủ đề, chúng ta có thể nói rằng thế kỷ XX. đã theo Pushkin.

Chủ đề tối thiểu trường hợp trong số những từ thường gặp nhất, nó chỉ được tìm thấy ở Griboyedov và Pushkin. Ở Lermontov và các nhà thơ của thế kỷ XX. nó nhường chỗ cho một chủ đề tối giản từ. Lời nói không loại trừ việc làm (giải thích theo Kinh thánh về chủ đề này: trong Tân Ước, toàn bộ lời dạy của Chúa Giê-su Christ được coi là lời của Đức Chúa Trời hoặc lời của Chúa Giê-su, và các sứ đồ đôi khi tự gọi mình là thừa tác viên của Lời). Ý nghĩa thiêng liêng của từ lexeme được thể hiện một cách thuyết phục, chẳng hạn như trong câu thơ “Và hình ảnh của thế giới được bộc lộ trong Lời” của Pasternak. Ý nghĩa thiêng liêng của lexeme từ sự tương phản với những vấn đề của con người được thể hiện một cách thuyết phục trong bài thơ cùng tên của Gumilyov.

Các từ vị chỉ xuất hiện trong một văn bản mô tả tính độc đáo của một cuốn sách hoặc bộ sưu tập sách nhất định. Ví dụ: từ “tâm trí” là từ thường gặp nhất trong bộ phim hài “Woe from Wit” của Griboedov - nhưng nó không được tìm thấy trong số những từ thường gặp nhất trong các văn bản khác. Chủ đề tâm trí cho đến nay vẫn là chủ đề quan trọng nhất trong hài kịch. Từ vựng này đi kèm với hình ảnh Chatsky, và cái tên Chatsky là cái tên thường gặp nhất trong hài kịch. Do đó, tác phẩm kết hợp một cách hữu cơ danh từ chung phổ biến nhất với danh từ riêng phổ biến nhất.

Hệ số tương quan cao nhất kết nối chủ đề của những cuốn sách bi thảm của Gumilev “The Pillar of Fire” và “Anno Domini MCMXXI” của Akhmatova. Trong số 15 danh từ phổ biến nhất ở đây, có 10 danh từ phổ biến, bao gồm máu, trái tim, tâm hồn, tình yêu, lời nói, bầu trời. Chúng ta hãy nhớ lại rằng cuốn sách của Akhmatova có chứa tiểu phẩm “Bạn sẽ không bao giờ sống…”, được viết giữa thời điểm Gumilyov bị bắt và bị hành quyết.

Chủ đề về nến và đám đông trong tài liệu được nghiên cứu chỉ có trong “Những bài thơ của Yury Zhivago”. Chủ đề ngọn nến trong các bài thơ trong tiểu thuyết có nhiều ý nghĩa ngữ cảnh: nó gắn liền với hình ảnh Chúa Giêsu Kitô, với chủ đề về đức tin, sự bất tử, sự sáng tạo và cuộc hẹn hò tình yêu. Ngọn nến là nguồn ánh sáng quan trọng nhất trong những cảnh trung tâm của cuốn tiểu thuyết. Chủ đề đám đông phát triển gắn liền với ý tưởng chính của cuốn tiểu thuyết, trong đó cuộc sống riêng tư của một con người với những giá trị không thể lay chuyển của nó đối lập với sự vô đạo đức của một nhà nước mới, được xây dựng dựa trên nguyên tắc làm hài lòng đám đông. .

Công việc bao gồm giai đoạn thứ ba, cũng được phản ánh trong chương trình, - đây là tính toán sự khác biệt về số thứ tự của các từ phổ biến trong hai từ điển và khoảng cách trung bình giữa các từ giống nhau của hai từ điển. Giai đoạn này cho phép chúng ta chuyển từ xu hướng chung trong tương tác của các từ điển, được xác định bằng cách sử dụng số liệu thống kê, sang mức độ tiếp cận văn bản. Ví dụ, sách của Gumilyov và Akhmatova có mối tương quan đáng kể về mặt thống kê. Chúng tôi xem xét những từ phổ biến trong từ điển của chúng và trước hết chọn những từ có số thứ tự tối thiểu hoặc bằng 0. Chính những từ này có cùng số hạng và do đó, chính những chủ đề tối thiểu này cũng quan trọng như nhau trong tâm trí hai nhà thơ. Tiếp theo bạn nên chuyển sang cấp độ văn bản và bối cảnh.

Phương pháp định lượng còn giúp nghiên cứu đặc điểm của người bản ngữ. Ví dụ, trong tiếng Nga có 6 trường hợp, trong tiếng Anh không có trường hợp nào, và trong một số ngôn ngữ của các dân tộc Dagestan, số trường hợp lên tới 40. L. Perlovsky trong bài viết “Ý thức, ngôn ngữ và văn hóa” liên hệ những đặc điểm này với xu hướng của các dân tộc theo chủ nghĩa cá nhân hoặc chủ nghĩa tập thể, với nhận thức về các sự vật và hiện tượng một cách riêng biệt hoặc liên quan đến những thứ khác. Rốt cuộc, chính trong thế giới nói tiếng Anh (không có trường hợp nào - một thứ được coi là "tự thân") đã xuất hiện những khái niệm như tự do cá nhân, chủ nghĩa tự do và dân chủ (lưu ý rằng tôi chỉ sử dụng những khái niệm này liên quan đến ngôn ngữ, không có bất kỳ đặc điểm đánh giá nào). Mặc dù thực tế là những phỏng đoán như vậy vẫn chỉ ở mức độ giả thuyết khoa học táo bạo, nhưng chúng giúp nhìn nhận các hiện tượng quen thuộc theo một cách mới.

Như chúng ta thấy, các đặc điểm định lượng có thể được sử dụng trong các lĩnh vực ngôn ngữ học hoàn toàn khác nhau, điều này ngày càng làm mờ ranh giới giữa các phương pháp “chính xác” và “nhân đạo”. Ngôn ngữ học ngày càng nhờ đến sự trợ giúp của không chỉ toán học mà còn cả công nghệ máy tính để giải quyết các vấn đề của nó.

2.3 Học ngôn ngữ bằng phương pháp logic hình thức

Ngôn ngữ học lý thuyết hiện đại tương tác với các phương pháp toán học phi định lượng, đặc biệt là với logic, không kém phần hiệu quả so với các phương pháp định lượng. Sự phát triển nhanh chóng của công nghệ máy tính và vai trò ngày càng tăng của chúng trong thế giới hiện đại đòi hỏi phải xem xét lại cách tiếp cận đối với sự tương tác giữa ngôn ngữ và logic nói chung.

Các phương pháp logic được sử dụng rộng rãi trong việc phát triển các ngôn ngữ hình thức hóa, đặc biệt là các ngôn ngữ lập trình, các thành phần của chúng là các ký hiệu nhất định (gần giống với các ký hiệu toán học), được chọn (hoặc được xây dựng từ các ký hiệu đã chọn trước đó) và được diễn giải theo một cách nhất định, liên quan đến không có cách sử dụng, hiểu biết và chức năng “truyền thống” của các ký hiệu tương tự trong các bối cảnh khác. Một lập trình viên liên tục xử lý logic trong công việc của mình. Mục đích của lập trình chính xác là dạy máy tính suy luận (theo nghĩa rộng của từ này). Đồng thời, các phương pháp “lý luận” hóa ra rất khác nhau. Mỗi lập trình viên dành một khoảng thời gian nhất định để tìm kiếm lỗi trong chương trình của chính mình và của người khác. Tức là tìm kiếm những sai sót trong lý luận, logic. Và điều này cũng để lại dấu ấn của nó. Việc phát hiện các lỗi logic trong lời nói thông thường sẽ dễ dàng hơn nhiều. Tính đơn giản tương đối của các ngôn ngữ được nghiên cứu bởi các nhà logic học cho phép họ làm sáng tỏ cấu trúc của các ngôn ngữ này rõ ràng hơn mức mà các nhà ngôn ngữ học chỉ phân tích các ngôn ngữ tự nhiên phức tạp có thể đạt được. Vì các ngôn ngữ được các nhà logic học nghiên cứu sử dụng các quan hệ được sao chép từ các ngôn ngữ tự nhiên nên các nhà logic học có thể đưa ra đóng góp đáng kể vào lý thuyết chung về ngôn ngữ. Tình huống ở đây tương tự như tình huống xảy ra trong vật lý: nhà vật lý cũng xây dựng các định lý cho các trường hợp đơn giản hóa lý tưởng hoàn toàn không xảy ra trong tự nhiên - ông xây dựng các định luật cho chất khí lý tưởng, chất lỏng lý tưởng, nói về chuyển động khi không có ma sát, v.v. . Đối với những trường hợp lý tưởng hóa này người ta có thể đặt luật đơn giản, điều này sẽ góp phần rất lớn vào sự hiểu biết về những gì đang xảy ra trong thực tế và những gì có lẽ vật lý vẫn chưa biết nếu nó cố gắng xem xét thực tế một cách trực tiếp, trong tất cả sự phức tạp của nó.

Trong nghiên cứu ngôn ngữ tự nhiên, các phương pháp logic được sử dụng để người học ngôn ngữ không thể ngu ngốc “ghi nhớ” càng nhiều từ càng tốt mà hiểu rõ hơn cấu trúc của nó. L. Shcherba cũng sử dụng trong bài giảng của mình một ví dụ về câu được xây dựng theo quy luật của tiếng Nga: “The glokaya kuzdra shteko budlanul bokra và kurdyachit bokrenok,” rồi hỏi học sinh điều này có nghĩa là gì. Mặc dù thực tế là ý nghĩa của các từ trong câu vẫn chưa rõ ràng (đơn giản là chúng không tồn tại trong tiếng Nga), nhưng vẫn có thể trả lời rõ ràng: “kuzdra” là chủ ngữ, một danh từ giống cái, trong trường hợp số ít, chỉ định , “bokr” là hoạt ảnh, v.v. Bản dịch của cụm từ này gần như như sau: “Một thứ gì đó nữ tính đã làm điều gì đó với một số sinh vật thuộc giới tính nam chỉ trong một lần, và sau đó bắt đầu làm điều gì đó lâu dài, dần dần với đàn con của nó.” Một ví dụ tương tự về văn bản (hư cấu) từ những từ không tồn tại, được xây dựng hoàn toàn theo quy luật ngôn ngữ, là “Jabberwocky” của Lewis Carroll (trong “Alice in Wonderland” Carroll, qua miệng nhân vật Humpty Dumpty, giải thích ý nghĩa của những từ mà anh ấy đã nghĩ ra: “luộc” - tám giờ tối, khi đến giờ nấu bữa tối, "khliky" - mỏng manh và khéo léo, "shoryok" - con lai giữa chồn sương, lửng và mở nút chai, "đào" - nhảy, lặn, xoay, "nava" - cỏ dưới đồng hồ mặt trời (kéo dài sang phải một chút, sang trái một chút và lùi lại một chút), "gầm gừ" - càu nhàu và cười, "zelyuk" - a gà tây xanh, “mumzik” - một con chim; lông của nó xù xì và nhô ra mọi hướng, giống như một chiếc chổi, “mova” - xa nhà) .

Một trong những khái niệm cơ bản của logic hiện đại và ngôn ngữ học lý thuyết, được sử dụng trong nghiên cứu ngôn ngữ của các phép tính logic-toán học, ngôn ngữ tự nhiên khác nhau, để mô tả mối quan hệ giữa các ngôn ngữ ở các “cấp độ” khác nhau và để mô tả mối quan hệ giữa các ngôn ngữ các ngôn ngữ được đề cập và các lĩnh vực chủ đề được mô tả với sự trợ giúp của chúng là khái niệm về ngôn ngữ kim loại. Ngôn ngữ kim loại là ngôn ngữ dùng để thể hiện sự đánh giá về một ngôn ngữ khác, ngôn ngữ đối tượng. Với sự trợ giúp của kim loại, họ nghiên cứu cấu trúc tổ hợp ký hiệu (biểu thức) của ngôn ngữ đối tượng, chứng minh các định lý về tính chất biểu đạt của nó, mối quan hệ của nó với các ngôn ngữ khác, v.v. Ngôn ngữ đang được nghiên cứu còn được gọi là ngôn ngữ khách quan trong mối quan hệ với ngôn ngữ kim loại này. Cả ngôn ngữ chủ đề và ngôn ngữ kim loại đều có thể là ngôn ngữ thông thường (tự nhiên). Ngôn ngữ kim loại có thể khác với ngôn ngữ đối tượng (ví dụ: trong sách giáo khoa tiếng Anh dành cho người Nga, tiếng Nga là ngôn ngữ kim loại và tiếng Anh là ngôn ngữ đối tượng), nhưng nó có thể trùng với nó hoặc chỉ khác một phần, chẳng hạn thuật ngữ đặc biệt(Thuật ngữ ngôn ngữ học tiếng Nga là một thành phần của kim loại để mô tả ngôn ngữ Nga; cái gọi là yếu tố ngữ nghĩa là một phần của kim loại để mô tả ngữ nghĩa của ngôn ngữ tự nhiên).

Logic dạy chúng ta sự phân biệt hiệu quả giữa ngôn ngữ đối tượng và ngôn ngữ kim loại. Đối tượng ngôn ngữ là chính đối tượng nghiên cứu logic và ngôn ngữ kim loại chắc chắn là ngôn ngữ nhân tạo mà nghiên cứu đó được tiến hành. Tư duy logic chính xác bao gồm việc hình thành bằng ngôn ngữ ký hiệu (ngôn ngữ kim loại) các mối quan hệ và cấu trúc của một ngôn ngữ thực (ngôn ngữ-đối tượng).

Trong mọi trường hợp, một ngôn ngữ kim loại phải “không kém hơn” ngôn ngữ chủ đề của nó (tức là, đối với mỗi biểu thức của ngôn ngữ sau trong ngôn ngữ kim loại thì phải có tên của nó - “bản dịch”) - nếu không, nếu những yêu cầu này không được đáp ứng (mà rõ ràng xảy ra trong các ngôn ngữ tự nhiên, nếu các thỏa thuận đặc biệt không quy định khác), sẽ nảy sinh những nghịch lý về ngữ nghĩa (các mâu thuẫn).

Khi ngày càng có nhiều ngôn ngữ lập trình mới được tạo ra, cùng với vấn đề của người dịch lập trình, nhu cầu cấp thiết là tạo ra các kim loại ngôn ngữ. Hiện nay, ngôn ngữ được sử dụng phổ biến nhất để mô tả cú pháp của các ngôn ngữ lập trình là ngôn ngữ kim loại dạng Backus-Naur (viết tắt là BNF). Nó được trình bày dưới dạng thu gọn dưới dạng một số công thức tương tự như công thức toán học. Đối với mỗi khái niệm của một ngôn ngữ chỉ có một công thức ẩn dụ duy nhất (công thức thông thường). Nó bao gồm các phần bên trái và bên phải. Phía bên trái biểu thị khái niệm đang được xác định và phía bên phải chỉ định tập hợp các cấu trúc ngôn ngữ được chấp nhận được kết hợp thành khái niệm này. Công thức sử dụng các siêu ký hiệu đặc biệt dưới dạng dấu ngoặc nhọn, chứa khái niệm đã xác định (ở bên trái của công thức) hoặc khái niệm được xác định trước đó (ở bên phải) và việc phân tách phần bên trái và bên phải được biểu thị bằng siêu ký hiệu "::=", ý nghĩa của nó tương đương với từ "theo định nghĩa là có". Các công thức ngôn ngữ học ở một dạng nào đó được nhúng vào trong các dịch giả; với sự trợ giúp của họ, các cấu trúc được lập trình viên sử dụng sẽ được kiểm tra xem có tuân thủ về mặt hình thức với bất kỳ cấu trúc nào được chấp nhận về mặt cú pháp trong ngôn ngữ này hay không. Ngoài ra còn có các kim loại riêng biệt của các ngành khoa học khác nhau - do đó, kiến ​​thức tồn tại dưới dạng các kim loại khác nhau.

Các phương pháp logic cũng là cơ sở cho việc tạo ra các hệ thống trí tuệ nhân tạo dựa trên khái niệm chủ nghĩa kết nối. Chủ nghĩa kết nối là một phong trào đặc biệt trong khoa học triết học, chủ đề của nó là những câu hỏi về kiến ​​thức. Là một phần của phong trào này, những nỗ lực đang được thực hiện nhằm giải thích khả năng trí tuệ của con người bằng cách sử dụng mạng lưới thần kinh nhân tạo. Được tạo thành từ một số lượng lớn đơn vị cấu trúc, tương tự như tế bào thần kinh, với trọng số được chỉ định cho từng phần tử quyết định cường độ kết nối với các phần tử khác, mạng lưới thần kinh là mô hình đơn giản hóa của bộ não con người. Các thử nghiệm với các loại mạng thần kinh này đã chứng minh khả năng học các nhiệm vụ như nhận dạng mẫu, đọc và xác định các cấu trúc ngữ pháp đơn giản.

Các nhà triết học bắt đầu quan tâm đến chủ nghĩa kết nối vì cách tiếp cận theo chủ nghĩa kết nối hứa hẹn mang đến một giải pháp thay thế cho lý thuyết cổ điển về trí óc và ý tưởng được phổ biến rộng rãi trong lý thuyết đó rằng hoạt động của trí óc giống như quá trình xử lý ngôn ngữ biểu tượng bằng máy tính kỹ thuật số. Khái niệm này gây nhiều tranh cãi nhưng trong những năm gần đây nó ngày càng nhận được nhiều người ủng hộ.

Nghiên cứu logic về ngôn ngữ tiếp tục khái niệm Saussure về ngôn ngữ như một hệ thống. Việc nó liên tục tiếp tục một lần nữa khẳng định sự táo bạo của những phỏng đoán khoa học vào đầu thế kỷ trước. Phần cuối cùng Tôi sẽ cống hiến công việc của mình cho triển vọng phát triển các phương pháp toán học trong ngôn ngữ học ngày nay.

2.4 Triển vọng ứng dụng các phương pháp toán học trong ngôn ngữ học

Trong thời đại công nghệ máy tính, các phương pháp ngôn ngữ học toán học đã đón nhận một quan điểm phát triển mới. Việc tìm kiếm giải pháp cho các vấn đề phân tích ngôn ngữ hiện đang ngày càng được thực hiện ở cấp độ hệ thống thông tin. Đồng thời, việc tự động hóa quá trình xử lý tài liệu ngôn ngữ, đồng thời mang lại cho nhà nghiên cứu những cơ hội và lợi thế đáng kể, tất yếu đặt ra những yêu cầu và nhiệm vụ mới cho nhà nghiên cứu.

Sự kết hợp giữa tri thức “chính xác” và “nhân đạo” đã trở thành mảnh đất màu mỡ cho những khám phá mới trong các lĩnh vực ngôn ngữ học, khoa học máy tính và triết học.

Dịch máy từ ngôn ngữ này sang ngôn ngữ khác vẫn là một nhánh công nghệ thông tin đang phát triển nhanh chóng. Mặc dù thực tế là bản dịch sử dụng máy tính sẽ không bao giờ có chất lượng tương đương với bản dịch do con người thực hiện (đặc biệt là đối với các văn bản văn học), máy đã trở thành một trợ lý không thể thiếu của con người trong việc dịch khối lượng lớn văn bản. Người ta tin rằng trong tương lai gần, các hệ thống dịch thuật tiên tiến hơn sẽ được tạo ra, chủ yếu dựa trên phân tích ngữ nghĩa của văn bản.

Một hướng đi hứa hẹn không kém vẫn là sự tương tác giữa ngôn ngữ học và logic, đóng vai trò là nền tảng triết học để hiểu công nghệ thông tin và cái gọi là “thực tế ảo”. Trong tương lai gần, công việc sẽ tiếp tục tạo ra các hệ thống trí tuệ nhân tạo - mặc dù, một lần nữa, nó sẽ không bao giờ sánh được với trí thông minh của con người về khả năng của nó. Sự cạnh tranh như vậy là vô nghĩa: trong thời đại của chúng ta, một cỗ máy không nên trở thành (và trở thành) không phải là đối thủ mà là trợ lý của con người, không phải thứ gì đó từ thế giới tưởng tượng mà là một phần của thế giới thực.

Việc nghiên cứu ngôn ngữ tiếp tục sử dụng các phương pháp thống kê, cho phép chúng ta xác định chính xác hơn các đặc tính định tính của nó. Điều quan trọng là những giả thuyết táo bạo nhất về ngôn ngữ phải tìm được bằng chứng toán học và do đó có tính logic.

Điều quan trọng nhất là các nhánh khác nhau của ứng dụng toán học trong ngôn ngữ học, trước đây khá khác nhau, trong những năm gần đây đã có mối tương quan với nhau, thống nhất thành một hệ thống mạch lạc, tương tự như hệ thống ngôn ngữ được Ferdinand phát hiện cách đây một thế kỷ. de Saussure và Yvan Baudouin de Courtenay. Đây là tính liên tục của kiến ​​thức khoa học.

Ngôn ngữ học trong thế giới hiện đại đã trở thành nền tảng cho sự phát triển của công nghệ thông tin. Chừng nào khoa học máy tính vẫn là một nhánh hoạt động của con người đang phát triển nhanh chóng thì sự kết hợp giữa toán học và ngôn ngữ học sẽ tiếp tục đóng vai trò của nó trong sự phát triển của khoa học.

Phần kết luận

Cho thế kỷ 20 công nghệ máy tínhđã đi một chặng đường dài - từ sử dụng quân sự đến sử dụng vì mục đích hòa bình, từ phạm vi mục tiêu hạn hẹp đến thâm nhập vào mọi lĩnh vực của đời sống con người. Toán học với tư cách là một môn khoa học đã tìm thấy ý nghĩa thực tiễn mới cùng với sự phát triển của công nghệ máy tính. Quá trình này tiếp tục ngày hôm nay.

Sự “song hành” không thể tưởng tượng trước đây của “nhà vật lý” và “nhà viết lời” đã trở thành hiện thực. Để có sự tương tác đầy đủ của toán học và khoa học máy tính với ngành nhân văn, cần có các chuyên gia có trình độ từ cả hai bên. Trong khi các chuyên gia máy tính ngày càng cần những kiến ​​thức nhân văn có hệ thống (ngôn ngữ, văn hóa, triết học) để hiểu được những thay đổi trong thực tế xung quanh họ, trong sự tương tác giữa con người và công nghệ, để phát triển ngày càng nhiều khái niệm ngôn ngữ và tinh thần mới, để viết chương trình, thì Ở thời đại chúng ta, một “nhà nhân văn” ít nhất phải nắm vững những điều cơ bản khi làm việc với máy tính để phát triển về mặt chuyên môn.

Toán học, có mối liên hệ chặt chẽ với khoa học máy tính, tiếp tục phát triển và tương tác với kiến ​​thức khoa học tự nhiên và nhân văn. Trong thế kỷ mới, xu hướng toán học hóa khoa học không hề suy yếu mà trái lại còn ngày càng mạnh mẽ. Sử dụng dữ liệu định lượng, các mô hình phát triển ngôn ngữ cũng như các đặc điểm lịch sử và triết học của nó sẽ được hiểu rõ.

Chủ nghĩa hình thức toán học phù hợp nhất để mô tả các mô hình trong ngôn ngữ học (thực tế cũng như trong các ngành khoa học khác - cả nhân văn và khoa học tự nhiên). Tình huống đôi khi phát triển trong khoa học theo cách mà không cần sử dụng ngôn ngữ toán học thích hợp thì người ta vẫn có thể hiểu được bản chất của các tính chất vật lý, hóa học, v.v. quá trình là không thể. Tạo ra một mô hình hành tinh của nguyên tử, nổi tiếng nhà vật lý người Anh Thế kỷ XX E. Rutherford gặp khó khăn về toán học. Lúc đầu, lý thuyết của ông không được chấp nhận: nó nghe có vẻ không thuyết phục, và lý do cho điều này là do Rutherford không hiểu lý thuyết xác suất, trên cơ sở cơ chế mà người ta chỉ có thể hiểu được cách biểu diễn mô hình của các tương tác nguyên tử. Nhận ra điều này, một nhà khoa học xuất sắc vào thời điểm đó, người đoạt giải Nobel, đã đăng ký tham gia hội thảo của giáo sư toán học Lamb và trong hai năm, cùng với các sinh viên, đã tham gia một khóa học và làm việc trong một hội thảo về lý thuyết xác suất. Trên cơ sở đó, Rutherford đã có thể mô tả hành trạng của electron, mang lại cho mô hình cấu trúc của ông độ chính xác thuyết phục và được công nhận. Ngôn ngữ học cũng vậy.

Điều này đặt ra câu hỏi, điều gì chứa đựng tính toán học trong các hiện tượng khách quan mà khiến chúng có thể được mô tả bằng ngôn ngữ toán học, bằng ngôn ngữ của các đặc tính định lượng? Đây là những đơn vị vật chất đồng nhất phân bố trong không gian và thời gian. Những ngành khoa học đã đi xa hơn những ngành khoa học khác trong việc xác định tính đồng nhất hóa ra lại phù hợp hơn cho việc sử dụng toán học trong đó.

Internet, phát triển nhanh chóng vào những năm 90, đã đoàn kết đại diện của nhiều quốc gia, dân tộc và nền văn hóa khác nhau. Mặc dù thực tế rằng tiếng Anh tiếp tục là ngôn ngữ chính trong giao tiếp quốc tế, Internet đã trở thành đa ngôn ngữ trong thời đại chúng ta. Điều này dẫn đến sự phát triển của các hệ thống dịch máy thành công về mặt thương mại và được sử dụng rộng rãi trong nhiều lĩnh vực hoạt động khác nhau của con người.

Mạng máy tính đã trở thành đối tượng của sự hiểu biết triết học - ngày càng có nhiều khái niệm ngôn ngữ, logic, thế giới quan mới được tạo ra để giúp hiểu “thực tế ảo”. Trong nhiều tác phẩm nghệ thuật, các kịch bản đã được tạo ra - thường là bi quan - về sự thống trị của máy móc so với con người và sự thống trị của thực tế ảo đối với thế giới xung quanh. Không phải lúc nào những dự báo như vậy hóa ra là vô nghĩa. Công nghệ thông tin không chỉ là một lĩnh vực đầy hứa hẹn để đầu tư kiến ​​thức của con người mà còn là một cách để kiểm soát thông tin và do đó, vượt qua cả suy nghĩ của con người.

Hiện tượng này có cả mặt tiêu cực và mặt tích cực. Tiêu cực - bởi vì việc kiểm soát thông tin mâu thuẫn với quyền không thể thay đổi của con người được tự do tiếp cận thông tin đó. Tích cực - vì việc thiếu sự kiểm soát này có thể dẫn đến hậu quả thảm khốc cho nhân loại. Chỉ cần nhớ lại một trong những bộ phim khôn ngoan nhất thập kỷ trước - “Khi thế giới kết thúc” của Wim Wenders, có các nhân vật hoàn toàn đắm chìm trong “thực tế ảo” trong giấc mơ của chính họ, được ghi lại trên máy tính. Tuy nhiên, không một nhà khoa học hay nghệ sĩ nào có thể đưa ra câu trả lời chắc chắn cho câu hỏi: điều gì đang chờ đợi khoa học công nghệ trong tương lai.

Tập trung vào “tương lai”, đôi khi có vẻ tuyệt vời, là một đặc điểm nổi bật của khoa học vào giữa thế kỷ 20, khi các nhà phát minh tìm cách tạo ra những ví dụ hoàn hảo về công nghệ có thể hoạt động mà không cần sự can thiệp của con người. Thời gian đã cho thấy bản chất không tưởng của những nghiên cứu như vậy. Tuy nhiên, sẽ không cần thiết phải lên án các nhà khoa học về điều này - nếu không có sự nhiệt tình của họ trong những năm 1950 và 60, công nghệ thông tin sẽ không có được bước nhảy vọt mạnh mẽ như vậy vào những năm 90 và chúng ta sẽ không có được những gì chúng ta có bây giờ.

Những thập kỷ cuối của thế kỷ XX đã thay đổi các ưu tiên của khoa học - nghiên cứu, các sáng tạo đã nhường chỗ cho lợi ích thương mại. Một lần nữa, điều này không tốt cũng không xấu. Đây là một thực tế trong đó khoa học ngày càng được tích hợp vào cuộc sống hàng ngày.

Sự ra đời của thế kỷ 21 tiếp tục xu hướng này, và trong thời đại của chúng ta, đằng sau những phát minh không chỉ có danh tiếng và sự công nhận mà trước hết là tiền bạc. Đây cũng là lý do tại sao điều quan trọng là phải đảm bảo rằng những thành tựu khoa học và công nghệ mới nhất không rơi vào tay các nhóm khủng bố hoặc các chế độ độc tài. Nhiệm vụ khó đến mức không thể thực hiện được; Hiện thực hóa nó càng nhiều càng tốt là nhiệm vụ của toàn thể cộng đồng thế giới.

Thông tin là một vũ khí, và là vũ khí không kém phần nguy hiểm so với vũ khí hạt nhân hoặc hóa học - chỉ có điều nó không hoạt động về mặt vật lý mà hoạt động về mặt tâm lý. Nhân loại cần suy nghĩ về điều gì quan trọng hơn đối với mình trong trường hợp này – tự do hay kiểm soát.

Các khái niệm triết học mới nhất gắn liền với sự phát triển của công nghệ thông tin và nỗ lực tìm hiểu chúng đã cho thấy những hạn chế của cả chủ nghĩa duy vật khoa học tự nhiên, vốn thống trị trong suốt thế kỷ 19 và đầu thế kỷ 20, lẫn chủ nghĩa duy tâm cực đoan, vốn phủ nhận tầm quan trọng của thế giới vật chất. Điều quan trọng đối với tư tưởng hiện đại, đặc biệt là tư tưởng phương Tây, là phải vượt qua tính nhị nguyên này trong tư duy, khi thế giới xung quanh chúng ta được phân chia rõ ràng thành vật chất và lý tưởng. Con đường dẫn đến điều này là sự đối thoại giữa các nền văn hóa, sự so sánh các quan điểm khác nhau về các hiện tượng xung quanh.

Nghịch lý thay, công nghệ thông tin lại có thể đóng một vai trò quan trọng trong quá trình này. Mạng máy tính và đặc biệt là Internet không chỉ là nguồn tài nguyên giải trí và hoang dã hoạt động thương mại, nó còn là phương tiện giao tiếp đầy ý nghĩa, gây tranh cãi giữa đại diện của các nền văn minh khác nhau trong thế giới hiện đại, cũng như đối thoại giữa quá khứ và hiện tại. Chúng ta có thể nói rằng Internet mở rộng ranh giới không gian và thời gian.

Và trong cuộc đối thoại giữa các nền văn hóa thông qua công nghệ thông tin, vai trò của ngôn ngữ với tư cách là phương tiện giao tiếp phổ quát lâu đời nhất vẫn rất quan trọng. Đó là lý do tại sao ngôn ngữ học, trong mối tương tác với toán học, triết học và khoa học máy tính, đã tái sinh và tiếp tục phát triển cho đến ngày nay. Xu hướng của hiện tại sẽ tiếp tục trong tương lai - “cho đến ngày tận thế”, như V. Wenders đã dự đoán 15 năm trước. Đúng, không biết khi nào kết thúc này sẽ xảy ra - nhưng điều đó có quan trọng bây giờ không, vì sớm hay muộn thì tương lai vẫn sẽ trở thành hiện tại.

Phụ lục 1

Ferdinand de Saussure

Nhà ngôn ngữ học người Thụy Sĩ Ferdinand de Saussure (1857-1913) được nhiều người coi là người sáng lập ngôn ngữ học hiện đại trong nỗ lực mô tả cấu trúc của ngôn ngữ hơn là lịch sử của các ngôn ngữ và hình thức ngôn ngữ cụ thể. Trên thực tế, phương pháp của Chủ nghĩa Cấu trúc trong ngôn ngữ học và nghiên cứu văn học cũng như một nhánh quan trọng của Ký hiệu học tìm thấy điểm khởi đầu chính trong tác phẩm của ông vào đầu thế kỷ XX. Người ta thậm chí còn lập luận rằng sự phức tạp của các chiến lược và quan niệm được gọi là "chủ nghĩa hậu cấu trúc" - tác phẩm của Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes và những người khác - được đề xuất bởi công trình ngôn ngữ học của Saussure và cách đọc đảo chữ của thơ Latin muộn, có thể thấy rõ nhất qua cách mà tác phẩm của Saussure về ngôn ngữ học và diễn giải tham gia vào những biến đổi trong phương thức hiểu biết trên nhiều lĩnh vực trí tuệ từ vật lý đến chủ nghĩa hiện đại văn học. đến phân tâm học và triết học vào đầu thế kỷ XX. Như Algirdas Julien Greimas và Joseph Courtés tranh luận trong Ký hiệu học và ngôn ngữ: Từ điển phân tích, dưới tiêu đề “Giải thích”, một phương thức diễn giải mới đã xuất hiện vào đầu thế kỷ XX mà họ đồng nhất với ngôn ngữ học Saussure, Hiện tượng học Husserlian và phân tâm học Freud. Trong phương thức này, “sự diễn giải không còn là vấn đề gán một nội dung nhất định cho một hình thức mà lẽ ra sẽ thiếu nội dung đó; đúng hơn, nó là một cách diễn đạt hình thành theo một cách khác nội dung tương đương của một yếu tố biểu đạt trong một hệ thống ký hiệu học nhất định” ( 159). Trong cách hiểu “diễn giải” này, hình thức và nội dung không khác biệt; đúng hơn, mọi "hình thức", nói cách khác, cũng là một "nội dung" ngữ nghĩa, một "hình thức biểu đạt", do đó cách diễn giải đó đưa ra một cách diễn giải tương tự về một cái gì đó đã có ý nghĩa trong một số hệ thống biểu đạt khác.

Sự diễn giải lại hình thức và sự hiểu biết như vậy - điều mà Claude Lévi-Strauss mô tả trong một trong những cách trình bày có tính lập trình nhất của ông về khái niệm chủ nghĩa cấu trúc, trong "Cấu trúc và hình thức: Những suy ngẫm về một tác phẩm của Vladimir Propp" - ẩn chứa trong Khóa học để lại của Saussure trong Ngôn ngữ học đại cương (1916, chuyển ngữ, 1959, 1983). Khi còn sống, Saussure xuất bản tương đối ít, và tác phẩm chính của ông, Khóa học, là bản chép lại của một số khóa học về ngôn ngữ học đại cương mà ông tổ chức vào năm 1907-11. Trong Khóa học Saussure kêu gọi nghiên cứu ngôn ngữ một cách "khoa học" trái ngược với công việc về ngôn ngữ học lịch sử đã được thực hiện vào thế kỷ 19. Công việc đó là một trong những thành tựu vĩ đại của trí tuệ phương Tây: lấy những từ cụ thể làm khối xây dựng. ngôn ngữ, ngôn ngữ học lịch sử (hoặc "lịch đại") truy tìm nguồn gốc và sự phát triển của các ngôn ngữ phương Tây từ một nguồn ngôn ngữ chung giả định, đầu tiên là ngôn ngữ "Ấn-Âu" và sau đó là ngôn ngữ "tiền Ấn-Âu" trước đó.

Chính nghiên cứu này về sự xuất hiện duy nhất của các từ, với giả định đồng thời rằng "đơn vị" cơ bản của ngôn ngữ, trên thực tế, là sự tồn tại tích cực của các "yếu tố từ" này mà Saussure đã đặt câu hỏi. Công việc của ông là một nỗ lực nhằm giảm bớt khối lượng sự thật về ngôn ngữ, được nghiên cứu rất tỉ mỉ bởi ngôn ngữ học lịch sử, thành một số lượng mệnh đề có thể quản lý được. “Trường phái so sánh” của Ngữ văn thế kỷ 19, Saussure nói trong Khóa học, “đã không thành công trong việc thiết lập nền khoa học thực sự về ngôn ngữ học” bởi vì “nó đã thất bại trong việc tìm kiếm ra ngoàiông lập luận rằng “bản chất” đó không chỉ được tìm thấy trong những từ “cơ bản” mà một ngôn ngữ bao gồm – những sự kiện (hoặc “bản chất”) có vẻ “tích cực” của ngôn ngữ – nhưng trong những mối quan hệ hình thức làm nảy sinh những “chất” đó.

Việc xem xét lại ngôn ngữ một cách có hệ thống của Saussure dựa trên ba giả định: Thứ nhất, nghiên cứu khoa học về ngôn ngữ cần phát triển và nghiên cứu hệ thống hơn là lịch sử của các hiện tượng ngôn ngữ. Vì lý do này, ông phân biệt giữa những sự xuất hiện cụ thể của ngôn ngữ - đặc thù của nó. “các sự kiện lời nói,” mà ông thiết kế như lời tạm tha – và đối tượng thích hợp của ngôn ngữ học, hệ thống (hoặc “mật mã”) chi phối các sự kiện đó, mà ông thiết kế như ngôn ngữ, hơn nữa, một nghiên cứu có hệ thống như vậy đòi hỏi một “sự đồng bộ”. quan niệm về mối quan hệ giữa các yếu tố của ngôn ngữ ở một thời điểm cụ thể hơn là nghiên cứu “lịch đại” về sự phát triển của ngôn ngữ qua lịch sử.

Giả định này đã dẫn đến cái mà Roman Jakobson vào năm 1929 gọi là "chủ nghĩa cấu trúc", trong đó "bất kỳ tập hợp hiện tượng nào được khoa học đương đại xem xét đều được coi không phải là một sự kết tụ cơ học mà là một tổng thể cấu trúc mà quan niệm cơ học về các quá trình dẫn đến." câu hỏi về chức năng của chúng" ("Lãng mạn" 711). Trong đoạn văn này, Jakobson đang trình bày rõ ý định của Saussure trong việc định nghĩa ngôn ngữ học như một hệ thống khoa học chứ không phải là sự giải thích đơn giản, "máy móc" về những sự ngẫu nhiên lịch sử. Hơn nữa, cùng với điều này, Jakobson cũng đang mô tả giả định cơ bản thứ hai trong Saussurean – ngày nay chúng ta có thể gọi nó là “cấu trúc” – ngôn ngữ học: rằng các yếu tố cơ bản của ngôn ngữ chỉ có thể được nghiên cứu trong mối quan hệ với chức năng của chúng chứ không phải trong mối quan hệ với nguyên nhân của chúng. . Thay vì nghiên cứu các sự kiện và thực thể cụ thể và duy nhất (tức là lịch sử của các “từ” Ấn-Âu cụ thể), những sự kiện và thực thể đó phải được đặt trong một khuôn khổ hệ thống trong đó chúng có liên quan đến cái gọi là các sự kiện và thực thể khác. Đây là một sự định hướng lại căn bản trong việc nhận thức kinh nghiệm và hiện tượng, một điều mà triết gia Ernst Cassirer đã so sánh tầm quan trọng của nó với “khoa học mới của Galileo mà vào thế kỷ XVII đã thay đổi toàn bộ khái niệm của chúng ta về thế giới vật chất” (trích dẫn trong Culler, Pursuit 24) . Sự thay đổi này, như Greimas và Courtés lưu ý, nhận thức lại “sự diễn giải” và do đó nhận thức lại chính sự giải thích và sự hiểu biết. Thay vì sự giải thích tồn tại dưới dạng các nguyên nhân của một hiện tượng, do đó, với tư cách là một "kết quả", về mặt nào đó nó phụ thuộc vào các nguyên nhân của nó, sự giải thích ở đây bao gồm việc đặt một hiện tượng phụ thuộc vào "chức năng" hướng tới tương lai của nó hoặc "mục đích." Việc giải thích không còn độc lập với những ý định hay mục đích của con người (mặc dù những ý định đó có thể mang tính khách quan, mang tính cộng đồng, hoặc theo thuật ngữ của Freud là "vô thức").

Trong ngôn ngữ học của mình, Saussure thực hiện sự biến đổi này một cách cụ thể bằng việc định nghĩa lại “từ” ngôn ngữ, cái mà ông mô tả là “dấu hiệu” ngôn ngữ và định nghĩa theo thuật ngữ chức năng luận. Ông lập luận rằng dấu hiệu là sự kết hợp của "một khái niệm và một hình ảnh âm thanh", mà ông gọi là "được biểu đạt và người biểu đạt" (66-67; bản dịch năm 1983 của Roy Harris đưa ra các thuật ngữ "ý nghĩa" và "tín hiệu"). “sự kết hợp” của chúng là “chức năng” ở chỗ cả cái được biểu đạt và cái biểu đạt đều không phải là “nguyên nhân” của cái kia; đúng hơn, “mỗi cái có giá trị từ cái kia” (8). và đưa ra giả định cơ bản của ngôn ngữ học lịch sử, cụ thể là, sự đồng nhất của các đơn vị cơ bản của ngôn ngữ và ý nghĩa (tức là “từ ngữ”), phải được phân tích chặt chẽ. Lý do chúng ta có thể nhận ra những lần xuất hiện khác nhau của từ "cây" là ". cùng một từ không phải vì từ đó được xác định bởi những phẩm chất vốn có – nó không phải là một “sự kết tụ máy móc” của những phẩm chất đó – mà bởi vì nó được xác định như một phần tử trong một hệ thống, “tổng thể cấu trúc” của ngôn ngữ.

Một định nghĩa quan hệ (hoặc "dấu phụ") như vậy về một thực thể chi phối quan niệm về tất cả các yếu tố của ngôn ngữ trong ngôn ngữ học cấu trúc. Điều này thể hiện rõ nhất ở thành tựu ấn tượng nhất của ngôn ngữ học Saussure, sự phát triển các khái niệm về “âm vị” và “đặc điểm riêng biệt” của ngôn ngữ. Âm vị là đơn vị biểu đạt và khớp nối nhỏ nhất của một ngôn ngữ. Chúng không phải là những âm thanh xuất hiện trong ngôn ngữ mà là những “hình ảnh âm thanh” Saussure đề cập, được người nói nắm bắt – nắm bắt một cách phi thường – như là truyền đạt ý nghĩa. (Do đó, Elmar Holenstein mô tả ngôn ngữ học của Jakobson, theo Saussure theo những cách quan trọng, là “chủ nghĩa cấu trúc hiện tượng học.”) Chính vì lý do này mà người phát ngôn hàng đầu của Chủ nghĩa cấu trúc trường phái Praha, Jan Mukarovsky, đã lưu ý vào năm 1937 rằng “cấu trúc. . . là một hiện tượng luận chứ không phải một thực tại kinh nghiệm; bản thân nó không phải là tác phẩm mà là một tập hợp các mối quan hệ chức năng nằm trong ý thức của một tập thể (thế hệ, môi trường, v.v.)” (trích dẫn trong Galan 35). Tương tự, Lévi-Strauss, người phát ngôn hàng đầu của chủ nghĩa cấu trúc Pháp , lưu ý vào năm 1960 rằng "cấu trúc không có nội dung riêng biệt; bản thân nó là nội dung, và tổ chức logic trong đó nó bị giam giữ được coi là thuộc tính của cái thực” (167; xem thêm Jakobson, Nguyên tắc cơ bản 27-28).

Khi đó, âm vị, những yếu tố nhỏ nhất có thể cảm nhận được của ngôn ngữ, không phải là những đối tượng tích cực mà là một “hiện thực hiện tượng học”. Ví dụ, trong tiếng Anh, âm vị /t/ có thể được phát âm theo nhiều cách khác nhau, nhưng trong mọi trường hợp, người nói tiếng Anh sẽ nhận ra nó có chức năng như một /t/. Một âm t bật hơi (tức là một âm t được phát âm với hơi thở giống h sau nó), một âm t cao hoặc thấp, một âm t mở rộng, v.v., tất cả sẽ hoạt động theo cách giống nhau trong việc phân biệt ý nghĩa của từ. “làm” và “làm” bằng tiếng Anh. Hơn nữa, sự khác biệt giữa các ngôn ngữ đến mức các biến thể âm vị trong một ngôn ngữ có thể tạo thành các âm vị riêng biệt trong ngôn ngữ khác; Do đó, tiếng Anh phân biệt giữa /l/ và /r/, trong khi các ngôn ngữ khác có cấu trúc chặt chẽ đến mức những cách phát âm này được coi là các biến thể của cùng một âm vị (như t bật hơi và không bật hơi trong tiếng Anh). Trong mọi ngôn ngữ tự nhiên, số lượng lớn các từ có thể có là sự kết hợp của một số lượng nhỏ âm vị. Ví dụ, tiếng Anh có ít hơn 40 âm vị kết hợp với nhau để tạo thành hơn một triệu từ khác nhau.

Bản thân các âm vị của ngôn ngữ là những cấu trúc đặc trưng được tổ chức một cách có hệ thống. Trong những năm 1920 và 1930, theo sự hướng dẫn của Saussure, Jakobson và N. S. Trubetzkoy đã phân lập được “các đặc điểm riêng biệt” của âm vị. Những đặc điểm này dựa trên cấu trúc sinh lý của các cơ quan phát âm – lưỡi, răng, các dây thanh âm, v.v. – đó là Saussure đề cập trong Khóa học và được Harris mô tả là "ngữ âm sinh lý" ( 39; bản dịch trước đó của Baskin sử dụng thuật ngữ "âm vị học" [(1959) 38]) – và chúng kết hợp thành "bó" các cặp đối lập nhị phân để tạo thành các âm vị. Ví dụ, trong tiếng Anh, sự khác biệt giữa /t/ và /d/ là sự hiện diện hay vắng mặt của “giọng” (sự tham gia của các hợp âm) và ở mức độ phát âm, các âm vị này xác định lẫn nhau. Theo cách này, âm vị học là một ví dụ cụ thể về quy luật chung của ngôn ngữ được Saussure mô tả: Trong ngôn ngữ chỉ có những khác biệt. Quan trọng hơn nữa: sự khác biệt thường bao hàm những điều khoản tích cực mà giữa sự khác biệt đó được thiết lập; nhưng trong ngôn ngữ chỉ có những khác biệt mà không có những thuật ngữ tích cực. Cho dù chúng ta lấy cái được biểu đạt hay cái biểu đạt, ngôn ngữ không có ý tưởng hay âm thanh nào tồn tại trước hệ thống ngôn ngữ. (120)

Trong khuôn khổ này, bản sắc ngôn ngữ được xác định không phải bởi những phẩm chất vốn có mà bởi những mối quan hệ (“cấu trúc”) mang tính hệ thống.

Tôi đã nói rằng âm vị học “đi theo sự dẫn dắt” của Saussure, bởi vì mặc dù phân tích của ông về sinh lý học của việc sản sinh ngôn ngữ “ngày nay,” như Harris nói, “sẽ được gọi là “vật lý”, trái ngược với “tâm lý” hoặc “chức năng”. "" (Đọc 49), tuy nhiên, trong Khóa học, ông đã trình bày rõ phương hướng và phác thảo của việc phân tích chức năng của ngôn ngữ. Tương tự, tác phẩm mở rộng duy nhất của ông, Mémoire sur le système primitif des voyelles dans les langues Indo-Européennes (Hồi ký về hệ thống nguyên âm nguyên thủy trong các ngôn ngữ Ấn-Âu), xuất hiện năm 1878, hoàn toàn nằm trong dự án của thế kỷ 19- ngôn ngữ học lịch sử thế kỷ. Tuy nhiên, trong tác phẩm này, như Jonathan Culler đã thảo luận, Saussure đã chứng minh “sự phong phú của việc suy nghĩ về ngôn ngữ như một hệ thống các mục thuần túy mang tính quan hệ, ngay cả khi thực hiện nhiệm vụ tái thiết lịch sử” (Saussure 66). Bằng cách phân tích mối quan hệ cấu trúc có hệ thống giữa các âm vị để giải thích các mô hình xen kẽ nguyên âm trong các ngôn ngữ Ấn-Âu hiện có, Saussure cho rằng ngoài một số âm vị khác nhau /a/, chắc chắn phải có một âm vị khác có thể được mô tả chính thức. Culler kết luận: “Điều khiến công trình của Saussure rất ấn tượng là thực tế là gần 50 năm sau, khi chữ hình nêm Hittite được phát hiện và giải mã, người ta phát hiện ra nó có chứa một âm vị, viết là h, hoạt động giống như Saussure đã dự đoán”. . Ông đã phát hiện ra, bằng một phân tích thuần túy hình thức, cái mà ngày nay được gọi là thanh quản của người Ấn-Âu" (66).

Quan niệm này về sự xác định mang tính quan hệ hoặc dấu phụ của các yếu tố tạo nghĩa, vừa tiềm ẩn vừa rõ ràng trong Khóa học, gợi ý một giả định thứ ba chi phối ngôn ngữ học cấu trúc, cái mà Saussure gọi là "bản chất độc đoán của dấu hiệu". Bằng cách này, ông muốn nói rằng mối quan hệ giữa cái biểu đạt và cái được biểu đạt trong ngôn ngữ là không bao giờ cần thiết (hoặc “có động cơ”): người ta có thể dễ dàng tìm thấy arbbre âm thanh ký hiệu cũng như cây ký hiệu để hợp nhất với khái niệm “cây”. Nhưng hơn thế nữa, điều đó có nghĩa là việc ký tên cũng mang tính tùy ý: người ta có thể dễ dàng định nghĩa khái niệm “cây” theo chất lượng gỗ của nó (loại trừ cây cọ) cũng như theo kích thước của nó (loại trừ “cây thân gỗ thấp” mà chúng ta gọi là cây bụi). Điều này cần làm rõ rằng việc đánh số các giả định mà tôi vừa trình bày không thể hiện thứ tự ưu tiên: mỗi giả định – bản chất hệ thống của ý nghĩa (được hiểu rõ nhất bằng cách nghiên cứu ngôn ngữ “đồng bộ”), bản chất quan hệ hoặc “dấu phụ” của các yếu tố về ý nghĩa, tính chất tùy tiện của các dấu hiệu – lấy giá trị của nó từ những dấu hiệu khác.

Nghĩa là, ngôn ngữ học Saussure hiểu các hiện tượng mà nó nghiên cứu trong các mối quan hệ bao quát của sự kết hợp và tương phản trong ngôn ngữ. Theo quan niệm này, ngôn ngữ vừa là quá trình diễn đạt ý nghĩa (ký hiệu) vừa là sản phẩm của nó (giao tiếp), và hai chức năng này của ngôn ngữ không giống nhau cũng như không hoàn toàn đồng nhất (xem Schleifer, “Giải cấu trúc”). Ở đây, chúng ta có thể thấy sự xen kẽ giữa hình thức và nội dung mà Greimas và Courtés mô tả theo cách giải thích của chủ nghĩa hiện đại: ngôn ngữ trình bày những sự tương phản xác định chính thức các đơn vị của nó và các đơn vị này kết hợp ở các cấp độ tiếp theo để tạo ra nội dung biểu đạt. Vì các yếu tố của ngôn ngữ là tùy ý, hơn nữa, không thể nói sự tương phản hay sự kết hợp nào là cơ bản. , trong ngôn ngữ, những đặc điểm riêng biệt kết hợp để tạo thành các âm vị tương phản ở một mức độ hiểu biết khác, các âm vị kết hợp để tạo thành các hình vị tương phản, các hình vị kết hợp để tạo thành từ, các từ kết hợp để tạo thành câu, v.v. Trong mỗi trường hợp, toàn bộ âm vị, từ, hoặc câu, v.v., lớn hơn tổng các phần của nó (giống như nước, H2O, trong ví dụ của Saussure [(1959) 103] lớn hơn sự kết tụ cơ học của hydro và oxy).

Ba giả định của Khóa học về Ngôn ngữ học đại cương đã khiến Saussure kêu gọi một ngành khoa học mới của thế kỷ 20 vượt xa khoa học ngôn ngữ để nghiên cứu "đời sống của các dấu hiệu trong xã hội". Saussure đặt tên cho khoa học này là "ký hiệu học (từ tiếng Hy Lạp semeîon "dấu hiệu")" (16). "Khoa học" về ký hiệu học, được thực hiện ở Đông Âu vào những năm 1920 và 1930 và ở Paris trong những năm 1950 và 1960, đã mở rộng việc nghiên cứu ngôn ngữ và các cấu trúc ngôn ngữ sang các tạo tác văn học được cấu thành (hoặc khớp nối) bởi các cấu trúc đó. Hơn nữa, trong suốt giai đoạn cuối sự nghiệp của mình, ngay cả khi đang giảng dạy các khóa học về ngôn ngữ học đại cương, Saussure vẫn theo đuổi việc phân tích "ký hiệu học" của riêng mình về thơ Latinh thời kỳ cuối trong nỗ lực khám phá những cách đảo chữ được che giấu một cách có chủ ý của các tên riêng. Phương pháp nghiên cứu này về nhiều mặt trái ngược với chủ nghĩa duy lý chức năng trong các phân tích ngôn ngữ của ông: nó đã cố gắng, như Saussure đề cập trong một trong 99 cuốn sổ ghi chép mà ông theo đuổi nghiên cứu này, để xem xét một cách có hệ thống vấn đề về “cơ hội”, cái mà " trở thành nền tảng tất yếu của mọi thứ" (trích trong Starobinski 101). Một nghiên cứu như vậy, như chính Saussure nói, tập trung vào “sự thật vật chất” về cơ hội và ý nghĩa (trích dẫn 101), do đó “từ chủ đề” mà phép đảo ngữ mà Saussure đang tìm kiếm, như Jean Starobinski lập luận, “là dành cho nhà thơ”. , một nhạc cụ chứ không phải là mầm mống sống còn của bài thơ. Bài thơ buộc phải sử dụng lại chất liệu ngữ âm của từ chủ đề”(45). Trong phân tích này, Starobinski nói, "Saussure không đánh mất chính mình trong việc tìm kiếm những ý nghĩa ẩn giấu." Thay vào đó, tác phẩm của ông dường như thể hiện mong muốn trốn tránh mọi vấn đề nảy sinh từ ý thức: “Vì thơ không chỉ được hiện thực hóa bằng ngôn từ mà là cái gì đó sinh ra từ ngôn từ, nên nó thoát khỏi sự kiểm soát tùy tiện của ý thức mà chỉ phụ thuộc vào một loại tính pháp lý của ngôn ngữ. " (121).

Đó là nỗ lực của Saussure nhằm khám phá những tên riêng trong thơ Latinh hậu kỳ - điều mà Tzvetan Todorov gọi là sự rút gọn của một "từ". . . đối với người ký hiệu của nó"(266) – nhấn mạnh một trong những yếu tố chi phối phân tích ngôn ngữ của ông, tính chất tùy tiện của dấu hiệu. (Nó cũng nhấn mạnh bản chất hình thức của ngôn ngữ học Saussurean - “Ngôn ngữ,” ông khẳng định, “là một hình thức chứ không phải một thực thể" - vốn loại bỏ một cách hiệu quả ngữ nghĩa như một đối tượng phân tích chính.) Như Todorov kết luận, công trình của Saussure ngày nay tỏ ra đồng nhất một cách đặc biệt ở chỗ nó từ chối chấp nhận các hiện tượng mang tính biểu tượng. . . . Trong nghiên cứu về đảo chữ cái, ông chỉ chú ý đến hiện tượng lặp lại chứ không chú ý đến hiện tượng gợi nhớ. . . . Trong nghiên cứu của mình về Nibelungen, ông chỉ nhận ra các biểu tượng để cho rằng chúng là do cách đọc nhầm: vì chúng không có chủ ý nên các biểu tượng không tồn tại. Cuối cùng, trong các khóa học về ngôn ngữ học đại cương, ông suy ngẫm về sự tồn tại của ký hiệu học, và do đó, có những dấu hiệu khác ngoài dấu hiệu ngôn ngữ học; nhưng sự khẳng định này ngay lập tức bị hạn chế bởi thực tế là ký hiệu học chỉ dành cho một loại dấu hiệu duy nhất: những dấu hiệu tùy tiện. (269-70)

Nếu điều này đúng thì đó là vì Saussure không thể hình dung được “ý định” nếu không có chủ ngữ; ông không thể thoát khỏi sự đối lập giữa hình thức và nội dung mà tác phẩm của ông đã gây ra nhiều nghi vấn. Thay vào đó, ông dùng đến "tính hợp pháp về mặt ngôn ngữ". Một mặt, nằm giữa các quan niệm thế kỷ 19 về lịch sử, tính chủ quan và phương thức giải thích nhân quả do các quan niệm này chi phối và mặt khác là các quan niệm “cấu trúc luận” thế kỷ 20 về cái mà Lévi-Strauss gọi là “Chủ nghĩa Kant không có một chủ thể siêu việt" (được trích dẫn trong Connerton 23) – những quan niệm xóa bỏ sự đối lập giữa hình thức và nội dung (hoặc chủ thể và đối tượng) và thứ bậc tiền cảnh và hậu cảnh trong chủ nghĩa cấu trúc toàn diện, phân tâm học, và thậm chí cả cơ học lượng tử – tác phẩm của Ferdinand de Saussure trong ngôn ngữ học và ký hiệu học đã mô tả một thời điểm tín hiệu trong việc nghiên cứu ý nghĩa và văn hóa.

Ronald Schleifer

Phụ lục 2

Ferdinand de Saussure (bản dịch)

Nhà ngôn ngữ học người Thụy Sĩ Ferdinand de Saussure (1857-1913) được coi là người sáng lập ngôn ngữ học hiện đại - nhờ nỗ lực mô tả cấu trúc của ngôn ngữ hơn là lịch sử ngôn ngữ riêng lẻ và các dạng từ. Nhìn chung, nền tảng của các phương pháp cấu trúc trong ngôn ngữ học và phê bình văn học, và ở một mức độ lớn, ký hiệu học đã được đặt trong các tác phẩm của ông vào đầu thế kỷ XX. Người ta đã chứng minh rằng các phương pháp và khái niệm của cái gọi là “chủ nghĩa hậu cấu trúc”, được phát triển trong các tác phẩm của Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes và những người khác, có nguồn gốc từ các tác phẩm ngôn ngữ học của Saussure và cách đọc đảo chữ. của thơ La Mã muộn. Cần lưu ý rằng công trình của Saussure về ngôn ngữ học và giải thích ngôn ngữ giúp kết nối một loạt các ngành trí tuệ, từ vật lý đến đổi mới văn học, phân tâm học và triết học đầu thế kỷ XX. A. J. Greimas và J. Courtet viết trong Ký hiệu học và Ngôn ngữ: “Từ điển phân tích với tựa đề “Diễn giải” như một kiểu diễn giải mới xuất hiện vào đầu thế kỷ XX cùng với ngôn ngữ học của Saussure, hiện tượng học của Husserl và phân tâm học. của Freud. Trong trường hợp này, “sự diễn giải không phải là sự quy kết một nội dung nhất định vào một hình thức lẽ ra không có nó; đúng hơn, nó là một cách diễn giải hình thành theo một cách khác cùng một nội dung của một yếu tố quan trọng trong một hệ thống ký hiệu học nhất định” (159) . Trong cách hiểu “diễn giải” này, hình thức và nội dung không thể tách rời; ngược lại, mỗi hình thức đều thấm nhuần ý nghĩa ngữ nghĩa (“hình thức có ý nghĩa”), do đó việc diễn giải đưa ra một cách kể lại mới, tương tự về một điều gì đó có ý nghĩa trong một hệ thống ký hiệu khác.

Một cách hiểu tương tự về hình thức và nội dung, được trình bày bởi Claude Lévi-Strauss trong một trong những tác phẩm mang tính lập trình của chủ nghĩa cấu trúc, (“Cấu trúc và hình thức: Những suy ngẫm về tác phẩm của Vladimir Propp”) có thể được thấy trong cuốn sách được xuất bản sau khi Saussure “A Course in Ngôn ngữ học đại cương” (1916, trans., 1959, 1983). Saussure ít xuất bản trong suốt cuộc đời của ông; The Course, tác phẩm chính của ông, được biên soạn từ ghi chú của các sinh viên tham dự các bài giảng của ông về ngôn ngữ học đại cương vào năm 1907-11. Trong cuốn The Course, Saussure kêu gọi nghiên cứu ngôn ngữ một cách “khoa học”, đối chiếu nó với ngôn ngữ học lịch sử so sánh của thế kỷ 19. Công trình này có thể coi là một trong những thành tựu vĩ đại nhất của tư tưởng phương Tây: lấy các từ riêng lẻ làm cơ sở làm yếu tố cấu trúc của ngôn ngữ, ngôn ngữ học lịch sử (hay “lịch đại”) đã chứng minh nguồn gốc và sự phát triển của các ngôn ngữ Tây Âu từ một hệ thống Ấn Độ chung. - Ngôn ngữ châu Âu - và một ngôn ngữ Ấn-Âu nguyên thủy.

Chính nghiên cứu này về sự xuất hiện duy nhất của các từ, với giả định kèm theo rằng "đơn vị" cơ bản của ngôn ngữ, trên thực tế, là sự tồn tại tích cực của các "yếu tố từ" này mà Saussure đã đặt câu hỏi. Công việc của ông là một nỗ lực nhằm giảm bớt nhiều sự thật về ngôn ngữ đã được nghiên cứu một cách tình cờ. ngôn ngữ học so sánh, đối với một số ít định lý. Saussure viết, trường phái ngữ văn so sánh của thế kỷ 19 “đã không thành công trong việc tạo ra một trường phái ngôn ngữ học thực sự” bởi vì “nó không hiểu được bản chất của đối tượng nghiên cứu” (3). Ông lập luận rằng “bản chất” này không chỉ nằm ở từng từ riêng lẻ – “những chất tích cực” của ngôn ngữ – mà còn ở những mối liên hệ hình thức giúp những chất này tồn tại.

“Bài kiểm tra” ngôn ngữ của Saussure dựa trên ba giả định. Thứ nhất: sự hiểu biết khoa học về ngôn ngữ không dựa trên lịch sử mà dựa trên một hiện tượng cấu trúc. Do đó, ông phân biệt giữa các hiện tượng riêng lẻ của ngôn ngữ - “các sự kiện lời nói”, mà ông định nghĩa là “tạm tha” - và theo quan điểm của ông, đối tượng nghiên cứu ngôn ngữ học, hệ thống (mật mã, cấu trúc) kiểm soát các sự kiện này (“mật mã, cấu trúc) thích hợp” ngôn ngữ”). Hơn nữa, việc nghiên cứu có hệ thống như vậy đòi hỏi một khái niệm “đồng bộ” về mối quan hệ giữa các yếu tố của một ngôn ngữ tại một thời điểm nhất định, chứ không phải là một nghiên cứu “lịch đại” về sự phát triển của một ngôn ngữ trong suốt lịch sử của nó.

Giả thuyết này đã trở thành tiền thân của cái mà Roman Jakobson gọi là “chủ nghĩa cấu trúc” vào năm 1929 - một lý thuyết trong đó “bất kỳ tập hợp hiện tượng nào được nghiên cứu bởi khoa học hiện đại đều được coi không phải là sự tích lũy cơ học mà là một tổng thể cấu trúc trong đó thành phần mang tính xây dựng có tương quan với chức năng” (“Lãng mạn " 711). Trong đoạn văn này, Jakobson đã hình thành ý tưởng của Saussure về việc định nghĩa ngôn ngữ như một cấu trúc, trái ngược với việc liệt kê “máy” các sự kiện lịch sử. Ngoài ra, Jacobson còn phát triển một giả định khác của Saussure, giả định này đã trở thành tiền thân của ngôn ngữ học cấu trúc: các yếu tố cơ bản của ngôn ngữ cần được nghiên cứu không chỉ với nguyên nhân mà với chức năng của chúng. Các hiện tượng và sự kiện riêng lẻ (chẳng hạn như lịch sử nguồn gốc của các từ Ấn-Âu riêng lẻ) không nên được nghiên cứu riêng lẻ mà trong một hệ thống trong đó chúng có mối tương quan với các thành phần tương tự. Đây là một bước ngoặt căn bản trong việc so sánh các hiện tượng với thực tế xung quanh, tầm quan trọng của nó được nhà triết học Ernst Cassirer so sánh với “khoa học của Galileo, vào thế kỷ XVII đã lật đổ những ý tưởng về thế giới vật chất”. như Greimas và Kurte lưu ý, đã thay đổi ý tưởng “diễn giải”, và do đó, bản thân những lời giải thích bắt đầu được giải thích không liên quan đến lý do xuất hiện của chúng, mà liên quan đến tác động mà chúng có thể có trong hiện tại. và tương lai. Sự diễn giải đã không còn độc lập với ý định của con người (mặc dù thực tế là ý định có thể mang tính khách quan, “vô thức”) theo nghĩa của từ này.

Trong ngôn ngữ học của mình, Saussure đặc biệt chỉ ra bước ngoặt này ở sự thay đổi quan niệm về từ trong ngôn ngữ học, cái mà ông định nghĩa là dấu hiệu và mô tả dưới dạng chức năng của nó. Đối với ông, dấu hiệu là sự kết hợp giữa âm thanh và ý nghĩa, “được biểu thị và chỉ định” (66-67; trong bản dịch tiếng Anh năm 1983 của Roy Harris - “ký hiệu” và “tín hiệu”). Bản chất của kết nối này là “chức năng” (cả phần tử này và phần tử kia đều không thể tồn tại nếu không có phần tử kia); hơn nữa, “người này mượn phẩm chất của người kia” (8). Vì vậy, Saussure xác định thành phần cấu trúc chính của ngôn ngữ - dấu hiệu - và biến nó thành cơ sở ngôn ngữ học lịch sử sự đồng nhất của các dấu hiệu với các từ, đòi hỏi phải có sự phân tích đặc biệt nghiêm ngặt. Do đó, chúng ta có thể hiểu những ý nghĩa khác nhau của cùng một từ “cây” - không phải vì từ này chỉ là một tập hợp những phẩm chất nhất định, mà bởi vì nó được định nghĩa là một phần tử trong hệ thống ký hiệu, trong một “tổng thể cấu trúc”, trong ngôn ngữ.

Khái niệm thống nhất tương đối (“dấu phụ”) này làm cơ sở cho khái niệm về tất cả các yếu tố của ngôn ngữ trong ngôn ngữ học cấu trúc. Điều này đặc biệt rõ ràng trong khám phá độc đáo nhất của ngôn ngữ học Saussure, trong sự phát triển khái niệm “âm vị” và “đặc điểm riêng biệt” của ngôn ngữ. Âm vị là đơn vị ngôn ngữ nhỏ nhất có thể phát âm được và có ý nghĩa. Saussure lưu ý rằng chúng không chỉ là những âm thanh được tìm thấy trong một ngôn ngữ mà còn là “hình ảnh âm thanh”, được người bản xứ coi là có ý nghĩa. (Cần lưu ý rằng Elmar Holenstein gọi ngôn ngữ học của Jakobson, theo các quy định chính, tiếp tục các ý tưởng và khái niệm của Saussure, “chủ nghĩa cấu trúc hiện tượng học”). Đây là lý do tại sao diễn giả hàng đầu của trường phái cấu trúc luận Praha, Jan Mukarovsky, đã nhận xét vào năm 1937 rằng “cấu trúc. . . không phải là một khái niệm thực nghiệm mà là một khái niệm hiện tượng học; bản thân nó không phải là kết quả mà là một tập hợp các mối quan hệ có ý nghĩa của ý thức tập thể (của một thế hệ, những thế hệ khác, v.v.).” Một ý tưởng tương tự đã được Lévi-Strauss, người đứng đầu chủ nghĩa cấu trúc Pháp, đưa ra vào năm 1960: “Cấu trúc không có nội dung xác định; bản thân nó có ý nghĩa và cấu trúc logic chứa đựng nó là dấu ấn của thực tế.”

Ngược lại, âm vị, với tư cách là yếu tố ngôn ngữ nhỏ nhất được chấp nhận để nhận thức, đại diện cho một “hiện thực hiện tượng học” riêng biệt, không thể thiếu. Ví dụ, trong tiếng Anh, âm "t" có thể được phát âm theo nhiều cách khác nhau, nhưng trong mọi trường hợp, người nói tiếng Anh sẽ cảm nhận nó là "t". Phát âm có hơi thở, lưỡi lên cao hay thấp, âm “t” dài, v.v. sẽ phân biệt như nhau ý nghĩa của từ “to” và “do”. Hơn nữa, sự khác biệt giữa các ngôn ngữ là sự đa dạng của một âm thanh trong một ngôn ngữ có thể tương ứng với các âm vị khác nhau trong ngôn ngữ khác; ví dụ: “l” và “r” khác nhau trong tiếng Anh, trong khi ở các ngôn ngữ khác, chúng là các biến thể của cùng một âm vị (như “t” trong tiếng Anh, được phát âm là bật hơi và không bật hơi). Vốn từ vựng phong phú của bất kỳ ngôn ngữ tự nhiên nào cũng là tập hợp các tổ hợp của số lượng âm vị nhỏ hơn nhiều. Ví dụ, trong tiếng Anh, chỉ có 40 âm vị được sử dụng để phát âm và viết khoảng một triệu từ.

Âm thanh của một ngôn ngữ đại diện cho một tập hợp các đặc điểm được tổ chức một cách có hệ thống. Trong những năm 1920–1930, theo Saussure, Jacobson và N.S. Trubetskoy đã xác định “những đặc điểm riêng biệt” của âm vị. Những đặc điểm này dựa trên cấu trúc của các cơ quan phát âm - lưỡi, răng, dây thanh âm - Saussure lưu ý điều này trong Khóa học Ngôn ngữ học đại cương, và Harris gọi nó là "ngữ âm sinh lý" (bản dịch trước đó của Baskin sử dụng thuật ngữ "âm vị học" ) - chúng được kết nối thành các "nút » Durg chống lại một người bạn để tạo ra âm thanh. Ví dụ, trong tiếng Anh, sự khác biệt giữa “t” và “d” là sự hiện diện hay vắng mặt của “giọng nói” (độ căng của dây thanh âm) và mức độ của giọng nói để phân biệt âm vị này với âm vị khác. Vì vậy, âm vị học có thể được coi là một ví dụ của châm ngôn ngôn ngữ học tổng quát được Saussure mô tả: “Trong ngôn ngữ chỉ có những khác biệt”. Điều quan trọng hơn thậm chí không phải là điều này: sự khác biệt thường bao hàm những điều kiện chính xác mà nó nằm giữa; nhưng trong ngôn ngữ chỉ có sự khác biệt mà không có điều kiện chính xác. Cho dù chúng ta xem xét “ký hiệu” hay “được biểu đạt”, không có khái niệm hay âm thanh nào trong ngôn ngữ tồn tại trước khi hệ thống ngôn ngữ phát triển.

Trong một cấu trúc như vậy, các phép loại suy ngôn ngữ được xác định không phải bởi những đặc tính vốn có của chúng mà bởi những mối quan hệ mang tính hệ thống (“cấu trúc”).

Tôi đã đề cập rằng âm vị học trong quá trình phát triển của nó dựa trên ý tưởng của Saussure. Theo Harris, mặc dù phân tích của ông về sinh lý ngôn ngữ trong thời đại chúng ta “sẽ được gọi là “vật lý”, trái ngược với “tâm lý” hay “chức năng”, trong Khóa học, ông đã trình bày rõ ràng phương hướng và các nguyên tắc cơ bản của chức năng. phân tích ngôn ngữ. Tác phẩm duy nhất của ông được xuất bản trong suốt cuộc đời của ông, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Ghi chú về hệ thống nguyên âm gốc của các ngôn ngữ Ấn-Âu), xuất bản năm 1878, hoàn toàn phù hợp với ngôn ngữ học lịch sử so sánh của thế kỷ 19. Tuy nhiên, với tác phẩm này, như Jonathan Culler nói, Saussure đã cho thấy “sự thành công của ý tưởng về ngôn ngữ như một hệ thống các hiện tượng liên quan đến nhau, ngay cả với sự tái hiện lịch sử của nó”. Phân tích mối quan hệ giữa các âm vị, giải thích sự xen kẽ nguyên âm trong ngôn ngữ hiện đại Nhóm Ấn-Âu, Saussure gợi ý rằng ngoài một số âm “a” khác nhau, phải có những âm vị khác được mô tả chính thức. “Điều đặc biệt ấn tượng về công trình của Saussure,” Culler kết luận, “là gần 50 năm sau, với việc phát hiện và giải mã chữ hình nêm Hittite, một âm vị, được viết là “h,” đã được tìm thấy hoạt động đúng như Saussure dự đoán. Thông qua phân tích chính thức, ông đã phát hiện ra cái mà ngày nay được gọi là âm glottal trong các ngôn ngữ Ấn-Âu.

Trong khái niệm định nghĩa tương đối (dấu phụ) của các dấu hiệu, cả được thể hiện rõ ràng và ngụ ý trong Khóa học, có một giả định quan trọng thứ ba về ngôn ngữ học cấu trúc, được Saussure gọi là “bản chất tùy ý của dấu hiệu”. Điều này có nghĩa là mối quan hệ giữa âm thanh và ý nghĩa trong ngôn ngữ là không có động cơ: người ta có thể dễ dàng kết nối từ “arbre” và từ “cây” với khái niệm “cây”. Hơn nữa, điều này có nghĩa là âm thanh cũng tùy tiện: bạn có thể định nghĩa khái niệm “cây” bằng sự hiện diện của vỏ cây (trừ cây cọ) và theo kích thước (trừ “cây thân gỗ thấp” - cây bụi). Từ đó, có thể thấy rõ rằng tất cả các giả định mà tôi trình bày không được chia thành ít nhiều quan trọng: mỗi giả định - tính chất hệ thống của các dấu hiệu (dễ hiểu nhất trong nghiên cứu ngôn ngữ “đồng bộ”), bản chất tương đối (dấu phụ) của chúng, bản chất tùy tiện của các dấu hiệu - xuất phát từ phần còn lại.

Như vậy, trong ngôn ngữ học Saussure, hiện tượng được nghiên cứu được hiểu là một tập hợp những so sánh, đối lập của ngôn ngữ. Ngôn ngữ vừa là sự thể hiện ý nghĩa của từ (chỉ định) vừa là kết quả của chúng (giao tiếp) - và hai chức năng này không bao giờ trùng nhau (xem "Giải cấu trúc ngôn ngữ" của Shleifer). Chúng ta có thể nhận thấy sự xen kẽ giữa hình thức và nội dung mà Greimas và Courtet mô tả trong phiên bản mới nhất của cách giải thích: sự tương phản ngôn ngữ xác định các đơn vị cấu trúc của nó và các đơn vị này tương tác ở các cấp độ kế tiếp để tạo ra một nội dung có ý nghĩa nhất định. Vì các yếu tố của ngôn ngữ là ngẫu nhiên nên cả sự tương phản lẫn sự kết hợp đều không thể là cơ sở. Điều này có nghĩa là trong một ngôn ngữ, những đặc điểm riêng biệt hình thành nên sự tương phản về ngữ âm ở những mức độ hiểu khác nhau, các âm vị được kết hợp thành các hình vị tương phản, các hình vị được kết hợp thành từ, từ thành câu, v.v.. Trong mọi trường hợp, toàn bộ âm vị, từ, câu, v.v. không chỉ là tổng các phần của nó (cũng như nước, trong ví dụ của Saussure, không chỉ là sự kết hợp giữa hydro và oxy).

Ba giả định trong Khóa học Ngôn ngữ học đại cương đã đưa Saussure đến với ý tưởng về một ngành khoa học mới của thế kỷ XX, tách biệt với ngôn ngữ học, nghiên cứu “đời sống của các dấu hiệu trong xã hội”. Saussure gọi khoa học này là ký hiệu học (từ tiếng Hy Lạp “semeîon” - ký hiệu). "Khoa học" về ký hiệu học, phát triển ở Đông Âu vào những năm 1920 và 1930 và ở Paris trong những năm 1950 và 1960, đã mở rộng việc nghiên cứu ngôn ngữ và cấu trúc ngôn ngữ sang những phát hiện văn học được sáng tác (hoặc hình thành) bằng cách sử dụng các cấu trúc này. Ngoài ra, vào cuối sự nghiệp của mình, song song với khóa học về ngôn ngữ học tổng quát, Saussure đã thực hiện một phân tích "ký hiệu học" về thơ La Mã thời kỳ cuối, cố gắng khám phá những cách đảo chữ được cố tình sáng tác cho các tên riêng. Phương pháp này về nhiều mặt đối lập với chủ nghĩa duy lý trong phân tích ngôn ngữ của nó: đó là một nỗ lực, như Saussure viết trong một trong 99 cuốn sổ ghi chép của ông, để nghiên cứu trong một hệ thống vấn đề về “xác suất”, vốn “trở thành nền tảng của mọi thứ”. ” Nghiên cứu như vậy, như chính Saussure lập luận, giúp tập trung vào “khía cạnh vật chất” của xác suất; “Từ khóa”, một phép đảo chữ mà Saussure đang tìm kiếm, như Jean Starobinsky lập luận, “là một công cụ dành cho nhà thơ, chứ không phải là nguồn sống của bài thơ. Bài thơ có tác dụng đảo ngược âm thanh của từ khóa.” Theo Starobinsky, trong bài phân tích này "Saussure không đi sâu vào việc tìm kiếm những ý nghĩa ẩn giấu." Ngược lại, trong các tác phẩm của ông có sự mong muốn tránh né những câu hỏi liên quan đến ý thức: “vì thơ không chỉ được thể hiện bằng lời nói mà còn ở những gì những từ này tạo ra, nó vượt ra ngoài tầm kiểm soát của ý thức và chỉ phụ thuộc vào quy luật.” của ngôn ngữ.”

Nỗ lực của Saussure nhằm nghiên cứu tên riêng trong thơ La Mã thời kỳ cuối (Tsvetan Todorov gọi nó là sự rút gọn của "từ... ngay trước khi nó được viết ra") nhấn mạnh một trong những thành phần trong phân tích ngôn ngữ của ông - bản chất độc đoán của các dấu hiệu, cũng như bản chất hình thức của ngôn ngữ học Saussure (“Ngôn ngữ,” ông lập luận, “bản chất là hình thức, không phải hiện tượng”), loại trừ khả năng phân tích ý nghĩa. Todorov kết luận rằng ngày nay các tác phẩm của Saussure có vẻ nhất quán một cách đặc biệt ở chỗ họ miễn cưỡng nghiên cứu các biểu tượng [các hiện tượng có ý nghĩa được xác định rõ ràng]. . . . Khi nghiên cứu đảo chữ, Saussure chỉ chú ý đến sự lặp lại mà không chú ý đến các biến thể trước đó. . . . Khi nghiên cứu Nibelungenlied, ông chỉ xác định các ký hiệu để gán chúng cho những cách đọc sai: nếu chúng vô tình, thì các ký hiệu đó không tồn tại. Rốt cuộc, trong các bài viết của mình về ngôn ngữ học đại cương, ông gợi ý về sự tồn tại của một ký hiệu học mô tả nhiều thứ hơn là chỉ các dấu hiệu ngôn ngữ; nhưng giả định này bị hạn chế bởi thực tế là dấu hiệu học chỉ có thể mô tả các dấu hiệu ngẫu nhiên, tùy ý.

Nếu thực sự là như vậy thì đó chỉ là do anh ta không thể tưởng tượng được “ý định” nếu không có đối tượng; ông không thể vượt qua hoàn toàn khoảng cách giữa hình thức và nội dung - trong các tác phẩm của ông, điều này đã trở thành một câu hỏi. Thay vào đó, ông kêu gọi “tính hợp pháp về mặt ngôn ngữ”. Một mặt, nằm giữa các khái niệm thế kỷ 19 dựa trên lịch sử và phỏng đoán chủ quan, và các phương pháp diễn giải ngẫu nhiên dựa trên các khái niệm này, và mặt khác, các khái niệm theo chủ nghĩa cấu trúc, mà Lévi-Strauss gọi là “Chủ nghĩa Kant không có cơ sở siêu nghiệm”. tác nhân” - xóa bỏ sự đối lập giữa hình thức và nội dung (chủ thể và đối tượng), ý nghĩa và nguồn gốc trong cấu trúc luận, phân tâm học và cả cơ học lượng tử - Các công trình của Ferlinand de Saussure về ngôn ngữ học và ký hiệu học đánh dấu một bước ngoặt trong việc nghiên cứu ý nghĩa trong ngôn ngữ và văn hóa.

Ronald Shleifer

Văn học

1. Admoni V.G. Cơ sở lý luận ngữ pháp / V.G. khuyên răn; Viện Hàn lâm Khoa học Liên Xô.-M.: Nauka, 1964.-104p.

4. Arnold I.V. Cấu trúc ngữ nghĩa của một từ trong tiếng Anh hiện đại và phương pháp nghiên cứu nó. /I.V. Arnold – L.: Giáo dục, 1966. – 187 tr.

6. Bashlykov A.M. Hệ thống dịch tự động. / LÀ. Bashlykov, A.A. Sokolov. – M.: LLC “FIMA”, 1997. – 20 tr.

7. Baudouin de Courtenay: Di sản lý thuyết và tính hiện đại: Tóm tắt các báo cáo của hội nghị khoa học quốc tế / Ed. Kondratieva. – Kazan: KSU, 1995. – 224 tr.

8. Gladky A.V., Các yếu tố của ngôn ngữ học toán học. / . Gladky A.V., Melchuk I.A. – M., 1969. – 198 tr.

9. Golovin, B.N. Ngôn ngữ và thống kê. /B.N. Golovin – M., 1971. – 210 tr.

10. Zvegintsev, V.A. Ngôn ngữ học lý thuyết và ứng dụng. / V.A. Zvegintsev – M., 1969. – 143 tr.

11. Kasevich, V.B. Ngữ nghĩa. Cú pháp. Hình thái học. // V.B. Kasevich – M., 1988. – 292 tr.

12. Lekomtsev Yu.K. Giới thiệu về ngôn ngữ hình thức của ngôn ngữ học / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 tr., bệnh.

13. Di sản ngôn ngữ Baudouin de Courtenay cuối thế kỷ XX: Tóm tắt báo cáo hội nghị khoa học và thực tiễn quốc tế ngày 15-18/3/2000. – Krasnoyarsk, 2000. – 125 tr.

Matveeva G.G. Ý nghĩa ngữ pháp ẩn giấu và nhận dạng con người xã hội (“chân dung”) của người nói / G.G. Matveeva. – Rostov, 1999. – 174 tr.

14. Melchuk, I.A. Kinh nghiệm xây dựng mô hình ngôn ngữ “Ý nghĩa”<-->Text."/ I.A. Melchuk. - M., 1974. - 145 tr.

15. Nelyubin L.L. Dịch thuật và ngôn ngữ học ứng dụng/L.L. Nelyubin. – M.: Trường Cao Đẳng, 1983. – 207 tr.

16. Về các phương pháp nghiên cứu ngôn ngữ chính xác: về cái gọi là “ngôn ngữ học toán học” / O.S. Akhmanova, I.A. Paducheva và cộng sự – M., 1961. – 162 tr.

17. Piotrovsky L.G. Ngôn ngữ học toán học: Sách giáo khoa / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. – M.: Trường Cao Đẳng, 1977. – 160 tr.

18. Tương tự. Văn bản, máy móc, anh bạn. – L., 1975. – 213 tr.

19. Tương tự. Ngôn ngữ học ứng dụng / Ed. NHƯ Gerda. – L., 1986. – 176 tr.

20. Revzin, I.I. Các mô hình ngôn ngữ M., 1963. Revzin, I.I. Ngôn ngữ học cấu trúc hiện đại. Vấn đề và phương pháp. M., 1977. – 239 tr.

21. Revzin, I.I., Rosenzweig, V.Yu. Nguyên tắc cơ bản của dịch thuật tổng quát và dịch máy/Revzin I.I., Rosenzweig, V.Yu. – M., 1964. – 401 tr.

22. Slyusareva N.A. Lý thuyết của F. de Saussure dưới góc độ ngôn ngữ học hiện đại / N.A. Slyusareva. – M.: Nauka, 1975. – 156 tr.

23. Cú, L.Z. Ngôn ngữ học phân tích/ L.Z. Cú - M., 1970. - 192 tr.

24. Saussure F. de. Ghi chú về ngôn ngữ học đại cương / F. de Saussure; mỗi. từ fr. – M.: Tiến bộ, 2000. – 187 tr.

25. Tương tự. Giáo trình ngôn ngữ học đại cương/Transl. từ fr. – Ekaterinburg, 1999. –426 tr.

26. Thống kê lời nói và phân tích tự động văn bản/Trả lời. biên tập. R.G. Piotrovsky. L., 1980. – 223 tr.

27. Stoll, P. Sets. Logic. Các lý thuyết tiên đề./ R. Stoll; mỗi. từ tiếng Anh – M., 1968. – 180 tr.

28. Tenier, L. Cơ bản về cú pháp cấu trúc. M., 1988.

29. Ubin I.I. Tự động hóa các hoạt động dịch thuật ở Liên Xô / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. – M., 1989. – 28 tr.

30. Faure, R., Kofman, A., Denis-Papin, M. Toán học hiện đại. M., 1966.

31. Schenk, R. Xử lý thông tin khái niệm. M., 1980.

32. Shikhanovich, Yu.A. Giới thiệu về toán học hiện đại (khái niệm cơ bản). M., 1965

33. Shcherba L.V. Nguyên âm tiếng Nga về mặt định tính và định lượng / L.V. Shcherba – L.: Nauka, 1983. – 159 tr.

34. Abdulla-zade F. Công dân thế giới // Ogonyok - 1996. - Số 5. – P.13

35. V.A. Uspensky. Lời nói đầu dành cho độc giả của Tạp chí Văn học Mới những thông điệp ký hiệu học của Andrei Nikolaevich Kolmogorov. – Tạp chí văn học mới. –1997. – Số 24. – Trang 18-23

36. Perlovsky L. Ý thức, ngôn ngữ và văn hóa. - Kiến thức là sức mạnh. –2000. Số 4 – trang 20-33

37. Frumkina R.M. Về chúng tôi - xiên. // Tạp chí Nga. – 2000. – Số 1. – P. 12

38. Fitialov, S.Ya. Về mô hình cú pháp trong ngôn ngữ học cấu trúc // Các vấn đề của ngôn ngữ học cấu trúc. M., 1962.

39. Tương tự. Về sự tương đương của ngữ pháp NS và ngữ pháp phụ thuộc // Các vấn đề về ngôn ngữ học cấu trúc. M., 1967.

40. Chomsky, N. Cơ sở logic của lý thuyết ngôn ngữ học // Mới trong ngôn ngữ học. Tập. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure // báo chí. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45.nhấn. jhu.ru

46.ru.wikipedia.org