Объект и методы математической лингвистики. Лингвистический энциклопедический словарь

В течение последнего столетия языкознание всегда приводилось как пример науки, развивавшейся стреми­тельно и очень быстро достигшей методической зрело­сти. Уже в середине прошлого столетия молодая наука уверенно заняла место в кругу наук, обладавших тыся­челетней традицией, а один из виднейших ее представи­телей - А. Шлейхер - имел смелость полагать, что своими трудами он подводит уже итоговую линию.<113> История лингвистики, однако, показала, что такое мне­ние было слишком поспешно и неоправданно. В конце века языкознание претерпело первое большое потрясе­ние, связанное с критикой младограмматических прин­ципов, за которым последовали и другие. Следует при этом отметить, что все кризисы, которые мы можем вскрыть в истории науки о языке, как правило, не рас­шатывали ее основ, но, наоборот, способствовали укреплению и в конечном счете приносили с собой уточнение и усовершенствование методов лингвистического иссле­дования, расширяя вместе с тем и научную проблема­тику.

Но рядом с языкознанием жили и развивались также и другие науки, в том числе и большое количество но­вых. Особенно бурное развитие в наше время получили физические, химические и технические (так называемые «точные») науки, а над всеми ними воцарилась их тео­ретическая основа - математика. Точные науки не толь­ко сильно потеснили все гуманитарные науки, но в на­стоящее время стремятся «привести их в свою веру», подчинить своим обычаям, навязать им свои исследова­тельские методы. При создавшемся положении, исполь­зуя японское выражение, можно сказать, что ныне языковеды-филологи оскверняют собой самый краешек циновки, где торжествующе и привольно расположились точные науки во главе с математикой.

Не целесообразнее ли с точки зрения общенаучных интересов капитулировать перед математикой, целиком отдаться во власть ее методов, к чему уже откровенно призывают некоторые голоса 5 9 , и тем самым, быть мо­жет, обрести новую силу? Чтобы ответить на эти вопро­сы, надо сначала посмотреть, на что претендует матема­тика в данном случае, в какой области лингвистики находят свое применение математические методы, в ка­кой мере они согласуются со спецификой языкового ма­териала и способны ли они дать или даже только под­сказать ответы на те вопросы, которые ставит перед собой наука о языке.

С самого начала следует отметить, что и среди энту­зиастов нового, математического направления в лингви<114>стических исследованиях нет единства мнений относительно его целей и задач. Акад. А. А. Марков, первым применивший математические методы к языку, Болдрини, Юл, Мариотти рассматривают языковые элементы как подходящий иллюстративный материал для построе­ния квантитативных методов, или для статистических теорем, совершенно не задаваясь вопросом, представ­ляют ли интерес результаты такого исследования для лингвистов 6 0 . Росс полагает, что теория вероятностей и математическая статистика представляют инструмент или, как ныне предпочитают говорить, математическую модель для проверки и подтверждения тех лингвистиче­ских выводов, которые допускают числовую трактовку. Тем самым математические методы мыслятся лишь как вспомогательные средства лингвистического исследова­ния 6 1 . На гораздо большее претендует Хердан, который в своей книге не только подытожил и систематизировал все попытки математического изучения языковых проб­лем, но и попытался дать им четкую ориентацию в отно­шении дальнейшей работы. Изложение всего материала своей книги он ориентирует на «понимание литературной статистики (так он называет изучение текстов методами математической статистики. -В. 3.) как неотъемлемой части лингвистики» 6 2 , а сущность и задачи этого нового раздела в языкознании формулирует в следующих сло­вах: «Литературная статистика в качестве квантитатив­ной философии языка применима ко всем отраслям лингвистики. По нашему мнению, литературная стати­стика есть структуральная лингвистика, поднятая на уровень квантитативной науки или же квантитативной философии. Таким образом, одинаково неправильно определять ее результаты как не относящиеся к области<115> лингвистики или же трактовать ее как вспомогательное средство для исследования» 6 3 .

Едва ли целесообразно вдаваться в теоретизирова­ния относительно того, правомерно ли в данном слу­чае говорить о возникновении новой отрасли лингвисти­ки и решать вопрос о ее претензиях, не обратившись сначала к рассмотрению уже фактически сделанного в этой области, и к выяснению того, в каком направле­нии идет применение новых методов 6 4 . Это поможет нам разобраться и в разноголосице мнений.

Применение математического (или, точнее говоря, статистического) критерия для решения лингвистиче­ских вопросов является отнюдь не новым для науки о языке и в той или иной мере уже давно используется языковедами. Ведь, по сути говоря, такие традиционные понятия лингвистики, как фонетический закон (и связан<116>ное с ним - исключение из закона), продуктивность грамматических элементов (например, словообразова­тельных суффиксов) или даже критерии родственных отношений между языками в известной степени строятся на относительных статистических признаках. Ведь чем резче и отчетливее статистическое противопоставление наблюдаемых случаев, тем больше у нас оснований го­ворить о продуктивных и непродуктивных суффиксах, о фонетическом законе и исключениях из него, о наличии или отсутствии родственных отношений между языками. Но если в подобных случаях статистический принцип использовался более или менее стихийно, то в дальнейшем он стал применяться сознательно и уже с опреде­ленной целеустановкой. Так, в наше время большое рас­пространение получили так называемые частотные сло­вари лексики и выражений отдельных языков 6 5 или даже значений разноязычных слов с «общей направлен­ностью на действительность» 6 6 . Данные этих словарей используются для составления учебников иностранных языков (тексты которых строятся на наиболее употре­бительной лексике) и словарей-минимумов. Специально лингвистическое использование статистические исчисле­ния нашли в методе лексикостатистики или глоттохронологии М. Сводеша, где на основе статистических фор­мул, учитывающих случаи исчезновения из языков слов основного фонда, оказывается возможным установить абсолютную хронологию расчленения языковых се­мейств 6 7 .

В последние годы случаи применения математиче­ских методов к языковому материалу значительно умно­жились и в массе подобного рода попыток наметились более или менее определенные направления. Обратимся <117> к последовательному их рассмотрению, не вдаваясь в детали.

Начнем с того направления, которому присвоено наименование стилостатистики. Речь в данном случае идет об определении и характеристике стилистических особенностей отдельных произведений или авторов через посредство количественных отношений используемых языковых элементов. В основе статистического подхода к исследованию стилистических явлений лежит понима­ние литературного стиля как индивидуального способа владения средствами языка. При этом исследователь со­вершенно отвлекается от вопроса о качественной значи­мости исчисляемых языковых элементов, сосредоточивая все свое внимание только на количественной стороне; смысловая сторона исследуемых языковых единиц, их эмоционально-экспрессивная нагрузка, так же как и их удельный вес в ткани художественного произведе­ния - все это остается вне учета, относится к так назы­ваемым избыточным явлениям. Таким образом, художественное произведение выступает в виде механической совокупности, специфика построения которого находит свое выражение лишь через числовые отношения ее эле­ментов. На все отмеченные обстоятельства представите­ли стилостатистики не закрывают глаза, противопостав­ляя методам традиционной стилистики, несомненно включающим элементы субъективности, одно единственное качество математического метода, которое, по их мнению, окупает все его недостатки - объективность до­стигнутых результатов. «Мы стремимся, - пишет, напри­мер, В. Фукс,-...охарактеризовать стиль языкового выражения математическими средствами. Для этой цели должны быть созданы методы, результаты которых должны обладать объективностью в такой же мере, как и результаты точных наук... Это предполагает, что мы, во всяком случае первоначально, будем заниматься только формальными структурными качествами, а не смысловым содержанием языковых выражений. Таким образом мы получим систему порядковых отношений, которая в своей совокупности представит собой основу и исходный пункт математической теории стиля» 6 8 . <118>

Простейшим видом статистического подхода к изуче­нию языка писателей или отдельных произведений яв­ляется подсчет употребляемых слов, так как богатство словаря, видимо, должно определенным образом харак­теризовать и самого автора. Однако результаты подоб­ных подсчетов дают несколько неожиданные в этом плане результаты и никак не способствуют эстетическо­му познанию и оценке литературного произведения, что не в последнюю очередь входит в число задач стилисти­ки. Вот некоторые данные относительно общего количе­ства слов, употребляемых в ряде произведений:

Библия (латинская) . . . . . . . . . . 5649 слов

Библия (древнееврейская) . . . . 5642 слова

Демосфен (речи) . . . . . . . . . . . . 4972 слова

Саллюстий. . . . . . . . . . . . . . . . . 3394 слова

Гораций. . . . . . . . . . . . . . . . . . . .6084 слова

Данте (Божественная комедия) 5860 слов

(сюда входит 1615 имен собст­венных и географич. на­званий)

Тассо (Неистовый Орланд) . . . . 8474 слова

Милтон. . . . . . . . . . . . . . . . . . . . .8000 слов (прибл. дан.)

Шекспир. . . . . . . . . . . . . . . . . . .15000 слов

(приблизительно, по другим данным 20 000 слов)

О. Есперсен указывает, что словарь Золя, Киплинга и Джека Лондона значительно превышает словарь Милтона, т. е. число в 8000 6 9 . Подсчет словаря речей президента США В. Вилсона установил, что он богаче, чем у Шекспира. К этому следует добавить данные психоло­гов. Так, Терман на основе наблюдений над большим количеством случаев установил, что словарь среднего ребенка составляет около 3600 слов, а в 14 лет - уже 9000. Средний взрослый употребляет 11700 слов, а че­ловек «повышенной интеллигентности» до 13500 7 0 . Та­ким образом, подобные числовые данные сами по себе не дают никаких оснований для выявления стилистиче­ских качеств произведений и только «объективно» кон<119>статируют употребление разного количества слов разны­ми авторами, что, как показывают приведенные подсче­ты, не связано с относительной художественной ценно­стью их произведений.

Несколько по-иному строятся подсчеты относи­тельной частоты употребления слов у отдельных авторов. В этом случае учитывается не только общая сумма слов, но и частота употребления отдельных слов. Статистическая обработка полученного таким образом материала заключается в том, что слова с равной частотой употребления группируются по классам (или ран­гам), что приводит к установлению частотной дистрибу­ции всех употребляемых данным автором слов. Частным случаем такого рода подсчетов является определение относительной частотности специальных слов (напри­мер, романской лексики в произведениях Чосера, как это было сделано Мерсандом 7 1). Относительная частотность употребляемых авторами слов содержит такие же объективные сведения о стиле отдельных авторов, как и вышеприведенные суммарные подсчеты, с той только разницей, что в результате получаются более точные числовые данные. Но она используется и для датировки отдельных произведений одного и того же автора на основе предварительно произведенного подсчета относи­тельной частоты употребления им слов в разные периоды его жизни (по датированным самим автором произведе­ниям). Другим видом использования данных подобных подсчетов является установление подлинности авторства произведений, относительно которых этот вопрос пред­ставляется сомнительным 7 2 . В этом последнем случае все строится на сравнении статистических формул частоты употребления в подлинных и спорных произведениях. Нет надобности говорить об очень большой относитель­ности и приблизительности результатов, полученных такими методами. Ведь относительная частота употребле­ния меняется не только с возрастом автора, но и в зави­симости от жанра, сюжета, а также и исторической сре­ды действия произведения (ср., например, «Хлеб» и «Петр I» А. Толстого). <120>

Углубляя вышеописанный метод, стилостатистика в качестве стилевой характеристики стала прибегать к критерию стабильности относительной частоты наиболее употребительных слов. Применяемый в данном случае метод можно проиллюстрировать статистической обра­боткой рассказа Пушкина «Капитанская дочка», произ­веденной Есселсоном и Эпштейном в Институте славян­ских языков при Детройтском университете (США) 7 3 . Обследованию был подвергнут весь текст рассказа (око­ло 30000 случаев употребления слов), а затем отрывки, содержащие около 10000 и 5000 случаев употребления. Далее, с целью определения стабильности относительной частоты употребления слов, у 102 наиболее употребительных слов (с частотой от 1160 раз до 35) было произ­ведено сравнение расчетной относительной частоты (сде­ланной на основе выборочных отрывков) с действитель­ной. Например, союз «и» во всем рассказе употреблялся 1 160 раз. В отрывке, содержащем 5 000 случаев употреб­лений всех слов, следует ожидать, что этот союз будет использоваться 5 000 x 1 160: 30 000, или округло 193 раза, а в отрывке, содержащем 10 000 случаев употреблений всех слов, он предположительно используется 10 000 x 1 160: 30 000, или 386 раз. Сравнение полученных с помощью подоб­ного рода расчетов данных с фактическими показывает очень незначительное отклонение (в пределах 5%). На основе подобных расчетов было установлено, что в дан­ном рассказе Пушкина предлог «к» используется в два раза чаще, чем «у», а местоимение «ты» в три раза ча­ще, чем «их» и т. д. Таким образом, несмотря на все перипетии сюжета, как на протяжении всего рассказа, так и в отдельных его частях, наблюдается стабильность относительной частоты употребления слов. То, что на­блюдается в отношении некоторых (наиболее употреби­тельных) слов, предположительно применимо и по отно­шению ко всем использованным в произведении словам. Отсюда следует, что стиль автора можно характеризо­вать определенным соотношением изменчивости средней частоты употребления слова к общей для данного языка<121> частоте его употребления. Это соотношение и рассматри­вается в качестве объективной квантитативной характе­ристики стиля автора.

Аналогичным образом исследуются и иные формаль­ные элементы структуры языка. Так, например, В. Фукс подверг сопоставительно-статистическому рассмотрению метрические особенности произведений Гёте, Рильке, Цезаря, Саллюстия и др. 7 4

Критерий стабильности относительной частоты упот­ребления слов, уточняя технику квантитативной харак­теристики стиля, ничего принципиально нового не вно­сит сравнительно с выше разобранными более прими­тивными способами. Все методы стилостатистики дают в конечном счете одинаково бесстрастные, скользящие по поверхности языка и цепляющиеся только за сугубо внешние признаки «объективные» результаты. Квантита­тивные методы, видимо, не способны ориентироваться на качественные различия исследуемого материала и фактически нивелируют все изучаемые объекты.

Там, где необходима максимальная конкретизация, предлагаются максимально обобщенные критерии; каче­ственные характеристики выражаются языком количества. Здесь не только логическое противоречие, но и несо­гласие с природой вещей. В самом деле, что получится, если мы попытаемся получить сравнительную стилисти­ческую (т. е., следовательно, качественную) характеристику произведений Александра Герасимова и Рембрандта на основании количественного отношения красной и черной краски на их полотнах? Видимо, абсолютная не­суразица. В какой мере вполне «объективные» квантита­тивные сведения о физических данных человека способ­ны дать нам представление о всем том, что характери­зует человека и составляет его истинную сущность? Оче­видно, ни в какой. Они могут служить лишь индивиду­альным признаком, отличающим одного человека от другого, вроде отпечатка извилин на большом пальце руки. Аналогичным образом обстоит дело и с квантита­тивными характеристиками литературного стиля. Если внимательно разобраться, то они дают столь же скудные данные для суждения о действительных стилистических<122> качествах языка автора, как и описание извилин на пальце для изучения психологии человека.

Ко всему сказанному следует добавить, что в прош­лом в так называемой формальной школе литературо­ведения уже делалась попытка квантитативного иссле­дования стиля писателей, когда производились подсчеты эпитетов, метафор, ритмо-мелодических элементов стиха. Однако эта попытка не получила своего дальнейшего развития.

Другое направление применения математических ме­тодов для изучения языковых явлений можно объеди­нить под именем лингвостатистики. Оно стремится вторг­нуться в основные вопросы теории языка и таким обра­зом получить призвание в собственно лингвистической сфере. Для ознакомления с этим направлением лучше всего обратиться к уже упоминавшейся работе Хердана, по выражению одного из ее многочисленных рецензен­тов, «чудовищно претенциозной книге» 7 5 , получившей, однако, широкий отклик среди языковедов 7 6 . Ввиду того, что Хердан (на что уже указывалось выше) стремился собрать в своей книге все наиболее существенное в об­ласти применения математических методов к лингвисти­ческой проблематике, в его книге мы фактически имеем дело не столько с Херданом, сколько с целым направле­нием. Как показывает само название книги - «Язык как выбор и вероятность», - основное ее внимание направ­лено на выяснение того, что в языке предоставлено сво­бодному выбору говорящего и что обусловлено имма­нентной структурой языка, точно так же, как и на опре­деление количественного соотношения элементов перво­го и второго порядка. Книга Хердана дает почти исчер­пывающую информацию о всех работах в этой области, проведенных представителями разных специальностей<123> (философами, лингвистами, математиками, техниками), но не ограничивается этим и включает много оригиналь­ных наблюдений, соображений и выводов самого автора. В качестве суммирующего труда она дает хорошее пред­ставление о применяемых квантитативных методах, и о достигаемых с их помощью результатах. Вопросы, кото­рые мы условно объединяем в раздел лингвостатистики, трактуются во второй и четвертой частях книги.

Из множества случаев применения методов матема­тической статистики к изучению лингвистических вопро­сов мы остановимся на наиболее общих, которые одно­временно можно рассматривать и как наиболее типич­ные. Используя данные других авторов - Болдрини 7 7 , Матезиуса 7 8 , Мариотти 7 9 , Ципфа 8 0 , Диуэй 8 1 и др., а также приводя собственные исследования, определяю­щие относительную частоту распределения фонем, букв, длины слов (измеряемую количеством букв и слогов), грамматических форм и метрических элементов в латин­ском и греческом гекзаметре, Хердан устанавливает факт стабильности относительной частоты языковых элементов как общую характеристику всех лингвистиче­ских структур. Он выводит следующее правило: «Про­порции лингвистических элементов, принадлежащих то­му или иному уровню или сфере лингвистического кодирования - фонологии, грамматике, метрике, - остаются более или менее постоянными для данного языка, в данный период его развития и в пределах достаточно обширных и беспристрастно проведенных наблюдений» 8 2 . Это правило, которое Хердан называет основным зако­ном языка, он стремится определенным образом истолковать и расширить. «Он, - пишет Хердан об этом за­коне, - является выражением факта, что даже здесь, где человеческой воле и свободе выбора предоставлены<124> широчайшие рамки, где сознательный выбор и беззаботная игра живо чередуются друг с другом, в целом существует значительная стабильность... Наши исследования обнаружили еще один фактор общего порядка: далеко идущее сходство между членами одного языкового коллектива наблюдается не только в системе фонем, в словаре и в грамматике, но также и в отношении частоты употребления конкретных фонем, лексических единиц (слов) и грамматических фонем и конструкций; другими словами, сходство не только в том,чтоиспользуется, но также и в том,как частоиспользуется» 8 3 . Такое положение обусловливается понятными причинами, но это дает повод для новых выводов. При исследовании различных текстов или отрезков данного языка, например, обнаруживается, что относительные частоты использования данной конкретной фонемы (или других рече­вых элементов) разными людьми остаются в основном одними и теми же. Это и приводит к истолковыванию индивидуальных форм речи как некоторых колебаний постоянной вероятности употребления рассматриваемой фонемы в данном языке. Таким образом получается, что в своей речевой деятельности человек подчинен определенным законам вероятности в отношении количества используемых лингвистических элементов. А тогда, ког­да мы наблюдаем огромное количество лингвистических элементов в большой совокупности текстов или речевых отрезков, у нас создается впечатление причинной зави­симости в том смысле, что в данном случае имеет место также детерминирование и в отношении использования определенных лингвистических элементов. Другими сло­вами, оказывается допустимым утверждать, что то, что с интуитивной точки зрения представляется причинным отношением, в квантитативном плане является вероят­ностью 8 4 . При этом очевидно, что чем больше совокуп<125>ность обследываемых текстов или речевых отрезков, тем отчетливее будет проявляться стабильность относитель­ной частоты употребления языковых элементов также и в индивидуальном использовании (закон больших чисел). Отсюда делается новый общий вывод о том, что язык есть массовое явление и должен трактоваться как таковое.

Указанные выводы, достигнутые на основании ча­стотных исчислений фонетических элементов, слов и грамматических форм, которые в совокупности состав­ляют язык, применяются затем к «статистической интер­претации» проводимого Соссюром разделения на «язык» (lalangue) и «речь» (laparole). По Соссюру, «язык» есть совокупность лингвистических привычек, которые делают возможным общение между членами данного языкового коллектива. Это социальная реаль­ность, «массовое явление», обязательное для всего гово­рящего на данном языке народа. Хердан, как указыва­лось, доказывает, что члены единого языкового коллек­тива сходствуют друг с другом не только тем, что ис­пользуют одни и те же фонемы, лексические единицы и грамматические формы, но и тем, что все эти элементы употребляются с одинаковой частотой. Таким образом, статистическое определение «языка» принимает у него следующую форму: «язык» (lalangue) есть совокуп­ность общих лингвистических элементов плюс их относительная вероятность употребления.

Такое определение «языка» является исходным и для соответствующего статистического истолкования «речи», которая, согласно Соссюру, представляет собой индиви­дуальное высказывание. Противопоставляя «язык» как явление социальное «речи» как явлению индивидуаль­ному, Соссюр писал: «Речь есть индивидуальный акт воли и понимания, в котором надлежит различать: 1. комбинации, при помощи которых говорящий субъект пользуется языковым кодексом с целью выражения сво­ей личной мысли; 2. психофизический механизм, позво­ляющий ему объективировать эти комбинации» 8 5 . Поскольку «язык» в лингвостатистике рассматривается как совокупность элементов с определенной относитель<126>ной вероятностью их употребления, постольку он включает в себя в качестве существеннейшей характеристики статистическую совокупность или ансамбль (популя­цию) и может рассматриваться в этом аспекте. В соот­ветствии с этим «речь» превращается в отдельную вы­борку, взятую из «языка» как статистической совокуп­ности. Вероятность в данном случае обусловливается отношением «речи» к «языку» (в их «квантитативном» понимании), а распределение относительной частоты употребления разных элементов языка истолковывается как результат коллективного «выбора» (choice) в опре­деленный хронологический период существования языка. Понимая, что такая трактовка различий «языка» и «ре­чи» строится все же на совершенно иных основаниях, чем у Соссюра, Хердан пишет в этой связи: «Эта, види­мо, незначительная модификация концепции Соссюра имеет то важное следствие, что «язык» (lalangue) ныне приобретает существенную характеристику в виде ста­тистической совокупности (популяции). Эта популяция характеризуется определенными относительными часто­тами или вероятностями колебаний, имея в виду, что каждый лингвистический элемент относится к опреде­ленному лингвистическому уровню. В этом случае «речь» (laparole) в соответствии со своим значением оказы­вается термином для определения статистических выбо­рок, взятых из «языка» как статистической совокупно­сти. Становится очевидным, что выбор (choice) выступает здесь в виде отношения «речи» к «языку», являясь отношением взятой наудачу выборки к статистической совокупности (популяции). Сам порядок распределения частоты, в качестве отложения речевой деятельности языкового коллектива в течение столетий, представляет собой элемент выбора (choice), но не индивидуального выбора, как в стиле, а коллективного выбора. Употреб­ляя метафору, мы можем здесь говорить о выборе, сде­ланном духом языка, если мы понимаем под этим прин­ципы лингвистической коммуникации, находящиеся в соответствии с комплексом психических данных членов конкретного языкового коллектива. Стабильность серий есть результат вероятности (chance)» 8 6 .

Частным случаем приложения изложенного принци<127>па является отграничение в языке нормативных явлении от «исключений» (отклонений). В лингвостатистике утверждается, что статистический метод позволяет устранить существующую в данном вопросе нечеткость и установить ясные критерии для разграничения указан­ных явлений. Если под нормой понимается статистиче­ская совокупность (в вышеуказанном смысле), а исключением (или ошибкой) - отклонение от частот, показы­ваемых статистической совокупностью, то квантитатив­ное решение вопроса напрашивается само собой. Здесь все сводится к статистическим отношениям между «по­пуляцией» и «отклонением». Если частоты, наблюдае­мые в отдельной выборке, отклоняются от вероятностей, обусловленных статистической совокупностью, более, чем это определяется серией выборочных подсчетов, то мы имеем основание заключать, что демаркационная ли­ния между «тем же самым» (нормой) и «не тем же са­мым» (исключением) оказывается нарушенной.

Квантитативные различия между «языком» и «ре­чью» используются и для разграничения языковых эле­ментов двух типов: грамматических и лексических. Исходным моментом для решения этой задачи, пред­ставляющей с лингвистической точки зрения часто боль­шие трудности, является предположение, что степень величины частотности грамматических элементов иная, чем у лексических единиц. Это якобы связывается с «обобщенностью» грамматических элементов, чем они отличаются от понятий, фиксированных лексическими единицами. Кроме того, грамматические элементы яко­бы, как правило, значительно меньше по своему объему: в качестве самостоятельных слов (к ним причисляются местоимения, предлоги, союзы и служебные слова) они обычно состоят из малого количества фонем, а в виде «связанных форм» - из одной или двух фонем 8 7 . Чем меньше лингвистический элемент, тем менее способна его «длина» (количественный момент) служить в каче­стве определяющей характеристики и тем большее значение приобретает для этой цели «качество» фонем. Ка­кие же методы предлагаются для решения рассматри­ваемой проблемы? Она решается посредством обраще­ния к чисто квантитативному понятию грамматической<128> нагрузки, «Предположим, - пишет в этой связи Хердан, - что нас интересует сравнение в указанном отно­шении двух языков. Каким образом мы определяем с известной степенью объективности «грамматическую нагрузку», которую несет язык? Ясно, что эта нагрузка будет зависеть от положения демаркационной линии, отграничивающей грамматику от лексики. Первое сооб­ражение, которое может прийти при этом нам в голову, заключается в том, чтобы определить, насколько «слож­на» грамматика данного языка. Ведь «сложность» - качественная характеристика, а понятие «грамматиче­ской нагрузки» является количественной характеристи­кой. Правда, нагрузка до известной степени зависит от сложности, но не целиком. Язык может быть награжден чрезвычайно сложной грамматикой, но в деятельности языка получает применение только сравнительно неболь­шая ее часть. Мы определяем «грамматическую нагруз­ку» как совокупность грамматики, которую несет язык, когда он находится в действии, что тотчас переводит на­шу проблему в область структуральной лингвистики в том смысле, в каком эта дисциплина была определена Соссюром. В последующем изложении применяются квантитативные методы определения различия языков в зависимости от того, где проходит граница, разделяю­щая грамматику от лексики» 8 8 . Иными словами, различия языков в данном случае должны быть сведены к различиям числовых отношений между грамматиче­скими и лексическими элементами.

Имеющиеся в нашем распоряжении материалы ри­суют следующую картину. В английском языке (учиты­вались лишь «грамматические слова»: местоимения, или, как они также именуются, «заместители», предлоги, союзы и вспомогательные глаголы) в отрезке, включаю­щем 78633 случая употребления всех слов (1027 различ­ных слов), было обнаружено 53 102 случая употребления грамматических элементов, или, точнее говоря, «грамма­тических слов» (149 различных слов), что составляет 67,53% при 15,8% различных слов. Таковы данные Диуэй 8 9 . Другие данные показывают иное процентное<129> соотношение: 57,1% при 5,4% различных слов 9 0 . Такое значительное расхождение объясняется различием письменного и устного языка. Письменные формы языка (первые данные) используют якобы больше грамматиче­ских элементов, чем устные (второй случай). В «Божественной комедии» Данте (по итальянскому оригиналу) Мариотти установил 54,4% случаев употребления «грам­матических слов».

Другой и, видимо, более совершенный способ опре­деления грамматической нагрузки языка заключается в подсчете фонем, входящих в грамматические элемен­ты. В данном случае учитываются не только самостоя­тельные грамматические слова, но и связанные формы. Здесь возможны различные варианты. Например, опре­деление относительной частоты употребления отдельных согласных фонем в грамматических элементах и сопо­ставление их с частотой суммарного употребления этих же фонем (итоговые данные такого соотношения в анг­лийском языке дают пропорцию 99,9% к 100000 - сум­марного употребления); или подобное же сопоставление согласных по отдельным классификационным группам (лабиальные, палатальные, велярные и прочие фонемы). Итоговое соотношение здесь принимает форму пропорции 56,47% (в грамматических элементах) к 60,25% (в суммарном употреблении); или такое же сопоставление начальных согласных фонем (в этом случае получи­лось соотношение 100,2% в грамматических словах к 99,95 - в суммарном употреблении). Возможны и иные более сложные статистические операции, которые, одна­ко, в результате дают подобные же квантитативные вы­ражения исследуемой проблемы.

Приведенные квантитативные данные служат основа­нием для общего вывода. Он сводится к тому, что рас­пределение фонем в грамматических элементах обуслов­ливает характер распределения (в числовом, конечно, выражении) фонем в языке в целом. А это в свою оче­редь позволяет заключить, что употребление граммати­ческих элементов в наименьшей степени зависит от индивидуального выбора и составляет ту часть лингви­стического выражения, которая контролируется вероят<130>ностью. Этот умозрительный вывод подтверждается подсчетом грамматических форм в русском языке, сделанным Есселсоном 9 1 . Исследованию было подвергну­то 46896 слов, взятых из II источников (произведения Грибоедова, Достоевского, Гончарова, Салтыкова-Щедрина, Гаршина, Белинского, Амфитеатрова, Гусева-Оренбургского, Эренбурга, Симонова и Н. Островского). Они были разделены на разговорные слова (17 756 слов, или 37,9%) и неразговорные (29140 слов, или 62,1%). Затем вся совокупность слов была подразделена на 4 группы в зависимости от их грамматического характера: в 1-ю группу вошли существительные, прилага­тельные, прилагательные в функции существительных, местоимения и склоняемые числительные; во 2-ю группу - глаголы; в 3-ю группу - отглагольные причастия, причастия в функции прилагательных и существительных и деепричастия; в 4-ю группу - неизменяемые формы наречия, предлоги, союзы и частицы. Суммарные результаты (приводятся также таблицы с данными по отдельным авторам) дают следующее соотношение:

1-я группа

2-я группа

3-я группа

4-я группа

разговорн.

неразговорн.

Хердан следующими словами характеризует рас­смотрение полученных таким образом квантитативных данных: «Они оправдывают вывод, что грамматические элементы следует рассматривать в качестве фактора, обусловливающего вероятность лингвистического выражения. Такой вывод позволяет избежать обременитель­ной квалификации каждого употребляемого слова. Со­вершенно очевидно, что, поскольку грамматика и лекси­ка не хранятся в водонепроницаемых оболочках, ни та и ни другая не являются чистым «выбором» (choice) или чистой «вероятностью» (chance). И грамматика и лексика содержат оба элемента, хотя и в значительно варьирующихся пропорциях» 9 2 . <131>

Большой раздел книги Хердана посвящен исследова­нию в языке двухплановости или двойственности (dua­lity), причем само понятие двойственности основывает­ся им на математических характеристиках.

Так, теоремы в проективной геометрии можно распо­лагать в два ряда, так что каждая теорема одного ряда может быть получена из некоторый теоремы другого ря­да посредством замены друг на друга слов точка ипря­мая. Например, если дано положение: «любые различ­ные точки принадлежат одной и только одной прямой», то мы можем из него вывести соотнесенное ему положе­ние: «любые две различные прямые принадлежат одной и только одной точке». Другим методом определения двойственности является нанесение по оси абсцисс и оси ординат разных планов исследуемого явления. Так, как это, например, делает Юл 9 3 , по оси абсцисс отсчитываются различные частоты употребления, а по оси ординат - количество лексических единиц, у которых определяется частотность и т. д. Так трактуется понятие двойственности, якобы в равной мере применимое и к. лингвистическим исследованиям.

Под определенное таким образом понятие двойствен­ности, которое во всех случаях фактически имеет харак­тер бинарного кода и которое также считается самой су­щественной чертой языковой структуры, подводятся чрезвычайно разнокачественные явления, допускающие противоположение по двум планам: распределение упо­требления слов соответственно характеру лексических единиц и распределение лексических единиц соответст­венно частоте употребления слов; письменную и разго­ворную формы речи; лексические и грамматические эле­менты; синонимы и антонимы; фонема и ее графическое изображение; определяемое и определяющее (соссюровские signifiantиsignifiй) и т. д.

После квантитативного исследования двойственности того или иного частного, языкового явления или ограниченного «текста», как правило, делается вывод, которому приписываются качества лингвистической универсальности. Характер подобных выводов и спо­соб их обоснования можно проследить на примере<132> исследования двойственности слова и понятия (фактиче­ски же речь идет о соотношении длины слова и объема понятия - надо иметь в виду, что чрезвычайно свобод­ное употребление лингвистических и иных терминов в подобных работах часто весьма затрудняет понимание). Важно при этом отметить, что в качестве материала, послужившего источником наблюдений данного вида лингвистической двойственности, были использованы: международная номенклатура болезней (около 1000 на­званий) и общий регистр заболеваний по Англии и Уэллсу за 1949 г. В этом случае делается следующий общий вывод: «Каждое понятие, обозначающее общую идею, имеет то, что можно назвать «сферой» или «объемом». Оно позволяет через свое посредство думать о многих предметах или других понятиях, находящихся внутри его «сферы». С другой стороны, все предметы, необхо­димые для определения понятия, составляют то, что на­зывается его «содержанием». Объем и содержание взаимно соотносимы - чем меньше содержание и соот­ветственно чем более абстрактно понятие, тем больше его сфера или объем, т. е. тем больше объектов подво­дится под него. Это можно рассматривать как аналогию (в понятийной сфере) принципам кодирования, соответ­ственно которым длина символа и частота употребления взаимозависимы» 9 4 .

Принцип двойственности применяется и к частным проблемам. Например, при установлении эквивалентно­сти значений слов двух разных языков. В результате изучения англо-немецкого словаря Мюре - 3андерса с применением математического метода итераций делает­ся вывод, что вероятность употребления английского слова с одним или больше значением в немецком пере­воде остается постоянной для каждой начальной буквы во всем словаре 9 5 . Рассмотрение порядка расположения слов в китайских словарях приводит к заключению, что он носит таксономический характер, так как количество черт в иероглифе указывает его место (как самостоя­тельного радикала или определенного подкласса, подчиняющегося радикалу). Таксономия представляет со­бой соподчиняющий принцип классификации, применяю­щийся в зоологии и ботанике. Хердан утверждает, что<133> основы китайской лексикографии также строятся на принципах таксономии 9 6 и т. д.

Делая общую оценку данного направления приме­нения математических методов к изучению лингвисти­ческих проблем (т. е. лингвостатистики), необходимо, видимо, исходить из того положения, которое было сформулировано Эттингером: «Математика может быть эффективно использована на службе лингвистики только тогда, когда языковедам будут ясны реальные границы ее применения, так же как и возможности ис­пользуемых математических моделей» 9 7 . Иными сло­вами, о математической лингвистике речь может идти тогда, когда математические методы докажут свою при­годность для решения тех собственно лингвистических задач, которые в своей совокупности составляют науку о языке. Если же этого нет, хотя при этом, возможно, и открываются новые аспекты научного исследования, то в таком случае можно говорить о чем угодно, но только не о лингвистике - в данном случае имеются в виду не разные виды прикладной лингвистики (о ней еще будет речь ниже), а научное, или теоретическое, языкознание. Исходя из этой позиции, следует отметить, что с точки зрения лингвиста многое в лингвостатистике вызывает сомнение и даже недоумение.

Обратимся к разбору только двух примеров (чтобы не загромождать изложения), оговорившись, что весьма существенные возражения можно сделать по каждому из них. Вот перед нами квантитативное разграничение грамматических и лексических единиц. Оказывается, для того, чтобы произвести такое разграничение, необходимо уже заранее знать, что относится к области грамматики, а что - к лексике, так как «грамматическая нагрузка» языка (т. е. совокупность употребляемых в речи грам­матических элементов), как указывается в приводившей­ся выше цитате, «зависит от демаркационной линии, отграничивающей лексику от грамматики». Не зная, где пролегает эта линия, нельзя, следовательно, и провести указанного разграничения. В чем же тогда смысл кванти­тативного способа разграничения лексического от грам<134>матического? Впрочем, что касается Хердана, то он осо­бенно не задумывается над этим вопросом и смело клас­сифицирует языковые элементы, относя к грамматическим элементам «связанные формы», под которыми, судя по изложению, следует разуметь внешнюю флексию, и «грамматические слова», куда относятся предлоги, союзы, вспомогательные глаголы и местоимения - последние в силу того, что они являются «заместителями». Но если говорить только об этом качестве местоимений и на этом основании относить их к грамматическим элементам, то тогда к ним, очевидно, следует отнести и такие слова, как «вышеупомянутый», «названный», «данный» и т. д., так как они тоже выступают в качестве заместителей. В связи с применяемым в лингвостатистике способом выделения грамматических элементов естественно возни­кает вопрос, как же поступать в этом случае с такими «не имеющими вида» грамматическими явлениями, как порядок слов, тоны, нулевые морфемы, парадигматиче­ские отношения (часть этих явлений, кстати говоря, на­ходит отражение и в тех языках, которые исследуются математическими методами)? Как проводить разграни­чение в языках с богатой внутренней флексией (как, на­пример, в семитских языках), где она осуществляет не только грамматическую модификацию корня (радика­ла), но и сообщает ему лексическое существование, так как корень без перегласовок не имеет реального су­ществования в языке? Что следует понимать под грамматической сложностью языка, каким критерием она определяется? Если количественным моментом, который в этом случае всячески подчеркивается, то тогда одним из самых сложных в грамматическом отношении языков окажется английский, обладающий такими конструк­циями, как IshallhavebeencallingилиHewouldhavebeencalling. В этих предложениях толькоcallможно отнести к лексическому, а все остальное, следовательно, надлежит считать грамматическим. Какие суще­ствуют основания связывать частотность употреблений грамматических элементов с обобщенностью или аб­страктностью значений грамматических слов? Ведь со­вершенно очевидно, что относительно большая частота употребления грамматических элементов определяется их функцией в построении предложений, а что касается абстрактности значений, то очень просто найти большое<135> количество лексических элементов, которые легко в этом отношении могут соревноваться с грамматическими эле­ментами, во многом уступая им в частотности (напри­мер,бытие, существование, протяженность, простран­ство, субстанция и т. д).

Подобного же рода несуразности встают перед нами и в случае с определением двойственности (duality) сло­ва и понятия. Надо обладать чрезвычайно своеобразным пониманием структурной сущности языка, чтобы подвер­гать ее исследованию, пользуясь номенклатурой болез­ней и больничным регистром заболеваний, что, как ука­зывалось выше, послужило исходным материалом для весьма ответственных лингвистических выводов. Не останавливаясь на совершенно неясном употреблении таких не имеющих лингвистического бытия терминов, как сфе­ра, объем и содержание понятия (кстати говоря, при этом грубо путаются лексическое значение слова и обо­значаемое научным термином понятие), обратимся к заключению, которое в этом случае делается. Как ука­зывалось выше, мы имеем дело с утверждением, что «объем и содержание взаимно соотносимы». Весь ход рассуждения, который дает основание для такого выво­да, так же как и способ математического оперирования языковыми фактами, отчетливо показывает, что в этом случае совершенно не учитывается одно весьма сущест­венное качество языка, которое опрокидывает все про­водимые расчеты: способность выражать одно и то же «содержание» лингвистическими единицами разного «объема», несомненно обладающими к тому же разной относительной частотой употребления. Так, одно и то же лицо мы можем обозначить как Петров, мой знакомый, он, москвич, молодой человек, сотрудник университета, брат моей жены, человек, которого мы встретили на мосту, и т. д. В свете подобных фактов сомнение вызывают не только частные выводы, которым, однако, как указы­валось, придается универсальное значение, но и целесообразность применения самих квантитативных мето­дов к подобного рода лингвистическим проблемам.

Но иногда лингвистам предлагаются выводы, спра­ведливость которых не вызывает никакого сомнения. Та­ковым является «основной закон языка», заключающийся в том, что в языке наблюдается определенная стабиль­ность его элементов и относительной частоты их упо<136>­требления. Беда подобного рода открытий заключается, однако, в том, что они давно известны лингвистам. Ведь совершенно очевидно, что если бы язык не обладал из­вестной стабильностью и каждый член данного языково­го коллектива свободно варьировал элементы языка, то не было бы возможно взаимное общение и само сущест­вование языка стало бы бессмысленным. А что касается распределения относительной частоты употребления от­дельных элементов языка, то она нашла свое выраже­ние в языкознании в виде выделения категорий пассив­ной и активной лексики и грамматики, чему так много уделял внимания Л. В. Щерба. В данном случае статистические методы могут оказать помощь лингвистам только в распределении конкретных языковых элемен­тов по разрядам относительной частоты их употребле­ния, но не имеют никаких оснований претендовать на открытие каких-то новых закономерностей, представ­ляющих ценность для теоретической лингвистики.

С другой стороны, лингвостатистика предлагает ряд действительно «оригинальных» выводов, которые чрез­вычайно показательны для характера научного мышле­ния ее адептов. Так, сложными статистическими метода­ми исследуется «политическая лексика» в трудах Чер­чилля, Бенеша, Халифакса, Штреземана и других, причем в подсчетах для неанглоязычных авторов используются переводы их работ на английский язык. Результаты подсчетов представлены в виде многочислен­ных таблиц, математических формул и уравнений. Лин­гвистическая интерпретация квантитативных данных в этом случае сводится всего лишь к тому, что употребле­ние Черчиллем «политической лексики» является наибо­лее типичным (?) для данной группы авторов и что ис­пользование Черчиллем слов в тех случаях, когда он касается политических вопросов, типично для англий­ского речевого коллектива 9 8 .

В другом случае после соответствующих статисти­ческих манипуляций делается вывод, что Гитлер в сло­воупотреблении нацистской Германии нарушил двойственность между «языком» и «речью» в квантитативном понимании этих терминов. Частным случаем уничтоже­ния этой двойственности является буквальное понима<137>ние метафорических оборотов (например, «сыпать соль в открытые раны»). Нацистская Германия заклеймила себя таким количеством бесчеловечных поступков, что едва ли есть надобность уличать ее и в этом лингвисти­ческом злодействе 9 9 . К нарушению лингвистической двойственности ведет, по утверждению Хердана, и опре­деление Марксом языка как непосредственной действи­тельности мысли, а закон диалектики о переходе явления в свою противоположность есть, по его мнению, непра­вильно понятый лингвистический закон двойственности языка 1 00 . Подобного рода интерпретации говорят сами за себя.

Наконец, общим недостатком, свойственным всем приведенным случаям квантитативного способа изуче­ния лингвистического материала и тем самым приобре­тающим уже методологический характер, является под­ход к языковым элементам как к механической совокуп­ности абсолютно независимых друг от друга фактов, в соответствии с чем, если при этом и вскрываются какие-либо закономерности, то они относятся только к число­вым отношениям распределения автономных фактов, вне их системных зависимостей. Правда, Дж. Уотмоу всяче­ски стремится уверить, что именно математика лучше, чем любой вид лингвистического структурного анализа, способна вскрыть структурные особенности языка. «Современная математика, - пишет он, - занимается не измерением и исчислением, точность которых по самой своей природе ограничена, но в первую очередь структу­рой. Вот почему математика в высшей степени способствует точности изучения языка - в такой степени, на какую не способно раздельное описание, еще более ограниченное по своей природе... Так же как в физике математические элементы используются для описания физического мира, поскольку предполагается, что они соответствуют элементам физического мира, так и в математической лингвистике математические элементы предположительно должны соответствовать элементам мира речи» 1 01 . Но такая постановка вопроса отнюдь не спасает положения, так как в лучшем случае она может<138> дать анализ языка либо какфизическойструктуры, что для языка еще далеко не достаточно, и в конечном счете носит все тот же механистический характер, либо каклогико-математическойструктуры, а это переносит язык в иную и во многом чуждую ему плоскость 1 02 . Не лишне при этом отметить, что успехи математической лингвистики Уотмоу предвидит только в будущем, а что касается их реальных результатов, то он дает им оценку в следующих словах: «...почти вся работа, выполненная по настоящее время Херданом, Ципфом, Юлом, Гиро (Guiraux) и другими, находится отнюдь не за пределами критики как со стороны лингвистики, так и математики; она в значительной мере отдает любительщиной» 1 03 . Таким образом, если не пытаться предсказывать будущее математических методов в лингвистических исследованиях, а постараться по заслугам оценить то, чем мы располагаем на сегодняшний день, то по необходимости придется признать, что математика фактически пока ограничивалась в области языкознания лишь «измерением и подсчетом», а качественного анализа языка, вникающего в его структуру, не смогла дать. <139>

Постараемся все же быть максимально объективны­ми. В известной своей части квантитативные данные, ви­димо, могут быть использованы лингвистикой, но лишь в качестве вспомогательныхи по преимуществу в проблемах, имеющих практическую направленность. В отношении же большей части квантитативных спосо­бов изучения отдельных лингвистических явлений, не­сомненно, оправдан общий вывод Р. Брауна: «Их можно рассматривать так, как их рассматривает Хердан, но каков смысл всего этого?» 1 04 . Представим себе, что мы задаем вопрос: «Что собой представляют деревья в этом саду?». И в ответ получаем: «В этом саду сто деревьев». Разве это ответ на наш вопрос и разве действительно он имеет смысл? А ведь в отношении многих лингвистиче­ских вопросов математические методы дают именно та­кого рода ответы.

Однако существует широкая область исследователь­ской деятельности, использующая по преимуществу ма­тематические методы и в то же время ориентирующая их на языковый материал, где целесообразность такого объединения не вызывает никакого сомнения. «Смысл» этой исследовательской деятельности, ее значимость обусловливается теми целями, к которым она стремится. Она уже апробирована практикой. Речь в данном слу­чае идет о проблемах, связанных с созданием информационных машин, конструкций для машинного перево­да письменных научных текстов, автоматизацией пере­вода устной речи с одного языка на другой и со всем тем комплексом задач, которые объединяются в лингви­стических вопросах кибернетики. Всей совокупности подобных проблем обычно присваивают общее наименова­ние прикладной лингвистики. Тем самым она отграничи­вается от так называемой математической лингвистики, включающей те направления работы, которые выше бы­ли обозначены как стилостатистика и лингвостатистика, хотя отнюдь не избегает статистической обработки лин­гвистического материала. Пожалуй, наиболее важной чертой прикладной лингвистики, отделяющей ее от ма­тематической лингвистики, как она обрисовывалась вы­ше, является то, что первая имеет обратную направлен­ность: не математика для лингвистики, но лингвистика<140> (формализованная математическими методами) для широкого комплекса практических задач.

Нет надобности раскрывать содержание отдельных проблем, включающихся в ныне чрезвычайно широкую область прикладной лингвистики. В противоположность математической лингвистике, эти проблемы активно обсуждаются в советской лингвистической литературе и справедливо начинают занимать все более видное место в научной проблематике исследовательских институ­тов 1 05 . Таким образом, они уже достаточно известны нашей лингвистической общественности. Это обстоя­тельство, однако, не освобождает нас от необходимости подвергнуть их осмыслению, в частности, с точки зрения принципов науки о языке. Это несомненно поможет устранению недоразумений, которые все чаще и чаще возникают между представителями весьма далеких друг от друга наук, принимающих участие в работе над про­блемами прикладной лингвистики, и наметит пути их сближения, с одной стороны, и разграничения областей исследования, с другой стороны. Само собой разумеет­ся, что нижеследующие соображения будут представ­лять точку зрения лингвиста, и необходимо, чтобы мате­матики не только постарались ее усвоить, но в связи с поднимающимися вопросами дали им свою трактовку.

Лингвиста-теоретика никак не может удовлетворить то обстоятельство, что во всех случаях исследования яв<141>лений языка в тех целях, которые ставятся прикладной лингвистикой, основой их служит математическая мо­дель. В соответствии с этим наблюдения над явлениями языка и получаемые при этом результаты выражаются в терминах и понятиях математики, т. е. посредством математических уравнений и формул. Обратимся для на­глядности к примеру. Кондон 1 06 и Ципф 1 07 установили, что логарифмы частоты (f ) употребления слов в тексте большого объема располагаются почти на прямой ли­нии, если на диаграмме соотнести их с логарифмами ран­га или разряда (r ) этих слов. Уравнениеf = c: r, гдес является константой, отражает это отношение в том ограниченном смысле, чтоc: r для заданного значе­нияr с большой приближенностью воспроизводит наблюдаемую частоту. Отношение междуf иr, выражен­ное математической формулой, является моделью для отношений между наблюдаемыми значениями частоты употребления и ранга, или разряда, слов. Таков один из случаев математического моделирования. 

Вся теория информации целиком базируется на ма­тематической модели процесса коммуникации, разрабо­танной К. Шенноном 1 08 . Она определяется как «мате­матическая дисциплина, посвященная способам вычис­ления и оценке количества информации, содержащейся в каких-либо данных, и исследованию процессов хра­нения и передачи информации» (БСЭ, т. 51, стр. 128). Соответственно и основные понятия теории информации получают математическое выражение.Информацияизмеряется бинитами или двоичными единицами (код, которому уподобляется и язык, с двумя условными рав­но вероятными сигналами передает одну двоичную еди­ницу информации при передаче каждого символа).Избыточностьопределяется как «разность между теоретически возможной передающей способностью ка­кого-либо кода и средним количеством передаваемой ин<142>формации. Избыточность выражается в процентах к об­щей передающей способности кода» 1 09 и пр. Точно так же и для машинного перевода необходима алгоритмиче­ская разработка отображения элементов одного языка в другом и т. д. 1 10 . Таковы другие случаи моделирования.

Использование моделей вне всякого значения может оказать весьма существенную помощь, в частности, по всей вероятности, при решении тех задач, которые ста­вит перед собой прикладная лингвистика. Однако для теоретического языкознания весьма существенным яв­ляется то обстоятельство, что абстрактная модель, как правило, не воспроизводит всех особенностей действи­тельного явления, всех его функциональных качеств. Так, архитектор, перед тем как построить дом, может создать его модель, воспроизводящую во всех мельчай­ших деталях проектируемый дом, и это помогает ему решить ряд практических вопросов, связанных с по­стройкой самого дома. Но такая модель дома, какой бы она точной ни была, лишена той «функции» и того назна­чения, ради чего строятся вообще все дома - она не спо­собна обеспечить человека жильем. Аналогичным обра­зом обстоит дело и с языком, где модель не всегда спо­собна воспроизвести все его качества. В данном же слу­чае дело усложняется еще и тем, что для построения мо­дели используются не собственно лингвистические, а ма­тематические мерила. «Математические модели...- пи­шет А. Эттингер, - играют чрезвычайно важную роль во всех областях техники, но поскольку они являются орудием синтеза, их значение для лингвистики, являю­щейся в первую очередь исторической и описательной дисциплиной, естественно имеет ограниченный харак­тер» 1 11 .<143>

Математическое моделирование языка фактически применимо только к его статическому состоянию, ко­торое для языковеда является условным и в действительности находится в прямом противоречии с основным качеством языка, самой формой существования которого является развитие. Само собой разумеется, статическое изучение языка отнюдь не исключается и из языкозна­ния и является основой при составлении нормативных грамматик и словарей, описательных грамматик, прак­тических грамматик и словарей, служащих пособием для практического изучения иностранных языков, и т. д. Однако во всех таких работах, имеющих по преимуще­ству прикладной характер, языковеды идут на созна­тельное ограничение поля исследования и отнюдь не закрывают глаза на другие аспекты языка 1 12 . При ста­тическом рассмотрении языка, в частности, совершенно пропадают из поля зрения исследователя такие каче­ства языка, связанные с его динамическим характером, как продуктивность, зависимость от форм мышления, широкое взаимодействие с культурными, социальными, политическими, историческими и прочими факторами. Только в плане синхроническом можно язык рассматри­вать как систему условных знаков или кодов, что, одна­ко, оказывается совершенно неправомерным, как только мы становимся на более подходящую для языка динамическую точку зрения. Именно в процессах раз­вития проявляются такие качества языка, как мотивированность, не имеющая стабильных границ многознач­ность слов, неавтономность значения слова и его зву­ковой оболочки, связанные с контекстом творческие по­тенции слова, а это все находится в резком противоречии с основными характеристиками кода или знака 1 13 . Оче­видно, в прикладной лингвистике также можно отмысливаться от всех этих качеств языка и в практических це­лях довольствоваться, так сказать, «моментальным сним­ком» языка, который все же способен дать достаточно приближенное представление о механизме его функцио<144>нирования. Однако каждый такой «моментальный сни­мок», если его рассматривать как факт языка, а не как факт системы условных кодов, должен быть включен­ным в бесконечный процесс движения, в котором язык всегда пребывает 1 14 . Его нельзя изучать вне тех кон­кретных условий, которые характеризуют это движение, накладывающее свой отпечаток на данное состояние языка и обусловливающее потенции дальнейшего его развития. Здесь существует такая же разница, как меж­ду моментальной фотографией человека и его портре­том, написанным кистью истинного художника. В про­изведении художника перед нами обобщающий образ человека во всем своеобразии не только его физического облика, но и внутреннего духовного содержания. По ху­дожественному портрету мы можем прочесть и прошлое запечатленного на нем человека и определить, на что он способен в своих поступках. А моментальная фотогра­фия, хотя и способна дать более точное изображение внешности оригинала, лишена этих качеств и нередко фиксирует и случайный прыщ, вскочивший на носу, и<145> совершенно нехарактерную позу или выражение, что в конечном счете приводит к искажению и оригинала.

Следует оговориться, что способ «моментальных снимков» можно, конечно, применять и к фактам разви­тия языка. Но в этом случае мы в действительности будем иметь дело только с отдельными состояниями языка, которые при квантитативной своей характеристике ока­зываются связанными не в большей мере, чем сопоста­вительная квантитативная характеристика разных язы­ков. Подобного рода квантитативная «динамика» ничего органического не будет заключать в себе, и связь от­дельных состояний языка будет покоиться только на со­поставлении числовых отношений. Если и в этом случае прибегать к аналогии, то можно сослаться на рост ре­бенка. Его развитие, разумеется, можно представить в виде динамики числовых данных о его весе, росте, изме­няющихся отношений объема частей его тела, но все эти данные абсолютно отрешены от всего того, что в первую очередь составляет индивидуальную сущность челове­ка - его характера, склонностей, привычек, вкусов и т.д.

Другой негативной стороной математического «мо­делирования» языка является то обстоятельство, что оно не может служить тем общим принципом, на основе которого можно осуществить всестороннее и всеобъемлю­щее - систематическое описание языка. Только лишь математический подход к явлениям языка, например, не даст возможности ответить даже на такие коренные вопросы (без которых немыслимо само существование науки о языке), как: что такое язык, какие явления сле­дует относить к собственно языковым, как определяется слово или предложение, каковы основные понятия и категории языка и пр. Прежде чем обратиться к матема­тическим методам исследования языка, необходимо уже заранее располагать ответами (хотя бы и в форме рабо­чей гипотезы) на все эти вопросы. Нет надобности за­крывать глаза на то, что во всех известных нам случаях исследования языковых явлений математическими мето­дами все указанные понятия и категории неизбежно при­ходилось принимать таковыми, как они были определены традиционными или, условно говоря, качественными методами.

Эту особенность математических методов в их лингви­стическом применении отметил Спанг-Ханссен, когда пи<146>сал: «Следует иметь в виду, что наблюденные факты, по­лучающие квантитативное выражение... не имеют ценности, если они не составляют части описания, а для линг­вистических целей это должно быть систематическое описание, тесно связанное с качественным лингвистиче­ским описанием и теорией» 1 15 . В другом выступлении Спанг-Ханссена мы встречаем уточнение этой мысли: «До тех пор, пока не будет доказана возможность постро­ения квантитативной системы, и до тех пор, пока су­ществует общепринятая качественная система для данной области исследования, частотные подсчеты и иные чис­ловые характеристики с лингвистической точки зрения не имеют никакого смысла» 1 16 . Подоб­ные же идеи вы­сказывает и Улдалль, несколько неожиданно связывая их с разработкой, общетеоретических основ глоссематики: «Когда лингвист считает или измеряет все то, что он счи­тает и измеряет, само по себе определяется не квантита­тивно; например, слова, когда они подсчитываются, определяются, если они вообще определяются, в совершенно иных терминах» 1 17 . <147>

Таким образом оказывается, что как в теоретическом отношении, так и в практическом их применении, мате­матические методы находятся в прямой зависимости от лингвистических понятий и категорий, определенных традиционными, филологическими, или, как говорилось вы­ше, качественными методами. В плане прикладного язы­кознания важно осознание этой зависимости, а следова­тельно, и знакомство со всей совокупностью основных ка­тегорий традиционной лингвистики.

Нет, правда, никаких оснований упрекать представи­телей точных наук, работающих в области прикладной лингвистики, в том, что они не используют данных совре­менной лингвистики. Это не соответствует действитель­ному положению вещей. Они не только отлично знают, но и широко используют в своей работе установленные лингвистами системы дифференциальных признаков, свойственные разным языкам, дистрибуцию и аранжи­ровку языковых элементов в пределах конкретных язы­ковых систем, достижения акустической фонетики и т. д. Но в этом случае необходима весьма существенная ого­ворка. Фактически представители точных наук пользу­ются данными только одного направления в языкозна­нии - так называемой дескриптивной лингвистики, кото­рая сознательно отграничилась от традиционных про­блем теоретического языкознания, далеко не покрывает собой всего поля лингвистического исследования, с соб­ственно лингвистической точки зрения обладает сущест­венными методическими недостатками, что и привело ее к вскрывшемуся в последнее время кризису 1 18 , и, кроме того, имеет сугубо практическую направленность, соответствующую интересам прикладной лингвистики. К дескриптивной лингвистике применимы все те оговорки и упреки, которые выше были сделаны в адрес стати­ческого рассмотрения языка. Подобный односторонний подход дескриптивной лингвистики может, следователь<148>но, оправдываться только теми задачами, которые ста­вит перед собой прикладная лингвистика, но он далеко не исчерпывает всего содержания науки о языке.

В процессе разработки вопросов прикладного языко­знания могут возникнуть и фактически уже возникли но­вые теоретические проблемы. Некоторые из этих проблем тесно связаны с конкретными задачами прикладно­го языкознания и направлены на преодоление тех труд­ностей, которые возникают при разрешении этих задач. Другие проблемы имеют прямое отношение к теоретиче­скому языкознанию, позволяя в новом аспекте взглянуть на традиционные представления или открывая новые области лингвистического исследования, новые понятия и теории. К числу этих последних, например, относится проблема создания «машинного» языка (или языка-по­средника), которая самым тесным образом связана со сложным комплексом таких кардинальных вопросов тео­ретического языкознания, как взаимоотношение понятий и лексических значений, логики и грамматики, диахро­нии и синхронии, знаковой природы языка, сущности лингвистического значения, принципов построения ис­кусственных языков и т.д. 1 19 . В этом случае особенно важно наладить взаимопонимание и содружество в об­щей работе представителей лингвистических дисциплин и точных наук. Что касается лингвистической стороны, то речь в данном случае, видимо, должна идти не о том, чтобы уже заранее ограничивать усилия, например, кон­структоров переводческих машин» и пытаться установить рабочие возможности подобных машин стихами Н. Гри­бачева или прозой В. Кочетова 1 20 . Машина сама найдет границы своих возможностей, а рентабельность - пре­делы ее использования. Но языковеды в качестве своего вклада в общее дело должны внести свое знание особенностей структуры языка, ее многогранности, внутрен­них перекрещивающихся отношений ее элементов, а также широких и многосторонних связей языка с физи­ческими, физиологическими, психическими и логически<149>ми явлениями, специфическими закономерностями функ­ционирования и развития языка. Вся совокупность этих знаний необходима конструкторам соответствую­щих машин, чтобы не блуждать в неверных направле­ниях, но сделать поиски целеустремленными и четко ориентированными. Даже и тот весьма краткий обзор случаев применения математических методов к лингви­стической проблематике, который был сделан в настоя­щем очерке, убеждает, что такие знания отнюдь не будут лишними для представителей точных наук.

На основании всех изложенных соображений можно, очевидно, прийти к некоторым общим выводам.

Итак, математическая лингвистика? Если под этим разумеется применение математических методов в каче­стве универсальной отмычки для решения всех лингви­стических проблем, то такие претензии следует признать абсолютно неправомерными. Все, что было сделано в этом направлении, пока очень мало или даже совсем не способствовало решению традиционных проблем нау­ки о языке. В худшем случае применение математиче­ских методов сопровождается очевидными нелепостями или же с лингвистической точки зрения является абсо­лютно бессмысленным. В лучшем случае математические методы могут быть использованы в качестве вспомога­тельных приемов лингвистического исследования, буду­чи поставлены на службу конкретным и ограниченным по своему характеру лингвистическим задачам. Ни о ка­кой «квантитативной философии языка» при этом не мо­жет быть и речи. На самостоятельность науки о языке в свое время посягали и физика, и психология, и физио­логия, и логика, и социология, и этнология, но не смогли подчинить себе языкознания. Случилось обратное - язы­кознание воспользовалось достижениями этих наук и в нужной для себя мере стало пользоваться их помощью, обогатив тем самым арсенал своих исследовательских приемов. Теперь, видимо, наступила очередь математи­ки. Следует надеяться, что это новое содружество также будет способствовать укреплению науки о языке, совер­шенствованию его рабочих приемов, увеличению их мно­гообразия. О математической лингвистике, следователь­но, правомерно в такой же степени говорить, как и о фи­зической лингвистике, физиологической лингвистике, ло­гической лингвистике, психологической лингвистике и<150> т. д. Таких лингвистик нет, есть только одна лингвистика, с пользой для себя реализующая данные других наук в качестве вспомогательных исследовательских средств. Таким образом, нет никаких оснований отступать перед натиском новой науки и с легкостью уступать ей завое­ванные позиции. Здесь очень уместно вспомнить слова А. Мартине: «Быть может, это и соблазнительно -присоединиться путем использования нескольких удачно выбранных терминов к тому или иному крупному движе­нию мысли, или заявить какой-нибудь математической формулой о строгости своего рассуждения. Однако лин­гвистам уже пришло время осознать самостоятельность их науки и освободиться от того комплекса неполноцен­ности, который заставляет их связывать любое свое действие с тем или иным общенаучным принципом, в ре­зультате чего контуры действительности всегда делают­ся лишь более расплывчатыми, вместо того, чтобы стать более четкими» 1 21 .

Следовательно, математика сама по себе и языко­знание само по себе. Это отнюдь не исключает их взаим­ной помощи или дружеской встречи в совместной работе над общими проблемами. Такого рода местом приложе­ния согласных усилий двух наук и является весь широ­кий круг проблем, входящих в прикладное языкознание и обладающих большой народнохозяйственной значи­мостью. Следует пожелать только, чтобы в своей совместной работе обе науки проявили максимум вза­имопонимания, что, несомненно, будет способствовать и максимальной плодотворности их сотрудничества.<151>

Проникновение в лингвистику математических методов и «математического духа» способствовало развитию лингвистики в сторону точности и объективности. Однако на пути ее дальнейшего развития в этом направлении стоят серьезные препятствия. Автор размышляет о причинах сближения лингвистики и математики, о границах применимости в лингвистике математических методов и о природе факторов, препятствующих взаимопониманию математиков и лингвистов.

Когда во второй половине 50-х годов некоторые молодые лингвисты задумались о применении математических методов для исследования структуры языка и начали сотрудничать с математиками, это вызвало у очень многих их коллег удивление и даже шок - ведь они с детства были убеждены, что гуманитарные науки, одной из которых является лингвистика, с математикой и другими «точными» науками не имеют и не могут иметь ничего общего.

Между тем наличие тесной связи между естественным языком и математикой вовсе не было в то время новым открытием. Л. С. Выготский писал в опубликованной в 1934 году книге «Мышление и речь»: «Первым, кто увидел в математике мышление, происходящее из языка, но преодолевающее его, был, по-видимому, Декарт» и продолжал: «Наш обычный разговорный язык из-за присущих ему колебаний и несоответствий грамматического и психологического находится в состоянии подвижного равновесия между идеалами математической и фантастической гармонии и в непрестанном движении, которое мы называем эволюцией».

Возникшее в Древней Греции учение о грамматических категориях уже представляло собой описание ряда важнейших аспектов строения языка с помощью абстрактных моделей, близких по стилю к тем моделям, которые были созданы древнегреческими математиками для описания пространственных форм; только привычность таких понятий, как падеж, род и т. п., ставших, как писал Х. Штейнталь, «нашей второй натурой», мешает нам понять, какого высокого уровня абстрактного мышления потребовало их создание. Так что удивляться следовало бы скорее тому, что первые попытки использовать для описания языкового «идеала математической гармонии» настоящие математические средства были предприняты лишь в середине ХХ столетия.

Можно указать две причины такого «запоздания». Во-первых, наука о языке после значительных шагов, сделанных в античную эпоху, снова начала по-настоящему развиваться только в XIX столетии, но в течение всего этого столетия главное внимание лингвистов было обращено на историю языка, и лишь в следующем веке, который вообще был для гуманитарных наук веком структурализма, лингвистика впервые после античного периода обратилась к изучению языковых структур, но уже на новом уровне. Когда лингвисты осознали, что язык представляет собой, говоря словами Ф. де Соссюра, «систему чистых отношений», т. е. систему знаков, физическая природа которых несущественна, а существенны только отношения между ними, стала совершенно очевидна параллель между языком и математическими конструкциями, которые тоже являются «системами чистых отношений», и уже в начале ХХ столетия тот же де Соссюр мечтал об исследовании языка математическими средствами.

Во-вторых, в математике в начале Нового времени вышли на первый план количественные методы, и только в XIX веке математики снова начали строить неколичественные абстрактные модели, отличавшиеся от античных более высоким уровнем абстракции, а также - что для нашей темы особенно важно - тем, что они могли использоваться для описания значительно более широкого круга явлений, чем пространственные формы; нередко такие модели оказывались удобным и даже необходимым средством для изучения явлений, о которых строившие их математики вовсе не думали и даже не знали об их существовании. Среди этих моделей были и те, которые впоследствии получили применение в лингвистике; особенно интенсивное развитие математических дисциплин, содержанием которых было их построение, пришлось на первую половину ХХ столетия. Поэтому встреча математики и лингвистики в середине этого столетия была вполне закономерна.

Одним из результатов этой встречи было возникновение новой математической дисциплин - математической лингвистики, предметом которой является разработка математического аппарата для лингвистических исследований. Центральное место в математической лингвистике занимает теория формальных грамматик, по характеру используемого в ней аппарата родственная математической логике и в особенности теории алгоритмов. Она доставляет формальные методы описания правильных языковых единиц различных уровней, а также, что особенно важно, формальные методы описания преобразований языковых единиц - как на одном уровне, так и межуровневых. К теории формальных грамматик примыкает теория синтаксических структур, значительно более простая в отношении аппарата, но не менее важная для лингвистических приложений. В математической лингвистике разрабатываются также аналитические модели языка, в которых на основе тех или иных - считающихся известными - данных о «правильных текстах» производятся формальные построения, результатом которых является описание каких-то «составных частей» механизма языка. На этом пути можно получить формальное описание некоторых традиционных грамматических понятий. Сюда же следует отнести описание смысла предложения с помощью аппарата интенсиональной логики («семантику Монтегю»).

Разумеется, с помощью математического аппарата можно описать только один из двух идеалов языка, о которых говорил Выготский; поэтому часто раздающиеся возражения против использования той или иной математической модели (или математических моделей вообще) на том основании, что такие-то и такие-то частные случаи она не охватывает, не имеют смысла: для описания присущих языку «колебаний и несоответствий» нужны совсем другие, не математические средства, и как раз четкое описание «математического идеала» могло бы помочь их находить, поскольку оно позволило бы ясно отграничивать в языке «фантастическое» от «математического». Но это пока что дело будущего.

Не меньшее, а может быть и большее значение, чем возникновение математической лингвистики, имело непосредственное проникновение в лингвистику фундаментальных математических идей и понятий - таких, как множество, функция, изоморфизм. В современной лингвистической семантике важную роль играют пришедшие из математической логики понятия предиката и квантора. (Первое из них возникло в логике еще тогда, когда она не отграничивалась от лингвистики, и теперь вернулось в лингвистику в обобщенном и математически обработанном виде.)

И, наконец, очень большое значение имеет уточнение языка лингвистических исследований, происходящее благодаря проникновению в лингвистику «математического духа» не только в тех ее областях, где возможно использование математических идей и методов. Все это можно коротко резюмировать так: лингвистика становится все более точной и более объективной наукой - не переставая, само собой, быть наукой гуманитарной.

Однако на этом естественном пути развития лингвистики стоят серьезные препятствия, которые могут его надолго затормозить. Главное из них - возникшее в начале Нового времени «разделение факультетов»: естествоиспытатели и математики с одной стороны и гуманитарные ученые с другой не интересуются работой коллег «на другом факультете» и, более того, - в глубине души, а нередко и открыто презирают их. Математики и естествоиспытатели (и еще больше «технари») склонны видеть в гуманитарных исследованиях всего лишь некое «украшение» или даже «пустую болтовню», а «гуманитарии» готовы терпеть математику и естественные науки лишь ради практической пользы и убеждены, что они ничем не могут помочь постижению природы человеческого духа.

Только в середине XIX столетия в этой, говоря словами великого биолога и великого мыслителя Конрада Лоренца, «зловредной стене между естественными и гуманитарными наукам (die böse Mauer zwischen Natur- und Geistwissenschaften)» была пробита первая брешь в самом тонком месте, отделявшем логику от математики. В ХХ столетии появились и другие бреши - среди них и та, которую пробили с двух сторон математики и лингвисты, - но их все еще мало, стена крепка до сих пор, и нет недостатка в усилиях с обеих сторон укреплять ее дальше и латать пробоины. Нередко эти усилия бывают довольно успешны; последнее «достижение» в этом направлении - «профильное образование» в средней школе, уже в детстве разделяющее способных и интересующихся людей на «факультеты» и приучающее их гордиться невежеством в «чужих» науках - может очень сильно воспрепятствовать дальнейшему сближению естественных и гуманитарных наук, настоятельно необходимому для нормального развития тех и других. Одно из последствий воздвижения стены состоит в том, что «гуманитарии», включая подавляющее большинство лингвистов, ничего не знают даже об азах как раз тех разделов математики, которые имеют наибольшее значение для гуманитарных наук (и представляют себе математика как человека, занятого исключительно вычислениями).

Другое препятствие - характерная для нынешнего состояния науки бешеная гонка, безостановочная погоня за все новыми и новыми «результатами», сужающая кругозор и не оставляющая времени задуматься над более глубокими проблемами или заняться серьезным изучением смежной и тем более не совсем смежной научной дисциплины. Это относится в равной степени к лингвистам и к математикам - как, впрочем, и ко всем, кто профессионально занимается наукой.

И третье - инертность, или, проще говоря, лень. На первый взгляд лень и бешеная гонка несовместимы, но в действительности они прекрасно уживаются между собой и, более того, поддерживают и стимулируют друг друга. Когда человеку лень взяться за трудное дело, он хватается за более легкое и более «надежное», успехи в котором оправдывают и поощряют его инертность. Высокомерное отношение к «меньшим братьям», копошащимся по другую сторону стены, также поощряет лень и поощряется ею. Когда, например, математик предлагает пересмотреть все представления о древней истории, не дав себе труда хоть немного познакомиться с древними языками, за это в весьма значительной степени ответственна та же лень-матушка.

Опасность для развития науки, создаваемая этими препятствиями, гораздо серьезнее, чем может показаться на первый взгляд. Когда невежество в «чужих» науках становится предметом гордости, это закономерно ведет к поверхностности и невежеству также и в «своих». «Факультетов» давно уже много больше двух, число их растет из года в год, и каждый отгораживается стеной от других; появляются стены и внутри факультетов. Кругозор исследователей постепенно сужается; правда, аппарат исследования становится все более тонким и изысканным, но в поле его зрения попадают почти исключительно мелкие предметы, и укрепляется представление, будто только они и заслуживают изучения. Есть все основания говорить о кризисе в науке, и лингвистика не является исключением. Сейчас, как мне представляется, самое время оглянуться и задуматься.

Здесь собрались лингвисты того направления, которое связано с моделью «Смысл - Текст». Эта модель, созданная в 60-е годы теперь уже прошлого столетия, была одним из первых и лучших результатов встречи лингвистики и математики, после которой выросли уже два поколения лингвистов, со студенческих лет приучившихся к точному мышлению. Но и они, к сожалению, не свободны от инертности, мешающей им осознать наличие кризиса и задуматься о путях его преодоления. Между тем среди всех лингвистов - и, может быть, даже среди всех, кто занимается гуманитарными науками - у них больше всего объективных возможностей для такого осознания, и хотелось бы надеяться, что они этими возможностями воспользуются.

Текст доклада любезно предоставлен А. В. Гладким и издательством

I МАТЕМАТИЧЕСКИЕ АСПЕКТЫ СТРУКТУРЫ ЯЗЫКА

В. Звегинцев ПРИМЕНЕНИЕ В ЛИНГВИСТИКЕ ЛОГИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ

].

Не подлежит сомнению, что использование в языкознании математических и логических методов в значительной степени было стимулировано задачами прикладной лингвистики. Если и делались попытки приложения этих методов к решению проблем, непосредственно относящихся к области теоретического языкознания, например для разграничения явлений языка и речи 1 , то в перспективе (хотя, может быть, и не всегда ясной и близкой) имелись в виду все же потребности прикладной лингвистики.

Успех использования этих методов в совершенно новой области с общей точки зрения во многом обусловливается ответом на вопрос о том, в какой мере допустимо отождествление логически правильного языка с естественным языком, или, в другой формулировке, возможно ли сведение второго к первому 2 . Ответ на этот вопрос обычно дается в практической форме - посредством построения статистических, теоретико-информационных, теоретико-множественных, теоретико-вероятностных и других моделей языка, не всегда, впрочем, ориентирующихся на конкретные задачи. При построении подобного рода моделей их авторы нередко исходят из того допущения (очевидного с их точки зрения), что любое приложение формальнологического или математического аппарата к лингвистическому описанию и исследованию автоматически способствует их совершенствованию. По этому поводу хорошо

1 См . G. Herdan, Language as Choice and Chance, Gronigen, 1956.

2 Ср. замечание Г. Карри: «То, что существует тесная связь между математикой и логикой, с одной стороны, и языком - с другой, стало очевидным уже довольно давно, а сейчас этот факт оказался в центре внимания в более строгом смысле...» (см. ниже, стр. 98).

сказал Уоррен Плат в своем обзоре работ по математической лингвистике: «Если рассматривать языковые модели как абстрактные системы дискретных элементов, то к ним можно применять различные математические понятия и методы, начиная от элементарной идеи числа и кончая сложными логическими, статистическими и теоретико-множественными операциями. Однако представление о том, что всякое привлечение чисел и математических операций для описания таких систем элементов делает утверждения более «точными» или более «научными», является абсолютно ошибочным. Нужно прежде всего показать, что новая система, полученная таким образом, является более удовлетворительной моделью, чем исходная система,- либо в том отношении, что она дает возможность формулировать более простые и более общие теоретические утверждения о некоторых аспектах моделируемой области, либо потому, что операции над моделью проливают свет на результаты соответствующих операций в моделируемой области. Одна из самых больших опасностей, связанных с построением математических моделей языка, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и дезориентирующим результатам. Поэтому необходимо ясно понимать, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы» 3 .

С тем чтобы по возможности избежать указанной Уорреном Платом опасности, необходимо располагать не только чисто эмпирическими попытками ответа на сформулированный выше вопрос, но и стремиться к его общетеоретическому осмыслению. По сути дела вопрос о сводимости естественного языка к той или иной логико-математической его модели или интерпретации есть основной вопрос теории прикладной лингвистики, необходимость создания которой ощущается все более настоятельно. Для решения данного вопроса в первую очередь должна быть рассмотрена природа тех явлений, которые составляют предмет изучения, с одной стороны, логики и математики,

3 См. статью Плата в настоящем сборнике, стр. 202.

а с другой - естественного языка, а затем также возможности тех методов, которые использует каждая из этих наук. Уже из сопоставительного изучения этих моментов окажется возможным сделать некоторые общие выводы. Последние могут быть не бесполезными для всех тех, кому по необходимости приходится проводить свои исследования на пересечении указанных наук.

До известной степени эту цель преследовал и симпозиум «Структура языка и его математические аспекты», проведенный Американским математическим обществом. Избранные работы этого симпозиума и составляют нижеследующий раздел. Но все они, как это явствует и из самого названия симпозиума, затрагивают только отдельные и в ряде случаев весьма частные аспекты интересующей нас проблемы. Хотя в своей совокупности они и создают достаточно аргументированные предпосылки для ответа на поставленный нами вопрос, однако в них все же отсутствует четкое и недвусмысленное формулирование необходимых выводов. Во многом участники симпозиума продолжают линию эмпирических попыток разрешения данного вопроса, отнюдь не навязчиво предлагая свои опыты вниманию лингвистов в надежде, что последние уже сами разберутся в том, насколько предоставленные в их распоряжение гипотезы и решения окажутся пригодными для целей лингвистики.

2.

Как кажется, мы уже располагаем недвусмысленным ответом на наш вопрос. Так, Н. Д. Андреев и Л. Р. Зиндер пишут: «Математическое представление (модель) языков отнюдь не тождественно самому языку» 4 . Эту мысль развивает и автор книги «Модели языка» И. И. Ревзин, который указывает, что результатом моделирования может явиться лишь «более или менее близкая аппроксимация данных конкретной действительности» 5 . Однако сказать так, значит еще ничего не сказать, поскольку остается

4 Н. Д. Андреев, Л. Р. Зиндер, Основные проблемы прикладной лингвистики, «Вопросы языкознания», 1959, № 4, стр. 18

5 И. И. Р е в з и н, Модели языка, Москва, 1962, стр. 8. Кстати говоря, выражение «близкая аппроксимация» - прямая тавтология: близкая приближенность.

нераскрытым, почему это так, и следует ли все же обращаться к методу математического и логического моделирования, а если да, то в каких пределах и для какой цели.

Прежде чем приступить к решению этих вопросов, необходимо сначала установить, к каким наукам - индуктивным или дедуктивным - относятся лингвистика, логика и математика. Что касается последних двух наук, то их положение ясно - они, бесспорно, относятся к дедуктивным наукам, которые опираются в своей исследовательской методике на умозаключение. Лингвистику же традиционно определяют как эмпирическую науку, поскольку полагают, что ее главной научной целью является описание фактов. Это значит, видимо, что лингвистика должна быть отнесена к области индуктивных наук. Это значит также, что, стремясь использовать в лингвистике формальный аппарат логики и математики, пытаются применить в индуктивной науке дедуктивные методы исследования.

Впрочем, в последние годы индуктивная природа науки о языке косвенно или прямо стала подвергаться сомнению. В наиболее резкой форме это сделал Л. Ельмслев. Правда, используемая им терминология весьма сбивчива и, в частности, характеризуется своеобразным и очень личным пониманием терминов дедукция и индукция (фактически он истолковывает их в обратном смысле). Однако основы его лингвистической теории не оставляют никаких сомнений относительно ее методологической сущности. Так, он считает допустимым использование любых исходных операционных определений, что характерно для дедуктивных наук. И сам он в следующих выражениях характеризует свою теорию: «1. Теория в нашем смысле сама по себе независима от опыта. Сама по себе она ничего не говорит ни о возможности ее применения, ни об отношении к опытным данным. Она не включает постулата о существовании. Она представляет собой то, что было названо чисто дедуктивной системой, в том смысле, что она одна может быть использована для исчисления возможностей, вытекающих из ее предпосылок. 2. С другой стороны, теория включает ряд предпосылок, о которых из предшествующего опыта известно, что они удовлетворяют условиям применения к некоторым опытным данным. Эти предпосылки наиболее общи и могут поэтому удовлетворять условиям применения к большому числу экспериментальных данных» 6 .

Как явствует из этого высказывания, Л. Ельмслев стремится провести идею о двойственной методической природе объектов лингвистического исследования с преимущественным акцентом на их дедуктивные признаки. Ему следует приписать и тот довольно двусмысленный способ («с одной стороны.., но с другой стороны...»), который вообще стал характерным для рассмотрения данного вопроса (и который дает возможность повернуть в любую из сторон). Идея методической двойственности лингвистики получила в последнее время широкое распространение и даже послужила теоретической основой для формулирования принципов самого последнего по времени своего возникновения направления в науке о языке - лингвистики универсалий (универсалиализма). В «Меморандуме относительно лингвистических универсалий» говорится по этому поводу: «Изучение лингвистических универсалий ведет к целой серии эмпирических обобщений относительно языкового поведения - как еще требующих эксперимента, так и уже установленных. Эти обобщения представляют собой потенциальный материал для построения дедуктивной структуры научных законов. Впрочем, некоторые и, может быть, большинство из них пока располагают всего лишь статусом эмпирических обобщений, которые при современном состоянии наших знаний не представляется возможным соотнести с обобщениями или дедуктивно вывести из законов более общей значимости» 7 . С не меньшей определенностью выражается и Дж. Грян-берг в своем предисловии к сборнику, посвященному лингвистическим универсалиям. Полемизируя с известными словами Л. Блумфилда о том, что «единственно правомерными обобщениями относительно языка являются индуктивные обобщения», он пишет: «Все же, по-видимому, считается общепринятым, что научный метод должен быть-не только индуктивным, но и дедуктивным. Формулирование обобщений, полученных индуктивным исследованием, приводит к теоретическим гипотезам, на основе

6 Л. Е л ь м с л е в, Пролегомены к теории языка, Сб. «Новое-в лингвистике», вып. I , М., 1960, стр. 274-275.

7 «Memorandum Concerning Language Universals», в «Universals of Language», ed. by J. Greenberg, Cambridge, Mass., 1963, pp. 262 - 263.

которых путем дедукции в свою очередь могут быть выведены дальнейшие обобщения. Эти последние затем должны быть подвергнуты эмпирической проверке» 8 .

То обстоятельство, что история языкознания состоит не только из накопления фактов языка и их классификации, но и из смены точек зрения на сам язык, что неизбежно предполагает различие подходов к языковым фактам и даже различное их теоретическое истолкование, заставило и некоторых советских лингвистов также прийти к выводам о методической двойственности их науки. С. К. Шаумян предпочитает, правда, говорить при этом о методе гипотетико-дедуктивном, и следующим образом излагает его особенности: «Гипотетико-дедуктивный метод представляет собой циклическую процедуру, которая начинается с фактов и кончается фактами. В этой процедуре различаются четыре фазы:

1) фиксирование фактов, требующих объяснения;

2) выдвижение гипотез для объяснения данных фактов;

3) выведение из гипотез предсказаний о фактах, лежащих за пределами круга фактов, для объяснения которых были выдвинуты гипотезы;

4) проверка фактов, которые предсказываются гипотезами, и определение вероятности гипотез.

Гипотетико-дедуктивный метод принципиально отличается от индуктивного метода, применяемого в таких областях знания, как, например, описательная ботаника или зоология» 9 . Метод С. К. Шаумяна полностью повторяет метод лингвистики универсалий и Дж. Гринберга. Единственное различие состоит в наименовании. Если, например, Дж. Гринберг говорит о сочетании индуктивного и дедуктивного метода, то С. К. Шаумян именует свой метод гипотетико-дедуктивным - обозначение явно непоследовательное для метода, который «начинается с фактов и кончается фактами».

Вопросом о том, куда следует отнести языкознание, задается и И. И. Ревзин. «По самой своей природе,- от-

8 « Universals of Languages p . IX .

9 С. К- Шаумян, Проблемы теоретической фонологии, М., 1962, сгр. 18-19. Относительно гипотетико-дедуктивного метода см. также статью В. С. Ш в ы р е в а, Некоторые вопросы логико-методологического анализа отношения теоретического и эмпирического уровней научного знания, в сборнике «Проблемы логики науч-шого познания», М., «Наука», 1964, стр. 66-75 (3-й раздел статьи).

вечает он на этот вопрос,- языковедение должно прежде всего пользоваться индуктивными методами, оно описывает конкретные речевые акты конкретных языков...

С другой стороны, наличие бесконечного множества речевых актов, изучаемых лингвистом, едва ли дает возможность сформулировать основные понятия науки о языке обобщением по индукции.

Отсюда следует, что лингвисты нуждаются не только в индуктивных, но и в дедуктивных методах исследовав ния, чтобы получить систему общих знаний, помогающих осмыслить те данные, которые добываются при анализе конкретных языков...

В своей дедуктивной части языковедение, по-видимому, может быть построено так, как строится логика или математика, а именно: выделяется некоторое минимальное количество первичных, неопределяемых терминов, а все остальные термины определяются через первичные. При этом должны быть четко сформулированы некоторые первичные утверждения о связи этих терминов между собой (аксиомы), и все остальные утверждения должны доказываться, то есть сводиться к некоторым другим утверждениям» 10 .

Здесь метод дедукции, воплощающийся в логике и математике, выступает всего лишь как средство упорядочения «множества речевых актов», для целей создания «системы общих понятий». В прямом противоречии с этой задачей стоит, однако, изложение самого дедуктивного метода, рекомендуемого для использования в языкознании. Он полностью отмысливается и от актов и от фактов и за исходный момент построения системы общих лингвистических понятий принимает набор неопределяемых и, по-видимому, абсолютно условных первичных терминов, через посредство которых определяются все последующие термины.

Это противоречие не случайно, оно кроется в самой природе рассматриваемых нами наук. Казалось бы, вывод о том, что при изучении лингвистических объектов допустимо сочетание индуктивного и дедуктивного методов, открывает двери для использования в лингвистике логических и математических методов, а конкретной реализацией этого вывода является создание многочисленных

10 И. И. Р е в з и н, Модели языка, М., 1962, стр. 7-8.

формально-логических и математических моделей языка. Но, как будет показано в дальнейшем, такой упрощенный лодход не может дать удовлетворительных результатов. Можно согласиться с тем, что в лингвистическом исследовании допустимо и даже необходимо сочетать дедуктивную и индуктивную методику. В конце концов, как писал В. Брёндаль, «индукция есть не что иное, как замаскированная дедукция, и за чистыми связями, установленными между наблюдаемыми явлениями, совершенно неизбежно предполагается реальность, специфический объект данной науки» 11 . Но это еще не значит, что в лингвистику следует безоговорочно и механически переносить формальный аппарат логики и математики без всякого учета «специфического объекта данной науки». Как справедливо замечает тот же И. И. Ревзин, «доказательства, полученные дедуктивным путем, сколь бы безукоризненными они ни были с логической точки зрения, еще ничего не говорят о свойствах реального языка, описываемого моделью» 12 . И для определения действенности моделей он рекомендует обратиться к практике, каковую представляет машинный перевод и «другие практические приложения, языкознания».

А практика прикладной лингвистики свидетельствует, что на использование математических и логических методов при изучении явлений языка накладываются очень строгие ограничения.

Логика дает пример наиболее последовательного использования дедуктивного метода. Математика во многом следует в этом отношении за логикой, и поэтому они могут рассматриваться совместно.

Разумеется, и логика, и математика в отношении своих методов и интерпретации целей не представляют гомогенных систем. Так, например, применительно к логике мы можем говорить о логике диалектической, формальной, математической и в более узком смысле - о предметной, семантической, феноменологической, трансцедентальной, или конструктивной, комбинаторной, многозначной, мо-

11 В. Брёндаль, Структуральная лингвистика. Цит. по
книге В. А. Звегинцева «История языкознания XIX и XX вв. в очер-
ках и извлечениях», ч. II, М., Учпедгиз, 1960, стр. 41-42.

12 И. И. Ревзин, Модели языка, М., 1962, стр. 10.

дальной и пр. По необходимости, однако, придется от-мыслиться от всех подобных подразделений и говорить только о самых общих чертах, свойственных логике и математике в целом, и главным образом о тех, которые с наибольшей отчетливостью демонстрируют дедуктивный характер методов этих наук.

Став на эту позицию, мы, следовательно, не будем обращаться к индуктивной логике. Отметим только, что выводы в индуктивной логике не определяются предпосылками - тем самым они не являются тавтологическими. Выводы в индуктивной логике находятся в прямой зависимости от фактов, а эти последние определяются объемом наших знаний - таким образом, они устанавливаются на вероятностной основе. Вероятность является основным методическим орудием индуктивной логики.

Дедуктивную логику наиболее полным образом представляют формальная и математическая логики, имеющие много общего. Дедуктивная логика - наука, изучающая человеческое мышление или мыслительные акты со стороны их структуры или формы, отвлекаясь от их конкретного содержания. Таким образом, дедуктивная логика стремится сформулировать законы и принципы, соблюдение которых является обязательным условием для достижения истинных результатов в процессе получения выводного знания. Основным методическим орудием дедуктивной логики является импликация. Выводное зна-ние она получает без непосредственного обращения к опыту или к практике, лишь посредством применения законов логики. В процессе дедукции предпосылка обусловливает вывод: если предпосылка истинна, то и вывод должен быть истинным. Таким образом, вывод заключается уже в предпосылке, и цель дедукции - сделать очевидным то, что в скрытом состоянии заключено уже в предпосылке. Отсюда следует, что всякий полученный посредством дедукции вывод тавтологичен, то есть логически является пустым, хотя с иных точек зрения, например в случаях применения формально-логического аппарата для целей других наук, может быть новым, неожиданным и оригинальным.

Аналогичное положение имеет место в математике - обоснованность доводов в ней полностью покоится на дедукции. При этом в математике, как правило, приемлема любая исходная точка зрения, любой подход к решению проблемы - лишь бы они удовлетворяли условиям математической дедукции. Математика располагает богатым набором такого рода «исходных точек зрения» и «подходов», которые исследователь альтернативно может использовать для решения своей задачи. Математическая проблематика часто переводима в разные эквивалентные формы, а каждая из них предполагает использование различных областей математической теории с целью решения проблемы. Таким образом, математик обладает фактически неограниченной свободой выбора предпосылок - он выбирает те из них, которые, с его точки зрения, таят в себе самые обещающие возможности для наиболее простого, небанального, изящного решения задачи. Его талант и опыт проявляются именно в удачном выборе предпосылок, тех «допустим, что...» или «если..., то», которыми пестрят математические работы. Так же как и в логике, математические предпосылки - аксиомы или постулаты - обусловливают определения еще не определенных единиц.

Свобода выбора предпосылок в математике находится в прямой зависимости от тех нематериальных единиц или объектов, которыми она оперирует,- ее внимание направлено на отношения между ними. Математические объекты выступают в качестве символов, выражающих структуру чистых отношений. Математическую систему можно, таким образом, рассматривать как набор формальных отношений, существующих лишь в силу констатации этих отношений. Разумеется, в частности в прикладных целях, констатации отношений могут быть направлены на воплощение в них корреспонденции с внешней реальностью, что не окажет никакого воздействия на сами эти констатации, скорее, наоборот. Математики исследуют не «истинность» своих аксиом, хотя и требуют между ними взаимной согласованности. Исследование внутри математической системы есть исследование и установление связей, которые позволяют доказать, что факт теории А предполагает факт теории Б. Следовательно, основной вопрос в математике не «что такое А и Б», а «предполагает ли А (или обусловливает ли) Б?»

Совершенно иное положение в лингвистике - она в основном ориентируется на первый из этих вопросов, и это не дает ей возможности оторваться от реальности; она, следовательно, оперирует не абстрактными, а конкретными единицами, хотя и стремится в ряде случаев к созданию абстрагированных объектов вроде понятия фонемы или морфемы. Такое положение характерно не только для традиционной лингвистики, но в равной степени свойственно и новейшим ее направлениям, объединившимся под знаменем структурализма. Выше уже приводился ряд высказываний, авторы которых, пытаясь использовать в науке о языке не только индуктивные, но и дедуктивные методы (или математические и логические методы), не смогли все же обойти необходимость обращения к реальному лингвистическому факту. В дополнение к ним можно привести еще одно, которое вносит полную ясность в рассматриваемый вопрос. «Лингвистический анализ, - пишет в указанной связи П. Гарвин, - в основном индуктивный процесс в том смысле, что он стремится установить список элементов или набор констатации, исходя из лингвистических стимулов информантов или же из изучения текста. Он основывается на предположении, что в обоих этих источниках сведений окажется возможным распознать регулярно встречающиеся элементы различных типов и порядков сложности. Классификация этих типов и констатация их условий дистрибуции, полученные в результате анализа, образуют индуктивное описание языка» 13 .

В лингвистике, конечно, также можно использовать метод предпосылок, исходя из которых затем определяются частные объекты, факты или единицы языка. Но здесь мы сталкиваемся с двумя особенностями, которые вносят существенные коррективы в использование этого метода. В отличие от логики и математики в этом случае будет искаться «истинность» полученных таким способом определений, то есть их соответствие данным опыта. Таким образом, устанавливается взаимозависимость предпосылки и выводного знания: предпосылка определяет вывод (определение частного лингвистического объекта в терминах предпосылки), но если вывод не соответствует данным опыта, то возникает необходимость коррективы самой предпосылки. Но такого рода коррективы предпосылки не имеют ничего общего с той переводимостью в эквивалентные формы, которая, как указывалось выше, допустима в математике, так как они обусловливаются не

13 P. Garvin, A Study of Inductive Method in Syntax, «Word», vol. 18, 1962, p. 107.

формальными соображениями, а данными опыта. Все сказанное дает основание заключить, что само понятие предпосылки и свобода ее выбора обладают в лингвистическом анализе специфичностью, с которой нельзя не считаться при использовании в языкознании дедуктивного метода.

Лингвисты не могут пользоваться с такой свободой методом «если» или «допустим», как математики. Свобода предпосылок у них очень строго ограничена. История науки о языке знает немало смен «точек зрения» или, иными словами, исходных предпосылок, которые были подсказаны открытием новых фактов, распространением на лингвистику общенаучных идей или даже формированием оригинальных теорий. Но для лингвиста во всех подобных случаях смена «если», или исходной предпосылки, есть смена всей научной концепции. Поэтому лингвист говорит не «если», а постулирует свое понимание предпосылки, то есть фактически понимание предмета своего исследования, и, исходя из этого понимания, дает определение частных единиц языка, проверяя эти определения данными опыта. Последнее же обстоятельство, в силу взаимозависимости предпосылки и вывода в лингвистике, служит средством проверки и правомерности самой предпосылки, стоящей в начале дедуктивного по форме лингвистического анализа. Так, если обращаться к конкретным примерам, в прошлом язык истолковывался как выражение духовной сущности народа (у Гумбольдта), как естественный организм (у Шлейхера), как индивидуальная психофизиологическая деятельность (у младограмматиков) и т. д. Исследовательская практика, основывающаяся на этих концепциях, показала их недостаточность. Ныне исходной предпосылкой лингвистического анализа является постулат, что язык есть система знаков. Он подлежит такой же проверке опытом и практикой, как и любая другая концепция в науке о языке.

Уже эти предварительные и самые общие соображения показывают, что дедуктивные методы вовсе не противопоказаны лингвистике, но применение их требует соблюдения специфических условий. Именно эти специфические условия накладывают определенные ограничения на механическое перенесение методов логики и математики в область лингвистики. Однако, если мы ограничимся такой общей констатацией, многое останется все еще неясным. Именно поэтому следует углубить разбираемый нами «вопрос и для подкрепления потенциальных выводов обратиться к практике прикладной лингвистики, где с наибольшей отчетливостью проявляется правомерность предпосылок и соответствие опытным данным сделанных на их основе выводов.

Отношения между языком и логикой носят весьма своеобразный характер. Представители эмпирических наук, к которым относится и лингвистика, изучают тот или иной предмет или явление с целью описать или объяснить его. Полученные ими результаты они формулируют на языке, который именуется языком-объектом. Логик орудует доказательствами, умозаключениями, суждениями и пр., но они доступны ему только в языковой форме. Таким образом, получается, что логик на одну ступень находится дальше от реального мира, чем представители эмпирических наук. Его анализ направляется не непосредственно на реальный объект, изучаемый эмпирическими науками, а на их язык 14 . Иными словами, он исследует язык и формулирует полученные результаты на языке, который именуется метаязыком.

С логической точки зрения основной единицей языка является не знак и не обозначаемый им объект, а предложение, так как только в нем может развернуться логический процесс. Именно поэтому только предложение может быть истинным или ложным. А слова сами по себе не могут обладать этими качествами. Но прежде чем мы сможем установить, является ли предложение истинным или нет, мы должны констатировать, что оно имеет значение.

Понятия истинности и значения относятся к области семантики, изучающей отношения между языком и обозначаемыми им объектами. Через посредство этих отношений и определяется истинность или ложность предложения: если предложение описывает объекты правильно, оно истинно, а если неправильно - нет. Но языковые выражения могут вступать в отношения иные, чем те, которые

14 «Логический анализ научного знания,- пишут в этой связи П. В. Таванец и В. С. Швырев,- есть прежде всего и непосредственно анализ языка, в котором выражается это знание». См. статью «Логика научного познания» в сборнике «Проблемы логики научного познания», М., «Наука», 1964, стр. 161.

существуют между обозначаемыми ими объектами. Кроме того, предложения могут вступать в отношения с другими предложениями. Задача логика заключается в том, чтобы выяснить природу отношений между языковыми выражениями и предложениями и установить правила для определения того, выдерживается предписанная в данном случае процедура или нет. При решении этого последнего вопроса логик не обращается к объектам, описываемым предложением. Он интересуется лингвистической формой, а не ее содержанием, что, разумеется, не препятствует интерпретации ее содержания, в результате чего возникает формализованный язык. Формализованный язык может быть представлен в виде абстрактной системы, например исчисления предикатов.

Итак, логик может в зависимости от задач исследования работать на двух уровнях - синтаксическом (логический синтаксис) и семантическом (логическая семантика). Рассмотрим сначала приложение первого из этих уровней к естественному языку.

Если логик, занятый изучением языковых форм и существующих между ними отношений, может оставаться в пределах синтаксического уровня, оперируя несодержательными терминами, то лингвист этого сделать не может. Все уровни естественного языка (за исключением, может быть, фонематического) содержательны и поэтому вне семантики немыслимы. И более того, естественный язык не существует вне прагматики, которая не может быть легко отслоена от него в силу той простой причины, что в речевом акте она постоянно трансполируется в семантику. Поэтому естественный язык - всегда интерпретация и притом двуступенчатая, поскольку связана и с семантикой и с прагматикой 15 . И эта интерпретация не поддается пока никакой формализации.

Перейдем теперь ко второму уровню, когда исчислению посредством семантических правил приписывается интерпретация. И в этом случае мы получим образование, никак не сопоставимое с естественным языком. Правда,

15 Ср. замечания Нилса Бора о математическом языке, где «необходимая для объективного описания однозначность определений достигается при употреблении математических символов именно благодаря тому, что таким способом избегаются ссылки на сознательный субъект, которыми пронизан повседневный язык». (Ниле Бор, Атомная физика и человеческое познание, М., ИЛ, 1961, стр. 96.) здесь мы имеем дело с содержательными терминами, но в логическом и естественном языке они строят свое отношение к «истинности» на совершенно иных основаниях. Как пишет А. Тарский, «истинное», «во всяком случае, в его классической трактовке» является таковым в той мере, в какой оно «совпадает с действительностью» 16 . Но этот критерий истинности фактически применим лишь к естественным языкам, всегда ориентированным на действительность. По-иному обстоит дело в логической семантике. Семантический анализ опирается лишь на логическую интерпретацию системы и предполагает установление on - i ределенных правил, формулирующих условия истинности, i Он предписывает следование этим правилам, не отвечая на вопрос о том, в какой мере здесь имеет место «совпаде- i ние с действительностью». Кроме того, сама ориентированность на действительность осуществляется в естественном языке не непосредственно, а через человека, что опять-таки делает необходимым обращение к третьему уровню, - прагматическому. «...Переход на семантический уровень, - констатируют П. В. Таванец и В. С. Швырев, - не есть само по себе возвращение к живому языку в его конкретности, как может показаться на первый взгляд благодаря тому, что смысловая функция языка есть как будто существо языка как «непосредственной действительности мысли». На самом деле исходная схема семантики «язык - действительность» не дает еще конкретного образа языка как непосредственной действительности мысли по той простой причине, что язык связан с действительностью не сам по себе неким мистическим способом, а через человека, через его действия, его поведение. Поэтому, собственно говоря, конкретное представление о языке как носителе мысли может быть достигнуто лишь на уровне его прагматического анализа по схеме «язык - действия человека с языком и на основе языка - действительность» 17 .

Но и это еще не взе. Касаясь данного вопроса, В. M. | Глушков пишет: «Живой человеческий язык может рассматриваться как формальный язык лишь после того, как будет сформулирована строгая система правил, позволяю-

16 А . Т а г s k i, Grundlegung der Wissenschaftlichen Semantik
(Actes du
Congrès International de Philosophie Scientifique, 1936).

17 См. статью «Логика научного познания» в сборнике «Про-
блемы логики научного познания», М., «Наука»,
1964, стр. 16.

щая отличить выражения, допускаемые в языке, от всех прочих выражений, то есть осмысленные предложения От бессмысленных» 18 . Разъясняя трудности, возникающие при формализации естественного языка, он далее указывает, что «...никакой фиксированный формализованный язык не может быть адекватен живому человеческому языку, поскольку последний в отличие от первого непрерывно развивается и совершенствуется. Поэтому всякая формализация любого живого человеческого языка представляет собой лишь более или менее удачный его мгновенный слепок, утрачивающий сходство с оригиналом по мере развития последнего» 19 . Если бы все сводилось только к этому, то это было бы еще полбеды, В прикладной лингвистике отмысливаются от моментов развития языка, стремятся рассматривать его как совершенно стабильную систему и все же никак не удается добиться формализации естественного языка. Происходит это по весьма простой причине. Формальная система и естественный язык основывают свою действенность на полярно противоположных качествах. Всякая формальная система всегда тождественна самой себе. Именно это ее качество делает возможным выполнение ею своих функций во всех конкретных случаях ее приложения. А естественный язык - в плане своего содержания, своей семантики или, как в этих случаях принято говорить, в своем информативном плане - никогда не тождествен самому себе. Именно эта его способность дает возможность функционировать ему во всех конкретных случаях его применения. Оставаясь тем же самым языком, он в разных ситуациях всегда иной. При этом он не обладает ни эксплицитными, ни формативными правилами, ни правилами истинности, ни трансформационными правилами для определения того, какое из потенциальных значений или оттенков значений получит данное слово в той или иной ситуации. Более того, почти любое слово естественного языка может получить значение, которое не зафиксировано никаким языком,- оно может, возникнув, закрепиться в языке, но с таким же успехом, подобно беглому огоньку, вспыхнув, затеряться в лингвистическом космосе и погаснуть.

18 В. М. Г л у ш к о в, Мышление и кибернетика, «Вопросы фи-
лософии», 1963, № 1, стр. 37-38

19 Там же, стр. 38.

И при всех этих своих качествах естественный язык оказывается изумительно совершенным орудием, которое позволяет добиться полного взаимопонимания относительно самых сложных понятий и в любых ситуациях. Почему это происходит?

Видимо, ответ на этот вопрос частично следует искать в одной из мыслей основоположника семиотики Ч. Пирса, которую он настойчиво повторяет во многих своих работах. Она сводится к следующему. В современной лингвистике язык принято определять как систему знаков. Это исходная предпосылка для всего лингвистического анализа. Если это так, то язык не просто система знаков, а система взаимно интерпретирующих друг друга знаков, существующих в нем постольку, поскольку они интерпретированы в других знаках. Ч. Пирс формулирует это следующим образом: «Ни один знак не может функционировать в качестве знака, если он не интерпретирован в другом знаке. Следовательно, для знака абсолютно существенно, чтобы он воздействовал на другой знак» 20 . И в другом месте: «Все назначение знака состоит в том, что он будет интерпретирован в другом знаке» 21 . И, наконец, пожалуй, наиболее важное: «Знак не есть знак, если только он не переводит себя в другой знак, в котором он получает более полное развитие» 22 .

Следовательно, естественный язык есть система знаков, которые посредством взаимной интерпретации получают возможность отвечать на все потребности человека в смысловом выражении. Но здесь необходима одна существенная оговорка. Ведь все потребности этого рода обусловливаются отношением человека к явлениям внешнего мира и общественной средой, в которой протекает его жизнь. В силу этого обстоятельства трансформационная семантика, если бы ее удалось создать, не может опираться лишь на правила взаимной интерпретации знаков, то есть носить закрытый и конечный характер. Она оказывается производной от очень большого количества величин, которые всячески противятся формализации.

20 Ch. Р е i г с е , Collected Papers, Cambridge, Mass., vol. 8,
p. 225.

21 Там же, vol . 8, p . 191.

22 Там же, vol . 5, p . 594.

В связи со сказанным важно рассмотреть особенности процедуры решения задач и само понятие решаемости в логике и математике, с одной стороны, и в лингвистике - с другой.

Прежде чем приступить к решению проблемы в математике, эта проблема должна быть формулирована в точных терминах. Само это формулирование является предпосылкой успешного решения проблемы. При этом, как уже указывалось, математик может свободно трансформировать данное формулирование проблемы в эквивалентный вариант- она располагает для этого и соответствующими средствами. Уже на этой первой стадии исследовательской методики лингвистика существенно отличается от математики. При формулировании своих проблем лингвист располагает некоторым количеством наблюденных эмпирических данных, которым он не всегда может дать точную формулировку, но которые тем не менее он волей-неволей должен положить в основу своего исследования - уже в процессе самого этого исследования уточняются формулировки, нередко являющиеся целью самого исследования. Чтобы не идти далеко за примерами, можно сослаться на лингвистическое значение, которое лежит в основе исследований в области автоматической переработки речевой информации, но вместе с тем определяется весьма туманно и разноречиво. Именно это обстоятельство и заставляет исследователей данной области постоянно менять свою стратегию.

Но вот исследование начато и достигнуто какое-то решение. Что это значит применительно к логике и математике и применительно к лингвистике? Логика, как указывалось выше, дает возможность эксплицитно представить заключения, имплицитно присутствующие в предпосылке. Однако логика не располагает правилами, использование которых может гарантировать, что при этом будет добыто желаемое решение, так как она есть не средство достижения новых выводов, а всего лишь методика определения их правильности. Она - не волшебный ключ ко всем тайнам. Совершенно очевидно, что если бы логика обладала подобными правилами, то тогда бы не было и нерешенных проблем. Достаточно было бы приложить определенный набор логических правил, и мы бы автоматически получали готовый ответ на любой мучающий нас вопрос. В свете сказанного специфическое значение приобретает и понятие решаемости проблемы или задачи.

В логике и в математике всякий конечный результат признается истинным, если в процессе доказательства не было нарушено никакое формальное правило. Так как при этом возможны разные пути доказательства, допустимо существование различных решений. Но все они могут быть подвержены проверке с точки зрения требования логики или математики. По-иному обстоит дело в лингвистике. Она не располагает аппаратом, с помощью которого можно проверить или доказать правильность полученных выводов. Соответственно с этим определяется и истинность достигнутых решений - она устанавливается не формальными правилами, а своим соответствием данным опыта. При этих условиях теоретически следовало бы ожидать единого конечного решения. Однако практически, как свидетельствуют об этом разноречивые лингвистические определения даже основных категорий языка, это не имеет места. В данном случае всегда присутствует известный субъективизм оценок, который в немалой степени определяется объемом фактов, находящихся в распоряжении исследователя. Отсюда следует, что истинность решения в лингвистике всегда дается в некотором приближении и имеет не детерминативный, а вероятностный характер.

В этих условиях очень важно подвергнуть проверке на основе объективных критериев правильность лингвистических определений и истолкований. Возможность такой проверки дает широкая область прикладной лингвистики, где естественному языку противостоит машина, представляющая интересы логики и математики.

Для решения практических задач прикладной лингвистики используется цифровая вычислительная машина. Она способна воспринимать, хранить, передавать, перегруппировывать и выдавать информацию. Она интерпретирует и выполняет набор команд (программу команд), а также модифицирует их в процессе выполнения задания. Она в состоянии решать весьма сложные проблемы, но при этом весь процесс перехода от задания к решению должен быть исчерпывающе и непротиворечиво описан в терминах последовательности основных элементарных операций. Информация вводится в машину с помощью двузначного (бинарного) кода или языка. Машина оперирует закодированными таким образом словами, соответствующими основным логическим связям . или функциям исчисления высказываний или предикатов. Машина может решать сложные математические задачи именно в силу того, что сложные математические операции оказывается возможным свести к последовательности арифметических операций, а эти последние в свою очередь к логическим операциям. Следовательно, цифровую вычислительную машину можно рассматривать так же, как логическую машину.

Таким образом, какой бы сложности ни была задача, машина решает ее с помощью последовательности элементарных операций, программа которых должна быть формулирована абсолютно недвусмысленно (непротиворечиво), точно, детально и исчерпывающе полно. Другими словами, она не должна выходить за те пределы, которые устанавливаются логическим исчислением высказываний; и когда мы задаемся вопросом о том, может ли машина совладать с обработкой информации, заключенной в естественных языках, нам прежде всего нужно выяснить, в какой степени логическое исчисление высказываний является адекватной моделью для естественного языка.

Учитывая специфику цифровой вычислительной машины, описанную выше, первое, что необходимо сделать, чтобы машина «поняла» задание и начала обработку речевой информации в соответствии с этим заданием, это переформулировать информацию, содержащуюся в естественном языке, на логический язык. Речь идетю переводе естественного языка на язык логического исчисления высказываний.

При этом, как показал Бар-Хиллел 23 , приходится сталкиваться с такими трудностями, которые рисуют перспективы автоматической обработки информации в весьма мрачном свете, если не будет изменено все направление поисков решения данной проблемы. По меньшей мере придется считаться с перечисленными ниже препятствиями, для преодоления которых мы пока не располагаем необходимыми средствами.

А. Логическое исчисление высказываний слишком бедно для того, чтобы можно было бы, даже с далеким при-

23 Y. В а г - Н i 1 1 е 1, A Demonstration of the Non-feasibility of Fully Automatic High Quality Translation, «Advances in Compu-ters», ed. by F. Alt., vol. I , N . Y ., 1960, pp . 158-163.

ближением, произвести переформулировку естественного языка, невероятно сложного по своей семантической структуре, обладающего огромным объемом избыточных элементов и - самое главное - часто отличающегося такой неясностью и неопределенностью в выражении «смысла», что никакая двузначная логика не способна справиться с созданием искусственного двойника естественного языка 24 . Правда, логика, как указывалось, имеет дело лишь с лингвистической формой. Но поскольку дело идет об автоматической обработке информации, необходимо уметь различать и семантическую информацию, и если этого невозможно достичь с помощью имеющихся в нашем распоряжении логических средств, то откуда мы можем почерпнуть "уверенность, что наш перевод естественного языка на логический правилен?

Б. Машина не может учитывать того, что Бар-Хиллел называет «общими предварительными данными информации» (gênerai background of information), которые фактически остаются за пределами естественного языка и поэтому не подлежат переводу на логический язык. Лингвисты в этих случаях говорят о внеязыковом контексте (frame of référence), который неприметным для нас, но очень решительным образом корректирует или даже подвергает полному переосмыслению все наши слова. Ведь даже такая простая фраза, как «Я вернусь засветло», для точного ее понимания и определения содержащегося в ней временного указания как минимум требует предварительного знания того, где она была произнесена и в какое время дня и года. Только подобного рода предварительная информация часто является единственным средством для уяснения тех внутрифазовых отношений, с которыми не в состоянии справиться ни исчисление высказываний, ни исчисление предикатов. Так, привлекая для примера два промелькнувших в газетах предложения:

Аспирант университета из города Курска. Заслуженный рационализатор Сибири,

мы видим, что каждое из них может быть истолковано двояким образом. Если придерживаться лишь формально-

24 В статье Ч. Хоккетта «Грамматика для слушающего», включенной в настоящий раздел, приводится много примеров такого рода сложностей в «естественном» понимании предложения, которые разрешаются последующими и далеко уходящими шагами анализа.

грамматических признаков, то первое предложение с одинаковым успехом можно понять и как «Аспирант из университета, расположенного в городе Курске» и как «Аспирант университета, проживающий в городе Курске (или происходящий из города Курска)». А второе предложение может быть трактовано и как «Заслуженный рационализатор, полем деятельности которого является Сибирь» и как «Заслуженный рационализатор, являющийся жителем Сибири». И только предварительные и никак не выраженные в предложениях знания (предварительная информация), констатирующие, что в городе Курске нет университета и что заслуженный рационали затор есть почетное звание, присваиваемое в Советском Союзе отдельными административными округами, дают возможность правильного понимания этих предложений. Если внимательно приглядеться, то почти за каждой фразой разговорного языка стоит весьма основательная и разветвленная предварительная информация, само собой разумеющаяся для человека, но лежащая за пределами «разумения» машины, которая не знает ни рода, ни племени.

В. Машина не может делать внутритекстовые смысловые заключения, распространяющиеся на несколько предложений (а иногда даже намеренно на целый рассказ, чтобы до конца не раскрыть его персонажа или сюжетного хода). На это обстоятельство обратил внимание голландский лингвист А. Рейхлинг 25 , иллюстрируя свою мысль следующим примером. Допустим, что мы читаем некое повествование, которое начинается предложением: «Я играю с моим братом». Если мы на этом остановимся, то в нашем распоряжении не будет никаких данных для выяснения того, как же следует понимать эту фразу, о какой игре здесь идет речь. Ведь можно играть на деньги (в карты и пр.), на музыкальном инструменте, в театре или в кино, в игрушки, в футбол, играть для забавы, играть человеком и его судьбой и т. д. Но вот мы читаем дальше: «Я сказал это, когда Вильгельм однажды встретился мне

25 На коллоквиуме «Stichting Studiecentrum voor Administrative Automatisering», организованном в 1961 г. Имеется и немецкий перевод доклада: A. R е i с h 1 i n g, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, «Beiträge zur Sprachkunde und Informationsverarbeitung», Heft I., Wien, 1963.

в баре». Теперь уже с большей вероятностью мы можем заключить, что, по-видимому, речь идет об игре на деньги. Но все же существуют и другие возможности. Далее следует: «Мой брат подошел к столу, и кости были брошены». Теперь ясно, о какой игре идет речь, хотя нигде в тексте точного указания на действительный смысл слова «игра» не был дан. Мы догадались о нем по совокупности тех внешних примет, которые даны в тексте в разных предложениях. Эти приметы следуют здесь одна за другой, но в письменном повествовании они могут значительно отстоять друг от друга. Человек может выбрать их из широкого языкового контекста, сопоставить их и затем уже сделать соответствующее умозаключение. Машина же лишена этой возможности.

Но, может быть, это не так важно? Действительно, при машинном переводе данных предложений на немецкий или французский языки особых трудностей не возникает (но трудности могут, конечно, возникнуть при переводе других предложений). При переводе на немецкий мы можем употребить буквализм: Ich spiele mit meinem Bruder. Точно так же и во французском мы можем начать: Je joue avec... При переводе же на английский возникают сложности грамматического порядка, потому что в приведенном тексте нет никаких указаний на то, какую форму должна выбрать машина: 1. I am playing with my brother, 2. I play with my brother, или 3. I ' ll play with my brother . И уж совсем плохо будет обстоять дело при переводе на испанский язык, так как машине придется выбирать по меньшей мере между тремя глаголами: jugar, tocar или trabajar.

Тут логический язык беспомощен.

Г. Машина фактически имеет дело с речью (или, точнее, с речевыми отрезками) - в ее письменной и устной форме. Каждая из этих форм речи имеет свою систему прагматических элементов, способных к тому же переходить в семантические (а правила такого перехода и не изучены и во многом произвольны). Так, например, устная речь обладает такой супрасегментной надстройкой, как интонация. Интонацию ныне представляется возможным классифицировать по функциональным типам, выделяя вопросительную, повествовательную и пр. интонации. Однако совершенно ясно, что интонация не существует в отрыве от предложений. Она, конечно, взаимодействует со смыслом, заключенным в них. В подтверждение этого достаточно сослаться на риторический вопрос, который является вопросом только по своей внешней структуре, но не по значению - он не требует ответа со стороны слушающих. Таковы новые трудности, с которыми логический язык не имеет возможности справиться.

Д. Но если даже удастся справиться с перечисленными языковыми трудностями, существуют еще препятствия собственно логического порядка - речь в данном случае идет о так называемых «правилах вывода решения» (decision rules ). Ведь если мы хотим быть уверенными, что машина будет действовать логически безукоризненно, мы должны снабдить ее набором правил, следуя которым она и сможет последовательно пройти путь от исходной информации к необходимым выводам. Применительно к логическим исчислениям высказываний мы располагаем такими правилами, но для более сложных логик таких правил нет, и, более того, есть основания полагать, что такие правила нельзя найти. Если же ориентироваться на правила, которые в нашем распоряжении уже имеются, то использование их сделает процесс разрешения настолько сложным (даже при применении усовершенствованных вычислительных машин), что игра не будет стоить свеч.

В таком виде рисуется проблема применения логических и математических методов в науке о языке на основании данных прикладной лингвистики. Каковы же выводы? Выводы уже формулировались выше - лингвистический анализ допускает сочетание индуктивных методов с дедуктивными, но когда мы говорим об использовании в лингвистике дедуктивных методов, не следует все сводить к слепому подчинению лингвистического исследования логико-математическим методам. Естественный язык восстает против такого насилия. И практика прикладной лингвистики подтверждает эти выводы, устанавливая, что между формализованным логическим языком и естественным языком существуют такие различия, что достаточно полный (в информативном плане) , перевод второго в первый невозможен. Значит ли это, что в лингвистике, и в частности в прикладной, следует отказаться от использования логико-математических методов? Конечно, нет. Но только не следует полагаться целиком на них, а сочетать их с другими. И чтобы не быть голословными, обратимся к свидетельству математиков и логиков, которым на практике приходится применять свои знания к исследованию естественного языка.

Вот что говорит математик: «Помощь математики в изучении естественного языка еще далека от очевидности... Прежде чем мы можем думать об использовании математики для исчисления, необходимо определить границы и функции лингвистических единиц... Это - внематемати-ческая задача, она является частью индуктивных методов в лингвистике.

Выяснилось, что математика не заменяет эмпирической методологии, хотя некоторые лингвисты и стремятся к этому. Наоборот, только после того, как единицы и отношения естественного языка будут установлены индуктивным методом и соответствующим образом подтверждены (верифицированы), будут созданы необходимые условия для реалистического применения математики к естественному языку. При этом математики либо обнаружат, что они имеют дело с новой манифестацией того, что по своей сущности уже знакомо им, либо получат стимул для математического мышления нового порядка» 26 .

А вот что говорит логик: «Перспективы автоматической обработки речевой информации очень хороши, но роль логики в этой области ограничена. Впрочем, как орудие лингвистического анализа, не как набор правил для выведения заключений, она дает реальные обещания» 27 . И далее он устанавливает, какая исследовательская стратегия при этом более предпочтительна: «Проблемы нужно решать не посредством непреклонного следования набору правил, установленных логиком, а скорее с помощью эвристической техники... Для автоматической обработки речевой информации предпочтителен эмпирический, индуктивный подход, при котором ищутся грубые правила для решения информационных проблем. Не следует пытаться переводить обычный язык на логический с целью дальнейшей его обработки, но скорее искать правила эвристического типа, которые позволят совладать с естественным языком. Необходимо прекратить поиски

26 P. Garvin and W. К а г u s h, Linguistics, Data Proces-
sing and Mathematics, «Natural language and the computer», N. Y.,
1963, pp. 368-369.
См . также в той же книге статью W. К а г u s h,
The use of mathematics in the behavioral sciences, pp. 64-83.

27 M. M a г о n, A Logician's View of Language-data Proces-
sing,
указанная книга , стр . 144.

абсолютной достоверности и обратиться к приближенным методам, которые с накоплением опыта будут уточнены и усовершенствованы. Мы предпочитаем рассматривать аппроксимации таким же образом, каким рассматривают теорию в науке, где видоизменения и усовершенствования производятся на основе данных, полученных в результате эксперимента» 28 .

Таковы общие выводы. Они говорят о том, что в совместной работе с логиками и математиками лингвистам принадлежит ведущая роль. В обязанность лингвистов входит подготовка языкового материала таким образом, чтобы сделать его доступным обработке логико-математическими методами. Именно в этом наЦравлении следует искать реалистического сочетания в лингвистике индуктивных методов с дедуктивными. А когда при решении задач прикладной лингвистики речь идет об эвристических гипотезах, то они в первую очередь должны исходить от лингвиста, так как он ближе к языку и по своей должности обязан лучше знать и понимать его.

С учетом изложенных соображений следует подходить к включенным в данный раздел статьям. Как уже указывалось, они взяты из сборника материалов симпозиума по прикладной математике «Структура языка и его математические аспекты» (симпозиум проходил в Нью-Йорке в апреле 1960 г., материалы симпозиума были опубликованы в 1961 г.).

В симпозиуме принимали участие математики, логики и лингвисты, то есть как раз представители тех наук, о совместной работе которых говорилось выше. Тема симпозиума, формулированная довольно свободно, давала его участникам возможность говорить как об очень частных и специальных вопросах, так и о достаточно общих, не связывая себя ни единым пониманием задач рассматриваемых вопросов, ни оценкой их удельного веса во всей проблеме в целом. Пожалуй, единственным объединяющим участников симпозиума теоретическим началом был тезис, приведенный Р. Якобсоном в «Предисловии» к материалам, в соответствии с которым лингвистику сле-

28 Там же, стр. 143-144.

дует рассматривать в качестве моста между математическими и гуманитарными дисциплинами. В остальном каждый автор сообщения выступал сообразно со своими индивидуальными интересами и в соответствии с направлением его исследовательской работы.

В связи с определенным лимитом листажа настоящего сборника не представилось возможным использовать все включенные в материалы симпозиума статьи. Пришлось произвести некоторый отбор работ, однако с таким расчетом, чтобы он давал советскому читателю возможность составить достаточно полное представление об общих тенденциях в изучении той проблемы, которая стоит в названии симпозиума. В своем информационном качестве все статьи настоящего раздела представляют бесспорный интерес и для теории языкознания и для исследовательской практики прикладной лингвистики.

В. Звегинцев

математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков . Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления М. л. послужила назревшая в языкознании потребность уточнения его основных понятий. Методы М. л. имеют много общего с методами математической логики - математической дисциплины, занимающейся изучением строения математических рассуж­де­ний, - и в особенности таких её разделов, как теория алгоритмов и теория автоматов. Широко исполь­зу­ют­ся в М. л. также алгебраические методы. М. л. разви­ва­ет­ся в тесном взаимо­дей­ствии с языкознанием . Иногда термин «М. л.» исполь­зу­ет­ся также для обозначения любых лингви­сти­че­ских исследований, в которых применяется какой-либо математи­че­ский аппарат.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» - последовательности речевых единиц , подчиняющиеся определённым закономерностям, многие из которых допускают матема­ти­че­ское описание. Разработка и изучение способов математи­че­ско­го описания правиль­ных текстов (в первую очередь предложений) составляет содержание одного из разде­лов М. л. - теории способов описания синтаксической структуры . Для описания строения предло­же­ния - точнее, его синтаксической структуры - можно либо выделить в нём составляющие - группы слов , функционирующие как цельные синтакси­че­ские единицы, либо указать для каждого слова те слова, которые ему непосредственно подчинены (если такие есть). Так, в предложении «Ямщик сидит на облучке» (А. С. Пушкин) при описании по 1‑му способу составляющими будут все предложение П, каждое его отдельное слово и группы слов A = сидит на облучке и B = на облучке (см. рис. 1; стрелки означают «непосредственное вложение»); описание по 2‑му способу даёт схему, показанную на рис. 2. Возникающие при этом математические объекты называются системой составляющих (1‑й способ) и деревом синтаксического подчинения (2‑й способ).

Точнее, система составляющих - это множество отрезков предложения, содержащее в качестве элементов всё предложение и все вхождения слов в это предложение («однословные отрезки») и обладающее тем свойством, что каждые два входящих в него отрезка либо не пересекаются, либо один из них содержится в другом; дерево синтаксического подчинения, или просто дерево подчинения, есть дерево, множеством узлов которого служит множество вхождений слов в предложение. Деревом в математике называется множество, между элементами которого - их называют узлами - установлено бинарное отношение - его называют отношением подчинения и графически изображают стрелками, идущими от подчиняющих узлов к подчиненным, - такое, что: 1) среди узлов имеется точно один - его называют корнем , - не подчинённый никакому узлу; 2) каждый из остальных узлов подчинен точно одному узлу; 3) невозможно, отправившись из какого-либо узла вдоль стрелок, вернуться в тот же узел. Узлы дерева подчинения - это вхождения слов в предложения. При графическом изображении система составляющих (как на рис. 1) также приобретает вид дерева (дерева составляющих ). Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксической структурой в виде дерева подчинения (системы составляющих). Системы составляющих исполь­зу­ют­ся пре­иму­ще­ствен­но в описаниях языков с жёстким порядком слов , деревья подчинения - в описаниях языков со свободным порядком слов (в частности, русского), формально для каждого (не слишком короткого) предложения можно построить много разных синтаксических структур любого из двух видов, но среди них только одна или несколько являются правильными. Корнем правильного дерева подчинения служит обычно сказуемое. Предложение, имеющее более одной правильной синтаксической структуры (одного вида), назы­ва­ет­ся синтаксически омонимичным ; как правило, разные синтаксические структуры отвечают разным смыслам предложения. Например, предложение «Школьники из Ржева поехали в Торжок» допускает два правильных дерева подчинения (рис. 3, а, б); первое из них отвечает смыслу «Ржевские школьники поехали (не обязательно из Ржева) в Торжок», второе - «Школьники (не обязательно ржевские) поехали из Ржева в Торжок».

В русском и ряде других языков деревья подчинения предложений «делового стиля» подчи­ня­ют­ся, как правило, закону проективности , состоящему в том, что все стрелки можно провести над прямой, на которой записано предложение, таким образом, что никакие две из них не пересекутся и корень не будет лежать ни под какой стрелкой. В языке художественной литера­ту­ры , особенно в поэзии, отклонения от закона проективности допустимы и чаще всего служат задаче создания определённого художественного эффекта. Так, в предложении «Друзья кровавой старины народной чаяли войны» (Пушкин) непроективность приводит к эмфати­че­ско­му выде­ле­нию слова «народной» и одновременно как бы замедляет речь, создавая этим впечатление известной приподнятости, торжественности. Имеются и другие формаль­ные признаки деревьев подчинения, которые могут исполь­зо­вать­ся для характеризации стиля . Например, максимальное число вложенных друг в друга стрелок служит мерой «синтак­си­че­ской громоздкости» предло­же­ния (см. рис. 4).

Для более адекватного описания строения предложения составляющие обычно помечаются симво­ла­ми грамматических категорий («именная группа», «группа переходного глагола » и т. п.), а стрелки дерева подчинения - символами синтаксических отношений («предика­тив­ное », «определи­тель­ное» и т. п.).

Аппарат деревьев подчинения и систем составляющих исполь­зу­ет­ся также для представ­ле­ния глубинно-синтаксической структуры предложения , которая образует промежу­точ­ный уровень между семантической и обычной синтаксической структурой (послед­нюю часто называют поверхностно-синтаксической).

Более совершенное представление синтаксической структуры предложения (требующее, однако, более сложного математического аппарата) дают системы синтаксических групп , в которые входят как словосочетания, так и синтаксические связи, причём не только между словами, но и между словосочетаниями. Системы синтаксических групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксических групп.

Другой раздел М. л., занимающий в ней центральное место, - теория формальных грамматик , начало которой было положено работами Н. Хомского. Она изучает способы описания закономерностей, характеризующих уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики - абстрактного «механизма», позволяющего с помощью едино­образ­ной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко исполь­зу­е­мый тип формальной грамматики - порождающая грамматика , или грамматика Хомского, представляющая собой упорядоченную систему Г = ⟨ V, W, П, R ⟩, где V и W - непересекающиеся конечные множества, называемые соответственно основным , или терминальным , и вспомогательным , или нетерминальным , алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символами ), П - элемент W, называемый начальным символом , и R - конечное множество правил вида φ → ψ, где φ и ψ - цепочки (конечные последовательности) из основных и вспомогательных символов. Если φ → ψ - правило грамматики Г и ω 1 , ω 2 - цепочки из основных и вспомогательных символов, говорят, что цепочка ω 1 ψω 2 непосредственно выводима в Г из ω 1 φω 2 . Если ξ 0 , ξ 1 , ..., ξ n - цепочки и для каждого i = 1, ..., n цепочка ξ i непосредственно выводима из ξ i−1 , говорят, что ξ n выводима в Г из ξ 0 . Множество тех цепочек из основных символов, которые выводимы в Г из её начального символа, называется языком, порождаемым грамматикой Г, и обозначается L(Г). Если все правила Г имеют вид η 1 Aη 2 → η 1 ωη 2 , то Г называется грамматикой составляющих (или непосредственно составляющих), сокра­щён­но НС-грамматикой ; если при этом в каждом правиле цепочки η 1 и η 2 (правый и левый контексты ) пусты, то грамматика называется бесконтекстной (или контекстно-свободной ), сокра­щён­но Б-грамматикой (или КС-грамматикой ). В наибо­лее обычной лингвистической интер­пре­та­ции основные символы представляют собой слова, вспомогательные - символы грамматических категорий, начальный символ - символ категории «предложение»; при этом язык, порождаемый грамматикой, интер­пре­ти­ру­ет­ся как множество всех грамматически правильных предложений данного естественного языка. В НС-грамматике вывод предложения даёт для неё дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного вспомогательного символа, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет, в числе прочих, правила П → S x, y, им, V y → V i y O, O → S x, y, предл, V i y → сидит, S муж, ед., им → на, ямщик, S муж, ед., предл. → облучке, то предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвеча­ю­щая этому выводу, совпадает с изображенной на рис. 1. Возможны и другие интер­пре­та­ции: например, основные символы могут интер­пре­ти­ро­вать­ся как морфы , вспомогательные - как символы типов морф и допустимых цепочек морф, начальный символ - как символ типа «слово­фор­ма », а язык, порождаемый грамматикой, - как множество правильных словоформ (морфологическая интер­пре­та­ция); употребительны также морфонологическая и фонологическая интер­пре­та­ции. В реальных описаниях языков исполь­зу­ют­ся обычно «многоуровневые» грамма­ти­ки, которые содержат последо­ва­тель­но работающие синтаксические, морфологические и морфонологически-фонологические правила.

Другой важный тип формальной грамматики - доминационная грамматика , которая порождает множество цепочек, интер­пре­ти­ру­е­мых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтакси­че­ских групп порождает множество предложений вместе с их синтаксическими структу­ра­ми, имею­щи­ми вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев ), служа­щей не для порожде­ния предложений, а для преобразования деревьев, интер­пре­ти­ру­е­мых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика - система правил преобразования деревьев, интер­пре­ти­ру­е­мых как «чистые» деревья подчине­ния предложений, т. е. деревья подчине­ния без линейного порядка слов.

Особняком стоят грамматики Монтегю , служащие для одновременного описания синтак­си­че­ских и семантических структур предложения; в них исполь­зу­ет­ся сложный математико-логический аппарат (так называемая интенсиональная логика ).

Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования .

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно исполь­зу­ет­ся несложный математический аппарат - простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными . В анали­ти­че­ских моделях наиболее простого типа исходными данными служат множество правильных предло­же­ний и система окрестностей - совокупностей «слов», принадлежащих одной лексеме (напри­мер, {дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах}). Простейшим произ­вод­ным понятием в таких моделях является замещаемость : слово a замещаемо на слово b , если всякое правильное предложение, содержащее вхождение слова a , остаётся правильным при замене этого вхождения вхождением слова b . Если а замещаемо на b и b на a , говорят, что a и b взаимозамещаемы . (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством . Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи . В другом типе аналитических моделей вместо множества правильных предло­же­ний исполь­зу­ет­ся отношение потенциального подчинения между словами, означа­ю­щее способ­ность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных граммати­че­ских катего­рий - например, формальное определение падежа существительного , представ­ля­ю­щее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, явля­ю­щих­ся формами существительных.

В аналитических моделях языка исполь­зу­ют­ся простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели - процеду­ры, позво­ля­ю­щие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предва­ри­тель­ных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языко­ве­де­ния. В то же время ее методы находят широкое применение в прикладных лингвистических иссле­до­ва­ни­ях - автоматической обработке текста , автоматическом переводе и разработ­ках, связан­ных с так называемым общением между человеком и ЭВМ.

  • Кулагина О. С., Об одном способе определения грамматических понятий на базе теории множеств, в сб.: Проблемы кибернетики, в. 1, М., 1958;
  • Хомский Н., Синтаксические структуры, в сб.: «Новое в лингвистике», в. 2, М., 1962;
  • Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969 (лит.);
  • их же , Грамматики деревьев, I, II, в сб.: Информационные вопросы семиотики, лингвистики и автоматического перевода, в. 1, 4, М., 1971-74 (лит.);
  • Маркус С., Теоретико-множественные модели языков, пер. с англ., М., 1970 (лит.);
  • Гладкий А. В., Формальные грамматики и языки, М., 1973 (лит.);
  • его же , Попытка формального определения понятий падежа и рода существительного, в сб.: Проблемы грамматического моделирования, М., 1973 (лит.);
  • его же , Синтаксические структуры естественного языка в автоматизированных системах общения, М., 1985 (лит.);
  • Сухотин Б. В., Оптимизационные методы исследования языка. М., 1976 (лит.);
  • Севбо И. П., Графическое представление синтаксических структур и стилистическая диагностика, К., 1981;
  • Парти Б. Х., Грамматика Монтегю, мысленные представления и реальность, в кн.: Семиотика, М., 1983;
  • Montague R., Formal philosophy, New Haven - L., 1974 (лит.).

Введение

Глава 1. История применения математических методов в лингвистике

1.1. Становление структурной лингвистики на рубеже XIX – ХХ веков

1.2. Применение математических методов в лингвистике во второй половине ХХ века

Глава 2. Отдельные примеры использования математики в лингвистике

2.1. Машинный перевод

2.2.Статистические методы в изучении языка

2.3. Изучение языка методами формальной логики

2.4. Перспективы применения математических методов в лингвистике

Заключение

Литература

Приложение 1. Ronald Schleifer. Ferdinand de Saussure

Приложение 2. Фердинанд де Соссюр (перевод)

Введение

В ХХ веке наметилась продолжающаяся и поныне тенденция к взаимодействию и взаимопроникновению различных областей знаний. Постепенно стираются грани между отдельными науками; появляется всё больше отраслей умственной деятельности, находящихся «на стыке» гуманитарного, технического и естественнонаучного знания.

Другая очевидная особенность современности – стремление к изучению структур и составляющих их элементов. Поэтому всё большее место как в научной теории, так и на практике уделяется математике. Соприкасаясь, с одной стороны, с логикой и философией, с другой стороны, со статистикой (а, следовательно, и с общественными науками), математика всё глубже проникает в те сферы, которые на протяжении долгого времени было принято считать чисто «гуманитарными», расширяя их эвристический потенциал (ответ на вопрос «сколько» часто помоагет ответить и на вопросы «что» и «как). Исключением не стало и языкознание.

Цель моей курсовой работы – кратко осветить связь математики с такой отраслью языкознания, как лингвистика. Начиная с 50-х годов прошлого века, математика применяется в лингвистике при создании теоретического аппарата для описания строения языков (как естественных, так и искусственных). Однако следует сказать, что она не сразу нашла себе подобное практическое применение. Первоначально математические методы в лингвистике стали использоваться для того, чтобы уточнить основные понятия языкознания, однако с развитием компьютерной техники подобная теоретическая посылка стала находить применение на практике. Разрешение таких задач, как машинный перевод, машинный поиск информации, автоматическая обработка текста требовало принципиально нового подхода к языку. Перед лингвистами назрел вопрос: как научиться представлять языковые закономерности в том виде, в котором их можно подавать непосредственно на технику. Популярным в наше время термином «математическая лингвистика» называют любые лингвистические исследования, в которых применяются точные методы (а понятие точных методов в науке всегда тесно связано с математикой). Некоторые учёные прошлых лет, считают, что само выражение нельзя возводить в ранг термина, так как оно обозначает не какую-то особую «лингвистику», а лишь новое направление, ориентированное на усовершенствование, повышение точности и надёжности методов исследования языка. В лингвистике используются как количественные (алгебраические), так и неколичественные методы, что сближает её с математической логикой, а, следовательно, и с философией, и даже с психологией. Ещё Шлегель отмечал взаимодействие языка и сознания, а видный лингвист начала ХХ века Фердинанд де Соссюр (о его влиянии на становление математических методов в лингвистике расскажу позже) связывал структуру языка с его принадлежностью к народу. Современный исследователь Л. Перловский идёт дальше, отождествляя количественные характеристики языка (например, число родов, падежей) с особенностями национального менталитета (об этом в разделе 2.2, «Статистические методы в лингвистике»).

Взаимодействие математики и языкознания – тема многогранная, и в своей работе я остановлюсь не на всех, а, в первую очередь, на её прикладных аспектах.

Глава I. История применения математических методов в лингвистике

1.1 Становление структурной лингвистики на рубеже XIX – ХХ веков

Математическое описание языка основано на представлении о языке как о механизме, восходящем к известному швейцарскому лингвисту начала ХХ века Фердинанду де Соссюру.

Начальное звено его концепции – теория языка как системы, cостоящей из трёх частей (собственно язык – langue , речь – parole , и речевую деятельность – langage ), в которой каждое слово (член системы) рассматривается не само по себе, а в связи с другими членами. Как впоследствии отметил другой видный лингвист, датчанин Луи Ельмслев, Соссюр «первый требовал структурного подхода к языку, то есть научного описания языка путём регистрации соотношений между единицами» .

Понимая язык как иерархическую структуру, Соссюр первым поставил проблему ценности, значимости языковых единиц. Отдельные явления и события (скажем, история происхождения отдельных индоевропейских слов) должны изучаться не сами по себе, а в системе, в которой они соотнесены с подобными же составляющими.

Структурной единицей языка Соссюр считал слово, «знак», в котором соединялись звучание и смысл. Ни один из этих элементов не существует друг без друга: поэтому носителю языка понятны различные оттенки значения многозначного слова как отдельного элемента в структурном целом, в языке.

Таким образом, в теории Ф. де Соссюра можно увидеть взаимодействие лингвистики, с одной стороны, с социологией и социальной психологией (следует отметить, что в это же время развиваются феноменология Гуссерля, психоанализ Фрейда, теория относительности Эйнштейна, происходят эксперименты над формой и содержанием в литературе, музыке и изобразительном искусстве), с другой стороны – с математикой (понятие системности соответствует алгебраической концепции языка). Подобная концепция изменила понятие языковой интерпретации как таковой: Явления стали трактоваться не относительно причин их возникновения, а относительно настоящего и будущего. Толкование перестало быть независимым от намерений человека (несмотря на то, что намерения могут быть безличными, «бессознательными» во фрейдистском понимании этого слова).

Функционирование же языкового механизма проявляется через речевую деятельность носителей языка. Результатом речи являются так называемые «правильные тексты» – последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Изучением способов математического описания правильных текстов (в первую очередь, предложений) занимается теория способов описания синтаксической структуры. В подобной структуре языковые аналогии определены не с помощью изначально присущих им качеств, а с помощью системных («структурных») отношений.

На Западе соссюровские идеи развивают младшие современники великого швейцарского лингвиста: в Дании – уже упомянутый мною Л. Ельмслев, давший начало алгебраической теории языка в своём труде «Основы лингвистической теории», в США – Э. Сепир, Л. Блумфилд, Ц. Харрис, в Чехии – русский учёный-эмигрант Н. Трубецкой.

Статистическими же закономерностями в изучении языка стал заниматься не кто иной, как основоположник генетики Георг Мендель. Только в 1968 году филологи обнаружили, что, оказывается, в последние годы жизни он был увлечен изучением лингвистических явлений с помощью методов математики. Этот метод Мендель привнёс в лингвистику из биологии; в девяностые годы девятнадцатого века лишь самые смелые лингвисты и биологи заявляли о целесообразности подобного анализа. В архиве монастыря св. Томаша в г. Брно, аббатом которого был Мендель, были найдены листки со столбцами фамилий, оканчивающимися на «mann», «bauer», «mayer», и с какими-то дробями и вычислениями. Стремясь обнаружить формальные законы происхождения фамильных имен, Мендель производит сложные подсчеты, в которых учитывает количество гласных и согласных в немецком языке, общее число рассматриваемых им слов, количество фамилий и т.д.

В нашей стране структурная лингвистика начала развиваться примерно в то же время, что и на Западе – на рубеже XIX-XX веков. Одновременно с Ф. де Соссюром понятие языка как системы разрабатывали в своих трудах профессора Казанского университета Ф.Ф. Фортунатов и И.А. Бодуэн де Куртенэ. Последний на протяжении долгого времени переписывался с де Соссюром, соответственно, женевская и казанская школы языкознания сотрудничали друг с другом. Если Соссюра можно назвать идеологом «точных» методов в лингвистике, то Бодуэн де Куртенэ заложил практические основы их применения. Он первым отделил лингвистику (как точную науку, использующую статистические методы и функциональную зависимость) от филологии (общности гуманитарных дисциплин, изучающих духовную культуру через язык и речь). Сам учёный считал, что «языкознание может принести пользу в ближайшем будущем, лишь освободившись от обязательного союза с филологией и историей литературы» . «Испытательным полигоном» для внедрения математических методов в лингвистику стала фонология – звуки как «атомы» языковой системы, обладающие ограниченным количеством легко измеримых свойств, были самым удобным материалом для формальных, строгих методов описания. Фонология отрицает наличие смысла у звука, так что в исследованиях устранялся «человеческий» фактор. В этом смысле фонемы подобны физическим или биологическим объектам.

Фонемы, как самые мелкие языковые элементы, приемлемые для восприятия, представляют собой отдельную сферу, отдельную «феноменологическую реальность». Например, в английском языке звук «т» может произноситься по-разному, но во всех случаях человек, владеющий английским, будет воспринимать его как «т». Главное, что фонема будет выполнять свою главную – смыслоразличительную – функцию. Более того – различия между языками таковы, что разновидности одного звука в одном языке могут соответствовать разным фонемам в другом; например «л» и «р» в английском различны, в то время как в других языках это разновидности одной фонемы (подобно английскому «т», произнесённому с придыханием или без). Обширный словарный запас любого естественного языка представляет собой набор сочетаний гораздо меньшего количества фонем. В английском, например, для произнесения и написания около миллиона слов используется всего 40 фонем.

Звуки языка представляют собой системно организованный набор черт. В 1920е –1930е, вслед за Соссюром, Якобсон и Н.С.Трубецкой выделили «отличительные черты» фонем. Эти черты основаны на строении органов речи – языка, зубов, голосовых связок. Скажем, в английском разница между «т» и «д» заключается в наличии или отсутствии «голоса» (напряжении голосовых связок) и в уровне голоса, отличающем одну фонему от другой. Таким образом, фонологию можно считать примером общего языкового правила, описанного Соссюром: «В языке есть только различия» . Более важно даже не это: различие обычно подразумевает точные условия, между которыми оно и находится; но в языке существуют только различия без точных условий. Рассматриваем ли мы «обозначение» или «обозначаемое» – в языке не существует ни понятий, ни звуков, которые существовали бы до того, как развилась языковая система.

Таким образом, в соссюровском языкознании изучаемый феномен понимается как свод сопоставлений и противопоставлений языка. Язык – это и выражение значения слов, и средство общения, причём эти две функции никогда не совпадают. Мы можем заметить чередование формы и содержания: языковые контрасты определяют его структурные единицы, и эти единицы взаимодействуют, чтобы создать определённое значимое содержание. Так как элементы языка случайны, ни контраст, ни сочетание не могут быть основой. Значит, в языке отличительные признаки формируют фонетический контраст на другом уровне понимания, фонемы соединяются в морфемы, морфемы – в слова, слова – в предложения и т.д. В любом случае, целая фонема, слово, предложение и т.д. представляет собой нечто большее, чем просто сумма составляющих.

Соссюр предложил идею новой науки двадцатого века, отдельно от лингвистики изучающей роль знаков в обществе. Соссюр назвал эту науку семиологией (от греческого «semeîon» - знак). «Наука» семиотики, развивавшаяся в Восточной Европе в 1920е –1930е и в Париже в 1950е – 1960е, расширила изучение языка и лингвистических структур до литературных находок, составленных (или сформулированных) с помощью этих структур. Кроме того, на закате своей карьеры, параллельно совему курсу общей лингвистики, Соссюр занялся «семиотическим» анализом поздней римской поэзии, пытаясь открыть умышленно составленные анаграммы имён собственных. Этот метод был во многом противоположен рационализму в его лингвистическом анализе: он был попыткой, изучить в системе проблему «вероятности» в языке. Такое исследование помогает сосредоточиться на «вещественной стороне» вероятности; «ключевое слово», анаграмму которого ищет Соссюр, как утверждает Жан Старобинский, «инструмент для поэта, а не источник жизни стихотворения». Стихотворение служит для того, чтобы поменять местами звуки ключевого слова. По словам Старобинского, в этом анализе «Соссюр не углубляется в поиски скрытых смыслов». Напротив, в его работах заметно желание избежать вопросов, связанных с сознанием: «так как поэзия выражается не только в словах, но и в том, что порождают эти слова, она выходит из-под контроля сознания и зависит только от законов языка» (cм. Приложение 1).

Попытка Соссюра изучить имена собственные в поздней римской поэзии подчёркивает одну из составляющих его лингвистического анализа – произвольную природу знаков, а также формальную сущность соссюровской лингвистики, что исключает возможность анализа смысла. Тодоров делает вывод, что в наши дни труды Соссюра выглядят на редкость последовательными в нежелании изучать символы явления, имеющие чётко определённое значение [Приложение 1]. Исследуя анаграммы, Соссюр обращает внимание только на повторение, но не на предшествующие варианты. . . . Изучая «Песнь о Нибелунгах», он определяет символы только для того, чтобы присвоить их ошибочным чтениям: если они неумышленны, символов не существует. В конце концов, в своих трудах по общей лингвистике он делает предположение о существовании семиологии, описывающей не только лингвистические знаки; но это предположение ограничивается тем, что семиoлогия может описывать только случайные, произвольные знаки.

Раз это действительно так, то только потому, что не мог представить «намерение» без предмета; он не мог до конца преодолеть пропасть между формой и содержанием – в его трудах это превращалось в вопрос. Вместо этого он обращался к «языковой законности». Находясь между, с одной стороны, концепциями девятнадцатого века, основанными на истории и субъективных догадках, и методах случайной интерпретации, основанных на этих концепциях, и, с другой стороны, структуралистскими концепциями, стирающими противостояние между формой и содержанием (субъектом и объектом), значением и происхождением в структурализме, психоанализе и даже квантовой механике – труды Фердинанда де Соссюра по лингвистике и семиотике обозначают поворотный момент в изучении значений в языке и культуре.

Русские учёные были представлены и на Первом международном конгрессе лингвистов в Гааге в 1928 году. С. Карцевский, Р. Якобсон и Н. Трубецкой выступили с докладом, в котором рассматривалась иерархическая структура языка – в духе самых современных для начала прошлого века представлений. Якобсон в своих трудах развивал идеи Соссюра о том, что базовые элементы языка должны изучаться, в первую очередь, в связи со своими функциями, а не с причинами их возникновения.

К сожалению, после прихода в 1924 году к власти Сталина отечественное языкознание, как и многие другие науки, отбрасывает назад. Многие талантливые учёные вынуждены были эмигрировать, были высланы из страны или погибли в лагерях. Только с середины 1950-х годов стал возможен некоторый плюрализм теорий – об этом в разделе 1.2.

1.2 Применение математических методов в лингвистике во второй половине ХХ века

К середине ХХ века сформировалось четыре мировых лингвистических школы, каждая из которых оказалась родоначальником определённого «точного» метода. Ленинградская фонологическая школа (её родоначальником был ученик Бодуэна де Куртенэ Л.В. Щерба) использовала в качестве основного критерия обобщения звука в виде фонемы психолингвистический эксперимент, основанный на анализе речи носителей языка.

Учёные Пражского лингвистического кружка , в частности – его основатель Н.С. Трубецкой, эмигрировавший из России, разработали теорию оппозиций – семантическая структура языка была описана ими как набор оппозитивно постороенных семантических единиц – сем. Эта теория применялась в изучении не только языка, но и художественной культуры.

Идеологами американского дескриптивизма были языковеды Л. Блумфилд и Э. Сепир. Язык представлялся дескриптивистам в виде совокупности речевых высказываний, которые и были главным объектом их исследования. В центре их внимания оказались правила научного описания (отсюда название) текстов: изучение организации, аранжировка и классификация их элементов. Формализация аналитических процедур в области фонологии и морфологии (разработка принципов исследования языка на разных уровнях, дистрибутивного анализа, метода непосредственно составляющих и т.д.) привела к постановке общих вопросов лингвистического моделирования. Невнимание к плану содержания языка, а также парадигматической стороне языка не позволило дескриптивистам достаточно полно интерпретировать язык как систему.

В 1960-х годах развивается теория формальных грамматик, возникшая, главным образом, благодаря работам американского философа и лингвиста Н. Хомского. Он по праву считается одним из наиболее известных современных учёных и общественных деятелей, ему посвящено множество статей, монографий и даже полнометражный документальный фильм. По имени принципиально нового способа описания синтаксической структуры, изобретённого Хомским – генеративной (порождающей) грамматики – соответствующее течение в лингвистике получило название генеративизма .

Хомский, потомок выходцев из России, с 1945 года изучал в Пенсильванском университете лингвистику, математику и философию, находясь под сильным влиянием своего учителя Зелига Хэрриса – как и Хэррис, Хомский считал и считает свои политические взгляды близкими к анархизму (до сих пор он известен как критик существующего политического строя США и как один из духовных лидеров антиглобализма).

Первая крупная научная работа Хомского, магистерская диссертация «Морфология современного иврита» (1951), так и осталась неопубликованной. Докторскую степень Хомский получил в Пенсильванском университете в 1955, однако большая часть исследований, положенных в основу диссертации (полностью опубликованной только в 1975 под названием «Логическая структура лингвистической теории») и его первой монографии «Синтаксические структуры» (Syntactic Structures, 1957, рус. пер. 1962), была выполнена в Гарвардском университете в 1951–1955. В том же 1955 ученый перешел в Массачусетский технологический институт, профессором которого он стал в 1962.

В своём развитии теория Хомского прошла несколько этапов.

В первой монографии «Синтактические структуры» учёный представил язык как механизмепорождения бесконечного множества предложений с помощью конечного набора грамматических средств. Для описания языковых свойств он предложил понятия глубинной (скрытой от непосредственного восприятия и порождаемой системой рекурсивных, т.е. могущих применяться многократно, правил) и поверхностной (непосредственно воспринимаемой) грамматических структур, а также трансформаций, описывающих переход от глубинных структур к поверхностным. Одной глубинной структуре могут соответствовать несколько поверхностных (например, пассивная конструкция Указ подписывается президентом выводится из той же глубинной структуры, что и активная конструкция Президент подписывает указ ) и наоборот (так, неоднозначность Мать любит дочь описывается как результат совпадения поверхностных структур, восходящих к двум различным глубинным, в одной из которых мать – та, кто любит дочь, а в другой – та, кого любит дочь).

Стандартной теорией Хомского считается модель «Аспектов», изложенная в книге Хомского «Аспекты теории синтаксиса». В этой модели в формальную теорию впервые вводились правила семантической интерпретации, приписывающих значение глубинным структурам. В «Аспектах» языковая компетенция противопоставлена употреблению языка (performance), принята так называемая гипотеза Катца – Постала о сохранении смысла при трансформации, в связи с чем исключено понятие факультативной трансформации, а также введен аппарат синтаксических признаков, описывающих лексическую сочетаемость.

В 1970-е Хомский работает над теорией управления и связывания (GB-теория – от слов government и binding ) – более общей, нежели предыдущая. В ней учёный отказался от специфических правил, описывающих синтаксические структуры конкретных языков. Все трансформации были заменены одной универсальной трансформацией перемещения. В рамках GB-теории существуют и частные модули, каждый из которых отвечает за свою часть грамматики.

Уже недавно, в 1995 году, Хомский выдвинул минималистскую программу, где человеческий язык описывается подобно машинному. Это лишь программа – не модель и не теория. В ней Хомский выделяет две главных подсистемы языкового аппарата человека: лексикон и вычислительную систему, а также два интерфейса – фонетический и логический.

Формальные грамматики Хомского стали классическими для описания не только естественных, но и искусственных языков – в частности, языков программирования. Развитие структурной лингвистики во второй половине ХХ века можно по праву считать «хомскианской революцией».

Московская фонологическая школа , представителями которой были А.А. Реформатский, В.Н. Сидоров, П.С. Кузнецов, А.М. Сухотин, Р.И. Аванесов, использовала подобную же теорию для изучения фонетики. Постепенно «точные» методы начинают применяться касаемо не только фонетики, но и синтаксиса. Структурностью языка начинают заниматься и лингвисты, и математики – как у нас, так и за рубежом. В 1950-60е в СССР начинается новый этап во взаимодействии математики и лингвистики, связанный с разработкой систем машинного перевода.

Толчком к началу этих работ в нашей стране послужили первые разработки в области машинного перевода в США (хотя первое механизированное переводное устройство П.П. Смирнова-Троянского было изобретено в CCCР ещё в 1933 году, оно, будучи примитивным, не получило распространения). В 1947 году А.Бутт и Д. Бриттен придумали код для пословного перевода с помощью ЭВМ, годом позже Р.Риченс предложил правило разбиения слов на основу и окончание при машинном переводе. В те годы довольно сильно отличались от современных. Это были очень большие и дорогие машины, которые занимали целые комнаты и требовали для своего обслуживания большой штат инженеров, операторов и программистов. В основном эти компьютеры использовались для осуществления математических расчетов для нужд военных учреждений – новое в математике, физике и технике служило, в первую очередь, военному делу. На ранних этапах разработка МП активно поддерживалась военными, при этом (в условиях «холодной войны») в США развивалось русско-английское направление, а в СССР - англо-русское.

В январе 1954 года в Массачусетском техническом университете состоялся «Джорджтаунский эксперимент»– первая публичная демонстрация перевода с русского языка на английский на машине ИБМ-701. Реферат сообщения об удачном прохождении эксперимента, сделанный Д.Ю. Пановым, появился в РЖ «Математика», 1954, №10: «Перевод с одного языка на другой при помощи машины: отчёт о первом успешном испытании».

К работам по машинному переводу Д. Ю. Панов (в то время директор Института научной информации – ИНИ, позднее ВИНИТИ) привлёк И. К. Бельскую, которая позднее возглавит группу машинного перевода в Институте точной математики и вычислительной техники АН СССР. К концу 1955 года относится первый опыт перевода с английского языка на русский при помощи машины БЭСМ. Программы для БЭСМ составляли Н.П. Трифонов и Л.Н. Королёв, кандидатская диссертация которого была посвящена методам построения словарей для машинного перевода.

Параллельно работы по машинному переводу велись в Отделении прикладной математики Математического института АН СССР (сейчас Институт прикладной математики имени М.В. Келдыша РАН). По инициативе математика А.А. Ляпунова. К работам по переводу текстов на машине «Стрела» с французского языка на русский он привлёк аспирантку МИАН О.С. Кулагину и своих учениц Т.Д. Вентцель и Н.Н. Рикко. Представления Ляпунова и Кулагиной о возможности использования техники для перевода с одного языка на другой были опубликованы в журнале «Природа», 1955, №8. С конца 1955 года к ним присоединилась Т.Н. Молошная, затем приступившая к самостоятельной работе над алгоритмом англо-русского перевода.

Р.Фрумкина , занимавшаяся в то время алогритмом перевода с испанского, вспоминает, что на этом этапе работ сложно было делать какие-то последовательные шаги. Гораздо чаще приходилось следовать эвристическому опыту – своему или коллег.

Однако первое поколение систем машинного перевода было весьма несовершенным. Все они базировались на алгоритмах последовательного перевода «слово за словом», «фраза за фразой» – смысловые связи между словами и предложениями никак не учитывались. Для примера можно привести предложения: «John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy . (Джон искал свою игрушечную коробку. Наконец он ее нашел. Коробка была в манеже. Джон был очень счастлив.)». «Pen» в данном контексте – не «ручка» (инструмент для письма), а «детский манеж» (play-pen ). Знание синонимов, антониов и переносных значений сложно вводить в компьютер. Перспективным направлением становилась разработка машинных систем, ориентированных на использование человеком-переводчиком.

Со временем на смену системам прямого перевода пришли Т-системы (от английского слова «transfer» – преобразование), в которых перевод осуществлялся на уровне синтаксических структур. В алгоритмах Т-систем использовался механизм, позволяющий построить синтаксическую структуру по правилам грамматики языка входного предложения (подобно тому, как учат иностранному языку в средней школе), а затем синтезировать выходное предложение, преобразуя синтаксическую структуру и подставляя из словаря нужные слова.

Ляпунов говорил о переводе путём извлечения смысла переводимого текста и его представления на другом языке. Подход к построению систем машинного перевода, основанный на получении смыслового представления входного предложения путём его семантического анализа и синтеза входного предложения по полученному смысловому представлению, до сих пор считается наиболее совершенным. Такие системы называют И-системами (от слова «интерлингва»). Однако задача по их созданию, поставленная ещё в конце 50-х – начале 60-х, не решена полностью до сих пор, несмотря на усилия Международной федерации IFIP – мирового сообщества учёных в области обработки информации.

Учёные задумались над тем, как нужно формализовать и строить алгоритмы для работы с текстами, какие словари надо вводить в машину, какие лингвистические закономерности следует использовать при машинном переводе. Такими представлениями традиционная лингвистика не располагала – не только в части семантики, но и в части синтаксиса. Ни для одного языка в то время не существовало перечней синтаксических конструкций, не были изучены условия их сочетаемости и взаимозмаеняемости, не были разработаны правила построения крупных единиц синтаксической структуры из более мелких составляющих элементов.

Потребность в создании теоретических основ машинного перевода и привела к формированию и развитию математической лингвистики. Ведущую роль в этом деле в СССР сыграли математики А.А. Ляпунов, О.С. Кулагина, В.А. Успенский, лингвисты В.Ю. Розенцвейг, П.С. Кузнецов, Р.М. Фрумкина, А.А. Реформатский, И.А. Мельчук, В.В. Иванов. Диссертация Кулагиной была посвящена исследованию формальной теории грамматик (одновременно с Н.Хомским в США), Кузнецов выдвинул задачу аксиоматизации лингвистики, восходящую к работам Ф.Ф. Фортунатова.

6 мая 1960 года было принято Постановление Президиума АН СССР «О развитии структурных и математических методов исследования языка», в Институте языкознания и Институте русского языка были созданы соответствующие подразделения. С 1960 года в ведущих гуманитарных вузах страны – филологическом факультете МГУ, Ленинрадском, Новосибирском университетах, МГПИИЯ – началась подготовка кадров в области автоматической обработки текста.

Однако работы по машинному переводу этого периода, называемого «классическим», представляют собой скорее теоретический, нежели практический интерес. Экономически эффективные системы машинного перевода стали создаваться только в восьмидесятые годы прошлого века. Об этом я расскажу позже, в разделе 2.1, «Машинный перевод».

К 1960-м – 70-м годам относятся глубокие теоретические разработки, использующие методы теории множеств и математической логики, такие, как теория поля и теория нечётких множеств.

Автором теории поля в лингвистике был советский поэт, переводчик и лингвист В.Г. Адмони. Свою теорию он изначально разрабатывал на основе немецкого языка. У Адмони понятие «поле» обозначает произвольное непустое множество языковых элементов (например, «лексическое поле», «семантическое поле»).

Структура поля неоднородна: оно состоит из ядра, элементы которого обладают полным набором признаков, определяющих множество, и периферии, элементы которой могут обладать как признаками данного множества (не всеми), так и соседних. Приведу пример, иллюстрирующий данное высказывание: скажем, в английском языке поле сложных слов («day-dream» – «мечтать» трудноотделимо от поля словосочетаний («tear gas» – «слезоточивый газ»).

С теорией поля тесно связана уже упомянутая выше теория нечётких множеств. В СССР её обоснованием занимались лингвисты В.Г. Адмони, И.П. Иванова, Г.Г. Поченцов, однако её родоначальником был американский математик Л.Заде, в 1965 году выпустивший статью «Fuzzy Logic». Давая математическое обоснование теории нечётких множеств, Заде рассматривал их на лингвистическом материале.

В этой теории речь идёт уже не столько о принадлежности элементов к данному множеству (АÎа), сколько о степени этой принадлежности (mАÎа), так как периферийные элементы могут в той или иной мере принадлежать нескольким полям. Заде (Лофти-заде) был выходцем из Азербайджана, до 12 лет имел практику общения на четырех языках - азербайджанском, русском, английском и персидском - и пользовался тремя различными алфавитами: кириллицей, латинским, арабским. Когда ученого спрашивают, что общего между теорией нечетких множеств и лингвистикой, он не отрицает этой связи, но уточняет: «Я не уверен, что изучение этих языков оказало большое влияние на мое мышление. Если это и имело место, то разве что подсознательно». В юности Заде учился в Тегеране в пресвитерианской школе, а после Второй мировой войны эмигрировал в США. «Вопрос не в том, являюсь ли я американцем, русским, азербайджанцем или кем-то еще, - сказал он в одной из бесед, - я сформирован всеми этими культурами и народами и чувствую себя достаточно комфортабельно среди каждого из них» . В этих словах есть нечто родственное тому, что характеризует теорию нечетких множеств – отход от однозначных определений и резких категорий.

В нашей стране в 70е переводятся и изучаются труды западных лингвистов ХХ века. И.А. Мельчук перевёл на русский язык сочинения Н. Хомского. Н.А. Слюсарева в своей книге «Теория Ф. де Соссюра в свете современной лингвистики» связывает постулаты соссюровского учения с актуальными проблемами лингвистики 70-х. Намечается тенденция к дальнейшей математизации лингвистики. В ведущих отечественных вузахидёт подготовка кадров по специальности «Математическая (теоретическая, прикладная) лингвистика». В это же время на Западе происходит резкий скачок в развитии вычислительной техники, для чего требуются всё более новые лингвистические основы.

Таким образом, на протяжении всего ХХ века шло сближение точных и гуманитарных наук. Взаимодействие математики с лингвистикой всё чаще находило практическое применение. Об этом – в следующей главе.

Глава 2. Отдельные примеры использования математики в лингвистике

2.1 Машинный перевод

Идея перевода с одного языка на другой при помощи универсального механизма возникла несколькими веками раньше, чем начались первые разработки в этой области – ещё в 1649 году Рене Декарт предложил идею языка, в котором эквивалентные идеи разных языков выражались бы одним символом. Первые попытки осуществить эту идею в 1930-40е, начало теоретических разработок в середине века, усовершенствование систем перевода при помощи техники в 1970-80е, бурное развитие переводческой техники в последнее десятилетие – таковы этапы развития машинного перевода как отрасли. Именно из работ по машинному переводу выросла компьютерная лингвистика как наука.

С развитием вычислительной техники в конце 70х – начале 80х исследователи задались более реалистичными и экономически выгодными целями – машина становилась не конкурентом (как предполагалось раньше), а помощником человека-переводчика. Машинный перевод перестаёт служить исключительно военным задачам (все советские и американские изобретения и исследования, ориентированные, в первую очередь, на русский и английский языки, в той или иной мере способствовали «холодной войне»). В 1978 году слова естественного языка были переданы в объединённой сети Arpa, шестью годами позже в США появились первые программы перевода для микрокомпьютеров.

В 70е Комиссия Европейских Общин покупает англо-французскую версию компьютерного переводчика Systran, заказывая также франко-аглийскую и итало-английскую версии, и систему перевода с русского на английский, использовавшуюся американскими Вооружёнными Силами. Так были заложены основы проекта EUROTRA.

О возрождении машинного перевода в 70-80-е гг. свидетельствуют следующие факты: Комиссия Европейских общин (CEC) покупает англо-французскую версию Systran, а также систему перевода с русского на английский (последняя развивалась после доклада ALPAC и продолжала использоваться ВВС США и НАСА); кроме того, CEC заказывает разработку франко-английской и итало-английской версий. Одновременно происходит быстрое расширение деятельности по созданию систем машинного перевода в Японии; в США Панамериканская организация здравоохранения (PAHO) заказывает разработку испано-английского направления (система SPANAM); ВВС США финансируют разработку системы машинного перевода в Лингвистическом исследовательском центре при Техасском университете в Остине; группа TAUM в Канаде достигает заметных успехов в разработке своей системы METEO (для перевода метеорологических сводок). Целый ряд проектов, начатых в 70-80-е гг. впоследствии развились в полноценные коммерческие системы.

За период 1978-93 в США на исследования в области машинного перевода истрачено 20 миллионов долларов, в Европе - 70 миллионов, в Японии - 200 миллионов.

Одной из новых разработок стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой, поэтому не нужно дважды переводить одно и то же предложение. В настоящее время разработчиком известной коммерческой системы, основанной на технологии TM, является система TRADOS (основана в 1984 г.).

В настоящее несколько десятков компаний занимаются разработкой коммерческих систем машинного перевода, в их числе: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica b.v. и др. Появилась возможность воспользоваться услугами автоматических переводчиков непосредственно в Сети: alphaWorks; PROMT"s Online Translator; LogoMedia.net; AltaVista"s Babel Fish Translation Service; InfiniT.com; Translating the Internet.

Коммерчески эффективные переводческие системы появились во второй половине 80х и в нашей стране. Расширилось само понятие машинного перевода (к нему стали относить «создание целого ряда автоматических и автоматизированных систем и устройств, выполняющих автоматически или полуавтоматически весь цикл перевода либо отдельные задачи в диалоге с человеком» ), увеличились государственные ассигнования на развитие этой отрасли.

Основными языками отечественных переводческих систем стали русский, английский, немецкий, французский и японский. Во Всесоюзном центре переводов (ВЦП) была разработана система перевода с английского и немецкого языков на русский на машине ЭВМ ЕС-1035 –АНРАП. Она состояла из трёх словарей – входных английского и немецкого и выходного русского – под единым программным обеспечением. Существовало несколько сменных специализированных словарей – по вычислительной технике, программированию, радиоэлектронике, машиностроению, сельскому хозяйству, металлургии. Система могла работать в двух режимах – автоматическом и интерактивном, когда на экране отображался пофразно исходный текст и перевод, который человек мог отредактировать. Скорость перевода текста на АНРАП (от начала набора до окончания печати) составляла примерно 100 страниц в час.

В 1989 году было создано семейство коммерческих переводчиков типа СПРИНТ, работавших с русским, английским, немецким и японским языками. Их главным преимуществом стала их совместимость с IBM PC – таким образом отечественные системы машинного перевода достигали международного уровня качества. В это же время разрабатывается система машинного перевода с французского языка на русский ФРАП, включающая в себя 4 этапа анализа текста: графематический, морфологический, синтаксический и семантический. В ЛГПИ им. Герцена шла работа над четырёхязычной (английский, французский. Испанский, русский) системой СИЛОД-МП (в промышленном режиме эксплуатировались англо-русский и франко-русский словари.

Для специализированного перевода текстов по электротехнике существовала система ЭТАП-2. Анализ входного текста в ней осуществлялся на двух уровнях – морфологическом и синтаксическом. Словарь ЭТАП-2 содержал около 4 тысяч статей; этап преобразования текста – около 1000 правил (96 общих, 342 частных, остальные – словарные). Всё это обеспечивало удовлетворительное качество перевода (скажем, заголовок патента «Optical phase grid arrangement and coupling device having such an arrangement» переводился как «Устройство оптической фазовой сетки и соединяющее устройство с таким устройством» – несмотря на тавтологию, смысл сохранён).

В Минском педагогическом институте иностранных языков на базе англо-русского словаря словоформ и оборотов была изобретена система машинного перевода заголовков), в Институте востоковедения АН – система перевода с японского на русский. Созданная в Московском НИИ систем автоматизации первая автоматическая словарно-терминологическая служба (СЛОТЕРМ) по вычислительной технике и программированию содержала примерно 20000 терминов в толковом словаре и специальных словарях для лингвистических исследований.

Системы машинного перевода постепенно стали использоваться не только по прямому назначению, но и как важный компонент автоматических обучающих систем (для обучения переводу, контроля орфографических и грамматических знаний).

90-е годы принесли с собой бурное развитие рынка ПК (от настольных до карманных) и информационных технологий, широкое использование сети Интернет (которая становится все более интернациональной и многоязыкой). Все это сделало востребованным дальнейшее развитие автоматизированных переводческих систем. С начала 1990-х гг. на рынок систем ПК выходят и отечественные разработчики.

В июле 1990 года на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer"s Machine Translation). В 1991 г. было создано ЗАО "ПРОект МТ", и уже в 1992 г. компания "ПРОМТ" выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе). В 1992 г. "ПРОМТ" выпускает целое семейство систем под новым названием STYLUS для перевода с английского, немецкого, французского, итальянского и испанского языков на русский и с русского на английский, а в 1993 г. на базе STYLUS создается первая в мире система машинного перевода для Windows. В 1994 г. вышла версия STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996 гг. представлено третье поколение систем машинного перевода, полностью 32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершена разработка совершенно новых, первых в мире русско-немецкой и русско-французской систем машинного перевода.

В 1997 г. подписано соглашение с французской фирмой Softissimo о создании систем перевода с французского языка на немецкий и английский и обратно, а в декабре этого года была выпущена первая в мире система немецко-французского перевода. В этом же году компания "ПРОМТ" компания выпустила систему, реализованную по технологии Гигант, поддерживающей несколько языковых направлений в одной оболочке, а также специальный переводчик для работы в Интернете WebTranSite.

В 1998 г. выпускается целое созвездие программ под новым названием PROMT 98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакет программ для работы в Интернете - PROMT Internet, и переводчик для корпоративных почтовых систем - PROMT Mail Translator. В ноябре 1999 года PROMT была признана лучшей системой машинного перевода среди тестируемых французским журналом PC Expert, обойдя конкурентов по сумме показателей на 30 процентов. Для корпоративных клиентов разработаны также специальные серверные решения - корпоративный сервер переводов PROMT Translation Server (PTS) и Интернет-решение PROMT Internet Translation Server (PITS). В 2000 г. "ПРОМТ" обновила всю линию своих программных продуктов, выпустив МП системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000.

Перевод в режиме он-лайн при поддержке системы "ПРОМТ" используется на ряде отечественных и зарубежных сайтов: PROMT"s Online Translator, InfiniT.com, Translate.Ru, Lycos и др., а также в учреждениях различного профиля для перевода деловой документации, статей и писем (существуют системы перевода, встраиваемые непосредственно в Outlook Express и другие почтовые клиенты).

В наше время появляются новые технологии машинного перевода, основанные на использовании систем искусственного интеллекта, статистических методах. О последних – в следующем разделе.

2.2 Статистические методы в изучении языка

Немалое внимание в современной лингвистике отводится изучению языковых явлений методами количественной математики. Количественные данные часто помогают более глубоко осмыслить изучаемые явления, их место и роль в системе смежных явлений. Ответ на вопрос «сколько» помогает ответить и на вопросы «что», «как», «почему» – таков эвристический потенциал количественной характеристики.

Немалую роль статистические методы играют в разработке систем машинного перевода (см. раздел 2.1). При статистическом подходе проблема перевода рассматривается в терминах канала с помехами. Представим себе, что нам нужно перевести предложение с английского на русский. Принцип канала с помехами предлагает нам следующее объяснение отношений между английской и русской фразой: английское предложение представляет собой не что иное, как русское предложение, искаженное неким шумом. Для того чтобы восстановить исходное русское предложение, нам нужно знать, что именно люди обычно говорят по-русски и как русские фразы искажаются до состояния английского. Перевод осуществляется путем поиска такого русского предложения, которое максимизирует произведения безусловной вероятности русского предложения и вероятности английского предложения (оригинала) при условии данного русского предложения. Согласно теореме Байеса, это русское предложение является наиболее вероятным переводом английского:

где e – предложение перевода, а f – предложение оригинала

Таким образом, нам требуется модель источника и модель канала, или модель языка и модель перевода. Модель языка должна присваивать оценку вероятности любому предложению конечного языка (в нашем случае, русского), а модель перевода –предложению оригинала. (cм. табл.1)

В общем случае система машинного перевода работает в двух режимах:

1. Обучение системы: берется тренировочный корпус параллельных текстов, и с помощью линейного программирования ищутся такие значения таблиц переводных соответствий, которые максимизируют вероятность (например) русской части корпуса при имеющейся английской согласно выбранной модели перевода. На русской части того же корпуса строится модель русского языка.

2. Эксплуатация: на основе полученных данных для незнакомого английского предложения ищется русское, максимизирующее произведение вероятностей, присваиваемых моделью языка и моделью перевода. Программа, используемая для такого поиска, называется дешифратором.

Самой простой статистической моделью перевода является модель дословного перевода. В этой модели предполагается, что для перевода предложения с одного языка на другой достаточно перевести все слова (создать «мешок слов»), а расстановку их в правильном порядке обеспечит модель Для приведения P(a, f | e) к P(a | e, f), т.е. вероятности данного выравнивания при данной паре предложений, каждая вероятность P(a, f | e) нормализуется по сумме вероятностей всех выравниваний данной пары предложений:

Реализация алгоритма Витерби, используемая для обучения Модели №1, состоит в следующем:

1.Вся таблица вероятностей переводных соответствий заполняется одинаковыми значениями.

2. Для всех возможных вариантов попарных связей слов вычисляется вероятность P(a, f | e):

3. Значения P(a, f | e) нормализуются для получения значений P(a | e, f).

4. Подсчитывается частота каждой переводной пары, взвешенная по вероятности каждого варианта выравнивания.

5. Полученные взвешенные частоты нормализуются и формируют новую таблицу вероятностей переводных соответствий

6. Алгоритм повторяется с шага 2.

Рассмотрим в качестве примера тренировку подобной модели на корпусе из двух пар предложений (рис.2):

Белый Дом/White House


После большого числа итераций мы получим таблицу (табл.2.), из которой видно, что перевод осуществляется с высокой точностью.


Также статистические методы широко используются в изучении лексики, морфологии, синтаксиса, стилистики. Учёные Пермского государственного университета провели исследование, в основе которого лежало утверждение о том, что стереотипные словосочестания являются важным «строительным материалом» текста . Эти словосочетания состоят из «ядерных» повторяющихся слов и зависимых слов-конкретизавторов и имеют ярко выраженную стилистическую окраску.

В научном стиле «ядерными» словами можно назвать: исследование, изучение, задача, проблема, вопрос, явление, факт, наблюдение, анализ и др. В публицистике «ядерными» будут уже другие слова, обладающие повышенной ценностью именно для текста газеты: время, лицо, власть, дело, действие, закон, жизнь, история, место и т.д. (всего 29)

Особый интерес для лингвистов представляет также профессиональная диффереренциация общенародного языка, своеобразие использования лексики и грамматики в зависимости от рода занятий. Известно, что шофёры в профессиональной речи употребляю форму шо фер, медики говорят ко клюш вместо коклю ш – подобных примеров можно привести. Задача статистики – проследить за вариативностью произношения и изменением языковой нормы.

Профессиональные различия ведут за собой различия не только грамматические, но и лексические. В Якутском государственном университете им. М.К. Аммосова было проанализировано по 50 анкет с наиболее часто встречающимися реакциями на некоторые слова среди медиков и строителей (табл.3) .

Строители

человек

пациент (10), личность (5)

мужчина (5)

добро

помощь (8), помогать (7)

зло (16)

жизнь

смерть (10)

прекрасная (5)

смерть

труп (8)

жизнь (6)

огонь

жар (8), ожог (6)

пожар (7)

палец

рука (14), панариций (5)

большой (7), указательный (6)

глаза

зрение (6), зрачок, окулист (по 5)

карие (10), большие (6)

голова

ум (14), мозги (5)

большая (9), умная (8), ум (6)

терять

сознание, жизнь (по 4)

деньги (5), находить (4)


Можно заметить, что медики чаще, чем строители, дают ассоциации, связанные с их профессиональной деятельностью, так как приведённые в анкете слова-стимулы имеют к их профессии больше отношения, чем к профессии строителя.

Статистические закономерности в языке используются для создания частотных словарей – словарей, в которых приводятся числовые характеристики употребительности слов (словоформ, словосочетаний) какого-либо языка – языка писателя, какого-либо произведения и т. п. Обычно в качестве характеристики употребительности используется частота встречаемости слова в тексте определенного объема

Модель восприятия речи невозможна без словаря как своего существеннейшего компонента. При восприятии речи основной оперативной единицей выступает слово. Из этого следует, в частности, что каждое слово воспринимаемого текста должно быть отождествлено с соответствующей единицей внутреннего словаря слушающего (или читающего). Естественно считать, что уже с самого начала поиск ограничен некоторыми подобластями словаря. Согласно большинству современных теорий восприятия речи, собственно фонетический анализ звучащего текста в типичном случае дает лишь некоторую частичную информацию о возможном фонологическом облике слова, и такого рода информации отвечает не одно, а определенное МНОЖЕСТВО слов словаря; следовательно, возникает две задачи:

(а) выделить соответствующее множество по тем или иным параметрам;

(б) в пределах очерченного множества (если оно выделено адекватно) произвести «отсев» всех слов, кроме того единственного, которое и соответствует наилучшим образом данному слову распознаваемого текста. Одна из стратегий «отсева» – исключение низкочастотных слов. Отсюда следует, что словарь для восприятия речи – это частотный словарь. Именно создание компьютерной версии частотного словаря русского языка и является первоначальной задачей представляемого проекта.

На материале русского языка существует 5 частотных словарей (не считая отраслевых). Отметим лишь некоторые общие недостатки имеющихся словарей.

Все известные частотные словари русского языка построены на обработке массивов письменных (печатных) текстов. Отчасти по этой причине, когда тождество слова во многом опирается на совпадение формальное, графическое, недостаточно учитывается семантика. В результате оказываются смещенными, искаженными и частотные характеристики; например, если слова из сочетания «друг друга» составитель частотного словаря включает в общую статистику употребления слова «друг», то едва ли это оправданно: учитывая семантику, мы должны признать, что это уже другие слова, а точнее, что самостоятельной словарной единицей выступает лишь само по себе сочетание в целом.

Также во всех существующих словарях слова помещены лишь в своих основных формах: существительные в форме единственного числа, именительного падежа, глаголы в форме инфинитива и т.д. Некоторые из словарей дают информацию о частотности словоформ, но обычно делают это недостаточно последовательно, не исчерпывающим образом. Частотности разных словоформ одного и того же слова заведомо не совпадают. Разработчик же модели восприятия речи должен учитывать, что в реальном перцептивном процессе распознаванию подлежит именно конкретная словоформа, «погруженная» в текст: на базе анализа начального участка экспонента словоформы формируется множество слов с идентичным началом, причем начальный участок словоформы не обязательно тождествен начальному участку словарной формы. Именно словоформе принадлежит конкретная ритмическая структура – также чрезвычайно важный параметр для перцептивного отбора слов. Наконец, в итоговом представлении распознанного высказывания опять-таки слова представлены соответствующими словоформами.

Существует множество работ, в которых демонстрируется важность частотности в процессе восприятии речи. Но нам не известны работы, где использовалась бы частотность словоформ – напротив, все авторы практически игнорируют частотность отдельных словоформ, обращаясь исключительно к лексемам. Если полученные ими результаты не считать артефактами, приходится допустить, что носителю языка каким-то образом доступна информация о соотношении частотностей словоформ и словарной формы, т.е., фактически, лексемы. Причем такого рода переход от словоформы к лексеме, конечно, невозможно объяснить естественным знанием соответствующей парадигмы, поскольку информация о частотности должна использоваться до окончательной идентификации слова, иначе она просто теряет смысл.

По первичным статистическим характеристикам можно определить с заданной относительной погрешностью ту часть словника, в которую входят слова с высокой частотой появления независимо от типа текста. Возможно также, введя ступенчатое упорядочение в словарь, получить серию словников, охватывающих первые 100, 1000, 5000 и т. д. частых слов. Статистические характеристики словаря вызывают интерес в связи со смысловым анализом лексики. Изучение предметно-идеологическнх групп и семантических полей показывает, что лексические объединения поддерживаются семантическими связями, которые концентрируются вокруг лексем с наиболее общим значением. Описание значений в пределах лексико-семантического поля может проводиться посредством идентификации слов с наиболее абстрактными по смыслу лексемами. По-видимому, «пустые» (с точки зрения номинативных потенций) единицы словаря составляют статистически однородный пласт.

Не меньшую ценность имеют и словники по отдельным жанрам. Изучение меры их сходства и характера статистических распределений даст интересные сведения о качественном расслоении лексики в зависимости от сферы речеупотребления.

Составление больших частотных словарей требует обращения к вычислительной технике. Введение частичной механизации и автоматизации в процесс работы над словарем представляет интерес как эксперимент машинной обработки словников к разным текстам. Такой словарь требует более строгой системы обработки и накопления словарного материала. В миниатюре это информационно-поисковая система, которая способна выдавать сведения о различных сторонах текста и словаря. Некоторые основные запросы к этой системе планируются с самого начала: общее количество инвентаризованных слов, статистические характеристики отдельного слова и целых словников, упорядочение частых и редких зон словника и т. п. Машинная картотека позволяет автоматически строить обратные словари по отдельным жанрам и источникам. Множество других полезных статистических сведений о языке будет извлечено из накопленного массива информации. Компьютерный частотный словарь создает экспериментальную базу для перехода к более обширной автоматизации словарных работ.

Статистические данные частотных словарей могут быть широко использованы и при решении других лингвистических задач – например, при анализе и определении активных средств словообразования современного русского языка, решении вопросов усовершенствования графики и орфографии, которые связаны с учетом статистических сведений о словарном составе (при этом важно учитывать вероятностные характеристики комбинаций графем, реализованные в словах типы буквосочетаний), практической транскрипции и транслитерации. Статистические параметры словаря будут полезны и при решении вопросов автоматизации печатного дела, распознавания и автоматического чтения буквенного текста.

Современные толковые словари и грамматики русского языка в основном построены на базе литературно-художественных текстов. Существуют частотные словари языка А.С. Пушкина, А.С. Грибоедова, Ф.М. Достоевского, В.В. Высоцкого и многих других авторов. На кафедре истории и теории литературы Смоленского гос. педагогического университета ряд лет ведётся работа по составлению частотных словарей стихотворных и прозаических текстов. Для настоящего исследования отобраны частотные словари всей лирики Пушкина и ещё двух поэтов золотого века – «Горя от ума» Грибоедова и всей поэзии Лермонтова; Пастернака и ещё пяти поэтов серебряного века - Бальмонта 1894-1903 гг., «Стихов о Прекрасной Даме» Блока, «Камня» Мандельштама, «Огненного столпа» Гумилёва, «Anno Domini MCMXXI» Ахматовой и «Сестры моей жизни» Пастернака и ещё четырёх поэтов века железного – «Стихотворений Юрия Живаго», “Когда разгуляется”, всего корпуса лирики М. Петровых, «Дорога далека», «Ветрового стекла», «Прощания со снегом» и «Подковы» Межирова, «Антимиров» Вознесенского и «Снежницы» Рыленкова.

Следует отметить, что эти словари по природе своей различны: одни представляют лексику одного драматического произведения, другие – книги лирики, или нескольких книг, или всего корпуса стихов поэта. Результаты анализа, представленные в настоящей работе, следует воспринимать с осторожностью, их нельзя абсолютизировать. Однако с помощью специальных мер разницу онтологической природы текстов можно до известной степени уменьшить.

В последние годы все более отчетливо осознается противопоставление разговорной и книжной речи. Особенно остро обсуждается этот вопрос среди методистов, которые требуют поворота обучения в сторону разговорного языка. Однако специфика разговорной речи до сих пор остается необъясненной.

Обработка словарей выполнялась путем создания пользовательского приложения в среде офисной программы EXCEL97. Приложение включает четыре рабочих листа книги EXCEL – «Титульный лист», лист «Словари» с исходными данными, «Близости» и «Расстояния» с результатами, а также набор макросов.

Исходная информация вводится на лист «Словари». В ячейки EXCEL, записываются словари исследуемых текстов, последний столбец S формируется из полученных результатов и равен количеству слов, встречающихся в других словарях. Таблицы «Близости» и «Расстояния» содержат рассчитанные меры близости M, корреляции R и расстояния D.

Макросы приложения представляют собой событийные программные процедуры на языке Visual Basic for Application (VBA). Основу процедур составляют библиотечные объекты VBA и методы их обработки. Так, для операций с рабочими листами приложения используется ключевой объект Worksheet (рабочий лист) и соответствующий ему метод активизации листа Activate (активизировать). Задание диапазона анализируемых исходных данных на листе «Словари» выполняется методом Select (выбрать) объекта Range (диапазон), а передача слов в качестве значений переменным выполняется как свойство Value (значение) этого же объекта Range.

Несмотря на то, что ранговый корреляционный анализ заставляет с осторожностью говорить о зависимости тематики между разными текстами, большая часть самых частотных слов каждого текста имеет соответствия в одном или нескольких других текстах. В колонке S показано количество таких слов среди 15 наиболее частотных у каждого автора. Полужирным шрифтом выделены слова, встречающиеся в нашей таблице только у одного поэта. Нет выделенных слов вовсе у Блока, Ахматовой и Петровых, у них S = 15. У этих трёх поэтов все 15 самых частотных слов одни и те же, различаются они только местом в списке. Но даже у Пушкина, лексика которого наиболее оригинальна, S = 8, а выделенных слов 7.

Результаты показывают, что существует определённый слой лексики, концентрирующий основные темы поэзии. Как правило, эти слова коротки: из общего числа (225) словоупотреблений односложных 88, двусложных 127, трёхсложных 10. Зачастую эти слова представляют основные мифологемы и могут распадаться на пары: ночь - день, земля - небо (солнце), Бог - человек (люди), жизнь - смерть, тело - душа, Рим - мир (у Мандельштама); могут объединяться в мифологемы более высокого уровня: небо, звезда, солнце, земля; в человеке как правило выделяются тело, сердце, кровь, рука, нога, щека, глаза . Из человеческих состояний предпочтение отдаётся сну и любви. К миру человека принадлежат дом и города – Москва, Рим, Париж. Творчество представлено лексемами слово и песня .

У Грибоедова и Лермонтова среди наиболее частотных слов почти нет слов, обозначающих природу. У них втрое больше слов, обозначающих человека, части его тела, элементы его духовного мира. У Пушкина и поэтов ХХ в. обозначений человека и природы приблизительно поровну. В этом важном аспекте тематики, можем сказать, ХХ в. пошёл за Пушкиным.

Минимальная тема дело среди самых частотных слов встречается только у Грибоедова и Пушкина. У Лермонтова и поэтов ХХ в. она уступает место минимальной теме слово . Слово не исключает дела (библейская трактовка темы: в Новом Завете всё учение Иисуса Христа рассматривается как слово Божье или слово Иисуса, а апостолы иногда называют себя служителями Слова). Сакральный смысл лексемы слово убедительно проявляется, например, в стихе Пастернака «И образ мира, в Слове явленный». Сакральный смысл лексемы слово в со- и противопоставлении с человеческими делами убедительно проявляется в одноимённом стихотворении Гумилёва.

Лексемы, которые встречаются только в одном тексте, характеризуют своеобразие данной книги или совокупности книг. Например, слово «ум» - самое частотное в комедии Грибоедова «Горе от ума» – но оно не встречается среди частотных слов других текстов. Тема ума безусловно является наиболее значимой в комедии. Эта лексема сопровождает образ Чацкого, причём имя Чацкого является наиболее частотным в комедии. Таким образом, в произведении органически сочетаются самое частотное имя нарицательное с самым частотным именем собственным.

Самый высокий коэффициент корреляции связывает тематику трагических книг Гумилёва «Огненный столп» и Ахматовой «Anno Domini MCMXXI». Среди 15 наиболее частотных имён существительных здесь 10 общих, в том числе кровь, сердце, душа, любовь, слово, небо. Напомним, что в книгу Ахматовой вошла миниатюра «Не бывать тебе в живых...», написанная между арестом Гумилёва и его расстрелом.

Темы свечи и толпы в исследованном материале встречаются только в «Стихотворениях Юрия Живаго». Тема свечи в стихах из романа имеет множество контекстуальных значений: она связана с образом Иисуса Христа, с темами веры, бессмертия, творчества, любовного свидания. Свеча – важнейший источник света в центральных сценах романа. Тема толпы развивается в связи с основной идеей романа, в котором частная жизнь человека с её незыблемыми ценностями противопоставлена безнравственности нового государства, построенного на началах угождения толпе.

Работа предполагает и третий этап, тоже отраженный в программе, - это вычисление разности порядковых номеров слов, общих для двух словарей и среднего показателя расстояния между одинаковыми словами двух словарей. Этот этап позволяет от общих тенденций взаимодействия словарей, выявленных с помощью статистики, перейти на уровень, приближающийся к тексту. Например, статистически значимо коррелируют книги Гумилева и Ахматовой. Мы смотрим, какие слова оказались общими для их словарей, и выбираем прежде всего те, разница между порядковыми номерами которых минимальна или равна нулю. Именно эти слова имеют один и тот же ранговый номер и, следовательно, именно эти минимальные темы в сознании двух поэтов одинаково важны. Далее следует переходить на уровень текстов и контекстов.

Количественные методы также помогают изучить особенности народов – носителей языка. Скажем, в русском языке 6 падежей, в английском падежей нет, а в отдельных языках народов Дагестана количество падежей доходит до 40. Л.Перловский в своей статье «Сознание, язык и культура» соотносит эти характеристики со склонностью народов к индивидуализму или коллективизму , с восприятием вещей и явлений отдельно или в связи с другими. Ведь именно в англоязычном мире (падежей нет – вещь воспринимается «сама по себе») появились такие понятия, как свобода личности, либерализм и демократия (замечу, что я употребляю эти понятия только в связи с языком, без какой-либо оценочной характеристики). Несмотря на то, что подобные догадки пока остаются лишь на уровне смелых научных гипотез, они помогают посмотреть по-новому на уже знакомые явления.

Как мы видим, количественные характеристики могут применяться в совершенно различных областях языкознания, что всё больше стирает границы между «точными» и «гуманитарными» методами. Лингвистика всё чаще прибегает к помощи не только математики, но и вычислительной техники для решения своих задач.

2.3 Изучение языка методами формальной логики

С неколичественными методами математики, в частности, с логикой, современная теоретическая лингвистика взаимодействует не менее плодотворно, чем с количественными. Быстрое развитие компьютерных технологий и возрастание их роли в современном мире потребовало пересмотра подхода к взаимодействию языка и логики в целом.

Методы логики широко используются в разработке формализованных языков, в частности, языков программирования, элементами которых являются некоторые символы (сродни математическим), выбираемые (или конструируемые из выбранных ранее символов) и интерпретируемые определённым образом, связанным ни с каким «традиционным» употреблением, пониманием и функциями таких же символов в других контекстах. Программист постоянно имеет дело с логикой в своей работе. Смысл программирования состоит как раз в том, чтобы научить компьютер рассуждать (в широком смысле слова). При этом методы "рассуждения" оказываются самыми разными. Каждый программист тратит определенное время на поиск ошибок в своих и чужих программах. То есть, на поиск ошибок в рассуждениях, в логике. И это тоже накладывает свой отпечаток. Гораздо легче обнаруживаешь логические ошибки и в обычной речи. Относительная простота языков, изучаемых логиками, позволяет им выяснять структуры этих языков более четко, чем это достижимо для лингвистов, анализирующих исключительно сложные естественные языки. Ввиду того, что языки, изучаемые логиками, используют отношения, скопированные с естественных языков, логики способны внести существенный вклад в общую теорию языка. Ситуация здесь подобна той, которая имеет место в физике: физик также формулирует теоремы для идеально упрощенных случаев, которые не происходят в природе вообще - он формулирует законы для идеальных газов, идеальных жидкостей, говорит о движении при отсутствии трения и т.д. Для этих идеализированных случаев можно установить простые законы, которые значительно способствовали бы пониманию того, что происходит в действительности и что, вероятно, осталось бы неизвестным физике, если бы она пробовала рассматривать действительность непосредственно, во всей сложности.

В изучении естественных языков логические методы используются для того, чтобы изучающие язык могли не тупо «зазубрить» как можно больше слов, а лучше понять его структуру. Ещё Л. Щерба использовал на своих лекциях пример предложения, построенного по законам русского языка: «Глокая куздра штеко будланула бокра и курдячит бокренка», – а потом спрашивал у студентов, что это значит. Несмотря на то, что смысл слов в предложении оставался непонятен (их просто не существует в русском языке), можно было чётко ответить: «куздра» – подлежащее, существительное женского рода, в единственном числе, именительном падеже, «бокр» – одушевлённое, и т.д. Перевод фразы получается примерно таков: «Нечто женского рода в один прием совершило что-то над каким-то существом мужского рода, а потом начало что-то такое вытворять длительное, постепенное с его детенышем» . Подобным же примером текста (художественного) из несуществующих слов, построенного полностью по законам языка, является «Бармаглот» Льюиса Кэрролла (в «Алисе в стране чудес» Кэрролл устами своего персонажа Шалтая-Болтая объясняет и значение придуманных им слов: «варкалось» – восемь часов вечера, когда уже пора варить ужин, «хливкий» – хлипкий и ловкий, «шорёк» – помесь хорька, барсука и штопора, «пыряться» – прыгать, нырять, вертеться, «нава» – трава под солнечными часами (простирается немного направо, немного налево и немного назад), «хрюкотать» – хрюкать и хохотать, «зелюк» – зелёный индюк, «мюмзик» – птица; перья у неё растрёпаны и торчат во все стороны, как веник, «мова» – далеко от дома) .

Одно из основных понятий современной логики и теоретической лингвистики, используемое при исследовании языков различных логико-математических исчислений, естественных языков, для описания отношений между языками различных «уровней» и для характеристики отношений между рассматриваемыми языками и описываемыми с их помощью предметными областями – понятие метаязыка. Метаязык – это язык, используемый для выражения суждений о другом языке, языке-объекте. С помощью метаязыка изучают структуру знакосочетаний (выражений) языка-объекта, доказывают теоремы о его выразительных свойствах, об отношении его к другим языкам и т. п. Изучаемый язык называется также предметным языком по отношению к данному метаязыку. Как предметный язык, так и метаязык могут быть обычными (естественными) языками. Метаязык может отличаться от языка-объекта (например, в учебнике английского языка для русских русский язык является метаязыком, а английский – языком-объектом), но может и совпадать с ним или отличаться лишь частично, например специальной терминологией (русская лингвистическая терминология – элемент метаязыка для описания русского языка; т. н. семантические множители – часть метаязыка описания семантики естественных языков).

Логика учит нас плодотворному разграничению языка-объекта и метаязыка. Язык-объект - это сам предмет логического исследования, а метаязык - тот неизбежно искусственный язык, на котором такое исследование ведется. Логическое мышление как раз и состоит в том, чтобы сформулировать на языке символов (метаязыке) отношения и структуру реального языка (языка-объекта).

Метаязык должен быть во всяком случае «не беднее» своего предметного языка (т. е. для каждого выражения последнего в метаязыке должно иметься его имя- «перевод») – иначе, при невыполнении этих требований (что заведомо имеет место в естественных языках, если специальными соглашениями не предусмотрено обратное) возникают семантические парадоксы (антиномии).

По мере создания все новых и новых языков программирования в связи с проблемой программирования трансляторов появилась острая необходимость в создании метаязыков. В настоящее время наиболее употребительным для описания синтаксиса языков программирования является метаязык форм Бэкуса-Наура (сокращенно БНФ). Он представляет собой компактную форму в виде некоторых формул, похожих на математические. Для каждого понятия языка существует единственная метаформула (нормальная формула). Она состоит из левой и правой частей. В левой части указывается определяемое понятие, а в правой - задается множество допустимых конструкций языка, которые объединяются в это понятие. В формуле используют специальные метасимволы в виде угловых скобок, в которых заключено определяемое понятие (в левой части формулы) или ранее определенное понятие (в ее правой части), а разделение левой и правой частей указывается метасимволом "::=", смысл которого эквивалентен словам "по определению есть". Металингвистические формулы в некотором виде заложены в трансляторы; с их помощью ведется проверка конструкций, используемых программистом, на формальное соответствие какой-нибудь из конструкций, синтаксически допустимых в этом языке. Существуют и отдельные метаязыки различных наук – таким образом, знания существуют в виде различных метаязыков.

Логические методы также послужили основой для создания систем искусственного интеллекта, основанных на концепции коннекционизма. Коннекционизм – это особое течение в философской науке, предметом которого являются вопросы познания. В рамках этого течения предпринимаются попытки объяснить интеллектуальные способности человека, используя искусственные нейронные сети. Составленные из большого числа структурных единиц, аналогичных нейронам, с заданным для каждого элемента весом, определяющим силу связи с другими элементами, нейронные сети представляют собой упрощённые модели человеческого мозга. Эксперименты с нейронными сетями подобного рода продемонстрировали их способность к обучению выполнения таких задач, как распознавание образов, чтение и определение простых грамматических структур.

Философы начали проявлять интерес к коннекционизму, так как коннекционистский подход обещал обеспечить альтернативу классической теории разума и широко распространённой в рамках этой теории идеи, согласно которой механизмы работы разума имеют сходство с обработкой символического языка цифровым компьютером. Эта концепция весьма спорна, однако в последние годы она находит всё больше сторонников.

Логическое изучение языка продолжает соссюровскую концепцию о языке как системе. То, что оно постоянно продолжается, ещё раз подтверждает смелость научных догадок начала прошлого века. Последний раздел своей работы я посвящу перспективам развития математических методов в лингвистике в наши дни.

2.4 Перспективы применения математических методов в лингвистике

В эпоху компьютерных технологий методы математической лингвистики получили новую перспективу развития. Поиск решения проблем лингвистического анализа все активнее реализуется теперь на уровне информационных систем. Вместе с тем автоматизация процесса обработки языкового материала, предоставляя исследователю значительные возможности и преимущества, неизбежно выдвигает перед ним новые требования и задачи.

Соединение «точного» и «гуманитарного» знания стало плодородной почвой для новых открытий в области лингвистики, информатики и философии.

Машинный перевод с одного языка на другой остаётся быстро развивающейся отраслью информационных технологий. Несмотря на то, что перевод при помощи компьютера никогда не сравнится по качеству с переводом, сделанным человеком (особенно это касается художественных текстов), машина стала неотъемлемым помощником человека в переводе больших объёмов текста. Считается, что в ближайшем будущем будут созданы более совершенные переводческие системы, основанные, в первую очередь, на семантическом анализе текста.

Не менее перспективным направлением остаётся взаимодействие лингвистики и логики, служащее философским фундаментом для осмысления информационных технологий и так называемой «виртуальной реальности». В ближайшем будущем продолжится работа над созданием систем искусственного интеллекта – хотя, опять же, он никогда не будет равен человеческому по его возможностям. Подобная конкуренция бессмысленна: в наше время машина должна стать (и становится) не соперником, а помощником человека, не чем–то из области фантастики, а частью реального мира.

Продолжается изучение языка методами статистики, что позволяет более точно определить его качественные свойства. Важно, чтобы наиболее смелые гипотезы о языке находили своё математическое, а, следовательно, и логическое, доказательство.

Наиболее значимо то, что различные отрасли применения математики в лингвистике, до этого достаточно разрозненные, в последние годы соотносятся между собой, соединяясь в стройную систему, по аналогии с системой языка, открытой столетие назад Фердинандом де Соссюром и Иваном Бодуэном де Куртенэ. В этом – преемственность научного знания.

Лингвистика в современном мире стала фундаментом для развития информационных технологий. Пока информатика остаётся бурно развивающейся отраслью человеческой деятельности, союз математики и лингвистики продолжит играть свою роль в развитии науки.

Заключение

За ХХ век компьютерные технологии проделали большой путь – от военного применения к мирному, от узкого круга целей до проникновения во все отрасли человеческой жизни. Математика как наука находила всё новое практическое значение с развитием вычислительной техники. Этот процесс продолжается и сегодня.

Немыслимый раньше «тандем» «физиков» и «лириков» стал реальностью. Для полноценного взаимодействия математики и информатики с гуманитарными науками потребовались квалифицированные специалисты как с той, так и с другой стороны. В то время как специалистам-компьютерщикам всё более нужны систематические гуманитарные знания (лингвистические, культурологические, философские) , чтобы осмыслять изменения в окружающей их реальности, во взаимодействии человека и техники, разрабатывать всё новые и новые языковые и мыслительные концепции, писать программы, то любой «гуманитарий» в наше время для своего профессионального роста должен овладеть хотя бы азами работы с компьютером.

Математика, будучи тесно взаимосвязанной с информатикой, продолжает развиваться и взаимодействовать с естественнонаучным и гуманитарным знанием. В новом веке не ослабевает, а, наоборот, усиливается тенденция к математизации науки. На количественных данных осмысливаются закономерности развития языка, его исторические и философские характеристики.

Математический формализм более всего подходит для описания закономерностей в лингвистике (как, впрочем, и в других науках – и гуманитарных, и естественных). Ситуация порой складывается в науке так, что без применения соответствующего математического языка понять характер физического, химического и т.п. процесса невозможно. Создавая планетарную модель атома, известный английский физик XX в. Э. Резерфорд испытал математические трудности. Вначале его теорию не приняли: она не звучала доказательно, и виной тому явилось незнание Резерфордом теории вероятности, на основе механизма которой только и возможно было понять модельное представление атомных взаимодействий. Осознав это, выдающийся уже к тому времени ученый, обладатель Нобелевской премии, записался в семинар математика профессора Лэмба и в течение двух лет вместе со студентами прослушал курс и отработал практикум по теории вероятности. На ее основе Резерфорд смог описать поведение электрона, придав своей структурной модели убедительную точность и получив признание. То же – и с языкознанием.

Напрашивается вопрос, что же содержится в объективных явлениях такое математическое, благодаря чему они и поддаются описанию на языке математики, на языке количественных характеристик? Это однородные единицы вещества, распределяемые в пространстве и времени. Те науки, которые дальше других прошли путь к выделению однородности, и оказываются лучше приспособленными для использования в них математики.

Стремительно развившаяся в 90е годы сеть Интернет объединила под собой представителей различных стран, народов и культур. Несмотря на то, что основным языком международного общения продолжает служить английский, Интернет в наше время стал многоязычным. Это обусловило развитие коммерчески успешных систем машинного перевода, широко использующихся в различных областях человеческой деятельности.

Компьютерные сети стали объектом философского осмысления – создавались всё новые лингвистические, логические, мировоззренческие концепции, помогающие понять «виртуальную реальность». Во многих художественных произведениях создавались сценарии – чаще пессимистические – о господстве машин над человеком, а виртуальной реаьности – над окружающим миром. Далеко не всегда подобные прогнозы оказывались бессмысленными. Информационные технологии – не только перспективная отрасль вложения человеческих знаний, это ещё и способ контроля над информацией, а, следовательно, и над человеческой мыслью.

У этого явления есть как отрицательная, так и положительная сторона. Отрицательная – потому что контроль над информацией противоречит неотъемлемому человеческому праву на свободный доступ к ней. Положительная – потому что отсутствие этого контроля может привести к катастрофическим последствиям для человечества. Достаточно вспомнить один из наиболее мудрых фильмов последнего десятилетия – «Когда наступит конец света» Вима Вендерса, герои которого полностью погрузились в «виртуальную реальность» собственных снов, записываемых на компьютер. Однако ни один учёный и ни один художник не может дать однозначного ответа на вопрос: что же ждёт науку и технику в будущем.

Ориентировка на «будущее», порой кажущееся фантастическим, была отличительной особенностью науки середины ХХ века, когда изобретатели стремились создать совершенные образцы техники, которые могут работать без вмешательства человека. Время показало утопичность подобных изысканий. Однако было бы излишним осуждать учёных за это – без их энтузиазма в 1950е – 60е информационные технологии не сделали бы столь мощного скачка в 90е, и мы бы не имели того, что имеем сейчас.

Последние десятилетия ХХ века изменили приоритеты науки – исследовательский, изобретательский пафос уступил место коммерческому интересу. Опять же – это не хорошо и не плохо. Это – реальность, в которой наука оказывается всё более интегрированной в повседневную жизнь.

Наступивший XXI век продолжил эту тенденцию, и в наше время за изобретениями стоят не только слава и признание, но, в первую очередь, деньги. Ещё и поэтому важно заботиться о том, чтобы новейшие достижения науки и техники не попали в руки террористических группировок или диктаторских режимов. Задача сложная до невозможности; максимально осуществить её – задача всего мирового сообщества.

Информация – оружие, причём оружие не менее опасное, чем ядерное или химическое – только действует оно не физически, а, скорее, психологически. Человечеству надо задуматься о том, что для него в этом случае важнее – свобода или контроль.

Новейшие философские концепции, связанные с развитием информационных технологий и попыткой их осмыслить, показали ограниченность как естественнонаучного материализма, господствовавшего на протяжении ХIХ – начала ХХ веков, так и крайнего идеализма, отрицающего значимость материального мира. Современной мысли, особенно мысли Запада, важно преодолеть этот дуализм в мышлении, когда окружающий мир чётко делится на материальное и идеальное. Путь к этому – диалог культур, сопоставление разных точек зрения на окружающие явления.

Как ни парадоксально, информационные технологии могут сыграть не последнюю роль в этом процессе. Компьютерные сети, и особенно Интернет – это не только ресурс для развлечения и бурной коммерческой деятельности, это ещё и средство осмысленного, спорного общения между представителями различных цивилизаций в современном мире, а также для диалога прошлого с настоящим. Можно сказать, что Интернет раздвигает пространственные и временные рамки.

А в диалоге культур посредством информационных технологий по-прежнему важна роль языка как древнейшего универсального средства общения. Именно поэтому лингвистика во взаимодействии с математикой, философией и информатикой пережила своё второе рождение и продолжает развиваться поныне. Тенденция настоящего продолжится и в будущем – «until the end of the world», как 15 лет назад предсказывал всё тот же В. Вендерс. Правда, неизвестно, когда произойдёт этот конец – но важно ли это сейчас, ведь будущее рано или поздно всё равно станет настоящим.

Приложение 1

Ferdinand de Saussure

The Swiss linguist Ferdinand de Saussure (1857-1913) is widely considered to be the founder of modern linguistics in its attempts to describe the structure of language rather than the history of particular languages and language forms. In fact, the method of Structuralism in linguistics and literary studies and a significant branch of Semiotics find their major starting point in his work at the turn of the twentieth century. It has even been argued that the complex of strategies and conceptions that has come to be called "poststructuralism" – the work of Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, and others – is suggested by Saussure"s work in linguistics and anagrammatic readings of late Latin poetry. If this is so, it can be seen most clearly in the way that Saussure"s work in linguistics and interpretation participates in transformations in modes of understanding across a wide range of intellectual disciplines from physics to literary modernism to psychoanalysis and philosophy in the early twentieth century. As Algirdas Julien Greimas and Joseph Courtés argue in Semiotics and Language: An Analytic Dictionary, under the heading "Interpretation," a new mode of interpretation arose in the early twentieth century which they identify with Saussurean linguistics, Husserlian Phenomenology, and Freudian psychoanalysis. In this mode, "interpretation is no longer a matter of attributing a given content to a form which would otherwise lack one; rather, it is a paraphrase which formulates in another fashion the equivalent content of a signifying element within a given semiotic system" (159). In this understanding of "interpretation," form and content are not distinct; rather, every "form" is, alternatively, a semantic "content" as well, a "signifying form," so that interpretation offers an analogical paraphrase of something that already signifies within some other system of signification.

Such a reinterpretation of form and understanding – which Claude Lévi-Strauss describes in one of his most programmatic articulations of the concept of structuralism, in "Structure and Form: Reflections on a Work by Vladimir Propp" – is implicit in Saussure"s posthumous Course in General Linguistics (1916, trans., 1959, 1983). In his lifetime, Saussure published relatively little, and his major work, the Course, was the transcription by his students of several courses in general linguistics he offered in 1907-11. In the Course Saussure called for the "scientific" study of language as opposed to the work in historical linguistics that had been done in the nineteenth century. That work is one of the great achievements of Western intellect: taking particular words as the building blocks of language, historical (or "diachronic") linguistics traced the origin and development of Western languages from a putative common language source, first an "Indo-European" language and then an earlier "proto-Indo-European" language.

It is precisely this study of the unique occurrences of words, with the concomitant assumption that the basic "unit" of language is, in fact, the positive existence of these "word-elements," that Saussure questioned. His work was an attempt to reduce the mass of facts about language, studied so minutely by historical linguistics, to a manageable number of propositions. The "comparative school" of nineteenth-century Philology, Saussure says in the Course, "did not succeed in setting up the true science of linguistics" because "it failed to seek out the nature of its object of study" ( 3). That "nature," he argues, is to be found not simply in the "elemental" words that a language comprises – the seeming "positive" facts (or "substances") of language – but in the formal relationships that give rise to those "substances."

Saussure"s systematic reexamination of language is based upon three assumptions. The first is that the scientific study of language needs to develop and study the system rather than the history of linguistic phenomena. For this reason, he distinguishes between the particular occurrences of language – its particular "speech-events," which he designates as parole – and the proper object of linguistics, the system (or "code") governing those events, which he designates as langue. Such a systematic study, moreover, calls for a "synchronic" conception of the relationship among the elements of language at a particular instant rather than the "diachronic" study of the development of language through history.

This assumption gave rise to what Roman Jakobson in 1929 came to designate as "structuralism," in which "any set of phenomena examined by contemporary science is treated not as a mechanical agglomeration but as a structural whole the mechanical conception of processes yields to the question of their function" ("Romantic" 711). In this passage Jakobson is articulating Saussure"s intention to define linguistics as a scientific system as opposed to a simple, "mechanical" accounting of historical accidents. Along with this, moreover, Jakobson is also describing the second foundational assumption in Saussurean – we can now call it "structural" – linguistics: that the basic elements of language can only be studied in relation to their functions rather than in relation to their causes. Instead of studying particular and unique events and entities (i.e., the history of particular Indo-European "words"), those events and entities have to be situated within a systemic framework in which they are related to other so-called events and entities. This is a radical reorientation in conceiving of experience and phenomena, one whose importance the philosopher Ernst Cassirer has compared to "the new science of Galileo which in the seventeenth century changed our whole concept of the physical world" (cited in Culler, Pursuit 24). This change, as Greimas and Courtés note, reconceives "interpretation" and thus reconceives explanation and understanding themselves. Instead of explanation"s being in terms of a phenomenon"s causes, so that, as an "effect," it is in some ways subordinate to its causes, explanation here consists in subordinating a phenomenon to its future-oriented "function" or "purpose." Explanation is no longer independent of human intentions or purposes (even though those intentions can be impersonal, communal, or, in Freudian terms, "unconscious").

In his linguistics Saussure accomplishes this transformation specifically in the redefinition of the linguistic "word," which he describes as the linguistic "sign" and defines in functionalist terms. The sign, he argues, is the union of "a concept and a sound image," which he called "signified and signifier " (66-67; Roy Harris"s 1983 translation offers the terms "signification" and "signal" ). The nature of their "combination" is "functional" in that neither the signified nor the signifier is the "cause" of the other; rather, "each its values from the other" (8). In this way, Saussure defines the basic element of language, the sign, relationally and makes the basic assumption of historical linguistics, namely, the identity of the elemental units of language and signification (i.e., "words"), subject to rigorous analysis. The reason we can recognize different occurrences of the word "tree" as the "same" word is not because the word is defined by inherent qualities – it is not a "mechanical agglomeration" of such qualities – but because it is defined as an element in a system, the "structural whole," of language.

Such a relational (or "diacritical") definition of an entity governs the conception of all the elements of language in structural linguistics. This is clearest in the most impressive achievement of Saussurean linguistics, the development of the concepts of the "phonemes" and "distinctive features" of language. Phonemes are the smallest articulated and signifying units of a language. They are not the sounds that occur in language but the "sound images" Saussure mentions, which are apprehended by speakers – phenomenally apprehended – as conveying meaning. (Thus, Elmar Holenstein describes Jakobson"s linguistics, which follows Saussure in important ways, as "phenomenological structuralism.") It is for this reason that the leading spokesperson for Prague School Structuralism, Jan Mukarovsky, noted in 1937 that "structure . . . is a phenomenological and not an empirical reality; it is not the work itself, but a set of functional relationships which are located in the consciousness of a collective (generation, milieu, etc.)" (cited in Galan 35). Similarly, Lévi-Strauss, the leading spokesperson for French structuralism, noted in 1960 that "structure has no distinct content; it is content itself, and the logical organization in which it is arrested is conceived as a property of the real" (167; see also Jakobson, Fundamentals 27-28).

Phonemes, then, the smallest perceptible elements of language, are not positive objects but a "phenomenological reality." In English, for instance, the phoneme /t/ can be pronounced in many different ways, but in all cases an English speaker will recognize it as functioning as a /t/. An aspirated t (i.e., a t pronounced with an h-like breath after it), a high-pitched or low-pitched t sound, an extended t sound, and so on, will all function in the same manner in distinguishing the meaning of "to" and "do" in English. Moreover, the differences between languages are such that phonological variations in one language can constitute distinct phonemes in another; thus, English distinguishes between /l/ and /r/, whereas other languages are so structured that these articulations are considered variations of the same phoneme (like the aspirated and unaspirated t in English). In every natural language, the vast number of possible words is a combination of a small number of phonemes. English, for instance, possesses less than 40 phonemes that combine to form over a million different words.

The phonemes of language are themselves systematically organized structures of features. In the 1920s and 1930s, following Saussure"s lead, Jakobson and N. S. Trubetzkoy isolated the "distinctive features" of phonemes. These features are based upon the physiological structure of the speech organs – tongue, teeth, vocal chords, and so on – that Saussure mentions in the Course and that Harris describes as "physiological phonetics" ( 39; Baskin"s earlier translation uses the term "phonology" [(1959) 38]) – and they combine in "bundles" of binary oppositions to form phonemes. For instance, in English the difference between /t/ and /d/ is the presence or absence of "voice" (the engagement of the vocal chords), and on the level of voicing these phonemes reciprocally define one another. In this way, phonology is a specific example of a general rule of language described by Saussure: In language there are only differences. Even more important: a difference generally implies positive terms between which the difference is set up; but in language there are only differences without positive terms. Whether we take the signified or the signifier, language has neither ideas nor sounds that existed before the linguistic system. ( 120)

In this framework, linguistic identities are determined not by inherent qualities but by systemic ("structural") relationships.

I have said that phonology "followed the lead" of Saussure, because even though his analysis of the physiology of language production "would nowadays," as Harris says, "be called "physical," as opposed to either "psychological" or "functional"" (Reading 49), nevertheless in the Course he articulated the direction and outlines of a functional analysis of language. Similarly, his only extended published work, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir on the primitive system of vowels in Indo-European languages), which appeared in 1878, was fully situated within the project of nineteenth-century historical linguistics. Nevertheless, within this work, as Jonathan Culler has argued, Saussure demonstrated "the fecundity of thinking of language as a system of purely relational items, even when working at the task of historical reconstruction" (Saussure 66). By analyzing the systematic structural relationships among phonemes to account for patterns of vowel alternation in existing Indo-European languages, Saussure suggested that in addition to several different phonemes /a/, there must have been another phoneme that could be described formally. "What makes Saussure"s work so very impressive," Culler concludes, "is the fact that nearly fifty years later, when cuneiform Hittite was discovered and deciphered, it was found to contain a phoneme, written h, which behaved as Saussure had predicted. He had discovered, by a purely formal analysis, what are now known as the laryngeals of Indo-European" (66).

This conception of the relational or diacritical determination of the elements of signification, which is both implicit and explicit in the Course, suggests a third assumption governing structural linguistics, what Saussure calls "the arbitrary nature of the sign." By this he means that the relationship between the signifier and signified in language is never necessary (or "motivated"): one could just as easily find the sound signifier arbre as the signifier tree to unite with the concept "tree". But more than this, it means that the signified is arbitrary as well: one could as easily define the concept "tree" by its woody quality (which would exclude palm trees) as by its size (which excludes the "low woody plants" we call shrubs). This should make clear that the numbering of assumptions I have been presenting does not represent an order of priority: each assumption – the systemic nature of signification (best apprehended by studying language "synchronically"), the relational or "diacritical" nature of the elements of signification, the arbitrary nature of signs – derives its value from the others.

That is, Saussurean linguistics understands the phenomena it studies in overarching relationships of combination and contrast in language. In this conception, language is both the process of articulating meaning (signification) and its product (communication), and these two functions of language are neither identical nor fully congruent (see Schleifer, "Deconstruction"). Here, we can see the alternation between form and content that Greimas and Courtés describe in modernist interpretation: language presents contrasts that formally define its units, and these units combine on succeeding levels to create the signifying content. Since the elements of language are arbitrary, moreover, neither contrast nor combination can be said to be basic. Thus, in language distinctive features combine to form contrasting phonemes on another level of apprehension, phonemes combine to form contrasting morphemes, morphemes combine to form words, words combine to form sentences, and so on. In each instance, the whole phoneme, or word, or sentence, and so on, is greater than the sum of its parts (just as water, H2O, in Saussure"s example [(1959) 103] is more than the mechanical agglomeration of hydrogen and oxygen).

The three assumptions of the Course in General Linguistics led Saussure to call for a new science of the twentieth century that would go beyond linguistic science to study "the life of signs within society." Saussure named this science "semiology (from Greek semeîon "sign")" (16). The "science" of semiotics, as it came to be practiced in Eastern Europe in the 1920s and 1930s and Paris in the 1950s and 1960s, widened the study of language and linguistic structures to literary artifacts constituted (or articulated) by those structures. Throughout the late part of his career, moreover, even while he was offering the courses in general linguistics, Saussure pursued his own "semiotic" analysis of late Latin poetry in an attempt to discover deliberately concealed anagrams of proper names. The method of study was in many ways the opposite of the functional rationalism of his linguistic analyses: it attempted, as Saussure mentions in one of the 99 notebooks in which he pursued this study, to examine systematically the problem of "chance," which "becomes the inevitable foundation of everything" (cited in Starobinski 101). Such a study, as Saussure himself says, focuses on "the material fact" of chance and meaning (cited 101), so that the "theme-word" whose anagram Saussure is seeking, as Jean Starobinski argues, "is, for the poet, an instrument, and not a vital germ of the poem. The poem is obliged to re-employ the phonic materials of the theme-word" (45). In this analysis, Starobinski says, "Saussure did not lose himself in a search for hidden meanings." Instead, his work seems to demonstrate a desire to evade all the problems arising from consciousness: "Since poetry is not only realized in words but is something born from words, it escapes the arbitrary control of consciousness to depend solely on a kind of linguistic legality" (121).

That is, Saussure"s attempt to discover proper names in late Latin poetry – what Tzvetan Todorov calls the reduction of a "word . . . to its signifier" (266) – emphasizes one of the elements that governed his linguistic analysis, the arbitrary nature of the sign. (It also emphasizes the formal nature of Saussurean linguistics – "Language," he asserts, "is a form and not a substance" – which effectively eliminates semantics as a major object of analysis.) As Todorov concludes, Saussure"s work appears remarkably homogeneous today in its refusal to accept symbolic phenomena . . . . In his research on anagrams, he pays attention only to the phenomena of repetition, not to those of evocation. . . . In his studies of the Nibelungen, he recognizes symbols only in order to attribute them to mistaken readings: since they are not intentional, symbols do not exist. Finally in his courses on general linguistics, he contemplates the existence of semiology, and thus of signs other than linguistic ones; but this affirmation is at once limited by the fact that semiology is devoted to a single type of sign: those which are arbitrary. (269-70)

If this is true, it is because Saussure could not conceive of "intention" without a subject; he could not quite escape the opposition between form and content his work did so much to call into question. Instead, he resorted to "linguistic legality." Situated between, on the one hand, nineteenth-century conceptions of history, subjectivity, and the mode of causal interpretation governed by these conceptions and, on the other hand, twentieth-century "structuralist" conceptions of what Lévi-Strauss called "Kantianism without a transcendental subject" (cited in Connerton 23) – conceptions that erase the opposition between form and content (or subject and object) and the hierarchy of foreground and background in full-blown structuralism, psychoanalysis, and even quantum mechanics – the work of Ferdinand de Saussure in linguistics and semiotics circumscribes a signal moment in the study of meaning and culture.

Ronald Schleifer

Приложение 2

Фердинанд де Соссюр (перевод)

Швейцарский языковед Фердинанд де Соссюр (1857-1913) считается основателем современной лингвистики – благодаря своим попыткам описать структуру языка, а не историю отдельных языков и словоформ. По большому счёту, основы структурных методов в лингвистике и литературоведении и, в значительной мере, семиотики были заложены в его работах в самом начале двадцатого века. Доказано, что методы и концепции так называемого "постструктурализма", развитые в работах Жака Деррида, Мишеля Фуко, Жака Лакана, Юлии Кристевой, Ролана Барта и других, восходят к лингвистическим трудам Соссюра и анаграмматическим прочтениям поздней римской поэзии. Следует заметить, что работы Соссюра по лингвистике и языковой интерпретации помогает связать широкий круг интеллектуальных дисциплин – от физики до литературных новшеств, психоанализа и философии начала двадцатого века. А. Дж. Греймас и Ж. Курте пишут в «Семиотике и языке»: «Аналитический словарь с заголовком «Интерпретация» как новый вид интерпретации появился в начале ХХ века вместе с лингвистикой Соссюра, феноменологией Гуссерля и психоанализом Фрейда. В таком случае, "интерпретация – это не приписывание данного содержания к форме, которая иначе испытала бы недостаток в том; скорее это - пересказ, который формулирует другим способом то же содержание значимого элемента в пределах данной семиотической системы" (159). В таком понимании «интерпретации», форма и содержание неразрывны; напротив, каждая форма наполнена семантическим значением («значимая форма»), поэтому интерпретация предлагает новый, аналогичный пересказ чего-то, значимого в другой знаковой системе.

Подобное понимание формы и содержания, представляемое Клодом Леви-Строссом в одной из программных работ структурализма, ("Структура и Форма: Размышления над трудами Владимира Проппа") – можно увидеть в посмертно вышедшей книге Соссюра «Курс общей лингвистики» (1916, пер., 1959, 1983). При жизни Соссюр мало публиковался, «Курс» – его основная работа – был собран по конспектам студентов, посещавших его лекции по общей лингвистике в 1907-11 гг. В «Курсе» Соссюр призывал к «научному» исследованию языка, противопоставляя его сравнительно-историческому языкознанию девятнадцатого века. Эту работу можно считать одним из величайших достижений западной мысли: беря за основу отдельные слова как структурные элементы языка, историческое (или «диахроническое») языкознание доказывало происхождение и развитие западноевропейских языков от общего, индоевропейского языка– и более раннего праиндоевропейского.

Это - точно это исследование уникальных возникновений слов, с сопутствующим предположением, что основная "единица" языка, фактически, положительное существование этих "элементов слова", что Соссюр подверг сомнению. Его работа была попыткой сократить множество фактов о языке, вскользь изученных сравнительной лингвистикой, до небольшого числа теорем. Сравнительная филологическая школа XIX века, пишет Соссюр, «не преуспела в создании настоящей школы лингвистики», так как «она не поняла сущности объекта изучения» ( 3). Эта «сущность», утверждает он, заключается не только в отдельных словах – «позитивных субстанциях» языка – но и в формальных связях, помогающих этим субстанциям существовать.

Соссюровская «проверка» языка основана на трёх предположениях. Первое: научное понимание языка основано не на историческом, а на структурном феномене. Поэтому он различал отдельные явления языка –«события речи», которые он определяет как «parole» – и надлежащий, по его мнению, объект изучения лингвистики, систему (код, структуру), управляющую этими событиями («langue»). Подобное систематическое изучение, кроме того, требует «синхронной» концепции отношений между элементами языка в данный момент, а не «диахронического» исследования развития языка через его историю.

Эта гипотеза стала предтечей того, что Роман Якобсон в 1929 назовёт «структурализмом» – теории, где "любой набор явлений, исследованный современной наукой, рассматривается не как механическое скопление, а как структурное целое, в котором конструктивная составляющая соотносится с функцией" ("Romantic" 711). В этом отрывке Якобсон сформулировал соссюровскую идею определения языка как структуры в противовес «машинальному» перечислению исторических событий. Кроме того, Якобсон развивает и другое соссюровское предположение, ставшее предтечей стркутурной лингвистики: базовые элементы языка должны изучаться в связи не столько со своими причинами, сколько со своими функциями. Отдельные явления и события (скажем, история происхождения отдельных индоевропейских слов) должны изучаться не сами по себе, а в системе, в котрой они соотнесены с подобными же составляющими. Это был радикальный поворот в сопоставлении явлений с окружающей действительностью, значимость которого философ Эрнст Кассирер сравнил с «наукой Галилея, перевернувшей в семнадцатом веке представления о материальном мире". Такой поворот, как замечают Греймас и Курте, меняет представление о «интерпретации», а, седовательно, и сами объяснения. Явления стали трактоваться не относительно причин их возникновения, а относительно того эффекта, который они могут оакзать в настоящем и будущем. Толкование перестало быть независимым от намерений человека(несмотря на то, что намерения могут быть безличными, «бессознательными» во фрейдистском понимании этого слова).

В своей лингвистике Соссюр особенно показывает этот поворот в изменении понятия слова в лингвистике, которое он определяет как знак и описывает с точки зрения его функций. Знак для него –соединение звучания и смысла, «обозначаемого и обозначения » (66-67; в английском переводе 1983 года авторства Роя Харриса – «signification» и "signal" ). Природа этого соединения – «функциональная» (ни тот, ни другой элемент не могут существовать друг без друга); более того, "одно заимствует качества у другого" (8). Таким образом Соссюр определяет основной структурный элемент языка – знак – и делает основой исторического языкознания идентичность знаков словам, что требует особо строгого анализа. Поэтому мы можем понять разные значения, скажем, одного и того же слова «дерево» – не потому что слово представляет собой лишь набор определённых качеств, а потому что оно определено как элемент в знаковой системе, в «структурном целом», в языке.

Подобное относительное («диакритическое») понятие единства лежит в основе представления о всех элементах языка в структурной лингвистике. Это особенно ясно видно в наиболее оригинальной находкесоссюровского языкознания, в развитии концепции «фонем» и «отличительных особенностей» языка. Фонемы – самые мелкие из произносимых и значимых языковых единиц. Они являются не только звуками, встречающимися в языке, но «звуковыми образами», замечает Соссюр, которые воспринимаются носителями языка как обладающие значением. (Следует заметить, что Элмар Холенштейн называет лингвистику Якобсона, по основным положениям продолжающего идеи и концепции Соссюра, «феноменологическим структурализмом»). Именно поэтому ведущий докладчик пражской школы структурализма, Ян Мукаровский, заметил в 1937 году, что «структура. . . не эмпирическое, а феноменологическое понятие; это не сам результат, а набор значимых отношений коллективного сознания (поколения, окружающих и т.д.)». Похожую мысль высказал в 1960 году Леви-Стросс, лидер французского структурализма: «У структуры нет определённого содержания; она сама по себе содержательна, и логическая конструкция, в которую она заключена, представляет собой отпечаток реальности».

В свою очередь, фонемы, как самые мелкие языковые элементы, приемлемые для восприятия, представляют собой отдельную цельную «феноменологическую реальность». Например, в английском языке звук «т» может произноситься по-разному, но во всех случаях человек, владеющий английским, будет воспринимать его как «т». Произнесённый с придыханием, с высоким или низким подъёмом языка, долгий звук «т» и т.п будет одинаково различать значение слов «to» и «do». Более того – различия между языками таковы, что разновидности одного звука в одном языке могут соответствовать разным фонемам в другом; например «л» и «р» в английском различны, в то время как в других языках это разновидности одной фонемы (подобно английскому «т», произнесённому с придыханием и без). Обширный словарный запас любого естественного языка представляет собой набор сочетаний гораздо меньшего количества фонем. В английском, например, для произнесения и написания около миллиона слов используется всего 40 фонем.

Звуки языка представляют собой системно организованный набор черт. В 1920е –1930е, вслед за Соссюром, Якобсон и Н.С.Трубецкой выделили «отличительные черты» фонем. Эти черты основаны на строении органов речи – языка, зубов, голосовых связок – Соссюр замечает это в «Курсе общей лингвистики», а Харрис называет «физиологической фонетикой» (в более раннем переводе Баскина используется термин «фонология») – они соединяются в «узлы» дург против друга, чтобы издавать звуки. Скажем, in в английском разница между «т» и «д» заключается в наличии или отсутствии «голоса» (напряжении голосовых связок), и в уровне голоса, отличающем одну фонему от другой. Таким образом, фонологию можно считать примером общего языкового праивла, описанного Соссюром: «В языке есть только различия». Более важно даже не это: различие обычно подразумевает точные условия, между которыми оно и находится; но в языке существуют только различия без точных условий. Рассматриваем ли мы «обозначение» или «обозначаемое» – в языке не существует ни понятий, ни звуков, которые существовали бы до того, как развилась языковая система.

В подобной структуре, языковые аналогии определены не с помощью изначально присущих им качеств, а с помощью системных («структурных») отношений.

Я уже упомянул, что фонология в своём развитии опиралась на идеи Соссюра. Несмотря на то, что его анализ языковой физиологии в наше время по словам Харриса, «был бы назван «физическим», в противовес «психологическому» или «функциональному», в «Курсе» он отчётливо сформулировал направление и основные принципы функционального анализа языка. Его единственная изданная при жизни работа, «Mémoire sur le système primitif des voyelles dans les langues indo-européennes» (Записки о первоначальной системе гласных в индоевропейских языках), изданная в 1878, полностью находилась в русле сравнительно-исторического языкознания XIX века. Тем не менее этим трудом, как говорит Джонатан Каллер, Соссюр показал «плодотворность представления о языке как о системе взаимосвязанных явлений, даже при его исторической реконструкции». Анализируя взаимосвязи между фонемами, объясняя чередования гласных в современных языках индоевропейской группы, Соссюр предположил, что кроме нескольких разных звуков «а», должны быть и другие фонемы, описываемые формально. «Что производит особое впечатление в труде Соссюра, – делает вывод Каллер, – то, что почти 50 лет спустя, при открытии и расшифровке хеттской клинописи, была найдена фонема, на письме обозначаемая «h», которая вела себя так, как предсказывал Соссюр. С помощью формального анализа он открыл то, что сейчас известно как гортанный звук в индоевропейских языках.

В концепция относительного (диакритического) определения знаков, как явно выраженной, так и подразумеваемой в «Курсе», существует и третье ключевое предположение структурной лингвистики, названное Соссюром «произвольной природой знака». Под этим подразумевается, что отношение между звучанием и значением в языке ничем не мотивировано: с одинаковой лёгкостью можно соединить слово «arbre» и слово «tree» с понятием «дерево». Более того, это значит, что звучание тоже произвольно: можно определить понятие «дерево» по наличию у него коры (кроме пальм) и по размеру (кроме «низких древесных растений» - кустарников). Из этого должно быть понятно, что все представляемые мною предположения не делятся на более и менее важные: каждое из них – системный характер знаков (более всего понятный при «синхронном» изучении языка), их относительная (диакритическая) сущность, произвольная природа знаков – исходит из остальных.

Таким образом, в соссюровском языкознании изучаемый феномен понимается как свод сопоставлений и противопоставлений языка. Язык – это и выражение значения слов (обозначение), и их результат (общение) – и эти две функции никогда не совпадают (см. «Деконструкцию языка» Шлейфера). Мы можем заметить чередование формы и содержания, которое Греймас и Курте описывают в новейшем варианте интерпретации: языковые контрасты определяют его структурные единицы, и эти единицы взаимодействуют на сменяющих друг друга уровнях, чтобы создать определённое значимое содержание. Так как элементы языка случайны, ни контраст, ни сочетание не могут быть основой. Значит, в языке отличительные признаки формируют фонетический контраст на другом уровне понимания, фонемы соединяются в контрастные морфемы, морфемы – в слова, слова – в предложения и т.д. В любом случае, целая фонема, слово, предложение и т.д. представляет собой нечто большее, чем сумма составляющих (так же как вода, в соссюровском примере – больше, чем сочетание водорода и кислорода).

Три предположения «Курса общей лингвистики» привели Соссюра к идее новой науки двадцатого века, отдельно от лингвистики изучающей «жизнь знаков в обществе». Соссюр назвал эту науку семиологией (от греческого «semeîon» - знак). «Наука» семиотики, развивавшаяся в Восточной Европе в 1920е –1930е и в Париже в 1950е and 1960е, расширила изучение языка и лингвистических структур до литературных находок, составленных (или сформулированных) с помощью этих структур. Кроме того, на закате своей карьеры, параллельно своему курсу общей лингвистики, Соссюр занялся «семиотическим» анализом поздней римской поэзии, пытаясь открыть умышленно составленные анаграммы имён собственных. Этот метод был во многом противоположен рационализму в его лингвистическом анализе: он был попыткой, как пишет Соссюр в одной из 99 записных книжек, изучить в системе проблему «вероятности», которая «становится основой всего». Такое исследование, как утверждает сам Соссюр, помогает сосредоточиться на «вещественной стороне» вероятности; «ключевое слово», анаграмму которого ищет Соссюр, как утверждает Жан Старобинский, «инструмент для поэта, а не источник жизни стихотворения. Стихотворение служит для того, чтобы поменять местами звуки ключевого слова». По словам Старобинского, в этом анализе «Соссюр не углубляется в поиски скрытых смыслов». Напротив, в его работах заметно желание избежать вопросов, связанных с сознанием: «так как поэзия выражается не только в словах, но и в том, что порождают эти слова, она выходит из-под контроля сознания и зависит только от законов языка».

Попытка Соссюра изучить имена собственные в поздней римской поэзии (Цветан Тодоров назвал это сокращением «слова... лишь до его написания») подчёркивает одну из составляющих его лингвистического анализа – произвольную природу знаков, а также формальную сущность соссюровской лингвистики («Язык, – утверждает он, «суть форма, а не явление»), что исключает возможность анализа смысла. Тодоров делает вывод, что в наши дни труды Соссюра выглядят на редкость последовательными в нежелании изучать символы [явления, имеющие чётко определённое значение]. . . . Исследуя анаграммы, Соссюр обращает внимание только на повторение, но не на предшествующие варианты. . . . Изучая «Песнь о Нибелунгах», он определяет символы только для того, чтобы присвоить их ошибочным чтениям: если они неумышленны, символов не существует. В конце концов, в своих трудах по общей лингвистике он делает предположение о существовании семиологии, описывающей не только лингвистические знаки; но это предположение ограничивается тем, что семилогоия может описывать только случайные, произвольные знаки.

Раз это действительно так, то только потому, что не мог представить «намерение» без предмета; он не мог до конца преодолеть пропасть между формой и содержанием – в его трудах это превращалось в вопрос. Вместо этого он обращался к «языковой законности». Находясь между, с одной стороны, концепциями девятнадцатого века, основанными на истории и субъективных догадках, и методах случайной интерпретации, основанных на этих концепциях, и, с другой стороны, структуралистскими концепциями, которые Леви-Стросс назвал «кантианством без трансцендентного действующего лица» – стирающими противостояние между формой и содержанием (субъектом и объектом), значением и происхождением в структурализме, психоанализе и даже квантовой механике – труды Ферлинанда де Соссюра по лингвистике и семиотике обозначают поворотный момент в изучении значений в языке и культуре.

Рональд Шлейфер

Литература

1. Адмони В.Г. Основы теории грамматики / В.Г. Адмони; АН СССР.-М.: Наука, 1964.-104с.

4. Арнольд И.В. Семантическая структура слова в современном английском языке и методика её исследования. /И.В. Арнольд– Л.: Просвещение, 1966. – 187 с.

6.Башлыков А.М. Система автоматизированного перевода. / А.М. Башлыков, А.А. Соколов. – М.: ООО «ФИМА», 1997. – 20 с.

7.Бодуэн де Куртенэ: Теоретическое насле дие и современность: Тезисы докладов международной научной конференции / Ред.И.Г. Кондратьева. – Казань: КГУ, 1995. – 224 с.

8. Гладкий А.В., Элементы математической лигвистики. / . Гладкий А.В., Мельчук И.А. –М., 1969. – 198 с.

9. Головин, Б.Н. Язык и статистика. /Б.Н. Головин –М., 1971. – 210 с.

10. Звегинцев, В.А. Теоретическая и прикладная лингвистика. / В.А. Звегинцев –М., 1969. – 143 с.

11. Касевич, В.Б. Семантика. Синтаксис. Морфология. // В.Б. Касевич –М., 1988. – 292 c.

12. Лекомцев Ю.К. Введение в формальный язык лингвистики/ Ю.К. Лекомцев. – М.: Наука, 1983, 204 с., ил.

13. Лингвистическое наследие Бодуэна де Куртенэ на исходе ХХ столетия: Тезисы докладов международской научно-практическтй конференции 15-18 марта 2000 года. – Красноярск, 2000. – 125 с.

Матвеева Г.Г. Скрытые грамматические значения и идентификация социального лица («портрета») говорящего/ Г.Г. Матвеева. – Ростов, 1999. – 174 с.

14. Мельчук, И.A. Опыт постpоения лингвистических моделей "Смысл <--> Текст"./ И.А. Мельчук. – М., 1974. – 145 c.

15. Нелюбин Л.Л. Перевод и прикладная лингвистика/Л.Л. Нелюбин. – М. : Высшая школа, 1983. – 207 с.

16. О точных методах исследования языка: о так называемой «математической лингвистике»/ О.С. Ахманова, И. А. Мельчук, Е.В. Падучева и др. – М., 1961. – 162 с.

17. Пиотровский Л.Г. Математическая лингвистика: Учебное пособие/ Л.Г. Пиотровский, К.Б. Бектаев, А.А. Пиотровская. – М.: Высшая школа, 1977. – 160 с.

18.Он же. Текст, машина, человек. – Л., 1975. – 213 с.

19. Он же. Прикладное языкознание / Под ред. А.С Герда. – Л., 1986. – 176 с.

20. Ревзин, И.И. Модели языка. М., 1963. Ревзин, И.И. Современная структурная лингвистика. Проблемы и методы. М., 1977. – 239 с.

21. Ревзин, И.И., Розенцвейг, В.Ю. Основы общего и машинного перевода/Ревзин И.И., Розенцвейг, В.Ю. – М., 1964. – 401 с.

22. Слюсарёва Н.А. Теория Ф.де Соссюра в свете современной лингвистики/ Н.А. Слюсарева. – М.:Наука, 1975. – 156 с.

23. Сова, Л.З. Аналитическая лингвистика/ Л.З. Сова – М., 1970. – 192 с.

24. Соссюр Ф. де. Заметки по общей лингвистике/ Ф. де Соссюр; Пер. с фр. – М.: Прогресс, 2000. – 187 с.

25. Он же. Курс общей лингвистики/ Пер. с фр. – Екатеринбург, 1999. –426 с.

26. Статистика речи и автоматический анализ текста / Отв. ред. Р.Г. Пиотровский. Л., 1980. – 223 с.

27. Столл, P. Множествa. Логикa. Aксиомaтические теоpии./ Р. Столл; Пер. с англ. – М., 1968. – 180 с.

28. Теньер, Л. Основы структурного синтаксиса. М., 1988.

29. Убин И.И. Автоматизация переводческой деятельности в СССР/ И.И. Убин, Л.Ю. Коростелёв, Б.Д. Тихомиров. – М., 1989. – 28 с.

30. Фоp, P. , Кофмaн, A., Дени-Пaпен, М. Совpеменнaя мaтемaтикa. М., 1966.

31. Шенк, Р. Обработка концептуальной информации. М., 1980.

32. Шихaнович, Ю.A. Введение в современную мaтемaтику (нaчaльные понятия). М., 1965

33. Щерба Л.В. Русские гласные в качественном и количественном отношении/ Л.В. Щерба – Л.: Наука, 1983. – 159 с.

34. Абдулла-заде Ф. Гражданин мира// Огонёк – 1996. – №5. – С.13

35. В.А. Успенский. Предварение для читателей «Нового литературного обозрения» к семиотическим посланиям Андрея Николаевича Колмогорова. – Новое литературное обозрение. –1997. – № 24. – С. 18-23

36. Перловский Л. Сознание, язык и культура. – Знание – сила. –2000. №4 – С. 20-33

37. Фрумкина Р.М. О нас – наискосок. //Русский Журнал. – 2000. – №1. – С. 12

38. Фитиалов, С.Я. О моделировании синтаксиса в структурной лингвистике // Проблемы структурной лингвистики. М., 1962.

39. Он же. Об эквивалентности грамматики НС и грамматики зависимостей // Проблемы структурной лингвистики. М., 1967.

40. Хомский, Н. Логические основы лингвистической теории // Новое в лингвистике. Вып. 4. М., 1965

41. Schleifer R. Ferdinand de Saussure// press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. press. jhu.ru

46. ru.wikipedia.org