Найважливішим напрямком комп'ютерної лінгвістики є технологія. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна

Новосьолова Ірина

Чому не всі машинні переклади досконалі? Від чого залежить якість перекладу? Чи достатньо автору знань, щоб використовувати та доповнювати існуючі комп'ютерні словники? Відповіді на ці запитання авторка прагнула подати у своїй роботі. Звіт на тему - у прикріпленому файлі, продукт проектної діяльності- на шкільному порталі

Завантажити:

Попередній перегляд:

Відкрита

Міжнародна

науково-дослідна

конференція

старшокласників та студентів

«Освіта. Наука. Професія»

Секція «Лінгвістика іншомовна»

« Комп'ютерна лінгвістика»

Виконала Новосьолова Ірина

МОУ гімназія №39 «Класична»

10 «Б» клас

Наукові керівники:

Чигриньова Тетяна Дмитрівна,

вчитель англійської мовивищої категорії

Осипова Світлана Леонідівна,

вчитель інформатики вищої категорії

м. Відрадний

2011

  1. Англомовні слова в ІКТ

Дивіться на сайті

  1. Мій експеримент

Одне із завдань – провести експеримент, який укладений у порівнянні можливостей різних комп'ютерних лінгвістичних словників, за більш точно наближеним перекладом з англійської на російську.

Були протестовані такі сайти:

  1. http://translate.eu/
  2. http://translate.google.ru/#ru
  3. http://www.langinfo.ru/index.php?div=6
  4. http://www2.worldlingo.com/ru/products_services/worldlingo_translator.html

Для чистоти експерименту, я вибирала пропозиції з різним ступенемскладності стилістичного перекладу Фрази для введення:

1. A New report says today's teenagers are more selfish than they were 20 years ago

(Нова доповідь каже, що сучасні підліткибільш егоїстичні, ніж вони були 20 років тому)

2. She believes video games and theІнтернет є величезні умови для цього вдосконаленого самопочуття.

(Вона вірить, що відео ігри та Інтернет є найбільш значущими причинамидля цієї зростаючої егоїстичності)

3. They want to be better than others

(Вони хочуть бути кращими, ніж інші)

4. She found the big increase started від year 2000, який є коли violent video games became real popular.

(Вона знайшла велике зростання, що розпочався з 2000 року, коли жорстокі відеоігри стали дійсно популярними)

Переклавши ці пропозиції на сайтах онлайн-перекладачів, я отримала такі результати:

  1. http://translate.eu/

КУРСОВА РОБОТА

з дисципліни «Інформатика»

на тему: «Комп'ютерна лінгвістика»


ВСТУП

1. Місце та роль комп'ютерної лінгвістики у лінгвістичних дослідженнях

2. Сучасні інтерфейси комп'ютерної лінгвістики

ВИСНОВОК

ЛІТЕРАТУРА


Вступ

У житті сучасного суспільства важливу рольвідіграють автоматизовані інформаційні технології. З часом їх значення безперервно зростає. Але розвиток інформаційних технологійвідбувається дуже нерівномірно: якщо сучасний рівень обчислювальної технікиі засобів зв'язку вражає уяву, то в галузі смислової обробки інформації успіхи значно скромніші. Ці успіхи залежать передусім від досягнень у вивченні процесів людського мислення, процесів мовного спілкуванняміж людьми та від уміння моделювати ці процеси на ЕОМ.

Коли йдетьсяпро створення перспективних інформаційних технологій, проблеми автоматичної обробки текстової інформації, представленої природними мовами, виступають на передній план. Це визначається тим, що мислення людини тісно пов'язане з її мовою. Понад те, природна мова є інструментом мислення. Він є також універсальним засобомспілкування для людей – засобом сприйняття, накопичення, зберігання, обробки та передачі. Проблемами використання природної мовиу системах автоматичного оброблення інформації займається наука комп'ютерна лінгвістика. Ця наука виникла порівняно недавно – на рубежі п'ятдесятих та шістдесятих років минулого сторіччя. За минулі півстоліття в галузі комп'ютерної лінгвістики було отримано значні наукові та практичні результати: були створені системи машинного перекладу текстів з одних мов на інші, системи автоматизованого пошуку інформації в текстах, системи автоматичного аналізута синтезу усного мовленнята багато інших. Ця роботаприсвячена побудові оптимального комп'ютерного інтерфейсу засобами комп'ютерної лінгвістики під час проведення лінгвістичних досліджень.


У сучасному світіпід час проведення різних лінгвістичних досліджень дедалі активніше використовується комп'ютерна лінгвістика.

Комп'ютерна лінгвістика – це область знань, пов'язана з вирішенням завдань автоматичного оброблення інформації, представленої природною мовою. Центральними науковими проблемамиКомп'ютерної лінгвістики є проблема моделювання процесу розуміння сенсу текстів (переходу від тексту до формалізованого уявлення його сенсу) та проблема синтезу мови (переходу від формалізованого уявлення сенсу до текстів природною мовою). Ці проблеми виникають при вирішенні низки прикладних завданьі, зокрема, завдань автоматичного виявлення та виправлення помилок при введенні текстів в ЕОМ, автоматичного аналізу та синтезу мовлення, автоматичного перекладутекстів з одних мов на інші, спілкування з ЕОМ природною мовою, автоматичної класифікації та індексування текстових документів, їх автоматичне реферування, пошук документів у повнотекстових базах даних.

Лінгвістичні засоби, що створюються та використовуються в комп'ютерній лінгвістиці, можна умовно розділити на дві частини: декларативну та процедурну. До декларативної частини належать словники одиниць мови та мови, тексти та різного родуграматичні таблиці, до процедурної частини – засоби маніпулювання одиницями мови та мови, текстами та граматичними таблицями. Комп'ютерний інтерфейс відноситься до процедурної частини комп'ютерної лінгвістики.

Успіх у вирішенні прикладних завдань комп'ютерної лінгвістики залежить, насамперед, від повноти та точності представлення у пам'яті ЕОМ декларативних засобів та від якості процедурних засобів. На сьогоднішній день необхідний рівень вирішення цих завдань поки що не досягнуто, хоча роботи в галузі комп'ютерної лінгвістики ведуться у всіх розвинених країнсвіту (Росія, США, Англія, Франція, Німеччина, Японія та ін.).

Тим не менш, можна відзначити серйозні наукові та практичні досягненняв галузі комп'ютерної лінгвістики. Так у ряді країн (Росія, США, Японія, та ін.) побудовано експериментальні та промислові системи машинного перекладу текстів з одних мов на інші, побудовано ряд експериментальних системспілкування з ЕОМ природною мовою, ведуться роботи зі створення термінологічних банків даних, тезаурусів, двомовних та багатомовних машинних словників (Росія, США, Німеччина, Франція та ін.), будуються системи автоматичного аналізу та синтезу мовлення (Росія, США, Японія та ін), ведуться дослідження у галузі побудови моделей природних мов.

p align="justify"> Важливою методологічною проблемою прикладної комп'ютерної лінгвістики є правильна оцінка необхідного співвідношення між декларативною та процедурною компонентами систем автоматичної обробки текстової інформації. Чому віддати перевагу: потужним обчислювальним процедурам, що спираються на відносно невеликі словникові системи з багатою граматичною та семантичною інформацією, або потужною декларативною компонентою за відносно простих комп'ютерні інтерфейси? Більшість вчених вважають, що другий шлях кращий. Він швидше призведе до досягнення практичних цілей, тому що при цьому менше зустрінеться глухих кутів і важко подоланих перешкод і тут можна буде в ширших масштабах використовувати ЕОМ для автоматизації досліджень і розробок.

Необхідність мобілізації зусиль насамперед на розвитку декларативної компоненти систем автоматичної обробки текстової інформації підтверджується півстолітнім досвідом розвитку комп'ютерної лінгвістики. Адже тут, незважаючи на безперечні успіхи цієї науки, захоплення алгоритмічними процедурами не дало очікуваного успіху. Настало навіть деяке розчарування у можливостях процедурних засобів.

У світлі вищевикладеного, є перспективним такий шлях розвитку комп'ютерної лінгвістики, коли основні зусилля будуть спрямовані на створення потужних словників одиниць мови та мови, вивчення їх семантико-синтаксичної структури та на створення базових процедур морфологічного, семантико-синтаксичного та концептуального аналізу та синтезу текстів. Це дозволить надалі вирішувати широкий спектрприкладних завдань.

Перед комп'ютерною лінгвістикою стоять передусім завдання лінгвістичного забезпечення процесів збирання, накопичення, обробки та пошуку інформації. Найбільш важливими є:

1. Автоматизація складання та лінгвістичної обробки машинних словників;

2. Автоматизація процесів виявлення та виправлення помилок під час введення текстів в ЕОМ;

3. Автоматичне індексування документів та інформаційних запитів;

4. Автоматична класифікація та реферування документів;

5. Лінгвістичне забезпечення процесів пошуку інформації в одномовних та багатомовних базах даних;

6. Машинний переклад текстів з одних мов на інші;

7. Побудова лінгвістичних процесорів, які забезпечують спілкування користувачів із автоматизованими інтелектуальними інформаційними системами(зокрема, з експертними системами) природною мовою, або мовою, близькою до природної;

8. Вилучення фактографічної інформації з неформалізованих текстів.

Детально зупинимося на проблемах, що найбільше стосуються теми дослідження.

У практичної діяльності інформаційних центрівІснує необхідність вирішення завдання автоматизованого виявлення та виправлення помилок у текстах при їх введенні в ЕОМ. Ця комплексне завданняможе бути умовно розчленована на три завдання – завдання орфографічного, синтаксичного та семантичного контролю текстів. Перша їх може бути вирішена з допомогою процедури морфологічного аналізу, використовує досить потужний еталонний машинний словник основ слів. У процесі орфографічного контролю слова тексту піддаються морфологічному аналізу, і якщо основи ототожнюються з основами еталонного словника, всі вони вважаються правильними; якщо не ототожнюються, то вони у супроводі мікроконтексту видаються на перегляд людині. Людина виявляє та виправляє спотворені слова, а відповідна програмна системавносить ці виправлення до тексту, що коректується.

Завдання синтаксичного контролю текстів з метою виявлення у них помилок суттєво складніше завданняїх орфографічного контролю. По-перше, тому, що вона включає до свого складу та завдання орфографічного контролю як свою обов'язкову компоненту, а по-друге, тому, що проблема синтаксичного аналізунеформалізованих текстів у повному обсязіще не вирішено. Проте частковий синтаксичний контроль текстів цілком можливий. Тут можна йти двома шляхами: або складати досить представницькі машинні словники еталонних синтаксичних структур та порівнювати з ними синтаксичні структури аналізованого тексту; або розробляти складну системуправил перевірки граматичної узгодженості елементів тексту Перший шлях нам представляється перспективнішим, хоча він, звичайно, не виключає і можливості застосування елементів другого шляху. Синтаксична структуратекстів має описуватися у термінах граматичних класів слів (точніше – у вигляді послідовностей наборів граматичної інформаціїдо слів).

Завдання семантичного контролю текстів з метою виявлення у них смислових помилокслід зарахувати до класу завдань штучного інтелекту. У повному обсязі вона може бути вирішена лише на основі моделювання процесів людського мислення. При цьому, мабуть, доведеться створювати потужні енциклопедичні бази знань та програмні засоби маніпулювання знаннями. Тим не менш, для обмежених предметних областейі для формалізованої інформації це завдання цілком можна розв'язати. Вона має ставитися і вирішуватись як завдання семантико-синтаксичного контролю текстів.

КОМП'ЮТЕРНА ЛІНГВІСТИКА (калька з англійської computational linguistics), один із напрямків прикладної лінгвістики, в якому для дослідження мови та моделювання функціонування мови в тих чи інших умовах, ситуаціях та проблемних сферах розробляються та використовуються комп'ютерні програми, комп'ютерні технології організації та обробки даних. З іншого боку, це сфера застосування комп'ютерних моделеймови у лінгвістиці та суміжних з нею дисциплінах. Як особливе науковий напрямкомп'ютерна лінгвістика оформилася в європейських дослідженняху 1960-х роках. Оскільки англійське прикметник computational може перекладатися і як «обчислювальний», у літературі зустрічається також термін «обчислювальна лінгвістика», однак у вітчизняній науцівін набуває вужчого значення, що наближається до поняття «квантитативна лінгвістика».

Часто до комп'ютерної лінгвістики відносять термін «квантитативна лінгвістика», який характеризує міждисциплінарний напрямок у прикладних дослідженнях, де як основний інструмент вивчення мови та мови використовуються кількісні чи статистичні методи аналізу. Іноді квантитативна (або кількісна) лінгвістика протиставляється комбінаторній лінгвістиці. В останній домінуючу роль займає «кількісний» математичний апарат- теорія множин, математична логіка, теорія алгоритмів і т. д. З теоретичної точки зору використання статистичних методіву мовознавстві дозволяє доповнити структурну модель мови імовірнісним компонентом, т. е. створити теоретичну структурно-імовірнісну модель, що має значний пояснювальний потенціал. У прикладної областіквантитативна лінгвістика представлена, насамперед, використанням фрагментів цієї моделі, що використовуються для лінгвістичного моніторингу функціонування мови, дешифрування кодованого тексту, авторизації/атрибуції тексту тощо.

Термін «комп'ютерна лінгвістика» і проблематика цього напряму часто пов'язуються з моделюванням спілкування, і перш за все - із забезпеченням взаємодії людини з ЕОМ природною або обмеженою природною мовою (для цього створюються спеціальні системиобробки природної мови), а також з теорією та практикою інформаційно-пошукових систем (ІПС). Забезпечення спілкування людини з ЕОМ природною мовою іноді позначається терміном «обробка природної мови» (переклад з англійської терміна Natural Language Processing). Цей напрямок комп'ютерної лінгвістики виник наприкінці 1960-х років за кордоном і розвивався в рамках науково-технологічної дисципліни, що називається штучним інтелектом (роботи Р. Шенка, М. Лебовиця, Т. Винограда та ін.). За змістом словосполучення «обробка природної мови» має охоплювати всі області, у яких комп'ютери використовуються обробки мовних даних. Насправді, проте, закріпилося вужче розуміння терміна - розробка методів, технологій і конкретних систем, які забезпечують спілкування людини з ЕОМ природним чи обмеженою природною мовою.

До комп'ютерної лінгвістики певною мірою можуть бути віднесені роботи в галузі створення гіпертекстових систем, що розглядаються як особливий спосіборганізації тексту і навіть як важливо новий виглядтексту, протиставлений за багатьма своїми властивостями звичайному тексту, сформованому в гутенбергівській традиції друкарства (див. Гутенберг).

До компетенції комп'ютерної лінгвістики і автоматичний переклад.

У рамках комп'ютерної лінгвістики виник і порівняно новий напрямок, що активно розвивається з 1980-90-х років - корпусна лінгвістика, де розробляються загальні принципипобудови лінгвістичних корпусів даних (зокрема корпусів текстів) з використанням сучасних комп'ютерних технологій. Корпуси текстів – це колекції спеціально підібраних текстів книг, журналів, газет тощо, перенесені на машинні носії та призначені для автоматичної обробки. Один з перших корпусів текстів був створений для американського варіантаанглійської мови у Браунівському університеті (так званий Браунівський корпус) у 1962-63 під керівництвом У. Френсіса. У Росії з початку 2000-х років в Інституті російської мови імені В. В. Виноградова РАН розробляється Національний корпус російської мови, що складається з представницької вибірки російськомовних текстів обсягом близько 100 мільйонів слововжитків. Крім власне конструювання корпусів даних, корпусна лінгвістика займається створенням комп'ютерних інструментів ( комп'ютерних програм), призначених для отримання різноманітної інформації з текстових корпусів. З погляду користувача, до корпусів текстів пред'являються вимоги представництва (репрезентативності), повноти та економічності.

Комп'ютерна лінгвістика активно розвивається і в Росії, і за кордоном. Потік публікацій у цій галузі дуже великий. Крім тематичних збірок, у США з 1984 року щоквартально виходить журнал «Computational Linguistics» («Комп'ютерна лінгвістика»). Велику організаційну та наукову роботу проводить Асоціація з комп'ютерної лінгвістики (The Association for Computational Linguistics), яка має регіональні структуриу всьому світі (зокрема, європейське відділення). Кожні два роки відбуваються міжнародні конференції КОЛІНТ (у 2008 році конференція проходила в Манчестері). Основні напрями комп'ютерної лінгвістики обговорюються також на щорічній міжнародній конференції «Діалог», що організується Російським НДІ штучного інтелекту, філологічним факультетом МДУ, Яндексом та іншими організаціями. Відповідна проблематика широко представлена ​​також на міжнародних конференціяхпо штучному інтелектурізних рівнів.

Літ.: Звегінцев В. А. Теоретична та прикладна лінгвістика. М., 1968; Піотровський Р. Р., Бектаєв К. Би., Піотровська А. А. Математична лінгвістика. М., 1977; Городецький Б. Ю. Актуальні проблемиприкладної лінгвістики // Нове у зарубіжній лінгвістиці. М., 1983. Вип. 12; Кібрик А. Є. Прикладна лінгвістика // Кібрик А. Є. Нариси за загальним та прикладним питанняммовознавства. М., 1992; Kennedy G. An introduction to corpus linguistics. L., 1998; Bolshakov I.А., Gelbukh А. Computational linguistics: models, resources, applications. Мех., 2004; Національний корпус російської: 2003-2005. М., 2005; Баранов А. Н. Введення у прикладну лінгвістику. 3-тє вид. М., 2007; Комп'ютерна лінгвістика та інтелектуальні технології. М., 2008. Вип. 7.

На філфаку Вищої школиекономіки запускається нова магістерська програма, присвячена комп'ютерній лінгвістиці: тут чекають абітурієнтів із гуманітарним та математичним базовою освітоюі всіх, кому цікаво вирішувати завдання в одній із найперспективніших галузей науки. Її керівник Анастасія Бонч-Осмоловська розповіла «Теоріям та практикам», що таке комп'ютерна лінгвістика, чому роботи не замінять людину і чого навчатимуть у магістратурі ВШЕ з комп'ютерної лінгвістики.

Ця програма - чи не єдина такого роду в Росії. А де ви самі вчилися?

Я навчалася у МДУ на відділенні теоретичної та прикладної лінгвістики філологічного факультету. Потрапила туди не відразу, спочатку вступила на російське відділення, але потім серйозно захопилася лінгвістикою, і мене привабила атмосфера, яка й досі залишається на кафедрі. Найголовніше там - гарний контактміж викладачами та студентами та їх взаємна зацікавленість.

Коли в мене народилися діти і треба було заробляти життя, я пішла у сферу комерційної лінгвістики. У 2005 році було не дуже зрозуміло, що являє собою ця сфера діяльності як така. Я працювала в різних лінгвістичних фірмах: починала з невеликої фірми за сайтом Public.ru - це така бібліотека ЗМІ, там я почала займатися лінгвістичними технологіями. Потім рік працювала у Роснанотеху, де була ідея зробити аналітичний портал, щоб дані на ньому автоматично структурувалися. Потім я керувала лінгвістичним відділом у компанії «Авікомп» - це вже серйозне виробництво в галузі комп'ютерної лінгвістики та семантичних технологій. Паралельно я вела курс з комп'ютерної лінгвістики в МДУ і намагалася зробити його сучаснішим.

Два ресурси для лінгвіста: - сайт, створений лінгвістами для наукових та прикладних досліджень, пов'язаних із російською мовою. Це модель російської, представлена ​​з допомогою величезного масиву текстів різних жанрів і періодів. Тексти забезпечені лінгвістичною розміткою, за допомогою якої можна отримувати інформацію про частотність тих чи інших мовних явищ. Ворднет – величезна лексична база англійської мови, головна ідеяВорднета – зв'язати в одну велику мережу не слова, але їх смисли. Ворднет можна завантажувати та використовувати для власних проектів.

А чим займається комп'ютерна лінгвістика?

Це дуже міждисциплінарна область. Тут найголовніше розуміти, що діється в електронному світіі хто допоможе тобі зробити конкретні речі.

Нас оточує дуже велика кількістьдигітальної інформації, існує безліч бізнес-проектів, успіх яких залежить від обробки інформації, ці проекти можуть належати до сфери маркетингу, політики, економіки та чого завгодно. І дуже важливо вміти поводитися з цією інформацією ефективно - головне не лише швидкість обробки інформації, але й легкість, з якою ти можеш, відсіявши шум, дістати ті дані, які тобі потрібні, і створити цільну картину.

Раніше з комп'ютерною лінгвістикою були пов'язані якісь глобальні ідеї, наприклад: люди думали, що машинний переклад замінить на людський, замість людей працюватимуть роботи. Але зараз це здається утопією, і машинний переклад використовується в пошукових системах швидкого пошукунезнайомою мовою. Тобто зараз лінгвістика рідко займається абстрактними завданнями - переважно якимись маленькими штучками, які можна вставити у великий продукт і на цьому заробити.

Одна з великих завдань сучасної лінгвістики- Семантичний web, коли пошук відбувається не просто за збігом слів, а за змістом, а всі сайти так чи інакше розмічені по семантиці. Це може бути корисним, наприклад, для поліцейських або медичних звітів, які пишуться щодня. Аналіз внутрішніх зв'язківдає багато потрібної інформації, а читати і рахувати це вручну неймовірно довго.

У двох словах, у нас є тисяча текстів, треба розкласти їх за купками, подати кожен текст у вигляді структури та отримати таблицю, з якою вже можна працювати. Це називається обробка неструктурованої інформації. З іншого боку, комп'ютерна лінгвістика займається, наприклад, створенням штучних текстів. Є така компанія, яка вигадала механізм генерації текстів на теми, на які людині писати нудно: зміна цін на нерухомість, прогноз погоди, звіт про футбольні матчі. Замовляти людині ці тексти набагато дорожче, до того ж комп'ютерні текстина такі теми написані зв'язковою людською мовою.

Розробками в галузі пошуку неструктурованої інформації в Росії активно займається "Яндекс", "Лабораторія Касперського" наймає дослідні групи, які вивчають машинне навчання. Хтось на ринку намагається вигадати щось нове в галузі комп'ютерної лінгвістики?

**Книги з комп'ютерної лінгвістики:**

Daniel Jurafsky, Speech and Language Processing

Крістофер Маннінг, Прабхакар Рагхаван, Хайнріх Шютце, "Введення в інформаційний пошук"

Яків Тестелець, «Вступ до загального синтаксису»

Більшість лінгвістичних розробок є власністю великих компанійпрактично нічого не можна знайти в відкритому доступі. Це гальмує розвиток галузі, ми не маємо вільного лінгвістичного ринку, коробкових рішень.

Крім того, не вистачає повноцінних інформаційних ресурсів. Є такий проект, як Національний корпус російської мови. Це один з найкращих національних корпусів у світі, який стрімко розвивається та відкриває неймовірні можливості з наукових та прикладним дослідженням. Різниця приблизно як у біології - до ДНК-досліджень та після.

Але багато ресурсів не існують російською мовою. Так, немає аналога такому чудовому англомовному ресурсу, як Framenet – це така концептуальна мережа, де формально представлені всі можливі зв'язкиякогось конкретного слова з іншими словами. Наприклад, є слово "літати" - хто може літати, куди, з яким приводом вживається це слово, з якими словами воно поєднується і таке інше. Цей ресурс допомагає зв'язати мову з реальним життям, тобто простежити, як поводиться конкретне словона рівні морфології та синтаксису. Це дуже корисно.

У компанії Avicomp зараз розробляється плагін для пошуку близьких за змістом статей. Тобто, якщо вас зацікавила якась стаття, ви можете оперативно подивитися історію сюжету: коли тема виникла, що писалося і коли був пік інтересу до цієї проблеми. Наприклад, за допомогою цього плагіна можна буде, відштовхнувшись від статті, присвяченої подіям у Сирії, дуже швидко побачити, як протягом останнього рокурозвивалися події.

Як буде побудовано процес навчання в магістратурі?

Навчання у Вишці організовано за окремими модулями - як у західних університетах. Студенти будуть поділені на маленькі команди, міні-стартапи - тобто на виході ми маємо отримати декілька готових проектів. Ми хочемо отримати реальні продукти, які потім відкриємо людям та залишимо у відкритому доступі.

Крім безпосередніх керівників проектів студентів, ми хочемо знайти їм кураторів з-поміж них потенційних роботодавців- з того ж «Яндекса», наприклад, які теж гратимуть у цю гру та давати студентам якісь поради.

Я сподіваюся, що до магістратури прийдуть люди з самих різних областей: програмісти, лінгвісти, соціологи, маркетологи. У нас буде кілька адаптаційних курсів з лінгвістики, математики та програмування. Потім у нас буде два серйозні курси з лінгвістики, і вони будуть пов'язані з найактуальнішими лінгвістичними теоріямиМи хочемо, щоб наші випускники могли читати і розуміти сучасні лінгвістичні статті. Те саме і з математикою. У нас буде курс, який називатиметься «Математичні основи комп'ютерної лінгвістики», де викладатимуться ті розділи математики, на яких ґрунтується сучасна комп'ютерна лінгвістика.

Для того, щоб вступити до магістратури, потрібно здати вступний іспитз мови та пройти конкурс портфоліо.

Крім основних курсів будуть лінійки предметів на вибір Ми запланували кілька циклів - два з них орієнтовані на глибше вивчення окремих тем, до яких відносяться, наприклад, машинний переклад і корпусна лінгвістика, і, а один, навпаки, пов'язаний з суміжними областями: такими як, соціальні мережі, машинне навчання або Digital Humanities – курс, який, як ми сподіваємося, будемо прочитаний англійською мовою.