Компютърна лингвистика на уебсайта на Игор Гаршин

Компютърна лингвистика : от автоматична обработка на текст до машинно разбиране.

Алгоритъм, алгоритъм (отalgorithmi, algorismus, първоначално - латинска транслитерация на името на математикаal-Khwarizmi) - метод (програма) за решаване на изчислителни и други задачи, точно предписващ кои процедури трябва да се извършат и в каква последователност, за да се получи резултат, еднозначно определен от изходните данни. Алгоритъмът е едно от основните понятия на математиката и кибернетиката. В компютрите езиците за програмиране се използват за описание на алгоритъм.

Основните направления накомпютърната лингвистика (англ. computational linguistics, също - Nature Language Processing, NL-Processing, NLP), според Wikipedia:

  • Машиненпревод.
  • Автоматичноразпознаване на символи(английски OCR).
  • Автоматичноразпознаване на реч(ASR).
  • Автоматично извличане на данни (English Data Mining) [с технияинтелектуален анализ, т.е.откриване на знанияв бази данни].
  • Автоматичнорезюмеанотация] на текстове.
  • Изграждане на системи зауправление на знания.
  • Създаване наелектронни речници, тезауруси, онтологии[компютърна лексикография].
  • Корпусна лингвистика, създаване и използване наелектронни корпуситекстове.

И много други, например:

Най-сложните от гледна точка на алгоритми области намашинната лингвистика изискват използването на езици с изкуствен интелект катоПролог, чийто обхват може да бъде:

  • Автоматиченпревод от един език на друг;
  • създаване на интерфейси на естествен език за съществуващи системи;
  • проектиране на динамични релационни бази данни;
  • създаване на експертни системи и техните обвивки.

Очевиднокомпютърната лингвистика се превръща в основна част от технологиитеизкуствен интелект.

На тази страница се публикува информация за информационните технологии в лингвистиката - направления, подходи, теории, програми, алгоритми.

Обучение на компютърни лингвисти

Професията [компютърен] лингвист е много търсена (от сайта на HSE):

Къде се обучават компютърни лингвисти и като цяло добри теоретични лингвисти:

  1. Москва, Академия на Министерството на външните работи
  2. Москва (с филиал в Нижни Новгород),Висше училище по икономика, Филологически факултет на HSE (магистърска програма "Компютърна лингвистика")
  3. Москва, MGIMO
  4. Москва, Филологически факултет на Московския държавен университет. Ломоносов
  5. Московски лингвистичен университет (MSLU на име Морис Торез)
  6. Москва,MIPT, Факултет по иновации и високи технологии, Катедра "Разпознаване на изображения и обработка на текст" (направления "Интелигентни системи" и "Методи на машинно обучение").
  7. Санкт Петербург, Иняз РСПУ им. А. И. Херцен
  8. Санкт Петербург,SPbSU, Факултет по хуманитарни науки, Катедра "Информационни системи в изкуствата и хуманитарните науки" (програма "Инженерство на хуманитарното знание").
  9. Новосибирски лингвистичен университет (NGLU на името на Добролюбов)
  10. Пятигорски лингвистичен институт

Конференции по компютърна лингвистика

Портали за машинна лингвистика и колекции от лингвистични програми

  • Лингвистичен алгоритъм. С каталогЕзикови програми и ресурси в мрежата Версия 1.6 (2002) (налично е и по-четливо копие): 1. Програмиза анализ и езикова обработка на текстове. 2. Психолингвистични програми. 3.Програми за конвертиране на текст. 4.Текстови генератории "говорещи" програми. 5. Системи за обработка на естествен език (NL-Processing). 6. Колекции от ресурси. 7. Речници итезауруси.
  • Справочно-информационен портал "Български език" МО "ЕЛЕКС", 2000 г. Ресурсът съдържа много полезна информация. Включва онлайн речници на българския език: 1) Пълен електронен правописен речник на българския език, изд. В. В. Лопатин. 2) Речник на произношението и ударението в съвременния български език. 3) Нов речник на българския език. Обяснителна деривация. 4) Ударение на българската дума. Речник на народните имена. 5) Ударение на българската дума. Речник на собствените имена.
  • Езикови прегледи на софтуера Оценка на лингвистичния софтуер [Eng]

Програмни каталози и индекси в компютърната лингвистика