Компютърна лингвистика на уебсайта на Игор Гаршин
Компютърна лингвистика : от автоматична обработка на текст до машинно разбиране.
Алгоритъм, алгоритъм (отalgorithmi, algorismus, първоначално - латинска транслитерация на името на математикаal-Khwarizmi) - метод (програма) за решаване на изчислителни и други задачи, точно предписващ кои процедури трябва да се извършат и в каква последователност, за да се получи резултат, еднозначно определен от изходните данни. Алгоритъмът е едно от основните понятия на математиката и кибернетиката. В компютрите езиците за програмиране се използват за описание на алгоритъм.
Основните направления накомпютърната лингвистика (англ. computational linguistics, също - Nature Language Processing, NL-Processing, NLP), според Wikipedia:
- Машиненпревод.
- Автоматичноразпознаване на символи(английски OCR).
- Автоматичноразпознаване на реч(ASR).
- Автоматично извличане на данни (English Data Mining) [с технияинтелектуален анализ, т.е.откриване на знанияв бази данни].
- Автоматичнорезюме[ианотация] на текстове.
- Изграждане на системи зауправление на знания.
- Създаване наелектронни речници, тезауруси, онтологии[компютърна лексикография].
- Корпусна лингвистика, създаване и използване наелектронни корпуситекстове.
И много други, например:
Най-сложните от гледна точка на алгоритми области намашинната лингвистика изискват използването на езици с изкуствен интелект катоПролог, чийто обхват може да бъде:
- Автоматиченпревод от един език на друг;
- създаване на интерфейси на естествен език за съществуващи системи;
- проектиране на динамични релационни бази данни;
- създаване на експертни системи и техните обвивки.
Очевиднокомпютърната лингвистика се превръща в основна част от технологиитеизкуствен интелект.
На тази страница се публикува информация за информационните технологии в лингвистиката - направления, подходи, теории, програми, алгоритми.
Обучение на компютърни лингвисти
Професията [компютърен] лингвист е много търсена (от сайта на HSE):
Къде се обучават компютърни лингвисти и като цяло добри теоретични лингвисти:
- Москва, Академия на Министерството на външните работи
- Москва (с филиал в Нижни Новгород),Висше училище по икономика, Филологически факултет на HSE (магистърска програма "Компютърна лингвистика")
- Москва, MGIMO
- Москва, Филологически факултет на Московския държавен университет. Ломоносов
- Московски лингвистичен университет (MSLU на име Морис Торез)
- Москва,MIPT, Факултет по иновации и високи технологии, Катедра "Разпознаване на изображения и обработка на текст" (направления "Интелигентни системи" и "Методи на машинно обучение").
- Санкт Петербург, Иняз РСПУ им. А. И. Херцен
- Санкт Петербург,SPbSU, Факултет по хуманитарни науки, Катедра "Информационни системи в изкуствата и хуманитарните науки" (програма "Инженерство на хуманитарното знание").
- Новосибирски лингвистичен университет (NGLU на името на Добролюбов)
- Пятигорски лингвистичен институт
Конференции по компютърна лингвистика
Портали за машинна лингвистика и колекции от лингвистични програми
- Лингвистичен алгоритъм. С каталогЕзикови програми и ресурси в мрежата Версия 1.6 (2002) (налично е и по-четливо копие): 1. Програмиза анализ и езикова обработка на текстове. 2. Психолингвистични програми. 3.Програми за конвертиране на текст. 4.Текстови генератории "говорещи" програми. 5. Системи за обработка на естествен език (NL-Processing). 6. Колекции от ресурси. 7. Речници итезауруси.
- Справочно-информационен портал "Български език" МО "ЕЛЕКС", 2000 г. Ресурсът съдържа много полезна информация. Включва онлайн речници на българския език: 1) Пълен електронен правописен речник на българския език, изд. В. В. Лопатин. 2) Речник на произношението и ударението в съвременния български език. 3) Нов речник на българския език. Обяснителна деривация. 4) Ударение на българската дума. Речник на народните имена. 5) Ударение на българската дума. Речник на собствените имена.
- Езикови прегледи на софтуера Оценка на лингвистичния софтуер [Eng]