Разговорни системи и машинно обучение

Лаборатория по невронни мрежи и дълбоко обучение MIPT

Михаил Бурцев, началник лаборатория:

- Лабораторията е млада, засега сме само петима души в екипа, работата е неорана нива, но сме сериозни. Основната посока беше разработването и изследването на системи за диалог - онлайн консултанти, асистенти, които компетентно отговарят на всички потребителски въпроси. Много компании все още имат такива услуги, но или те не работят добре, постоянно дават грешки, или от другата страна на монитора седи жив човек, който не може да бъде онлайн 24/7 и освен това трябва да плаща. Искаме да разработим алгоритъм, който ще ни позволи да създадем роботи, способни на пълноценен разговор. Такъв робот ще може да ви купи самолетен билет или да ви посъветва по всеки неотложен проблем за няколко минути. Сега това ниво на системи не съществува.

Невронни мрежи и изкуствен интелект

Идеята за невронни мрежи се ражда в средата на 20 век в САЩ с появата на първите компютри. Неврофизиолозите, които изучаваха теоретичните аспекти на работата на мозъка, вярваха, че организирането на работата на компютъра по образ и подобие на работата на човешкия мозък ще позволи в близко бъдеще да се създаде първият изкуствен интелект.

Разликата между изкуствения интелект и всички алгоритми от предишно поколение е, че обучената невронна мрежа не действа по даден път, а самостоятелно търси начини за най-ефективно постигане на целта. Работата на един компютърен "неврон" изглежда така: за обучение на входа на програмата се подават обекти, принадлежащи към два типа - A и B - и носещи някаква числова стойност. Програмата, въз основа на данните в обучителната извадка, разбира кои диапазони от тази стойност съответстват на обекти A и кои -B, и впоследствие може да ги различи независимо. При реални проблеми системата трябва да прави разлика между много типове, всеки от които на свой ред може да има десетки свойства. За решаването им е необходима по-сложна структура от слоеве неврони, сериозна изчислителна мощност и голям брой тренировъчни тестове. 21-ви век бележи началото на ера, в която тези технологии вече могат да се прилагат за ежедневни задачи.

Михаил Бурцев, ръководител на лабораторията по невронни мрежи и дълбоко обучение, Московски физико-технологичен институт

Михаил Бурцев, началник лаборатория:

- Концепцията на невронните мрежи е доста проста: даваме на машината голямо количество текст и тя запомня как думите се съчетават. Въз основа на тази информация тя може да възпроизвежда такива текстове - за това машината не трябва да знае правилата за синтаксис, склонение и спрежение. Вече има невронни мрежи, които, след като са се научили от произведенията на Пушкин, се опитват да пишат в неговия стил. Това е друга характеристика на невронните мрежи: те научават „стила“, който им е даден да научат. Ако дадете Wikipedia като материал, програмата ще е пълна с термини и ще използва предимно журналистически стил. Тъй като нашата лаборатория работи върху създаването на системи за въпроси и отговори, ние използваме готови диалози, за да обучим мрежата. В един от експериментите те използваха субтитри от филми - дадоха на нашата мрежа цяла сага за вампири за изучаване. След като анализира този масив от данни, невронната мрежа вече може да поддържа разговора в момента.

Диалози на лаборантите с невронна мрежа

Екип: днес и утре

Лабораторията си сътрудничи с големи изследователски центрове на базата на Националния изследователски ядрен университет MEPhI и Института Курчатов. Също и в нейната работаУчастват и чуждестранни експерти в областта на машинното обучение и невроинформатиката, например Сергей Плис от The Mind Research Network. Освен това редовно се провеждат събития за популяризиране на дейността на лабораторията и търсене на млади таланти. Спечелването на хакатон или успешното завършване на курс ви дава добър шанс да влезете в лабораторията.

Валентин Малих, лаборант:

— Пътят ми до лабораторията беше много труден. Преди четири години практически не засягах темата за машинното обучение. След това се зае с компютърната лингвистика и тръгваме. Смених работата си няколко пъти: опитах се в роботиката, занимавах се с разработването на софтуер, свързан с компютърното зрение, там се запознах с машинното обучение и исках да направя сериозно изследване. През цялото време, в което работих, успях да отида на няколко хакатона, организирани от лабораторията - може би най-интересното нещо, което ми се случи през този период. Тогава дойдох при момчетата и казах, че искам да работя за тях. Взеха ме.

Хакатоните, въпреки името си, нямат нищо общо със софтуерното хакване (англ.hack). Това са отборни състезания по програмиране, в които участниците се борят няколко дни, а понякога и седмици, за да решат един конкретен проблем. Темата на хакатона се обявява предварително, обикновено участват няколкостотин души. Такива събития се организират не само от институции, но и от големи компании, които търсят талантливи специалисти. На базата на Phystech лабораторията за невронни мрежи и дълбоко обучение вече организира два хакатона - участниците слушаха лекции по системи за въпроси и отговори и диалог и писаха код за една седмица.

Членовехакатони се състезават в решаването на проблеми

Владислав Беляев, лаборант:

— Тази и миналата година бяхме домакини на хакатони за машинно обучение. Имаше много заявки, не само от България и ОНД, но и от Европа, от Щатите. По време на хакатона лекции изнесоха учени от Оксфорд и Станфорд, Google DeepMind и OpenAI и български колеги, разбира се. Сега подготвяме курс по невронни мрежи, ще ви разкажем всичко от самото начало до края: от биологичната концепция и основните модели в програмирането до действителното приложение и специфичната реализация.

Михаил Бурцев, началник лаборатория:

- Трябва да работя много - май вече не помня какво е свободно време. Няма шега, на практика няма време за почивка: през последните шест месеца успяхме да излезем на барбекю веднъж с група. Въпреки че в известен смисъл работата може да бъде и почивка. На хакатони и семинари е възможно да общувате в по-малко формална обстановка с колеги и да създавате нови запознанства. Все още не сме успели да започнем традициите да прекарваме време заедно след работа - твърде млади сме. През лятото планираме да излезем сред природата с цялата лаборатория, да наемем вила и да решаваме най-трудните и интересни задачи заедно в продължение на две седмици - ще организираме свой личен мини-хакатон. Нека видим колко ефективен може да бъде този подход. Може би това ще стане първата ни добра традиция.

Отляво надясно: Валентин Малих, Владислав Беляев, Алексей Озерин, Дмитрий Хуснутдинов

Лабораторията ще се разширява и вече търси нови служители. Най-лесният начин да получите място е да вземете двумесечен стаж, който се избира въз основа на резултатите от интервю. Предпоставка за преминаване на интервюто е изпълнението на част от задачитеКурс за дълбоко обучение. По време на стажа има възможност за участие в изпълнението на платени проекти по поръчка. Финансирането на лабораторията все още не е установено, но според персонала на лабораторията този проблем ще бъде решен в близко бъдеще. „Да стигнете до нас сега означава да получите шанс да станете „баща-основател“ на лабораторията в най-обещаващата област на информационните технологии“, казва Михаил Бурцев.

Изображения и снимки, предоставени от лабораторията за невронни мрежи и задълбочено обучение на MIPT. Фотограф: Евгений Пелевин.