Машинно обучение

Машинното обучение(англ. machine learning, ML) е клас методи за изкуствен интелект, чиято характерна черта не е директното решаване на проблем, а обучението в процеса на прилагане на решения на много подобни проблеми. За изграждането на такива методи се използват средствата на математическата статистика, числените методи, методите за оптимизация, теорията на вероятностите, теорията на графите, различни техники за работа с данни в цифров вид.

Има два вида обучение:

  1. Прецедентното обучениеилииндуктивното обучениесе основава на откриване на емпирични модели в данните.
  2. Дедуктивното обучениевключва формализиране на знанията на експертите и тяхното прехвърляне към компютър под формата на база от знания.

Дедуктивното обучение обикновено се приписва на областта на експертните системи, така че терминитемашинно обучениеиобучение чрез прецедентимогат да се считат за синоними.

Много индуктивни методи на обучение са разработени като алтернатива на класическите статистически подходи. Много методи са тясно свързани с извличането на информация, извличането на данни.

Съдържание

Има набор отобекти(ситуации) и набор от възможниотговори(отговори, реакции). Има известна зависимост между отговорите и обектите, но тя е неизвестна. Известен е само краен набор отпрецеденти- двойки "обект, отговор", наречениобучителен набор. Въз основа на тези данни е необходимо да се възстанови имплицитната зависимост, тоест да се изгради алгоритъм, способен да произведе достатъчно точен класифициращ отговор за всеки възможен входен обект. Тази зависимост не е задължително изразена аналитично и тук невронните мрежи прилагат принципа емпирично.генерирано решение. Важна характеристика в този случай е способността на системата за обучение да обобщава, тоест да реагира адекватно на данни, които излизат извън границите на съществуващата извадка за обучение. За измерване на точността на отговорите е въведен оцененфункционал на качеството.

Тази формулировка е обобщение на класическите задачи за апроксимация на функция. В класическите задачи за приближение обектите са реални числа или вектори. В реални приложни задачи входните данни за обектите могат да бъдат непълни, неточни, нечислови, разнородни. Тези функции водят до голямо разнообразие от методи за машинно обучение.

Разделът на машинното обучение, от една страна, се формира в резултат на разделянето на науката за невронните мрежи на методи за обучение на мрежи и видове топологии на тяхната архитектура, от друга страна, той поглъща методите на математическата статистика. Методите за машинно обучение по-долу се основават на случая на използване на невронни мрежи, въпреки че има и други методи, които използват концепцията за обучителна извадка - например дискриминантен анализ, който оперира с обобщената дисперсия и ковариация на наблюдаваните статистики, или байесови класификатори. Основни типове невронни мрежи, като персептрон и многослоен персептрон (както и техните модификации), могат да се обучават както с учител, така и без учител, с подсилване и самоорганизация. Но някои невронни мрежи и повечето статистически методи могат да бъдат приписани само на един от методите на обучение. Следователно, ако трябва да класифицирате методите за машинно обучение в зависимост от метода на обучение, би било неправилно да приписвате невронни мрежи на определен тип, би било по-правилно да въведете алгоритми за обучение за невронни мрежи.

  • Наблюдавано обучение - за всеки случай на употреба се изисква двойка „ситуациярешение":
  1. Изкуствена невронна мрежа
  1. Дълбоко обучение
  • Метод за коригиране на грешки
  • Метод на обратно разпространение
  • Поддържаща векторна машина
    • Неконтролирано обучение - за всеки случай на употреба се посочва само „ситуация“, изисква се групиране на обекти в клъстери, като се използват данни за двойно сходство на обекти и / или намаляване на измерението на данните:
    1. Алфа армираща система
    2. Гама система за подсилване
    3. Метод на най-близкия съсед
    • Подсилващо обучение – за всеки случай на употреба има двойка „ситуация, решение“:
    1. Генетичен алгоритъм.
    • Активното учене е различно по това, че алгоритъмът за учене има способността самостоятелно да присвоява следната изследвана ситуация, на която ще стане известен правилният отговор:
    • Обучение с частично участие на учител(англ. semi-supervised learning) - за някои прецеденти се задава двойка „ситуация, необходимо решение“, а за част - само „ситуация“
    • Трансдуктивно обучение - обучение с частично участие на учителя, когато се предполага, че прогнозата се прави само за прецеденти от тестовата извадка
    • Многозадачно обучение(англ. multi-task learning) - едновременно обучение на група взаимосвързани задачи, за всяка от които са зададени собствени двойки "ситуация, необходимо решение"
    • Многократно обучение(англ. multiple-instance learning) - обучение, когато случаите могат да бъдат комбинирани в групи, всяка от които има „ситуация“ за всички случаи, но само за един от тях (и не се знае кой) има двойка „ситуация, необходимо решение“
    • Бустиране(на английски boosting - подобрение) е процедура за последователно изгражданесъстав на алгоритми за машинно обучение, когато всеки следващ алгоритъм се стреми да компенсира недостатъците на състава на всички предишни алгоритми.
    • Байесова мрежа