Приложение на байесовия подход при измерване на аналитични данни като фактор при формирането на процеси
Заглавие: Икономика и управление
Библиографско описание:
Байесовата методология се различава от другите подходи по това, че дори преди да получи данни, изследователят определя нивото на своята увереност във възможните модели и впоследствие го представя под формата на определени вероятности. След като изследователят получи данните, използвайки теоремата на Bayes, той намира друг набор от вероятности, които са ревизираните степени на доверие във възможните модели, като се вземе предвид новата информация, получена от изследователя.
Ключови думи: метод, анализ, прогнозиране, оценки, икономика, икономически процеси
Байесовата методология се различава от другите подходи по това, че още преди да получи данните, изследователят определя нивото на своето доверие към възможните модели и впоследствие го представя под формата на определени вероятности. След като изследователят е получил данните, използвайки теоремата на Байс, той намира друг набор от вероятности, които са преразгледани степени на доверие във възможните модели, като се вземе предвид новата информация, получена от изследователя.
Ключови думи: метод, анализ, прогнозиране, оценка, икономика, икономически процеси
Байесовите методи са разработени в резултат на многобройни опити на учените да идентифицират проблеми в статистическия анализ на поведението на различни процеси и да намерят тяхното решение чрез прилагане на основата на байесовската методология - теоремата на Байес. Използването на тази теорема има редица предпоставки, основната от които е наличието на определени връзки между вероятностите на явления, които имат различниестеството и спецификацията на всяко явление на желаното ниво [1].
Байесовата методология се различава от другите подходи по това, че дори преди да получи данни, изследователят определя нивото на своята увереност във възможните модели и впоследствие го представя под формата на определени вероятности. След като изследователят получи данните, използвайки теоремата на Bayes, той намира друг набор от вероятности, които са ревизираните степени на доверие във възможните модели, като се вземе предвид новата информация, получена от изследователя.
Едно от основните предимства на байесовия подход е използването на всяка начална (априорна) информация относно параметрите на модела. Такава информация се изразява като предварителна вероятност или функция на плътност на вероятността. Първоначалните вероятности след това се „ревизират“ с помощта на примерните данни, които се съпоставят с последващото разпределение на оценките на параметрите или променливите на модела.
Необходимо е да се подчертаят следните характеристики на байесовия подход:
- абсолютно всички параметри и количества се считат за случайни, а именно точната стойност на параметрите е неизвестна на изследователя, от което следва, че параметрите са случайни от гледна точка на незнанието на изследователя;
‒ Байесовите методи се използват дори при нулев размер на извадката. В този случай стойностите на предишното и задното разпределение са равни;
- за оценка на неизвестни променливи се използват постериорни разпределения, т.е. да се намери решение на проблема за оценка на определено количество означава да се определи задното разпределение на това количество;
‒ основният инструмент на подхода е байесовата формула (теорема), както и правила като правило за сумиране (ако A1, …, Ak са взаимно изключващи се събития, тогава едно от тяхвинаги се случва) и правило за продукт (всяка плътност на фугата винаги може да бъде факторизирана).
Наред с горните предимства на байесовската методология е необходимо да се подчертаят нейните недостатъци. От 1930г Байесовската парадигма често е остро критикувана и практически не се използва поради следните причини:
‒ Байесовите методи предполагат, че предварителното разпределение е известно преди началото на наблюденията и не предлагат конструктивни начини за избора му;
‒ Вземането на решение с помощта на байесови методи в нетривиални случаи изисква огромни изчислителни разходи, свързани с численото интегриране в многомерни пространства;
‒ Фишър показа оптималността на метода на максималната вероятност и следователно безсмислието да се опитваш да измислиш нещо по-добро.
Днес (от 90-те години на миналия век) учените са свидетели на възраждане на байесовската методология, чиито методи се оказаха полезни при намирането на решения на множество и доста сериозни въпроси и проблеми в областта на машинното обучение и статистиката.
Теорема на Байс: формула, приложение
Формулата (теорема) на Байс е една от основните теореми на теорията на вероятностите и ви позволява да установите вероятността от определено събитие А, ако се случи друго статистически зависимо събитие Б. С други думи, прилагането на теоремата на Байс позволява на изследователя най-точно да преизчисли вероятността, като вземе предвид както информацията, която е получил по-рано, така и нови данни от по-късни наблюдения. Теоремата на Байес може да бъде извлечена от основните аксиоми на теорията на вероятностите, а именно от условната вероятност. Формулата на Байс има определени особености, основната от които еФактът, че използването на теоремата на практика изисква значително количество изчисления и изчисления, в резултат на което оценките на байесовската парадигма намериха активно приложение едва в периода след революцията, настъпила в областта на мрежовите и компютърните технологии.
Преди формулирането на теоремата на Байес, вероятностите, използвани в нея, бяха обект на множество вероятностни интерпретации. Един от тях установява факта, че извеждането на формулата зависи пряко от използването на специален подход за статистически анализ. Когато се прилага байесовската интерпретация на вероятността, теоремата на Байс показва как степента на лично доверие може да се промени значително след настъпването на определен брой събития. Това е основният извод на Бейс, който стана основен за байесовската статистика. Въпреки това, теоремата е намерила своето приложение не само в байесовия анализ, но се използва активно и в голям брой други изчисления.
Същността на байесовската парадигма е, че когато изследователят открие нова информация, тя предоставя основа за измерване на вероятностите, които се дължат на свързани събития. Формулата на Бейс има следния вид [1]:
,
къде са вероятностите на хипотезите преди експеримента (априорни вероятности);
— условни вероятности за настъпване на събитие А при избора на i-тата хипотеза; — условна вероятност на i-тата хипотеза след настъпването на събитие А (апостериорна или следекспериментална вероятност).
С помощта на тази теорема е възможно да се промени стойността на вероятността въз основа на по-късна получена информация. Интерпретацията на байесовия подход е следната: нека има n хипотези H1, H2, …, Hn за възможните му състояния до началото на реорганизацията на даден обект. Въз основа на исторически данникъм тях могат да се присвоят априорни вероятности P(H1), P(H2), …, P(Hn). След това се провежда експеримент (реализира се проект), в резултат на което може да се случи или да не се случи събитие А. Условните вероятности за настъпване на събитие А се определят експериментално, когато i-тата хипотеза е избрана като честота на наблюдение на събитие А. При условие на настъпване на събитие А, вярата във валидността на всяка хипотеза се преоценява чрез замяна на вероятностите с вероятности.
Трябва да се отбележи, че при липса на статистически данни за априорни вероятности от наблюдения или хипотези за настъпването на събитие А, байесовската методология не може да бъде приложена, тъй като такава „формализация“ губи своя физически смисъл [6].
Байесова стратегия за оценка на надеждността на заключенията в експертни системи
Байесовската стратегия за оценка на изводите се използва все повече в науката, икономиката и индустрията. За подробно изследване на байесовската стратегия е необходимо да се разгледа пример за оценка на надеждността на хипотеза, базирана на нея, както и да се обоснове използването на байесовската теорема за експертни системи.
Като начало е необходимо да се даде по-разширена версия на формулата на Bayes, като се вземе предвид някакво събитие E, свързано със събитията H1, H2. hn. Вероятностите на събитието E са известни при условие, че някои от събитията H1, H2. Hn дойде: P(E/H1), P(E/H2). P(E/Hn). Да предположим, че знаем, че е настъпило събитие E. В този случай вероятността някое от събитията Hi (i=1. n) да се е случило се определя по следната формула [2]:
Събития H1, H2. Hn са хипотези, а събитието E се нарича доказателство. Вероятностите на хипотезите P(Hi), без да се вземат предвид доказателствата (т.е. без да се вземе предвид дали събитието E е настъпило или не), се наричат предекспериментални (априорни), а вероятностите P(Hi/E) се наричат следекспериментални(апостериори). Стойността P(EHi) е съвместната вероятност на събитията E и Hi, т.е. вероятността двете събития да се случат заедно. Стойността P(E) е общата (безусловна) вероятност на събитието E.
В експертните системи (компютърни системи, които могат частично да заменят експерт-специалист при разрешаването на конкретна проблемна ситуация), теоремата на Байс може да се използва за оценка на вероятностите за заключения на производствени правила въз основа на данни за надеждността на техните предпоставки. Изводите (заключенията) в този случай съответстват на хипотезите в теоремата на Байс, а предпоставките съответстват на доказателствата. Обикновено изпращането на правило в експертни системи съдържа няколко условия. Вероятностите P(Hi) и P(E/Hi) се определят на базата на статистически данни, като се използват основните формули, използвани в теорията на вероятностите (формули за умножение на вероятности, формули за събиране на вероятности).
Като илюстративен пример, помислете за експертна система, която помага да се оценят условията на труд на работниците в определена организация. Следната таблица представя данни за 5000 работници (315 са диагностицирани със заболяване, възникнало във връзка с професионалната им дейност):
Пример за оценка на валидността на хипотеза
Състояние
Стойност
Брой проф. заболявания
Брой работници, коитонямат проф. заболявания