Теория на Демпстър-Шафер

Теорията на Демпстър-Шафере математическа теория на доказателствата ([SH76]), базирана нафункции на вярата(функции на вярата) ифункции на вероятността(правдоподобни разсъждения), които се използват за комбиниране на отделни части от информация (доказателства) за изчисляване на вероятността от събитие. Теорията е разработена от Артър П. Демпстър [en] и Glenn Schafer [en] .

Съдържание

Първата игра е хвърляне на монета, при която се правят залози за това дали ще има глави или опашки. Сега си представете втора игра, в която се правят залози за изхода от битка между най-добрия боксьор в света и най-добрия борец в света. Да предположим, че сме невежи в бойните изкуства и ни е много трудно да решим на кого да заложим.

Много хора ще бъдат по-малко уверени в ситуацията на втората игра, в която вероятностите са неизвестни, отколкото в първата игра, където е лесно да се види, че вероятността за всеки изход е наполовина. В случая на втората игра, байесовската теория ще присвои половината от вероятността за всеки резултат, независимо от информацията, която прави един от резултатите по-вероятен от другия. Теорията на Демпстър-Шафер ви позволява да определите степента на увереност на играча по отношение на вероятностите, определени за различни резултати.

По дефиниция масата на празното множество е нула:

Масите на останалите елементи от експоненциалното множество се нормализират до единична сума:

Въз основа на зададените маси е възможно да се определят горната и долната граница на диапазона от възможности. Този интервал съдържа точната стойност на вероятността на разглежданото подмножество (в класическия смисъл) и е ограничен от две неадитивни непрекъснати мерки, наречениувереност(вярване) (илиподкрепа(подкрепа)) ивероятност(правдоподобност):

b e l (A) ≤ P (A) ≤ pl(A)

Тези две мерки са свързани една с друга, както следва:

От горното следва, че е достатъчно да знаете поне една от мерките (маса, увереност или вероятност), за да изчислите останалите две.

Разгледайте проблема за комбиниране на две независими групи от приписани маси. Оригиналното правило за свързване, известно като правилото на Демпстър за комбиниране, е обобщение на правилото на Бейс. Това правило подчертава съгласието между множество източници и игнориравсичкипротиворечиви доказателства чрез нормализиране. Законността на използването на това правило е сериозно поставена под въпрос в случай на значителни несъответствия между източниците на информация.

Всъщност обединението (нареченоприсъединена маса) се изчислява от два набора от маси m 1>gt; и m2>gt; по следния начин:

Доверие и надеждност

Подходът на Shafer ни позволява да интерпретирамеувереносттаивероятносттакато границите на интервала на възможната стойност на истинността на хипотезата:

доверие≤ известна мярка за истина ≤вероятност.

Например, да кажем, че имаме хипотезата „котката в кутията е мъртва“. Ако за нея увереността е 0,5, а вероятността е 0,8, това означава, че имаме доказателства (с общо тегло 0,5), които недвусмислено показват, че котката е мъртва; но има и доказателства (с общо тегло 0,2), които недвусмислено показват, че котката е жива (вероятност „котката е мъртва“ = 1 − 0,2 = 0,8). Останалата маса (допълваща 0,5 и 0,2 до 1,0), която също е разликата между вероятността от 0,8 и увереността от 0,5, съответства на „несигурността“ („универсална“ хипотеза), наличието на доказателства, че определено има котка в кутията, но не казва нищо за това дали е жива или мъртва.

Общо интервалът [0,5; 0,8]характеризира несигурността на истинността на първоначалната хипотеза, основана на наличните доказателства.

ХипотезаМасаУвереностВероятност
Нула (без котка)000
жив0,20,20,5
Мъртъв0,50,50,8
Универсален (жив или мъртъв)0,31.01.0

Теглото на „нулевата“ хипотеза е зададено на 0 по дефиниция (това съответства на случаи на „без решение“ или неразрешимо противоречие между доказателствата). Това води до факта, че доверието в „нулевата“ хипотеза е 0, а вероятността за „универсалната“ хипотеза е 1. Тъй като масата на „универсалната“ хипотеза се изчислява от масите на „живите“ и „мъртвите“ хипотези, тогава нейната увереност автоматично е равна на 1, а вероятността за „нулевата“ хипотеза е 0.

Нека вземем малко по-сложен пример, който демонстрира характеристиките на доверието и правдоподобността. Да предположим, че използваме набор от детектори, за да регистрираме един далечен сигнал за пожар, който може да бъде един от три цвята (червен, жълт или зелен):

ХипотезаМасаУвереностВероятност
Нула000
червен0,350,350,56
Жълто0,250,250,45
Зелено0,150,150,34
Червено или жълто0,060,660,85
Червено или зелено0,050,550,75
Жълто или зелено0,040,440,65
Универсален0,101,001,00

Доверие (червено или жълто) = Маса (нулева хипотеза) + Маса (червено) + Маса (жълто) + Маса (червено или жълто) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Вероятност (червено или жълто) = 1 − Доверие (отрицателно червено или жълто) = 1 − Доверие (зелено) = 1 − Маса („N z еро хипотеза) − Маса (зелено) = 1 − 0 − 0,15 = 0,85

Събитията от този набор не трябва да се разглеждат като пресечна точка на събития във вероятностното пространство, тъй като те са дадени в масовото пространство. По-правилно е събитието „Червено или Жълто“ да се разглежда като обединение на събитията „Червено“ и „Жълто“ и (вижте аксиомите на теорията на вероятностите) P(Червено или Жълто) ≥ P(Жълто) и P(Универсално) = 1, където „Универсалната“ хипотеза съответства на „Червено“, „Жълто“ или „Зелено“. В TDS масата на "Универсалната" хипотеза съответства на част от доказателствата, които не могат да бъдат приписани на никоя друга хипотеза; тоест доказателства, които твърдят, че е имало някакъв сигнал, но изобщо не говорят за цвета му.

В този пример на "червеното или зеленото" доказателство е присвоена маса от 0,05. Такива доказателства могат да бъдат получени например от хора с червено/зелена слепота. TDS ни позволява да разглеждаме такива доказателства по балансиран начин.