Ниво на значимост и сила на теста

При тестване на хипотези със статистически тест може да възникне една от четирите ситуации: 1) хипотезата H0 е вярна (и следователно H1 е невярна) и се предприема действие A; 2) хипотезата H1 е вярна (и следователно H0 е невярна) и се предприема действие A; 3) ) хипотезата H0 е вярна (и следователно H1 е невярна) и е предприето действие B; 4) хипотезата H1 е вярна (и следователно H0 е невярна) и се предприема действие B. В ситуации 2 и 3 се получава грешка. Има 2 вида грешки. Грешката при приемане на хипотезата H0, когато е невярна (грешка от втори род), е качествено различна от грешката при отхвърляне на H0, когато е вярна (грешка от първи вид). В този случай числата αi = αi(δ) = Pi(δ(X)≠ Hi), характеризиращи вероятността за отхвърляне на хипотезата Hi, когато е вярна, се наричат ​​вероятности за грешка на (i + 1)-ия вид на критерия δ. Наборът от вероятности αi(δ) за грешни решения се характеризира с качеството на критерия δ. Правилното решение може да бъде взето и по два начина (ситуации 1 и 4): когато хипотезата H0 се приеме, защото е вярна, и когато хипотезата H0 се отхвърли, защото е невярна. В ситуация 1 не се прави грешка от тип 1; в ситуация 4 не се прави грешка от тип 2.

Нивото на значимост на критерия не променя степента на риск, свързан с възможността за грешка от тип II, т.е. приемане на грешна хипотеза. И при дадено ниво на значимост критичната област може да бъде дефинирана по различни начини. По правило се определя така, че мощността на критерий 1 – α1(δ) да е възможно най-голяма: P (X ] x1; x2[H1) = max. Силата на критерия δ е вероятността 1 – α1(δ) да не допуснете грешка от втори род. Колкото по-голяма е силата на критерия, толкова по-малка е вероятността да се приеме неправилна хипотеза.

Критерий за съгласие.

Критерии за добротаPearson се основава на избора на определена мярка за несъответствие между теоретичните и емпиричните (получени от експеримента) разпределения. Освен това проблемът за проверка на съответствието на теорията с експериментални данни може да се формулира по следния начин: има извадка x1, x2, ..., xn от наблюдаваните стойности на някои RH X. Необходимо е да се определи, че разпределението на извадката принадлежи към определено разпределение (нормално, биномно, експоненциално и т.н.) - хипотезата H0 срещу алтернативната хипотеза H1 - разпределението не принадлежи към избраното разпределение. Нека първо приемем, че хипотезата H0 напълно определя формата на функцията P и вероятността P(xj Si) може да бъде изчислена за всеки даден набор S1, S2, ..., Sk - това са или интервали за непрекъснат RV, или групи от отделни стойности на дискретно RV, които нямат общи точки. Нека pi = P(xj Si) е вероятността RV X да приеме стойности, които принадлежат на множество Si и =1, и всички pi>0, i = . Съответните групови честоти в извадката са m1, m2, …, mk, т.е. mi е броят на SV X стойностите от пробата, които попадат в Si. Ясно е, че =n. Ако тестваната хипотеза H0 е вярна, тогава разпределението на извадката може да се разглежда като статистически аналог на общото разпределение, дефинирано от функцията p(x). Това означава, че mi е честотата на възникване на събитие с вероятност pi = P(Si) в нашата последователност от n наблюдения. Следователно всеки набор от Si има относителни честоти mi/n в първото разпределение и вероятности pi във второто. След това, съгласно метода на най-малките квадрати, ние приемаме стойността Ci(mi/n - pi) 2 като мярка за несъответствието между разпределението на извадката и теоретичното разпределение, където Ci е произволен коефициент. Пиърсън доказа, че ако Ci = n/ pi, тогава получаваме мярка за несъответствие под формата χ 2 = , така че с увеличаванеразмер на извадката, разпределението на извадката на стойността χ 2 клони към граничното разпределение χ 2 с υ = κ - r - 1 степени на свобода (k е броят на интервалите или групите, на които са разделени всички наблюдавани данни, r е броят на параметрите на хипотетичното разпределение на вероятността P, оценено от данните на извадката). Това твърдение следва от факта, че ако хипотезата H0 е вярна, тогава съвместното разпределение на груповите честоти mi, i = , е просто обобщение на биномиалното разпределение и тогава случайните променливи Xi = (mi - npi)/ са нормално разпределени и тяхната сума от квадрати χ 2 = има разпределение χ 2 с υ = κ – r – 1 степени на свобода. За да може стойността на критерия приблизително да има χ 2 -разпределение, теоретичните честоти npi не трябва да бъдат твърде малки.