Excel в статистическа компютърна симулация
При анализиране на статистически модели, например намиране на процентни точки или оценка на силата на статистически критерий, методът на статистическото компютърно моделиране (по същество вариант на метода Монте Карло) е ефективен.
При решаване на подобни проблеми в този метод, в съответствие с определен закон за разпределение на вероятностите на случайна променлива,Nпроби с обемnсе моделират с помощта на генератор на произволни числа, който генерира произволни числа, които имат теоретично равномерно разпределение с параметри 0 и 1. Това ни позволява да ги разглеждаме като стойности на симулираната интегрална функция на разпределение. На базата на генерираните произволни числа се изчисляват квантилите на симулираното разпределение, които се считат за примерни елементи. В този случайNтрябва да е достатъчно голям. Например, когато се изчисляват процентни пунктове на статистически критерии, се препоръчва един милион проби за постигане на висока точност [1]. Въз основа на симулираните проби се намират числени стойности от интерес или емпирични модели. Така че, когато се намират процентните точки на който и да е статистически критерий, неговата стойност се изчислява за всяка извадка и след това най-големите стойности на критерия се изхвърлят в част, равна на приетото ниво на значимост. Най-голямата стойност на критерия след бракуване е равна на съответния процентен пункт.
Универсалните софтуерни пакети за статистически анализ са малко полезни за такива изследвания. Следователно методът обикновено се прилага чрез създаване на подходящ наукоемък софтуер [1, 2]. Този подход обаче има редица недостатъци: изследователят се нуждае от способност за програмиране (което не винаги се среща сред инженерно-техническите и научни работници), програмата често се създава за един илисравнително тесен кръг от задачи за решаване, съществуващият софтуер е недостъпен и създаването му изисква известно, понякога доста значително финансиране.
В същото време електронната таблица MS Excel може да бъде прост, универсален и достъпен инструмент за статистическо компютърно моделиране. Автоматичната симулация на голям брой проби се постига чрез използване на цикличен макрос, тъй като всеки път, когато макросът се изпълни, произволните числа се генерират наново и следователно се симулира нова извадка. Макросът може да бъде написан на езика на приложението Visual Basic или с помощта на програма за запис на макроси. Във втория случай изобщо не е необходимо да знаете програмирането, но макрокодът няма да бъде оптимален, което може значително да забави изчисленията. Под цикличен макрос, създаден веднъж, можете да "настроите" в електронна таблица почти всеки абстрактен или конкретен проблем от теорията на вероятностите или математическата статистика.
Възможността за използване на Excel в статистическото компютърно моделиране беше проверена чрез изчисляване на стойностите на процентни пунктове за критерия за груби грешки (критерий за аномалия) N.V. Смирнов [3] и сравнявайки получените стойности с литературните данни.
Трябва да се отбележи, че GOST R ISO 5725-2-2002 и GOST R 8-736-2011 препоръчват използването на теста на Grubbs за анализ на проби за груби грешки с една съмнителна стойност в пробата. Въпреки това, в таблиците на процентните точки на теста на Grubbs в тези GOST, нивата на значимост се удвояват и ако се намалят съответно, тестът на Grubbs се намалява до теста на N.V. Smirnov [4]. Следователно, очевидно, името "критерий на Смирнов (Грубс)", което често се среща в литературата, би било правилно.
Изчисляване на процентен пунктбяха извършени за максималния размер на пробата приnразмери на пробата от 3, 5, 10, 50 и 100. Пробите бяха моделирани от стандартно нормално разпределение от 106 за всеки размер на пробата. Стойностите на критериите са изчислени от примерни оценки на параметрите на разпределението. Статистиката на критерия N.V. Smirnov tcalc за съмнителна стойност се изчислява съгласно уравнението:
където xc е съмнителната стойност, хср е средната стойност на извадката, s е стандартното отклонение на извадката.
Процентните точки на критерия на Н. В. Смирнов, изчислени в това изследване, както и тези, дадени в [1] (под името на критерия на Гръбс), са показани в таблицата.
н | от 1] | По изчисление | ||||
1% | 5% | 10% | 1% | 5% | 10% | |
3 | 1,155 | 1.153 | 1,148 | 1,155 | 1.153 | 1,148 |
5 | 1,749 | 1,672 | 1,602 | 1,749 | 1,671 | 1,602 |
10 | 2,410 | 2,176 | 2,036 | 2,409 | 2,176 | 2,036 |
50 | 3,336 | 2,956 | 2,768 | 3,338 | 2,958 | 2,769 |
100 | 3600 | 3,207 | 3,017 | 3600 | 3,207 | 3,017 |
Възможно е при решаване на други проблеми отклонението от действителните стойности да е малко по-голямо. Може да е необходимо да се проверят отклоненията във всеки случай и, ако е необходимо, да се увеличи броят на симулираните проби. Но по един или друг начин електронната таблица MS Excel е доста приемливаприложения в статистическото компютърно моделиране.
       ЛИТЕРАТУРА
        Следващ     Съдържание