Анализ на сериите на разпределение
АНАЛИЗ НА РАЗПРОСТРАНЕНИЕТО
1. Характеристика на разпределителния център
1.3 Индикатори за диференциация
2. Характеристики на вариацията
2.1 Абсолютни характеристики на вариацията
2.1.1 Изчисляване на дисперсията по метода на моментите
2.1.2 Изчисляване на дисперсията на признак
2.1.3 Междугрупова дисперсия. Правило за добавяне на дисперсии
2.2 Относителни характеристики на вариацията
3. Теоретични криви на разпределение
3.1 Нормално разпределение
3.2 Напасване на емпирично разпределение към камбановидна крива
3.3 Критерии за приемане
3.4 Характеристики на неравномерното разпределение
Серията на разпределение (т.е. подреденото разпределение на единици от изследваната популация в групи според определен променлив признак) характеризира състава, структурата на популацията по определен признак. Той е изграден, за да разкрие характера на разпределението на единиците от съвкупността по различен признак, да определи закономерностите в това разпределение.
За анализ на серията на разпределение се използват редица статистически характеристики:
характеристики на разпределителния център;
характеристики на неравномерно разпределение.
Честотните характеристики на серията на разпределение, а именно честотата
1. Характеристика на разпределителния център
Характеристиките на центъра на разпределение включват средна стойност, режим и медиана. Тези характеристики се наричат още структурни средни, те определят вида на полигона и хистограмата, емпиричния закон на разпределение.
Като средна стойност за характеризиране на центъра на разпространение най-често се използва средноаритметичното, просто или претеглено.
Fashion (Mo) е вариант, койтонай-чести в изследваната популация. Режимът не зависи от екстремните стойности на варианта и може да се използва за характеризиране на центъра в разпределителни серии с неопределени граници.
В дискретна вариационна серия режимът се определя визуално и е равен на варианта с най-висока честота или честота. Данните за разпределението на работниците по трудов стаж (виж лекцията "Обобщение и групиране на статистически данни") показват, че най-много работници са с 4 години трудов стаж, т.е. вариант, равен на 4, е режимът на функцията. Mo = 4.
В сериите на интервално разпределение, за да се намери модата, модалният интервал първо се определя от най-високата честота, т.е. интервал, съдържащ режима, и след това приблизително го изчислете по формулата:
Има серии, които имат два режима (бимодални серии) или няколко (полимодални).
Нека изчислим режима на интервалния ред на разпределението на работниците по заплати (виж лекцията "Обобщение и групиране на статистически данни").
В тази вариационна серия интервалът от 900-1000 UAH, който включва максималния брой работници (9 души), е модален.
Получената стойност на режима показва, че в разглежданата популация най-типичната заплата е 914,29 UAH, което е по-високо от предварително изчислената средна заплата (870 UAH).
За серия с неравни интервали модалният интервал се определя от най-високата плътност на разпределение, а във формулата за изчисление се използват режими вместо честоти, абсолютни плътности на разпределение.
За интервални вариационни серии с равни интервали режимът може да се определи приблизително графично.
За да направите това, на хистограмата на тази серия (вижте хистограмата в лекцията "Обобщение и групиране на статистически данни"), изберете най-високия правоъгълник,което е модално.
Освен това, горният десен връх на правоъгълника, предшестващ модалния (честота fMo-1) е свързан с горния десен връх на модалния правоъгълник (честота fMo), а горният ляв връх на този правоъгълник е свързан с горния ляв връх на правоъгълника, следващ модалния (честота fMo+1).
От точката на пресичане се спуска перпендикуляр към хоризонталната ос. Основата на перпендикуляра ще покаже стойността на режима Mo. Точността на определянето зависи от мащаба на графиката.
1.2 Медиана
Медианата Me е стойността на атрибута, който попада в средата на класираната серия и я разделя на две части, равни по брой единици. По този начин, в серията с класирано разпределение, едната половина от серията има стойности на характеристиките, които надвишават медианата, докато другата половина има стойности, по-малки от медианата. Медианата се използва вместо средноаритметично, когато крайните варианти на класираната серия (най-малката и най-голямата) в сравнение с останалите се оказват прекалено големи или прекалено малки.
В дискретна вариационна серия, съдържаща нечетен брой единици, медианата е равна на варианта на характеристиката с числото
където N е броят единици на съвкупността.
В дискретна серия, състояща се от четен брой единици от съвкупността, медианата се определя като средната стойност на опциите с числа
При разпределението на работниците по трудов стаж медианата е равна на средната стойност на вариантите, които имат номера 10: 2 = 5 и 10: 2 + 1 = 6 в класираната серия. Вариантите за пети и шести признак са 4 години, следователно
При изчисляване на медианата в интервалната серия първо се намира медианният интервал (т.е. съдържащ медианата), за който се използват натрупаните честоти или честоти. Медианата е интервалът, чиято кумулативна честота е равна или по-голяма от половината от общия обеминертни материали. След това средната стойност се изчислява по формулата:
Нека изчислим медианата на серията от разпределение на работниците по заплата (вижте лекцията "Обобщение и групиране на статистически данни").
Средният интервал на заплатите е 800-900 UAH, тъй като неговата кумулативна честота е 17, което е повече от половината от сумата на всички честоти (
Получената стойност показва, че половината от работниците имат заплати под 875 UAH, но това е по-високо от средния им размер.
За определяне на медианата, вместо кумулативните честоти
Медианата, подобно на режима, не зависи от екстремните стойности на варианта, поради което се използва и за характеризиране на центъра в сериите на разпределение с неопределени граници.
Свойство на медианата: сборът от абсолютните стойности на отклоненията от медианата е по-малък от всяка друга стойност (включително средноаритметичната):
Това свойство на медианата се използва в транспорта при проектиране на разположението на трамвайни и тролейбусни спирки, бензиностанции, сборни пунктове и др.
Пример.Има 10 гаража на 100 км магистрала. За проектиране на изграждането на бензиностанция бяха събрани данни за броя на очакваните пътувания на бензиностанция за всеки гараж.
Таблица 2 - Данни за броя пътувания до бензиностанции за всеки автосервиз.