Изчисляване на характеристиките на стратифицирана извадка – Студопедия

Характеристиките на такава извадка се изчисляват като „претеглени“ стойности: индикаторите за всяка страта се комбинират в обща средна стойност; приносът на груповите средни стойности е пропорционален на "теглото" на всяка страта в извадката или общата съвкупност.

В стратифицирана извадка общата дисперсия на извадката има, така да се каже, два източника: дисперсията на груповите средни стойности, които характеризират всяка страта sx 2 и средната дисперсия на дисперсиите в рамките на всяка от тези страти s 2 i.

Това се записва по следния начин: s= sx 2 + s 2 i (7)

Изчисляването на средната грешка в селекцията, пропорционална на броя на единиците в стратите, се извършва по формулата

или, ако пренебрегнем съотношението n/N,

В изрази (8) и (9) s 2 i се изчислява въз основа на формула (7), т.е. s 2 i=s 2 -s 2 x, където s 2 е общата дисперсия на извадката, се изчислява като за проста извадка, без да се взема предвид стратификацията.

изчисляване

От съотношението за средната грешка (7) следва, че грешката на стратифицирана извадка е по-малка от средната грешка на чисто случайна извадка или равна на нея, когато междугруповата дисперсия е нула.

Пример. Да приемем, че извадката съдържа 5 страти (групи семейства по среден доход 6 ). Необходимо е да се определи размерът на разходите за годишния абонамент. Бяха взети две семейства от всеки 2-ри слой (размер на извадката n = 10, виж Таблица 19).

стратифицирана

стратифицирана

Така, както се вижда от разгледания пример, стратифициранитевземането на проби ceteris paribus дава по-точни резултати.

5. 5. Многоетапни и комбинирани методи, формиране на извадкова съвкупност

Пробата може да бъде изградена като едно или многоетапна. При многоетапен избор единицата за избор се променя на всеки етап. Например, на първия етап се избират промишлени предприятия, на втория - подборът на бригади в предприятията, включени в извадката на първия етап, на третия - подборът на работници от бригадите, попаднали в извадката на втория етап на подбор и т.н.

Необходимостта от многоетапна селекция се дължи, като правило, на липсата на информация за всички единици от генералната съвкупност. При многоетапна селекция, за да се организира първият етап, е необходимо да има информация за разпределението на един или друг признак върху целия набор от единици на първия етап на селекция. За организирането на втория етап е необходима само информация за избраните звена от първия етап.

На първия етап, като правило, се използва произволен избор и, като се започне от втория етап, произволно се избира брой единици, пропорционални на размера на съответната единица от предишния етап и т.н.

Дяловете на подбор на всеки етап се комбинират по такъв начин, че като цяло делът на подбор на извадката предоставя на всички единици от генералната съвкупност еднакъв шанс да бъдат включени в извадката.

Пропорционалният метод за организиране на многоетапно вземане на проби има определени неудобства. Социологът, от една страна, намалява размера на извадката, за да спести пари и да съкрати времето на изследването, а от друга страна, спазвайки принципа на пропорционалността, той може да получи много малки групи за отделни фактори, които ще бъдат недостатъчни за статистически анализ.

Има няколко начинаформиране на многоетапни проби.

Например, разгледайте метод за организиране на двуетапна извадка, чийто избор на единици на първия етап се извършва с вероятност, пропорционална на размера. Нека използваме например условията и задачите за организиране на извадка в известно изследване на ленинградски социолози.

Звената на първия етап на подбор са предприятията от града.

Съставен е пълен списък на единиците на наблюдение от първия етап на подбор - промишлени предприятия и броя на младите работници във всяко от тях. Генералната съвкупност включва 50 такива предприятия.

характеристиките

Извадковите единици се класират според броя на работниците, избрани като единици за наблюдение, и се взема решение в извадката да се включат определен брой фабрики, например пет. Според таблицата със случайни числа се избират числа (M1, M2, M3, M4 и M5) между N1 и N (общият кумулативен брой работници в общата съвкупност). В извадката са включени тези предприятия, чиито номера са в същия ред (j), който съответства на кумулативното, съдържащо едно от числата Мk k=1/5 т.е. i = f, ако N1+N2+…+Nj-1

Вторият етап на подбор се осъществява по следния начин. Във всяко предприятие, включено в извадката; избран е същият брой работници (единици от втория етап на подбор). Допълнителният избор може да бъде случаен или систематичен.

Грешка при многоетапно вземане на проби(на примера на двуетапно вземане на проби). При многоетапен подбор (започвайки с двуетапен подбор) трябва да се вземат предвид спецификите на изчисляване на грешката на извадката. Всеки етап на подбор прави своя "принос" за отклонението на установените оценки от истинските стойности на характеристиките в общата популация.

За достатъчно голям размер на извадката има опростени формули за изчисляване на средната грешка.

Къдетоs 2 1 - дисперсия на единици от първия етап на селекция и n 1 - техният брой; n 2 2 е дисперсията на единиците от втория етап на селекция и n 2 е техният брой в състава на единиците от първия етап на селекция в извадката.

Формулата взема предвид и двата източника на грешки в представителността при двуетапна селекция. Първият член на формулата под корена показва дисперсията, причинена от формирането на първия - етап на селекция. Вторият термин показва вътрешногруповата вариация, свързана с организацията на втория етап на извадката.

Опростяването на тази формула се състои в това, че вътрешногруповите дисперсии се изчисляват във всяка единица от първия етап след избора на единици от втория етап от него. Това е "непретеглената" средна стойност на квадратите на грешките върху цялата сума от единици на втория етап (n 2 ). Това е вторият източник на случайни грешки.

Не намерихте това, което търсихте? Използвайте търсачката:

Деактивирайте adBlock! и обновете страницата (F5)наистина е необходимо