Плюсове и минуси на стратифицираната извадка Стратифицираната извадка във всеки случай се оказва
Въпреки това, стратифицираната извадка може да се приложи само ако има допълнителна информация за населението (например, имаме нужда от процента на мъжете и жените, в случай че искаме да стратифицираме извадката по пол). Липсата на такава информация прави невъзможно използването на стратифицирана извадка. Друг недостатък на стратифицирания подбор е възможността за отклонение. Следващите примери ще се опитат да илюстрират различните начини, по които може да се използва стратифицирана извадка.
Пример: [6, 41] Нека отново вземем данните за доходите от таблица 1. Само че сега от същия масив ще направим не случайна, а стратифицирана извадка от четирима души.
За да можем да направим стратифицирана извадка, ще приемем, че от предишното преброяване знаем доходите на респондентите за предходния период и имаме основание да приемем, че към този период те не са се променили или са се променили пропорционално.
Въз основа на тези данни населението може да бъде стратифицирано по доходи. Резултатите от това разделяне са представени в таблица 12.
Разпределение на респондентите по страти. номер на групата. Анкетираните включени в групата. 1.A,J,D. 2.L,G,F. 3. I, H, C. 4.E,K,B.
Тук във всяка група (или прослойка) има хора с възможно най-близки доходи. Ние избираме четирима души, от които се нуждаем, като произволно избираме по един човек от всяка група (т.е. извършваме пропорционална извадка).
В резултат на това получаваме извадка, която е доста представителна по отношение на доходите, т.к в нашата извадка хората с различно материално състояние ще бъдат представени в правилната пропорция.
Освен това такъв избор е по-надежден от произволния избор, тъй като с такава селекциямогат да се избират "лоши" проби, т.е. проби, съдържащи само бедните или богатите (напр. ADJL или BCEK). Стратифицираната извадка обаче не винаги е от полза, както е показано в следващия пример.
Пример: [6, 42] Да предположим, че отново трябва да направим стратифицирана извадка от респондентите, представени в таблица 1. Освен това да предположим, че между преброяването и проучването доходите на респондентите са претърпели значителни промени, тогава групите, които сме идентифицирали въз основа на данните от преброяването, може да не се окажат хомогенни (хората с различни доходи ще попаднат в една прослойка). Например представените в таблица 13.
Разпределение на респондентите по страти. номер на групата. Анкетираните включени в групата. 1.A,F,C. 2.L,J,D. 3.K,E,G. 4. H, B, I.
В този случай стратифицираният подбор няма да донесе практически никаква полза в сравнение с произволната извадка, тъй като
Пример: [6, 42-46] Сега разгледайте случая с разнородна генерална съвкупност, т.е. популация, в която има отделни резки отклонения от средната тенденция. Например съвкупността, представена в таблица 1, ще бъде хетерогенна, ако например респондент Б получи доход от 20 000 вместо доход от 6300.
Стратификацията в този случай може да се извърши по два начина: както беше стратифицирано в таблица 12 и както беше направено в таблица 14.
Разпределение на респондентите по страти. номер на групата. Анкетираните включени в групата. 1.A,J,D,L. 2.G,F,I,H. 3.C,E,K. 4.б.
В първия случай, както вече беше споменато, е извършен пропорционален подбор, а в този случай съответно непропорционален. Пропорционалната селекция в този случай (в случай на хетерогенна обща популация) не е такавае добре, защото няма да осигури хомогенност на стратите (в който и пласт Б да попадне, този пласт веднага ще стане нехомогенен).
Въпреки това, при непропорционална селекция, принципът на еднаква вероятност за попадане в извадката се нарушава, тъй като Респондент Б е включен в нашата извадка за всеки резултат.
За коригиране на това обстоятелство в случай на непропорционален подбор се прилага процедура за претегляне. Коефициентът на претегляне е предназначен да "възстанови" Чрез претеглянето ние увеличаваме дела на респондентите от големи слоеве. За нашия пример ще бъде изчислена средната стойност
Ако изберем всички възможни извадки с дадена стратификация (Таблица 14), тогава без претегляне ще получим предубедена оценка на извадката (обща средна = 3817 и средна извадка = 6852). Въпреки това, ако се извърши претегляне, тогава в този случай непропорционалната селекция (стандартно отклонение = 277) ще бъде по-ефективна от пропорционалната селекция (стандартно отклонение = 1878).
Нека по-нататък разгледаме разгледания по-горе пример с микрорайони. Решението на проблема може да бъде увеличаване на размера на извадката или провеждане на произволно проучване. Но последното може да доведе до някои изкривявания и неточности, т.к кварталите също се различават един от друг. Първият е свързан с допълнителни разходи.
Това е мястото, където стратифицираната извадка е полезна. Може да се реализира, ако успеем да комбинираме няколко микрорайона като подобни. Чрез разделянето на всички микрорайони на няколко относително хомогенни групи е възможно да се изгради представителна извадка, без да се увеличава нейният размер.
Стратифицираната извадка също може да ни помогне, когато няма пълен списък на жителите на града. В този случай е възможно да се избере един микрорайон от всеки слой, в който ще се проведе проучването и да се събере информация за неговите жители.
Въпреки това, акоАко изберем грешни критерии за комбиниране на квартали, това ще доведе до сериозна системна грешка.