Паспорт на пробата - Studiopedia
Паспортът на извадката се явява при социолога два пъти. За първи път социологът трябва да даде характеристика на вида на извадката с кратка обосновка за целесъобразността на нейното използване в съответствие с целите на изследването, изискванията за представителност и организационните възможности на изследването в методологическия раздел на програмата на неговото изследване. Примерният раздел съдържа отговори на следните въпроси:
♦ Какъв е емпиричният обект на изследване?
♦ Изследването е преброяване или извадка?
♦ Ако е селективен, претендира ли да бъде представителен?
♦ Ако претендира за представителност, какво е населението?
♦ Колко етапа на подбор се използват в извадката?
♦ Каква е единицата за подбор на всеки етап?
♦ Каква е стратегията за подбор за всяка стъпка (произволна, квота)?
♦ Какъв специфичен тип произволен избор се използва?
♦ Какви параметри се използват при квотното вземане на проби?
♦ Каква е рамката за вземане на проби (списък, картотека, карта)?
♦ Каква е единицата за наблюдение на последния етап от подбора?
Принципите на вземане на проби са описани не само за метода на проучването, но и за всеки метод, използван в изследването: анализ на документи, наблюдение и др.
Условен пример за примерно описание. При изследването на ефективността на бригадните форми на организация на труда такава стратегия е възможна. 1. За емпиричен обект се приемат работниците, обединени в бригадна форма на организация на труда. 2. Изследването е избирателно. 3. Генералната съвкупност са всички работници, обединени в бригадна форма. 4. Прилагат се три етапа на подбор. 5. На първия етап се разпределят бригади, наети основно испомагателно производство. За вторите се използва непрекъснато изследване (поради малкия им брой), а за първите – избирателно изследване. 6. Втората стъпка е подбор на екипи, ангажирани в основното производство. По показателите, характеризиращи крайните резултати, бригадите се разделят на три групи: а) напреднали; б) средно; в) изоставащи. В зависимост от броя на бригадите се прави списък за всяка група и от него се прави случаен непропорционален избор (например три бригади във всяка), като се използва определена „стъпка на извадка“. 7. Трети етап - провежда се непрекъснато проучване в избраните бригади. Единицата на наблюдение е отделен работник 50 .
Вторият път, когато социологът се среща с описание на извадката, е след изследването, когато пише научен доклад или научна статия в списание.
Непълното описание на паспортните данни на изследването, за съжаление, е най-честата болест на българските учени. Някои не знаят как да ги съставят, други смятат такава информация за незадължителна или маловажна. Има и такава категория изследователи, които просто няма какво да докладват, защото, описвайки цялата информация за извадката, те ще разкрият своята неграмотност. Често срещан случай е, че социолог по някакъв начин е провел проучване, по някакъв начин е изградил извадка и е получил нещо там. Но той не може да формулира паспорт, да изрази действията си на научен език.
Емпиричните данни се оказаха интересни, авторът бърза да ги сподели с читателя, но не може да опише параметрите на своето изследване, камо ли да обоснове защо е избрал точно този метод или тип извадка.
Според данните от изследването на V.V. Солодников, който извърши вторичен анализ на публикации в три академични списания: Социологически изследвания, ВъпросиПсихология” и “Психологически вестник” за 1986-1992 г. нито социолозите, нито психолозите се уморяват да изтъкват, обосновават и проверяват хипотези. Повечето учени (от 61% за психолозите до 92% за социолозите) се справят без такъв когнитивен инструмент, нарушавайки всички канони на научния метод. Само в 8% от социологическите публикации хипотезите са формулирани експлицитно. Лошо е положението за социолозите и психолозите с описанието на обекта на изследване: малцина посочват броя на респондентите, пола и възрастта на респондентите, нивото на образование на респондентите, местоживеене, продължителност на семейния живот (за тези, които са женени), рядко се съобщават доходи и професионален статус. Проблемът за представителността, т.е. сравнението на извадката и генералната съвкупност по посочените признаци почти не се обсъжда. Освен това има малко споменавания от социолозите за пилотиране на инструменти, използването на предварително тествани методи. Въпреки че най-често срещаният метод за събиране на емпирична информация е анкетата, рядко някой описва какъв вид анкета е използвана в зависимост от мястото, времето или метода на попълване на въпросника.
Представителност (фр.representatif- показателен) - свойството на извадката да представя характеристиките на генералната съвкупност. Представителността на извадката означава, че с някаква предварително определена или изчислена грешка в действителната извадка, това, което е установено в извадката от съвкупността, може да бъде идентифицирано с генералната съвкупност или, използвайки езика на статистиката, могат да бъдат намерени оценки на параметрите на популацията. Първо, всяка единица в популацията трябва да има еднаква вероятност да бъде включена в извадката. Второ, за да се избегне насочен подбор, изборът на съвкупност от единици трябва да бъдепроизвеждат независимо от изследваната черта. Трето, подборът трябва да бъде направен, доколкото е възможно, от хомогенни популации. Четвърто, броят на единиците от съвкупността, избрани за изследването, трябва да бъде достатъчно голям.
Процесът на директно определяне на представителността на извадката се състои от следните етапи: сравнение на средните показатели на разпределенията на извадката и генералната съвкупност; сравнение на формите на разпределение на тези показатели. Средното разпределение обикновено се приема като средно 144
аритметично или среднопретеглено аритметично на това разпределение.
В случай на изучаване на съвкупности с алтернативни признаци, вместо средноаритметичната стойност, делът на единиците с разглежданата характеристика се изчислява спрямо цялата популация. Ако обозначим обема на популацията със символаN,и явлението с тази характеристика -M,, тогаваP —се определя делът на събитията с тази характеристика:
къдетоQе делът на събитията с алтернативен атрибут.
Възможно е да се използват заключенията, получени въз основа на изследване на извадкова популация, ако разликата между средните аритметични стойности (или средните дялове) на характеристиките на извадката и генералната популация клони към нула. Приема се, че това изискване е изпълнено, когато са изпълнени четирите посочени по-горе условия. Вярно е, че знаейки само средните стойности на извадката, е невъзможно да се дадат точни оценки на тяхната разлика, тъй като средните стойности на генералната съвкупност са неизвестни. В допълнение, самите стойности на извадковите средни стойности могат да варират в зависимост от това кои единици от общата съвкупност са включени в извадката. Следователно оценката на представителността на извадката от съвкупността според средните показатели на нейното разпределениесе свежда до намиране на грешката на представителността.
Сравнението на извадката и генералната съвкупност чрез средни стойности не дава пълна картина на генералната съвкупност. Така че, в две популации с еднакви средни показатели, несъответствията между максималните и минималните стойности на черта, които определят формата на нейното разпределение, могат да бъдат различни. Ако представите такова разпределение графично, тогава то образува симетрична камбанообразна (нормална) крива, отразяваща факта, че сумата от много независими произволно разпределени случайни променливи е приблизително разпределена според нормалния закон. Ординататаy,, която определя височината на кривата за всяка точкаx,, е плътността на вероятността за стойносттаxr
Максималната плътност на вероятността пада върху средната стойност на променливата и е равна на единица. Това означава, че колкото по-малко
случайната стойност на една променлива се различава от нейната средна стойност, толкова по-вероятно е това да се случи. Обратно, колкото по-голямо е отклонението на стойностите на дадена променлива от нейната средна стойност, толкова по-малка е вероятността те да се появят. По този начин стойностите на отклоненията от средните стойности, т.е. стойностите на формата x(-x,носят информация за вариацията на изследваните променливи. Ако всички стойности на признака са еднакви и съвпадат със средната му стойност, тогава съвкупността от стойността на този признак би била изключително хомогенна.
Обикновено броят на положителните отклонения от средноаритметичното на съвкупността е приблизително равен на броя на отрицателните отклонения, т.е. сумата от всички отклонения неизбежно клони към нула. Следователно, ако е необходимо да се сумират всички отклонения на характеристика в съвкупността, тази сума винаги ще бъде равна на нула:
За да избегнете това, всекиотклонението се повдига на квадрат и се намира сумата от квадратите - дисперсията.
Нормалното разпределение се характеризира напълно със следните параметри: jc е средната стойност на атрибута и a е стандартното отклонение. Meanxопределя позицията на разпределението спрямо оста x; стандартното отклонение показва формата на кривата; колкото по-голяма е стойността на a, толкова по-широка е кривата и толкова по-нисък е нейният максимум.
Площта под нормалната крива е разположена по такъв начин, че 68% от общото разпределение на характеристиката е в границите наx ±o и винаги в границите наx ±2, но в математическата статистика е доказано, че има връзка между общите и извадковите вариации на формата:
къдетоn —размер на извадката.
Проблемът за представителността на извадката е важен, както и проблемът за легитимността на екстраполирането на заключенията, получени от анализа на извадката от съвкупността към цялата генерална съвкупност 52 .
Не намерихте това, което търсихте? Използвайте търсачката: