Фигура 3

При причисляване на респондент към определен интервал по отношение на продължителността на обучение възниква следният въпрос. Къде са долната и горната граница на интервала? С други думи, кой интервал трябва да се припише, например, на студент, чиято продължителност на обучение е четири часа. В крайна сметка може да се припише както на първия, така и на втория интервал. Този проблем се решава лесно. Например, социолог решава, че всички горни граници на интервали са относителни към интервал. След това студент, чиято продължителност на обучението е 4 часа, ще бъде разпределен към третия интервал. Студент, чиято продължителност на обучението е 8 часа, ¾ до пети и т.н.

Тези интервали могат да бъдат определени и в друга форма:

В този случай възниква друг проблем при изчисленията, ако продължителността на обучението на даден студент например е 1,09 часа. Отново решението е в ръцете на социолога. Той може да припише на интервала не само горната граница, но и това, което е под долната граница на следващия интервал, т.е. респондентът, чиято продължителност на изследването е 1,09 часа, ще бъде причислен към първия интервал.

Използвайки първите въведени интервали, изчисляваме разпределението на респондентите по тях (Таблица 3.1.3.)

Моля, имайте предвид, че всяка от горните таблици има заглавие, обща колона. Тези таблици са пример за дизайна, така да се каже, на първичните резултати от социологическо изследване. Разбира се, с изключение на факта, че реалните таблици съдържат само един индикатор от четирите дадени. Такива таблици служат и за представяне на резултатите от изследването. Тази ситуация е характерна за изследване на общественото мнение.

Социологът нарича разпределението на характеристиката"линийка", просторазпределение,линейноразпределение,честотноразпределение, просто групиране, защото всъщност говорим за най-простите,едномерни разпределенияза разлика от условните и многомерните. Последните се получават, когато се конструира разпределение по няколко характеристики едновременно. Ще преминем към случая на двумерни разпределения малко по-късно.

Разпределение на студентите по продължителност на обучение

Едномерно разпределение може да се получи както за цялата извадка, така и за отделна подизвадка. В нашия случай подизвадката са студенти по хуманитарни науки, избрани от цялата съвкупност от анкетирани студенти. Тогава е по-точно да наречем разпределенията, получени от нас според трите критерия,условни.Условните разпределения от този вид позволяват да се решават проблемите на сравнителния анализ още на този първи етап от работата с емпирични данни. Например, може да се сравни структурата на удовлетвореността от обучението за студенти по хуманитарни науки и природни науки, структурата на продължителността на обучение за социолози и историци и т.н. Във всеки случай, ние сравняваме разпределенията наструктуратаза различни групи отанкетирани / интервюирани.

В допълнение към такъв сравнителен анализ, едномерните разпределения са необходими на социолога, за да постигне следнитецели. Първо,за проверка на качеството на извадката, ако говорим за масови проучвания. Дори когато извадката е „добре“ планирана, може да има изкривяване в действителните данни. Признаците, по които се формира извадката, са включени в инструментариума, като по разпределенията им се извършва съответен контрол. Това е само един аспект. Друга е свързана с факта, че броят на признаците, за които се планира извадката, не може да бъде голям. В тази връзка, редица характеристики, които представляват интерессоциолог по отношение на представителността на извадката, отпадат от внимание при нейното формиране. Тогава социологът може да тества представителността на тези черти въз основа на анализ на тяхното разпределение.

Второ,едномерните разпределения определят диференциращата сила на характеристиките. Връщайки се към таблица 3.1.1, виждаме, че две професии не се срещат в нашите данни. Съответно те са изключени от по-нататъшен анализ. Определена група (според нивото на удовлетвореност, професионална) респонденти може да бъде малка на брой (което е "много" и "малко", определя социологът въз основа на своите изследователски задачи). Малката група изключва възможността да се сравнява с други, големи групи. В този случай, разчитайки на прости разпределения, се взема и решение за. обединение на отделни групи. Така могат да се конкретизират задачите и хипотезите на изследването.

Трето,използвайки прости разпределения, ние определяме естеството на това разпределение и установяваме емпиричните модели на „поведението“ на характеристиката по отношение на обектите, които се изучават (в нашия случай студенти по хуманитарни науки). Терминът "поведение" ще бъде използван само за яснота и образност. Според нас той е по-полезен от математическите термини.

И накрая, важно е следното. Едномерното разпределение може да се анализира на различни „езици“. Първият основен ¾ език на математическата статистика, статистически анализ. Огромно количество литература описва този аспект. Основният постулат на статистическия подход: едномерното разпределение е резултат само от едно наблюдение на генералната съвкупност и съответно е обект на влиянието на случайни, неконтролирани фактори. Ако пробата е била „добра“, тогава тя може да се използва с определена точностизчисляване на характеристиките на генералната съвкупност. Оттук и понятиетодоверителен интервал,интервал, в който се намира истинската (за общата популация) стойност на този вид характеристика. На езика на статистическия анализ възможните стойности на признак се наричат варианти,, а тяхната съвкупност и съответните им честоти се наричат ¾вариационни серии.Социолозите практически не използват тези термини.

Вторият „език“ се основава на информационния подход или концепции натеорията на информацията.Има концепция за единица информация. Това еbit(от английската двоична цифра ¾ binary digit). Всеки поток от информация (цифри, букви, фрази) може да бъде кодиран с нули и единици. Броят 0s и 1s, необходими за оптималното (най-краткото) кодиране на този поток, се наричаколичество информация.

Представете си сега ситуация, в която трябва да научим нещо. Например, някой от вас позна някой от присъстващите. Колко въпроса да му задам, за да разбера "на кого" е познал. В този случай само въпроси с опции за отговор "да" и "не". За да направя това, ще направя списък на всички, например, 32 присъстващи студенти. След това ще разделя този списък на две части и ще попитам, сочейки първата част от списъка, „има ли скрит в тази част“. Така ще идентифицирам 16 ученика, сред които има скрит. Ще повторя процедурата за разделяне на две части и ще получа списък от 8 ученика, сред които има скрит. Продължаването на тази процедура на разделяне води до резултата. Трябваше да задам само пет въпроса. Пет е количеството информация. Това число може да се определи и по друг начин. Ще присвоя петцифрен номер на серийния номер на всеки ученикдвоично число от 00000 до 11111 и попитайте дали е вярно, че първата, втората, третата, четвъртата и петата цифра на планирания ученик са равни на едно?

Количеството информация, необходимо за отгатване на планирания ученик, е пет илиlog232. Като упражнение пребройте количеството информация в номера на паспорта.

Едномерното разпределение може да се интерпретира като съобщение, съдържащо определеноколичество информация.Това количество може да бъде оценено чрез някаква мярка и стойността му ще бъде различна за различните разпределения. Такава мярка се нарича ощеентропия.Ако някой от вас се интересува от този въпрос, тогава погледнете в една интересна книга (10) от унгарски математик, където има раздел „Бележки на студент по теория на информацията“.

Задание за семинар или за самостоятелна реализация

Всеки ученик трябва да излезе с данни за моделната задача. Ако е възможно, използвайте фрагмент от истинско изследване. Целта на задачата е подготовка за овладяване на методите за първичен анализ, т.е. изследване на "поведението" на индивидуалните характеристики, включително емпирични показатели. На същия материал ще овладеем и анализа на връзките между характеристиките.

Изискванията към проблема, а оттам и към емпиричните данни, са следните:

1. Брой обекти 45-50. В ролята на обекти могат да бъдат: респонденти, семейства, студентски групи и др. Най-вероятно това ще бъдат респонденти, тъй като са необходими около 50 обекта. Предупреждение към всезнаещите ¾ на този етап всичко се прави без компютър. Препоръчително е първо да изпълните ръчно всички задачи, дадени в“Лекции”и едва след това да използвате компютъра.

2. Броят на характеристиките е най-малко три. Първият се измерва по номиналскала с брой градации, равен на 6-9. Втората ¾ на порядъчната скала с брой градации, равен на 5-7. И накрая, третият знак се измерва в метрична скала (числа, количества). В същото време, за да се опростят изчисленията, се препоръчва да се използват двуцифрени числа като характерни стойности.

5. След като изберете изходните характеристики за анализ, трябва да съставите отговори, ако задачата е моделна. По този начин се получава матрица от изходни данни под формата на „обект ¾ знак“, въз основа на която ще се изпълняват задачи за няколко следващи раздела на тази глава.

6. И за трите знака е необходимо да се изчислят абсолютните, относителните (в дроби и проценти) и натрупаните честоти. Подредете резултатите във вид на таблици от тип 3.1.1; 3.1.2; 3.1.3.