2.6. Правила за кодиране
Кодирането е присвояването на цифрови кодове на въпроси и определени стойности на техните отговори. Неговата задача е да организира първичната информация и да осигури удобството за въвеждането й в компютърна база данни, която след това се подлага на статистика.
Правилата за кодиране са доста тясно свързани с връзката между понятията "въпрос" и "променлива". По принцип трябва да се прави разлика между изследователски променливи и променливи на въпросника. Изследователската променлива е по-широко понятие, което се отнася до конкретен обект, процес или явление, представляващи интерес за изследователя, което може да приеме редица различни опции. Въпросът от въпросника е по-скоро инструмент за операционализация. Някои променливи могат лесно да бъдат операционализирани с един въпрос (напр. пол, възраст, доход). Други ще изискват няколко въпроса, различни комбинации от отговори, на които ще покажат една или друга стойност на променливата. Например, в едно от нашите изследвания, операционализирането на такава променлива като „място в организацията
трудоустройство” изискваше пет въпроса, а операционализирането на променливата „отношение към собствеността” изискваше единадесет! Като се има предвид обаче, че почти всички въпроси във въпросника имат повече от един отговор, те също могат да се считат за променливи (въпреки че, за разлика от променливите на проучването, те трябва да се наричат променливи на въпросника).
Веднага трябва да се каже, че въпросникът се състои от въпроси, само някои от които действат като независими изследователски променливи. Кодирането на такива въпроси е съвсем просто: до въпроса е неговият пореден номер (след номера на предишния въпрос), а вариантите за отговор са номерирани, като се започне от код 1. За ориентация във въпросите, както и за удобство при последващо въвеждане на данни в компютъра, се препоръчват кодовевъпросите (както и тяхната формулировка) трябва да са подчертани с удебелен шрифт, а възможните им значения (варианти на отговор) трябва да са прости. Например:
75. Посочете средния доход на глава от населението на вашето семейство миналия месец (сумата на член от семейството):
2 - 201-500 рубли. 3-501-1000 rub. 4-1001-2000 rub. 5-2001-5000 rub. 6 - над 5000 рубли.
Ясно е, че реално доходът на всеки от респондентите може да попадне само в един от интервалите. Ако респондентът, отговаряйки на този въпрос от въпросника, е отбелязал опция 5 (огради я с кръгче или постави отметка до нея), тогава при въвеждане на данни в компютъра ще поставите този номер на позиция 75 (номер на въпроса).
Ситуацията е различна при кодиране на безалтернативни въпроси. В този случай трябва да кодирате всяка опция за отговор като отделна променлива във въпросника. Въпреки че всъщност това е само една от стойностите на променливата. Да речем, че задавате въпрос на респондент относно това, от което е бил недоволен, когато е посетил магазин. В този случай променливата всъщност може да бъде определена като "фактор на недоволство". Раздразнението на купувача може
причина само една причина, или може би няколко (въпреки че е възможно той да е доволен от всичко или просто безразличен). В такива случаи всяка от опциите за отговор се кодира като отделна променлива, а самият въпрос не се кодира:
От какво останахте недоволни, когато посетихте нашия магазин (отбележете всички, които са причинили недоволството ви):
35 - тясна стая
36 - грубост на продавачите
37 - неподреденост на персонала
38 - изтекъл срок на годност
Моля, обърнете внимание: номерът на всеки от вариантите за отговор е с удебелен шрифт. Това означава, че при компютърно въвеждане всяка позиция в реда, на местата, съответстващи на тези кодове (35, 36 и т.н.), ще заеме отделно място ище бъде обозначено с числото 1 (отметнато) или 0 (без отметка). Ако номерираме въпроса с удебелен шрифт, а всеки от вариантите за отговор с прост, тогава ще се затрудним какъв номер да поставим на съответната позиция в случай, че респондентът е отбелязал няколко варианта.
И последната забележка. След като кодирането приключи, проверете дали редът на номерата на променливите кодове е правилен. Ако сте пропуснали едно или две числа (например след променлива 23 веднага следва променлива номер 26), това ще доведе до необходимостта от попълване на няколко позиции в базата данни с нули за всеки въпросник (ред). При достатъчно голям масив от извадки (достигащ до няколко хиляди респонденти) това ще доведе до осезаеми непроизводителни разходи за труд и време. Още по-лошо е, когато две променливи в ред са номерирани с един и същ код (или кодовият номер на следващата променлива е по-малък от предишния). Това означава, че губите място на линията за една или повече позиции. Този вид пропуск може да доведе до необходимостта от прекодиране на всички въпроси, като се започне от мястото на грешката.