Надеждност на психологическия тест

Надеждността е един от критериите за качеството на теста, неговата стабилност по отношение на грешките на измерването. Има два вида надеждност - надеждност като стабилност и надеждност като вътрешна последователност.

Надеждността като стабилност

Стабилност на резултатите от теста - възможността за получаване на едни и същи резултати от субектите в различни случаи.

Стабилността се определя чрезповторен тест (retest) :

При този метод се предлага да се извършат няколко измервания за определен период от време (от седмица до година) с един и същ тест. Ако корелацията между резултатите от различни измервания е висока, тогава тестът е доста надежден. Въпреки това, надеждността на не всички тестове може да бъде тествана с този метод, тъй като оценяваното качество, явление или ефект може сам по себе си да бъде нестабилен (например нашето настроение, което може да се променя от едно измерване към следващо). Друг недостатък на MR е ефектът на пристрастяване. Субектите вече са запознати с този тест и може дори да си спомнят повечето от отговорите си от предишното завършване.

Надеждността като вътрешна последователност

Вътрешната последователност се определя от връзката на всеки конкретен елемент от теста с общия резултат, от това как всеки елемент противоречи на останалите, от това доколко всеки отделен въпрос измерва атрибута, към който е насочен целият тест.

За да проверите вътрешната последователност, приложете:

Метод на разделяне или метод на автономни части
Еквивалентен празен метод
Алфата на Кронбах

Метод за разделяне на половината надеждност

Този метод се състои в разделяне / разделяне на теста на две равни части (например четни и нечетни въпроси,първа и втора половина), след което се намира връзката между тях. Ако корелацията е висока, тестът може да се счита за надежден.

Еквивалентен празен метод

OIE се състои от използване на два тестови формуляра, сравними един с друг за голяма извадка (например L и M формуляри за измерване на скалата за интелигентност на Станфорд-Бине)

Резултатите от двете форми се сравняват и се изчислява корелация. Ако коефициентът на корелация е висок, тогава тестът е надежден. Недостатъкът на този метод е, че той включва толкова дълъг и трудоемък процес като създаването на две еквивалентни форми.

Алфата на Кронбах

Този метод, предложен от Лий Кронбах, сравнява разпространението на всеки елемент с общото разпространение на цялата скала. Ако разсейването на резултатите от теста е по-малко от разсейването на резултатите за всеки отделен въпрос, тогава всеки отделен въпрос е насочен към изучаване на същата характеристика, свойство или явление. Те произвеждат стойност, която може да се счита за истинска. Ако такава стойност не може да бъде разработена, т.е. когато се отговаря на въпроси, се получава случайно разпространение, тестът не е надежден и алфата на Кронбах ще бъде равна на 0. Ако всички въпроси измерват един и същ атрибут, тогава тестът е надежден и алфата на Кронбах в този случай ще бъде равна на 1.

В допълнение към надеждността на теста има и надеждност на наблюденията – надеждност между наблюдателите. МН е процентът на съвпадение на резултатите от наблюдението на експертите един с друг.

Надеждност и валидност

Надеждността показва, че резултатите от провежданото изследване са близки до истината, а валидността показва, че резултатите наистина се отнасят до явлението, което изследователят изучава. Валидното изследване автоматично е надеждно, но обратнотоследствие не е необходимо. Едно надеждно проучване може да не е валидно.