Комплекси (батерии) от тестове - стр
4.7.3 Комплекси (батерии) от тестове
В изследователската и спортната практика често се използват не един, а няколко теста с обща цел. Такава група се нарича комплекс или батерия от тестове. Обичайно е да се разграничават два вида такива комплекси: хомогенни и хетерогенни.
Комплекси, състоящи се от различни тестове, които оценяват едно и също свойство, се наричат хомогенни (например няколко различни теста за оценка на издръжливостта). Резултатите от такива тестове трябва да имат висока корелация помежду си. Ако резултатите от два или повече теста имат висока корелация, близка до единица, те са силно хомогенни или еквивалентни. Еквивалентните тестове са взаимозаменяеми, защото изглежда, че се дублират един друг.
Комплекси, състоящи се от тестове, които оценяват различни свойства, се наричат хетерогенни. Например комплекс за оценка на общата физическа подготовка, състоящ се от тестове, които оценяват: сила, бързина, ловкост, издръжливост, гъвкавост. Тестовете, включени в разнороден комплекс, не трябва да имат висока корелация помежду си.
4.7.4 Критерии за допустимост на теста
Всеки тест, независимо от неговото съдържание, цел или обхват, трябва да бъде оценен по отношение на неговата пригодност за решаване на задачата. Най-честите характеристики, които определят пригодността на теста са: трудност, дължина, продължителност, скорост, надеждност, информативност. Всички тези свойства на теста могат да бъдат оценени само по отношение на конкретна статистическа популация. Това означава, че нито един тест няма универсална пригодност, това зависи от целта на изследването и характеристиките на изследваната популация (катокато пол, възраст, здравословно състояние, физическа годност, квалификации и др.). Първо, разгледайте първите 4 от изброените по-горе характеристики.
Трудността на теста (P) характеризира неговата достъпност за изследваните лица. Количествена характеристика на трудността на теста за даден контингент обикновено е делът на лицата (относителна честота), изпълнили задачата:
(1),
където m е броят на хората, завършили теста,
n е общият брой на субектите.
Един и същ тест представлява различна трудност за деца и възрастни, за спортисти и начинаещи и т.н. По този начин понятието „трудност на теста“ не се отнася до отделен тестов обект (за когото тестът може да се окаже много лесен или, напротив, като цяло невъзможен), а до определена статистическа съвкупност като цяло. Ако различните тестове имат различни P стойности в една и съща група хора, това показва, че тестовете не са еднакво трудни. Ако в различни групи едни и същи тестове имат различно P, това показва различна подготвеност на групите.
Продължителността на теста (D), в зависимост от съдържанието му, може да бъде изразена в различни мерки. Например в броя на опитите (хвърляния към баскетболния кош), в дължината на пътя (разстоянието на бягане), времето, необходимо за изпълнение на задачата (например за изпълнение на максималния брой потупвания в теста за потупвания за 10 секунди). Следователно „продължителността на теста“ е относително понятие, свързано с възможността за удължаване или съкращаване на теста.
Скоростта на теста се определя от съотношението на дължината на теста към времето за изпълнение D/t. Скоростта на теста може да бъде зададена от формулировката на теста и да бъде едно от условията за неговото изпълнение. Например въртене на педалите на велоергометър с темп от 60 оборота в минута. Промяната на скоростта на теста е възможна чрез увеличаване на дължината или продължителността му. INИ в двата случая се променя трудността на теста и в резултат на това неговата надеждност и информационно съдържание.
Точността на резултатите от теста се оценява по различен начин от точността на измерванията. При оценка на точността на измерване, неговият резултат се сравнява с резултата от по-точно (референтно) измерване. При тестване възможността за такова сравнение отсъства. Следователно в теорията на тестовете не се оценява точността на измерването, а свойствата на самия тест (приема се, че измерването се извършва с достатъчна точност).
В теорията на теста не се оценява точността на измерването, а свойствата на самия тест (разбира се, че измерването се извършва с
Сравнимостта на резултатите от теста се осигурява чрез спазване на стандартните условия на процедурата за тестване, което позволява да се сравнят резултатите, получени по време на многократно тестване на един и същ субект или различни субекти на теста помежду си.
1 Трябва да се определи целта на теста.
2 Стандартизиране на процедурата (методологията и условията на теста трябва да бъдат еднакви във всички случаи на теста).
3 Тестът трябва да има достатъчна надеждност.
4 Тестът трябва да бъде информативен.
5 Трябва да се разработи система за оценяване на резултатите от теста.
Тестовете, които отговарят на изискванията за надеждност и информативност, се наричат автентични (автентични, здрави).
Разгледайте значението на основните критерии за пригодност на тестовете.
Правилното определяне на целта на тестването допринася за по-информиран избор на тестове. По този начин тестването може да се проведе, за да се: идентифицира нивото на обща или специална физическа, техническа, тактическа, психологическа или функционална годност на участващите. Във всеки от тези случаи са необходими различни тестове. С изключениеОсвен това, в зависимост от целта на изпитването, изискванията за тестовите свойства също могат да бъдат различни. Например, изискванията към тестовете, предназначени за оперативен, текущ или поетапен контрол, не са еднакви. Критериите за пригодност на тестовете, предназначени да оценят състоянието на спортиста и да предскажат неговите постижения в далечното бъдеще, също се различават.
Сравнимостта на резултатите от теста се осигурява чрез спазване на стандартните условия на процедурата за тестване, което позволява да се сравнят резултатите, получени по време на многократно тестване на един и същ субект или различни субекти на теста помежду си. Съответствие с това изискване се постига, когато са изпълнени следните условия:
схемата за изпълнение на теста трябва да бъде постоянна от един тест на друг;
условията, при които се извършва всеки тест, трябва да бъдат възможно най-еднакви;
режимът на деня, предшестващ теста, трябва да бъде еднакъв за всички предмети;
загряването преди извършване на теста (ако е необходимо) винаги трябва да бъде стандартно.
Тестването, ако е възможно, трябва да се извършва от същите лица:
интервалите между повторните опити за извършване на теста трябва да са достатъчни, за да се възстанови състоянието на субекта след предишния опит;
ако резултатът от теста изисква проява на максималните възможности на субекта, той трябва да се стреми да покаже този максимум.
4.7.5 Надеждност на теста
За да могат резултатите от теста да разграничат с достатъчна увереност два (или повече) субекта или да се каже, че противоречивите резултати от две измервания на едно и също лице показват промяна в неговото състояние, тестът трябва да е надежден.
ПодНадеждността на теста се разбира като способността да дава последователни резултати при многократно измерване на едни и същи хора в едно и също състояние. Поради редица причини нито един тест не може да даде абсолютно съвпадение на резултатите при повторно измерване.
Теорията за надеждността на теста идва от факта, че резултатът от всяко измерване, извършено върху човек - X - е сумата от три количества:
(2), (1),
където Xo е истинската стойност на измерената стойност, която искаме да фиксираме;
Xe - грешка, причинена от колебания в състоянието на обекта;
Xm е грешката, въведена от измервателния уред*.
* Теорията на теста предполага, че Xm е много по-малък от Xe, така че Xm обикновено се пренебрегва. Разбира се, това предположение трябва да бъде обосновано, т.е. трябва да бъде осигурена точността на измерване, необходима за изпълнение на това условие.
Причините, които намаляват надеждността на теста са следните:
промяна в състоянието на субектите (умора, работоспособност и др.);
неконтролирани промени във външните условия и оборудване (промени в температурата, влажността на въздуха, скоростта на вятъра, атмосферното налягане, колебанията на напрежението в мрежата на измервателните уреди и др.);
промяна в състоянието на лицето, което извършва измерването (или замяната му с друго лице);
несъвършенство на самия тест (например хвърляне на топката в баскетболна кошница преди първия пропуск).
На практика всички горепосочени причини могат да действат заедно, но делът на тяхното влияние във всеки конкретен случай може да бъде различен. Без специални техники е невъзможно отделно да се оцени влиянието на всяка от причините. Следователно не е възможно с достатъчна вероятност да се вземе практическо решение, за да се направи преценка какво е причинило несъответствието.резултатите от две или повече последователни измервания, промяна в състоянието на обекта или влиянието на втора, трета или четвърта причина. Подобна ситуация възниква, ако е необходимо да се сравнят резултатите от тестовете на различни субекти, ако техните резултати (и ранговете им) се променят по време на многократни измервания. Без специален анализ е невъзможно да се разбере какво причинява тези промени, както е невъзможно да се прецени със сигурност кой от субектите има по-високо измерено качество.
Естествено, не всички тестове имат достатъчна надеждност, освен това един и същ тест при различни условия и върху различен контингент от субекти може да има различна надеждност. По този начин понятието „надеждност на теста“ може да се отнася до различни аспекти. В зависимост от това коя от причините, които намаляват надеждността на теста, е основната, надеждността на теста може да бъде разделена на няколко разновидности: възпроизводимост, стабилност и последователност.
Възпроизводимост на теста и как да го оцените
Възпроизводимостта на теста се разбира като степен на съответствие между резултатите от многократно тестване на едни и същи лица в същото състояние, получени от един и същ изследовател с минимален интервал от време между първото и второто измерване. Често говорейки за надеждността на теста, те имат предвид именно неговата възпроизводимост.
По принцип, когато оценява възпроизводимостта на даден тест, изследователят може да се интересува от два въпроса: дали ранговете на субектите се променят от първото към второто измерение (т.е. тяхната позиция в групата един спрямо друг) и дали нивото на резултата се променя от първото към второто измерение.
Най-простият начин да се отговори на първия въпрос е да се изчисли коефициентът на корелация между две повторени измерваниявърху същата проба (n> 20). Тази процедура се нарича "метод тест-повторен тест". Първото измерване се нарича тест, а второто се нарича повторен тест. Коефициентът, получен по този начин, се означава като rtt и служи като количествена мярка за възпроизводимостта на теста.
Няма общоприети критерии за надеждност, но могат да се използват следните степени на оценка:
0,95 и> – отлична надеждност 0,90–0,95 – висока,