Корелация на ранговите променливи
Ако коефициентът на корелация r-Pearson е неприемлив за количествените данни, тогава корелациите r-Spearman или τ-Kendal могат да бъдат приложени за тестване на хипотезата за връзка между две променливи след предварително класиране. Например, при изследването на психофизичните характеристики на музикално надарени юноши И. А. Лавочкин е използван методът на ранговата корелация.
За правилното изчисляване на двата коефициента (Spearman и Kendall) резултатите от измерванията трябва да бъдат представени в скала от рангове или интервали. Няма фундаментални разлики между тези критерии, но общоприето е, че коефициентът на Kendal е по-„смислен“, тъй като анализира връзките между променливите по-пълно и подробно, като сортира всички възможни съответствия между двойки стойности. Коефициентът на Спирман по-точно отчита количествената степен на връзка между променливите.
Коефициентът на рангова корелация на Спирман е непараметричен аналог на класическия коефициент на корелация на Пиърсън, но неговото изчисление взема предвид не показателите, свързани с разпределението на сравняваните променливи (средно аритметично и дисперсия), а ранговете. Например, необходимо е да се определи връзката между ранговите оценки на личностните черти, които са включени в представата на човек за неговото „Аз съм истински“ и „Аз съм идеален“.
Коефициентът на Спирман също се използва широко в психологическите изследвания. Например в работата на Бушов Ю. В. и Несмелова Н. Н. Коефициентът на рангова корелация на Спирман е използван за изследване на зависимостта на точността на оценка и възпроизвеждане на продължителността на звуковите сигнали от индивидуалните характеристики на човек.
Тъй като този коефициент е аналог на r-Pearson, тогава използването му за тестване на хипотези е подобно на използването на r-Pearson. Това естатистическата хипотеза, която трябва да бъде тествана, процедурата за вземане на статистическо решение и формулирането на смисленото заключение са едни и същи. В компютърните програми (SPSS, Statistica) нивата на значимост за едни и същи коефициенти r-Pearson и r-Spearman винаги съвпадат.
Предимството на r-Spearman пред r-Pearson е по-голямата чувствителност към свързване в следните случаи:
1. значително отклонение на разпределението на поне една променлива от нормалната форма (неправилност, извънредни стойности);
2. криволинейна (монотонна) връзка.
Ограничението за прилагане на коефициента на r-Spearman е:
1. за всяка променлива най-малко 5 наблюдения;
2. Коефициентът за голям брой идентични рангове в едната или двете променливи дава груба стойност.
Коефициентът на рангова корелация tau-b на Кендъл е независим оригинален метод, базиран на изчисляването на съотношението на двойки стойности на две проби, които имат еднакви или различни тенденции (повишаване или намаляване на стойностите). Този коефициент се нарича още коефициент на конкордация. По този начин основната идея на този метод е, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки: ако двойка субекти има промяна в X, която съвпада по посока с промяна в Y, тогава това показва положителна връзка, ако не съвпада, тогава отрицателна връзка. Например при изследване на лични качества, които са от решаващо значение за семейното благополучие. При този метод една променлива се представя като монотонна последователност (например данни на съпруга) във възходящ ред на величина; на друга променлива (например данни на съпругата) се присвояват съответните места за класиране. Броят на инверсиите (нарушения на монотонността в сравнение спърви ред) се използва във формулата за коефициентите на корелация.
Прилагането на коефициента на Kendall е за предпочитане, ако има отклонения в оригиналните данни.
Характеристика на коефициентите на рангова корелация е, че максималните рангови корелации (+1, -1) не съответстват непременно на строги преки или обратно пропорционални връзки между началните променливи X и Y: достатъчна е само монотонна функционална връзка между тях. Ранговите корелации достигат своята максимална модулна стойност, ако по-голямата стойност на една променлива винаги съответства на по-голяма стойност на друга променлива (+1) или по-голямата стойност на една променлива винаги съответства на по-малка стойност на друга променлива и обратно (-1).
Статистическата хипотеза, която трябва да бъде тествана, процедурата за вземане на статистическо решение и формулирането на смислено заключение са същите като в случая на r-Spearman или r-Pearson.
Ако не е намерена статистически значима връзка, но има причина да се смята, че наистина има връзка, тогава трябва първо да преминете от r-Spearman към τ-Kendal (или обратно) и след това да проверите за възможни причини за ненадеждността на връзката.
1. Нелинейна връзка За това вижте двуизмерната точкова диаграма. Ако връзката не е монотонна, разделете пробата на части, в които връзката е монотонна, или разделете пробата на контрастни групи и след това ги сравнете според нивото на проява на симптома.
2. Хетерогенност на пробата (вижте 2D диаграма на разсейване). Опитайте се да разделите извадката на части, в които връзката може да има различни посоки.
Ако връзката е статистически значима, тогава преди да се направи смислено заключение, е необходимо да се изключи възможността за фалшива корелация (по аналогия с метричните коефициентикорелации).