Spearmanovo rho je neparametrické opatrenie závislosti, pri ktorom sa počíta stredná hierarchia pozorovaní, rozdiely sa štvorčekujú a zakomponujú do vzorca.
Inými slovami, pozorovaniam každej premennej priradíme poradie a študujeme vzťah závislosti medzi dvoma danými premennými.
Klasifikované korelácie sú neparametrickou alternatívou ako miera závislosti medzi dvoma premennými, keď nemôžeme použiť Pearsonov korelačný koeficient.
Spravidla je priradené písmeno giega rho na korelačný koeficient.
Spearmanov odhad rho je daný:
Postup Rho Spearmana
0. Vychádzame zo vzorky n pozorovania (Ai, Bi).
1. Klasifikujte pozorovania každej premennej a upravte ich podľa väzieb.
- Používame funkciu programu Excel, ktorá pre nás klasifikuje pozorovania a automaticky ich upravuje, ak nájde väzby medzi prvkami. Táto funkcia sa nazýva HERARCH.MEDIA (klasifikácia Ai; Klasifikácian;objednať).
- Posledný faktor funkcie je voliteľný a hovorí nám, v akom poradí chceme zoradiť pozorovania. Nenulové číslo zoradí pozorovania vzostupne. Napríklad priradí najmenšiemu prvku poradie 1. Ak do premennej dáme nulu objednať, priradí najväčšej položke pozíciu 1 (zostupne).
Praktický príklad
- V našom prípade priradíme premennej objednávky nenulové číslo, aby sa pozorovania zoradili vzostupne. To znamená priradenie najmenšieho prvku premennej k hodnosti 1.
- Skontrolujeme, či súčet stĺpcov predstavuje celkový súčet Klasifikácia A Y. Klasifikácia B sú si navzájom rovní a stretávajú sa:
V tomto prípade n = 10, pretože v každej premennej máme celkom 10 prvkov / pozorovaní TO Y. B.
Celkový súčet klasifikácie A sa rovná celkovému súčtu klasifikácie Y a takisto spĺňajú vyššie uvedený vzorec.
TO | B | Klasifikácia A | Klasifikácia B | Štvorcové rozdiely |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Celkom | 55 | 55 | 130 |
2. Pridajte rozdiely medzi hodnotením a zarovnajte ich.
- Keď máme všetky klasifikované pozorovania, berúc do úvahy väzby medzi nimi, vypočítame rozdiel vo forme:
di = Ai - Bi
Definujeme (di) ako rozdiel medzi klasifikáciou Ai a klasifikácia Bi.
- Po získaní rozdielu ho vyrovnáme. Druhé mocniny rozdielov sa použijú tak, aby mali iba kladné hodnoty.
Definujeme di2 ako štvorcový rozdiel medzi klasifikáciou Ai a klasifikácia Bi.
V stĺpci štvorcových rozdielov budeme mať:
di2 = (A.i - Bi)2
3. Vypočítajte Spearmanovo rho:
- Vypočítame celkový súčet štvorcových rozdielov formulára:
V našom príklade:
- Výsledok začleňujeme do Spearmanovho vzorca:
V našom príklade:
Porovnanie: Pearson vs Spearman
Ak vypočítame Pearsonov korelačný koeficient na základe predchádzajúcich pozorovaní a porovnáme ho s Spearmanovým korelačným koeficientom, dostaneme:
- Pearson = 0,1109
- Spearman = 0,2121
Vidíme, že závislosť medzi premennými A a B zostáva slabá aj pri použití Spearmana namiesto Pearsona.
Keby mali odľahlé hodnoty veľký vplyv na výsledky, našli by sme veľký rozdiel medzi Pearsonom a Spearmanom, a preto by sme mali použiť Spearmana ako mieru závislosti.