Jedná sa o neparametrické opatrenie závislosti, ktoré identifikuje zhodné a nezhodné páry dvoch premenných. Po identifikácii sa spočítajú súčty a vytvorí sa kvocient.
Klasifikované korelácie sú neparametrickou alternatívou ako miera závislosti medzi dvoma premennými, keď nemôžeme použiť Pearsonov korelačný koeficient.
Inými slovami, pozorovaniam každej premennej priradíme poradie a študujeme vzťah závislosti medzi dvoma danými premennými. Existujú dva spôsoby, ako vypočítať Kendall's Tau; po objednaní pozorovaní každej premennej sa rozhodneme vypočítať vzťah závislosti. V našom príklade uvidíme, že sme zoradili rebríčky v stĺpci X vzostupne.
Matematicky
Definujeme:
C.n = celkový počet zodpovedajúcich párov.
NCn = celkový počet nesúhlasných (nesúladných) párov.
Postup a praktický príklad
Aby sme získali Kendallovo Tau, musíme najskôr vedieť, ako identifikovať zhodné a nezhodné páry dvoch premenných.
Využijeme preferencie lyžiarov. V tomto príklade predpokladáme, že chceme vyhodnotiť, či lyžiari klasifikujú svoje preferencie pre alpské lyžovanie alebo severské lyžovanie v rovnakom poradí na stanici i. Ich hodnotenie sa môže pohybovať od 1 (veľmi výhodné) do 7 (veľmi málo výhodné).
Naša otázka by znela: existuje závislosť medzi preferenciami zjazdových lyžiarov a severských lyžiarov v daných lyžiarskych strediskách?
Definujeme:
X = hodnotenie lyžiarov pre alpské lyžovanie v stanici i.
Y = hodnotenie lyžiarov pre severské lyžovanie na stanici i.
C = zhodné páry.
NC = nezhodné / nezhodné páry.
Ai = lyžiarske stredisko i.
Proces
- Vychádzame zo vzorky n = 7 pozorovania lyžiarskych stredísk. Každý riadok tabuľky predstavuje klasifikáciu uvedenú lyžiarmi. Každá dvojica staníc môže byť zhoda alebo nesúlad. V stĺpcoch C a NC počítame páry iba v jednom smere. Napríklad dvojica AB a BA sa počíta ako jeden pár, aby sa zabránilo opakovaniu.
Získané pozorovania sú:
Lyžiarsky areál (i) | X | Z |
TO | 1 | 1 |
B | 2 | 3 |
C. | 3 | 4 |
D | 4 | 2 |
A | 5 | 7 |
F | 6 | 6 |
G | 7 | 5 |
- Zoradili sme prvky stĺpca X vzostupne, aby sme ich mohli porovnať s prvkami stĺpca Z
- Nájdeme zhodné páry a nezhodné páry.
Lyžiarsky areál (i) | X | Z | C. | NC | |
TO | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C. | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
A | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | Celkom |
- Najprv sa pozrieme na stĺpec Z, pretože stĺpec X je už zoradený vzostupne. V dôsledku toho budú všetky klasifikácie v stĺpci Z, ktoré nie sú vzostupné, nesúhlasné dvojice staníc.
- Keď hľadáme páry staníc (zhodné a nesúhlasné), budeme mať vždy posledný rad pozorovaní, pretože hľadáme dvojice (súbory dvoch pozorovaní).
- Všetci, ktorí sú pod referenčnou klasifikáciou, budú zhodné páry. V prvom prípade obaja lyžiari stanovia referenčnú klasifikáciu na 1. Všetky klasifikácie nižšie ako 1 budú páry zodpovedajúce zhode s A. Celkovo máme na klasifikáciu 7 staníc. Takže bude 6 zhodných párov A. Pretože nemáme žiadne nesúhlasné páry spojené s A, dáme nulu.
Prečítajte si druhú časť Kendall's Tau (II)