Kendall's Tau (II) - Čo to je, definícia a pojem

Jedná sa o neparametrické opatrenie závislosti, ktoré identifikuje zhodné a nezhodné páry dvoch premenných. Po identifikácii sa spočítajú súčty a vytvorí sa kvocient.

Inými slovami, pozorovaniam každej premennej priradíme poradie a študujeme vzťah závislosti medzi dvoma danými premennými.

Existujú dva spôsoby, ako vypočítať Kendall's Tau; po objednaní pozorovaní každej premennej sa rozhodneme vypočítať vzťah závislosti. V našom príklade uvidíme, že zoradíme rebríčky v stĺpci X vzostupne.

Klasifikované korelácie sú neparametrickou alternatívou ako miera závislosti medzi dvoma premennými, keď nemôžeme použiť Pearsonov korelačný koeficient.

Na tieto výsledky sme sa zmienili v prvom článku -> Kendall's Tau (I):

Lyžiarsky areál (i) X Z C. NC
TO 1 1 6 0
B 2 3 5 0
C. 3 4 5 1
D 4 2 4 0
A 5 7 4 1
F 6 6 4 1
G 7 5 43 3 CELKOM
  • Pár BC-CB je nesúladný pár. Zadáme 1 do stĺpca NC a zmrazíme počítadlo na poslednej pozícii, kým opäť nenájdeme zodpovedajúci pár. V tomto prípade sme zmrazili počet zodpovedajúcich párov na 5 až po stanicu D. Stanica D môže tvoriť iba 4 zodpovedajúce páry: AD-DA, DE-ED, DF-FD, DG-GD.

Ďalším sporným párom by bol EF-FE:

  • Pár EF-FE je nesúladný pár. Do stĺpca NC napíšeme 1 a pokračujeme v ťahaní počtu 4 zhodných párov, ktoré je možné vytvoriť. Zhodné páry stanice E by boli: EA-AE, EB-BE, EC-CE, ED-DE, pretože EF-FE je nezhodný.
    • Pár FG-GF je nesúladný pár. Do stĺpca NC napíšeme 1 a pokračujeme v ťahaní počtu 4 zhodných párov, ktoré je možné vytvoriť. Zhodné páry stanice F s (nezmenili sme namiesto 4. Zhodné páry, ktoré sme mohli predtým zobraziť (nemenili sme, by boli: FA-AF, FB-BF, FC-CF, FD-DF. pretože FG-GF je nepríjemný.

Vypočítame Kendallovo Tau

Kendall's Tau nemá tajomstvo okrem toho, že je kvocientom zhodných a nezhodných párov vzorky pozorovaní.

Výklad

Naša počiatočná otázka bola: existuje vzťah medzi preferenciami zjazdových lyžiarov a severských lyžiarov v daných lyžiarskych strediskách?

V tomto prípade máme závislosť medzi dvoma premennými 0,8695. Výsledok veľmi blízko hornej hranici. Tento výsledok nám hovorí, že alpskí lyžiari (X) a severskí lyžiari (Z) klasifikovali strediská podobnou klasifikáciou.

Bez toho, aby sme museli robiť akýkoľvek typ výpočtu, vidíme, že prvé stanice (A, B, C) dostávajú najlepšie skóre z týchto dvoch skupín. Inými slovami, hodnotenie lyžiarov sa uberá rovnakým smerom.

Porovnanie: Pearson vs Kendall

Ak vypočítame Pearsonov korelačný koeficient vzhľadom na predchádzajúce pozorovania a porovnáme ho s Kendallovým Tau, dostaneme:

V tomto prípade nám Kendall's Tau hovorí, že medzi premennými X a Z existuje silnejší vzťah závislosti v porovnaní s Pearsonovým korelačným koeficientom: 0,8695> 0,75.

Keby mali odľahlé hodnoty veľký vplyv na výsledky, našli by sme veľký rozdiel medzi Pearsonom a Spearmanom, a preto by sme mali použiť Spearmana ako mieru závislosti.