Kendall's Tau (I) - Čo to je, definícia a koncept

Obsah:

Kendall's Tau (I) - Čo to je, definícia a koncept
Kendall's Tau (I) - Čo to je, definícia a koncept
Anonim

Jedná sa o neparametrické opatrenie závislosti, ktoré identifikuje zhodné a nezhodné páry dvoch premenných. Po identifikácii sa spočítajú súčty a vytvorí sa kvocient.

Klasifikované korelácie sú neparametrickou alternatívou ako miera závislosti medzi dvoma premennými, keď nemôžeme použiť Pearsonov korelačný koeficient.

Inými slovami, pozorovaniam každej premennej priradíme poradie a študujeme vzťah závislosti medzi dvoma danými premennými. Existujú dva spôsoby, ako vypočítať Kendall's Tau; po objednaní pozorovaní každej premennej sa rozhodneme vypočítať vzťah závislosti. V našom príklade uvidíme, že sme zoradili rebríčky v stĺpci X vzostupne.

Matematicky

Definujeme:

C.n = celkový počet zodpovedajúcich párov.

NCn = celkový počet nesúhlasných (nesúladných) párov.

Postup a praktický príklad

Aby sme získali Kendallovo Tau, musíme najskôr vedieť, ako identifikovať zhodné a nezhodné páry dvoch premenných.

Využijeme preferencie lyžiarov. V tomto príklade predpokladáme, že chceme vyhodnotiť, či lyžiari klasifikujú svoje preferencie pre alpské lyžovanie alebo severské lyžovanie v rovnakom poradí na stanici i. Ich hodnotenie sa môže pohybovať od 1 (veľmi výhodné) do 7 (veľmi málo výhodné).

Naša otázka by znela: existuje závislosť medzi preferenciami zjazdových lyžiarov a severských lyžiarov v daných lyžiarskych strediskách?

Definujeme:

X = hodnotenie lyžiarov pre alpské lyžovanie v stanici i.

Y = hodnotenie lyžiarov pre severské lyžovanie na stanici i.

C = zhodné páry.

NC = nezhodné / nezhodné páry.

Ai = lyžiarske stredisko i.

Proces

  • Vychádzame zo vzorky n = 7 pozorovania lyžiarskych stredísk. Každý riadok tabuľky predstavuje klasifikáciu uvedenú lyžiarmi. Každá dvojica staníc môže byť zhoda alebo nesúlad. V stĺpcoch C a NC počítame páry iba v jednom smere. Napríklad dvojica AB a BA sa počíta ako jeden pár, aby sa zabránilo opakovaniu.

Získané pozorovania sú:

Lyžiarsky areál (i) X Z
TO 1 1
B 2 3
C. 3 4
D 4 2
A 5 7
F 6 6
G 7 5
  1. Zoradili sme prvky stĺpca X vzostupne, aby sme ich mohli porovnať s prvkami stĺpca Z
  2. Nájdeme zhodné páry a nezhodné páry.
Lyžiarsky areál (i) X Z C.NC
TO 1 1 6 0
B 2 3 5 0
C. 3 4 5 1
D 4 2 4 0
A 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Celkom
  • Najprv sa pozrieme na stĺpec Z, pretože stĺpec X je už zoradený vzostupne. V dôsledku toho budú všetky klasifikácie v stĺpci Z, ktoré nie sú vzostupné, nesúhlasné dvojice staníc.
    • Keď hľadáme páry staníc (zhodné a nesúhlasné), budeme mať vždy posledný rad pozorovaní, pretože hľadáme dvojice (súbory dvoch pozorovaní).
    • Všetci, ktorí sú pod referenčnou klasifikáciou, budú zhodné páry. V prvom prípade obaja lyžiari stanovia referenčnú klasifikáciu na 1. Všetky klasifikácie nižšie ako 1 budú páry zodpovedajúce zhode s A. Celkovo máme na klasifikáciu 7 staníc. Takže bude 6 zhodných párov A. Pretože nemáme žiadne nesúhlasné páry spojené s A, dáme nulu.

Prečítajte si druhú časť Kendall's Tau (II)