Kvantil - čo to je, definícia a koncept

Obsah:

Anonim

Kvantil je ten bod, ktorý rozdeľuje distribučnú funkciu náhodnej premennej na pravidelné intervaly.

Preto nie je nič iné ako štatistická technika na oddelenie údajov od distribúcie. Samozrejme musí byť splnené, že skupiny sú si rovnocenné. Z tohto dôvodu existujú rôzne typy kvantilov, ako uvidíme neskôr, v závislosti od počtu ich partícií.

Sú mimoriadne užitočné v mnohých praktických aplikáciách, v príklade, ktorý si ukážeme.

Formulár na výpočet kvantilu

Kvantily je možné vypočítať z parametrického a neparametrického hľadiska. Pozrime sa na obidve podrobnejšie a tiež na takzvanú „kvantilovú funkciu“.

  • Parametrické: Používajú sa v distribúciách, ktorých tvar poznáme. To znamená, že rozdelenie bude normálne, rovnomerné, exponenciálne atď. Týmto spôsobom sa predpokladá, že je známa a jej hlavné parametre (aritmetický priemer a odchýlka) rovnako.
  • Neparametrické: Je vhodný pre malé vzorky, kde je ťažké poznať jeho presný tvar, a preto nepoznáme jeho distribučnú funkciu. Táto metóda poskytuje podobné hodnoty ako predchádzajúca, keď sa vzorka zväčšuje, a preto je použitie obidvoch ľahostajné.
  • Kvantilová funkcia: Čaká nás pravdepodobná forma výpočtu. Cieľom je vypočítať hodnotu, ktorá má určitú pravdepodobnosť v distribučnej funkcii. Nebudeme sa venovať matematickým otázkam, ktoré tento koncept komplikujú.

Najčastejšie kvantily

Ukážeme si, ktoré štatistické údaje sú najpoužívanejšie kvantily. Väčšina z nich sa bežne používa na to, aby bolo možné podrobne analyzovať distribúciu údajov. Okrem toho ďalším z použití je rozdelenie údajov do skupín s možnosťou výberu najvyššieho alebo najnižšieho. V príklade to uvidíme podrobnejšie.

  • Kvartil: Rozdeľte hodnoty do štyroch rovnakých skupín a existujú tri kvartily. Je to najčastejšie. Kvartil jeden (Q1) je najnižší údaj a kvartil tri (Q3) je najvyšší. Na druhej strane, kvartil dva (Q2) zodpovedá mediánu (Me), čo je štatistika polohy, ktorá rozdeľuje distribúciu údajov na polovicu. Hodnoty kvantilu by boli 0,25 (Q1), 0,5 (Q2) a 0,75 (Q3).
  • Kvintil: Podobne ako v predchádzajúcom, je menej častý a rozdeľuje údaje na päť rovnakých častí. Preto existujú štyri kvintily. Hodnoty kvantilu by v tomto prípade boli 0,20, 0,40, 0,60, 0,80.
  • Decile: V tomto prípade sú rozdelené na desať častí, a preto je ich deväť decíl. Ani to nie je príliš časté. Ich hodnoty by boli 0,1 až 0,9.
  • Percentily: Stretávame sa s variantom, v ktorom je rozdelenie rozdelené na sto rovnakých častí. Môže to zaujímať veľmi veľké vzorky. Ich hodnoty sa pohybujú od 0,01 do 0,99.

Kvantilny priklad

Pozrime sa na príklad, v ktorom máme sériu údajov o príjmoch obyvateľov určitej obce. Vypočítali sme tri najreprezentatívnejšie kvartily a tri decily. Zahrnieme použité vzorce, berúc do úvahy, že pre decily použijeme ekvivalent v percentiloch. Pamätajte, že údaje v Q2 a D5 sú ekvivalentné mediánu.

Môžeme pozorovať, že príjem jednotlivcov predstavujúcich najmenej zvýhodnených 25% (Q1) je 2 900. Vo vzťahu k decilu je príjem 10% (D1) jednotlivcov, ktorí dostávajú najmenej, 2 800. Rovnaký výklad sa robí s nadriadenými, ale opačne. 25% (Q3), ktoré zarobia najviac, získa príjem 4 100 a 10% 4 800. Kvantil preto odráža príslušné informácie, aby ste sa o premennej dozvedeli viac.