Odchýlka v kvartile - čo to je, definícia a pojem

Obsah:

Odchýlka v kvartile - čo to je, definícia a pojem
Odchýlka v kvartile - čo to je, definícia a pojem
Anonim

Kvartilová odchýlka je štatistická miera disperzie, ktorá vracia centrálnu hodnotu medzikvartilového rozsahu a používa sa v skreslených množinách údajov.

Inými slovami, kvartilová odchýlka spočíva v výpočte mediánu medzikvartilového rozsahu (IQR) a používa sa v množinách údajov s pomerne extrémnymi hodnotami.

Zkratkou pre kvartilovú odchýlku je DQ.

Medzikvartilový rozsah

Medzikvartilový rozsah je mierou rozptylu súboru údajov, ktorý sa zvyčajne používa v rámčekovom grafe. Inými slovami, medzikvartilový rozsah je rozdiel medzi predposledným a prvými kvartilmi distribúcie použitej v krabicovom grafe.

IQR = Q3 - Q1

Výhodou použitia medzikvartilového rozsahu je, že je možné vypočítať kvartilovú odchýlku (DQ), čo je veľmi adekvátna miera disperzie, keď máme skreslené súbory údajov.

Vzorec odchýlky od kvartilu

Odchýlka kvartilu sa počíta ako delenie medzikvartilového rozsahu číslom 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Pretože berieme do úvahy iba disperziu medzi tretím a prvým kvartilom, ignorujeme všetky údaje mimo tohto rozsahu. A preto sú všetky hodnoty blízke extrémom. Ak teda vydelíme medzikvartilový rozsah dvoma, dostaneme strednú hodnotu disperzie.

Príklad kvartilovej odchýlky

Predpokladáme, že chceme vypočítať medzikvartilový rozsah a kvartilovú odchýlku počtu cyklistov, ktorí okolo nášho domu prechádzajú počas roka.

  1. Najskôr spočítame cyklistov a zhromaždíme informácie do tabuľky.
  1. Po druhé, vypočítame prvý a tretí kvartil, aby sme dostali medzikvartilový rozsah.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Po tretie, vypočítame kvartilovú disperziu jednoduchým vydelením medzikvartilového rozsahu dvoma.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilové rozpätie pre túto množinu údajov je 175. Toto číslo je centrálnou hodnotou medzikvartilového rozsahu.

Je dôležité poznamenať, že údaje za mesiac júl sú extrémne údaje, pretože sú niekoľkonásobne vyššie ako všetky ostatné údaje. Dalo by sa teda povedať, že tento súbor údajov je k danému mesiacu skreslený. Vďaka „neznalosti“ kvartilovej disperzie smerom k extrémnym údajom je výsledok tohto opatrenia veľmi podobný, ako keby v júli obiehalo iba 600 cyklistov. Ak by v júli bolo iba 600 cyklistov, rozptyl kvartilu by bol 162,5, čo je veľmi blízko 175, ak vezmeme do úvahy, že počet cyklistov v danom mesiaci je 10-krát menší.