Box Plot - čo to je, definícia a koncept

Obsah:

Anonim

Boxplot, z angličtiny boxplot, je reprezentácia kvantitatívnej alebo kategorickej premennej za účelom rýchlej identifikácie kvartilov súboru dát.

Inými slovami, boxplot je graf, ktorý predstavuje kvantitatívnu alebo kvalitatívnu premennú v kvartiloch.

V štatistike je to užitočný nástroj na reprezentáciu diskrétnych aj spojitých súborov údajov.

Je dôležité mať na pamäti, že kvalitatívne premenné premenné alebo tie, ktoré majú predstavovať poradie alebo kategóriu, musia byť vždy spojené s číselným indexom väčším ako 0, aby sa mohli zobraziť v grafe a bolo možné vypočítať zodpovedajúcu štatistiku.

Krabicový graf a histogram

Krabicový graf nie je nič iné ako histogram pri pohľade zhora a rovnako je histogram krabicový graf pri pohľade zboku. Príklad je uvedený nižšie.

Prvou charakteristikou, ktorú zdieľajú obidva grafy, je minimum a maximum množiny údajov. Koncové lišty za pomlčkami označujú minimum (dolná lišta) a maximum (horná lišta). Odľahlé hodnoty by boli zastúpené mimo rozsahu maxima a minima. Teda za mrežami po pomlčkách. Nájdeme tiež vodorovné škatuľové grafy.

Na prvý pohľad vidíte, že väčšina údajov je v oboch grafoch sústredená na pozorovania blízko minima. Toto je naznačené grafom poľa, v ktorom je políčko bližšie k minimu ako k maximu. Ak sa pozrieme na histogram, uvidíme, že najčastejšími pozorovaniami sú pozorovania, ktoré sú blízko minima a ďaleko od maxima.

Informácie o políčku

Krabicový graf poskytuje nasledujúce informácie:

  1. Spodná časť škatule je prvý kvartil (Q1).
  2. Pruh v strede poľa je stredný alebo druhý kvartil (Q2).
  3. Horná časť krabice je tretí kvartil (Q3).
  4. Medzikvartilovým rozsahom alebo IQR by bola výška skrinky, to znamená rozdiel medzi Q3 a Q1.

Kľúč poľa s obrázkom

Toto grafické znázornenie sa nazýva rámčekové vykreslenie, pretože vyzerá ako rámček. Preto, aby sme si tento graf zapamätali, stačilo by nám myslieť iba na štvorcový objekt alebo škatuľu.

Pre čitateľov, ktorí sú oboznámení s cenou finančného majetku, uvidia väčšiu podobnosť so sviečkou. Sviečky, ktoré vidíte v ponuke, sú grafy polí prispôsobené zvolenému časovému oknu.

Výhody a nevýhody grafu poľa

Medzi výhody a nevýhody tohto diagramu nájdeme nasledujúce:

Výhoda

  • Globalizovaná vízia absolútnej frekvencie kvantitatívnej alebo kvalitatívnej premennej.
  • Znalosti minima, maxima a kvartilov súboru údajov bez nutnosti ich výpočtu.
  • Extrémne hodnoty sú rozpoznávané rýchlejšie ako pomocou histogramu, pretože extrémne hodnoty sú označené krúžkami mimo maxima a minima.

Nevýhody

  • Ak je množina údajov malá, vykonanie rámcového vykreslenia týchto údajov bude sťažené na pochopenie.

Príklad políčka

Predpokladáme, že chceme reprezentovať počet cyklistov, ktorí okolo nášho domu prejdú v priebehu roka. Najskôr spočítame cyklistov a zhromaždíme informácie do tabuľky.

Prostredníctvom niektorých programov ako R alebo Excel môžeme vygenerovať graf zobrazený nižšie.

Vďaka zastúpeniu počtu cyklistov v rámčeku môžeme rýchlo zistiť, kde je medián, ostatné kvartily, maximum a minimum. V tomto prípade nemáme atypické údaje, pretože za maximom a minimom nič nie je.

Aplikácia tohto typu grafov je veľmi častá vzhľadom na jeho jednoduchosť a užitočnosť v mnohých oblastiach presahujúcich oblasť financií a ekonomiky.