Interval spoľahlivosti - čo to je, definícia a koncept

Obsah:

Anonim

Interval spoľahlivosti je technika odhadu používaná pri štatistickom odvodení, ktorá umožňuje obmedziť pár alebo niekoľko párov hodnôt, v rámci ktorých sa nájde požadovaný bodový odhad (s určitou pravdepodobnosťou).

Interval spoľahlivosti nám umožní vypočítať dve hodnoty okolo priemeru vzorky (jedna horná a jedna dolná). Tieto hodnoty obmedzia rozsah, v ktorom sa s určitou pravdepodobnosťou bude nachádzať parameter populácie.

Interval spoľahlivosti = stredná odchýlka + - odchýlka

Poznať skutočnú populáciu je vo všeobecnosti niečo veľmi komplikované. Zvážte populáciu 4 milióny ľudí. Mohli by sme vedieť priemerné výdavky na spotrebu tejto populácie v domácnosti? V zásade áno. Jednoducho by sme museli zisťovať všetky domácnosti a vypočítať priemer. Nasledovať tento proces by však bolo mimoriadne namáhavé a štúdium by sa dosť skomplikovalo.

V situáciách, ako je táto, je reálnejšie zvoliť štatistickú vzorku. Napríklad 500 ľudí. A na uvedenej vzorke vypočítajte priemer. Aj keď by sme stále nepoznali skutočnú hodnotu populácie, mohli sme predpokladať, že sa bude blížiť hodnote vzorky. To znamená, že pripočítame hranicu chyby a máme hodnotu intervalu spoľahlivosti. Na druhej strane túto medzeru chyby odpočítame od priemeru a budeme mať ďalšiu hodnotu. Medzi týmito dvoma hodnotami bude priemerná hodnota populácie.

Záverom možno povedať, že interval spoľahlivosti neslúži na bodový odhad populačného parametra, ak nám má pomôcť získať približnú predstavu o tom, ktorý by mohol byť ten pravý. Umožňuje nám to obmedziť medzi dvoma hodnotami, kde sa bude nachádzať priemer populácie.

koeficient variácieKumulatívna frekvencia

Faktory, od ktorých závisí interval spoľahlivosti

Výpočet intervalu spoľahlivosti závisí hlavne od nasledujúcich faktorov:

  • Vybraná veľkosť vzorky: V závislosti od množstva údajov, ktoré sa použili na výpočet hodnoty vzorky, sa bude viac-menej blížiť skutočnému parametru populácie.
  • Úroveň sebavedomia: Bude nás informovať, v akom percentuálnom prípade je náš odhad správny. Zvyčajné úrovne sú 95% a 99%.
  • Miera chyby nášho odhadu: Toto sa nazýva alfa a informuje nás o pravdepodobnosti, že hodnota populácie je mimo nášho rozsahu.
  • Odhad vo vzorke (priemer, odchýlka, rozdiel priemerov …): Od toho bude závisieť pivotná štatistika pre výpočet intervalu.

Príklad intervalu spoľahlivosti pre priemer za predpokladu normality a známej štandardnej odchýlky

Pivotná štatistika použitá na výpočet by bola nasledovná:

Výsledný interval by bol nasledovný:

Vidíme, ako v intervale naľavo a napravo od nerovnosti máme dolnú a hornú hranicu. Preto nám tento výraz hovorí, že pravdepodobnosť, že priemerná populácia leží medzi týmito hodnotami, je 1-alfa (úroveň spoľahlivosti).

Poďme sa lepšie pozrieť na vyššie uvedené pomocou príkladu vyriešeného cvičenia.

Chcete odhadnúť priemerný čas, ktorý bežec potrebuje na absolvovanie maratónu. Na tento účel bolo načasovaných 10 maratónov a boli získané priemerne 4 hodiny so štandardnou odchýlkou ​​33 minút (0,55 hodiny). Chcete získať 95% interval spoľahlivosti.

Aby sme získali interval, stačilo by nám nahradiť údaje vo vzorci intervalu.

Interval spoľahlivosti by bola časť distribúcie, ktorá je zafarbená modrou farbou. Tým sú ohraničené 2 hodnoty, ktoré zodpovedajú 2 červeným čiaram. Stredná čiara, ktorá rozdeľuje distribúciu na 2, by bola skutočná hodnota populácie.

Je dôležité poznamenať, že v tomto prípade, vzhľadom na to, že hustotná funkcia distribúcie N (0,1) nám dáva kumulatívnu pravdepodobnosť (zľava po kritickú hodnotu), musíme nájsť hodnotu, ktorá nám ponechá 0,975 na ľavé% (to je 1,96).