Dostatočná štatistika - čo to je, definícia a koncept

Obsah:

Anonim

Postačujúca štatistika pre parameter Θ je taká, ktorá je schopná zhromaždiť alebo zhrnúť všetky informácie, ktoré obsahuje vzorka náhodnej premennej X.

Vieme, že štatistika je skutočnou funkciou vzorky. To znamená, že berie skutočné hodnoty obsiahnuté vo vzorke. Odtiaľ, ako sme videli v článku, v ktorom je definovaný pojem štatistika, musíme zabezpečiť, aby štatistik mal určité vlastnosti. Prečo požadovať také vlastnosti? Aby sme zaistili, že štatistika je užitočná pre naše účely.

Jednou z týchto vlastností je dostatočnosť. Oveľa jednoduchším spôsobom si povieme, že štatistika je dostatočná, ak využíva všetky informácie obsiahnuté vo vzorke.

Ako zistiť, či stačí štatistika?

Logicky vyvstáva otázka: Ako môžem zistiť, či štatistika T spĺňa vlastnosť dostatočnosti? Alebo Ako môžem nájsť, ak existuje, štatistiku, ktorá spĺňa vlastnosť dostatočnosti. Odpoveď na tieto dve otázky možno nájsť v dvoch vetách:

  • Kritérium faktorizácie podľa Fishera-Neymana: Toto kritérium uvádza, že vzhľadom na štatistiku T, ak spĺňa určité podmienky, bude to dostatočná štatistika.
  • Darmoisova veta: Táto veta odpovedá na druhú otázku. To znamená, že nám umožňuje nájsť dostatočnú štatistiku pomocou série postupov.

Príklad dostatočnej štatistiky

Predpokladajme, že chceme vypočítať priemerný ročný príjem rodín s bydliskom v Čile. Aby sme to dosiahli, budeme postupovať podľa nasledujúceho procesu:

  1. Zhromaždiť informácie (vzorka): Pretože sa nemôžeme pýtať každej z rodín s bydliskom v Chile, koľko ročne zarobia, zoberieme reprezentatívnu vzorku napríklad 1 000 rodín.
  2. Identifikujte náhodnú premennú, ktorá je predmetom štúdie: Náhodná premenná, ktorá je predmetom štúdie, je rodinný príjem. Teda: X → Rodinný príjem
  3. Vyberte správnu štatistiku: Vhodná štatistika na výpočet priemerného príjmu nie je nič iné ako očakávanie X. Inými slovami, priemerná vzorka X.
  4. Ako môžem zistiť, či je štatistický priemer vzorky dostatočný? Pretože už máme matematické vyjadrenie štatistiky, použijeme Fisherovo-Neymanovo faktoringové kritérium. Alebo Darmoisova veta. Sú to vzorce vytvorené na tento účel.

Po použití správnych výpočtov sme dospeli k záveru, že vzorová stredná štatistika spĺňa požiadavku alebo vlastnosť dostatočnosti. Zabezpečením splnenia tejto požiadavky zabezpečujeme, aby táto (štatistická) funkcia, ktorá nám umožňuje syntetizovať informácie (priemerný príjem), využívala všetky informácie obsiahnuté vo vzorke (1 000 rodín).

Prečo je dôležité, aby som použil všetky informácie zo vzorky?

Teraz, keď vieme, že výberový priemer je dostatočná štatistika, predpokladajme prípad. Aký zmysel by to malo, keby sme chceli vypočítať priemerný príjem na základe tých 1 000 čílskych rodín a že by sme použili iba údaje od 500 rodín?

Samozrejme, nedávalo by to žiadny zmysel. Chceme súhrn všetkých informácií. To je to, čo sme definovali ako dostatočnú štatistiku.