Štatistická normalizácia - čo to je, definícia a pojem

Obsah:

Anonim

Štatistická normalizácia je škálová transformácia distribúcie premennej, aby bolo možné vykonať porovnanie s ohľadom na množiny prvkov a priemer elimináciou účinkov vplyvov.

Inými slovami, normalizácia sú proporcie bez jednotiek merania (bezrozmerné alebo nemenné podľa mierky), ktoré nám umožňujú porovnávať prvky rôznych premenných a rôznych jednotiek merania.

V štatistike a ekonometrii sa štandardizované tabuľky rozdelenia pravdepodobnosti používajú na zistenie pravdepodobnosti, ktorú bude mať pozorovanie, s ohľadom na distribučnú funkciu, ktorú sleduje premenná.

Je dôležité neobmedzovať normalizačný termín iba na množiny prvkov, ktorých normálne rozdelenie je dobrou aproximáciou ich frekvencie.

Štatistická premenná

Tabuľka

V nasledujúcej tabuľke sú uvedené najbežnejšie štandardizácie v štatistikách používaných v oblasti financií a ekonomiky.

  • Typizované alebo štandardné skóre normalizuje chyby, keď môžeme vypočítať parametre vzorky.
  • Normalizácia v Studentovej distribúcii t normalizuje zvyšky, keď parametre nie sú známe, a urobíme odhad na ich získanie.
  • Variačný koeficient používa priemer ako mierku na rozdiel od štandardizovaného skóre a Studentovho t, ktoré používajú štandardnú odchýlku. Distribúcia je normalizovaná pre Poissonovo a exponenciálne rozdelenie.
  • Štandardizovaný moment je možné použiť na akékoľvek rozdelenie pravdepodobnosti, ktoré má funkciu generujúcu moment. Inými slovami, že integrály momentov sú konvergentné.

Aplikácie

Koľkokrát sme čítali, že normálne rozdelenie pravdepodobnosti sa javí ako dosť dobré priblíženie sa k frekvencii pozorovaní, a žiada sa od nás, aby sme zistili pravdepodobnosť, že premenná X získa konkrétnu hodnotu?

Inými slovami, nastavíme X ~ N (μ, σ2) a sme požiadaní, aby sme našli P (X ≤ xi)

Vieme, že nájsť P (X ≤ xi), musíme vyhľadať pravdepodobnosť v tabuľkách rozdelenia pravdepodobnosti. V tomto prípade v tabuľkách rozdelenia normálneho rozdelenia. Najbežnejšie používané tabuľky rozdelenia pravdepodobností v ekonometrii a kvantitatívnom financovaní sú: chí-kvadrát, Studentova t, Fisher-Snedecorova F, Poissonova, exponenciálna, cauchyova a štandardná normálna.

Pravdepodobnosti vypočítané v distribučných tabuľkách spĺňajú túto vlastnosť:

To znamená, že pravdepodobnosti (čísla v tabuľke) sú typické. Potom budeme tiež musieť napísať našu premennú podľa parametrov distribučnej funkcie, ak chceme zistiť pravdepodobnosť P (X ≤ xi).

Praktický príklad

Chceme vedieť pravdepodobnosť, že počet lyžiarov, ktorí idú lyžovať v piatok ráno, je 288.

Lyžiarske stredisko nám hovorí, že frekvencia premennej lyžiarov sa môže pohybovať približne v rozmedzí od normálu 280 a odchýlky 16.

Takže máme:

X ~ N (μ, σ2)

kde X je definované ako premenná „lyžiari“

Žiadajú od nás pravdepodobnosť, že počet lyžiarov, ktorí idú v piatok lyžovať, je menší alebo rovný 288. To znamená:

P (X ≤ 288)

Proces

Aby sme zistili pravdepodobnosť, že počet lyžiarov sa rovná 288, musíme najskôr napísať premennú.

Potom sa pozrieme na distribučnú tabuľku spojitého štandardného normálu:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Pravdepodobnosť, že v piatok ráno pôjde lyžovať 288 lyžiarov, je 97,72% vzhľadom na priemerné a variačné parametre.