Štatistika je akákoľvek reálna merateľná funkcia vzorky náhodnej premennej.
Pojem štatistik je pojem pokročilá štatistika. Definícia je krátka a rozhodne abstraktná. Je to veľmi široký pojem, ale ako uvidíme ďalej, veľmi jednoduchý.
Vzhľadom na náročnosť pojmu budeme popis uskutočňovať po častiach. Na prvom mieste teda bude potrebné popísať, čo myslíme pod reálnou merateľnou funkciou. A v druhom prípade definujte, čo chápeme ako vzorku náhodnej premennej.
Štatistika je merateľná reálna funkcia
Keď hovoríme o funkcii, hovoríme o matematickej funkcii. Napríklad:
Y = 2X
Podľa hodnôt, ktoré X získa, potom Y bude mať jednu alebo inú hodnotu. Predpokladajme, že X má hodnotu 2. Potom bude mať Y hodnotu 4, výsledok vynásobenia čísla 2 číslom 2. Ak má X hodnotu 3, potom hodnota Y bude 6. Výsledok vynásobenia čísla 2 číslom 3.
Štatistik samozrejme nie je hocijaká funkcia. Je to skutočná a merateľná funkcia. Tento matematický koncept je úprimne jednoduchý. Skutočný, pretože vedie k vzniku reálnych čísel a merateľný, pretože sa dá merať.
Štatistiky majú nespočetné množstvo aplikácií v každodennom živote. Dáva teda zmysel, že hodnoty, ktoré môže štatistika vyprodukovať, sú skutočné a merateľné.
Ukážka náhodnej premennej
Koncept vzorky sme počuli už mnohokrát. Alebo koncept reprezentatívnej vzorky. V tomto prípade nebudeme rozlišovať medzi rôznymi typmi vzoriek. Pojem vzorka teda použijeme v širšom zmysle.
Predstavme si, že by sme chceli vedieť priemerné výdavky mexických rodín na nákup oblečenia. Je zrejmé, že nemáme dostatok zdrojov na to, aby sme požiadali celú mexickú populáciu. Čo urobíme? Odhadujeme to na vzorke. Vzorka napríklad 50 000 rodín.
Táto vzorka, všetko je povedané, bude musieť spĺňať špecifické vlastnosti. To znamená, že musí byť reprezentatívny a musí obsahovať veľa rodín z rôznych geografických oblastí, rôznych chutí, náboženstiev alebo kúpnej sily. Ak nie, spoľahlivú hodnotu nezískame.
Náhodná premenná
Teraz je to vzorka, ale vzorka náhodnej premennej. Čo máme na mysli pod náhodnou premennou? Náhodná premenná je jednoduchými slovami ťažko predvídateľná. To znamená, že za podobných podmienok má rôzne hodnoty.
Napríklad číslo, ktoré sa bude hodiť, keď hodíte kostkou, je náhodná premenná. Aj keď ho vždy uvádzame na trh vo veľmi podobných podmienkach, dosiahneme rôzne výsledky.
Teraz, keď rozumieme technickej definícii konceptu, musíme dať dokopy všetko, čo sme sa naučili. Vieme, čo je skutočná a merateľná funkcia. A tiež vieme, čo je vzorka náhodnej premennej.
Ako napriek všetkému zostáva koncept abstraktný, najlepším spôsobom ako ho pochopiť bude príklad.
Štatistický príklad
Predpokladajme, že v škole je 100 študentov. Učiteľ nás navrhuje ako aktivitu, aby sme sa pokúsili odhadnúť, aký je priemerný známka študentov tejto školy z predmetu matematika.
Keďže nemáme čas ani prostriedky na to, aby sme sa opýtali 100 študentov, rozhodli sme sa opýtať 10 študentov. Odtiaľ sa pokúsime odhadnúť priemernú známku. Máme nasledujúce údaje:
Študent | Poznámka | Študent | Poznámka |
1 | 4 | 6 | 9 |
2 | 8 | 7 | 7 |
3 | 6 | 8 | 2 |
4 | 7 | 9 | 5 |
5 | 9 | 10 | 3 |
Pred výpočtom priemerného stupňa podľa účelu tohto článku použijeme to, čo sme sa v tomto príklade dozvedeli o štatistike.
Vieme, že štatistika je skutočná a merateľná funkcia vzorky náhodnej premennej. Máme vzorku náhodnej premennej (tabuľka vyššie). S ktorou bude akákoľvek skutočná a merateľná funkcia uvedenej vzorky štatistickým údajom. Napríklad:
Štatistika 1: Študent 1 + Študent 2 + Študent 3 +…. + Študent 10 = 60
Štatistika 2: Študent 1 - Študent 2 + Študent 3 - Študent 4 + … - Študent 10 = 2
Štatistika 3: -Študent 1 - Študent 2 - Študent 3 -… .- Študent 10 = -60
Tieto tri štatistické údaje sú skutočné, merateľné funkcie vzorky. S ktorými sú štatistické. V teoretickej rovine to všetko má zmysel. Zmyslom je, že nie všetky štatistiky budú platné na odhad podľa toho, aké parametre.
V tomto okamihu vstúpi koncept odhadcu. Odhadca je štatistika, ktorej splnenie bude vyžadovať určité podmienky, aby mohol spoľahlivo vypočítať požadovaný parameter.
Napríklad na odhad parametra, ktorý poznáme ako „priemerný stupeň“ alebo „priemerný stupeň“, potrebujeme odhad. Tento odhadovač poznáme ako „priemerný“. Priemer je odhad. Teda štatistika, ktorá vyžaduje určité podmienky, aby mohla vypočítať priemernú známku s určitými zárukami.
Ak chceme poznať priemerné známky, budeme musieť pridať všetky známky a vydeliť ich celkovým počtom študentov. Menovite:
Priemerná známka = (4 + 8 + 6 + 7 + 9 + 9 + 7 + 2 + 5 + 3) / 10 = 6
Vzorec pre priemer je rovnaký bez ohľadu na vzorku. Vždy používajte všetky údaje, ktoré vzorka obsahuje. V tomto prípade máme údaje od 10 študentov a priemerný vzorec používa všetkých 10 údajov. Keby sme mali 20 údajov od 20 študentov, použili by sme všetkých 20. Štatistiky, ktoré spĺňajú túto charakteristiku, sú známe ako dostatočné štatistiky.
Záverom možno povedať, že štatistikou je každá skutočná a merateľná funkcia vzorky. Ak už máte k dispozícii niekoľko možných štatistík, sú potrebné určité podmienky, aby ste ich mohli považovať za odhad. A vďaka odhadom sa môžeme pokúsiť „predpovedať“ určité hodnoty z menších vzoriek.