Jednoduchá náhodná vzorka - čo to je, definícia a koncept

Obsah:

Anonim

Vzhľadom na náhodnú premennú X je jednoduchou náhodnou vzorkou súbor náhodných premenných, nezávislých a identicky rozložených, získaných z náhodnej premennej X a ktoré sú s ňou distribuované rovnako.

Formálne je predchádzajúca definícia definícia jednoduchej náhodnej vzorky. Teraz je možné tento koncept definovať jednoduchšie. Pre správne pochopenie pojmu jednoduchá náhodná vzorka je samozrejme dôležité presne ju definovať.

Pretože formálna definícia je zložitá, postupne odvíjame každú časť definície.

Koncept jednoduchého náhodného vzorkovania krok za krokom

V prvom rade teda musíme brať do úvahy, že jednoduchá náhodná vzorka je vzorkou. Ako vzorka sa získava z náhodnej premennej. Túto náhodnú premennú sme nazvali X. Príkladom náhodnej premennej môže byť známka z matematiky študentov stredných škôl. Preto je prvá časť definície jasná. Jednoduchá náhodná vzorka je vzorka získaná z ľubovoľnej náhodnej premennej.

Druhá časť definície je zložitejšia. Predovšetkým konceptmi „nezávislého a identicky distribuovaného náhodného“. Pojem náhoda znamená náhoda. Pretože vzorka bola získaná náhodne, premenné sú následne náhodné. Pojem nezávislý sa vzťahuje na skutočnosť, že získané údaje spolu nesúvisia. To znamená, že výber určitých údajov nezávisí od predtým vybratých údajov alebo od tých, ktoré sa vyberú neskôr. A nakoniec, identicky rozdelené označuje štatistické rozdelenie, ktoré je rovnaké.

Stručne povedané, máme, že jednoduchá náhodná vzorka je vzorka, ktorá bola získaná úplne náhodným spôsobom. Dáta, ktoré tvoria vzorku, teda navzájom nesúvisia a dedia charakteristiky populačnej náhodnej premennej X.

Prečo je koncept jednoduchej náhodnej vzorky taký dôležitý?

Ak chceme uskutočniť výskum určitých charakteristík súboru údajov, je nevyhnutná kvalita vzorky. Aby boli vypočítané metriky, a teda aj výskumné závery spoľahlivé, musíme mať reprezentatívnu vzorku. To znamená, vzorka, ktorá adekvátne predstavuje charakteristiky celkovej populácie.

Jednou z hlavných charakteristík reprezentatívnej vzorky je, že je náhodná. Poznanie koncepcie jednoduchej náhodnej vzorky má preto zásadný význam pre to, aby bola naša štúdia platná vo vedeckej komunite.

Jednoduchý náhodný ukážkový príklad

Predpokladajme, že chceme uskutočniť štúdiu o mesačných platoch občanov krajiny. Našou náhodnou veličinou bude mesačný plat občanov.

Vzorová koncepcia vzniká z dôvodu nemožnosti opýtať sa každého občana krajiny. To by trvalo dlho alebo veľa finančných zdrojov. Takže namiesto toho, aby sme požiadali 50 miliónov ľudí, rozhodli sme sa požiadať 50 000 ľudí.

Keď už máme definovanú premennú, na ktorej budeme pracovať, a populáciu dát, musíme pristúpiť k získaniu vzorky. O získaní správnej vzorky existuje rozsiahla literatúra. Ale keďže cieľom tejto definície je priblížiť tento koncept jednoduchým spôsobom, nebudeme sa tým zaoberať.

Zjednodušenie, všeobecne, bude mať dve možnosti. Alebo sa opýtajte občanov úplne náhodným spôsobom alebo si vyberte výberové konanie. Aby vzorka spĺňala kritérium „náhodné“, musíme to urobiť úplne náhodne. Nemôžeme si vybrať mestá, zóny, susedstvá alebo čokoľvek iné.

Ak si výberový proces vyberieme vedome, bude naša vzorka pravdepodobne zaujatá. Správne by bolo použiť nástroj, ktorý náhodne vyberie mená občanov.

Keď máme našu jednoduchú náhodnú vzorku, musíme s údajmi pracovať. To znamená, urobiť štatistickú inferenciu. Táto štatistická inferencia nám umožní zo štúdie vyvodiť závery. Napríklad vyjadrenia ako: „priemerný mesačný plat v Španielsku je 1 200 eur“ alebo „iba 5% občanov s najvyššími platmi zarába ekvivalent najchudobnejších 30%“.

To všetko so zreteľnou mierou chýb. O to sa však už stará štatistická inferencia.