Odber vzoriek je proces, pri ktorom sa vyberie skupina pozorovaní patriacich k populácii. To za účelom vykonania štatistickej štúdie.
Inými slovami, vzorkovanie je postup, ktorým sa vykonávajú určití jedinci patriaci k populácii, ktorá sa podrobuje analýze.
Odber vzoriek je nevyhnutný z dôvodu skutočnosti, že populácie môžu byť príliš veľké a že je nemožné (ekonomicky a materiálne povedané) zhromažďovať údaje od všetkých jednotlivcov.
Cieľom je, aby vzorka bola reprezentatívna. To znamená, že jeho ukazovatele, ako napríklad priemerný vek, priemerný príjem, percento mužov a žien, okrem iných, sú rovnaké alebo veľmi podobné ako v prípade populácie.
Typy vzorkovania
Typy odberu vzoriek možno rozlíšiť na základe rôznych kritérií. Podľa techniky výberu podskupiny teda možno rozlíšiť nasledujúce položky:
Pravdepodobnosť vzorkovania
Pozorovania sa vyberajú na základe náhodnosti, to znamená náhodne. V tejto kategórii nájdeme:
- Jednoduché náhodné vzorkovanie: Všetci jedinci v populácii majú rovnakú pravdepodobnosť, že budú vybraní ako súčasť vzorky. Má výhody, napríklad skutočnosť, že sa dá ľahko vykonať prostredníctvom počítačových systémov. Vyžaduje sa však úplný zoznam celej populácie. Ak je vzorka veľmi malá, nemusí byť výber reprezentatívny.
- Systematické: Pozorovanie je vybrané náhodne a na výber zvyšku vzorky sa používajú pravidelné číselné intervaly. To znamená, že predpokladám, že mám populáciu 10 000, a náhodne vyberiem pozorovanie 600, po ktorom môžem zvážiť intervaly 30 pozorovaní. V takom prípade by ste použili pozorovania 600, 630, 660, 690, 720, 750, 780 atď.
- Stratifikované náhodne: Obyvateľstvo je rozdelené do vrstiev, čo sú skupiny, ktoré majú spoločné charakteristiky a sú ešte homogénnejšie ako populácia ako celok. Potom sa v každej vrstve náhodne alebo systematicky vyberie vzorka. Cieľom je dosiahnuť reprezentatívnosť každej vrstvy.
- Konglomerátmi alebo klastrami: Pozostáva z vytvorenia skupín menších ako populácia, ktoré odrážajú alebo zdieľajú všetky charakteristiky populácie. Potom vyberieme jeden z klastrov ako vzorku a podrobne ho analyzujeme.
Nepravdepodobné vzorkovanie
Výber vzorky nezávisí od pravdepodobnosti, ale od rozhodnutia výskumníkov. Môžeme rozlíšiť niektoré podkategórie:
- Metóda dôvery v dostupné predmety: Spočíva v tom, že výskumník zachytí predmety, ktoré má k dispozícii. A to napríklad v geografickom bode v určitom čase.
- Názor alebo zámerná metóda: Výskumný pracovník používa svoj úsudok alebo kritériá na výber, kto sa zúčastní ako súčasť vzorky. Inými slovami, pokračovaním v predchádzajúcom príklade mohol výskumník zhromaždiť vzorku na konkrétnom mieste a v konkrétnom čase. Ale vzhľadom na ciele výskumu by ste sa mohli rozhodnúť zahrnúť iba tie, ktoré sú vydaté a majú 20. a 30. rok.
- Príčinné alebo náhodné: Výskumník priamo vyberá jednotlivcov, ktorí budú súčasťou vzorky. Napríklad študentom školy. To za predpokladu, že k nim máte ľahký prístup.
- Snehová guľa: Spočíva v tom, že po nájdení prvého subjektu (alebo prvých subjektov) vo vzorke ho výskumník požiada (alebo ich) o pomoc s identifikáciou ďalších jednotlivcov s rovnakými vlastnosťami. Je to technika, ktorá sa používa, keď je ťažké nájsť konkrétnu skupinu z dôvodu spracovania citlivých údajov, napríklad nelegálnych prisťahovalcov.
- Podľa splátok: Výskumný pracovník s prihliadnutím na zloženie populácie a rozdelením podľa skupín alebo vrstiev vykoná proporcionálny výber vzorky. Napríklad si predstavte, že v populácii je 40% ľudí do 25 rokov, 35% ľudí vo veku od 25 do 50 rokov a 25% osôb nad 50 rokov. Vzorka 4 000 ľudí by teda mala 1 600 osôb mladších ako 25 rokov, 1 400 medzi 25 a 50 rokov a 1 000 dospelých starších ako 50 rokov alebo starších. Je potrebné poznamenať, že jednotlivci, ktorí budú hradiť každú splátku, budú vybraní nejakou nepravdepodobnou metódou, to znamená ktoroukoľvek z vyššie vysvetlených techník.
Rovnako je potrebné poznamenať, že odber vzoriek môže byť jednoduchý, ak sa vykoná iba raz; dvojnásobok, keď sa zachytia dve vzorky (druhá sa môže použiť, ak prvá neprináša konečné výsledky); alebo viacnásobné (je to podobné ako dvojnásobné, ale s viac ako dvoma vzorkami).