Predpojatosť pri zbere údajov

Obsah:

Predpojatosť pri zbere údajov
Predpojatosť pri zbere údajov
Anonim

Predpätie zhromažďovania údajov nastáva, keď chybne vyberieme subjekty, ktoré budú patriť do náhodne analyzovanej vzorky.

Máme problém, keď tento výber spôsobí, že náhodná vzorka nereprezentuje štatistickú populáciu. Preto je akýkoľvek výsledok, ktorý získame zo vzorky, zaujatý a nemohli sme potvrdiť, že bol v analyzovanej populácii splnený. V rámci tohto skreslenia môžeme rozlišovať rôzne typy, ktoré vysvetlíme nižšie.

Predpojatosť na prežitie

Nastáva, keď sú údaje vylúčené z analýzy, pretože v čase analýzy už neexistujú.

Inými slovami, zameriavame sa iba na údaje, ktoré existujú, a vyradíme tie, ktoré predtým existovali v populácii. V praxi existuje veľa príkladov tohto typu skreslenia. Jedným z nich je uskutočňovanie prieskumov iba u klientov spoločnosti, pričom sa vylučujú potenciálni zákazníci. Ďalším by bolo vyhodnotenie správania akciových indexov vyradením z analýzy spoločností, ktoré v danom indexe boli a už nie sú.

Riešenie tohto skreslenia je veľmi jednoduché. Vykonajte štúdiu so všetkými existujúcimi aj predtým existujúcimi údajmi.

Predvídanie zaujatosti

Nastáva, keď sa analýza vykonáva pomocou údajov, ktoré nie sú v čase analýzy k dispozícii. Príkladom by mohla byť analýza vzťahu ceny akcie s určitou premennou finančnej rovnováhy. Cena akcie je dynamická premenná, ktorej ak máme v čase analýzy správne informácie. Premenné stanovené v súvahe sú však statické, a preto by sme si pre túto analýzu mali počkať na zverejnenie účtovnej závierky.

Predpokladajme, že chceme na konci fiškálneho roka študovať vzťah medzi cenou a vlastným imaním mnohých spoločností. V takom prípade nebudeme mať k dispozícii údaje o čistom imaní až do zverejnenia účtovnej závierky. Zverejnenie, ktoré sa zvyčajne zverejňuje pár mesiacov po skončení fiškálneho roka.

Riešením tejto zaujatosti by preto bolo počkať na zverejnenie účtovnej závierky. A vykonajte analýzu so zverejnenými údajmi spolu s cenou v čase zverejnenia.

Predpojatosť časového obdobia

Táto odchýlka nastáva, ak je obdobie vybrané pre údaje príliš krátke alebo príliš dlhé. Ak je príliš krátke, analýza by mohla odrážať konkrétne výsledky, ktoré sú dosiahnuté iba za dané obdobie. To znamená, že by neboli dlhšie reprezentatívne.

Predstavte si päťročný časový rámec, v ktorom malé spoločnosti prekonali veľké spoločnosti na trhu s akciami. Z toho by sme mohli vyvodiť záver, že v budúcnosti malé spoločnosti vždy prekonajú veľké spoločnosti. Ale za také krátke obdobie nemožno vyvodiť nijaké závery. Hlavne kvôli tomu, že v dlhších časových obdobiach sa situácia mohla zmeniť. Preto sú získané výsledky ovplyvnené týmto skráteným časovým obdobím.