Chyba typu I - čo to je, definícia a pojem

Obsah:

Chyba typu I - čo to je, definícia a pojem
Chyba typu I - čo to je, definícia a pojem
Anonim

Chyba typu 1 v štatistike je definovaná ako odmietnutie nulovej hypotézy, keď je skutočne pravdivá. Chyba typu 1 sa tiež nazýva falošne pozitívna chyba alebo chyba typu alfa.

Urobiť chybu typu 1 znamená v podstate niečo poprieť, keď je to skutočne pravda. Zvážte napríklad situáciu pri testovaní, či marketingová kampaň uskutočnená na sociálnych sieťach zvyšuje predaj zmrzliny pre spoločnosť v letnom týždni. Hypotézy by boli nasledujúce:

H0: Predaj sa kvôli letnej kampani nezvyšuje

H1: Zvýšenie predaja v dôsledku marketingovej kampane

Po vyhodnotení prenosu na webových stránkach spoločnosti a na stránkach navštívených po kampani sa zistí nasledovné:

  • Nárast, aj keď v doprave a návštevách o 50%.
  • 200% zvýšenie predaja zmrzliny.

Na základe týchto výsledkov je možné dospieť k záveru, že reklamná kampaň bola plodná a mala priamy vplyv na zvýšenie predaja. Avšak myslime si, že v tom týždni došlo k vlne horúčav, ktorá priniesla teploty nad 40 stupňov.

Ak poznáme toto, museli by sme brať do úvahy faktor vysokej teploty ako príčinu zvýšenia predaja. Ak to neberieme do úvahy, mohli by sme odmietnuť našu nulovú hypotézu, keď je pravda, to znamená, že by sme si mysleli, že naša kampaň mala obrovský úspech, keď v skutočnosti bola príčinou zvýšenia predaja silná horúčava. Keby sme dospeli k tomuto záveru, odmietli by sme nulovú hypotézu, keď je skutočne pravdivá, a preto by sme sa dopustili chyby typu 1.

Príčiny chyby typu 1

Chyba typu 1 súvisí s významnosťou kontrastu alebo alfa, s chybou odhadu koeficientov a môže sa vyskytnúť v dôsledku 2 typických porušení počiatočných predpokladov regresie. Sú to:

  • Podmienená heteroscedasticita.
  • Sériová korelácia.

Regresia, ktorá predstavuje ktorékoľvek z predchádzajúcich porušení, by podcenila chybu koeficientov. Ak sa tak stane, náš odhad t štatistiky by bol väčší ako skutočná t štatistika. Tieto väčšie hodnoty t štatistiky by zvýšili pravdepodobnosť, že hodnota spadne do zóny odmietnutia.

Poďme si predstaviť 2 situácie.

Situácia 1 (nesprávny odhad chyby)

  • Význam: 5%
  • Veľkosť vzorky: 300 ľudí.
  • Kritická hodnota: 1,96
  • B1: 1,5
  • Chyba odhadu koeficientu: 0,5

T = 1,5 / 0,5 = 3

Takto by hodnota padla do zóny odmietnutia a odmietli by sme nulovú hypotézu.

Situácia 2 (správny odhad chyby)

  • Význam: 5%
  • Veľkosť vzorky: 300 ľudí.
  • Kritická hodnota: 1,96
  • B1: 1,5
  • Chyba odhadu koeficientu: 1

T = 1,5 / 1 = 1,5

Takto by hodnota klesla v zóne bez odmietnutia a hypotézu by sme nezamietli.

Na základe predchádzajúcich príkladov by situácia 1, v ktorej je chyba podhodnotená, viedla k odmietnutiu nulovej hypotézy, aj keď je v skutočnosti pravda, pretože ako vidíme v situácii 2 so správne odhadnutou chybou, hypotézu by sme nezamietli byť pravdivý.