Analýza rozptylu alebo ANOVA (analýza rozptylu) sú viacrozmerné techniky analýzy závislosti používané na určenie, či existujú významné rozdiely medzi priemermi troch alebo viacerých skupín obyvateľstva.
Touto analýzou preto zistíme, či existujú rozdiely medzi určitými skupinami, keď modifikujeme jednu alebo viac charakteristík. Na zistenie použijeme hodnotu priemeru údajov.
Jeho použitie je veľmi časté v oblastiach ako ekonómia alebo medicína.
Predchádzajúce predpoklady analýzy odchýlky
Existuje niekoľko predpokladov pre vykonanie ANOVA, ktoré by mali byť známe. To je nevyhnutné pre dosiahnutie adekvátnych výsledkov.
- Po prvé, populácia musí postupovať podľa normálneho rozdelenia. Preto máme do činenia s typom parametrického kontrastu, pretože sú známe populačné parametre priemeru a štandardnej odchýlky.
- Ďalej musia byť použité vzorky navzájom nezávislé. To znamená, že úprava jedného z nich nemusí mať vplyv na hodnotu ostatných.
- Na druhej strane musia byť rozdiely medzi skúmanými populáciami rovnaké. Toto sa nazýva homoscedasticita.
Klasifikácia analýzy variančných modelov
Na analýzu modelov odchýlok je možné použiť tri klasifikácie uvedené nižšie:
- Model s fixnými efektmi: Populácie sú normálne a líšia sa iba hodnotou príslušných prostriedkov.
- Model náhodných efektov: V tomto prípade majú údaje hierarchiu a závisia od nich populačné rozdiely.
- Model so zmiešanými efektmi: Stretli by sme sa s modelom, ktorý je zmesou predchádzajúcich dvoch.
Príklad ANOVA: dôležité koncepty
Na uskutočnenie ANOVA existujú určité zložité matematické rovnice. Avšak na Economy-Wiki.com sa rozhodujeme pre jednoduchú ekonomiku, a preto a s využitím technológie ukážeme, ako by sa to dalo urobiť v tabuľke.
Poďme si predstaviť, že by sme chceli vedieť, či existujú značné rozdiely medzi čitateľmi stránky Economy-Wiki.com na základe príbuznosti ich titulu s ekonómiou.
Upozornenie: Údaje, ktoré použijeme, sú fiktívne.
Musíme ísť na Dáta, Analýza dát a zvolíme analýzu rozptylu faktora.
Poradie by bolo maticou troch skupín. Môže byť zaujímavejšie zahrnúť potom nadpisy a poskytnúť požadované formátovanie. V našom prípade s logom a modrou farbou.
Vidíme, že existujú niektoré pojmy, ako sú stupne voľnosti a pravdepodobnosti alebo významu. Prvá sa počíta automaticky a predstavuje počet skupín mínus jedna. Druhý nám hovorí, či sú rozdiely významné alebo nie.
Spravidla vychádzate z prijatej úrovne dôvery. V ekonómii je to zvyčajne 95% (0,95), čo súvisí s významnosťou 0,05 (1-0,095). Ak je teda táto pravdepodobnosť alebo hodnota p pod akceptovanou významnosťou, rozdiely sú významné.
V tomto prípade sa zdá, že stupeň nemá vplyv na počet čitateľov (významnosť> 0,05). Zdá sa teda, že analýza odchýlok naznačuje, že stránka Economy-Wiki.com zaujíma každého, nielen špecializovaného čitateľa. Samozrejme, že sú to fiktívne údaje alebo nie?