Stupne voľnosti sú kombináciou počtu pozorovaní v súbore údajov, ktoré sa menia náhodne a nezávisle od nich, mínus pozorovania podmienené týmito ľubovoľnými hodnotami.
Inými slovami, stupne voľnosti sú počtom čisto voľných pozorovaní (ktoré sa môžu líšiť), keď odhadujeme parametre.
Hlavne rozlišujeme medzi štatistikami, ktoré používajú populačné a vzorkové parametre na zistenie ich stupňov voľnosti. Diskutujeme o rozdieloch medzi priemerom a štandardnou odchýlkou, keď sú parametrami populácia alebo vzorka:
Obyvateľstvo a parametre vzorky
- Obyvateľské parametre:
Pretože v populáciách nepoznáme všetky hodnoty, stupne voľnosti budú všetky prvky populácie: N.
Obidve štatistiky umožňujú, aby všetky pozorovania v množine boli náhodné, a preto vždy, keď odhadneme štatistiku, získame odlišné výsledky. Potom sú pozorovania, ktoré majú plné právo meniť, všetky pozorovania súboru populácie. Inými slovami, stupňami slobody sú v tomto prípade všetky prvky populácie: N. Z tohto dôvodu vydelíme obidve štatistiky celkovou veľkosťou populácie (N).
- Parametre vzorky (odhady):
Vo vzorkách poznáme všetky hodnoty.
Veľkosť populácie (N) diferencujeme s veľkosťou vzorky (n).
Pretože poznáme všetky hodnoty vo vzorkách, nemáme problém vypočítať priemer, pretože umožňuje, aby všetky pozorovania v množine boli náhodné.
V prípade štandardnej odchýlky ukladáme obmedzenie stupňov voľnosti: všetky prvky vzorky (n) a odčítame 1 prvok.
Ale … Prečo zo vzorky (n) odpočítame iba 1 a nie 5 alebo 10 prvkov?
Čím viac prvkov odčítame, znamená to, že čím viac informácií o parametri vzorky máme, v tomto prípade štandardná odchýlka.
Čím viac informácií máme, tým menej voľnosti (stupňov voľnosti) musia mať vzorové pozorovania náhodné hodnoty. Čím viac prvkov odčítame od vzorky, tým väčšie obmedzenie ukladáme a tým menej stupňov voľnosti bude mať parameter vzorky.
Príklad
Predpokladáme, že sa pôjdeme do Andorry pozrieť na finále svetového pohára v lyžovaní, pretože máme veľmi radi alpské lyžovanie. Prinášame mapu, ktorá nám hovorí, kde sa nachádzajú rôzne disciplíny a meno niektorých súťažiacich, ale štartové číslo každého účastníka nie je uvedené. Zakaždým, keď povedia meno konkurenta, poškriabeme ich meno. Pretože je zoznam súťažiacich obmedzený, dôjde k záveru, že meno pretekára poznáme skôr, ako ho oznámia rečníkom.
Kroniku analyzujeme z matematického hľadiska:
- Veľkosť vzorky (n), pretože nám hovoria iba meno niektorých účastníkov.
- Každý účastník môže štartovať náhodne, na poradí nezáleží a nemôže opäť súťažiť (kombinácie bez opakovaní).
- Posledným účastníkom bude známy prvok (n-1). Potom môžu náhodne vyjsť všetci ostatní účastníci okrem posledného, čo určite vieme.
Prečítajte si príklad stupňov slobody