Multicollinearity - čo to je, definícia a koncept

Obsah:

Anonim

Multicollinearita je silný vzťah lineárnej závislosti medzi viac ako dvoma vysvetľujúcimi premennými vo viacnásobnej regresii, ktorý porušuje Gauss-Markovov predpoklad, ak je presný.

Inými slovami, multicollinearita je vysoká korelácia medzi viac ako dvoma vysvetľujúcimi premennými.

Zdôrazňujeme, že lineárny vzťah (korelácia) medzi vysvetľujúcimi premennými musí byť silný. Je veľmi bežné, že vysvetľujúce premenné regresie korelujú. Je teda potrebné zdôrazniť, že tento vzťah musí byť silný, ale nikdy nie dokonalý, aby sa mohol považovať za prípad multicolinearity. Lineárny vzťah by bol dokonalý, keby bol korelačný koeficient 1.

Keď tento silný lineárny (ale nie dokonalý) vzťah nastane iba medzi dvoma vysvetľujúcimi premennými, hovoríme, že ide o prípad kolineárnosti. Bolo by to viackolinearita, keď by došlo k silnému lineárnemu vzťahu medzi viac ako dvoma nezávislými premennými.

Gaussov-Markovov predpoklad o presnej nemultikolinearite definuje, že vysvetľujúce premenné vo vzorke nemôžu byť konštantné. Ďalej by nemali existovať presné lineárne vzťahy medzi vysvetľujúcimi premennými (žiadna presná multicolinearita). Gauss-Markov nám neumožňuje presnú multicolinearitu, ale aproximuje ju.

Regresná analýza

Aplikácie

Existujú veľmi konkrétne prípady, zvyčajne nereálne, v ktorých regresné premenné navzájom úplne nesúvisia. V týchto prípadoch hovoríme o exogenite vysvetľujúcich premenných. Spoločenské vedy sú všeobecne známe tým, že do svojich regresií začleňujú približnú multicolinearitu.

Presná multicolinearita

Presná multicolinearita nastáva, keď sú viac ako dve nezávislé premenné lineárnou kombináciou iných nezávislých premenných v regresii.

Problémy

Keď Gauss Markov zakazuje presnú multicolinearitu, je to preto, že nemôžeme získať odhadca Ordinary Least Squares (OLS).

Matematické vyjadrenie odhadovaného beta sub-i v maticovej podobe:

Takže ak existuje presná multicolinearita, spôsobí to, že matica (X'X) bude mať determinant 0, a preto nebude invertovateľná. To, že nie je invertovateľný, znamená, že nie je schopný vypočítať (X'X)-1 a následne ani odhadovaný Beta sub-i.

Približná multicolinearita

Približná multicolinearita nastáva, keď viac ako dve nezávislé premenné nie sú presne (aproximáciou) lineárnou kombináciou ďalších nezávislých premenných v regresii.

Premenná k predstavuje náhodnú premennú (nezávislú a identicky rozdelenú (i.i.d)). Frekvencia vašich pozorovaní sa dá uspokojivo priblížiť k štandardnému normálnemu rozdeleniu so strednou hodnotou 0 a odchýlkou ​​1. Pretože ide o náhodnú premennú, znamená to, že v každom pozorovaní i bude hodnota k iná a nezávislá od akejkoľvek predchádzajúcej hodnoty.

Problémy

Matematicky vyjadrené v maticovej forme:

Takže ak existuje približná multicolininearita, spôsobí to, že matica (X'X) bude približne 0 a koeficient determinácie veľmi blízky 1.

Riešenie

Multicollinearity je možné znížiť elimináciou regresorov premenných s vysokým lineárnym vzťahom medzi nimi.

Lineárny korelačný koeficient