Jednoduchá funkcia autokorelácie - príklad v R
Inými slovami, funkcia Simple Autocorrelation (FAS) alebo z angličtiny, Funkcia autokorelácie, Jedná sa o matematickú funkciu, ktorá nám pomáha zistiť, ako závislé sú údaje daného obdobia od rovnakých údajov z k predchádzajúcich období.
Generujeme ročnú časovú sériu X, ktorá nasleduje po normálnom rozdelení plus zotrvačnosť. Môžeme tiež použiť reálne údaje.
Metodika
Programy sú nevyhnutné pre prácu na autokorelačnej analýze. Môžu sa použiť programy ako Python, ale pre štatistickú analýzu a správu dát odporúčame R alebo jeho vylepšenú verziu R Studio. Tu budeme pracovať s R.
Kalkulácia
A ako napíšeme FAS vzorec do R kódu?
R aj Python majú knižnice, kde sú vzorce spojené s menom. Potom stačí, že sme nainštalovali knižnicu obsahujúcu vzorec, ktorý chceme použiť, a zavoláme ju do skriptu.
V množine R musíme napísať:

Funkcia acf je to vnútri knižnice štatistiky.
X -> Časové rady, ktoré používame ako vzorku na výpočet FAS.
acf (X, ylim = c (-1,1)) -> Funkcia jednoduchej autokorelácie na X s limitmi na zvislej osi medzi -1 a 1, čo sú hodnoty, ktoré môže mať autokorelačný koeficient.
Overenie
Tento krok nie je potrebný, ak sme použili predchádzajúci kód, pretože ten vypočítava pásma spoľahlivosti sám.
Aby sme zistili, či sú vypočítané autokorelačné koeficienty štatisticky významné, budeme musieť vytvoriť pásma spoľahlivosti s kritickými hodnotami. Týmto spôsobom, vzhľadom na percento významnosti, môžeme so štatistickou istotou povedať, či je alebo nie je v údajoch prítomnosť autokorelácie.
Rovnako ako korelačný koeficient, aj autokorelačný koeficient predpokladá normálnosť, a preto vypočítame interval spoľahlivosti takto:
Testovanie hypotéz definujeme ako:

Pri 95% spoľahlivosti s úrovňou významnosti 5% nájdeme v bežných tabuľkách slávnych 1,96. Kritická hodnota je daná:

Kde je odchýlka koeficientov daná aproximáciou:

Aj keď dáme vzorec, odporúčame použiť štatistické programy pre väčšiu presnosť a rýchlosť.
Výsledok
Všetky čiary končiace mimo pásma spoľahlivosti znamenajú, že časové rady vykazujú v uvedenom období autokoreláciu.

Takže na základe grafu vidíme, že v týchto časových radoch existuje autokorelácia v obdobiach, keď priamka vyčnieva z nespojitého pásma.
Prvý riadok, ktorý je na 0 a strieľa smerom k 1, možno ignorovať, pretože t musí byť striktne väčšie ako 0 a v tomto prípade to tak nie je. Nemá veľký zmysel robiť všetky predchádzajúce kroky, aby sme poznali autokoreláciu s dneškom, pretože ju už poznáme: korelácia premennej ako takej je 1, takže odpoveď už máme.