Wednesday 19 April 2017

Umzugsdurchschnitt Pacf

Identifizieren der Zahlen von AR - oder MA-Terme in einem ARIMA-Modell. ACF - und PACF-Plots Nachdem eine Zeitreihe durch Differenzierung stationärisiert wurde, ist der nächste Schritt bei der Anpassung eines ARIMA-Modells, um festzustellen, ob AR - oder MA-Begriffe benötigt werden, um jede Autokorrelation zu korrigieren Bleibt in der differenzierten Serie Natürlich, mit Software wie Statgraphics, können Sie nur versuchen, einige verschiedene Kombinationen von Begriffen und sehen, was funktioniert am besten Aber es ist ein systematischer Weg, dies zu tun Durch Betrachten der Autokorrelation Funktion ACF und teilweise Autokorrelation PACF Plots von Die differenzierten Serien, können Sie die Anzahl der AR - und MA-Begriffe, die benötigt werden, vorläufig identifizieren Sie sind bereits mit dem ACF-Plot vertraut, es ist nur ein Balkendiagramm der Koeffizienten der Korrelation zwischen einer Zeitreihe und Verzögerungen von sich selbst. Das PACF-Plot ist Eine Auftragung der partiellen Korrelationskoeffizienten zwischen der Reihe und den Verzögerungen von sich selbst. Im allgemeinen ist die partielle Korrelation zwischen zwei Variablen die Menge der Korrelation zwischen ihnen, die nicht durch ihre gegenseitigen Korrelationen mit einem bestimmten Satz von anderen Variablen erklärt wird Wir setzen eine Variable Y auf andere Variablen X1, X2 und X3 zurück, die partielle Korrelation zwischen Y und X3 ist die Korrelation zwischen Y und X3, die nicht durch ihre gemeinsamen Korrelationen mit X1 und X2 erklärt wird. Diese partielle Korrelation kann berechnet werden Als die Quadratwurzel der Reduktion der Varianz, die durch Hinzufügen von X3 zur Regression von Y auf X1 und X2 erreicht wird. Eine teilweise Autokorrelation ist die Korrelationsgröße zwischen einer Variablen und einer Verzögerung von sich selbst, die überhaupt nicht durch Korrelationen erklärt wird Niedrigere Ordnung Die Autokorrelation einer Zeitreihe Y bei Verzögerung 1 ist der Korrelationskoeffizient zwischen Y t und Y t - 1, der vermutlich auch die Korrelation zwischen Y t -1 und Y t - 2 ist. Ist aber Y t korreliert Mit Y t -1 und Y t -1 gleich mit Y t -2 korreliert ist, dann sollten wir auch erwarten, dass sie eine Korrelation zwischen Y t und Y t-2 finden. In der Tat ist die Korrelation, die wir bei Verzögerung 2 erwarten sollten, genau die Quadrat der Lag-1-Korrelation So breitet sich die Korrelation bei Verzögerung 1 auf Verzögerung 2 und vermutlich auf höherwertige Verzögerungen aus. Die partielle Autokorrelation bei Verzögerung 2 ist daher die Differenz zwischen der tatsächlichen Korrelation bei Verzögerung 2 und der erwarteten Korrelation aufgrund der Ausbreitung Der Korrelation bei der Verzögerung 1.Hier ist die Autokorrelationsfunktion ACF der UNITS-Reihe, bevor irgendeine Differenzierung durchgeführt wird. Die Autokorrelationen sind für eine große Anzahl von Verzögerungen bedeutsam - aber vielleicht sind die Autokorrelationen bei Verzögerungen 2 und darüber nur auf die Ausbreitung zurückzuführen Der Autokorrelation bei Verzögerung 1 Dies wird durch das PACF-Plot bestätigt. Beachten Sie, dass die PACF-Kurve nur bei Verzögerung 1 einen signifikanten Spike aufweist, was bedeutet, dass alle Autokorrelationen höherer Ordnung effektiv durch die Lag-1-Autokorrelation erklärt werden. Die partiellen Autokorrelationen bei Alle Verzögerungen können durch Anpassen einer Folge von autoregressiven Modellen mit zunehmender Anzahl von Verzögerungen berechnet werden. Insbesondere ist die partielle Autokorrelation bei der Verzögerung k gleich dem geschätzten AR k-Koeffizienten in einem autoregressiven Modell mit k-Term - dh einem multiplen Regressionsmodell, bei dem Y Wird auf LAG Y, 1, LAG Y, 2, etc. bis zu LAG Y, k umgeleitet. So können Sie durch die bloße Inspektion der PACF bestimmen, wie viele AR-Begriffe Sie verwenden müssen, um das Autokorrelationsmuster in einer Zeitreihe zu erklären, wenn das Die partielle Autokorrelation ist bei der Verzögerung k und ist bei keinem höheren Auftrag signifikant, dh wenn die PACF bei der Verzögerung k abschaltet - dann schlägt man vor, dass man ein autoregressives Modell der Ordnung k anpassen sollte. Die PACF der UNITS-Serie bietet Ein extremes Beispiel für das Cut-off-Phänomen hat es eine sehr große Spike bei lag 1 und keine anderen signifikanten Spikes, was darauf hinweist, dass in Abwesenheit von differencing ein AR 1 - Modell verwendet werden sollte. Allerdings wird der AR 1-Term in diesem Modell ausfallen Um einen ersten Unterschied zu sein, da der geschätzte AR 1 - Koeffizient, der die Höhe des PACF-Spikes bei Verzögerung 1 ist, fast genau gleich 1 ist. Nun ist die Prognosegleichung für ein AR 1 - Modell für eine Serie Y ohne Ordnungen von Differenziert ist. Wenn der AR 1 - Koeffizient 1 in dieser Gleichung gleich 1 ist, ist es äquivalent zu der Vorhersage, dass die erste Differenz von Y konstant ist - dh es entspricht der Gleichung des zufälligen Wandermodells mit dem Wachstum. Die PACF von Die UNITS-Serie erzählt uns, dass, wenn wir es nicht anders machen, dann sollten wir ein AR-1-Modell passen, das sich als gleichbedeutend mit einem ersten Unterschied herausstellen wird. Mit anderen Worten, es sagt uns, dass UNITS wirklich eine Bestellung benötigt Differenziert, um stationär zu sein. AR - und MA-Signaturen Wenn die PACF einen scharfen Cutoff zeigt, während die ACF langsamer abfällt, dh signifikante Spikes bei höheren Verzögerungen hat, sagen wir, dass die stationäre Serie eine AR-Signatur anzeigt, was bedeutet, dass das Autokorrelationsmuster mehr erklärt werden kann Leicht durch Hinzufügen von AR-Terme als durch Hinzufügen von MA-Begriffen Sie werden wahrscheinlich feststellen, dass eine AR-Signatur häufig mit einer positiven Autokorrelation bei Verzögerung 1 assoziiert ist - dh sie neigt dazu, in Serie zu kommen, die leicht unter differenziert sind. Der Grund dafür ist, dass ein AR-Term Kann wie ein partieller Unterschied in der Prognosegleichung fungieren. Beispielsweise wirkt der AR-Term in einem AR-1-Modell wie ein erster Unterschied, wenn der autoregressive Koeffizient gleich 1 ist, tut es nichts, wenn der autoregressive Koeffizient null ist und er wirkt wie folgt Eine Teildifferenz, wenn der Koeffizient zwischen 0 und 1 liegt. Wenn also die Serie etwas unterdifferenziert ist - dh wenn das nichtstationäre Muster der positiven Autokorrelation nicht vollständig beseitigt ist, wird es eine Teildifferenz durch die Anzeige einer AR-Signatur verlangen Haben die folgende Faustregel für die Bestimmung, wann man AR-Terme hinzufügen soll. Regel 6 Wenn die PACF der differenzierten Serie einen scharfen Cutoff zeigt und die Lag-1 Autokorrelation positiv ist - wenn die Serie etwas unterdifferenziert erscheint - dann erwägen sie hinzuzufügen Ein AR-Term zum Modell Die Verzögerung, bei der die PACF abschneidet, ist die angegebene Anzahl von AR-Terme. Grundsätzlich kann jedes Autokorrelationsmuster aus einer stationärisierten Reihe entfernt werden, indem man genügend autoregressive Terme der stationärisierten Reihe der Prognosegleichung hinzufügt, Und die PACF sagt Ihnen, wie viele solcher Begriffe wahrscheinlich benötigt werden. Allerdings ist dies nicht immer der einfachste Weg, um ein gegebenes Muster der Autokorrelation zu erklären, manchmal ist es effizienter, MA-Terms-Verzögerungen der Prognosefehler zu addieren. Die Autokorrelationsfunktion ACF spielt die Gleiche Rolle für MA-Begriffe, dass die PACF für AR-Begriffe spielt - das heißt, die ACF sagt Ihnen, wie viele MA-Begriffe sind wahrscheinlich erforderlich, um die verbleibende Autokorrelation aus der differenzierten Serie zu entfernen Wenn die Autokorrelation bei lag k aber nicht bei Irgendwelche höheren Verzögerungen - dh wenn der ACF bei Verzögerung k abschaltet - bedeutet dies, dass genau k MA-Begriffe in der Prognosegleichung verwendet werden sollen. Im letzteren Fall sagen wir, dass die stationäre Serie eine MA-Signatur anzeigt, was bedeutet, dass die Autokorrelation Muster kann durch Hinzufügen von MA-Terminen leichter erklärt werden, als durch Hinzufügen von AR-Terme. Eine MA-Signatur ist üblicherweise mit einer negativen Autokorrelation bei Verzögerung 1 assoziiert - dh sie neigt dazu, in Serie zu kommen, die etwas überdimensioniert sind. Der Grund dafür ist, dass ein MA Englisch: www. tab. fzk. de/en/projekt/zusammenf...ng/ab117.htm Um dies zu sehen, ist zu erinnern, dass ein ARIMA 0,1,1 Modell ohne Konstante gleichbedeutend mit einem Simple Exponential Glättungsmodell ist. Die Prognosegleichung für dieses Modell ist, wo der MA 1 Koeffizient 1 ist Entspricht der Menge 1 - im SES-Modell Wenn 1 gleich 1 ist, entspricht dies einem SES-Modell mit 0, das ist nur ein CONSTANT-Modell, weil die Prognose niemals aktualisiert wird. Dies bedeutet, dass wenn 1 gleich 1 ist Die die SES-Prognose gewöhnlich bei der letzten Beobachtung wieder verankern kann. Andererseits, wenn der gleitende durchschnittliche Koeffizient gleich 0 ist, reduziert sich dieses Modell auf ein zufälliges Wandermodell - dh es verlässt es Die differenzierende Operation allein Also, wenn 1 etwas größer als 0 ist, ist es so, als ob wir teilweise eine Reihenfolge der Differenzierung annullieren. Wenn die Serie schon etwas überdimensioniert ist - dh wenn eine negative Autokorrelation eingeführt wurde - dann wird sie fragen Ein Unterschied, der teilweise durch die Anzeige einer MA-Signatur abgesagt wird. Eine Menge von Armwellen geht hier weiter Eine strengere Erklärung dieses Effektes findet sich in der mathematischen Struktur von ARIMA-Models Handout daher die folgende zusätzliche Faustregel. Regel 7 Wenn die ACF der differenzierten Serie zeigt einen scharfen Cutoff und / oder die Lag-1 Autokorrelation ist negativ - wenn die Serie etwas überdifferenziert erscheint - dann erwägen, einen MA-Term zum Modell hinzuzufügen. Die Verzögerung, bei der der ACF abschaltet, ist die angegebene Zahl Von MA-Terminen. Modell für die UNITS-Serie - ARIMA 2,1,0 Bisher haben wir festgestellt, dass die UNITS-Serie mindestens eine Reihenfolge der Nicht-Sequenz-Differenzierung benötigt, um stationär zu sein. Nach der Einnahme einer nicht-seasonalen Differenz - dh Anpassung an eine ARIMA 0,1 , 0-Modell mit Konstante - die ACF - und PACF-Plots sehen so aus. Nichts, dass die Korrelation bei lag 1 signifikant und positiv ist und b die PACF einen schärferen Cutoff als die ACF zeigt. Insbesondere hat die PACF nur zwei signifikante Spikes , Während der ACF vier hat, so ergibt sich nach der obigen Regel 7 die differenzierte Serie eine AR 2 - Signatur Wenn wir also die Reihenfolge des AR-Termes auf 2 setzen - also ein ARIMA-2,1,0-Modell passen - erhalten wir Die folgenden ACF - und PACF-Plots für die Residuen. Die Autokorrelation bei den entscheidenden Verzögerungen - nämlich Verzögerungen 1 und 2 - wurde eliminiert, und es gibt kein erkennbares Muster in höherwertigen Verzögerungen Die Zeitreihenpläne der Residuen zeigen etwas Beunruhigende Tendenz, vom Mittelwert weg zu wandern. Allerdings zeigt der Analyse-Zusammenfassungsbericht, dass das Modell dennoch in der Validierungsperiode sehr gut abläuft, beide AR-Koeffizienten unterscheiden sich deutlich von Null und die Standardabweichung der Residuen wurde von 1 54371 reduziert Auf 1 4215 fast 10 durch die Hinzufügung der AR-Terme Darüber hinaus gibt es keine Anzeichen für eine Einheit Wurzel, weil die Summe der AR-Koeffizienten 0 252254 0 195572 ist nicht in der Nähe von 1 Einheit Wurzeln werden ausführlicher diskutiert Im Folgenden, Dies scheint ein gutes Modell zu sein. Die untransformierten Prognosen für das Modell zeigen einen linearen Aufwärtstrend, der in die Zukunft projiziert wird. Der Trend in den Langzeitprognosen ist auf die Tatsache zurückzuführen, dass das Modell einen nicht-seasonalen Unterschied und einen konstanten Begriff dieses Modells beinhaltet Grundsätzlich ein zufälliger Spaziergang mit wachsendem Feind durch Addition zweier autoregressiver Begriffe - dh zwei Verzögerungen der differenzierten Serie Die Steigung der Langzeitprognosen, dh der durchschnittliche Anstieg von einer Periode zur anderen, entspricht dem Mittelwert der Modellzusammenfassung 0 467566 Die Prognosegleichung ist da ist der konstante Term in der Modellübersicht 0 258178, 1 ist der AR 1 Koeffizient 0 25224 und 2 ist der AR 2 Koeffizient 0 195572.Mean gegenüber der Konstante Im Allgemeinen ist der mittlere Term in der Die Ausgabe eines ARIMA-Modells bezieht sich auf den Mittelwert der differenzierten Reihe, dh der durchschnittliche Trend, wenn die Reihenfolge der Differenzierung gleich 1 ist, während die Konstante der konstante Term ist, der auf der rechten Seite der Prognosegleichung erscheint Konstante Begriffe sind durch die Gleichung verknüpft. CONSTANT MEAN 1 minus die Summe der AR Koeffizienten In diesem Fall haben wir 0 258178 0 467566 1 - 0 25224 - 0 195572.Lichtmodell für die UNITS Serie - ARIMA 0,2, 1 Erinnern wir uns, dass wir, als wir anfingen, die UNITS-Reihe zu analysieren, nicht ganz sicher waren von der korrekten Reihenfolge der Differenzierung zu verwenden. Eine Reihenfolge der Nicht-Seasonal-Differenzierung ergab die niedrigste Standardabweichung und ein Muster der milden positiven Autokorrelation, während zwei Ordnungen der Nichtseason-Differenzierung nachgaben Eine eher stationär aussehende Zeitreihen-Handlung, aber mit einer starken negativen Autokorrelation Hier sind sowohl die ACF als auch die PACF der Serie mit zwei nicht-seasonalen Differenzen. Die einzelne negative Spike bei Verzögerung 1 im ACF ist eine MA 1 Signatur gemäß Regel 8 oben Wenn wir also 2 Nichtseasonalunterschiede verwenden würden, hätten wir auch einen MA 1-Term, der ein ARIMA-0,2,1-Modell liefert. Nach Regel 5 wollen wir auch den konstanten Begriff unterdrücken. Hier sind also Die Ergebnisse der Anpassung eines ARIMA 0,2,1 Modells ohne Konstante. Notice, dass die geschätzte weiße Rausch Standardabweichung RMSE ist nur sehr etwas höher für dieses Modell als die vorherige 1 46301 hier versus 1 45215 zuvor Die Prognose Gleichung für dieses Modell ist Wo theta-1 der MA 1 - Koeffizient ist, erinnern wir, dass dies einem linearen exponentiellen Glättungsmodell ähnlich ist, wobei der MA 1 - Koeffizient der Größe 2 1-alpha im LES-Modell entspricht. Der MA 1 - Koeffizient von 0 76 in diesem Modell deutet darauf hin Dass ein LES-Modell mit Alpha in der Nähe von 0 72 genauso gut passen würde. Wenn ein LES-Modell an die gleichen Daten angepasst ist, erweist sich der optimale Wert von alpha auf etwa 0 61, was nicht zu weit weg ist Ist ein Modellvergleichsbericht, der die Ergebnisse der Montage des ARIMA 2,1,0 Modells mit konstantem, ARIMA 0,2,1 Modell ohne Konstante und dem LES Modell zeigt. Die drei Modelle sind in der Schätzperiode nahezu identisch Das ARIMA 2,1,0 Modell mit konstantem erscheint etwas besser als die beiden anderen in der Validierungsperiode Auf der Basis dieser statistischen Ergebnisse allein wäre es schwer, zwischen den drei Modellen zu wählen. Allerdings, wenn wir die langfristigen Prognosen abgeben Die von dem ARIMA 0,2,1 Modell ohne Konstante gemacht wurden, die im Wesentlichen die gleichen sind wie die des LES-Modells, sehen wir einen signifikanten Unterschied zu denen des früheren Modells. Die Prognosen haben etwas weniger Aufwärtstrend als die des früheren Modell - denn der lokale Trend nahe dem Ende der Serie ist etwas weniger als der durchschnittliche Trend über die ganze Serie - aber die Konfidenzintervalle breiten sich viel schneller aus Das Modell mit zwei Ordnungen der Differenzierung geht davon aus, dass der Trend in der Serie Zeit ist - varying, daher hält es für die ferne Zukunft, um viel unsicherer zu sein, als das Modell mit nur einer Reihenfolge der Differenzierung. Welches Modell sollten wir wählen Das hängt von den Annahmen ab, die wir in Bezug auf die Konstanz des Trendes in den Daten bequem machen Das Modell mit nur einer Reihenfolge der Differenzierung nimmt einen konstanten durchschnittlichen Trend an - es handelt sich im Wesentlichen um ein fein abgestimmtes zufälliges Wandermodell mit Wachstum - und das macht daher relativ konservative Trendprojektionen. Es ist auch ziemlich optimistisch hinsichtlich der Genauigkeit, mit der es prognostiziert werden kann Mehr als eine Periode im Vorfeld Das Modell mit zwei Ordnungen der Differenzierung nimmt einen zeitlich variierenden lokalen Trend - es ist im Wesentlichen ein lineares exponentielles Glättungsmodell - und seine Trendprojektionen sind etwas mehr fälschlich. Als allgemeine Regel in dieser Art von Situation, Ich würde empfehlen, das Modell mit der niedrigeren Reihenfolge der Differenzierung zu wählen, andere Dinge sind ungefähr gleich In der Praxis, zufällige Spaziergang oder einfach-exponentiell-glättende Modelle scheinen oft besser zu funktionieren als lineare exponentielle Glättung Modelle. Mixed Modelle In den meisten Fällen die besten Modell stellt sich heraus, ein Modell, das entweder nur AR-Begriffe oder nur MA-Begriffe verwendet, obwohl in einigen Fällen ein gemischtes Modell mit sowohl AR - als auch MA-Terminen die besten Anpassungen an die Daten liefern kann. Allerdings muss bei der Montage von gemischten Modellen Vorsicht geboten werden Für einen AR-Term und einen MA-Term, um sich gegenseitig s Effekte aufzuheben, obwohl beide im Modell signifikant erscheinen können, wie durch die t-Statistik ihrer Koeffizienten beurteilt wird. So wird beispielsweise angenommen, dass das richtige Modell für eine Zeitreihe ein ARIMA ist 0,1,1-Modell, aber stattdessen passen Sie ein ARIMA 1,1,2-Modell - dh Sie beinhalten einen zusätzlichen AR-Term und einen zusätzlichen MA-Term Dann können die zusätzlichen Begriffe am Ende im Modell deutlich erscheinen, aber intern können sie Nur gegeneinander arbeiten Die daraus resultierenden Parameterschätzungen können zweideutig sein, und der Parameterschätzprozess kann sehr viele z. B. mehr als 10 Iterationen annehmen, um daraus zu konvergieren. Regel 8 Es ist möglich, dass ein AR-Term und ein MA-Term sich gegenseitig aufheben Effekte, also wenn ein gemischtes AR-MA-Modell den Daten zu entsprechen scheint, probier auch ein Modell mit einem weniger AR-Term und einem weniger MA-Term aus - besonders wenn die Parameterschätzungen im Originalmodell mehr als 10 Iterationen konvergieren müssen In diesem Grund können ARIMA-Modelle nicht durch einen rückwärts schrittweisen Ansatz identifiziert werden, der sowohl AR - als auch MA-Terme enthält. Mit anderen Worten: Sie können nicht beginnen, indem Sie mehrere Begriffe jeder Art einbeziehen und dann diejenigen auswerfen, deren geschätzte Koeffizienten nicht signifikant sind Ein vorwärts schrittweises Vorgehen, das Hinzufügen von Terme der einen oder anderen Art, wie durch das Auftreten der ACF - und PACF-Plots angedeutet ist. Unit-Wurzeln Wenn eine Reihe grob unter - oder überdifferenziert ist - dh wenn eine ganze Reihenfolge der Differenzierung hinzugefügt werden muss oder Abgesagt, wird dies oft von einer Einheitswurzel in den geschätzten AR - oder MA-Koeffizienten des Modells signalisiert. Ein AR-1-Modell soll eine Einheitswurzel haben, wenn der geschätzte AR 1 - Koeffizient fast genau gleich 1 ist Deutlich anders als im Hinblick auf den eigenen Standardfehler des Koeffizienten Wenn dies geschieht, bedeutet dies, dass der AR 1-Term genau einen ersten Unterschied nachahmt, in welchem ​​Fall man den AR 1-Term entfernen und eine Reihenfolge der Differenzierung hinzufügen soll. Das ist genau so Was passieren würde, wenn man ein AR 1 - Modell an die undifferenzierte UNITS-Serie anpasst, wie bereits erwähnt In einem AR-Modell höherer Ordnung existiert eine Einheitswurzel im AR-Teil des Modells, wenn die Summe der AR-Koeffizienten genau gleich 1 ist In diesem Fall solltest du die Reihenfolge des AR-Termes um 1 reduzieren und eine Reihenfolge der Differenzierung hinzufügen. Eine Zeitreihe mit einer Einheitswurzel in den AR-Koeffizienten ist nichtstationär - es braucht eine höhere Reihenfolge der Differenzierung. Regel 9 Wenn es eine Einheitswurzel im AR-Teil des Modells - dh wenn die Summe der AR-Koeffizienten fast genau 1 ist - soll man die Anzahl der AR-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins erhöhen. Ähnlich ein MA 1-Modell Soll eine Einheitswurzel haben, wenn der geschätzte MA 1 - Koeffizient genau gleich 1 ist. Wenn dies geschieht, bedeutet dies, dass der MA 1-Term genau einen ersten Unterschied annulliert, in welchem ​​Fall Sie den MA 1-Term entfernen und auch reduzieren sollten Die Reihenfolge der Differenzierung um eins In einem übergeordneten MA-Modell existiert eine Einheitswurzel, wenn die Summe der MA-Koeffizienten genau gleich 1 ist. Regel 10 Wenn es eine Einheitswurzel im MA-Teil des Modells gibt - dh wenn Die Summe der MA-Koeffizienten ist fast genau 1 - Sie sollten die Anzahl der MA-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins reduzieren. Zum Beispiel, wenn Sie ein lineares exponentielles Glättungsmodell ein ARIMA 0,2,2 Modell passen Wenn ein einfaches exponentielles Glättungsmodell ein ARIMA-0,1,1-Modell ausreichen würde, können Sie feststellen, dass die Summe der beiden MA-Koeffizienten sehr nahezu gleich 1 ist. Durch Verringerung der MA-Ordnung und der Reihenfolge der Differenzierung um jeweils eine, Erhalten Sie das passendere SES-Modell Ein Prognosemodell mit einer Einheitswurzel in den geschätzten MA-Koeffizienten wird als nichtinvertibel bezeichnet, was bedeutet, dass die Residuen des Modells nicht als Schätzungen des wahren zufälligen Rauschens betrachtet werden können, das die Zeitreihen erzeugt hat. Ein weiteres Symptom von Eine Einheit Wurzel ist, dass die Prognosen des Modells kann sprengen oder sonst verhalten bizarr Wenn die Zeitreihenplot der längerfristigen Prognosen des Modells sieht seltsam, sollten Sie die geschätzten Koeffizienten Ihres Modells für die Anwesenheit einer Einheit Wurzel zu überprüfen. Rule 11 Wenn die Langzeitprognosen unregelmäßig oder instabil erscheinen, kann es in den AR - oder MA-Koeffizienten eine Einheitswurzel geben. Keiner dieser Probleme entstand mit den beiden hier installierten Modellen, weil wir sorgfältig mit plausiblen Ordnungen der Differenzierung beginnen mussten Und angemessene Anzahl von AR - und MA-Koeffizienten durch das Studium der ACF - und PACF-Modelle. Mehr detaillierte Diskussionen über Einheitswurzeln und Streichungseffekte zwischen AR - und MA-Terme finden Sie in der mathematischen Struktur von ARIMA-Models Handout. A Correlogram tale. In Datenanalyse, Wir beginnen gewöhnlich mit den beschreibenden statistischen Eigenschaften der Probendaten zB Mittelwert, Standardabweichung, Schräglauf, Kurtosis, empirische Verteilung usw. Diese Berechnungen sind sicherlich nützlich, aber sie berücksichtigen nicht die Reihenfolge der Beobachtungen in den Beispieldaten Analyse erfordert, dass wir auf die Ordnung achten und somit eine andere Art von beschreibenden Statistiken benötigen. Zeitreihen beschreibende Statistiken oder einfach Korrelogrammanalyse Die Korrelogram-Analyse untersucht die zeitraumabhängige Abhängigkeit innerhalb der Probendaten und konzentriert sich auf die empirische Auto-Kovarianz, Autokorrelation und verwandte statistische Tests Schließlich ist das Korrelogramm ein Grundstein für die Identifizierung der Modell - und Modellreihenfolge. Was ein Plot für die Autokorrelation ACF und oder teilweise Autokorrelation PACF sagt uns über die zugrunde liegende Prozessdynamik. Dieses Tutorial ist Ein bisschen mehr theoretisch als vorherige Tutorials in der gleichen Serie, aber wir werden unser Bestes tun, um die Intuitionen nach Hause für Sie zu fahren. Zuerst beginnen wir mit einer Definition für die Autokorrelationsfunktion, vereinfachen sie und untersuchen das theoretische ACF für Ein ARMA-Typ von Prozess. Auto-Korrelation Funktion ACF. By Definition, die Autokorrelation für die Verzögerung k wird wie folgt ausgedrückt. Ko-Korrelationsfunktion für die Verzögerung k. auto-Kovarianz für Verzögerung k. time Serie Varianz un-bedingte. Stationäre Zeitreihe bedingungsloses Mittel. Darüber hinaus geht man davon aus, dass aus einem schwach stationären Prozeß mit einem Null-Mittelwert i e erzeugt wird. Für endliche Abtastdaten wird die empirische Autokorrelation wie folgt ausgedrückt: J neq 0 Sigma 2 j 0 Ende rechts Data-pagespeed-url-hash 3448620129.Jetzt berechnen wir die ACF für verschiedene Lags. Theta1 2a 2 theta2 2a 2 theta3 2a 2 thetaq 2a 2 rechts sigma 2 links 1 sum thetaj 2 rechts data-pagespeed-url-hash 2790545473. theta1 theta2a 2 theta2 theta3a 2 theta thetaqa 2 rechts sigma 2 links theta1 sum thetaj theta rechts daten - Pagespeed-url-hash 4120581346. theta1 theta3a 2 theta2 theta4a 2 theta thetaqa 2 rechts sigma 2 links theta2 sum thetaj theta rechts daten-pagespeed-url-hash 4195645926. theta1 theta a 2 theta2 theta a 2 theta thetaqa 2 rechts sigma 2 links theta3 Summe thetaj theta right data-pagespeed-url-hash 586088199. data-pagespeed-url-hash 610845080. frac thetaj thetaj 2 k leq q 0 k succ q Ende rechts data-pagespeed-url-hash 1209414616.Die ACF-Plot für ein MA q Prozess ist ungleich Null für die ersten q Lags. Die MA hat einen endlichen Speicher der Größe q. Die ACF-Plot zeigt die Speichergröße Anforderung des Modells. Ein ARMA-Modell mit endlichen Speicher kann vollständig beschrieben werden mit einem MA-Typ von Modell Die Koeffizientenwerte des MA-Modells sind die Werte der Autokorrelationsfunktion. Beispiel 2 - AR 1 Modell. Next, lasst uns ein einfaches auto-regressives AR-Modell der Ordnung ansehen 1.Dieses ACF-Plot ist auch unendlich, aber Die tatsächliche Form kann verschiedenen Mustern folgen. Ein AR-Prozess kann durch einen unendlichen MA-Prozess dargestellt werden. Der AR hat unendliches Gedächtnis, aber der Effekt verringert sich im Laufe der Zeit. Exponentielle Glättungsfunktionen sind spezielle Fälle eines AR-Prozesses, und sie besitzen auch unendliches Gedächtnis. Beispiel 4 - ARMA p, q model. By jetzt sehen wir, was die ACF-Handlung eines reinen MA - und AR-Prozesses aussieht, aber was ist mit einer Mischung aus den beiden Modellen. Warum brauchen wir ein Mischungsmodell wie ARMA zu betrachten , Da wir jedes Modell als MA oder ein AR-Modell repräsentieren können Antwort Wir versuchen, den Speicherbedarf und die Komplexität des Prozesses durch die Super-Auferlegung der beiden Modelle zu reduzieren. Long-run bedingten Prozessmittel von der AR-Komponente Die charakteristischen Wurzeln des AR p-Modells. Mit der MA q Autokorrelationsformel können wir die ARMA p, q Auto-Korrelationsfunktionen für ihre MA-Repräsentation berechnen. Dies wird immer intensiv. Einige von euch könnten sich fragen, warum wir Port verwendet haben VAR oder eine staatliche Raumdarstellung, um die Notationen zu vereinfachen, machte ich einen Punkt, um im Zeitbereich zu bleiben, und vermied irgendwelche neuen Ideen oder Mathe-Tricks, da sie nicht unseren Absichten hier dienen würden. Imprägnieren Sie die genaue AR-MA-Reihenfolge mit den ACF-Werten selbst, Das ist alles andere als präzise. Intuition Die ACF-Werte können als die Koeffizientenwerte des äquivalenten MA-Modells gedacht werden. Intuition Die bedingte Varianz hat keine Barriere Wirkung auf die Autokorrelationsberechnungen. Intuition Das Langzeit-Mittel hat auch keine Barriere-Effekt auf die Auto-Korrelationen. Partial Auto-Korrelation Funktion PACF. By jetzt haben wir gesehen, dass die Identifizierung der Modellreihenfolge MA oder die AR ist nicht-trivial für nicht-einfache Fälle, so brauchen wir eine andere Tool teilweise Autokorrelation Funktion PACF. Die partielle Autokorrelationsfunktion PACF spielt eine wichtige Rolle bei der Datenanalyse, die darauf abzielt, das Ausmaß der Verzögerung in einem autoregressiven Modell zu identifizieren. Die Verwendung dieser Funktion wurde als Teil des Box-Jenkins-Ansatzes zur Zeitreihenmodellierung eingeführt Bestimmen die entsprechenden Verzögerungen p in einem AR p-Modell oder in einem erweiterten ARIMA p, d, q-Modell durch Plotten der partiellen Autokorrelationsfunktionen. Der PACF für die Verzögerung k ist der Regressionskoeffizient für den k-ten Term, wie unten gezeigt. Die PACF geht davon aus, dass das zugrundeliegende Modell ein AR k ist und mehrere Regressionen verwendet, um den letzten Regressionskoeffizienten zu berechnen. Bitte beachten Sie, dass und dass. Quick Intuition die PACF-Werte können grob gesprochen werden, da die Koeffizientenwerte des äquivalenten AR-Modells Die PACF hilfsbereit zu uns Angenommen, wir haben einen AR-P-Prozess, dann wird die PACF signifikante Werte für die ersten p-Verzögerungen haben und wird danach auf Null fallen. Was geht es um den MA-Prozess Der MA-Prozess hat nicht-Null-PACF-Werte für eine theoretisch Unendlich viele Lags. Example 4 MA 1.2 1 Moving Average Models MA Modelle. Time-Serie Modelle bekannt als ARIMA-Modelle können autoregressive Begriffe und oder gleitende durchschnittliche Begriffe In Woche 1, lernten wir einen autoregressiven Begriff in einem Zeitreihenmodell für die Variable xt Ist ein verzögerter Wert von xt. Beispielsweise ist ein autoregressiver Term 1 x t-1 multipliziert mit einem Koeffizienten. Diese Lektion definiert gleitende Durchschnittsbegriffe. Ein bewegter Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler, multipliziert mit einem Koeffizienten Osset N 0, Sigma 2w, was bedeutet, dass die wt identisch, unabhängig verteilt sind, jeweils mit einer Normalverteilung mit Mittelwert 0 und der gleichen Varianz. Das 1-stufige gleitende Durchschnittsmodell, das mit MA 1 bezeichnet wird, ist. Xt mu wt theta1w. Das 2. geordnete gleitende Durchschnittsmodell, das mit MA 2 bezeichnet wird, ist. Xt mu wt theta1w theta2w. Das gängige gleitende durchschnittliche Modell, das mit MA q bezeichnet wird, ist. Xt mu wt theta1w theta2w punkte thetaq. Note Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und nicht quittierten Begriffe in Formeln für ACFs und Abweichungen Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Zeichen verwendet wurden, um das geschätzte Modell R korrekt zu schreiben. R verwendet positive Zeichen in seinem zugrunde liegenden Modell, wie wir hier sind. Die theoretischen Eigenschaften einer Zeitreihe mit Ein MA 1 Modell. Hinweis, dass der einzige Wert ungleich Null in der theoretischen ACF ist für lag 1 Alle anderen Autokorrelationen sind 0 Also ein Beispiel ACF mit einer signifikanten Autokorrelation nur bei lag 1 ist ein Indikator für eine mögliche MA 1 Modell. Für interessierte Studenten, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handzettel. Beispiel 1 Angenommen, dass ein MA 1 - Modell xt 10 wt 7 w t-1 ist, wobei wt Overset N 0,1 Somit ist der Koeffizient 1 0 7 Die theoretische ACF ist gegeben durch Von diesem ACF folgt. Die Plot, die gerade gezeigt wird, ist die theoretische ACF für eine MA 1 mit 1 0 7 In der Praxis, ein Beispiel gewonnen t in der Regel ein solches klares Muster Mit R, simulierten wir n 100 Probenwerte mit dem Modell xt 10 wt 7 W t-1 wo w t. iid N 0,1 Für diese Simulation folgt ein Zeitreihenplot der Stichprobendaten Wir können aus dieser Handlung viel erzählen. Die Stichprobe ACF für die simulierten Daten folgt Wir sehen eine Spike bei Verzögerung 1 Gefolgt von im Allgemeinen nicht signifikanten Werten für Verzögerungen nach 1. Beachten Sie, dass die Stichprobe ACF nicht mit dem theoretischen Muster der zugrunde liegenden MA 1 übereinstimmt, was bedeutet, dass alle Autokorrelationen für Verzögerungen nach 1 0 sind. Eine andere Probe hätte eine etwas andere Probe ACF Unten gezeigt, aber wahrscheinlich die gleichen breiten Features haben. Theroretische Eigenschaften einer Zeitreihe mit einem MA 2 Modell. Für das MA 2 Modell sind die theoretischen Eigenschaften die folgenden. Hinweis, dass die einzigen Werte ungleich Null in der theoretischen ACF sind für Lags 1 Und 2 Autokorrelationen für höhere Verzögerungen sind 0 Also, ein Beispiel ACF mit signifikanten Autokorrelationen bei Verzögerungen 1 und 2, aber nicht signifikante Autokorrelationen für höhere Verzögerungen zeigt ein mögliches MA 2 - Modell an. N 0,1 Die Koeffizienten sind 1 0 5 und 2 0 3 Da es sich hierbei um einen MA 2 handelt, wird der theoretische ACF nur ungleich Null-Werte nur bei den Verzögerungen 1 und 2 haben. Die Werte der beiden Nicht-Null-Autokorrelationen sind. Ein Diagramm der theoretischen ACF folgt. Wenn fast immer der Fall ist, wurden die Beispieldaten gewonnen Verhalten sich ganz so perfekt wie die Theorie Wir simulierten n 150 Sample-Werte für das Modell xt 10 wt 5 w t-1 3 w t-2 wobei w t. iid N 0,1 Die Zeitreihen-Plot der Daten folgt Wie bei den Zeitreihen Plot für die MA 1 Beispieldaten, können Sie t viel davon erzählen. Das Beispiel ACF für die simulierten Daten folgt Das Muster ist typisch für Situationen, in denen ein MA 2 Modell nützlich sein kann Es gibt zwei statistisch signifikante Spikes bei den Verzögerungen 1 und 2 gefolgt Durch nicht signifikante Werte für andere Lags Beachten Sie, dass aufgrund des Stichprobenfehlers die Stichprobe ACF nicht mit dem theoretischen Muster genau übereinstimmte. ACF für General MA q Modelle. Eigenschaft von MA q-Modelle im Allgemeinen ist, dass es keine Null-Autokorrelationen für die erste gibt Q Verzögerungen und Autokorrelationen 0 für alle Verzögerungen q. Non-Eindeutigkeit der Verbindung zwischen Werten von 1 und Rho1 in MA 1 Modell. Im MA 1 Modell gibt für jeden Wert von 1 der reziproke 1 1 den gleichen Wert für ein Beispiel , Benutze 0 5 für 1 und verwende dann 1 0 5 2 für 1 Du bekommst in beiden Fällen rho1 0 4. Um eine theoretische Einschränkung zu erfüllen, die Invertierbarkeit genannt wird, beschränken wir MA 1 - Modelle, Werte mit einem absoluten Wert kleiner als 1 zu haben Gegeben, 1 0 5 wird ein zulässiger Parameterwert sein, wohingegen 1 1 0 5 2 nicht. Unterstützung von MA Modellen ist. Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einer konvergierenden unendlichen Ordnung ist AR-Modell Durch konvergierende, wir Dass die AR-Koeffizienten auf 0 abnehmen, wenn wir uns in der Zeit zurückziehen. Unverträglichkeit ist eine Einschränkung, die in die Zeitreihen-Software programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Terminen abzuschätzen. Es ist nicht etwas, das wir in der Datenanalyse überprüfen. Weitere Informationen über die Invertierbarkeitsbeschränkung für MA 1 Modelle ist im Anhang angegeben. Advanced Theory Note Für ein MA q Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell Die notwendige Bedingung für die Invertierbarkeit ist, dass die Koeffizienten Werte haben, so dass die Gleichung 1- 1 y - - qyq 0 hat Lösungen für y, die außerhalb des Einheitskreises liegen. R Code für die Beispiele In Beispiel 1 haben wir die theoretische ACF des Modells xt 10 wt 7w t-1 aufgetragen und dann n 150 Werte aus diesem Modell simuliert und Aufgetragen die Sample-Zeitreihen und die Probe ACF für die simulierten Daten Die R-Befehle, die verwendet wurden, um das theoretische ACF zu zeichnen, waren. acfma1 ARMAacf ma c 0 7, 10 Verzögerungen von ACF für MA 1 mit theta1 0 7 Verzögerungen 0 10 erzeugt eine Variable namens Lags Das von 0 bis 10 Plot-Verzögerungen reicht, acfma1, xlim c 1,10, ylab r, Typ h, Haupt-ACF für MA 1 mit theta1 0 7 abline h 0 fügt eine horizontale Achse zum Plot hinzu. Der erste Befehl bestimmt die ACF und Speichert es in einem Objekt namens acfma1 unsere Wahl des Namens. Die Plot-Befehl der 3. Befehl Plots Lags gegenüber den ACF-Werte für Lags 1 bis 10 Die ylab Parameter markiert die y-Achse und der Haupt-Parameter setzt einen Titel auf dem Plot. To sehen Die numerischen Werte des ACF verwenden einfach den Befehl acfma1. Die Simulation und Plots wurden mit den folgenden Befehlen durchgeführt. List ma c 0 7 Simuliert n 150 Werte aus MA 1 x xc 10 fügt 10 hinzu, um Mittel zu machen 10 Simulationsvorgaben bedeuten 0 Plot x, Typ b, Haupt Simuliert MA 1 Daten acf x, xlim c 1,10, Haupt-ACF für simuliert Beispieldaten In Beispiel 2 haben wir die theoretische ACF des Modells xt 10 wt 5 w t-1 3 w t-2 aufgetragen und dann n 150 Werte aus diesem Modell simuliert und die Sample-Zeitreihen und die Probe ACF für die simulierten aufgetragen Daten Die verwendeten R-Befehle waren. acfma2 ARMAacf ma c 0 5,0 3, acfma2-Verzögerungen 0 10 Plot-Verzögerungen, acfma2, xlim c 1,10, ylab r, Typ h, Haupt-ACF für MA 2 mit theta1 0 5, theta2 0 3 abline h 0 list ma c 0 5, 0 3 x xc 10 plot x, Typ b, main Simuliert MA 2 Serie acf x, xlim c 1,10, Haupt-ACF für simulierte MA 2 Daten. Appendix Nachweis der Eigenschaften von MA 1 Für interessierte Schüler sind hier Beweise für die theoretischen Eigenschaften des MA 1 Modells. Variante Text xt Text mu wt theta1 w 0 text wt text theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2w. Wenn h 1, der vorherige ausdruck 1 W 2 Für jeden h 2 ist der vorhergehende Ausdruck 0 Der Grund dafür ist, dass durch die Definition der Unabhängigkeit des wt E wkwj 0 für jedes kj weiter, weil das wt den Mittelwert 0 hat, E wjwj E wj 2 w 2.Für eine Zeitreihe. Geben Sie dieses Ergebnis, um das oben angegebene ACF zu erhalten. Ein invertierbares MA-Modell ist eines, das als ein unendliches Ordnungs-AR-Modell geschrieben werden kann, das so konvergiert, dass die AR-Koeffizienten zu 0 konvergieren, wenn wir uns unendlich zurück bewegen. Wir zeigen die Invertierbarkeit für die MA 1 Modell. Wir ersetzen dann die Beziehung 2 für w t-1 in Gleichung 1. 3 zt wt theta1 z - theta1w wt theta1z - theta 2w. Die Zeit t-2 Gleichung 2 wird. Wir ersetzen dann die Beziehung 4 für w t-2 In Gleichung 3. Zt wt theta1 z - Theta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31.Wenn wir unendlich weitergehen würden, würden wir das unendliche AR-Modell bekommen. Zt wt theta1 z - theta 21z theta 31z - theta 41z dots. Hinweis jedoch, dass wenn 1 1 die Koeffizienten, die die Verzögerungen von z multiplizieren, unendlich an Größe zunehmen werden, wenn wir uns in der Zeit zurückziehen Um dies zu verhindern, brauchen wir 1 1 Dies ist Die Bedingung für ein invertierbares MA 1 Modell. Unendliche Ordnung MA Modell. In Woche 3 sehen wir, dass ein AR 1 Modell in ein unendliches Auftrag MA Modell umgewandelt werden kann. Xt - mu wt phi1w phi 21w punkte phi k1 w punkte sum phi j1w. Diese Summierung der vergangenen weißen Rauschbegriffe ist als die kausale Darstellung eines AR 1 bekannt. Mit anderen Worten, xt ist ein spezieller Typ von MA mit unendlich vielen Terme Rückkehr in der Zeit Dies ist eine unendliche Ordnung MA oder MA Eine endliche Ordnung MA ist eine unendliche Ordnung AR und jede endliche Ordnung AR ist eine unendliche Ordnung MA. Recall in Woche 1, stellten wir fest, dass eine Voraussetzung für eine stationäre AR 1 ist, dass 1 1 Sei s berechnen die Var xt mit der Kausaldarstellung. Dieser letzte Schritt verwendet eine grundlegende Tatsache über geometrische Serien, die phi1 erfordert 1 sonst die Serie divergiert.


No comments:

Post a Comment