Gleitende Durchschnittliche Modellbeobachtungen




Gleitende Durchschnittliche ModellbeobachtungenNet. sourceforge. openforecast. models Klasse MovingAverageModel Ein gleitendes Durchschnittsprognosemodell basiert auf einer kunstlich konstruierten Zeitreihe, in der der Wert fur einen gegebenen Zeitraum durch den Mittelwert dieses Werts und die Werte fur eine gewisse Anzahl vorangehender und nachfolgender Zeit ersetzt wird Zeitraume. Wie Sie vielleicht aus der Beschreibung erraten haben, ist dieses Modell am besten fur Zeitreihendaten, d. H. Daten, die sich uber die Zeit andern, geeignet. Zum Beispiel zeigen viele Charts von einzelnen Aktien an der Borse 20, 50, 100 oder 200 Tage gleitende Durchschnitte als Trends zu zeigen. Da der Prognosewert fur einen gegebenen Zeitraum ein Durchschnitt der vorangegangenen Perioden ist, wird die Prognose immer scheinbar zuruckbleiben, entweder bei Anstieg oder Abnahme der beobachteten (abhangigen) Werte. Wenn beispielsweise eine Datenreihe einen merkbaren Aufwartstrend aufweist, wird eine gleitende Durchschnittsprognose generell eine Unterbewertung der Werte der abhangigen Variablen liefern. Die gleitende Durchschnittsmethode hat gegenuber anderen Prognosemodellen den Vorteil, dass sie in einer Reihe von Beobachtungen Gipfel und Taler (oder Taler) glattet. Es hat jedoch auch mehrere Nachteile. Insbesondere erzeugt dieses Modell keine tatsachliche Gleichung. Daher ist es nicht alles, was nutzlich, da ein Mittel-Langstrecken-Prognose-Tool. Es kann nur zuverlassig verwendet werden, um ein oder zwei Perioden in die Zukunft zu prognostizieren. Das gleitende Durchschnittsmodell ist ein Spezialfall des allgemeineren gewichteten gleitenden Durchschnitts. Im einfachen gleitenden Durchschnitt sind alle Gewichte gleich. Seit: 0.3 Autor: Steven R. Gould Felder geerbt aus der Klasse net. sourceforge. openforecast. models. AbstractForecastingModel MovingAverageModel () Erstellt ein neues gleitendes Durchschnittsprognosemodell. MovingAverageModel (int period) Erstellt ein neues gleitendes Durchschnittsprognosemodell mit dem angegebenen Zeitraum. GetForecastType () Gibt einen oder zwei Wortnamen dieser Art von Prognosemodell zuruck. Init (DataSet dataSet) Dient zur Initialisierung des gleitenden Durchschnittsmodells. ToString () Dies sollte uberschrieben werden, um eine textuelle Beschreibung des aktuellen Prognosemodells zu liefern, einschlie?lich, wenn moglich, alle abgeleiteten Parameter. Methoden, die von der Klasse net. sourceforge. openforecast. models. WeightedMovingAverageModel geerbt werden MovingAverageModel Erstellt ein neues gleitendes Durchschnittsprognosemodell. Fur ein gultiges zu konstruierendes Modell sollten Sie init aufrufen und einen Datensatz mit einer Reihe von Datenpunkten ubergeben, wobei die Zeitvariable initialisiert wird, um die unabhangige Variable zu identifizieren. MovingAverageModel Konstruiert ein neues gleitendes Durchschnittsprognosemodell unter Verwendung des angegebenen Namens als unabhangige Variable. Parameter: independentVariable - der Name der unabhangigen Variablen, die in diesem Modell verwendet werden soll. MovingAverageModel Erstellt ein neues gleitendes Durchschnittsprognosemodell mit dem angegebenen Zeitraum. Fur ein gultiges zu konstruierendes Modell sollten Sie init aufrufen und einen Datensatz mit einer Reihe von Datenpunkten ubergeben, wobei die Zeitvariable initialisiert wird, um die unabhangige Variable zu identifizieren. Der Periodenwert wird verwendet, um die Anzahl der Beobachtungen zu bestimmen, die verwendet werden, um den gleitenden Durchschnitt zu berechnen. Beispielsweise sollte fur einen 50-tagigen gleitenden Durchschnitt, bei dem die Datenpunkte tagliche Beobachtungen sind, der Zeitraum auf 50 gesetzt werden. Der Zeitraum wird auch verwendet, um die Menge zukunftiger Perioden zu bestimmen, die effektiv prognostiziert werden konnen. Mit einem 50 Tage gleitenden Durchschnitt konnen wir mit einer Genauigkeit nicht mehr als 50 Tage uber den letzten Zeitraum, fur den Daten verfugbar sind, prognostizieren. Dies kann vorteilhafter sein, als z. B. ein Zeitraum von 10 Tagen, wo wir nur vernunftigerweise 10 Tage nach der letzten Periode prognostizieren konnten. Parameter: Periode - die Anzahl der Beobachtungen, die verwendet werden, um den gleitenden Durchschnitt zu berechnen. MovingAverageModel Erstellt ein neues gleitendes Durchschnittsprognosemodell unter Verwendung des angegebenen Namens als unabhangige Variable und des angegebenen Zeitraums. Parameter: independentVariable - der Name der unabhangigen Variablen, die in diesem Modell verwendet werden soll. - die Anzahl der Beobachtungen, die zur Berechnung des gleitenden Durchschnitts verwendet werden sollen. Init Wird verwendet, um das gleitende Durchschnittsmodell zu initialisieren. Diese Methode muss vor jeder anderen Methode in der Klasse aufgerufen werden. Da das gleitende Durchschnittsmodell keine Gleichung fur die Prognose ableitet, verwendet dieses Verfahren den Eingabedatensatz, um Prognosewerte fur alle gultigen Werte der unabhangigen Zeitvariablen zu berechnen. Vorgabe durch: init in der Schnittstelle ForecastingModel Overrides: init in der Klasse AbstractTimeBasedModel Parameter: dataSet - ein Datensatz von Beobachtungen, mit dem die Prognoseparameter des Prognosemodells initialisiert werden konnen. GetForecastType Gibt einen oder zwei Wortnamen dieser Art von Prognosemodell zuruck. Halten Sie diese kurz. Eine langere Beschreibung sollte in der Methode toString implementiert werden. ToString Dies sollte uberschrieben werden, um eine textuelle Beschreibung des aktuellen Prognosemodells zu liefern, wobei nach Moglichkeit alle abgeleiteten Parameter verwendet werden. Bestimmt durch: toString in der Schnittstelle ForecastingModel Overrides: toString in der Klasse WeightedMovingAverageModel Gibt eine Stringdarstellung des aktuellen Prognosemodells und dessen Parameter zuruck. Ein Beispiel fur eine Zeitreihe fur 25 Perioden ist in Abb. 1 aus den numerischen Daten in Tabelle 1. Die Daten konnten die wochentliche Nachfrage nach einem Produkt darstellen. Wir verwenden x, um eine Beobachtung anzugeben, und t, um den Index der Zeitperiode darzustellen. Der beobachtete Zeitbedarf ist genau bezeichnet. Die Daten von 1 bis T sind:. Die Linien, die die Beobachtungen auf der Figur verbinden, dienen nur zur Verdeutlichung des Bildes und haben sonst keine Bedeutung. Tabelle 1. Wochentliche Nachfrage nach Wochen 1 bis 30 Abbildung 1. Eine Zeitreihe der wochentlichen Nachfrage Unser Ziel ist es, ein Modell zu ermitteln, das die beobachteten Daten erklart und eine Extrapolation in die Zukunft ermoglicht, um eine Prognose zu liefern. Das einfachste Modell deutet darauf hin, dass die Zeitreihe eine Konstante mit Variationen um den konstanten Wert ist, der durch eine Zufallsvariable bestimmt wird. Der obere Fall reprasentiert die Zufallsvariable, die die unbekannte Nachfrage zum Zeitpunkt t ist. Wahrend der kleinere Fall ein tatsachlich beobachteter Wert ist. Die Zufallsvariation um den Mittelwert wird als Rauschen bezeichnet. Es wird angenommen, dass das Rauschen einen Mittelwert von Null und eine spezifizierte Varianz aufweist. Die Variationen in zwei verschiedenen Zeitraumen sind unabhangig. Speziell MAD (8,7 2,4 8230 0,9) / 10 4.11 und Wir sehen, dass 1,25 (MAD) 5.138 ungefahr gleich der Standardabweichung ist. Die beispielhaft verwendete Zeitreihe wird mit einem konstanten Mittelwert simuliert. Abweichungen vom Mittelwert werden normalerweise mit Mittelwert Null und Standardabweichung 5 verteilt. Die Fehlerstandardabweichung umfasst die kombinierten Effekte von Fehlern in dem Modell und dem Rauschen, so dass ein Wert gro?er als 5 erwartet wurde. Naturlich eine andere Realisierung der Simulation Ergeben unterschiedliche statistische Werte. Das Excel-Arbeitsblatt, das von dem Prognose-Add-In erstellt wird, veranschaulicht die Berechnung fur die Beispieldaten. Die Daten sind in Spalte B. Die Spalte C enthalt die gleitenden Mittelwerte und die einperiodischen Prognosen in Spalte D. Der Fehler in Spalte E ist die Differenz zwischen Spalten B und D fur Zeilen, die sowohl Daten als auch Prognose haben. Die Standardabweichung des Fehlers ist in der Zelle E6, und der MAD befindet sich in der Zelle E7. In der Praxis liefert der gleitende Durchschnitt eine gute Schatzung des Mittelwerts der Zeitreihe, wenn der Mittelwert konstant ist oder sich langsam andert. Im Fall eines konstanten Mittelwertes wird der gr?te Wert von m die besten Schatzungen des zugrunde liegenden Mittels liefern. Ein langerer Beobachtungszeitraum wird die Effekte der Variabilitat ausmachen. Der Zweck der Bereitstellung eines kleineren m ist es, die Prognose auf eine Anderung in dem zugrunde liegenden Prozess zu ermoglichen. Um zu veranschaulichen, schlagen wir einen Datensatz vor, der Anderungen im zugrundeliegenden Mittel der Zeitreihen enthalt. Die Abbildung zeigt die Zeitreihen fur die Darstellung zusammen mit der mittleren Nachfrage, aus der die Serie erzeugt wurde. Der Mittelwert beginnt als eine Konstante bei 10. Ab dem Zeitpunkt 21 erhoht er sich um eine Einheit in jeder Periode, bis er zum Zeitpunkt 30 den Wert von 20 erreicht. Dann wird er wieder konstant. Die Daten werden simuliert, indem dem Mittelwert ein zufalliges Rauschen aus einer Normalverteilung mit Nullmittelwert und Standardabweichung 3 hinzugefugt wird. Die Ergebnisse der Simulation werden auf die nachste ganze Zahl gerundet. Die Tabelle zeigt die simulierten Beobachtungen fur das Beispiel. Wenn wir die Tabelle verwenden, mussen wir bedenken, dass zu einem gegebenen Zeitpunkt nur die letzten Daten bekannt sind. Die Schatzwerte des Modellparameters, fur drei verschiedene Werte von m, werden zusammen mit dem Mittelwert der Zeitreihen in der folgenden Abbildung gezeigt. Die Abbildung zeigt die gleitende durchschnittliche Schatzung des Mittelwerts zu jedem Zeitpunkt und nicht die Prognose. Die Prognosen wurden die gleitenden Durchschnittskurven nach Perioden nach rechts verschieben. Eine Schlussfolgerung ergibt sich unmittelbar aus der Figur. Fur alle drei Schatzungen liegt der gleitende Durchschnitt hinter dem linearen Trend, wobei die Verzogerung mit m zunimmt. Die Verzogerung ist der Abstand zwischen dem Modell und der Schatzung in der Zeitdimension. Wegen der Verzogerung unterschatzt der gleitende Durchschnitt die Beobachtungen, wahrend der Mittelwert zunimmt. Die Vorspannung des Schatzers ist die Differenz zu einer bestimmten Zeit im Mittelwert des Modells und dem Mittelwert, der durch den gleitenden Durchschnitt vorhergesagt wird. Die Vorspannung, wenn der Mittelwert zunimmt, ist negativ. Bei einem abnehmenden Mittelwert ist die Vorspannung positiv. Die Verzogerung in der Zeit und die Bias in der Schatzung eingefuhrt sind Funktionen von m. Je gro?er der Wert von m. Desto gro?er ist die Gro?e der Verzogerung und der Vorspannung. Fur eine stetig wachsende Serie mit Trend a. Die Werte der Verzogerung und der Vorspannung des Schatzers des Mittelwerts sind in den folgenden Gleichungen gegeben. Die Beispielkurven stimmen nicht mit diesen Gleichungen uberein, da das Beispielmodell nicht kontinuierlich zunimmt, sondern als Konstante beginnt, sich in einen Trend andert und dann wieder konstant wird. Auch die Beispielkurven sind vom Rauschen betroffen. Die gleitende Durchschnittsprognose der Perioden in die Zukunft wird durch die Verschiebung der Kurven nach rechts dargestellt. Die Verzogerung und die Vorspannung nehmen proportional zu. Die nachstehenden Gleichungen zeigen die Verzogerung und die Vorspannung von Prognoseperioden in die Zukunft im Vergleich zu den Modellparametern. Diese Formeln sind wiederum fur eine Zeitreihe mit einem konstanten linearen Trend. Wir sollten dieses Ergebnis nicht uberraschen. Der gleitende Durchschnittsschatzer basiert auf der Annahme eines konstanten Mittelwerts, und das Beispiel hat einen linearen Trend im Mittel wahrend eines Teils des Studienzeitraums. Da Realzeitreihen den Annahmen eines Modells nur selten gehorchen, sollten wir auf solche Ergebnisse vorbereitet sein. Wir konnen auch aus der Figur schlie?en, dass die Variabilitat des Rauschens den gro?ten Effekt fur kleinere m hat. Die Schatzung ist viel volatiler fur den gleitenden Durchschnitt von 5 als der gleitende Durchschnitt von 20. Wir haben die widerstrebenden Wunsche, m zu erhohen, um den Effekt der Variabilitat aufgrund des Rauschens zu verringern und m zu verringern, um die Prognose besser auf Veranderungen anzupassen Im Mittel. Der Fehler ist die Differenz zwischen den tatsachlichen Daten und dem prognostizierten Wert. Wenn die Zeitreihe wirklich ein konstanter Wert ist, ist der erwartete Wert des Fehlers Null und die Varianz des Fehlers besteht aus einem Term, der eine Funktion von und ein zweiter Term ist, der die Varianz des Rauschens ist. Der erste Term ist die Varianz des Mittelwertes mit einer Stichprobe von m Beobachtungen, vorausgesetzt, die Daten stammen aus einer Population mit einem konstanten Mittelwert. Dieser Begriff wird minimiert, indem man m so gro? wie moglich macht. Ein gro?es m macht die Prognose auf eine Anderung der zugrunde liegenden Zeitreihen unempfanglich. Um die Prognose auf Veranderungen anzupassen, wollen wir m so klein wie moglich (1), aber dies erhoht die Fehlerabweichung. Praktische Voraussage erfordert einen Zwischenwert. Prognose mit Excel Das Prognose-Add-In implementiert die gleitenden Durchschnittsformeln. Das folgende Beispiel zeigt die Analyse des Add-In fur die Beispieldaten in Spalte B. Die ersten 10 Beobachtungen sind mit -9 bis 0 indexiert. Im Vergleich zur obigen Tabelle werden die Periodenindizes um -10 verschoben. Die ersten zehn Beobachtungen liefern die Startwerte fur die Schatzung und werden verwendet, um den gleitenden Durchschnitt fur die Periode 0 zu berechnen. Die Spalte MA (10) zeigt die berechneten Bewegungsdurchschnitte. Der gleitende Mittelwert m ist in Zelle C3. Die Fore (1) Spalte (D) zeigt eine Prognose fur einen Zeitraum in die Zukunft. Das Prognoseintervall ist in Zelle D3. Wenn das Prognoseintervall auf eine gro?ere Zahl geandert wird, werden die Zahlen in der Spalte Vorwarts verschoben. Die Err (1) - Spalte (E) zeigt die Differenz zwischen der Beobachtung und der Prognose. Zum Beispiel ist die Beobachtung zum Zeitpunkt 1 6. Der prognostizierte Wert, der aus dem gleitenden Durchschnitt zum Zeitpunkt 0 gemacht wird, betragt 11,1. Der Fehler ist dann -5.1. Die Standardabweichung und mittlere mittlere Abweichung (MAD) werden in den Zellen E6 bzw. E7 berechnet. Aoregressive Moving-Average-Fehlerprozesse (ARMA-Fehler) und andere Modelle, die Verzogerungen von Fehlertermen enthalten, konnen unter Verwendung von FIT-Anweisungen geschatzt und durch simuliert oder prognostiziert werden Mit SOLVE-Anweisungen. ARMA-Modelle fur den Fehlerprozess werden oft fur Modelle mit autokorrelierten Residuen verwendet. Mit dem AR-Makro konnen Modelle mit autoregressiven Fehlerprozessen spezifiziert werden. Mit dem MA-Makro konnen Modelle mit gleitenden Durchschnittsfehlern angegeben werden. Autoregressive Fehler Ein Modell mit autoregressiven Fehler erster Ordnung, AR (1), hat die Form, wahrend ein AR (2) Fehlerprozess die Form hat und so weiter fur Prozesse hoherer Ordnung. Beachten Sie, dass die s unabhangig und identisch verteilt sind und einen Erwartungswert von 0 haben. Ein Beispiel fur ein Modell mit einer AR (2) - Komponente ist usw. fur Prozesse hoherer Ordnung. Zum Beispiel konnen Sie ein einfaches lineares Regressionsmodell mit MA (2) gleitenden Durchschnittsfehlern schreiben, da MA1 und MA2 die gleitenden Mittelwerte sind. Beachten Sie, dass RESID. Y automatisch durch PROC MODEL definiert wird. Die ZLAG-Funktion muss fur MA-Modelle verwendet werden, um die Rekursion der Verzogerungen zu verkurzen. Dadurch wird sichergestellt, dass die verzogerten Fehler in der Lag-Priming-Phase bei Null beginnen und keine fehlenden Werte propagieren, wenn Verzogerungsperiodenvariablen fehlen, und stellt sicher, dass die zukunftigen Fehler null sind, anstatt wahrend Simulation oder Prognose fehlen. Einzelheiten zu den Verzogerungsfunktionen finden Sie im Abschnitt Lag Logic. Dieses mit dem MA-Makro geschriebene Modell lautet wie folgt: Allgemeine Form fur ARMA-Modelle Das allgemeine ARMA-Verfahren (p, q) hat die folgende Form Ein ARMA-Modell (p, q) kann wie folgt angegeben werden: wobei AR i und MA j reprasentieren Die autoregressiven und gleitenden Durchschnittsparameter fur die verschiedenen Verzogerungen. Sie konnen beliebige Namen fur diese Variablen verwenden, und es gibt viele aquivalente Moglichkeiten, die die Spezifikation geschrieben werden konnte. Vektor-ARMA-Prozesse konnen auch mit PROC MODEL geschatzt werden. Beispielsweise kann ein zweidimensionaler AR (1) - Proze? fur die Fehler der beiden endogenen Variablen Y1 und Y2 wie folgt spezifiziert werden: Konvergenzprobleme mit ARMA-Modellen ARMA-Modelle konnen schwer abzuschatzen sein. Wenn die Parameterschatzwerte nicht innerhalb des geeigneten Bereichs liegen, wachsen exponentiell gleitende Modellrestriktionen. Die berechneten Residuen fur spatere Beobachtungen konnen sehr gro? sein oder uberlaufen. Dies kann entweder geschehen, weil falsche Startwerte verwendet wurden oder weil sich die Iterationen von vernunftigen Werten entfernt haben. Bei der Auswahl der Anfangswerte fur ARMA-Parameter sollte Sorgfalt angewendet werden. Startwerte von 0,001 fur ARMA Parameter in der Regel funktionieren, wenn das Modell die Daten gut und das Problem passt gut konditioniert. Man beachte, dass ein MA-Modell oft durch ein hoherwertiges AR-Modell angenahert werden kann und umgekehrt. Dies kann in gemischten ARMA-Modelle in hohen Kollinearitat fuhren, was wiederum kann zu schweren Fehlkonditionierung in den Berechnungen und Instabilitat der Parameterschatzungen fuhren. Wenn Sie Konvergenzprobleme haben, wahrend Sie ein Modell mit ARMA-Fehlerprozessen schatzen, versuchen Sie in Schritten abzuschatzen. Verwenden Sie zunachst eine FIT-Anweisung nur die Strukturparameter mit den ARMA Parameter auf Null (oder zu vernunftigen fruheren Schatzungen, wenn verfugbar), die zu schatzen. Verwenden Sie dann eine andere FIT-Anweisung nur die ARMA-Parameter zu schatzen, die strukturellen Parameterwerte aus dem ersten Lauf mit. Da die Werte der Strukturparameter sind wahrscheinlich ihre endgultigen Schatzungen nahe zu sein, konnten die ARMA Parameterschatzungen nun zusammenlaufen. Verwenden Sie schlie?lich eine andere FIT-Anweisung, um simultane Schatzungen aller Parameter zu erzeugen. Da die Anfangswerte der Parameter jetzt wahrscheinlich ganz nahe an ihre endgultige gemeinsame Schatzungen zu sein, sollten die Schatzungen schnell konvergieren, wenn das Modell fur die Daten geeignet ist. AR Anfangsbedingungen Die Anfangsverzogerungen der Fehlerterme von AR (p) - Modellen konnen auf unterschiedliche Weise modelliert werden. Die autoregressiven Fehlerstartmethoden von SAS / ETS Verfahren unterstutzt sind die folgenden: bedingten kleinsten Quadrate (ARIMA und MODEL Verfahren) bedingungslose kleinsten Quadrate (AUTOREG, ARIMA und MODEL Verfahren) Maximum-Likelihood (AUTOREG, ARIMA und MODEL Verfahren) Yule-Walker (AUTOREG Verfahren nur) Hildreth-Lu, die die ersten p Beobachtungen (MODEL Verfahren nur) loscht siehe Kapitel 8, Die AUTOREG Verfahren, um eine Erklarung und Diskussion uber die Vorzuge der verschiedenen AR (p) den Startmethoden. Die CLS-, ULS-, ML - und HL-Initialisierungen konnen mit PROC MODEL durchgefuhrt werden. Fur AR (1) Fehler konnen diese Initialisierungen wie in Tabelle 18.2 gezeigt erzeugt werden. Diese Verfahren sind in gro?en Proben aquivalent. Tabelle 18.2 Initialisierungen durchgefuhrt durch PROC MODELL: AR (1) ERRORS Die anfanglichen Verzogerungen der Fehlerausdrucke von MA (q) - Modellen konnen auch unterschiedlich modelliert werden. Die folgenden gleitenden durchschnittlichen Fehlerstartparadigmen werden von den ARIMA - und MODEL-Prozeduren unterstutzt: unbedingte kleinste Fehlerquadrate bedingte kleinste Fehlerquadrate Die bedingte Methode der kleinsten Fehlerquadrate zur Schatzung der gleitenden durchschnittlichen Fehlerterme ist nicht optimal, da sie das Startproblem ignoriert. Dies verringert die Effizienz der Schatzungen, obwohl sie unverandert bleiben. Die anfanglichen verzogerten Residuen, die sich vor dem Start der Daten erstrecken, werden als 0 angenommen, ihr unbedingter Erwartungswert. Dies fuhrt zu einer Differenz zwischen diesen Residuen und den verallgemeinerten Resten der kleinsten Quadrate fur die gleitende durchschnittliche Kovarianz, die im Gegensatz zum autoregressiven Modell durch den Datensatz fortbesteht. Normalerweise konvergiert diese Differenz schnell auf 0, aber fur fast nicht-invertierbare gleitende Durchschnittsprozesse ist die Konvergenz ziemlich langsam. Um dieses Problem zu minimieren, sollten Sie viele Daten haben, und die gleitenden Durchschnittsparameter-Schatzungen sollten gut innerhalb des invertiblen Bereichs liegen. Dieses Problem kann auf Kosten des Schreibens eines komplexeren Programms korrigiert werden. Unbedingte Kleinste-Quadrate-Schatzungen fur das MA (1) - Proze? konnen durch Spezifizieren des Modells wie folgt erzeugt werden: Gleitende Durchschnittsfehler konnen schwer abgeschatzt werden. Man sollte erwagen, eine AR (p) - Naherung fur den gleitenden Durchschnitt zu verwenden. Ein gleitender Durchschnitt kann in der Regel durch einen autoregressiven Prozess gut approximiert werden, wenn die Daten nicht geglattet oder differenziert sind. Das AR-Makro Das SAS-Makro AR erzeugt Programmieranweisungen fur PROC MODEL fur autoregressive Modelle. Das AR-Makro ist Teil der SAS / ETS-Software, und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Das autoregressive Verfahren kann auf die strukturellen Gleichungsfehler oder auf die endogenen Reihen selbst angewendet werden. Das AR-Makro kann fur folgende Arten von Autoregression verwendet werden: uneingeschrankte Vektorautoregression beschrankte Vektorautoregression Univariate Autoregression Um den Fehlerterm einer Gleichung als autoregressiven Prozess zu modellieren, verwenden Sie die folgende Anweisung nach der Gleichung: Angenommen, Y ist eine Linearen Funktion von X1, X2 und einem AR (2) Fehler. Sie wurden dieses Modell wie folgt schreiben: Die Aufrufe zu AR mussen nach allen Gleichungen kommen, auf die sich der Prozess bezieht. Der vorhergehende Makroaufruf AR (y, 2) erzeugt die in der LIST-Ausgabe in Abbildung 18.58 gezeigten Anweisungen. Abbildung 18.58 LIST Optionsausgabe fur ein AR (2) - Modell Die PRED-Prafixvariablen sind temporare Programmvariablen, die verwendet werden, so dass die Verzogerungen der Residuen die korrekten Residuen sind und nicht die, die durch diese Gleichung neu definiert werden. Beachten Sie, dass dies den Aussagen entspricht, die explizit im Abschnitt Allgemeine Formulare fur ARMA-Modelle beschrieben sind. Sie konnen die autoregressiven Parameter auch bei ausgewahlten Verzogerungen auf Null setzen. Wenn Sie zum Beispiel autoregressive Parameter in den Lags 1, 12 und 13 wunschen, konnen Sie die folgenden Anweisungen verwenden: Diese Anweisungen erzeugen die in Abbildung 18.59 dargestellte Ausgabe. Abbildung 18.59 LIST-Option Ausgang fur ein AR-Modell mit Lags bei 1, 12 und 13 Die MODEL-Prozedurauflistung der kompilierten Programmcode-Anweisung als Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Es gibt Variationen der Methode der bedingten Kleinste-Quadrate, je nachdem, ob Beobachtungen am Anfang der Serie zum Aufwarmen des AR-Prozesses verwendet werden. Die AR-bedingte Methode der kleinsten Quadrate verwendet standardma?ig alle Beobachtungen und nimmt Nullen fur die Anfangsverzogerungen autoregressiver Terme an. Wenn Sie die M-Option verwenden, konnen Sie anfordern, dass AR die unbedingte Methode der kleinsten Fehlerquadrate (ULS) oder Maximum-Likelihood (ML) anwendet. Zum Beispiel, Diskussionen dieser Methoden wird im Abschnitt AR Anfangsbedingungen zur Verfugung gestellt. Unter Verwendung der Option MCLS n konnen Sie anfordern, dass die ersten n Beobachtungen verwendet werden, um Schatzungen der anfanglichen autoregressiven Verzogerungen zu berechnen. In diesem Fall beginnt die Analyse mit der Beobachtung n 1. Beispielsweise konnen Sie mit dem AR-Makro ein autoregressives Modell an die endogene Variable anstelle des Fehlerterms uber die Option TYPEV anwenden. Wenn Sie beispielsweise die funf letzten Lags von Y der Gleichung im vorherigen Beispiel hinzufugen mochten, konnen Sie AR verwenden, um die Parameter und die Lags mit den folgenden Anweisungen zu generieren: Die obigen Anweisungen erzeugen die in Abbildung 18.60 dargestellte Ausgabe. Abbildung 18.60 LIST Option Ausgang fur ein AR-Modell von Y Dieses Modell prognostiziert Y als lineare Kombination von X1, X2, einem Intercept und den Werten von Y in den letzten funf Perioden. Unrestricted Vector Autoregression Um die Fehlerausdrucke eines Gleichungssystems als vektorautoregressiven Prozess zu modellieren, verwenden Sie die folgende Form des AR-Makros nach den Gleichungen: Der Name des Prozessnamens ist ein beliebiger Name, den Sie fur AR verwenden, um Namen fur den autoregressiven Namen zu verwenden Werden. Mit dem AR-Makro konnen Sie verschiedene AR-Prozesse fur verschiedene Satze von Gleichungen modellieren, indem Sie fur jeden Satz unterschiedliche Prozessnamen verwenden. Der Prozessname stellt sicher, dass die verwendeten Variablennamen eindeutig sind. Verwenden Sie fur den Prozess einen kurzen Prozessname-Wert, wenn Parameter-Schatzwerte in einen Ausgabedatensatz geschrieben werden sollen. Das AR-Makro versucht, Parameternamen zu erstellen, die kleiner oder gleich acht Zeichen sind, aber diese wird durch die Lange des Prozessnamens begrenzt. Die als Prafix fur die AR-Parameternamen verwendet wird. Der Variablenlistenwert ist die Liste der endogenen Variablen fur die Gleichungen. Beispielsweise wird angenommen, dass Fehler fur die Gleichungen Y1, Y2 und Y3 durch einen autoregressiven Prozess der zweiten Ordnung erzeugt werden. Sie konnen die folgenden Aussagen verwenden, die fur Y1 und ahnlichen Code fur Y2 und Y3 erzeugen: Fur Vektorprozesse kann nur die Methode der bedingten kleinsten Quadrate (MCLS oder MCLS n) verwendet werden. Sie konnen auch das gleiche Formular mit Einschrankungen verwenden, dass die Koeffizientenmatrix bei ausgewahlten Verzogerungen 0 ist. Zum Beispiel verwenden die folgenden Aussagen einen Vektorprozess der dritten Ordnung auf die Gleichungsfehler, wobei alle Koeffizienten bei Verzogerung 2 auf 0 beschrankt sind und die Koeffizienten bei den Verzogerungen 1 und 3 unbeschrankt sind: Sie konnen die drei Reihen Y1Y3 als vektorautoregressiven Prozess modellieren In den Variablen statt in den Fehlern, indem Sie die Option TYPEV verwenden. Wenn Sie Y1Y3 als Funktion von vergangenen Werten von Y1Y3 und einigen exogenen Variablen oder Konstanten modellieren mochten, konnen Sie mit AR die Anweisungen fur die Lag-Terme erzeugen. Schreiben Sie eine Gleichung fur jede Variable fur den nichtautoregressiven Teil des Modells und rufen Sie dann AR mit der Option TYPEV auf. Zum Beispiel kann der nichtautoregressive Teil des Modells eine Funktion von exogenen Variablen sein, oder es konnen Abfangparameter sein. Wenn es keine exogenen Komponenten fur das Vektorautoregressionsmodell gibt, die keine Abschnitte enthalten, dann weisen Sie jeder der Variablen Null zu. Es muss eine Zuordnung zu jeder der Variablen vorhanden sein, bevor AR aufgerufen wird. Dieses Beispiel modelliert den Vektor Y (Y1 Y2 Y3) als eine lineare Funktion nur seines Werts in den vorherigen zwei Perioden und einen Wei?rauschenfehlervektor. Das Modell hat 18 (3 3 3 3) Parameter. Syntax des AR-Makros Es gibt zwei Falle der Syntax des AR-Makros. Wenn Einschrankungen fur einen Vektor-AR-Prozess nicht benotigt werden, hat die Syntax des AR-Makros die allgemeine Form, die ein Prafix fur AR spezifiziert, das beim Konstruieren von Namen von Variablen zum Definieren des AR-Prozesses verwendet werden soll. Wenn der Endolist nicht angegeben wird, ist die endogene Liste standardma?ig der Name. Der der Name der Gleichung sein muss, auf die der AR-Fehlerprozess angewendet werden soll. Der Name darf nicht langer als 32 Zeichen sein. Ist die Reihenfolge des AR-Prozesses. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Wenn mehr als ein Name gegeben wird, wird ein unbeschrankter Vektorprozess mit den strukturellen Residuen aller Gleichungen erzeugt, die als Regressoren in jeder der Gleichungen enthalten sind. Wenn nicht angegeben, verwendet endolist standardma?ig den Namen. Gibt die Liste der Verzogerungen an, zu denen die AR-Terme hinzugefugt werden sollen. Die Koeffizienten der Terme, die nicht aufgelistet sind, werden auf 0 gesetzt. Alle aufgelisteten Lags mussen kleiner oder gleich nlag sein. Und es durfen keine Duplikate vorhanden sein. Wenn nicht angegeben, wird die Verzogerungsliste standardma?ig auf alle Verzogerungen 1 bis nlag gesetzt. Gibt die zu implementierende Schatzmethode an. Gultige Werte von M sind CLS (bedingte Schatzungen der kleinsten Quadrate), ULS (unbedingte Schatzungen der kleinsten Quadrate) und ML (Maximum Likelihood Estimates). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung angegeben wird. Die ULS - und ML-Methoden werden fur AR-AR-Modelle von AR nicht unterstutzt. Dass das AR-Verfahren auf die endogenen Variablen anstelle der strukturellen Residuen der Gleichungen angewendet werden soll. Eingeschrankte Vektorautoregression Sie konnen steuern, welche Parameter in den Prozess eingeschlossen werden, wobei die Parameter auf 0 begrenzt werden, die Sie nicht einschlie?en. Verwenden Sie zuerst AR mit der Option DEFER, um die Variablenliste zu deklarieren und die Dimension des Prozesses zu definieren. Verwenden Sie dann zusatzliche AR-Aufrufe, um Ausdrucke fur ausgewahlte Gleichungen mit ausgewahlten Variablen an ausgewahlten Verzogerungen zu generieren. Zum Beispiel sind die erzeugten Fehlergleichungen wie folgt: Dieses Modell besagt, da? die Fehler fur Y1 von den Fehlern sowohl von Y1 als auch von Y2 (aber nicht von Y3) bei beiden Verzogerungen 1 und 2 abhangen und da? die Fehler fur Y2 und Y3 davon abhangen Die vorherigen Fehler fur alle drei Variablen, aber nur bei Verzogerung 1. AR-Makro-Syntax fur eingeschrankten Vektor-AR Eine alternative Verwendung von AR ist es, Einschrankungen fur einen Vektor-AR-Prozess durch Aufruf von AR mehrmals aufzuerlegen, um verschiedene AR-Terme und Lags fur verschiedene festzulegen Gleichungen. Der erste Aufruf hat die allgemeine Form spezifiziert ein Prafix fur AR zu verwenden, bei der Konstruktion von Namen von Variablen benotigt, um den Vektor AR-Prozess zu definieren. Gibt die Reihenfolge des AR-Prozesses an. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Gibt an, dass AR den AR-Prozess nicht generieren soll, sondern auf weitere Informationen warten soll, die in spateren AR-Aufrufen fur denselben Namenwert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Spezifiziert die Liste der Gleichungen, auf die die Spezifikationen in diesem AR-Aufruf angewendet werden sollen. Nur Namen, die im Endolistenwert des ersten Aufrufs fur den Namenswert angegeben sind, konnen in der Liste der Gleichungen in eqlist erscheinen. Spezifiziert die Liste der Gleichungen, deren verzogerte strukturelle Residuen als Regressoren in die Gleichungen in eqlist aufgenommen werden sollen. Nur Namen im Endolisten des ersten Aufrufs fur den Namenswert konnen in varlist erscheinen. Wenn nicht angegeben, wird varlist standardma?ig Endolist. Gibt die Liste der Verzogerungen an, zu denen die AR-Terme hinzugefugt werden sollen. Die Koeffizienten der Terme, die nicht aufgelistet sind, werden auf 0 gesetzt. Alle aufgelisteten Verzogerungen mussen kleiner oder gleich dem Wert von nlag sein. Und es durfen keine Duplikate vorhanden sein. Wenn nicht angegeben, verwendet laglist standardma?ig alle Verzogerungen 1 bis nlag. Das MA-Makro Das SAS-Makro MA generiert Programmieranweisungen fur PROC MODEL fur gleitende Durchschnittsmodelle. Das MA-Makro ist Teil der SAS / ETS-Software, und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der gleitende Mittelwertfehlerproze? kann auf die strukturellen Gleichungsfehler angewendet werden. Die Syntax des MA-Makros entspricht dem AR-Makro, au?er es gibt kein TYPE-Argument. Wenn Sie die kombinierten MA - und AR-Makros verwenden, muss das Makro MA dem AR-Makro folgen. Die folgenden SAS / IML-Anweisungen erzeugen einen ARMA-Fehlerproze? (1, (1 3)) und speichern ihn im Datensatz MADAT2. Die folgenden PROC MODEL-Anweisungen werden verwendet, um die Parameter dieses Modells unter Verwendung der maximalen Wahrscheinlichkeitsfehlerstruktur zu schatzen: Die Schatzungen der durch diesen Durchlauf erzeugten Parameter sind in Abbildung 18.61 dargestellt. Abbildung 18.61 Schatzungen aus einem ARMA-Prozess (1, (1 3)) Es gibt zwei Falle der Syntax fur das MA-Makro. Wenn Beschrankungen fur einen Vektor-MA-Prozess nicht erforderlich sind, hat die Syntax des MA-Makros die allgemeine Form, die ein Prafix fur MA vorgibt, das beim Konstruieren von Namen von Variablen verwendet wird, die benotigt werden, um den MA-Prozess zu definieren, und ist der Standard-Endolist. Ist die Reihenfolge des MA-Prozesses. Spezifiziert die Gleichungen, auf die das MA-Verfahren angewendet werden soll. Wenn mehr als ein Name angegeben wird, wird die CLS-Schatzung fur den Vektorprozess verwendet. Gibt die Verzogerungen an, zu denen die MA-Bedingungen hinzugefugt werden sollen. Alle aufgelisteten Verzogerungen mussen kleiner oder gleich nlag sein. Und es durfen keine Duplikate vorhanden sein. Wenn nicht angegeben, wird die Verzogerungsliste standardma?ig auf alle Verzogerungen 1 bis nlag gesetzt. Gibt die zu implementierende Schatzmethode an. Gultige Werte von M sind CLS (bedingte Schatzungen der kleinsten Quadrate), ULS (unbedingte Schatzungen der kleinsten Quadrate) und ML (Maximum Likelihood Estimates). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung im Endolisten angegeben ist. MA-Makro-Syntax fur eingeschrankte Vektorbewegungsmittel Eine alternative Verwendung von MA ist es, Beschrankungen fur einen Vektor-MA-Proze? durch Aufruf von MA mehrere Male aufzuerlegen, um verschiedene MA-Terme und Verzogerungen fur verschiedene Gleichungen anzugeben. Der erste Aufruf hat die allgemeine Form spezifiziert ein Prafix fur MA, um beim Erstellen von Namen von Variablen fur die Definition der Vektor-MA-Prozess zu verwenden. Spezifiziert die Reihenfolge des MA-Prozesses. Spezifiziert die Liste der Gleichungen, auf die das MA-Verfahren angewendet werden soll. Spezifiziert, da? MA nicht den MA-Proze? erzeugen soll, sondern auf weitere Informationen, die in spateren MA-Aufrufen fur denselben Namenwert spezifiziert werden, wartet. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Spezifiziert die Liste der Gleichungen, auf die die Spezifikationen in diesem MA-Aufruf angewendet werden sollen. Spezifiziert die Liste der Gleichungen, deren verzogerte strukturelle Residuen als Regressoren in die Gleichungen in eqlist aufgenommen werden sollen. Spezifiziert die Liste der Verzogerungen, bei denen die MA-Begriffe addiert werden sollen. Moving durchschnittliche und exponentielle Glattungsmodelle Als ein erster Schritt, uber jenseits von Mittelwerten, zufalligen Fu?modellen und linearen Trendmodellen hinauszugehen, konnen nicht-saisonale Muster und Trends mit einer Bewegung extrapoliert werden - Gebrauchs - oder Glattungsmodell. Die grundlegende Annahme hinter Mittelwertbildung und Glattungsmodellen ist, dass die Zeitreihe lokal stationar mit einem sich langsam verandernden Mittelwert ist. Daher nehmen wir einen bewegten (lokalen) Durchschnitt, um den aktuellen Wert des Mittelwerts abzuschatzen und dann als die Prognose fur die nahe Zukunft zu verwenden. Dies kann als Kompromiss zwischen dem mittleren Modell und dem random-walk-ohne-Drift-Modell betrachtet werden. Die gleiche Strategie kann verwendet werden, um einen lokalen Trend abzuschatzen und zu extrapolieren. Ein gleitender Durchschnitt wird oft als "quotsmoothedquot" - Version der ursprunglichen Serie bezeichnet, da die kurzzeitige Mittelung die Wirkung hat, die Sto?e in der ursprunglichen Reihe zu glatten. Durch Anpassen des Glattungsgrades (die Breite des gleitenden Durchschnitts) konnen wir hoffen, eine Art von optimaler Balance zwischen der Leistung des Mittelwerts und der zufalligen Wandermodelle zu erreichen. Die einfachste Art der Mittelung Modell ist die. Einfache (gleichgewichtige) Moving Average: Die Prognose fur den Wert von Y zum Zeitpunkt t1, der zum Zeitpunkt t gemacht wird, entspricht dem einfachen Mittelwert der letzten m Beobachtungen: (Hier und anderswo werde ich das Symbol 8220Y-hat8221 stehen lassen Fur eine Prognose der Zeitreihe Y, die am fruhestmoglichen fruheren Zeitpunkt durch ein gegebenes Modell durchgefuhrt wird.) Dieser Mittelwert wird in der Periode t (m1) / 2 zentriert, was bedeutet, da? die Schatzung des lokalen Mittels dazu tendiert, hinter dem Wert zu liegen Wahren Wert des lokalen Mittels um etwa (m1) / 2 Perioden. Das durchschnittliche Alter der Daten im einfachen gleitenden Durchschnitt ist also (m1) / 2 relativ zu der Periode, fur die die Prognose berechnet wird: dies ist die Zeitspanne, in der die Prognosen dazu tendieren, hinter den Wendepunkten in der Daten. Wenn Sie z. B. die letzten 5 Werte mitteln, werden die Prognosen etwa 3 Perioden spat sein, wenn sie auf Wendepunkte reagieren. Beachten Sie, dass, wenn m1, die einfache gleitende Durchschnitt (SMA) - Modell ist gleichbedeutend mit der random walk-Modell (ohne Wachstum). Wenn m sehr gro? ist (vergleichbar der Lange des Schatzzeitraums), entspricht das SMA-Modell dem mittleren Modell. Wie bei jedem Parameter eines Prognosemodells ist es ublich, den Wert von k anzupassen, um den besten Quotienten der Daten zu erhalten, d. H. Die kleinsten Prognosefehler im Durchschnitt. Hier ist ein Beispiel einer Reihe, die zufallige Fluktuationen um ein sich langsam veranderndes Mittel zu zeigen scheint. Erstens konnen wir versuchen, es mit einem zufalligen Fu?modell, das entspricht einem einfachen gleitenden Durchschnitt von 1 Begriff entspricht: Das zufallige Fu?modell reagiert sehr schnell auf Anderungen in der Serie, aber dabei nimmt er viel von der quotnoisequot in der Daten (die zufalligen Fluktuationen) sowie das Quotsignalquot (das lokale Mittel). Wenn wir stattdessen einen einfachen gleitenden Durchschnitt von 5 Begriffen anwenden, erhalten wir einen glatteren Satz von Prognosen: Der 5-Term-einfache gleitende Durchschnitt liefert in diesem Fall deutlich kleinere Fehler als das zufallige Wegmodell. Das durchschnittliche Alter der Daten in dieser Prognose betragt 3 ((51) / 2), so dass es dazu neigt, hinter den Wendepunkten um etwa drei Perioden zu liegen. (Zum Beispiel scheint ein Abschwung in Periode 21 aufgetreten zu sein, aber die Prognosen drehen sich erst nach mehreren Perioden spater.) Beachten Sie, dass die Langzeitprognosen des SMA-Modells eine horizontale Gerade sind, genau wie beim zufalligen Weg Modell. Somit geht das SMA-Modell davon aus, dass es keinen Trend in den Daten gibt. Wahrend jedoch die Prognosen aus dem Zufallswegmodell einfach dem letzten beobachteten Wert entsprechen, sind die Prognosen des SMA-Modells gleich einem gewichteten Mittelwert der neueren Werte. Die von Statgraphics berechneten Konfidenzgrenzen fur die Langzeitprognosen des einfachen gleitenden Durchschnitts werden nicht breiter, wenn der Prognosehorizont zunimmt. Dies ist offensichtlich nicht richtig Leider gibt es keine zugrunde liegende statistische Theorie, die uns sagt, wie sich die Vertrauensintervalle fur dieses Modell erweitern sollten. Allerdings ist es nicht zu schwer, empirische Schatzungen der Konfidenzgrenzen fur die langerfristigen Prognosen zu berechnen. Beispielsweise konnen Sie eine Tabellenkalkulation einrichten, in der das SMA-Modell fur die Vorhersage von 2 Schritten im Voraus, 3 Schritten voraus usw. innerhalb der historischen Datenprobe verwendet wird. Sie konnten dann die Stichproben-Standardabweichungen der Fehler bei jedem Prognosehorizont berechnen und dann Konfidenzintervalle fur langerfristige Prognosen durch Addieren und Subtrahieren von Vielfachen der geeigneten Standardabweichung konstruieren. Wenn wir einen 9-term einfachen gleitenden Durchschnitt ausprobieren, erhalten wir sogar noch bessere Prognosen und mehr eine nacheilende Wirkung: Das Durchschnittsalter betragt jetzt 5 Perioden ((91) / 2). Wenn wir einen 19-term gleitenden Durchschnitt nehmen, steigt das Durchschnittsalter auf 10 an: Beachten Sie, dass die Prognosen tatsachlich hinter den Wendepunkten um etwa 10 Perioden zuruckbleiben. Welches Ma? an Glattung ist am besten fur diese Serie Hier ist eine Tabelle, die ihre Fehlerstatistiken vergleicht, darunter auch einen 3-Term-Durchschnitt: Modell C, der 5-term gleitende Durchschnitt, ergibt den niedrigsten Wert von RMSE mit einer kleinen Marge uber die 3 - term und 9-Term-Mittelwerte, und ihre anderen Statistiken sind fast identisch. So konnen wir bei Modellen mit sehr ahnlichen Fehlerstatistiken wahlen, ob wir ein wenig mehr Reaktionsfahigkeit oder ein wenig mehr Glatte in den Prognosen bevorzugen wurden. (Ruckkehr nach oben.) Browns Einfache Exponentialglattung (exponentiell gewichteter gleitender Durchschnitt) Das oben beschriebene einfache gleitende Durchschnittsmodell hat die unerwunschte Eigenschaft, da? es die letzten k-Beobachtungen gleich und vollstandig ignoriert. Intuitiv sollten vergangene Daten in einer allmahlicheren Weise diskontiert werden - zum Beispiel sollte die jungste Beobachtung ein wenig mehr Gewicht als die zweitletzte erhalten, und die 2. jungsten sollten ein wenig mehr Gewicht als die 3. jungsten erhalten, und bald. Das einfache exponentielle Glattungsmodell (SES) erfullt dies. 945 bezeichnen eine quotsmoothing constantquot (eine Zahl zwischen 0 und 1). Eine Moglichkeit, das Modell zu schreiben, besteht darin, eine Reihe L zu definieren, die den gegenwartigen Pegel (d. H. Den lokalen Mittelwert) der Serie, wie er aus Daten bis zu der Zeit geschatzt wird, darstellt. Der Wert von L zur Zeit t wird rekursiv von seinem eigenen vorherigen Wert wie folgt berechnet: Somit ist der aktuelle geglattete Wert eine Interpolation zwischen dem vorher geglatteten Wert und der aktuellen Beobachtung, wobei 945 die Nahe des interpolierten Wertes auf die neueste steuert Uberwachung. Die Prognose fur die nachste Periode ist einfach der aktuelle geglattete Wert: Aquivalent konnen wir die nachste Prognose direkt in Form fruherer Prognosen und fruherer Beobachtungen in einer der folgenden gleichwertigen Versionen ausdrucken. In der ersten Version ist die Prognose eine Interpolation zwischen vorheriger Prognose und vorheriger Beobachtung: In der zweiten Version wird die nachste Prognose durch Anpassung der bisherigen Prognose in Richtung des bisherigen Fehlers um einen Bruchteil 945 erhalten Zeit t. In der dritten Version ist die Prognose ein exponentiell gewichteter (dh diskontierter) gleitender Durchschnitt mit Abzinsungsfaktor 1-945: Die Interpolationsversion der Prognoseformel ist am einfachsten zu verwenden, wenn Sie das Modell in einer Tabellenkalkulation implementieren Einzelne Zelle und enthalt Zellverweise, die auf die vorhergehende Prognose, die vorherige Beobachtung und die Zelle mit dem Wert von 945 zeigen. Beachten Sie, dass, wenn 945 1, das SES-Modell entspricht einem zufalligen Weg-Modell (ohne Wachstum). Wenn 945 0 ist, entspricht das SES-Modell dem mittleren Modell, wobei angenommen wird, dass der erste geglattete Wert gleich dem Mittelwert gesetzt ist. (Zuruck zum Seitenanfang) Das Durchschnittsalter der Daten in der Simple-Exponential-Glattungsprognose betragt 1/945 relativ zu dem Zeitraum, fur den die Prognose berechnet wird. (Dies sollte nicht offensichtlich sein, kann aber leicht durch die Auswertung einer unendlichen Reihe gezeigt werden.) Die einfache gleitende Durchschnittsprognose neigt daher zu Verzogerungen hinter den Wendepunkten um etwa 1/945 Perioden. Wenn beispielsweise 945 0,5 die Verzogerung 2 Perioden betragt, wenn 945 0,2 die Verzogerung 5 Perioden betragt, wenn 945 0,1 die Verzogerung 10 Perioden und so weiter ist. Fur ein gegebenes Durchschnittsalter (d. H. Eine Verzogerung) ist die einfache exponentielle Glattungsprognose (SES) der simplen gleitenden Durchschnittsprognose (SMA) etwas uberlegen, weil sie relativ viel mehr Gewicht auf die jungste Beobachtung - i. e stellt. Es ist etwas mehr quresponsivequot zu Anderungen, die sich in der jungsten Vergangenheit. Zum Beispiel haben ein SMA - Modell mit 9 Terminen und ein SES - Modell mit 945 0,2 beide ein durchschnittliches Alter von 5 Jahren fur die Daten in ihren Prognosen, aber das SES - Modell legt mehr Gewicht auf die letzten 3 Werte als das SMA - Modell und am Gleiches gilt fur die Werte von mehr als 9 Perioden, wie in dieser Tabelle gezeigt: 822forget8221. Ein weiterer wichtiger Vorteil des SES-Modells gegenuber dem SMA-Modell ist, dass das SES-Modell einen Glattungsparameter verwendet, der kontinuierlich variabel ist und somit leicht optimiert werden kann Indem ein Quotsolverquot-Algorithmus verwendet wird, um den mittleren quadratischen Fehler zu minimieren. Der optimale Wert von 945 im SES-Modell fur diese Serie ergibt sich wie folgt: Das Durchschnittsalter der Daten in dieser Prognose betragt 1 / 0,2961 3,4 Perioden, was ahnlich wie bei einem 6-Term-Simple Moving ist durchschnittlich. Die Langzeitprognosen aus dem SES-Modell sind eine horizontale Gerade. Wie im SMA-Modell und dem Random-Walk-Modell ohne Wachstum. Es ist jedoch anzumerken, dass die von Statgraphics berechneten Konfidenzintervalle nun in einer vernunftigen Weise abweichen und dass sie wesentlich schmaler sind als die Konfidenzintervalle fur das Zufallswegmodell. Das SES-Modell geht davon aus, dass die Serie etwas vorhersehbarer ist als das Zufallswandermodell. Ein SES-Modell ist eigentlich ein Spezialfall eines ARIMA-Modells. So dass die statistische Theorie der ARIMA-Modelle eine solide Grundlage fur die Berechnung der Konfidenzintervalle fur das SES-Modell bildet. Insbesondere ist ein SES-Modell ein ARIMA-Modell mit einer nicht sonderbaren Differenz, einem MA (1) - Term und kein konstanter Term. Ansonsten als quotARIMA (0,1,1) - Modell ohne Konstantquot bekannt. Der MA (1) - Koeffizient im ARIMA-Modell entspricht der Gro?e 1 - 945 im SES-Modell. Wenn Sie zum Beispiel ein ARIMA-Modell (0,1,1) ohne Konstante an die hier analysierte Serie anpassen, ergibt sich der geschatzte MA (1) - Koeffizient auf 0,7029, was fast genau ein Minus von 0,2961 ist. Es ist moglich, die Annahme eines von Null verschiedenen konstanten linearen Trends zu einem SES-Modell hinzuzufugen. Dazu wird ein ARIMA-Modell mit einer nicht sonderbaren Differenz und einem MA (1) - Term mit konstantem, d. H. Einem ARIMA-Modell (0,1,1) mit konstantem Wert angegeben. Die langfristigen Prognosen haben dann einen Trend, der dem durchschnittlichen Trend uber den gesamten Schatzungszeitraum entspricht. Sie konnen dies nicht in Verbindung mit saisonalen Anpassungen tun, da die saisonalen Anpassungsoptionen deaktiviert sind, wenn der Modelltyp auf ARIMA gesetzt ist. Sie konnen jedoch einen konstanten langfristigen exponentiellen Trend zu einem einfachen exponentiellen Glattungsmodell (mit oder ohne saisonale Anpassung) hinzufugen, indem Sie die Inflationsanpassungsoption im Prognoseverfahren verwenden. Die prozentuale Zinssatzquote (prozentuale Wachstumsrate) pro Periode kann als der Steigungskoeffizient in einem linearen Trendmodell geschatzt werden, das an die Daten in Verbindung mit einer naturlichen Logarithmuswandlung angepasst ist, oder es kann auf anderen unabhangigen Informationen bezuglich der langfristigen Wachstumsperspektiven beruhen . (Ruckkehr nach oben.) Browns Linear (dh doppelt) Exponentielle Glattung Die SMA-Modelle und SES-Modelle gehen davon aus, dass es in den Daten keine Tendenzen gibt (die in der Regel in Ordnung sind oder zumindest nicht zu schlecht fur 1- Wenn die Daten relativ verrauscht sind), und sie konnen modifiziert werden, um einen konstanten linearen Trend, wie oben gezeigt, zu integrieren. Was ist mit kurzfristigen Trends Wenn eine Serie eine unterschiedliche Wachstumsrate oder ein zyklisches Muster zeigt, das sich deutlich gegen das Rauschen auszeichnet, und wenn es notwendig ist, mehr als eine Periode vorher zu prognostizieren, konnte die Schatzung eines lokalen Trends auch sein Ein Problem. Das einfache exponentielle Glattungsmodell kann verallgemeinert werden, um ein lineares exponentielles Glattungsmodell (LES) zu erhalten, das lokale Schatzungen sowohl des Niveaus als auch des Trends berechnet. Das einfachste zeitvariable Trendmodell ist Browns lineares exponentielles Glattungsmodell, das zwei verschiedene geglattete Serien verwendet, die zu verschiedenen Zeitpunkten zentriert sind. Die Prognoseformel basiert auf einer Extrapolation einer Linie durch die beiden Zentren. (Eine weiterentwickelte Version dieses Modells, Holt8217s, wird unten diskutiert.) Die algebraische Form des Brown8217s linearen exponentiellen Glattungsmodells, wie die des einfachen exponentiellen Glattungsmodells, kann in einer Anzahl von unterschiedlichen, aber aquivalenten Formen ausgedruckt werden. Die quadratische quadratische Form dieses Modells wird gewohnlich wie folgt ausgedruckt: Sei S die einfach geglattete Reihe, die durch Anwendung einfacher exponentieller Glattung auf Reihe Y erhalten wird. Das hei?t, der Wert von S in der Periode t ist gegeben durch: (Erinnern wir uns, Exponentielle Glattung, dies ware die Prognose fur Y in der Periode t1.) Dann sei Squot die doppelt geglattete Reihe, die man erhalt, indem man eine einfache exponentielle Glattung (unter Verwendung desselben 945) auf die Reihe S anwendet: Schlie?lich die Prognose fur Ytk. Fur jedes kgt1 ist gegeben durch: Dies ergibt e & sub1; & sub0; (d. h. Cheat ein Bit, und die erste Prognose ist gleich der tatsachlichen ersten Beobachtung) und e & sub2; Y & sub2; 8211 Y & sub1; Nach denen die Prognosen unter Verwendung der obigen Gleichung erzeugt werden. Dies ergibt die gleichen Anpassungswerte wie die Formel auf der Basis von S und S, wenn diese mit S 1 S 1 Y 1 gestartet wurden. Diese Version des Modells wird auf der nachsten Seite verwendet, die eine Kombination von exponentieller Glattung mit saisonaler Anpassung veranschaulicht. Holt8217s Lineares Exponentialglattung Brown8217s LES-Modell berechnet lokale Schatzungen von Pegel und Trend durch Glatten der letzten Daten, aber die Tatsache, dass dies mit einem einzigen Glattungsparameter erfolgt, legt eine Einschrankung fur die Datenmuster fest, die er anpassen kann: den Pegel und den Trend Durfen nicht zu unabhangigen Preisen variieren. Holt8217s LES-Modell adressiert dieses Problem durch zwei Glattungskonstanten, eine fur die Ebene und eine fur den Trend. Zu jedem Zeitpunkt t, wie in Brown8217s-Modell, gibt es eine Schatzung L t der lokalen Ebene und eine Schatzung T t der lokalen Trend. Hier werden sie rekursiv aus dem zum Zeitpunkt t beobachteten Wert von Y und den vorherigen Schatzungen von Pegel und Trend durch zwei Gleichungen berechnet, die exponentielle Glattung separat anwenden. Wenn der geschatzte Pegel und der Trend zum Zeitpunkt t-1 L t82091 und T t-1 sind. Dann ist die Prognose fur Y tshy, die zum Zeitpunkt t-1 gemacht worden ware, gleich L t-1 T t-1. Wenn der tatsachliche Wert beobachtet wird, wird die aktualisierte Schatzung des Pegels rekursiv berechnet, indem zwischen Y tshy und seiner Prognose L t-1 T t-1 unter Verwendung von Gewichten von 945 und 1- 945 interpoliert wird. Die Anderung des geschatzten Pegels, Namlich L t 8209 L t82091. Kann als eine verrauschte Messung des Trends zum Zeitpunkt t interpretiert werden. Die aktualisierte Schatzung des Trends wird dann rekursiv berechnet, indem zwischen L t 8209 L t82091 und der vorherigen Schatzung des Trends T t-1 interpoliert wird. Unter Verwendung der Gewichte von 946 und 1-946: Die Interpretation der Trendglattungskonstante 946 ist analog zu der Pegelglattungskonstante 945. Modelle mit kleinen Werten von 946 nehmen an, dass sich der Trend mit der Zeit nur sehr langsam andert, wahrend Modelle mit Gro?ere 946 nehmen an, dass sie sich schneller andert. Ein Modell mit einem gro?en 946 glaubt, dass die ferne Zukunft sehr unsicher ist, da Fehler in der Trendschatzung bei der Prognose von mehr als einer Periode ganz wichtig werden. (Ruckkehr nach oben) Die Glattungskonstanten 945 und 946 konnen auf ubliche Weise geschatzt werden, indem der mittlere quadratische Fehler der 1-Schritt-Voraus-Prognosen minimiert wird. Wenn dies in Statgraphics getan wird, erweisen sich die Schatzungen als 945 0.3048 und 946 0,008. Der sehr geringe Wert von 946 bedeutet, dass das Modell eine sehr geringe Veranderung im Trend von einer Periode zur nachsten annimmt, so dass dieses Modell im Grunde versucht, einen langfristigen Trend abzuschatzen. In Analogie zum Durchschnittsalter der Daten, die fur die Schatzung der lokalen Ebene der Serie verwendet werden, ist das Durchschnittsalter der Daten, die bei der Schatzung des lokalen Trends verwendet werden, proportional zu 1/946, wenn auch nicht exakt gleich es. In diesem Falle ergibt sich 1 / 0,006 125. Dies ist eine sehr genaue Zahl, da die Genauigkeit der Schatzung von 946 nicht wirklich 3 Dezimalstellen betragt, sondern dieselbe von der gleichen Gro?enordnung wie die Stichprobengro?e von 100 ist , So dass dieses Modell ist im Durchschnitt uber eine ganze Menge Geschichte bei der Schatzung der Trend. Das Prognose-Diagramm unten zeigt, dass das LES-Modell einen etwas gro?eren lokalen Trend am Ende der Serie schatzt als der im SEStrend-Modell geschatzte konstante Trend. Au?erdem ist der Schatzwert von 945 fast identisch mit dem, der durch Anpassen des SES-Modells mit oder ohne Trend erhalten wird, so dass dies fast das gleiche Modell ist. Nun, sehen diese aussehen wie vernunftige Prognosen fur ein Modell, das soll Schatzung einer lokalen Tendenz Wenn Sie 8220eyeball8221 dieser Handlung, sieht es so aus, als ob der lokale Trend nach unten am Ende der Serie gedreht hat Was ist passiert Die Parameter dieses Modells Wurden durch Minimierung des quadratischen Fehlers von 1-Schritt-Voraus-Prognosen, nicht langerfristigen Prognosen, abgeschatzt, wobei der Trend keinen gro?en Unterschied macht. Wenn alles, was Sie suchen, 1-Schritt-vor-Fehler sind, sehen Sie nicht das gro?ere Bild der Trends uber (sagen) 10 oder 20 Perioden. Um dieses Modell im Einklang mit unserer Augapfel-Extrapolation der Daten zu erhalten, konnen wir die Trendglattungskonstante manuell anpassen, so dass sie eine kurzere Basislinie fur die Trendschatzung verwendet. Wenn wir beispielsweise 946 0,1 setzen, betragt das durchschnittliche Alter der Daten, die bei der Schatzung des lokalen Trends verwendet werden, 10 Perioden, was bedeutet, dass wir den Trend uber die letzten 20 Perioden oder so mitteln. Here8217s, was das Prognose-Plot aussieht, wenn wir 946 0,1 setzen, wahrend 945 0,3 halten. Dies scheint intuitiv vernunftig fur diese Serie, obwohl es wahrscheinlich gefahrlich, diesen Trend mehr als 10 Perioden in der Zukunft zu extrapolieren. Was ist mit den Fehlerstatistiken Hier ist ein Modellvergleich fur die beiden oben gezeigten Modelle sowie drei SES-Modelle. Der optimale Wert von 945 fur das SES-Modell betragt etwa 0,3, aber ahnliche Ergebnisse (mit etwas mehr oder weniger Reaktionsfahigkeit) werden mit 0,5 und 0,2 erhalten. (A) Holts linearer Exp. Glattung mit alpha 0.3048 und beta 0,008 (B) Holts linear exp. Glattung mit alpha 0,3 (E) Einfache exponentielle Glattung mit alpha 0,3 (E) Einfache exponentielle Glattung mit alpha 0,2 Ihre Stats sind nahezu identisch, so dass wir wirklich die Wahl auf der Basis machen konnen Von 1-Schritt-Vorhersagefehlern innerhalb der Datenprobe. Wir mussen auf andere Uberlegungen zuruckgreifen. Wenn wir glauben, dass es sinnvoll ist, die aktuelle Trendschatzung auf das, was in den letzten 20 Perioden passiert ist, zugrunde zu legen, konnen wir fur das LES-Modell mit 945 0,3 und 946 0,1 einen Fall machen. Wenn wir agnostisch sein wollen, ob es einen lokalen Trend gibt, dann konnte eines der SES-Modelle leichter zu erklaren sein, und wurde auch fur die nachsten 5 oder 10 Perioden mehr Mittelprognosen geben. (Ruckkehr nach oben.) Welche Art von Trend-Extrapolation am besten ist: horizontal oder linear Empirische Evidenz deutet darauf hin, dass es, wenn die Daten bereits fur die Inflation angepasst wurden (wenn notig), unpratent ist, kurzfristige lineare Werte zu extrapolieren Trends sehr weit in die Zukunft. Die heutigen Trends konnen sich in Zukunft aufgrund unterschiedlicher Ursachen wie Produktveralterung, verstarkte Konkurrenz und konjunkturelle Abschwunge oder Aufschwunge in einer Branche abschwachen. Aus diesem Grund fuhrt eine einfache exponentielle Glattung oft zu einer besseren Out-of-Probe, als ansonsten erwartet werden konnte, trotz ihrer quotnaivequot horizontalen Trend-Extrapolation. Damped Trendmodifikationen des linearen exponentiellen Glattungsmodells werden in der Praxis haufig auch eingesetzt, um in seinen Trendprojektionen eine Note des Konservatismus einzufuhren. Das Dampfungs-Trend-LES-Modell kann als Spezialfall eines ARIMA-Modells, insbesondere eines ARIMA-Modells (1,1,2), implementiert werden. Es ist moglich, Konfidenzintervalle um langfristige Prognosen zu berechnen, die durch exponentielle Glattungsmodelle erzeugt werden, indem man sie als Spezialfalle von ARIMA-Modellen betrachtet. (Achtung: Nicht alle Software berechnet die Konfidenzintervalle fur diese Modelle korrekt.) Die Breite der Konfidenzintervalle hangt ab von (i) dem RMS-Fehler des Modells, (ii) der Art der Glattung (einfach oder linear) (iii) dem Wert (S) der Glattungskonstante (n) und (iv) die Anzahl der Perioden vor der Prognose. Im Allgemeinen breiten sich die Intervalle schneller aus, da 945 im SES-Modell gro?er wird und sich viel schneller ausbreiten, wenn lineare statt einfache Glattung verwendet wird. Dieses Thema wird im Abschnitt "ARIMA-Modelle" weiter erlautert. (Zuruck zum Seitenanfang.)