Moving Average Polynomial Muss Invertierbar Sein
4.3 Nichtstationäre Modelle für Zeitreihen Die bisher präsentierten Modelle basieren auf der Stationaritätsannahme, dh der Mittelwert und die Varianz des zugrundeliegenden Prozesses sind konstant und die Autokovarianzen hängen nur von der Zeitverzögerung ab. Aber viele wirtschaftliche und geschäftliche Zeitreihen sind nicht stationär. Nichtstationäre Zeitreihen können auf viele verschiedene Arten auftreten. Insbesondere zeigen ökonomische Zeitreihen in der Regel zeitveränderliche Niveaus, (siehe Grafik (b) in Abbildung 4.1) und / oder Abweichungen (siehe Grafik (c) in Abbildung 4.1). 4.3.1 Nichtstationär in der Varianz Wenn eine Zeitreihe nicht stationär ist, brauchen wir eine geeignete Varianzstabilisierungstransformation. Es ist sehr häufig, dass sich die Varianz eines nichtstationären Prozesses ändert, wenn sich sein Pegel ändert. So nehmen wir an, dass die Varianz des Prozesses ist: für einige positive Konstante und einige bekannte Funktion. Das Ziel besteht darin, eine Funktion zu finden, so dass die transformierte Reihe eine konstante Varianz hat. Expanding in einer ersten Ordnung Taylor Serie um: wo ist die erste Ableitung der ausgewertet bei. Die Varianz von kann angenähert werden als: So muß die Transformation so gewählt werden, daß: Wenn z. B. die Standardabweichung einer Reihe proportional zu ihrem Pegel ist, dann muß die Transformation genügen. Dies impliziert, dass. Daher ergibt eine logarithmische Transformation der Reihe eine konstante Varianz. Wenn die Varianz einer Reihe proportional zu ihrem Niveau ist, so daß dann eine Quadratwurzeltransformation der Reihe eine konstante Varianz ergibt. Um die Varianz zu stabilisieren, können wir allgemein die von Box und Cox (1964) eingeführte Leistungstransformation verwenden. Wo der Transformationsparameter heißt. Es ist anzumerken, dass häufig die Box-Cox-Transformation nicht nur die Varianz stabilisiert, sondern auch die Annäherung an die Normalität des Prozesses verbessert. 4.3.2 Nichtstationarität im Mittelpunkt Einer der dominierenden Merkmale vieler Wirtschafts - und Wirtschaftszeitreihen ist der Trend. Trend ist langsame, langjährige Evolution in den Variablen, die wir modellieren wollen. In den Bereichen Wirtschaft, Wirtschaft und Finanzen wird der Trend in der Regel durch langsam wachsende Präferenzen, Technologien und Demografie geprägt. Dieses Trendverhalten kann nach oben oder unten, steil oder nicht, und exponentiell oder annähernd linear sein. Bei einem solchen Trendmuster ist eine Zeitreihe nichtstationär, sie zeigt keine Tendenz der mittleren Reversion. Die Nichtstationarität im Mittel, dh eine nicht konstante Ebene, kann auf unterschiedliche Weise modelliert werden. Die häufigsten Alternativen sind deterministische Trends und stochastische Trends. Wir betrachten die Erweiterung des Wolds-Zerlegungstheorems für nichtstationäre Reihen von Cramer (1961). Wo ein Null-Mittelwert stationärer Prozess ist. Der sich ändernde Mittelwert eines nichtstationären Prozesses oder Tendenzes kann durch eine deterministische Funktion der Zeit dargestellt werden. Diese Modelle für den Trend deuten darauf hin, dass sich der Serientrend in einer perfekt vorhersagbaren Weise entwickelt, daher werden sie als deterministische Trendmodelle bezeichnet. Wenn zum Beispiel die mittlere Funktion einem linearen Trend folgt, kann man das deterministische lineare Trendmodell verwenden: Der Parameter ist der Intercept, es ist der Wert des Trends zur Zeit und ist die Steigung ist er positiv, wenn der Trend zunimmt und negativ, wenn Der Trend sinkt. Je größer der Absolutwert der steileren Trends slope. Manchmal tritt der Trend nichtlinear oder gekrümmt auf, zum Beispiel wenn eine Variable mit steigender oder abnehmender Rate ansteigt. Tatsächlich ist es nicht erforderlich, dass Trends linear sind, nur dass sie glatt sind. Quadratische Trendmodelle können möglicherweise Nichtlinearitäten erfassen, wie sie in einigen Serien beobachtet werden. Solche Trends sind quadratisch im Gegensatz zu linearen Funktionen der Zeit, Polynom-Trends der höheren Ordnung werden manchmal betrachtet, aber es ist wichtig, niederwertige Polynome zu verwenden, um die Glätte aufrechtzuerhalten. Andere Arten von nichtlinearen Trends, die manchmal geeignet sind, sind die exponentiellen Trends. Wenn der Trend durch konstantes Wachstum mit der Geschwindigkeit charakterisiert wird, können wir schreiben: Der Trend ist als nichtlineare (exponentielle) Funktion der Zeit in den Ebenen modelliert worden, aber in den Logarithmen haben wir also eine lineare Funktion der Zeit. Diese Situation, in der ein Trend nichtlinear in Ebenen, sondern linear in Logarithmen bezeichnet wird, wird als exponentieller Trend oder loglinearer Trend bezeichnet und ist sehr häufig in der Ökonomie, weil ökonomische Variablen oft grob konstante Wachstumsraten aufweisen. Die Nichtstationarität im Mittelwert kann in der Klasse der Modelle (4.7) behandelt werden. Ein Modell ist nichtstationär, wenn sein Polynom die Stationaritätsbedingung nicht erfüllt, dh wenn einige seiner Wurzeln nicht außerhalb des Einheitskreises liegen. Wenn das Polynom mindestens eine Wurzel innerhalb des Einheitskreises enthält, ist das Verhalten einer Realisierung des Prozesses explosiv. Dies ist jedoch nicht die Art der Evolution, die in Wirtschafts - und Wirtschaftszeitreihen beobachtet werden kann. Obwohl viele von ihnen nichtstationär sind, verhalten sich diese Reihen sehr ähnlich, mit Ausnahme des Unterschieds in den lokalen Durchschnittswerten. Wenn wir die Evolution der Serie unabhängig von ihrer Ebene im Rahmen von Modellen modellieren wollen, muss das Polynom genügen: Damit das Polynom faktorisiert werden kann, wie: Anwendung dieser Zerlegung auf das allgemeine Modell: Wo ist ein Polynom der Ordnung und. Wenn ein stationäres Polynom ist, sagen wir, dass eine Einheit autoregressive Wurzel hat. Wenn das nichtstationäre Polynom beispielsweise mehr als eine Einheitswurzel aufweist, kann es zerlegt werden als: Wenn wir diese Zerlegung wieder auf das allgemeine Modell anwenden, erhalten wir: für etwas, wo ein stationäres Polynom der Ordnung ist. Kurz gesagt, wenn wir Prozesse zur Modellierung nichtstationärer Zeitreihen verwenden, führt die Nichtstationarität zum Vorhandensein von Einheitswurzeln im autoregressiven Polynom. Mit anderen Worten, die Reihe ist nichtstationär, sondern ihre th differenzierte Reihe, für eine ganze Zahl folgt einem stationären und invertierbaren Modell. Ein Prozess mit diesen Merkmalen wird als integrierter Prozess der Ordnung d bezeichnet und wird mit bezeichnet. Es ist anzumerken, dass die Reihenfolge der Integration eines Prozesses die Anzahl der Unterschiede ist, die benötigt werden, um die Stationarität zu erreichen, d. h. Die Anzahl der im Prozess vorhandenen Einheitswurzeln. In der Praxis und Prozessen sind bei weitem die wichtigsten Fälle für ökonomische und wirtschaftliche Zeitreihen, die sich viel seltener ergeben. Box und Jenkins (1976) beziehen sich auf ein solches nichtstationäres Verhalten als homogene Nichtstationarität, was zeigt, dass das lokale Verhalten dieser Art von Reihen unabhängig von ihrem Niveau (für Prozesse) und ihrem Niveau und ihrer Steigung (für Prozesse) ist. Im allgemeinen, wenn die Reihe in Ordnung integriert ist, kann sie durch folgendes Modell dargestellt werden: wobei der stationäre Operator und der invertierbare Operator keine gemeinsamen Faktoren teilen. Das resultierende homogene nichtstationare Modell (4.19) wurde als das autoregressive integrierte Bewegungsdurchschnitts-Modell der Ordnung bezeichnet und wird als Modell bezeichnet. Wenn, wird das auch als Integrated Moving Average Modell der Ordnung und es wird als Modell bezeichnet. Wenn das resultierende Modell das autoregressive integrierte Modell genannt wird. Um mehr Einblick in die Art des nichtstationären Verhaltens zu erhalten, das durch integrierte Prozesse impliziert wird, wollen wir mit einigen Details zwei der einfachsten Modelle studieren: zufälliger Weg und zufälliger Weg mit Driftmodellen. Das Zufallswegmodell ist einfach ein mit Koeffizient: und die t-Statistik für die Einheitswurzel-Nullhypothese folgt der gleichen Verteilung wie bzw.. Die häufigsten Werte für null und 1 sind in Wirtschafts - und Wirtschaftszeitreihen. Deshalb haben wir uns bisher darauf konzentriert, die Nullhypothese einer Einheitswurzel gegen die Alternative der Stationarität (möglicherweise in Abweichungen von einem Mittelwert oder einem linearen Trend) zu testen. Aber es ist möglich, dass die Serie mehr als eine Einheit Wurzel. Wenn wir im allgemeinen die Hypothese testen wollen, daß eine Reihe gegen die Alternative ist, die es ist, so schlagen Dickey und Pantula (1987) ein sequentielles Verfahren vor. Zuerst sollten wir die Nullhypothese der Einheitswurzeln gegen die Alternative der Einheitswurzeln testen. Wenn wir dies ablehnen, dann sollte die Nullhypothese der Einheitswurzeln gegen die Alternative der Einheitswurzeln getestet werden. Zuletzt wird die Nullstelle einer Einheitswurzel gegen die Alternative der Stationarität getestet. Der XEGutsm07.xpl-Code berechnet die ADF-Statistik, um die Einheitswurzelhypothese für eine simulierte Zufallsgangserie der Größe 1000 zu testen. Der Wert der is -0,93178, der die Nullhypothese auf der 5-Signifikanzstufe ablehnt. Dieser Ausgang liefert auch die kritischen Werte 1, 5, 10, 90, 95 und 99. Es ist zu erkennen, dass die Unterschiede zwischen den Verteilungen der konventionellen t-Statistik wichtig sind. Beispielsweise beträgt der kritische Wert bei einem Signifikanzniveau von 0,05 den Wert -2,86, während der Wert der normalen Annäherung an die Schüler bei großen Stichproben -1,96 beträgt. Wenn wir die Stationarität einer Zeitreihe oder eine lineare Kombination von Zeitreihen überprüfen wollen, wäre es interessant, die Nullhypothese der Stationarität direkt zu testen. In Anbetracht dessen, dass die klassische Hypothesen-Testmethode dafür sorgt, dass die Nullhypothese akzeptiert wird, es sei denn, es gibt starke Hinweise darauf, ist es nicht verwunderlich, dass eine gute Anzahl von empirischen Arbeiten zeigt, dass Standard-Einheitswurzeltests die Nullhypothese für viele nicht ablehnen Wirtschaftliche Zeitreihen. Wenn es darum geht zu entscheiden, ob die ökonomischen Daten stationär oder integriert sind, wäre es sinnvoll, Tests der Nullhypothese der Stationarität sowie Tests der Einheitswurzel-Nullhypothese durchzuführen. Kwiatkowski, Phillips, Schmidt und Shin (1992) (KPSS) haben einen Test für die Nullhypothese der Stationarität gegen die Alternative der Einheitswurzel entwickelt. Wir betrachten den folgenden Datenerzeugungsprozess: Das SSM-Verfahren (experimentell) TREND-Name (Typ) ltoptions Die TREND-Anweisung definiert einen Trendbegriff im Modell. Locker gesprochen handelt es sich bei einem Trend um eine spezielle Art von Komponenten, die den zeitlichen Verlauf der Daten erfassen. Mit den Optionen in der TREND-Anweisung können Sie eine Vielzahl von häufig verwendeten Trendmustern angeben. Jede TREND-Spezifikation steht für ein spezielles Paar von STATE - und COMPONENT-Anweisungen. Sie können mehr als eine TREND-Anweisung angeben. Jede separate Trendspezifikation definiert eine Komponente, die als unabhängig von allen anderen Komponentenspezifikationen des Modells angenommen wird. Sie können sich auf den Zustand beziehen, der mit einer TREND-Spezifikation verknüpft ist, indem Sie den String-Status am Ende seines Namens anhängen. Zum Beispiel ist namestate der Zustand, der mit einem Trend namens name verbunden ist. Sie können namestate in einer COMPONENT-Anweisung verwenden, um eine lineare Kombination ihrer Elemente zu definieren. Die Schätzung dieser Linearkombination kann dann ausgedruckt oder an einen Datensatz ausgegeben werden. Die nominale Dimension von namestate wird als 1 oder die Anzahl der Variablen in der Liste, die in der CROSS-Option in der TREND-Anweisung angegeben wird, die zum Definieren des Namens verwendet wird, genommen. Einige dieser Trendspezifikationen sind auf alle Datentypen anwendbar, die typisch sind, sie können sowohl für reguläre Datentypen als auch für unregelmäßige Datentypen verwendet werden, während die anderen die regelmäßige oder reguläre Datenreplikation erfordern. Natürlich ist die Trendspezifikation nur ein Teil der Gesamtmodellspezifikation. Daher können die anderen Teile des Modells zusätzliche Einschränkungen für den Datentyp enthalten. Tabelle 27.3 listet die verfügbaren Trendmodelle und deren Datenanforderungen auf. Die Spalte Typ zeigt die zulässigen Schlüsselwörter an, die die jeweilige Trendart angeben. Zur Kürze gruppiert die Spalte Datentyp in Tabelle 27.3 die regulären und regulären Replikationsdatentypen in eine Kategorie: regulär. Weitere Informationen zu diesen Trendmodellen finden Sie im Abschnitt Vordefinierte Trendmodelle. Tabelle 27.3: Zusammenfassung der Trendarten ARIMA-Trendspezifikation AR - und MA-Koeffizienten, Damped local linear A-Typ des Zerfallsmusters Ornstein-Uhlenbeck-Zerfallsmuster A-Typ des Wachstumsmusters Ornstein-Uhlenbeck-Wachstumsmuster Polynomspline der Ordnung Bis 3 Die Keyword-Spezifikation verschiedener Trendtypen, mit Ausnahme des ARIMA-Trends, ist ganz einfach. Beispielsweise gibt die folgende Anweisung polySpline als Trend des Typs Polynomspline der Ordnung 2 an: Ähnlich definiert die folgende Anweisung dampedTrend als gedämpften lokalen linearen Trend: Der Varianzparameter, der die Steilheitsgleichung dieses Trendtyps regelt, wird durch eine Variable gegeben X. Die an anderer Stelle im Programm definiert werden müssen. Die anderen Parameter, die dampedTrend definieren, werden nicht angegeben. Die ARIMA Trendspezifikation erlaubt die Angabe von Trends, die einem ARIMA (p, d, q) (P, D, Q) Modell folgen. Die Spezifikation von ARIMA-Modellen erfordert eine Notation, die zuerst erläutert wird. Für einige Koeffizienten und eine weiße Rauschsequenz. Ein ARIMA-Prozess ist Mittelwert Null, stationär und invertierbar, wenn. Und die definierenden Polynome und haben alle ihre Wurzeln außerhalb des Einheitskreises, deren absolute Werte streng größer als 1,0 sind. Es wird angenommen, dass die Koeffizienten der Polynome eingeschränkt sind, so dass die Stationaritäts - und Invertibilitätsbedingungen erfüllt sind. Die unbekannten Koeffizienten dieser Polynome werden Teil des Modellparametervektors, der unter Verwendung der Daten geschätzt wird. Die allgemeine Form der ARIMA-Trendspezifikation ist wie folgt: ARIMA (lt P integer lt D ganzzahl lt Q integer lt SP integer lt SD integer lt SQ integer lt S integer) Standardmäßig sind die verschiedenen Ordnungen gleich 0 und die Jahreszeit Gleich 1. Die folgenden Beispiele veranschaulichen einige unterschiedliche ARIMA-Trendvorgaben: Diese Aussage definiert ima als integrierten gleitenden Durchschnittstrend: Diese Aussage definiert airTrend als Trend, der das bekannte Airline-Modell (ARIMA (0,1,1) (0,1,1) 12 Modell) für monatliche saisonale Daten: Diese Aussage definiert arma11 als null-gemein ARMA (1,1) Trend mit autoregressivem Parameter fixiert auf 0,1: Ein Beispiel für die Verwendung der ARIMA Trend-Spezifikation finden Sie unter Beispiel 27.6. TREND-Anweisungsoptionen In der TREND-Anweisung können Sie die folgenden Optionen verwenden, um die Trendparameter festzulegen und das Drucken der Trendschätzungen anzufordern. Darüber hinaus können Sie eine benutzerdefinierte Kombination eines bestimmten Trendtyps erstellen, indem Sie die Option CROSS angeben, um einen allgemeineren Trend zu erstellen. Ein Beispiel für die Verwendung der CROSS-Option finden Sie im Abschnitt Erste Schritte: SSM-Prozedur und die Diskussion des zweiten Modells in Beispiel 27.4. Listet die Werte der Koeffizienten des nicht-saisonalen autoregressiven Polynoms auf, wobei die Reihenfolge in der ARIMA-Trendspezifikation spezifiziert ist. Die Koeffizienten müssen ein stationäres autoregressives Polynom definieren. CROSS (var1, var2) CROSS (MATCHPARM) (var1, var2.) Erzeugt eine Linearkombination aus einer oder mehreren unabhängigen Trendkomponenten, die auf den Variablen in der Liste basiert. Wenn die Parameter des Trends durch Optionen wie die Option LEVELVAR oder die Option PHI angegeben werden, werden diese Parameter von diesen konstituierenden Trends gemeinsam genutzt. Nehmen wir zum Beispiel an, dass die CROSS-Liste zwei Variablen enthält und die Trend-Spezifikation vom Typ RW ist. Die Wirkung von CROSS () besteht darin, eine Komponente zu erstellen. Wo und sind zwei unabhängige zufällige gehen Trends. Wenn darüber hinaus die Random-Walk-Trend-Spezifikation die Option LEVELVAR verwendet, um den Varianzparameter anzugeben und ansonsten denselben Varianzparameter zu verwenden, werden zwei getrennte Varianzparameter diesen zufälligen Wanderungen zugewiesen. Wenn die zweite Form der CROSS-Option CROSS (MATCHPARM) verwendet wird, dann teilen sich die konstituierenden Trends alle relevanten Parameter, unabhängig davon, wie sie angegeben sind. Die CROSS-Option eignet sich für eine Vielzahl von Situationen. Angenommen, es ist eine Indikatorvariable, die 1 vor einem bestimmten Zeitpunkt und 0 danach ist. Dann hat CROSS (X) den Effekt, die Trendkomponente nach der Zeit auszuschalten. Ebenso werden angenommen und sind Indikatoren für Gender zum Beispiel, (GENDER M) und (GENDER F). Dann erzeugt CROSS () einen Trend, der mit dem Geschlecht der Beobachtung variiert. Die Variablen in der CROSS-Liste müssen frei von unbekannten Parametern sein. Die CROSS-Option kann rechnerisch aufwendig rechnerisch gleichbedeutend sein, so viele separate Trends wie die Anzahl der Variablen in der angegebenen Liste anzugeben. Die Variable LEVELVAR gibt die Variabilitätsparameter für alle Trendarten an. Für die Trendtypen LL und DLL gibt diese Option an. Jeder nichtnegative Wert, einschließlich 0, ist zulässig. Enthält die Variable unbekannte Parameter, werden sie aus den Daten geschätzt. Ebenso wird, wenn die Option LEVELVAR nicht angegeben ist, aus den Daten abgeschätzt. Listet die Werte der Koeffizienten des nicht sauren gleitenden mittleren Polynoms auf, wobei die Reihenfolge in der ARIMA-Trendspezifikation spezifiziert ist. Die Koeffizienten müssen ein invertierbares gleitendes Durchschnittspolynom definieren. Bewirkt, dass die diffusen Elemente im Anfangszustand des der Teilkomponente zugrundeliegenden Zustandsunterabschnitts als nicht diffundiert zu behandeln sind. Diese Option gilt für alle Trendarten außer ARIMA. Bei der ARIMA-Trendart wird diese Option auch dann ignoriert, wenn die nicht saisonalen oder saisonalen differenzierenden Aufträge ungleich Null sind. Die diffusen Elemente werden als unabhängige, null-mittlere Gaußsche Variablen angenommen. Ihre Varianzen werden Teil des Parametervektors und werden unter Verwendung der Daten geschätzt. Diese Option ist nützlich, um eine Trendkomponente zu erstellen, die als Abweichung von einer Gesamt-Trendkomponente (mit diffuser Initialisierung) interpretiert werden kann, die separat definiert ist. Die Variable PHI gibt den Wert für die Trendtypen DLL, DECAY, DECAY (OU), GROWTH und GROWTH (OU) an. Für den Typ DLL muss der angegebene Wert zwischen 0.0 und 1.0 liegen. Für die Typen DECAY und DECAY (OU) muss unbedingt negativ sein. Für die Typen GROWTH und GROWTH (OU) muss strikt positiv sein. Enthält die Variable unbekannte Parameter, werden sie aus den Daten geschätzt. Ähnlich wird, wenn die PHI-Option nicht spezifiziert ist, aus den Daten abgeschätzt. PRINTCOV COV1 FILTER SMOOTH T PRINT (ltCOV ltCOV1 ltFILTER ltSMOOTH ltT) fordert das Drucken der jeweiligen Systemmatrizen der Zustandsgleichung, die dem angegebenen Trend zugrunde liegt, und das Drucken seiner gefilterten und geglätteten Schätzungen. Wenn eine dieser Matrizen zeitlich variabel ist, wird die Matrix, die dem ersten Mal entspricht, gedruckt. Listet die Werte der Koeffizienten des saisonalen autoregressiven Polynoms auf, wobei der Auftrag mit der SP-Option in der ARIMA-Trendspezifikation angegeben wird und die Saisonlänge in der S-Option angegeben wird. Die Koeffizienten müssen ein stationäres autoregressives Polynom definieren. Listet die Werte der Koeffizienten des saisonalen gleitenden Durchschnittspolynoms auf, wobei die Reihenfolge unter Verwendung der SQ-Option in der ARIMA-Trendspezifikation spezifiziert wird und die Jahreszeitlänge in der S-Option angegeben ist. Die Koeffizienten müssen ein invertierbares gleitendes Durchschnittspolynom definieren. Die variable Variable SLOPEVAR gibt den zweiten Parameter der Störungsabweichung an. Für Trendtypen LL und DLL. Jeder nichtnegative Wert, einschließlich 0, ist zulässig. Enthält die Variable unbekannte Parameter, werden sie aus den Daten geschätzt. Ebenso wird, wenn die Option SLOPEVAR nicht angegeben ist, aus den Daten geschätzt. Copyright SAS Institute Inc. Alle Rechte vorbehalten.
Comments
Post a Comment