Zum Inhalt springen

Zeitreihenanalyse

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 19. Juli 2004 um 20:42 Uhr durch Blaubart (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Eine Zeitreihe ist eine zeitabhängige Folge von Datenpunkten. Typische Beispiele für Zeitreihen sind Börsenkurse oder Wetterbeobachtungen.

Die Zeitreihenanalyse ist die Disziplin, die sich mit der mathematisch-statistischen Analyse von Zeitreihen und der Vorhersage ihrer künftigen Entwicklung beschäftigt.

Zeitreihen: Nähere Begriffsbestimmung, Einteilung und Beispiele

Der Begriff Zeitreihe setzt voraus, dass Daten nicht kontinuierlich, sondern diskret, das heißt: in endlichen zeitlichen Abständen anfallen. Aus einem zeitkontinuierlichen Messsignal (oder der kontinuierlichen Aufzeichnung eines Messsignals, zum Beispiel mit einem analogen t-y-Schreiber oder einem analogen Magnetbandgerät) kann eine Zeitreihe durch Abtastung gewonnen werden.

Die Zeitpunkte, denen Datenpunkte zugeordnet werden, können äquidistant, also in konstanten Abständen (zum Beispiel alle 5 Sekunden), in anderer Regelmäßigkeit (zum Beispiel werktäglich) oder unregelmäßig angeordnet sein.

Ein Datenpunkt kann aus einer einzelnen Zahl (skalare Werte, univariate Zeitreihe) oder aus einer Mehrzahl (Tupel) von Zahlenwerten (vektorielle Werte, multivariate Zeitreihe) bestehen. Jedoch müssen alle Datenpunkte in gleicher Weise aus Einzelwerten aufgebaut sein.

Typische Zeitreihen entstehen aus dem Zusammenwirken regelhafter und zufälliger Ursachen. Die regelhaften Ursachen können periodisch (saisonal) variieren und/oder langfristige Trends enthalten. Zufällige Einflüsse werden oft als Rauschen bezeichnet.

Zeitreihen fallen in vielen Bereichen an. Beispiele:

Eine besonders komplexe (aber auch reichhaltige) Datensituation liegt vor, wenn man zeitabhängige Mikrodaten besitzt, also z.B. Personen- oder Haushaltsdaten für verschiedene Zeitpunkte. Hier spricht man allerdings nicht mehr von Zeitreihendaten, sondern von Trend-, Panel- oder Ereignisdaten, je nach ihrer Zeitstruktur.

Zeitreihenanalyse: Überblick

Ziele der Zeitreihenanalyse können sein

  • die kürzestmögliche Beschreibung einer historischen Zeitreihe
  • die Vorhersage von künftigen Zeitreihenwerten (Prognose) auf der Basis der Kenntnis ihrer bisherigen Werte (Wettervorhersage)
  • die Erkennung von Veränderungen in Zeitreihen (EEG oder EKG-Monitoring in der Medizin bei chirurgischen Eingriffen)
  • die Eliminierung von seriellen Abhängigkeiten oder Trends in Zeitreihen, um einfache Parameter wie Mittelwerte verlässlich zu schätzen

Die Vorgehensweise im Rahmen der Zeitreihenanalyse lässt sich in folgende Arbeitsphasen einteilen:

  • Identifikationsphase: Identifikation eines geeigneten Modells für die Modellierung der Zeitreihe
  • Schätzphase: Schätzung von geeigneten Parametern für das gewählte Modell
  • Diagnosephase: Diagnose und Evaluierung des geschätzten Modells
  • Einsatzphase: Einsatz des geschätzten und als geeignet befundenen Modells (insbesondere zu Prognosezwecken)

In den einzelnen Phasen ergeben sich Unterschiede, je nachdem ob man die klassischen Methoden der Zeitreihenanalyse (Box-Jenkins-Methode, Komponentenmodell) oder neuere, nichtlineare Methoden zu Grunde legt. Im folgenden wird beispielhaft auf die Box-Jenkins-Methode eingegangen.

Identifikationsphase

An erster Stelle sollte die graphische Darstellung der empirischen Zeitreihenwerte stehen. Dieses ist die einfachste und intuitivste Methode. Im Rahmen der graphischen Analyse lassen sich erste Schlüsse über das vorliegen von Trends, Saisonalitäten, Ausreißern, Varianzinstationarität sowie sonstiger Auffäligkeiten ziehen.

Stellt man einen stochastischen Trend (Instationarität) fest (entweder durch die graphische Analyse oder durch einen statistischen Test wie den Augmented-Dickey-Fuller-Test), der später durch eine Transformation der Zeitreihe (Differenzieren) bereinigt werden soll, so bietet sich eine Varianzstabilisierung (z. B. Box-Cox-Transformation) an. Die Varianzstabilisierung ist wichtig, da nach dem Differenzieren einer Zeitreihe negative Werte in der transformierten Zeitreihe vorkommen können.

Bevor weitergearbeitet werden kann, muss noch die grundsätzliche Frage geklärt werden, ob die Zeitreihe in einem deterministischem Modell (Trendmodell) oder einem stochastischen Modell abgebildet werden soll. Diese beiden Alternativen implizieren unterschiedliche Methoden der Trendbereinigung. Beim Trendmodell erfolgt die Bereinigung mittels einer Regressionsschätzung, beim stochastischen Modell mittels Differenzenbildung.

Schätzphase

In der Schätzphase werden die Modellparameter und -koeffizienten mit Hilfe unterschiedlicher Techniken geschätzt. Für das Trendmodell bietet sich die OLS-Methode, für die Box-Jenkins-Methode die Momentenmethode und die Maximum-Likelihood-Methode für die Schätzung an.

Diagnosephase

In der Diagnosephase werden das Modell oder ggf. mehrere ausgewählte Modelle nochmal anhand ihrer geschätzten Parameter beurteilt. Dabei bietet sich folgende Vorgehensweise an:

1. Schritt: Prüfen, ob die geschätzten Koeffizienten signifikant von Null verschieden sind. Bei einzelnen Koeffizienten erfolgt dies mit Hilfe eines t-Tests, mehrere Koeffizienten zusammen werden mit einem F-Test untersucht.

2. Schritt: Verfährt man nach der Box-Jenkins-Methode, so ist zu prüfen, inwieweit die empirischen Autokorrelationskoeffizienten mit denen übereinstimmen, die sich theoretisch aufgrund der vorher geschätzten Koeffizienten ergeben müssten. Zusätzlich können die partiellen Autokorrelationskoeffizienten sowie das Spektrum analysiert werden.

3. Schritt: Schließlich erfolgt eine sorgfältige Analyse der Residuen. Die Residuen sollten keine Struktur mehr aufweisen. Dabei kann man die Zentriertheit der Residuen mit einem t-Test kontrollieren. Die Konstanz der Varianz kann visuell am Zeitreihengraphen oder durch Berechnung des Effekts verschiedener λ-Werte in einer Box-Cox-Transformation berechnet werden. Um die Autokorrelationsfreiheit der Residuen zu prüfen kann man jeden einzelnen Koeffizienten auf signifikanten Unterschied zu Null prüfen oder die ersten n Koeffizienten gemeinsam auf Signifikanz zu Null testen. Um Letzteres zu klären kann auf die sogenannten Portmanteau-Tests zurückgegriffen werden.

Hierfür bieten sich beispielsweise Informationskriterien an.

Einsatzphase

In der Einsatzphase gilt es aus der in der Identifikationsphase aufgestellten und als brauchbar befundenen Modellgleichung eine Prognosegleichung zu formulieren. Dabei muss vorher ein Optimalitätskriterium festgelegt werden. Dafür kann z. B. der minimal mean squared error (MMSE) genommen werden.

Methoden der Zeitreihenanalyse

Grundlage jeder Zeitreihenanalyse ist ein mathematisches Modell. Es ermöglicht Vorhersagen und unter Umständen auch Rückschlüsse auf die der Zeitreihe zugrundeliegenden Prozesse.

Das einfachste Modell geht von einer Trend- und einer Rauschkomponente aus:

Meistens nimmt man an, dass die Zeitreihe stationär ist, also keinen Trend enthält:

und dass die Autokovarianz (s. auch http://www.luebbert.net/uni/statist/zr/zr2.htm ) der Zeitreihen zeitunabhängig ist (Stationarität zweiter Ordnung).

Lineare Methoden

Substantielle Information zu linearer Modellierung steht im Artikel ARMA-Modelle.

Instrumente zur Periodizitätsanalyse sind z.B.

Instrumente zur systematischen Bewegung sind insbesondere

Siehe auch: statistische Momente, Autokorrelation, partielle Autokorrelation.

Nichtlineare Methoden

Informationstheoretische Methoden: siehe dazu Transinformation, Entropie (Informationstheorie)

Methoden aus der Chaostheorie: siehe dazu Dimensionalität

Inferenzstatistische Analyse von Zeitreihen

In der Inferenzstatistik schätzt man die Grösse der untersuchten Effekte auf der Basis von Stichproben. Neben den schon genannten Verfahren, bei denen man inferenzstatistisch dann die Fehler der gefundenen Ergebnisse abschätzt, können komplexe Zeitreihen-Modelle spezifiziert und geschätzt werden. Dies wird vor allem in der Ökonometrie für die Wirtschaftsmodelle genutzt. Grundlage ist der Begriff 'stochastischer Prozess' Hier ist insbesondere die Gruppe der ARMA-Prozesse zu erwähnen.

Literatur

  • Schlittgen, Rainer; Streitberg, Bernd: Zeitreihenanalyse.
  • Assenmacher, Walter: Einführung in die Ökonometrie.
  • Greene, William H.: Econometric Analysis.
  • Rinne, Horst; Specht, Katja: Zeitreihen: Statistische Modellierung, Schätzung und Prognose, München: Vahlen, 2002.