Lineare Paneldatenmodelle
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.
Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen) |
Als Fixed-effects- und Random-effects-Modelle bezeichnet man verfeinerte Verfahren der linearen Regressionsanalyse, die in Verbindung mit Paneldaten verwendet werden können. Random-effects und insbesondere Fixed-effects-Modelle erlauben eine konsistente Schätzung kausaler Effekte unter weniger restriktiven Annahmen als die klassische Kleinste-Quadrate-Schätzung.
Kleinste-Quadrate-Schätzung in Paneldaten
In Paneldatensätzen werden Variablen von der gleichen Beobachtungseinheit i=1...N für mehrere Zeitperioden t=1...T erhoben, sodass insgesamt NT Beobachtungen zur Verfügung stehen. Ein grundsätzliches Modell könnte hierbei wie folgt aussehen [1]
wobei x einen Vektor darstellt, der die k erklärenden Variablen enthält; und sind die zu erklärenden Koeffizienzen und u stellt einen Fehlerterm dar. Dieses Modell kann so nicht geschätzt werden, da es zu viele zu schätzende Koeffizienten enthält.[2] Die klassische Kleinste-Quadrat-Schätzung (auch OLS- für ordinary least squares nimmt deswegen vereinfachend an, dass alle Koeffizienten üher die Zeit konstant bleiben[3]:
Dieses Modell ist auch als Pooled OLS bekannt. Damit der Effekt der erklärenden Variablen x auf y konsistent geschätzt werden kann, muss darüber hinaus angenommen werden, dass die erklärenden Variablen und die Fehlerterme unkorelliert sind[4]:
Random- und Fixed-Effects-Modelle erlauben es, von der Annahme ausschließlich konstanter Koeffizienten abzuweichen und ein Modell der Form
zu schätzen. Dieses Modell wird auch als Modell mit Individuen-spezifischen Effekten (individual-specific effects model)[5] oder Modell für unbeobachtete Effekte (unobserved effects model) [6] bezeichnet. Die Terme sind unter anderem als "unbeobachtete Heterogenität", "latente Variable" oder "individuelle Heterogenität" bekannt.[7]. Der Unterschied zwischen Random- und Fixed-Effects-Modell besteht in der unterstellten Korrelation zwischen den erklärenden Variablen und der unbeobachteten Heterogenität.
Random-Effects-Modell
Das Random Effects-Modell (zur Abgrenzung manchmal auch random intercept model [8]) macht die Annahme, dass die unbeobachtete Heterogenität orthogonal zu de erklärenden Variablen steht: , wobei x einen T-dimensionalen Vektor darstellt. Darüber hinaus muss auch strikte Exogenität des Fehlerterms angenommen werden: [9]. Unter diesen Annahmen kann die individuelle Heterogenität als ein weiterer Fehlerterm gesehen werden, d.h. das zu schätzende Modell kann umgeschrieben werden als , wobei . Aufgrund der obigen Annahmen ist dann . [10] Das Random-Effects-Modell erfüllt also die Anforderung, dass der Fehlerterm der Regression und die erklärenden Variablen unkorreliert sind. Aus diesem Grund würde eine klassische Kleinste-Quadrate-Schätzung konsistenten Schätzern für Beta führen. Aufgrund der individuellen Heterogenität erfüllt das Random-Effects-Modell allerdings die Annahme der Homoskedastie nicht. Selbst wenn und Konstanten sind und die idiosynkratischen Fehlerterme unkorreliert sind (, t≠s), wird zwischen den zusammengesetzten Fehlertermen des gleichen Individuums für verschiedene Zeitpunkte eine Korrelation bestehen: [11] Aus diesem Grund wird die Varianz-Kovarianzmatrix eine -Matrix sein, gegeben durch
Wobei die einzelnen Diagonalelemente gegeben sind durch -Matrizen
.
ist also keine Diagonalmatrix, sondern eine Block-diagonale Matrix. Die besondere Struktur mit nur zwei Parametern (Fehler beim Parsen (Syntaxfehler): {\displaystyle sigma^2_u und \sigma^2_c) wird auch als Random-Effects-Struktur bezeichnet.<ref> Wooldridge, 2002, S. 259 </ref> Die für den [[Satz von Gauß-Markov]] zentrale Annahme der Homoskedastie (die eine diagonale Varianz-Kovarianzmatrix mit konstantem Diagonalelement erfordert) ist nicht erfüllt. Aus diesem Grund ist die gewöhnliche Kleinste-Quadrat-Schätzung im Random-Effects-Modell nicht [[Minimalvarianter_linearer_erwartungstreuer_Schätzer|effizient]]. == Vergleich der Modelle == * Lineares Regressionsmodell zum Vergleich: <math>y_{ij}=\beta_{0} + \beta_{1} x_{ij}+ \epsilon_{ij}}
- Bei Fixed Effect-Modellen wird die gleiche Steigung unterstellt, aber Niveauunterschiede (Achsenabschnitte) zugelassen. Das Fixed Effect Modell geht davon, dass die fixe Effekte sind, also als Parameter eines linearen Regressionsmodellen mit entsprechenden Dummyvariablen für die Gruppe j geschätzt werden können:
- Fixed Effect Modell: (z.B. mit der Bedingung )
- Random Effect Modelle
Bei Random Effect-Modellen werden unterschiedliche Steigungen zugelassen, aber ein gleichen Ausgangsniveau erzwungen. Im Random Intercept Modell sind die fehlerbehaftete Größen (random effects). Der Fehler setzt sich dann aus zwei Komponenten zusammen: den inviduellen Fehlern und den Gruppenfehlern .
- Random Intercept Modell:
- Random Slope Modell:
Anwendung
werden im Rahmen der Mehrebenenanalyse und Paneldatenanalyse verwendet. Bei der Mehrebenenanalyse können die fixen Effekte z.B. Niveauunterschiede zwischen Ländern sein, in denen Informationen zu Personen vorliegen. Im Rahmen der Paneldatenanalyse können unterschiedliche Entwicklungen über die Zeit aufgrund von Drittvariablen kontrolliert werden.
Weblinks
- Fixed and random effects models
- Distinguishing Between Random and Fixed: Variables, Effects, and Coefficients
- How to Conduct a Meta-Analysis: Fixed and Random Effect Models
Literatur
- Joshua D. Angrist und Jörn-Steffen Pischke: Mostly Harmless Econometrics: An Empiricist's Companion, Princeton University Press, 2008
- A.Colin Cameron und Pravin K. Trivedi: Microeconometrics- Methods and Applications, Cambridge University Press, 2005, ISBN 0521848059, insb. Kapitel 21
- Ronald Christensen: Plane Answers to Complex Questions: The Theory of Linear Models. Third Auflage. Springer, New York 2002, ISBN 0-387-95361-2.
- FAQ:What is the between estimator? Abgerufen am 5. Oktober 2011.
- FAQ: Fixed-, between-, and random-effects and xtreg. Abgerufen am 5. Oktober 2011.
- Jeffrey M. Wooldridge: Econometric Analysis of Cross Section and Panel Data: Second Edition, Cambridge: MIT Press, 2002, insb. Kapitel 10
Einzelnachweise
- ↑ Cameron & Trivedi, 2005, S.698
- ↑ Es müssten schon alleine NT verschiedene alphas geschätzt werden, und dazu noch N*T*K verschiedene betas.
- ↑ Cameron & Trivedi, 2005, S.699
- ↑ Cameron und Trivedi, 2005, S. 702
- ↑ Cameron & Trivedi, 2005, S. 700
- ↑ Wooldridge, 2002, S. 251
- ↑ Wooldridge, 2002, S. 251
- ↑ Cameron & Trivedi, 2005, S. 700
- ↑ Wooldridge, 2002, S. 257
- ↑ Wooldridge, 2002, S. 258
- ↑ Wooldridge, 2002, S. 258f.