Lineare Paneldatenmodelle

Statistisches Verfahren in der Sozialforschung
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 13. November 2011 um 01:19 Uhr durch SEM (Diskussion | Beiträge) (Random-Effects-Modell). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen)

Als Fixed-effects- und Random-effects-Modelle bezeichnet man verfeinerte Verfahren der linearen Regressionsanalyse, die in Verbindung mit Paneldaten verwendet werden können. Random-effects und insbesondere Fixed-effects-Modelle erlauben eine konsistente Schätzung kausaler Effekte unter weniger restriktiven Annahmen als die klassische Kleinste-Quadrate-Schätzung.

Kleinste-Quadrate-Schätzung in Paneldaten

In Paneldatensätzen werden Variablen von der gleichen Beobachtungseinheit i=1...N für mehrere Zeitperioden t=1...T erhoben, sodass insgesamt NT Beobachtungen zur Verfügung stehen. Ein grundsätzliches Modell könnte hierbei wie folgt aussehen [1]

 

wobei x einen Vektor darstellt, der die k erklärenden Variablen enthält;   und   sind die zu erklärenden Koeffizienzen und u stellt einen Fehlerterm dar. Dieses Modell kann so nicht geschätzt werden, da es zu viele zu schätzende Koeffizienten enthält.[2] Die klassische Kleinste-Quadrat-Schätzung (auch OLS- für ordinary least squares nimmt deswegen vereinfachend an, dass alle Koeffizienten üher die Zeit konstant bleiben[3]:

 

Dieses Modell ist auch als Pooled OLS bekannt. Damit der Effekt der erklärenden Variablen x auf y konsistent geschätzt werden kann, muss darüber hinaus angenommen werden, dass die erklärenden Variablen und die Fehlerterme unkorelliert sind[4]:  

Random- und Fixed-Effects-Modelle erlauben es, von der Annahme ausschließlich konstanter Koeffizienten abzuweichen und ein Modell der Form

 

zu schätzen. Dieses Modell wird auch als Modell mit Individuen-spezifischen Effekten (individual-specific effects model)[5] oder Modell für unbeobachtete Effekte (unobserved effects model) [6] bezeichnet. Die Terme   sind unter anderem als "unbeobachtete Heterogenität", "latente Variable" oder "individuelle Heterogenität" bekannt.[7]. Der Unterschied zwischen Random- und Fixed-Effects-Modell besteht in der unterstellten Korrelation zwischen den erklärenden Variablen und der unbeobachteten Heterogenität.

Random-Effects-Modell

Das Random Effects-Modell (zur Abgrenzung manchmal auch random intercept model [8]) macht die Annahme, dass die unbeobachtete Heterogenität orthogonal zu de erklärenden Variablen steht:  , wobei x einen T-dimensionalen Vektor darstellt. Darüber hinaus muss auch strikte Exogenität des Fehlerterms angenommen werden:   [9]. Unter diesen Annahmen kann die individuelle Heterogenität als ein weiterer Fehlerterm gesehen werden, d.h. das zu schätzende Modell kann umgeschrieben werden als  , wobei  . Aufgrund der obigen Annahmen ist dann  . [10] Das Random-Effects-Modell erfüllt also die Anforderung, dass der Fehlerterm der Regression und die erklärenden Variablen unkorreliert sind. Aus diesem Grund würde eine klassische Kleinste-Quadrate-Schätzung konsistenten Schätzern für Beta führen. Aufgrund der individuellen Heterogenität erfüllt das Random-Effects-Modell allerdings die Annahme der Homoskedastie nicht. Selbst wenn   und   Konstanten sind und die idiosynkratischen Fehlerterme unkorreliert sind ( , t≠s), wird zwischen den zusammengesetzten Fehlertermen des gleichen Individuums für verschiedene Zeitpunkte eine Korrelation bestehen:   [11] Aus diesem Grund wird die Varianz-Kovarianzmatrix eine  -Matrix sein, gegeben durch

 

Wobei die einzelnen Diagonalelemente gegeben sind durch  -Matrizen

 .

  ist also keine Diagonalmatrix, sondern eine Block-diagonale Matrix. Die besondere Struktur mit nur zwei Parametern (Fehler beim Parsen (Syntaxfehler): {\displaystyle sigma^2_u und \sigma^2_c) wird auch als Random-Effects-Struktur bezeichnet.<ref> Wooldridge, 2002, S. 259 </ref> Die für den [[Satz von Gauß-Markov]] zentrale Annahme der Homoskedastie (die eine diagonale Varianz-Kovarianzmatrix mit konstantem Diagonalelement erfordert) ist nicht erfüllt. Aus diesem Grund ist die gewöhnliche Kleinste-Quadrat-Schätzung im Random-Effects-Modell nicht [[Minimalvarianter_linearer_erwartungstreuer_Schätzer|effizient]]. == Vergleich der Modelle == * Lineares Regressionsmodell zum Vergleich: <math>y_{ij}=\beta_{0} + \beta_{1} x_{ij}+ \epsilon_{ij}}

  • Bei Fixed Effect-Modellen wird die gleiche Steigung unterstellt, aber Niveauunterschiede (Achsenabschnitte) zugelassen. Das Fixed Effect Modell geht davon, dass die   fixe Effekte sind, also als Parameter eines linearen Regressionsmodellen mit entsprechenden Dummyvariablen für die Gruppe j geschätzt werden können:
Fixed Effect Modell:   (z.B. mit der Bedingung  )
  • Random Effect Modelle

Bei Random Effect-Modellen werden unterschiedliche Steigungen zugelassen, aber ein gleichen Ausgangsniveau erzwungen. Im Random Intercept Modell sind die   fehlerbehaftete Größen (random effects). Der Fehler setzt sich dann aus zwei Komponenten zusammen: den inviduellen Fehlern   und den Gruppenfehlern  .

Random Intercept Modell:  
Random Slope Modell:  

Anwendung

werden im Rahmen der Mehrebenenanalyse und Paneldatenanalyse verwendet. Bei der Mehrebenenanalyse können die fixen Effekte z.B. Niveauunterschiede zwischen Ländern sein, in denen Informationen zu Personen vorliegen. Im Rahmen der Paneldatenanalyse können unterschiedliche Entwicklungen über die Zeit aufgrund von Drittvariablen kontrolliert werden.

Literatur

Einzelnachweise

  1. Cameron & Trivedi, 2005, S.698
  2. Es müssten schon alleine NT verschiedene alphas geschätzt werden, und dazu noch N*T*K verschiedene betas.
  3. Cameron & Trivedi, 2005, S.699
  4. Cameron und Trivedi, 2005, S. 702
  5. Cameron & Trivedi, 2005, S. 700
  6. Wooldridge, 2002, S. 251
  7. Wooldridge, 2002, S. 251
  8. Cameron & Trivedi, 2005, S. 700
  9. Wooldridge, 2002, S. 257
  10. Wooldridge, 2002, S. 258
  11. Wooldridge, 2002, S. 258f.