Zum Inhalt springen

Stichproben-Regressionsfunktion

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 15. November 2020 um 17:03 Uhr durch CallMeEdgar (Diskussion | Beiträge) (Um konsistent mit der Formulierung des multiplen linearen Regressionsmodells zu sein, sollte der Störterm "epsilon" auch im Regressionsmodell der einfachen linearen Regression aufgeführt werden.). Sie kann sich erheblich von der aktuellen Version unterscheiden.

In der Statistik bezeichnet eine Stichproben-Regressionsfunktion, auch empirische Regressionsfunktion (englisch sample regression function, kurz: SRF) die geschätzte Version der Regressionsfunktion der Grundgesamtheit. Die Stichprobenregressionsfunktion ist fix, aber in der Grundgesamtheit unbekannt. Handelt es sich bei der Regressionsfunktion um eine Gerade, dann ist auch von einer Stichproben-Regressionsgerade, oder empirischen Regressionsgerade die Rede. Die Stichproben-Regressionsgerade wird als Kleinste-Quadrate-Regressionsgerade (kurz: KQ-Regressionsgerade) aus Beobachtungspaaren, die Datenpunkte repräsentieren, gewonnen. Sie stellt laut dem Kleinste-Quadrate-Kriterium die bestmögliche Anpassung an die Daten dar.

Einfache lineare Regression

Wenn man mittels der Kleinste-Quadrate-Schätzung den Kleinste-Quadrate-Schätzer für die Steigung und den Kleinste-Quadrate-Schätzer für das Absolutglied ermittelt, dann erhält man die folgende KQ-Regressionsgerade

.

Diese wird auch Stichprobenregressionsfunktion genannt, da sie eine geschätzte Variante der (theoretischen) Regressionsfunktion der Grundgesamtheit

ist.[1] Die Parameter und werden auch empirische Regressionskoeffizienten genannt.[2] Da die Stichprobenregressionsfunktion durch eine gegebene Stichprobe gewonnen wird, liefert eine neue Stichprobe einen neuen Anstieg und ein neues Absolutglied . In den meisten Fällen kann man den Kleinste-Quadrate-Schätzer für die Steigung darstellen als

Durch diese Darstellung kann man erkennen, dass der Kleinste-Quadrate-Schätzer für die Steigung wiedergibt, wie stark sich die Zielgröße verändert, wenn sich die Einflussgröße um eine Einheit erhöht.[3]

Multiple lineare Regression

Gegeben ein typisches multiples lineares Regressionsmodell , mit dem Vektor der unbekannten Regressionsparameter, der Versuchsplanmatrix , dem Vektor der abhängigen Variablen und dem Vektor der Störgrößen . Dann ist die KQ-Stichproben-Regressionsfunktion bzw. Stichproben-Regressionshyperebene gegeben durch

,

wobei die Prädiktionsmatrix darstellt.

Einzelnachweise

  1. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2013, S. 31.
  2. Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 185.
  3. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2013, S. 31.