Goldfeld-Quandt-Test

Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen)

Der Goldfeld-Quandt-Test ist ein statistischer Test zum Nachweis von Heteroskedastizität (Nicht-konstante Varianz) bei der Regressionsanalyse. Der Test basiert auf dem Vergleich zweier Stichprobenhälften. Er wurde benannt nach Stephen Goldfeld and Richard E. Quandt.^[1]

Vorgehen

Vorgehensweise beim parametrischen Goldfeld-Quandt-Test.

Die Stichprobe wird in zwei Teile bzgl. einer Variablen geteilt; siehe Grafik. Die beiden Teile müssen disjunmkt sein (also keine Beobachtung darf in beiden Teilen sein), muss aber nicht die gesamte Stichprobe umfassen. In der Grafik ist z.B. der Mittelteil der Beobachtungen in keinem Teil (grau). Für beide Teile wird eine Regression geschätzt und die Varianz der Residuen berechner. Bei Vorliegen von Heteroskedastiztät weist ein Teil der Stichprobe eine hohe Rsidualvarianz (rot) auf, während ein anderer Teil eine niedrige Residualvarianz (blau) aufweist.

Danach wird für jeden Teil die Stichprobenvarianz der Residuen ${s_{i}^{2}}$ für i=1,2 bestimmt (mit $s_{1}^{2}>s_{2}^{2}$ ) und der Prüfwert ${\tfrac {s_{1}^{2}}{s_{2}^{2}}}$ mittels einem kritischen Wert aus der F-Verteilung verglichen.

Mathematische Formulierung

Voraussetzung

Im klassischen Regressionsmodell gilt $Y_{i1}=f_{1}(x_{i1})+U_{i1}$ bzw. $Y_{i2}=f_{2}(x_{i2})+U_{i2}$ mit $U_{i1}\sim N(0;\sigma _{1})$ und $U_{i1}\sim N(0;\sigma _{2})$ . Der Test reagiert sensitiv auf Verletzungen der Normalverteilung der Residuen.

Hypothesen und Teststatistik

Die Hypothesen lauten

H_{0}:\sigma _{1}=\sigma _{2}\,

(Homoskedastizität) vs.

H_{0}:\sigma _{1}\neq \sigma _{2}

(Heteroskedastizität).

Die Verteilung der Teststatistik ergibt sich als

F={\frac {S_{1}^{2}}{S_{2}^{2}}}\sim F_{n_{1}-k;n_{2}-k}

mit $n_{i}$ die Anzahl der Beobachtungen in der $i$ ten Teil und $k$ die Anzahl der geschätzen Regressionsparammeter sowie

S_{i}^{2}={\frac {1}{n_{i}-k}}\sum _{j=1}^{n_{i}}U_{ji}^{2}

.

Die Nullhypothese (Homoskedastizität) wird verworfen, wenn der Prüfwert größer als der kritische Wert $F_{c}$ aus der F-Verteilung mit $n_{1}-k$ und $n_{2}-k$ Freiheitsgraden.

Beispiel

Variable	Bedeutung
medv	Mittlerer Kaufpreis in 1000 US$
lstat	Anteil Unterschichtbevölkerung
rm	Durchschnittliche Raumzahl
dis	Gewichtete Entfernung zu den fünf wichtigsten Beschäftigtenzentren

Für das Beispiel wurden lineare Regressionen mit dem Boston Housing Datensatz durchgeführt. Für jeden der 506 Bezirke wurden die rechts stehenden Variablen erhoben und eine lineare Regression durchgeführt:

medv_{i}=2,8083-0,7233lstat_{i}+4,8734rm_{i}-0,4613dis_{i}+{\hat {u}}_{i}

.

Plottet man die Residuen gegen die Variable dis (Grafik oben) so sieht man, dass die Varianz der Residuen abnimmt, wenn die Werte von dis zunehmen. Man teilt die Daten nun in zwei Teile: den roten und den blauen Teil. Dann fittet man zwei Regressionsmodelle und berechnet die Summe der quadrierten Residuen.

Rot	$medv_{i1}=+56,116-1,002lstat_{i1}+0,664rm_{i1}-14,106dis_{i1}+{\hat {u}}_{i1}$
	$s_{1}^{2}={\frac {1}{n_{1}-k}}\sum _{i=1}^{n_{1}}{\hat {u}}_{i1}^{2}={\frac {4899,807}{112-4}}=45,369$
Blau	$medv_{i2}=-40,858-0,044lstat_{i2}+9,895rm_{i2}+0,233dis_{i2}+{\hat {u}}_{i2}$
	$s_{2}^{2}={\frac {1}{n_{2}-k}}\sum _{i=1}^{n_{2}}{\hat {u}}_{i2}^{2}={\frac {179,927}{49-4}}=3,998$

Dann ergibt sich der Prüfwert zu $f={\tfrac {45,369}{3,998}}=11,347$ und der kritische Wert für ein Signifikanzniveau $\alpha =5\%$ aus der F-Verteilung mit 108 und 45 Freiheitsgraden zu $c=1,548$ . Da der Prüfwert größer ist als der kritische Wert muß die Nullhypothese der Homoskedastizität abgelehnt werden.

Einzelnachweise

↑ Stephen M. Goldfeld, Quandt, R. E.: Some Tests for Homoscedasticity. In: Journal of the American Statistical Association. 60. Jahrgang, Nr. 310, Juni 1965, S. 539–547 (jstor.org).

Literatur

Griffiths, William E. / Hill, R. Carter / Judge, George G.: Learning and Practicing Econometrics, 1. Auflage, 1993, Seite 494 ff., ISBN 0471513644

[GQ-1] Stephen M. Goldfeld, Quandt, R. E.: Some Tests for Homoscedasticity. In: Journal of the American Statistical Association. 60. Jahrgang, Nr. 310, Juni 1965, S. 539–547 (jstor.org).

[1]