Chi-Quadrat-Test

Hypothesentest in der mathematischen Statistik
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 14. August 2005 um 15:40 Uhr durch Robbot (Diskussion | Beiträge) (Bot: Ergänze: nl Ändere: it, lv). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Mit dem χ2-Test (Chi-Quadrat-Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit.

Man unterscheidet vor allem die beiden Tests:

  • Verteilungstest oder Anpassungstest
  • Unabhängigkeitstest

Verteilungstest

Man betrachtet ein statistisches Merkmal x, dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind. Es wird bezüglich der Wahrscheinlichkeiten von x eine, vorläufig allgemein formulierte Nullhypothese

Ho: Das Merkmal x hat die Wahrscheinlichkeitsverteilung Fo(x)

aufgestellt.

Vorgehensweise

Die n Beobachtungen von x liegen in m verschiedenen Kategorien j (j = 1, ..., m) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise zu Klassen j zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Die Zahl der Beobachtungen in einer Kategorie ist die beobachtete Häufigkeit nj.

Man überlegt sich nun, wieviele Beobachtungen im Mittel in einer Kategorie liegen müssten, wenn x tatsächlich die hypothetische Verteilung hat. Dazu berechnet man zunächst die Wahrscheinlichkeit Fo(x)j, dass x in diese Kategorie fällt.

 

ist die unter Ho zu erwartende Häufigkeit.

Die Prüfgröße für den Test ist

  .

Die Prüfgröße χ2 ist bei ausreichend großen nj annähernd χ2-verteilt mit m-1 Freiheitsgraden.

Wenn die Nullhypothese wahr ist, sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Häufigkeit klein sein. Also wird Ho bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für Ho liegt rechts.

Bei einem Signifikanzniveau α wird Ho abgelehnt, wenn χ2 > χ2(1-α; m-1), dem (1-α)-Quantil der χ2-Verteilung mit m-1 Freiheitsgraden ist.

Es existieren Tabellen für die χ2-Schwellenwerte in Abhängigkeit von der Anzahl der Freiheitsgrade und vom gewünschten Signifikanzniveau, z. B. [1] oder (knapper) [2].

Soll die Sicherheitsschwelle (=Signifikanzniveau), die zu einem bestimmten χ2 gehört, bestimmt werden, so muss in der Regel aus der Tabelle ein Zwischenwert berechnet werden. Dazu verwendet man logarithmische Interpolation.

Besonderheiten

Schätzung von Verteilungsparametern

Im allgemeinen gibt man bei der Verteilungshypothese die Parameter der Verteilung an. Kann man diese nicht angeben, müssen sie aus der Stichprobe geschätzt werden. Hier geht bei der χ2-Verteilung pro geschätztem Parameter ein Freiheitsgrad verloren. Sie hat also m-w-1 Freiheitsgrade mit w als Zahl der geschätzten Parameter.

Mindestgröße der erwarteten Häufigkeiten

Damit die Prüfgröße als annähernd χ2-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit mindestens 5 betragen. Sind sie zu klein, sollten gegebenenfalls mehrere Klassen zusammengefasst werden.

Beispiel zu Anpassungstest

Es liegen von ca. 200 börsennotierten Unternehmen die Umsätze vor. Das folgende Histogramm, in SPSS erstellt, zeigt ihre Verteilung.

 

Es sei x: Umsatz eines Unternehmens [Mio €].

Es soll nun die Hypothese getestet werden, dass x normalverteilt ist.

Da die Daten in vielen verschiedenen Ausprägungen vorliegen, wurden sie in Klassen eingeteilt. Es ergab sich die Tabelle:

Klasse Intervall Beobachtete Häufigkeit
j über bis nj
1 ... 0 0
2 0 5000 148
3 5000 10000 17
4 10000 15000 5
5 15000 20000 8
6 20000 25000 4
7 25000 30000 3
8 30000 35000 3
9 35000 ... 9
Summe     197

Da keine Parameter vorgegeben werden, werden sie aus der Stichprobe ermittelt. Es sind geschätzt

 

und

 

Es wird getestet:

Ho: X ist normalverteilt mit dem Erwartungswert μ = 6892 und der Varianz σ2 = 149842.

Um die erwarteten Häufigkeiten zu bestimmen, werden zunächst die Wahrscheinlichkeit berechnet, dass X in die vorgegebenen Klassen fällt. Es sei Φ(x|6892;149842) die Verteilungsfunktion der oben angegebenen Normalverteilung an der Stelle x. Man errechnet dann

 
 
...

Daraus ergeben sich die erwarteten Häufigkeiten

 
 
...

Es müssten also beispielsweise ca 25 Unternehmen im Mittel einen Umsatz zwischen 0 und 5000 € haben, wenn das Merkmal Umsatz tatsächlich normalverteilt ist.

Die erwarteten Häufigkeiten sind zusammen mit den beobachteten Häufigkeiten in der folgenden Tabelle aufgeführt.


Klasse Intervall Beobachtete Häufigkeit Wahrscheinlichkeit Erwartete Häufigkeit
j über bis nj Fjo njo
1 ... 0 0 0,3228 63,59
2 0 5000 148 0,1270 25,02
3 5000 10000 17 0,1324 26,08
4 10000 15000 5 0,1236 24,35
5 15000 20000 8 0,1034 20,36
6 20000 25000 4 0,0774 15,25
7 25000 30000 3 0,0519 10,23
8 30000 35000 3 0,0312 6,14
9 35000 ... 9 0,0303 5,98
Summe     197 1,0000 197,00

Die Prüfgröße wird jetzt folgendermaßen ermittelt:

 

Bei einem Signifikanzniveau α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ2(0,95;9-2=7) = 14,07. Da χ2 > 14,07 ist, wird die Hypothese abgelehnt. Man kann davon ausgehen, dass das Merkmal Umsatz nicht normalverteilt ist.

Ergänzung

Die Daten wurden logarithmiert. Ein Normalverteilungstest dieser Daten wurde bei einem Signifikanzniveau von 0,05 nicht abgelehnt.

Das folgende Histogramm, in SPSS erstellt, zeigt die Verteilung der logarithmierten Daten.

 

Unabhängigkeitstest

Siehe auch: Vierfeldertest

Man betrachtet zwei statistische Merkmale x und y, die beliebig skaliert sein können. Man interessiert sich dafür, ob die Merkmale stochastisch unabhängig sind. Es wird die Nullhypothese

Ho: Das Merkmal x ist vom Merkmal y stochastisch unabhängig.

aufgestellt.

Vorgehensweise

Die Beobachtungen von x liegen in m vielen Kategorien j (j = 1, ..., m) vor, die des Merkmals y in r vielen Kategorien k (k=1, ..., r) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise zu Klassen j zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Es gibt insgesamt n viele paarweise Beobachtungen von x und y, die sich auf m×r Kategorien verteilen.

Konzeptionell ist der Test so aufzufassen:

Man betrachte zwei diskrete Zufallsvariablen X und Y, deren gemeinsame Wahrscheinlichkeiten in einer Wahrscheinlichkeitstabelle dargestellt werden können.


Man zählt nun, wie oft die j-te Ausprägung von X zusammen mit der k-ten Ausprägung von Y auftritt. Die beobachteten gemeinsamen absoluten Häufigkeiten njk können in einer zweidimensionalen Häufigkeitstabelle mit m Zeilen und r Spalten eingetragen werden.

Merkmal y Σ
Merkmal x 1 2 ... k ... r nj.
1 n11 n12 ... n1k ... n1r n1.
2 n21 n22 ... n2k ... n2r n2.
... ... ... ... ... ... ... ...
j ... ... ... njk ... ... ...
... ... ... ... ... ... ... ...
m nm1 nm2 ... nmk ... nmr nm.
Σ n.1 n.2 ... n.k ... n.r n


Die Zeilen- bzw. Spaltensummen ergeben die absoluten Randhäufigkeiten nj. bzw. n.k als

  und  : .

Entsprechend sind die gemeinsamen relative Häufigkeiten pjk = njk/n und die relativen Randhäufigkeiten pj. = nj./n und p.k = n.k/n.

Wahrscheinlichkeitstheoretisch gilt: Sind zwei Ereignisse A und B stochastisch unabhängig, ist die Wahrscheinlichkeit für ihr gemeinsames Auftreten gleich dem Produkt der Einzelwahrscheinlichkeiten:

 


Man überlegt sich nun, dass analog zu oben bei stochastischer Unabhängigkeit von x und y auch gelten müsste

  ,

mit n multipliziert entsprechend

  oder auch
 .

Sind diese Differenzen für sämtliche j,k klein, kann man vermuten, dass x und y tatsächlich stochastisch unabhängig sind.

Setzt man für die erwartete Häufigkeit bei Vorliegen von Unabängigkeit

 

resultiert aus der obigen Überlegung die Prüfgröße für den Unabhängigkeitstest

  .

Die Prüfgröße χ2 ist bei ausreichend großen erwarteten Häufigkeiten njk* annähernd χ2-verteilt mit (m-1)(r-1) Freiheitsgraden.

Wenn die Prüfgröße klein ist, wird vermutet, dass die Hypothese wahr ist. Also wird Ho bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für Ho liegt rechts.

Bei einem Signifikanzniveau α wird Ho abgelehnt, wenn χ2 > χ2(1-α; (m-1)(r-1)), dem (1-α)-Quantil der χ2-Verteilung mit (m-1)(r-1) Freiheitsgraden ist.

Besonderheiten

Damit die Prüfgröße als annähernd χ2-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit njk* mindestens 5 betragen. Wird dieser Wert nicht erreicht, sollten gegebenenfalls mehrere Klassen zu einer neuen zusammengefasst werden.


Beispiel zu Unabhängigkeitstest

Im Rahmen des Qualitätsmangements wurden die Kunden einer Bank befragt, unter anderem nach ihrer Zufriedenheit mit der Geschäftsabwicklung und nach der Gesamtzufriedenheit. Der Grad der Zufriedenheit richtete sich nach dem Schulnotensystem.

Die Daten wurden in SPSS verarbeitet. Es ergab sich die unten folgende Kreuztabelle der Gesamtzufriedenheit von Bankkunden versus ihrer Zufriedenheit mit der Geschäftsabwicklung. Man sieht, dass einige erwartete Häufigkeiten zu klein waren.

 

Eine Reduzierung der Kategorien auf jeweils drei ergab methodisch korrekte Ergebnisse.

 

Die folgende Tabelle enthält die erwarteten Häufigkeiten njk*, die sich so berechnen:

 
Merkmal y
Merkmal x 1 2 3 Σ
1 44,35 44,84 12,81 102
2 156,09 157,82 45,09 359
3 69,57 70,34 20,10 160
Σ 270 273 78 621

Die Prüfgröße wird dann folgendermaßen ermittelt:

 

Bei einem α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ2(0,95;4) = 9,488. Da χ2 > 9,488 ist, wird die Hypothese abgelehnt, man vermutet also, dass die Gesamtzufriedenheit von der Zufriedenheit mit der Geschäftsabwicklung beeinflusst wurde.

Siehe auch

VierfeldertestFischer-Test