Mit dem χ2-Test (Chi-Quadrat-Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit.
Man unterscheidet vor allem die beiden Tests:
- Verteilungstest oder Anpassungstest
- Unabhängigkeitstest
Verteilungstest
Man betrachtet ein statistisches Merkmal x, dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind. Es wird bezüglich der Wahrscheinlichkeiten von x eine, vorläufig allgemein formulierte Nullhypothese
- Ho: Das Merkmal x hat die Wahrscheinlichkeitsverteilung Fo(x)
aufgestellt.
Vorgehensweise
Die n Beobachtungen von x liegen in m verschiedenen Kategorien j (j = 1, ..., m) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise zu Klassen j zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Die Zahl der Beobachtungen in einer Kategorie ist die beobachtete Häufigkeit nj.
Man überlegt sich nun, wieviele Beobachtungen im Mittel in einer Kategorie liegen müssten, wenn x tatsächlich die hypothetische Verteilung hat. Dazu berechnet man zunächst die Wahrscheinlichkeit Fo(x)j, dass x in diese Kategorie fällt.
ist die unter Ho zu erwartende Häufigkeit.
Die Prüfgröße für den Test ist
- .
Die Prüfgröße χ2 ist bei ausreichend großen nj annähernd χ2-verteilt mit m-1 Freiheitsgraden.
Wenn die Nullhypothese wahr ist, sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Häufigkeit klein sein. Also wird Ho bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für Ho liegt rechts.
Bei einem Signifikanzniveau α wird Ho abgelehnt, wenn χ2 > χ2(1-α; m-1), dem (1-α)-Quantil der χ2-Verteilung mit m-1 Freiheitsgraden ist.
Es existieren Tabellen für die χ2-Schwellenwerte in Abhängigkeit von der Anzahl der Freiheitsgrade und vom gewünschten Signifikanzniveau, z. B. [1] oder (knapper) [2].
Soll die Sicherheitsschwelle (=Signifikanzniveau), die zu einem bestimmten χ2 gehört, bestimmt werden, so muss in der Regel aus der Tabelle ein Zwischenwert berechnet werden. Dazu verwendet man logarithmische Interpolation.
Besonderheiten
Schätzung von Verteilungsparametern
Im allgemeinen gibt man bei der Verteilungshypothese die Parameter der Verteilung an. Kann man diese nicht angeben, müssen sie aus der Stichprobe geschätzt werden. Hier geht bei der χ2-Verteilung pro geschätztem Parameter ein Freiheitsgrad verloren. Sie hat also m-w-1 Freiheitsgrade mit w als Zahl der geschätzten Parameter.
Mindestgröße der erwarteten Häufigkeiten
Damit die Prüfgröße als annähernd χ2-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit mindestens 5 betragen. Sind sie zu klein, sollten gegebenenfalls mehrere Klassen zusammengefasst werden.
Beispiel zu Anpassungstest
Es liegen von ca. 200 börsennotierten Unternehmen die Umsätze vor. Das folgende Histogramm, in SPSS erstellt, zeigt ihre Verteilung.
Es sei x: Umsatz eines Unternehmens [Mio €].
Es soll nun die Hypothese getestet werden, dass x normalverteilt ist.
Da die Daten in vielen verschiedenen Ausprägungen vorliegen, wurden sie in Klassen eingeteilt. Es ergab sich die Tabelle:
Klasse | Intervall | Beobachtete Häufigkeit | |
j | über | bis | nj |
1 | ... | 0 | 0 |
2 | 0 | 5000 | 148 |
3 | 5000 | 10000 | 17 |
4 | 10000 | 15000 | 5 |
5 | 15000 | 20000 | 8 |
6 | 20000 | 25000 | 4 |
7 | 25000 | 30000 | 3 |
8 | 30000 | 35000 | 3 |
9 | 35000 | ... | 9 |
Summe | 197 |
Da keine Parameter vorgegeben werden, werden sie aus der Stichprobe ermittelt. Es sind geschätzt
und
Es wird getestet:
- Ho: X ist normalverteilt mit dem Erwartungswert μ = 6892 und der Varianz σ2 = 149842.
Um die erwarteten Häufigkeiten zu bestimmen, werden zunächst die Wahrscheinlichkeit berechnet, dass X in die vorgegebenen Klassen fällt. Es sei Φ(x|6892;149842) die Verteilungsfunktion der oben angegebenen Normalverteilung an der Stelle x. Man errechnet dann
- ...
Daraus ergeben sich die erwarteten Häufigkeiten
- ...
Es müssten also beispielsweise ca 25 Unternehmen im Mittel einen Umsatz zwischen 0 und 5000 € haben, wenn das Merkmal Umsatz tatsächlich normalverteilt ist.
Die erwarteten Häufigkeiten sind zusammen mit den beobachteten Häufigkeiten in der folgenden Tabelle aufgeführt.
Klasse | Intervall | Beobachtete Häufigkeit | Wahrscheinlichkeit | Erwartete Häufigkeit | |
j | über | bis | nj | Fjo | njo |
1 | ... | 0 | 0 | 0,3228 | 63,59 |
2 | 0 | 5000 | 148 | 0,1270 | 25,02 |
3 | 5000 | 10000 | 17 | 0,1324 | 26,08 |
4 | 10000 | 15000 | 5 | 0,1236 | 24,35 |
5 | 15000 | 20000 | 8 | 0,1034 | 20,36 |
6 | 20000 | 25000 | 4 | 0,0774 | 15,25 |
7 | 25000 | 30000 | 3 | 0,0519 | 10,23 |
8 | 30000 | 35000 | 3 | 0,0312 | 6,14 |
9 | 35000 | ... | 9 | 0,0303 | 5,98 |
Summe | 197 | 1,0000 | 197,00 |
Die Prüfgröße wird jetzt folgendermaßen ermittelt:
Bei einem Signifikanzniveau α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ2(0,95;9-2=7) = 14,07. Da χ2 > 14,07 ist, wird die Hypothese abgelehnt. Man kann davon ausgehen, dass das Merkmal Umsatz nicht normalverteilt ist.
Ergänzung
Die Daten wurden logarithmiert. Ein Normalverteilungstest dieser Daten wurde bei einem Signifikanzniveau von 0,05 nicht abgelehnt.
Das folgende Histogramm, in SPSS erstellt, zeigt die Verteilung der logarithmierten Daten.
Unabhängigkeitstest
Siehe auch: Vierfeldertest
Man betrachtet zwei statistische Merkmale x und y, die beliebig skaliert sein können. Man interessiert sich dafür, ob die Merkmale stochastisch unabhängig sind. Es wird die Nullhypothese
- Ho: Das Merkmal x ist vom Merkmal y stochastisch unabhängig.
aufgestellt.
Vorgehensweise
Die Beobachtungen von x liegen in m vielen Kategorien j (j = 1, ..., m) vor, die des Merkmals y in r vielen Kategorien k (k=1, ..., r) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise zu Klassen j zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Es gibt insgesamt n viele paarweise Beobachtungen von x und y, die sich auf m×r Kategorien verteilen.
Konzeptionell ist der Test so aufzufassen:
Man betrachte zwei diskrete Zufallsvariablen X und Y, deren gemeinsame Wahrscheinlichkeiten in einer Wahrscheinlichkeitstabelle dargestellt werden können.
Man zählt nun, wie oft die j-te Ausprägung von X zusammen mit der k-ten Ausprägung von Y auftritt. Die beobachteten gemeinsamen absoluten Häufigkeiten njk können in einer zweidimensionalen Häufigkeitstabelle mit m Zeilen und r Spalten eingetragen werden.
Merkmal y | Σ | ||||||
Merkmal x | 1 | 2 | ... | k | ... | r | nj. |
1 | n11 | n12 | ... | n1k | ... | n1r | n1. |
2 | n21 | n22 | ... | n2k | ... | n2r | n2. |
... | ... | ... | ... | ... | ... | ... | ... |
j | ... | ... | ... | njk | ... | ... | ... |
... | ... | ... | ... | ... | ... | ... | ... |
m | nm1 | nm2 | ... | nmk | ... | nmr | nm. |
Σ | n.1 | n.2 | ... | n.k | ... | n.r | n |
Die Zeilen- bzw. Spaltensummen ergeben die absoluten Randhäufigkeiten nj. bzw. n.k als
- und : .
Entsprechend sind die gemeinsamen relative Häufigkeiten pjk = njk/n und die relativen Randhäufigkeiten pj. = nj./n und p.k = n.k/n.
Wahrscheinlichkeitstheoretisch gilt: Sind zwei Ereignisse A und B stochastisch unabhängig, ist die Wahrscheinlichkeit für ihr gemeinsames Auftreten gleich dem Produkt der Einzelwahrscheinlichkeiten:
Man überlegt sich nun, dass analog zu oben bei stochastischer Unabhängigkeit von x und y auch gelten müsste
- ,
mit n multipliziert entsprechend
- oder auch
- .
Sind diese Differenzen für sämtliche j,k klein, kann man vermuten, dass x und y tatsächlich stochastisch unabhängig sind.
Setzt man für die erwartete Häufigkeit bei Vorliegen von Unabängigkeit
resultiert aus der obigen Überlegung die Prüfgröße für den Unabhängigkeitstest
- .
Die Prüfgröße χ2 ist bei ausreichend großen erwarteten Häufigkeiten njk* annähernd χ2-verteilt mit (m-1)(r-1) Freiheitsgraden.
Wenn die Prüfgröße klein ist, wird vermutet, dass die Hypothese wahr ist. Also wird Ho bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für Ho liegt rechts.
Bei einem Signifikanzniveau α wird Ho abgelehnt, wenn χ2 > χ2(1-α; (m-1)(r-1)), dem (1-α)-Quantil der χ2-Verteilung mit (m-1)(r-1) Freiheitsgraden ist.
Besonderheiten
Damit die Prüfgröße als annähernd χ2-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit njk* mindestens 5 betragen. Wird dieser Wert nicht erreicht, sollten gegebenenfalls mehrere Klassen zu einer neuen zusammengefasst werden.
Beispiel zu Unabhängigkeitstest
Im Rahmen des Qualitätsmangements wurden die Kunden einer Bank befragt, unter anderem nach ihrer Zufriedenheit mit der Geschäftsabwicklung und nach der Gesamtzufriedenheit. Der Grad der Zufriedenheit richtete sich nach dem Schulnotensystem.
Die Daten wurden in SPSS verarbeitet. Es ergab sich die unten folgende Kreuztabelle der Gesamtzufriedenheit von Bankkunden versus ihrer Zufriedenheit mit der Geschäftsabwicklung. Man sieht, dass einige erwartete Häufigkeiten zu klein waren.
Eine Reduzierung der Kategorien auf jeweils drei ergab methodisch korrekte Ergebnisse.
Die folgende Tabelle enthält die erwarteten Häufigkeiten njk*, die sich so berechnen:
Merkmal y | ||||
Merkmal x | 1 | 2 | 3 | Σ |
1 | 44,35 | 44,84 | 12,81 | 102 |
2 | 156,09 | 157,82 | 45,09 | 359 |
3 | 69,57 | 70,34 | 20,10 | 160 |
Σ | 270 | 273 | 78 | 621 |
Die Prüfgröße wird dann folgendermaßen ermittelt:
Bei einem α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ2(0,95;4) = 9,488. Da χ2 > 9,488 ist, wird die Hypothese abgelehnt, man vermutet also, dass die Gesamtzufriedenheit von der Zufriedenheit mit der Geschäftsabwicklung beeinflusst wurde.