Zum Inhalt springen

Zweistichproben-t-Test

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 1. März 2010 um 20:11 Uhr durch 84.57.116.222 (Diskussion) (Kleines "z", da z-Wert. Großes "z" würde für einen Fisher-Z-Wert stehen.). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Der t-Test ist ein Begriff aus der mathematischen Statistik, er bezeichnet eine Gruppe von Hypothesentests. Den t-Test im eigentlichen Sinn gibt es nicht. Es handelt sich hier lediglich um einen beliebigen Hypothesentest mit t-verteilter Testprüfgröße.

Oft ist jedoch mit dem t-Test der Einstichproben- bzw. Zweistichproben t-Test gemeint:

  • Der Einstichproben t-Test prüft anhand des Mittelwertes einer Stichprobe, ob der Erwartungswert einer Grundgesamtheit gleich, kleiner oder größer einem vorgegebenem Wert ist.
  • Der Zweistichproben t-Test prüft anhand der Mittelwerte zweier Stichproben, ob die Erwartungswerte zweier Grundgesamtheiten gleich, kleiner oder größer sind.

Weitere wichtige Tests mit t-verteilter Prüfgröße sind:

Der t-Test ist ein Spezialfall des Wald-Tests.

Einstichproben t-Test

Grundidee für den t-Test über den Erwartungswert einer normalverteilten Grundgesamtheit

Sind unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ und Standardabweichung σ, und möchte man die Nullhypothese testen, dann liegt es nahe, ihr arithmetisches Mittel

als Teststatistik zu benutzen. Es ist namentlich ebenfalls normalverteilt mit Erwartungswert μ, hat aber die Standardabweichung σ/√n. Bei bekanntem σ könnte die Hypothese mit einem Gauß-Test getestet werden. Dazu berechnet man

,

welche unter der Nullhypothese standardnormal verteilt ist.

Normalerweise ist jedoch die Standardabweichung unbekannt. In diesem Fall liegt es nahe, sie durch die empirische Standardabweichung

zu schätzen und als Teststatistik

zu verwenden. Dieser Statistik ist unter der Nullhypothese allerdings nicht mehr normalverteilt, sondern t-verteilt mit n−1 Freiheitsgraden. Ist der Wert der Teststatistik für eine konkrete Stichprobe so groß (oder so klein), dass dieser oder ein noch extremerer Wert unter der Nullhypothese hinreichend unwahrscheinlich ist, wird die Nullhypothese abgelehnt.

Grundidee für den t-Test über den Erwartungswert einer beliebig verteilten Grundgesamtheit

Sind () unabhängige beliebig verteilte Zufallsvariablen mit Erwartungswert und Standardabweichung , dann ist aufgrund des zentralen Grenzwertsatzes ihr arithmetisches Mittel ebenfalls approximativ normalverteilt mit Erwartungswert und hat die Standardabweichung . Mit der gleichen Argumentation wie zuvor gelangt man zu einer t-verteilten Teststatistik.

Vorgehen

Für eine Stichprobe aus einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert und unbekannter Standardabweichung soll die Nullhypothese (mit einem festen vermuteten Wert ) gegen die zweiseitige Alternative getestet werden. Dazu wird mit dem Stichprobenmittelwert und der Stichprobenstandardabweichung die Testprüfgröße berechnet. Die Nullhypothese wird zum Signifikanzniveau abgelehnt, falls ist, dem -Quantil der t-Verteilung mit Freiheitsgraden.

Die Prüfgröße kann auch zum Testen der einseitigen Alternative gegen die Nullhypothese zum Signifikanzniveau verwendet werden. Diese wird nun abgelehnt, wenn gilt. Analog wird die Nullhypothese abgelehnt, wenn ist.

Beispiel 1

Es soll getestet werden, ob die durchschnittliche Laufzeit von Notebook-Akkus tatsächlich mindestens 3,5 Stunden beträgt, wie vom Hersteller behauptet. Dazu werden bei 10 Akkus dieser Marke unter kontrollierten gleichen Bedingungen die Laufzeiten gemessen. Es ergibt sich ein empirischer Mittelwert von 3,25 Stunden mit einer Standardabweichung von 0,31 Stunden. Daraus berechnet sich als Prüfgröße ein t-Wert von . Für das 0,95-Quantil der t-Verteilung mit Freiheitsgraden findet man mit Hilfe einer t-Tabelle oder eines Computerprogramms den Wert . Wegen kann die Nullhypothese, dass der Erwartungswert der Laufzeit größer oder gleich 3,5 Stunden ist, zum Signifikanzniveau abgelehnt werden. Die Akkus erreichen also nicht die behaupteten Laufzeiten.

Kompaktdarstellung

Einstichproben t-Test
Voraussetzungen
  • unabhängig voneinander
  • oder mit
Hypothesen

(rechtsseitig)


(zweiseitig)


(linksseitig)
Teststatistik
Prüfwert mit und
Ablehnungsbereich

Zweistichproben t-Test

Aus der Theorie der multivariaten Normalverteilung folgt, dass die Differenz zweier normal verteilter (oder approximativ normalverteilter) Zufallsvariablen wieder normalverteilt ist. Damit kann der Zweistichproben t-Test auf den Einstichproben t-Test zurückgeführt werden mit :

Die obigen Hypothesen können als Spezialfall mit der allgemeinen Hypothesen gesehen werden:


Das Problem ist die Schätzung der Varianz von unter Gültigkeit der Nullhypothese zur Bestimmung der Verteilung der Teststatistik:

  • Sind die Grundgesamtheiten abhängig voneinander, dann muss der t-Test für gepaarte Stichproben durchgeführt werden.
  • Sind die Grundgesamtheiten unabhängig voneinander und
    • sind die Varianzen in den Grundgesamtheiten gleich, dann muss der t-Test für zwei unabhängige Stichproben durchgeführt werden und
    • sind die Varianzen in den Grundgesamtheiten ungleich, dann muss der Welch-Test durchgeführt werden.

Die drei Tests unterscheiden sich im wesentlichen dadurch, wie die Varianz von geschätzt wird. Dies beeinflusst auch die Zahl der Freiheitsgrade für die t-Verteilung der Teststatistik.

t-Tests für gepaarte Stichproben

Hier sind und zwei paarweise verbundene Stichproben, die beispielsweise aus zwei Messungen an denselben Untersuchungseinheiten gewonnen wurden (Messwiederholung). Die Stichproben können auch aus anderen Gründen paarweise abhängig sein, beispielsweise wenn die - und -Werte Messergebnisse von Frauen bzw. Männern in einer Partnerschaft sind und Unterschiede zwischen den Geschlechtern interessieren.

Soll die Nullhypothese getestet werden, dass die beiden Erwartungswerte der zugrunde liegenden normalverteilten Grundgesamtheiten gleich sind, so können mit dem oben beschriebenen Einstichproben-t-Test die Differenzen auf den Erwartungswert  getestet werden. In der Praxis muss nach J. Bortz bei kleineren Stichprobenumfängen die Voraussetzung erfüllt sein, dass die Differenzen in der Grundgesamtheit normalverteilt sind. Bei hinreichend großen Stichproben verteilen sich die Differenzen der Paare annähernd normal um das arithmetische Mittel der Differenz der Grundgesamtheit. Insgesamt reagiert der t-Test auf Annahmeverletzung eher robust.[1]


Beispiel 2

Um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, werden bei zehn Probanden vor und nach der Behandlung die Cholesterinwerte bestimmt. Es ergeben sich die folgenden Messergebnisse:

Vor der Behandlung: 223 259 248 220 287 191 229 270 245 201
Nach der Behandlung: 220 244 243 211 299 170 210 276 252 189
Differenz: 3 15 5 9 -12 21 19 -6 -7 12

Die Differenzen der Messwerte haben das arithmetische Mittel und die Stichprobenstandardabweichung . Das ergibt als Prüfgrößenwert

.

Es ist , also gilt . Somit kann die Nullhypothese, dass die Erwartungswerte der Cholesterinwerte vor und nach der Behandlung gleich sind, die Therapie also keine Wirkung hat, zum Signifikanzniveau nicht abgelehnt werden. Wegen ist auch die einseitige Alternative, dass die Therapie den Cholesterinspiegel senkt, nicht signifikant. Wenn die Behandlung überhaupt einen Effekt hat, so ist dieser nicht groß genug, um ihn mit einem so kleinen Stichprobenumfang zu entdecken.

Kompaktdarstellung

Zweistichproben t-Test für zwei gepaarte Stichproben
Voraussetzungen
  • unabhängig voneinander
  • (zumindest approximativ)
Hypothesen

(rechtsseitig)


(zweiseitig)


(linksseitig)
Teststatistik
Prüfwert
mit , ,
und
Ablehnungsbereich

t-Tests für zwei unabhängige Stichproben

Gegeben sind nun zwei unabhängige Stichproben und jeweils aus normalverteilten Grundgesamtheiten mit den Erwartungswerten bzw. und unbekannter, aber gleicher Standardabweichung . Es soll die Nullhypothese gegen die zweiseitige Alternative getestet werden. Dazu wird mit den Stichprobenmittelwerten , , den Stichprobenvarianzen und der sogenannten gewichteten Varianz

die Prüfgröße

berechnet. (Bei gleich großen Stichproben, also , vereinfacht sich diese Formel zu ). Die Prüfgröße ist t-verteilt mit Freiheitsgraden, also wird zum Signifikanzniveau abgelehnt, wenn gilt. Es können auch wieder einseitige Hypothesen getestet werden: Zum Beispiel wird die Nullhypothese zugunsten der Alternative abgelehnt, wenn gilt.

Beispiel 3

Zwei Düngemittelsorten sollen verglichen werden. Dazu werden 10 Parzellen mit Sorte A und 15 Parzellen mit Sorte B gedüngt. Bei ersteren ergibt sich ein mittlerer Ernteertrag mit Stichprobenvarianz und bei den anderen Parzellen das Mittel mit Varianz . Für die gewichtete Varianz berechnet man damit

.

Daraus erhält man die Prüfgröße

.

Dieser Wert ist größer als das 0,975-Quantil der t-Verteilung mit Freiheitsgraden . Es kann also mit einer Konfidenz von behauptet werden, dass ein Unterschied in der Wirkung der beiden Düngemittel besteht. Wegen ist Sorte A besser.

Kompaktdarstellung

Zweistichproben t-Test für zwei unabhängige Stichproben
Voraussetzungen
  • und unabhängig voneinander
  • oder mit
  • oder mit
  • unbekannt
Hypothesen

(rechtsseitig)


(zweiseitig)


(linksseitig)
Teststatistik
Prüfwert
mit , ,
,


und

Ablehnungsbereich
oder

Testen der Voraussetzungen und Alternativen zum t-Test

Der t-Test wird, wie oben ausgeführt, zum Testen von Hypothesen über Erwartungswerte einer oder zweier Stichproben aus normalverteilten Grundgesamtheiten mit unbekannter Standardabweichung verwendet.

Einzelnachweise

  1. Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage, Springer, Berlin 2005, ISBN 3-540-21271-X, S. 142.