Konfidenzintervall

In der Statistik ein Intervall, das die Präzision eines Parameters (z. B. eines Mittelwerts) angibt
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 2. Juni 2004 um 13:48 Uhr durch 194.95.60.65 (Diskussion) (Grafik eingefügt - s. Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Mit einem Konfidenzintervall kann man in der mathematischen Statistik die Lage eines Parameters mit einer bestimmten Wahrscheinlichkeit abschätzen.

Beschreibung des Verfahrens

Man interessiert sich für den unbekannten Verteilungsparameter einer Zufallsvariablen. Der „wahre“ Parameter Γ wird durch eine Schätzfunktion g aus einer Stichprobe vom Umfang n geschätzt. Es wird davon ausgegangen, dass die Stichprobe in etwa die Grundgesamtheit wiederspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter Γ enthält.

Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, in das die Zufallsvariable g mit einer Wahrscheinlichkeit 1−α fällt. 1−α wird Konfidenzkoeffizient genannt.

Das Verfahren wird anhand eines mit dem Erwartungswert μ und der Varianz σ2 normalverteilten Merkmals demonstriert: Es soll der Erwartungswert μ dieser Normalverteilung geschätzt werden. Verwendet wird die Schätzfunktion

 

wobei die Zufallsvariable Xi (i=1,...,n) für die i-te Beobachtung sorgt. Es ist

 

Die Grenzen des Intervalls

 

in dem   mit der Wahrscheinlichkeit 1−α liegt, bestimmen sich aus der Beziehung

 

Normalverteilung des Mittels

 


Man standardisiert und erhält für die standardisierte Zufallsvariable

 

die Wahrscheinlichkeit

 

wobei z(α/2) das (α/2)-Quantil der Standardnormalverteilung ist. Löst man nach μ auf, resultiert aus dem Zufallsintervall

 

das (1−α)-Konfidenzintervall für μ

 

Es liegt also der wahre Parameter μ mit einer Wahrscheinlichkeit von 1−α in dem durch   bestimmten Intervall. Ist die Stichprobe aber extrem ausgefallen, liegt der wahre Parameter nicht in dem Intervall. Dies ist in α·100 % aller Stichproben der Fall.

Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein schmales Konfidenzintervall.

Ausgewählte Konfidenzintervalle

Erwartungswert
eines normalverteilten Merkmals
mit bekannter Varianz:
 
Erwartungswert
eines normalverteilten Merkmals
mit unbekannter Varianz.
Die Varianz der Grundgesamheit wird durch die Stichprobenvarianz


 
geschätzt.
t(1-α;n-1) ist das 1−α-Quantil der t-Verteilung mit n-1 Freiheitsgraden.
Für n > 30 kann das Quantil der t-Verteilung näherungsweise durch das der Normalverteilung ersetzt werden.

 
Erwartungswert
eines unbekannt verteilten Merkmals
mit unbekannter Varianz,
falls n>50 ist.
 
Varianz
eines normalverteilten Merkmals.
χ2(p;k) ist das p-Quantil der >χ2-Verteilung mit k Freiheitsgraden.
 
Anteilswert einer dichotomen Grundgesamtheit
bei einem Urnenmodell mit Zurücklegen,
falls


 
ist.

 

Ist die Zahl N der Elemente in der Grundgesamtheit bekannt, kann auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden. Hier wird die Standardabweichung noch mit einem Korrekturfaktor modifiziert. Wenn der Stichprobenumfang n < 9/(p(1-p)) ist, kann ein exaktes Konfidenzintervall mit Hilfe der F-Verteilung angegeben werden.

Bemerkung

Konfidenzintervalle können gelegentlich auch Hypothesentests ersetzen. Beispielsweise testet man in der Regressionsanalyse, ob im multiplen Regressionsmodell mit der geschätzen Regressionshyperebene

 

die wahren Regressionskoeffizienten βj (j = 1, ... , m) gleich Null sind. Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj vermutlich für die Erklärung der abhängigen Variablen y unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überstreicht das Konfidenzintervall die Null, kann mit einer Wahrscheinlichkeit von 1-α der Regressionskoeffizient ebenso gut Null sein, d.h. er ist statistisch insignifikant.