Zum Inhalt springen

Konfidenzintervall

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 2. Juni 2004 um 13:48 Uhr durch 194.95.60.65 (Diskussion) (Grafik eingefügt - s. Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Mit einem Konfidenzintervall kann man in der mathematischen Statistik die Lage eines Parameters mit einer bestimmten Wahrscheinlichkeit abschätzen.

Beschreibung des Verfahrens

Man interessiert sich für den unbekannten Verteilungsparameter einer Zufallsvariablen. Der „wahre“ Parameter Γ wird durch eine Schätzfunktion g aus einer Stichprobe vom Umfang n geschätzt. Es wird davon ausgegangen, dass die Stichprobe in etwa die Grundgesamtheit wiederspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter Γ enthält.

Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, in das die Zufallsvariable g mit einer Wahrscheinlichkeit 1−α fällt. 1−α wird Konfidenzkoeffizient genannt.

Das Verfahren wird anhand eines mit dem Erwartungswert μ und der Varianz σ2 normalverteilten Merkmals demonstriert: Es soll der Erwartungswert μ dieser Normalverteilung geschätzt werden. Verwendet wird die Schätzfunktion

wobei die Zufallsvariable Xi (i=1,...,n) für die i-te Beobachtung sorgt. Es ist

Die Grenzen des Intervalls

in dem mit der Wahrscheinlichkeit 1−α liegt, bestimmen sich aus der Beziehung

Normalverteilung des Mittels

Normalvertielung von Xquer


Man standardisiert und erhält für die standardisierte Zufallsvariable

die Wahrscheinlichkeit

wobei z(α/2) das (α/2)-Quantil der Standardnormalverteilung ist. Löst man nach μ auf, resultiert aus dem Zufallsintervall

das (1−α)-Konfidenzintervall für μ

Es liegt also der wahre Parameter μ mit einer Wahrscheinlichkeit von 1−α in dem durch bestimmten Intervall. Ist die Stichprobe aber extrem ausgefallen, liegt der wahre Parameter nicht in dem Intervall. Dies ist in α·100 % aller Stichproben der Fall.

Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein schmales Konfidenzintervall.

Ausgewählte Konfidenzintervalle

Erwartungswert
eines normalverteilten Merkmals
mit bekannter Varianz:
Erwartungswert
eines normalverteilten Merkmals
mit unbekannter Varianz.
Die Varianz der Grundgesamheit wird durch die Stichprobenvarianz



geschätzt.
t(1-α;n-1) ist das 1−α-Quantil der t-Verteilung mit n-1 Freiheitsgraden.
Für n > 30 kann das Quantil der t-Verteilung näherungsweise durch das der Normalverteilung ersetzt werden.

Erwartungswert
eines unbekannt verteilten Merkmals
mit unbekannter Varianz,
falls n>50 ist.
Varianz
eines normalverteilten Merkmals.
χ2(p;k) ist das p-Quantil der >χ2-Verteilung mit k Freiheitsgraden.
Anteilswert einer dichotomen Grundgesamtheit
bei einem Urnenmodell mit Zurücklegen,
falls



ist.

Ist die Zahl N der Elemente in der Grundgesamtheit bekannt, kann auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden. Hier wird die Standardabweichung noch mit einem Korrekturfaktor modifiziert. Wenn der Stichprobenumfang n < 9/(p(1-p)) ist, kann ein exaktes Konfidenzintervall mit Hilfe der F-Verteilung angegeben werden.

Bemerkung

Konfidenzintervalle können gelegentlich auch Hypothesentests ersetzen. Beispielsweise testet man in der Regressionsanalyse, ob im multiplen Regressionsmodell mit der geschätzen Regressionshyperebene

die wahren Regressionskoeffizienten βj (j = 1, ... , m) gleich Null sind. Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj vermutlich für die Erklärung der abhängigen Variablen y unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überstreicht das Konfidenzintervall die Null, kann mit einer Wahrscheinlichkeit von 1-α der Regressionskoeffizient ebenso gut Null sein, d.h. er ist statistisch insignifikant.