Dichten der Chi-Quadrat-Verteilung mit verschiedenen Freiheitsgraden n
Die Chi-Quadrat-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen.
Im allgemeinen ist mit „Chi-Quadrat-Verteilung“ die zentrale Chi-Quadrat-Verteilung gemeint. Ihr einziger Parameter
n
{\displaystyle n}
kann, muss aber nicht, eine natürliche Zahl sein und heißt ihre Zahl der Freiheitsgrade .
Die Chi-Quadrat-Verteilung ist eine so genannte Stichprobenverteilung , die bei der Schätzung von Verteilungsparametern, beispielsweise der Varianz , Anwendung findet.
Man benutzt sie zur Beschreibung der Summe unabhängiger quadrierter standardnormalverteilter Zufallsvariablen .
Definition
Dichte und Verteilung von mehreren Chi-quadrat Verteilten Zufallsgrößen
Die Chi-Quadrat-Verteilung mit n Freiheitsgraden ist die Verteilung der Summe
χ
n
2
=
Z
1
2
+
…
+
Z
n
2
{\displaystyle \chi _{n}^{2}=Z_{1}^{2}+\ldots +Z_{n}^{2}}
n unabhängiger quadrierter standardnormalverteilter Zufallsvariablen , d. h.
Z
k
∼
N
(
0
,
1
)
{\displaystyle Z_{k}\sim {\mathcal {N}}(0,1)}
für
k
=
1
,
…
,
n
{\displaystyle k=1,\dots ,n}
.
Man schreibt:
χ
2
∼
χ
n
2
.
{\displaystyle \chi ^{2}\sim \chi _{n}^{2}.\,}
Dichte
Die Dichte fn der
χ
n
2
{\displaystyle \chi _{n}^{2}}
-Verteilung mit
n
{\displaystyle n}
Freiheitsgraden hat die Form:
f
n
(
x
)
=
{
x
n
2
−
1
e
−
x
2
2
n
2
Γ
(
n
2
)
x
>
0
0
x
≤
0
{\displaystyle f_{n}(x)={\begin{cases}\displaystyle {\frac {x^{{\frac {n}{2}}-1}e^{-{\frac {x}{2}}}}{2^{\frac {n}{2}}\Gamma \left({\frac {n}{2}}\right)}}&x>0\\0&x\leq 0\end{cases}}}
Dabei steht
Γ
(
r
)
{\displaystyle \Gamma (r)}
für die Gammafunktion . Die Werte von
Γ
(
n
2
)
{\displaystyle \Gamma ({\frac {n}{2}})}
kann man berechnen mit
Γ
(
1
2
)
=
π
,
Γ
(
1
)
=
1
,
{\displaystyle \Gamma ({\frac {1}{2}})={\sqrt {\pi }}\;,\quad \Gamma (1)=1\;,}
Γ
(
r
+
1
)
=
r
⋅
Γ
(
r
)
mit
r
∈
R
+
{\displaystyle \Gamma (r+1)=r\cdot \Gamma (r)\;\;{\mbox{mit}}\;r\in \mathbb {R} ^{+}}
.
Verteilungsfunktion
Die Verteilungsfunktion kann man nicht in elementarer Form schreiben, jedoch mit Hilfe der
regularisierten unvollständigen Gammafunktion :
F
n
(
x
)
=
P
(
n
2
,
x
2
)
{\displaystyle F_{n}(x)=P\left({\frac {n}{2}},{\frac {x}{2}}\right)}
Eigenschaften
Erwartungswert
Der Erwartungswert der Chi-Quadrat-Verteilung ist
E
(
X
)
=
n
{\displaystyle \operatorname {E} (X)=n}
.
Varianz
Die Varianz der Chi-Quadrat-Verteilung ist
Var
(
X
)
=
2
n
{\displaystyle \operatorname {Var} (X)=2n}
.
Modus
Der Modus der Chi-Quadrat-Verteilung ist
n
−
2
{\displaystyle n-2}
für
n
≥
2
{\displaystyle n\geq 2}
.
Schiefe
Die Schiefe der Chi-Quadrat-Verteilung ist
v
(
X
)
=
2
2
n
{\displaystyle \operatorname {v} (X)={\frac {2{\sqrt {2}}}{\sqrt {n}}}}
.
Charakteristische Funktion
Die charakteristische Funktion für
X
∼
χ
n
2
{\displaystyle X\sim \chi _{n}^{2}}
hat die Form
φ
X
(
s
)
=
1
(
1
−
2
i
s
)
n
/
2
{\displaystyle \varphi _{X}(s)={\frac {1}{(1-2is)^{n/2}}}}
Summe χ²-verteilter Zufallsvariablen
Sind
X
1
,
X
2
,
.
.
.
,
X
n
{\displaystyle X_{1},X_{2},...,X_{n}}
unabhängige Zufallsvariable, mit
X
i
∼
χ
2
(
ν
i
)
{\displaystyle X_{i}\sim \chi ^{2}(\nu _{i})}
, so gilt:
∑
i
=
1
n
X
i
∼
χ
2
(
∑
i
=
1
n
ν
i
)
{\displaystyle \sum _{i=1}^{n}X_{i}\sim \chi ^{2}(\sum _{i=1}^{n}\nu _{i})}
Die Chi-Quadrat-Verteilung ist also reproduktiv .
Nichtzentrale Chi-Quadrat-Verteilung
Wenn die normalverteilten Zufallsvariablen nicht bezüglich ihres Erwartungswertes
μ
i
(
i
=
1
,
.
.
.
,
n
)
{\displaystyle \mu _{i}(i=1,...,n)}
zentriert sind, erhält man die nichtzentrale Chi-Quadrat-Verteilung. Sie hat als zweiten Parameter neben
n
{\displaystyle n}
den Nichtzentralitätsparameter
λ
>
0
{\displaystyle \lambda >0}
.
Seien
Z
i
∼
N
(
μ
i
,
1
)
,
i
=
1
,
2
,
…
n
{\displaystyle Z_{i}\sim {\mathcal {N}}(\mu _{i},1),\,i=1,2,\ldots n}
, so ist
∑
i
=
1
n
Z
i
2
∼
χ
2
(
n
,
λ
)
{\displaystyle \sum _{i=1}^{n}{Z_{i}}^{2}\sim \chi ^{2}(n,\lambda )}
mit
λ
=
∑
i
=
1
n
μ
i
2
{\displaystyle \lambda =\sum _{i=1}^{n}{\mu _{i}}^{2}}
.
Insbesondere folgt aus
X
∼
χ
2
(
n
−
1
)
{\displaystyle X\sim \chi ^{2}(n-1)}
und
Z
∼
N
(
λ
,
1
)
{\displaystyle Z\sim {\mathcal {N}}({\sqrt {\lambda }},1)}
, dass
X
+
Z
2
∼
χ
2
(
n
,
λ
)
{\displaystyle X+Z^{2}\sim \chi ^{2}(n,\lambda )}
ist.
Eine zweite Möglichkeit, eine nichtzentrale Chi-Quadrat-Verteilung zu erzeugen, ist als Mischverteilung der zentralen Chi-Quadrat-Verteilung. Dabei ist
χ
2
(
n
+
2
j
)
=
χ
2
(
n
,
λ
)
{\displaystyle \chi ^{2}(n+2\,j)=\chi ^{2}(n,\lambda )}
,
wenn
j
∼
P
(
λ
2
)
{\displaystyle j\sim {\mathcal {P}}({\frac {\lambda }{2}})}
aus einer Poisson-Verteilung gezogen wird.
Die Dichtefunktion der nichtzentralen Chi-Quadrat-Verteilung ist
f
(
x
)
=
exp
[
−
1
2
(
x
+
λ
)
]
2
n
2
∑
j
=
0
∞
x
n
2
+
j
−
1
λ
j
2
2
j
Γ
(
n
2
+
j
)
j
!
{\displaystyle f(x)={\frac {\exp {\left[-{\frac {1}{2}}(x+\lambda )\right]}}{2^{\frac {n}{2}}}}\,\sum _{j=0}^{\infty }{\frac {x^{{\frac {n}{2}}+j-1}\lambda ^{j}}{2^{2j}\,\Gamma \left({\frac {n}{2}}+j\right)\,j!}}}
für
x
≥
0
{\displaystyle x\geq 0}
,
f
(
x
)
=
0
{\displaystyle f(x)=0}
für
x
<
0
{\displaystyle x<0}
.
Darstellung durch modifizierte Bessel-Funktion
Die Dichtefunktion kann alternativ auch mit Hilfe der modifizierten Bessel-Funktion erster Gattung
I
q
(
x
)
{\displaystyle I_{q}(x)}
dargestellt werden:
f
(
x
)
=
exp
[
−
1
2
(
x
+
λ
)
]
x
1
2
(
n
−
1
)
λ
2
(
λ
x
)
n
4
I
n
2
−
1
(
λ
x
)
{\displaystyle f(x)={\frac {\exp {\left[-{\frac {1}{2}}(x+\lambda )\right]}x^{{\frac {1}{2}}(n-1)}{\sqrt {\lambda }}}{2(\lambda x)^{\frac {n}{4}}}}\,I_{{\frac {n}{2}}-1}\left({\sqrt {\lambda x}}\right)}
für
x
≥
0
{\displaystyle x\geq 0}
.
Beziehung zu anderen Verteilungen
Beziehung zur Gammaverteilung
Die Chi-Quadrat-Verteilung ist ein Spezialfall der Gammaverteilung . Ist
X
∼
χ
n
2
{\displaystyle X\sim \chi _{n}^{2}}
, so gilt
X
∼
Γ
(
1
2
,
n
2
)
{\displaystyle X\sim \Gamma \left({\frac {1}{2}},{\frac {n}{2}}\right)}
.
Beziehung zur Normalverteilung
Quantile einer Normalverteilung und einer Chi-Quadrat-Verteilung
Die Summe
X
n
=
Z
1
2
+
…
+
Z
n
2
{\displaystyle X_{n}=Z_{1}^{2}+\ldots +Z_{n}^{2}}
von
n
{\displaystyle n}
unabhängigen quadrierten standardnormalverteilten Zufallsvariablen
Z
i
∼
N
(
0
,
1
)
(
i
=
1
,
…
,
n
)
{\displaystyle Z_{i}\sim {\mathcal {N}}(0,1)(i=1,\ldots ,n)}
genügt einer Chi-Quadrat-Verteilung
X
n
∼
χ
n
2
{\displaystyle X_{n}\sim \chi _{n}^{2}}
mit
n
{\displaystyle n}
Freiheitsgraden.
Für
n
≥
30
{\displaystyle n\geq 30}
ist
Y
=
2
X
−
2
n
−
1
{\displaystyle Y={\sqrt {2X}}-{\sqrt {2n-1}}}
näherungsweise standardnormalverteilt.
Für
n
>
100
{\displaystyle n>100}
ist die Zufallsvariable
X
{\displaystyle X}
näherungsweise normalverteilt mit
N
(
μ
=
n
,
σ
=
2
n
)
{\displaystyle {\mathcal {N}}\left(\mu =n,\sigma ={\sqrt {2n}}\right)}
, wobei
μ
{\displaystyle \mu }
bzw.
σ
{\displaystyle \sigma }
Erwartungswert und Standardabweichung darstellen.
Beziehung zur Exponentialverteilung
Eine Chi-Quadrat-Verteilung
χ
2
2
{\displaystyle \chi _{2}^{2}}
mit 2 Freiheitsgraden ist eine Exponentialverteilung
Exp
(
1
/
2
)
{\displaystyle \operatorname {Exp} (1/2)}
mit dem Parameter
λ
=
1
/
2
{\displaystyle \lambda =1/2}
.
Beziehung zur Erlang-Verteilung
Eine Chi-Quadrat-Verteilung mit
2
n
{\displaystyle 2n}
Freiheitsgraden ist identisch mit einer Erlang-Verteilung mit
n
{\displaystyle n}
Freiheitsgraden und
λ
=
1
/
2
{\displaystyle \lambda =1/2}
.
Beziehung zur F-Verteilung
Wenn
Y
1
m
{\displaystyle Y_{1m}\,}
und
Y
2
n
{\displaystyle Y_{2n}\,}
unabhängige
χ
2
{\displaystyle \chi ^{2}\,}
-verteilte Zufallsvariablen mit den Freiheitsgraden m und n sind, dann ist der Quotient
F
m
,
n
=
Y
1
m
/
m
Y
2
n
/
n
{\displaystyle F_{m,n}={\frac {Y_{1m}/m}{Y_{2n}/n}}}
eine Zufallsvariable, die der F-Verteilung mit den Freiheitsgraden (m,n) genügt.
Beziehung zur stetigen Gleichverteilung
Für gerade
n
=
2
m
{\displaystyle n=2m}
kann man die
χ
n
2
{\displaystyle \chi _{n}^{2}}
-Verteilung als m-fache Faltung bilden mit Hilfe der gleichmäßig stetige Dichte
U
(
0
,
1
)
{\displaystyle U(0,1)}
:
χ
n
2
=
−
1
2
ln
(
∏
i
=
1
m
u
i
)
=
−
1
2
∑
i
=
1
m
ln
(
u
i
)
{\displaystyle \chi _{n}^{2}=-{\frac {1}{2}}\ln {\left(\prod _{i=1}^{m}u_{i}\right)}=-{\frac {1}{2}}\sum _{i=1}^{m}\ln(u_{i})}
,
worin die ui m unabhängige gleichmäßig stetig verteilten Zufallsvariablen sind.
Für ungerade
n
{\displaystyle n}
gilt dagegen
χ
n
2
=
χ
n
−
1
2
+
[
N
(
0
,
1
)
]
2
{\displaystyle \chi _{n}^{2}=\chi _{n-1}^{2}+\left[{\mathcal {N}}(0,1)\right]^{2}}
Literatur
Hartung, Joachim / Elpelt, Bärbel / Klösener, Karl-Heinz: Statistik, 12. Auflage, Oldenbourg 1999, S. 152 ff., ISBN 3486249843 .
Weblinks