Wahrscheinlichkeitsverteilung
In der Wahrscheinlichkeitstheorie ist die Wahrscheinlichkeitsverteilung die Zuordnung von Wahrscheinlichkeiten zu Ereignissen. Die Wahrscheinlichkeitsverteilung einer reellwertigen Zufallsvariable gibt für jede (Borel-)Menge von reellen Zahlen an, mit welcher Wahrscheinlichkeit die Zufallsvariable Werte in annimmt. Die meisten in der Praxis vorkommenden Verteilungen werden entweder durch eine Wahrscheinlichkeitsfunktion (im diskreten Fall) oder durch eine Wahrscheinlichkeitsdichte beschrieben.
Alternativ kann eine Verteilung in den reellen Zahlen durch die (kumulative) Verteilungsfunktion Fehler beim Parsen (Syntaxfehler): {\displaystyle x\mapsto F(x) = P(X ≤ x)} beschrieben werden, die angibt, mit welcher Wahrscheinlichkeit die Zufallsvariable einen Wert kleiner oder gleich annimmt. (In der Regel spricht man einfach von einer Verteilungsfunktion. Die explizite Kennzeichnung als kumulativ kann helfen, Verwechslungen mit der Wahrscheinlichkeitsfunktion oder -dichte zu vermeiden.)
Definitionen
Mathematisch ist eine Wahrscheinlichkeitsverteilung definiert als ein Wahrscheinlichkeitsmaß. Die Verteilung einer Zufallsvariable von einem Wahrscheinlichkeitsraum in einen Messraum ist das Bildmaß
- .
Wahrscheinlichkeitsverteilung diskreter Zufallsvariablen
Eine diskrete Zufallsvariable nimmt endlich oder abzählbar unendlich viele Werte an. Jedem dieser Werte kann eine Wahrscheinlichkeit zugeordnet werden, mit der die Zufallsvariable diesen Wert annimmt. Die Wahrscheinlichkeitsverteilung ist dann durch
gegeben.
Die Wahrscheinlichkeitsfunktion ist mathematisch gesehen die Dichte der Verteilung von bezüglich des Zählmaßes auf der Menge der möglichen Werte. Sie wird daher auch als Zähldichte bezeichnet.
Die (kumulative) Verteilungsfunktion berechnet sich zu
- ,
wobei der Index der Summe alle Zahlen 1, 2, ... durchläuft, für die xi ≤ x ist.
Beispiel
Die Zufallsvariable sei das Ergebnis beim Würfeln.
Die Verteilung von ist gegeben durch die Wahrscheinlichkeitsfunktion
Die Wahrscheinlichkeit, eine Sechs zu würfeln, ist .
Die Wahrscheinlichkeit, höchstens eine Drei zu würfeln, lässt sich aus der Verteilungsfunktion ablesen:
Stetige Verteilungen, Dichten
Im nicht diskreten Fall ist die Verteilung einer rellen Zufallsvariablen durch die Wahrscheinlichkeiten allein noch nicht festgelegt, diese können alle 0 sein. Daher gibt man nicht an, mit welcher Wahrscheinlichkeit einen bestimmten Wert annimmt, sondern mit welcher Wahrscheinlichkeit in ein bestimmtes Intervall fällt. Beispielsweise fragt man nicht, wie viele Personen "genau" 1,75 Meter groß sind (d.h. 1,750000...), sondern, wie viele Personen eine Größe von 1,749 bis 1,751 haben.
Mit einem nach unten unendlichen Intervall erhält man die Verteilungsfunktion. Eine Zufallsvariable X heißt genau dann stetig verteilt oder kontinuierlich verteilt, wenn die dazugehörige Verteilungsfunktion stetig ist.
Auch für stetige Verteilungen lassen sich Momente angeben, die wichtigsten sind der Erwartungswert und die Varianz.
Stetige Verteilungen lassen sich in vielen Fällen durch Dichten beschreiben:
Eine integrierbare Funktion f heißt (Wahrscheinlichkeits-)Dichte oder Dichtefunktion der Zufallsvariable X, wenn
beziehungsweise
wobei B eine beliebige Borel-Menge ist.
Mathematisch gesehen ist die Funktion somit eine Dichte der Verteilung von bezüglich des Lebesgue-Maßes. Eine solche Dichte existiert genau dann, wenn
für jede Borel-Nullmenge N (Satz von Radon-Nikodym).
Die Stetigkeit der Verteilungsfunktion bzw. die Eigenschaft für alle x ist hierfür notwendig, aber nicht hinreichend. Beispielsweise hat eine unendliche Dezimalzahl zwischen 0 und 1, deren Ziffern durch einen Würfel bestimmt werden (etwa 0,5364142...), eine stetige Verteilungsfunktion, aber keine Dichte, da die Ziffern 7, 8, 9, 0 nicht vorkommen (vgl. Cantor-Menge).
Wenn die Zufallsvariable eine stetige Dichte f besitzt, dann ist diese eindeutig bestimmt und entspricht grob gesprochen der Ableitung der Verteilungsfunktion F:
- .
Genauer sei Dann ist für alle und sonst :.
Jede nichtnegative, integrierbare Funktion f, die die Eigenschaft
erfüllt, definiert durch obige Identität eine Zufallsvariable X.
Der Begriff der Verteilungsfunktion kann auch auf mehrdimensionale Zufallsvariablen, d.h. Zufallsvariablen, die Vektorwerte annehmen, erweitert werden: Hier ist in der Notation F(x) = P(X≤x) das x ein Vektor und das "≤"-Zeichen komponentenweise zu lesen. F ist also hierbei eine Abbildung von in das Intervall [0,1].
Wenn eine differenzierbare Funktion ist, entsteht die Dichte durch partielle Differentiation:
dann erfüllt f die Identität
Rechnen mit Verteilungsfunktionen
Ist von einer Zufallsvariablen die Verteilungsfunktion bekannt, so kann man die Wahrscheinlichkeit berechnen, mit der die Zufallsvariable Werte zwischen zwei reellen Zahlen annimmt:
- P(a<X≤b) = P(X≤b) - P(X≤a) = F(b) - F(a)
Beispiel
Beim Würfeln errechnet sich die Wahrscheinlichkeit eine Zahl zwischen 3 und 5 einschließlich zu würfeln zu
- .
Wichtige Verteilungen
siehe auch: Alpha-stabile Verteilungen
Diskrete Verteilungen
- Diskrete Gleichverteilung
- Binomialverteilung (Bernoulli-Verteilung)
- Poisson-Verteilung
- Geometrische Verteilung
- negative Binomialverteilung
- Hypergeometrische Verteilung
- Zipf-Verteilung
Siehe auch: Näherungslösungen
Kontinuierliche Verteilungen
Über einem endlichen Intervall [a,b], im einfachsten Fall [0,1]:
- Stetige Gleichverteilung (Rechteckverteilung)
- Dreiecksverteilung (Simpson-Verteilung)
- Betaverteilung
Über einem halbseitig unendlichen Intervall, üblicherweise als [0,∞) angenommen:
- Exponentialverteilung
- Pareto-Verteilung
- Gammaverteilung
- logarithmische Normalverteilung (Log-Normalverteilung)
- χ²-Verteilung
- F-Verteilung
- Weibull-Verteilung
- Erlang-Verteilung für x aus (0,∞)
Über der ganzen Zahlengeraden:
- Fishersche z-Verteilung
- Laplace-Verteilung (Doppelexponentialverteilung)
- Normalverteilung (Gauß-Verteilung, Glockenkurve)
- Students t-Verteilung (Student-Verteilung, t-Verteilung)
- Cauchy-Verteilung
- Logistische Verteilung
- Lévy-Verteilung
Siehe auch
Der Wahrscheinlichkeitsverteilung entspricht in der deskriptiven Statistik die Häufigkeitsverteilung.
Für konvexe Kombinationen mehrerer Verteilungen siehe Mischverteilung.
Literatur
- Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. Vandenhoeck & Ruprecht, Göttingen 1974, ISBN 3525031149
Weblinks
Verfügbarkeit in numerischen Bibliotheken
- Katalog der Wahrscheinlichkeitsverteilungen in der Gnu Scientific Library.