Die Binomialverteilung (manchmal nicht ganz korrekt auch Bernoulli-Verteilung genannt; was das ist, siehe unten) ist eine der wichtigsten diskreten Wahrscheinlichkeitsverteilungen. Sie ist eine Spezialfall der Multinomialverteilung. Sie beschreibt Ergebnisse von Bernoulli-Prozessen.
Ein Bernoulli-Prozess (auch: Bernoulli-Kette) besteht aus einer Abfolge mehrerer, unter gleich bleibenden Bedingungen durchgeführter Bernoulli-Versuche.
Ein Bernoulli-Versuch (auch: Bernoulli-Experiment) ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen. Die Wahrscheinlichkeit dieser Ergebnisse wird durch die Bernoulli-Verteilung beschrieben.
Die negative Binomialverteilung wird in einem eigenen Artikel behandelt.
Bernoulli-Versuch und Bernoulli-Verteilung
Ein Bernoulli-Versuch ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen, die wir im folgenden als Erfolg und Misserfolg bezeichnen werden. Die Wahrscheinlichkeit für einen Erfolg sei p; dann ist die Wahrscheinlichkeit für einen Misserfolg q = 1 - p.
Beispiele:
- Fairer Wurf einer Münze mit p=q=0,5.
- Beim Würfeln wird nur eine "6" als Erfolg gewertet: p=1/6, q=5/6.
Die Bernoulli-Verteilung ist die Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg den Wert 1 und bei Misserfolg den Wert 0 annimmt. Die Fallunterscheidung
kann man durch folgenden geschlossenen Ausdruck ersetzen:
denn es ist
Der Erwartungswert lautet E(X)=p, die Varianz E(X2)-E(X)2=p-p2 = p*(1-p) = pq.
Bernoulli-Prozess und Binomial-Verteilung
Ein Bernoulli-Prozess ist ein zeitlich diskreter stochastischer Prozess, der aus einer endlichen oder abzählbar-unendlichen Folge von Bernoulli-Versuchen besteht. Er kann durch eine Folge von Zufallsvariablen X1, X2, X3,..., beschrieben werden, deren jede mit der konstanten Wahrscheinlichkeit p den Wert X=1 (Erfolg) und mit der Wahrscheinlichkeit q=1-p den Wert X=0 (Misserfolg) annimmt. Eine Veranschaulichung der Zusammenhänge ist z.B. durch das Galtonbrett, ein mechanisches Modell für eine Bernoulli-Kette, möglich.
Je nach Fragestellung interessiert man sich für eine oder mehrere der folgenden Zufallsvariablen:
- Die Anzahl K erfolgreicher Versuche nach Durchführung von insgesamt n Versuchen; sie folgt einer Binomialverteilung.
- Die Anzahl n von Versuchen, die benötigt werden, um eine vorgegebene Anzahl von r Erfolgen zu erzielen; sie folgt der negativen Binomialverteilung.
Beispiele:
- Ein betrunkener Fußgänger (oder ein diffundierendes Teilchen) bewegt sich bei jedem Schritt mit der Wahrscheinlichkeit p vorwärts, mit der Wahrscheinlichkeit q rückwärts. Man interessiert sich für die Entfernung vom Ausgangspunkt 2K-n. Ein solches Modell wird in der Physik als eindimensionaler Random Walk bezeichnet.
Eigenschaften:
- Ein Bernoulli-Prozess ist ein spezieller Markow-Prozess: beim "Zeitschritt" von n nach n+1 geht das System mit der Wahrscheinlichkeit p aus dem "Zustand" k in den Zustand k+1 über; sonst bleibt es im Zustand k.
Die Zufallsvariable K, die angibt, wie viele von n Bernoulli-Versuchen erfolgreich waren, folgt der Binomial-Verteilung. Wir leiten diese Verteilung anhand eines Beispiels her:
- Beim Würfeln mit einem Würfel werde die Sechs als Erfolg gewertet; die Erfolgswahrscheinlichkeit ist also p=1/6, die komplementäre Misserfolgswahrscheinlichkeit q=5/6. Gefragt sei nun nach der Wahrscheinlichkeit, in n=5 Würfen genau k=2 Sechsen zu werfen.
Antwort: Die Wahrscheinlichkeit, erst zwei Sechsen, dann drei Nicht-Sechsen zu werfen, ist p2q3. Da es auf die Reihenfolge aber nicht ankommt, ist diese Wahrscheinlichkeit zu multiplizieren mit der Anzahl der Möglichkeiten, zwei (ununterscheidbare) Sechserwürfe auf fünf Würfe zu verteilen. Der Kombinatorik zufolge ist diese Anzahl durch den Binomialkoeffizienten "5 über 2" gegeben; die gesuchte Wahrscheinlichkeit lautet also:
Davon verallgemeinert, lautet die Wahrscheinlichkeit, in n Bernoulli-Versuchen genau k mal Erfolg zu haben,
mit q=1-p. Diese Funktion heißt Binomial-Verteilung oder binomische Verteilung. Es gibt keine einheitliche Notation; neben B(k|p, n) findet man viele andere Schreibweisen wie zum Beispiel Pp(k|n), Wpn(k) oder B(n; p).
Eigenschaften der Binomialverteilung
Die Binomialverteilung besitzt den Erwartungswert np und die Varianz npq.
Die Binomialverteilung besitzt die Symmetrie B(k|p, n) = B(k|q, n-k).
Symmetrische Binomialverteilung (p gleich 1/2)
Dieses Bild zeigt die Binomialverteilung für p=0,5 und verschiedene Werte von n als Funktion von k:
Diese Funktion ist spiegelsymmetrisch um den Wert k=n/2:
- B(k|0,5, n) = B(k|0,5, n-k),
wie die folgende Auftragung zeigt:
Die Breite der Verteilung wächst proportional zur Standardabweichung . Der Funktionswert bei k=n/2, also das Maximum der Kurve, sinkt proportional zu σ. Dementsprechend kann man Binomialverteilungen mit unterschiedlichem n aufeinander skalieren, indem man die Abszisse k-n/2 durch σ teilt und die Ordinate mit σ multipliziert:
Das folgende Bild zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von n und in einer Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem n gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, erkennt man, dass diese Kurve (im Bild schwarz durchgezogen) eine Gaußsche Glockenkurve ist:
- .
Dies ist die Wahrscheinlichkeitsdichte zur Standard-Normalverteilung N(0,1). Im zentralen Grenzwertsatz wird dieser Befund so verallgemeinert, dass auch Folgen anderer diskreter Wahrscheinlichkeitsverteilungen gegen die Normalverteilung konvergieren.
Und hier die gleichen Daten in einer halblogarithmischen Auftragung, die sehr zu empfehlen ist, wenn man überprüfen möchte, ob auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung folgen:
Allgemeiner Fall (p≠1/2)
Näherungen im Fall sehr vieler Bernoulli-Versuche
Im Grenzfall großer n konvergiert die Binomialverteilung gegen eine Normalverteilung:
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np>4 und nq>4. Je asymmetrischer die Binomialverteilung, umso größer muss n sein, bevor die Normalverteilung eine brauchbare Näherung liefert.
Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert np für große n gegen eine von n unabhängige Konstante λ konvergiert, kann man durch die Poisson-Verteilung nähern:
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np≤10 und n>1500p, gleichbedeutend mit n>= 50 und p≤0.05.
Beispiele
Ziehen von Kugeln
In einem Behälter befinden sich 80 Kugeln, davon sind 16 gelb. Es wird 5-mal eine Kugel entnommen und anschließend wieder zurückgelegt. Wegen des Zurücklegens ist die Wahrscheinlichkeit, eine gelbe Kugel zu ziehen, bei allen Entnahmen gleich groß: 16/80 = 1/5 = 0,2. Die Verteilung B(k|0,2; 5) gibt die Wahrscheinlichkeit dafür an, dass genau k der entnommenen Kugeln gelb sind.
k | Wahrscheinlichkeit in % |
0 | 32,768 |
1 | 40,96 |
2 | 20,48 |
3 | 5,12 |
4 | 0,64 |
5 | 0,032 |
∑ | 100 |
Erw.Wert | 1 |
Varianz | 0.8 |
Gemeinsamer Geburtstag am Wochenende
Die Wahrscheinlichkeit, dass eine Person in diesem Jahr an einem Wochenende Geburtstag hat, beträgt 2/7. In einem Raum halten sich 10 Personen auf (Darunter sind keine Zwillinge). Die Verteilung B(k|2/7; 10) gibt die Wahrscheinlichkeit dafür an, dass genau k der Anwesenden in diesem Jahr an einem Wochenende Geburtstag haben.
k | Wahrscheinlichkeit in % |
0 | 3,457161303360777 |
1 | 13,828645213443108 |
2 | 24,89156138419759 |
3 | 26,55099880981076 |
4 | 18,585699166867535 |
5 | 8,921135600096417 |
6 | 2,973711866698805 |
7 | 0,6797055695311554 |
8 | 0,1019558354296733 |
9 | 0,009062740927082069 |
10 | 0,0003625096370832828 |
∑ | 100 |
Erw.Wert | 2,8571428571428568 |
Varianz | 2,040816326530612 |
Gemeinsamer Geburtstag im Jahr
253 Personen sind zusammen gekommen. Wie groß ist die Wahrscheinlichkeit, dass niemand der Anwesenden an einem zufällig ausgewählten Tag Geburtstag hat?
Die Wahrscheinlichkeit eines Einzelereignisses beträgt 1/365= 0.003, die Zahl der Versuche 253. Die direkte Berechnung der Binominalverteilung ist aufgrund der großen Fakultäten schwierig. Eine Näherung über die Poisson-Verteilung ist zulässig (n>50, p<0.05).
- k(0): 0.49
- k(1): 0.35
- k(2): 0.12
- k(3): 0.03
- k(4): 0.01
- Die Wahrscheinlichkeit, dass an einem ausgewählten Tag niemand Geburtstag hat, beträgt fast 50%. Die andere Hälfte der Personen hat Geburtstag (35%) oder teilt ihn mit einer (12%) oder zwei (3%) weiteren Personen.
Das Ergebnis sieht völlig anders aus, wenn nicht nach der Geburtstagswahrscheinlichkeit an einem Tag im Jahr gefragt wird, sondern nach der Wahrscheinlichkeit gemeinsamer Geburtstage. Statt 365 Tagen steht nur noch eine Anzahl unterschiedlicher Tage zur Verfügung, die höchstens der Zahl der Personen entspricht, siehe Geburtstagsproblem.
Zufallszahlen
Zufallszahlen zur Binomialverteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt.
Weblinks
Siehe auch
- Für Anfänger zum Nachlesen im Wikibook Mathematik: Binomialverteilung
- Mathematik für die Schule