Die Poisson-Verteilung (benannt nach dem Mathematiker Siméon Denis Poisson) ist eine diskrete Wahrscheinlichkeitsverteilung, die beim mehrmaligen Durchführen eines Bernoulli-Experiments entsteht. Letzteres ist ein Zufallsexperiment, das nur zwei mögliche Ergebnisse besitzt (z. B. „Erfolg“ und „Misserfolg“). Führt man ein solches Experiment sehr oft durch und ist die Erfolgswahrscheinlichkeit gering, so ist die Poisson-Verteilung eine gute Näherung für die entsprechende Wahrscheinlichkeitsverteilung. Die Poisson-Verteilung wird deshalb manchmal als die Verteilung der seltenen Ereignisse bezeichnet (siehe auch Gesetz der kleinen Zahlen). Zufallsvariablen mit einer Poisson-Verteilung genügen dem Poisson-Prozess.
Die mit bezeichnete Wahrscheinlichkeitsverteilung wird durch den Parameter bestimmt, der gleichzeitig Erwartungswert und Varianz der Verteilung ist. Sie ordnet den natürlichen Zahlen die Wahrscheinlichkeiten wie folgt zu:
mit die Eulersche Zahl (Basis der natürlichen Exponentialfunktion), eine reelle positive Zahl und die Fakultät von .
Die Poisson-Verteilung liefert also Voraussagen über die Anzahl (k) des Eintretens seltener, zufälliger und voneinander unabhängiger Ereignisse innerhalb eines bestimmten Intervalls, wenn aus vorangehender Beobachtung bereits bekannt ist, wie viele Ereignisse man im Mittel innerhalb dieses Intervalls erwartet (). Sie ist ein Spezialfall der Panjer-Verteilung.
Poisson veröffentlichte 1837 seine Gedanken zu dieser Verteilung zusammen mit seiner Wahrscheinlichkeitstheorie in dem Werk „Recherches sur la probabilité des jugements en matières criminelles et en matière civile“ („Untersuchungen zur Wahrscheinlichkeit von Urteilen in Straf- und Zivilsachen“).
Erweiterungen der Poisson-Verteilung wie die Verallgemeinerte Poisson-Verteilung und die Gemischte Poisson-Verteilung werden vor allem im Bereich der Versicherungsmathematik angewendet.
Herleitung
Die Poisson-Verteilung ergibt sich einerseits als Grenzfall der Binomial-Verteilung, andererseits lässt sie sich aus grundlegenden Prozesseigenschaften (poissonsche Annahmen) ableiten. Wenn diese Eigenschaften einem Geschehen in guter Näherung zugeordnet werden können, wird die Ereignishäufigkeit Poisson-verteilt sein.
Man betrachtet ein Raum- oder Zeitkontinuum w (das Bernoulli-Experiment wird sehr oft, sozusagen an jedem Punkt des Kontinuums durchgeführt), 'auf' dem zählbare Ereignisse mit konstanter mittlerer Anzahl g pro Einheitsintervall stattfinden. Nun richtet man den Blick auf ein 'genügend' kleines Kontinuumsintervall , das je nach Experiment einen Bereich, ein Zeitintervall, eine abgegrenzte Strecke, Fläche oder Volumen darstellen kann. Was sich dort ereignet, bestimmt die globale Verteilung auf dem Kontinuum.
Die drei poissonschen Annahmen lauten:
- Innerhalb des Intervalls [w,w + ] gibt es höchstens ein Ereignis (Seltenheit), d.h. die Ereignisse erfolgen einzeln (sequentiell).
- Die Wahrscheinlichkeit, ein Ereignis im Intervall zu finden, ist proportional zur Länge des Intervalls (g ist konstant und damit auch unabhängig von w).
- Das Eintreten eines Ereignisses im Intervall wird nicht beeinflusst von Ereignissen, die in der Vorgeschichte stattgefunden haben (Geschichtslosigkeit).
Mit Annahme 1 und 2 ist die Wahrscheinlichkeit, ein Ereignis im Intervall zu finden, gegeben durch
sowie die Wahrscheinlichkeit eines leeren Intervalls durch
Nach Annahme 3 ist die Wahrscheinlichkeit eines leeren Intervalls unabhängig vom Auftreten irgendwelcher Ereignisse im Bereich w davor. So berechnet man die Wahrscheinlichkeit für kein Ereignis bis zum Punkt zu
Das ergibt näherungsweise die Differentialgleichung mit der Lösung
unter der Randbedingung Ebenso findet man die Wahrscheinlichkeit für m Ereignisse bis zum Punkt
Jedes angehängte Intervall darf nach Annahme 1 nur entweder kein oder ein Ereignis enthalten. Die entsprechende Differentialgleichung hat die Lösung
- .
Identifiziert man nun in diesem Ausdruck, der die Wahrscheinlichkeit des Eintretens von m Ereignissen im Kontinuumsbereich w beschreibt, die Parameter mit und m mit k, stimmt er mit der Formel der Poisson-Verteilung überein. Die Zahl ergibt sich in vielen Aufgabenstellungen als Produkt einer Rate (Anzahl von Ereignissen pro Einheitsintervall) und einem Vielfachen des Einheitsintervalls.
Eigenschaften
- Die Poisson-Verteilung wird durch den Parameter vollständig charakterisiert.
- Die Poisson-Verteilung ist stationär, das heißt nicht von der Zeit abhängig.
- In einem Poisson-Prozess ist die zufällige Anzahl der Ereignisse bis zu einem bestimmten Zeitpunkt poissonverteilt, die zufällige Zeit bis zum -ten Ereignis Erlang-verteilt. Wichtig ist der Spezialfall , der zur Exponentialverteilung führt. Sie beschreibt die Zeit bis zum ersten zufälligen Ereignis (sowie die Zeit zwischen zwei aufeinanderfolgenden Ereignissen) eines Poissonprozesses.
Einfache rekursive Berechnung
Zuerst bestimmt man , dann ergeben sich nacheinander Mit wachsendem werden dabei die Wahrscheinlichkeiten größer, solange ist. Wird schrumpfen sie.
Verteilungsfunktion
Die Verteilungsfunktion der Poisson-Verteilung lautet
und gibt die Wahrscheinlichkeit dafür, höchstens n Ereignisse zu finden, wo man im Mittel erwartet. ist die regularisierte Gammafunktion der unteren Grenze.
Erwartungswert, Varianz, Moment
ist zugleich Erwartungswert, Varianz und auch 3. zentriertes Moment , denn
Erwartungswert
Varianz
Alternative Berechnung von Erwartungswert und Varianz
Seien unabhängige binomialverteilte Zufallsvariablen und sei . Für gilt .
Variationskoeffizient
Aus Erwartungswert und Varianz erhält man sofort den Variationskoeffizienten
- .
Schiefe und Wölbung
Die Schiefe ergibt sich zu
- .
Die Wölbung lässt sich ebenfalls geschlossen darstellen als
- .
Charakteristische Funktion
Die charakteristische Funktion hat die Form
- .
Erzeugende Funktion
Für die erzeugende Funktion erhält man
- .
Momenterzeugende Funktion
Die momenterzeugende Funktion der Poisson-Verteilung ist
- .
Reproduktivität
Die Poisson-Verteilung ist reproduktiv, d.h. die Summe zweier stochastisch unabhängiger Poisson-verteilter Zufallsvariablen und mit den Parametern und ist wieder Poisson-verteilt mit dem Parameter . Denn es gilt:
Dies lässt sich auch auf mehrere stochastisch unabhängige Poisson-verteilte Zufallsvariablen verallgemeinern. Hier ist .
Nach einem Satz des sowjetischen Mathematikers D. A. Raikow gilt auch die Umkehrung: Ist eine Poisson-verteilte Zufallsvariable die Summe von zwei unabhängigen Zufallsvariablen und , dann sind die Summanden und ebenfalls Poisson-verteilt. Eine Poisson-verteilte Zufallsvariable lässt sich also nur in Poisson-verteilte unabhängige Summanden zerlegen. Dieser Satz ist ein Analogon zu dem Satz von Cramér für die Normalverteilung.
Die Poisson-Verteilung ist unendlich teilbar.
Symmetrie
Die Poisson-Verteilung hat für kleine Mittelwerte eine stark asymmetrische Gestalt. Für größer werdende Mittelwerte wird symmetrischer und lässt sich für in guter Näherung durch die Gauß-Verteilung darstellen.
Beziehung zu anderen Verteilungen
Beziehung zur Binomialverteilung
Die Wahrscheinlichkeitsdichte der Binomialverteilung lautet
Die Poisson-Verteilung lässt sich aus der Binomialverteilung herleiten. Sie ist die Grenzverteilung der Binomialverteilung bei sehr kleinen Anteilen der interessierten Merkmale und sehr großem Stichprobenumfang: und unter der Nebenbedingung, dass das Produkt konstant ist. ist dann für alle in der Grenzwertbildung betrachteten Binomialverteilungen wie auch für die resultierende Poisson-Verteilung der Erwartungswert.
Der Wert einer Poisson-verteilten Zufallsvariable an der Stelle ist der Grenzwert einer Binomialverteilung mit an der Stelle :
Beziehung zur Normalverteilung
Für große kann die Poisson-Verteilung durch die Gaußsche Normalverteilung mit und angenähert werden:
Beziehung zur Erlang-Verteilung
- In einem Poisson-Prozess genügt die zufällige Anzahl der Ereignisse bis zu einem festgelegten Zeitpunkt der Poisson-Verteilung . Die zufällige Zeit bis zum Eintreffen des -ten Ereignis hingegen ist Erlang-verteilt. Im Fall geht diese Erlang-Verteilung in eine Exponentialverteilung über . Dabei bezeichnet g die Zahl der erwarteten Ereignisse pro Einheitsintervall. Man sagt auch, dass die Poisson-Verteilung und die Erlang-Verteilung zueinander konjugierte Verteilungen sind.
- Für die Verteilungsfunktionen der Erlang-Verteilung und der Poisson-Verteilung gilt
- .
Beziehung zur Exponentialverteilung
Die Zeit bis zum ersten zufälligen Ereignis sowie die Zeit zwischen zwei aufeinanderfolgenden Ereignissen eines Poisson-Prozesses mit dem Parameter ist exponentialverteilt.
Anwendungsbeispiele
Die Poisson-Verteilung ist eine typische Verteilung für die Zahl von Phänomenen, die innerhalb einer Einheit auftreten.
So wird sie häufig dazu benutzt, zeitliche Ereignisse zu beschreiben. Gegeben sind ein zufälliges Ereignis, das durchschnittlich einmal in einem zeitlichen Abstand stattfindet, sowie ein zweiter Zeitraum , auf den dieses Ereignis bezogen werden soll.
Die Poisson-Verteilung mit gibt die Wahrscheinlichkeit an, dass im Zeitraum genau Ereignisse stattfinden. Anders ausgedrückt ist die mittlere Auftretenshäufigkeit eines Ereignisses.
Kaufhauskunden
Ein Kaufhaus wird an einem Samstag durchschnittlich alle 10 Sekunden ( ) von einem Kunden betreten. Werden nun im Takt von einer Minute bzw. 60 Sekunden die Personen gezählt, so würde man im Mittel 6 Personen erwarten (λ = 6 Personen/Minute), die das Kaufhaus betreten. gibt die Wahrscheinlichkeit dafür an, dass in der nächsten Minute ( ) genau Kunden das Kaufhaus betreten.
P6(n) | ||
---|---|---|
n | Wahrscheinlichkeit in % | Summe in % |
0 | 0,25 | 0,25 |
1 | 1,49 | 1,74 |
2 | 4,46 | 6,20 |
3 | 8,92 | 15,12 |
4 | 13,39 | 28,51 |
5 | 16,06 | 44,57 |
6 | 16,06 | 60,63 |
7 | 13,77 | 74,40 |
8 | 10,33 | 84,72 |
9 | 6,88 | 91,61 |
10 | 4,13 | 95,74 |
11 | 2,25 | 97,99 |
12 | 1,13 | 99,12 |
13 | 0,52 | 99,64 |
14 | 0,22 | 99,86 |
15 | 0,09 | 99,95 |
Mit einer Wahrscheinlichkeit von rund 4,5 % betreten genau 2 Personen in einer Minute das Kaufhaus. Mit einer Wahrscheinlichkeit von fast 92 % treten 0 bis 9 Personen (aufsummiert) ein. Die Wahrscheinlichkeit, dass mehr als 9 Personen in einer Minute eintreten, ist folglich 8 %.
Die Werte in der mittleren Spalte ergeben sich jeweils aus dem darüberliegenden Wert, multipliziert mit 6/n.
Radioaktiver Zerfall
In der Natur folgt zum Beispiel die Anzahl radioaktiver Zerfälle einzelner Atome in einem gegebenen Zeitintervall, dessen Dauer die Annahme einer konstanten Zerfallswahrscheinlichkeit rechtfertigt, der Poisson-Statistik. Umgekehrt sind dementsprechend die Zeiten zwischen einzelnen Zerfallsereignissen exponentialverteilt.
Zählexperiment
Die Messung einer poisson-verteilten Anzahl von Ereignissen wird bei häufiger Wiederholung um den gemessenen Mittelwert mit Standardabweichung streuen. Wird nur einmal (ohne Wiederholen des Experiments) gezählt, dient das Ergebnis als bester Schätzer für Mittelwert ( ) der zugrunde liegenden Poisson-Verteilung sowie Unsicherheit (Standardabweichung) der erhaltenen Anzahl. Um hier relative Genauigkeit von 1 % zu erzielen, braucht man also 'hohe Stastistik' von über 10000 Ereignissen!
Blitzeinschläge
Die Blitzhäufigkeit in Deutschland beträgt 10 Einschläge pro km² = 0,1 Einschläge pro ha und Jahr. Wie groß ist die Wahrscheinlichkeit, dass es in einer Parzelle von 1 ha zu Blitzeinschlägen in einem Jahr kommt?
Einschläge pro Hektar und Jahr.
- (kein Einschlag im betrachteten Jahr): 90 %
- (ein Einschlag im betrachteten Jahr): 9 %
- (zwei Einschläge im betrachteten Jahr): 0,5 %
- (drei Einschläge im betrachteten Jahr): 0,02 %
Statistisch ist es nicht verwunderlich, wenn ein Blitz innerhalb von 200 Jahren zweimal am gleichen Ort einschlägt, wobei es außerordentlich unwahrscheinlich ist, den Ort voraussagen zu können (Siehe hierzu auch Geburtstagsparadoxon).
Verstreute Reiskörner
Das Bild rechts zeigt Reiskörner, die zufällig auf Quadrate verteilt wurden. Die Felder enthalten Reiskörner. Der Vergleich zwischen Experiment und berechneter Poisson-Verteilung , wobei Reiskörner/Quadrate ist, zeigt eine gute Übereinstimmung:
gezählt | ||
0 |
15 |
12,7 |
1 |
15 |
17,2 |
2 |
11 |
11,6 |
3 |
5 |
5,2 |
4 |
1 |
1,7 |
5 |
2 |
0,5 |
Die Wahrscheinlichkeit, dass ein bestimmtes Feld leer bleibt, ist etwa 26 %:
Sportergebnisse
Die (zeitliche) Konstanz der Ereigniswahrscheinlichkeit - eine wesentliche Voraussetzung für die Anwendung der Poissonstatistik (siehe oben unter Poissonsche Annahmen) - ist bei Sportergebnissen natürlich höchstens näherungsweise gegeben. Es wirken viele im Einzelnen nicht isolierbare Einflüsse zusammen und ergeben eine Wahrscheinlichkeit für Punkte oder Tore, die man ohne besseres Wissen eben als konstant annimmt. Auch ob z.B. Tore unabhängig voneinander fallen, ist fraglich. Das Zutreffen dieser Annahmen lässt sich aber im Nachhinein an der Übereinstimmung von Daten und Poissonverteilung testen. Hier gibt es einen 'Spielraum' und keine Eindeutigkeit.
In vielen Sportarten geht es zum Siegen in einem Wettbewerb darum, innerhalb eines bestimmten Zeitraums mehr zählende Ereignisse zu erwirken, als der Gegner.
Die durchschnittliche Anzahl von Toren pro Spiel und Mannschaft betrug während der Gruppenphase der Fußball-Weltmeisterschaft 2010 der Herren in Südafrika 1,05 (101 Tore in 48 Spielen). Mit diesem Wert können mit Hilfe der Poisson-Verteilung die Verteilung der Tore und die Verteilung der Endergebnisse der Begegnungen berechnet werden. Die Wahrscheinlichkeit für ein bestimmtes Endergebnis ergibt sich hierbei aus dem Produkt der Wahrscheinlichkeiten der beiden Gegner für die entsprechenden Torerfolge. Auch hier ist die Summe aller Wahrscheinlichkeiten 100 %.
Die folgende Tabelle zeigt die berechneten Anteile der Endergebnisse auf der linken Seite und die tatsächlichen Anteile der Endergebnisse auf der rechten Seite. Die Übereinstimmung ist gut, und die Abweichungen zwischen tatsächlichen und berechneten Ergebnissen für einen bestimmten Spielendstand sind weit unten im einstelligen Prozentbereich. Ein Spiel entspricht einem Anteil von 1/48 (= 2,083 %) aller Spiele. In nur einem Fall (Endergebnis 0:1) beträgt die Abweichung zwischen der Berechnung und der tatsächlichen Anzahl von Spielen 2 (oder 3,81 %), in allen anderen Fällen ist sie maximal 1.
Tore (Parameter k) |
berechnet | 0 | 1 | 2 | 3 | 4 | geschossen | 0 | 1 | 2 | 3 | 4 | Differenz | 0 | 1 | 2 | 3 | 4 |
P (λ = 1,05) |
35 % | 37 % | 19 % | 7 % | 2 % | |||||||||||||
0 | 35 % | 12 % | 13 % | 7 % | 2 % | 1 % | 13 % | 17 % | 6 % | 4 % | 0 % | -1 % | -4 % | 1 % | -2 % | 1 % | ||
1 | 37 % | 13 % | 14 % | 7 % | 2 % | 1 % | 10 % | 13 % | 8 % | 2 % | 0 % | 3 % | 1 % | -1 % | 0 % | 1 % | ||
2 | 19 % | 7 % | 7 % | 4 % | 1 % | 0 % | 6 % | 6 % | 4 % | 0 % | 0 % | 1 % | 1 % | 0 % | 1 % | 0 % | ||
3 | 7 % | 2 % | 2 % | 1 % | 0 % | 0 % | 0 % | 2 % | 2 % | 0 % | 0 % | 2 % | 0 % | -1 % | 0 % | 0% | ||
4 | 2 % | 1 % | 1 % | 0 % | 0 % | 0 % | 2 % | 2 % | 0 % | 0 % | 0 % | -1 % | -1 % | 0 % | 0 % | 0 % | ||
5 | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | ||
6 | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | ||
7 | 0 % | 0 % | 0 % | 0 % | 0 % | 0 % | 2 % | 0 % | 0 % | 0 % | 0 % | -2 % | 0 % | 0 % | 0 % | 0 % |
Grenzwertüberschreitung
Die Anzahl poissonverteilter Ereignisse, die mit vorgegebener Wahrscheinlichkeit p < 1 nicht überschritten wird, lässt sich aus der Inversion der Verteilungsfunktion berechnen:
Nun ist keine elementare Form der Inversion der Verteilungsfunktion, bezogen auf ihr erstes Argument, bekannt. Ausser dem punktweisen Berechnen der Inversion gibt es aber noch folgende Möglichkeit:
Man findet für dass zum Beispiel folgende Ausdrücke der Verteilungsfunktion kaum (< 1 %) von abhängen:
Allgemein liegt für hohe Werte von p > 0.9 die Verteilungsfunktion sehr nahe bei p, wobei das einseitige Quantil der Standardnormalverteilung darstellt und als Funktion der Wahrscheinlichkeit p durch bestimmt ist. Die rechte Seite der Gleichung für entsteht aus der Umkehrfunktion des Fehlerintegrals . Der Ansatz für in ist zunächst motiviert durch die Tatsache, dass die Poisson-Verteilung für grosse in eine Normalverteilung mit übergeht. Das zusätzliche verbessert die Konstanz der Verteilungsfunktion bei kleinem
Für Mittelwerte wird mit Wahrscheinlichkeit p = 0.99 (99 %) maximal 1 Ereignis auftreten. Ist grösser, dann berechnet sich die mit Wahrscheinlichkeit p zu erwartende grösste Häufigkeit von Ereignissen in guter Näherung aus der einfachen Formel
Bei deutlich nicht ganzzahligem Ergebnis empfiehlt es sich aufzurunden. Damit wird bei vielfachen Wiederholungen (oder anders formuliert: auf lange Sicht) die Wahrscheinlichkeit, mit der Zahl der Ereignisse unter der Grenze zu bleiben, etwas erhöht. Mit p = 0.95 (entspricht ) und sind also nicht mehr als Ereignisse zu erwarten.
Zufallszahlen
Zufallszahlen zur Poisson-Verteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt.
Literatur
- Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. Vandenhoeck und Ruprecht, Göttingen 1974, ISBN 3-525-03114-9.
- Frodesen, Skjeggestad, Tofte: Probabibility and Statistics in Particle Physics, Universitetsforlaget, Bergen - Oslo - Tromsö
Weblinks
- Universität Konstanz – Interaktive Animation
- StatWiki – Herleitung der momenterzeugenden Funktion
- PoissonDiagrammer – Programm zum zeichnen der Poisson-Verteilung(auch für hohe Erwartungswerte)