Poisson-Verteilung

diskrete Wahrscheinlichkeitsverteilung
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 19. September 2011 um 23:57 Uhr durch 78.48.172.67 (Diskussion) (Erläuterung zur Grenzwertüberschreitung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Poisson-Verteilung (benannt nach dem Mathematiker Siméon Denis Poisson) ist eine diskrete Wahrscheinlichkeitsverteilung, die beim mehrmaligen Durchführen eines Bernoulli-Experiments entsteht. Letzteres ist ein Zufallsexperiment, das nur zwei mögliche Ergebnisse besitzt (z. B. „Erfolg“ und „Misserfolg“). Führt man ein solches Experiment sehr oft durch und ist die Erfolgswahrscheinlichkeit gering, so ist die Poisson-Verteilung eine gute Näherung für die entsprechende Wahrscheinlichkeitsverteilung. Die Poisson-Verteilung wird deshalb manchmal als die Verteilung der seltenen Ereignisse bezeichnet (siehe auch Gesetz der kleinen Zahlen). Zufallsvariablen mit einer Poisson-Verteilung genügen dem Poisson-Prozess.

Wahrscheinlichkeitsfunktion der Poisson-Verteilung für (blau), (grün) und (rot)

Die mit bezeichnete Wahrscheinlichkeitsverteilung wird durch den Parameter bestimmt, der gleichzeitig Erwartungswert und Varianz der Verteilung ist. Sie ordnet den natürlichen Zahlen die Wahrscheinlichkeiten wie folgt zu:

mit die Eulersche Zahl (Basis der natürlichen Exponentialfunktion), eine reelle positive Zahl und die Fakultät von .

Die Poisson-Verteilung liefert also Voraussagen über die Anzahl (k) des Eintretens seltener, zufälliger und voneinander unabhängiger Ereignisse innerhalb eines bestimmten Intervalls, wenn aus vorangehender Beobachtung bereits bekannt ist, wie viele Ereignisse man im Mittel innerhalb dieses Intervalls erwartet (). Sie ist ein Spezialfall der Panjer-Verteilung.

Poisson veröffentlichte 1837 seine Gedanken zu dieser Verteilung zusammen mit seiner Wahrscheinlichkeitstheorie in dem Werk „Recherches sur la probabilité des jugements en matières criminelles et en matière civile“ („Untersuchungen zur Wahrscheinlichkeit von Urteilen in Straf- und Zivilsachen“).

Erweiterungen der Poisson-Verteilung wie die Verallgemeinerte Poisson-Verteilung und die Gemischte Poisson-Verteilung werden vor allem im Bereich der Versicherungsmathematik angewendet.

Herleitung

Die Poisson-Verteilung ergibt sich einerseits als Grenzfall der Binomial-Verteilung, andererseits lässt sie sich aus grundlegenden Prozesseigenschaften (poissonsche Annahmen) ableiten. Wenn diese Eigenschaften einem Geschehen in guter Näherung zugeordnet werden können, wird die Ereignishäufigkeit Poisson-verteilt sein.

Man betrachtet ein Raum- oder Zeitkontinuum w (das Bernoulli-Experiment wird sehr oft, sozusagen an jedem Punkt des Kontinuums durchgeführt), 'auf' dem zählbare Ereignisse mit konstanter mittlerer Anzahl g pro Einheitsintervall stattfinden. Nun richtet man den Blick auf ein 'genügend' kleines Kontinuumsintervall  , das je nach Experiment einen Bereich, ein Zeitintervall, eine abgegrenzte Strecke, Fläche oder Volumen darstellen kann. Was sich dort ereignet, bestimmt die globale Verteilung auf dem Kontinuum.

Die drei poissonschen Annahmen lauten:

  1. Innerhalb des Intervalls [w,w +  ] gibt es höchstens ein Ereignis (Seltenheit), d.h. die Ereignisse erfolgen einzeln (sequentiell).
  2. Die Wahrscheinlichkeit, ein Ereignis im Intervall zu finden, ist proportional zur Länge des Intervalls   (g ist konstant und damit auch unabhängig von w).
  3. Das Eintreten eines Ereignisses im Intervall   wird nicht beeinflusst von Ereignissen, die in der Vorgeschichte stattgefunden haben (Geschichtslosigkeit).

Mit Annahme 1 und 2 ist die Wahrscheinlichkeit, ein Ereignis im Intervall   zu finden, gegeben durch

 

sowie die Wahrscheinlichkeit eines leeren Intervalls durch

 

Nach Annahme 3 ist die Wahrscheinlichkeit eines leeren Intervalls   unabhängig vom Auftreten irgendwelcher Ereignisse im Bereich w davor. So berechnet man die Wahrscheinlichkeit für kein Ereignis bis zum Punkt   zu

 

Das ergibt näherungsweise die Differentialgleichung   mit der Lösung

 

unter der Randbedingung   Ebenso findet man die Wahrscheinlichkeit für m Ereignisse bis zum Punkt  

 

Jedes angehängte Intervall   darf nach Annahme 1 nur entweder kein oder ein Ereignis enthalten. Die entsprechende Differentialgleichung   hat die Lösung

 .

Identifiziert man nun in diesem Ausdruck, der die Wahrscheinlichkeit des Eintretens von m Ereignissen im Kontinuumsbereich w beschreibt, die Parameter   mit   und m mit k, stimmt er mit der Formel der Poisson-Verteilung überein. Die Zahl   ergibt sich in vielen Aufgabenstellungen als Produkt einer Rate (Anzahl von Ereignissen pro Einheitsintervall) und einem Vielfachen des Einheitsintervalls.

Eigenschaften

  • Die Poisson-Verteilung   wird durch den Parameter   vollständig charakterisiert.
  • Die Poisson-Verteilung ist stationär, das heißt nicht von der Zeit abhängig.
  • In einem Poisson-Prozess ist die zufällige Anzahl der Ereignisse bis zu einem bestimmten Zeitpunkt poissonverteilt, die zufällige Zeit bis zum  -ten Ereignis Erlang-verteilt. Wichtig ist der Spezialfall  , der zur Exponentialverteilung   führt. Sie beschreibt die Zeit bis zum ersten zufälligen Ereignis (sowie die Zeit zwischen zwei aufeinanderfolgenden Ereignissen) eines Poissonprozesses.

Einfache rekursive Berechnung

Zuerst bestimmt man  , dann ergeben sich nacheinander   Mit wachsendem   werden dabei die Wahrscheinlichkeiten größer, solange   ist. Wird   schrumpfen sie.

Verteilungsfunktion

Die Verteilungsfunktion   der Poisson-Verteilung lautet

 

und gibt die Wahrscheinlichkeit dafür, höchstens n Ereignisse zu finden, wo man   im Mittel erwartet.   ist die regularisierte Gammafunktion der unteren Grenze.

Erwartungswert, Varianz, Moment

  ist zugleich Erwartungswert, Varianz und auch 3. zentriertes Moment  , denn

Erwartungswert

 

Varianz

 

Alternative Berechnung von Erwartungswert und Varianz

Seien   unabhängige binomialverteilte Zufallsvariablen und sei  . Für   gilt  .

 

Variationskoeffizient

Aus Erwartungswert und Varianz erhält man sofort den Variationskoeffizienten

 .

Schiefe und Wölbung

Die Schiefe ergibt sich zu

 .

Die Wölbung lässt sich ebenfalls geschlossen darstellen als

 .

Charakteristische Funktion

Die charakteristische Funktion hat die Form

 .

Erzeugende Funktion

Für die erzeugende Funktion erhält man

 .

Momenterzeugende Funktion

Die momenterzeugende Funktion der Poisson-Verteilung ist

 .

Reproduktivität

Die Poisson-Verteilung ist reproduktiv, d.h. die Summe   zweier stochastisch unabhängiger Poisson-verteilter Zufallsvariablen   und   mit den Parametern   und   ist wieder Poisson-verteilt mit dem Parameter  . Denn es gilt:

 

Dies lässt sich auch auf mehrere stochastisch unabhängige Poisson-verteilte Zufallsvariablen   verallgemeinern. Hier ist  .

Nach einem Satz des sowjetischen Mathematikers D. A. Raikow gilt auch die Umkehrung: Ist eine Poisson-verteilte Zufallsvariable   die Summe von zwei unabhängigen Zufallsvariablen   und  , dann sind die Summanden   und   ebenfalls Poisson-verteilt. Eine Poisson-verteilte Zufallsvariable lässt sich also nur in Poisson-verteilte unabhängige Summanden zerlegen. Dieser Satz ist ein Analogon zu dem Satz von Cramér für die Normalverteilung.

Die Poisson-Verteilung ist unendlich teilbar.

Symmetrie

Die Poisson-Verteilung   hat für kleine Mittelwerte   eine stark asymmetrische Gestalt. Für größer werdende Mittelwerte wird   symmetrischer und lässt sich für   in guter Näherung durch die Gauß-Verteilung darstellen.

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Die Wahrscheinlichkeitsdichte der Binomialverteilung   lautet

 

Die Poisson-Verteilung lässt sich aus der Binomialverteilung herleiten. Sie ist die Grenzverteilung der Binomialverteilung bei sehr kleinen Anteilen der interessierten Merkmale und sehr großem Stichprobenumfang:   und   unter der Nebenbedingung, dass das Produkt   konstant ist.   ist dann für alle in der Grenzwertbildung betrachteten Binomialverteilungen wie auch für die resultierende Poisson-Verteilung der Erwartungswert.

Der Wert einer Poisson-verteilten Zufallsvariable an der Stelle   ist der Grenzwert   einer Binomialverteilung mit   an der Stelle  :

 

Beziehung zur Normalverteilung

Für große   kann die Poisson-Verteilung durch die Gaußsche Normalverteilung mit   und   angenähert werden:

 

Beziehung zur Erlang-Verteilung

  • In einem Poisson-Prozess genügt die zufällige Anzahl der Ereignisse bis zu einem festgelegten Zeitpunkt der Poisson-Verteilung  . Die zufällige Zeit bis zum Eintreffen des  -ten Ereignis hingegen ist   Erlang-verteilt. Im Fall   geht diese Erlang-Verteilung in eine Exponentialverteilung über  . Dabei bezeichnet g die Zahl der erwarteten Ereignisse pro Einheitsintervall. Man sagt auch, dass die Poisson-Verteilung und die Erlang-Verteilung zueinander konjugierte Verteilungen sind.
  • Für die Verteilungsfunktionen der Erlang-Verteilung und der Poisson-Verteilung gilt
 .

Beziehung zur Exponentialverteilung

Die Zeit bis zum ersten zufälligen Ereignis sowie die Zeit zwischen zwei aufeinanderfolgenden Ereignissen eines Poisson-Prozesses mit dem Parameter   ist   exponentialverteilt.

Anwendungsbeispiele

Die Poisson-Verteilung ist eine typische Verteilung für die Zahl von Phänomenen, die innerhalb einer Einheit auftreten.

So wird sie häufig dazu benutzt, zeitliche Ereignisse zu beschreiben. Gegeben sind ein zufälliges Ereignis, das durchschnittlich einmal in einem zeitlichen Abstand   stattfindet, sowie ein zweiter Zeitraum  , auf den dieses Ereignis bezogen werden soll.

Die Poisson-Verteilung   mit   gibt die Wahrscheinlichkeit an, dass im Zeitraum   genau   Ereignisse stattfinden. Anders ausgedrückt ist   die mittlere Auftretenshäufigkeit eines Ereignisses.

Kaufhauskunden

Ein Kaufhaus wird an einem Samstag durchschnittlich alle 10 Sekunden ( ) von einem Kunden betreten. Werden nun im Takt von einer Minute bzw. 60 Sekunden die Personen gezählt, so würde man im Mittel 6 Personen erwarten (λ = 6 Personen/Minute), die das Kaufhaus betreten.   gibt die Wahrscheinlichkeit dafür an, dass in der nächsten Minute ( ) genau   Kunden das Kaufhaus betreten.

 
Poisson-Verteilung mit λ=6.
P6(n)
n Wahrscheinlichkeit in % Summe in %
0 0,25 0,25
1 1,49 1,74
2 4,46 6,20
3 8,92 15,12
4 13,39 28,51
5 16,06 44,57
6 16,06 60,63
7 13,77 74,40
8 10,33 84,72
9 6,88 91,61
10 4,13 95,74
11 2,25 97,99
12 1,13 99,12
13 0,52 99,64
14 0,22 99,86
15 0,09 99,95

Mit einer Wahrscheinlichkeit von rund 4,5 % betreten genau 2 Personen in einer Minute das Kaufhaus. Mit einer Wahrscheinlichkeit von fast 92 % treten 0 bis 9 Personen (aufsummiert) ein. Die Wahrscheinlichkeit, dass mehr als 9 Personen in einer Minute eintreten, ist folglich 8 %.

Die Werte in der mittleren Spalte ergeben sich jeweils aus dem darüberliegenden Wert, multipliziert mit 6/n.

Radioaktiver Zerfall

In der Natur folgt zum Beispiel die Anzahl radioaktiver Zerfälle einzelner Atome in einem gegebenen Zeitintervall, dessen Dauer die Annahme einer konstanten Zerfallswahrscheinlichkeit rechtfertigt, der Poisson-Statistik. Umgekehrt sind dementsprechend die Zeiten zwischen einzelnen Zerfallsereignissen exponentialverteilt.

Zählexperiment

Die Messung einer poisson-verteilten Anzahl von Ereignissen wird bei häufiger Wiederholung um den gemessenen Mittelwert   mit Standardabweichung   streuen. Wird nur einmal (ohne Wiederholen des Experiments) gezählt, dient das Ergebnis   als bester Schätzer für Mittelwert ( ) der zugrunde liegenden Poisson-Verteilung sowie Unsicherheit   (Standardabweichung) der erhaltenen Anzahl. Um hier relative Genauigkeit von 1 % zu erzielen, braucht man also 'hohe Stastistik' von über 10000 Ereignissen!

Blitzeinschläge

Die Blitzhäufigkeit in Deutschland beträgt 10 Einschläge pro km² = 0,1 Einschläge pro ha und Jahr. Wie groß ist die Wahrscheinlichkeit, dass es in einer Parzelle von 1 ha zu   Blitzeinschlägen in einem Jahr kommt?

  Einschläge pro Hektar und Jahr.

  (kein Einschlag im betrachteten Jahr): 90 %
  (ein Einschlag im betrachteten Jahr): 9 %
  (zwei Einschläge im betrachteten Jahr): 0,5 %
  (drei Einschläge im betrachteten Jahr): 0,02 %

Statistisch ist es nicht verwunderlich, wenn ein Blitz innerhalb von 200 Jahren zweimal am gleichen Ort einschlägt, wobei es außerordentlich unwahrscheinlich ist, den Ort voraussagen zu können (Siehe hierzu auch Geburtstagsparadoxon).

Verstreute Reiskörner

 
Zufällig auf dem Boden verstreute Reiskörner.

Das Bild rechts zeigt   Reiskörner, die zufällig auf   Quadrate verteilt wurden. Die Felder enthalten   Reiskörner. Der Vergleich zwischen Experiment und berechneter Poisson-Verteilung  , wobei   Reiskörner/Quadrate ist, zeigt eine gute Übereinstimmung:

  gezählt  

0

15

12,7

1

15

17,2

2

11

11,6

3

5

5,2

4

1

1,7

5

2

0,5

Die Wahrscheinlichkeit, dass ein bestimmtes Feld leer bleibt, ist etwa 26 %:

 

Sportergebnisse

Die (zeitliche) Konstanz der Ereigniswahrscheinlichkeit - eine wesentliche Voraussetzung für die Anwendung der Poissonstatistik (siehe oben unter Poissonsche Annahmen) - ist bei Sportergebnissen natürlich höchstens näherungsweise gegeben. Es wirken viele im Einzelnen nicht isolierbare Einflüsse zusammen und ergeben eine Wahrscheinlichkeit für Punkte oder Tore, die man ohne besseres Wissen eben als konstant annimmt. Auch ob z.B. Tore unabhängig voneinander fallen, ist fraglich. Das Zutreffen dieser Annahmen lässt sich aber im Nachhinein an der Übereinstimmung von Daten und Poissonverteilung testen. Hier gibt es einen 'Spielraum' und keine Eindeutigkeit.

In vielen Sportarten geht es zum Siegen in einem Wettbewerb darum, innerhalb eines bestimmten Zeitraums mehr zählende Ereignisse zu erwirken, als der Gegner.

Die durchschnittliche Anzahl von Toren pro Spiel und Mannschaft betrug während der Gruppenphase der Fußball-Weltmeisterschaft 2010 der Herren in Südafrika 1,05 (101 Tore in 48 Spielen). Mit diesem Wert können mit Hilfe der Poisson-Verteilung die Verteilung der Tore und die Verteilung der Endergebnisse der Begegnungen berechnet werden. Die Wahrscheinlichkeit für ein bestimmtes Endergebnis ergibt sich hierbei aus dem Produkt der Wahrscheinlichkeiten der beiden Gegner für die entsprechenden Torerfolge. Auch hier ist die Summe aller Wahrscheinlichkeiten 100 %.

Die folgende Tabelle zeigt die berechneten Anteile der Endergebnisse auf der linken Seite und die tatsächlichen Anteile der Endergebnisse auf der rechten Seite. Die Übereinstimmung ist gut, und die Abweichungen zwischen tatsächlichen und berechneten Ergebnissen für einen bestimmten Spielendstand sind weit unten im einstelligen Prozentbereich. Ein Spiel entspricht einem Anteil von 1/48 (= 2,083 %) aller Spiele. In nur einem Fall (Endergebnis 0:1) beträgt die Abweichung zwischen der Berechnung und der tatsächlichen Anzahl von Spielen 2 (oder 3,81 %), in allen anderen Fällen ist sie maximal 1.

Tore
(Parameter k)
berechnet 0 1 2 3 4 geschossen 0 1 2 3 4 Differenz 0 1 2 3 4
P
(λ = 1,05)
35 % 37 % 19 % 7 % 2 %
0 35 % 12 % 13 % 7 % 2 % 1 % 13 % 17 % 6 % 4 % 0 % -1 % -4 % 1 % -2 % 1 %
1 37 % 13 % 14 % 7 % 2 % 1 % 10 % 13 % 8 % 2 % 0 % 3 % 1 % -1 % 0 % 1 %
2 19 % 7 % 7 % 4 % 1 % 0 % 6 % 6 % 4 % 0 % 0 % 1 % 1 % 0 % 1 % 0 %
3 7 % 2 % 2 % 1 % 0 % 0 % 0 % 2 % 2 % 0 % 0 % 2 % 0 % -1 % 0 % 0%
4 2 % 1 % 1 % 0 % 0 % 0 % 2 % 2 % 0 % 0 % 0 % -1 % -1 % 0 % 0 % 0 %
5 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 %
6 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 % 0 %
7 0 % 0 % 0 % 0 % 0 % 0 % 2 % 0 % 0 % 0 % 0 % -2 % 0 % 0 % 0 % 0 %

Grenzwertüberschreitung

Die Anzahl   poissonverteilter Ereignisse, die mit vorgegebener Wahrscheinlichkeit p < 1 nicht überschritten wird, lässt sich aus der Inversion der Verteilungsfunktion berechnen:

 

Nun ist keine elementare Form der Inversion der Verteilungsfunktion, bezogen auf ihr erstes Argument, bekannt. Ausser dem punktweisen Berechnen der Inversion gibt es aber noch folgende Möglichkeit:

Man findet für   dass zum Beispiel folgende Ausdrücke der Verteilungsfunktion kaum (< 1 %) von   abhängen:

 
 
 

Allgemein liegt für hohe Werte von p > 0.9 die Verteilungsfunktion   sehr nahe bei p, wobei   das einseitige Quantil der Standardnormalverteilung darstellt und   als Funktion der Wahrscheinlichkeit p durch   bestimmt ist. Die rechte Seite der Gleichung für   entsteht aus der Umkehrfunktion des Fehlerintegrals  . Der Ansatz für   in   ist zunächst motiviert durch die Tatsache, dass die Poisson-Verteilung für grosse   in eine Normalverteilung mit   übergeht. Das zusätzliche   verbessert die Konstanz der Verteilungsfunktion bei kleinem  

Für Mittelwerte   wird mit Wahrscheinlichkeit p = 0.99 (99 %) maximal 1 Ereignis auftreten. Ist   grösser, dann berechnet sich die mit Wahrscheinlichkeit p zu erwartende grösste Häufigkeit von Ereignissen   in guter Näherung aus der einfachen Formel

 

Bei deutlich nicht ganzzahligem Ergebnis empfiehlt es sich aufzurunden. Damit wird bei vielfachen Wiederholungen (oder anders formuliert: auf lange Sicht) die Wahrscheinlichkeit, mit der Zahl der Ereignisse unter der Grenze zu bleiben, etwas erhöht. Mit p = 0.95 (entspricht  ) und   sind also nicht mehr als   Ereignisse zu erwarten.

Zufallszahlen

Zufallszahlen zur Poisson-Verteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt.

Literatur

  • Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. Vandenhoeck und Ruprecht, Göttingen 1974, ISBN 3-525-03114-9.
  • Frodesen, Skjeggestad, Tofte: Probabibility and Statistics in Particle Physics, Universitetsforlaget, Bergen - Oslo - Tromsö
Wikibooks: Poissonverteilung (für Anfänger) – Lern- und Lehrmaterialien