Satz von Bayes

mathematischer Satz aus der Wahrscheinlichkeitstheorie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 13. August 2003 um 12:28 Uhr durch Nerd (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.


Ich hoffe, dass irgendwann Darstellungen der bayesschen Regel gefunden werden, die den recht verstandenen Ansprüchen der Schule und der Lehrerausbildung genügen. -- H. Dinges

Das Bayes' theorem (oder auch Satz von Bayes) ist ein Ergebnis der Wahrscheinlichkeitstheorie, benannt nach Mathematiker Thomas Bayes, der es aus einer speziellen Studie im 18. Jahrhundert entwickelte.


Der Satz von Bayes

Satz von Bayes ist ein Satz zum Rechnen mit bedingten Wahrscheinlichkeiten:

 

Hierbei ist   die a-priori Wahrscheinlichkeit für ein Ereignis   und   die so genannte Likelihood Wahrscheinlichkeit für ein Ereignis   gegeben  . Die Korrektheit des Satzes folgt unmittelbar aus der Definition der bedingten Wahrscheinlichkeit.


Der Satz von Bayes erlaubt in gewissem Sinn das Umkehren von Schlussfolgerungen:

Allgemein

  • von einem positiven medizinischen Testergebnis wird auf das Vorhandensein einer Krankheit gschlosssen. Der Bayes'sche Ansatz gibt die Wahrscheinlichkeit dafür an, dass ein Kandidat zu einer Gruppe gesuchter Merkmalsträger (z.B. TBC-Träger) gehört unter der Bedingung, dass der Kandidat ein Kriterium (z.B. röntgen-positiv) erfüllt und er willkürlich aus der Population herausgegriffen wird.
  • von 10 charakterischtischen Wörtern in einer Mail, wird auf die Eigenschaft "Spam" zu sein, geschlossen.

konkretes Anwendungsbeispiel

In einem medizinischen Beispiel sei das Ereignis  , dass ein Patient eine schwere seltene ( ) Krankheit hat.

  bezeichne die Tatsache, dass der Patient positiv auf die Krankheit getestet worden ist.

Die Aufgabe kann entweder

  • durch Berechnen oder
  • durch einen Entscheidnungsbaum gelöst werden

Rechnen mit dem Satz von Bayes

Der Hersteller des Tests versichtert, dass der Test eine Krankheit zu 99.9% erkennt ( ) und nur in 1% der Fälle falsch anschlägt ( ).

  • Die Frage ist: Gegeben ein positiv getesteter Patient, wie wahrscheinlich ist er an der seltenen Krankheit erkrankt?


Nach dem Satz von oben finden wir

 


d.h. der Patient hat eine Chance von 98% gesund zu sein, obwohl der Test ihn als krank einschätzte (dies gilt natürlich nur unter der Annahme, dass nicht weitere Tatsachen auf eine Erkrankung hindeuten oder gegen diese sprechen).


Der Satz von Bayes im Entscheidungsbaum

Das Bayes-Theorems dient zum Rechnen mit bedingten Wahrscheinlichkeiten, er ist nicht leicht intuitiv verständlich. Die gleiche Aufgabe lässt sich im Entscheidungsbaum darstellen. Die "fehlenden" Angaben lassen sich ungleich einfacher einsetzen. Das Diagramm "rechnet mit".

                    10 000
                  /      \
                 /        \ 
                /          \ 
              2(krank)    9 998 (gesund)
              /\             /\
             /  \           /  \
            /    \         /    \
           /      \       /      \
Test-     0       2     100      9898
ergebnis  -       +     +        -

Ergebnis: 2+100=102 haben ein positives Ergebnis, obwohl 100 von ihnen gesund sind. Die Angabe erfolt hier in absoluten Häufigkeit

Vergleich Berechnung und Entscheidungsbaum

  • Bayes Formel: 0.019
  • Entscheidungsbaum: 2/102=0,0196

Die Berechung im Entscheidungsbaum erfolgt ohne Rechner, es gibt kleine Rundnugsfehler. Die Ergebnisses sind ident.




  • W(H| D,I) = W(D| H,I) * W(H| I) / W(D| I) Das so genannte Bayes-Theorem

Dabei bedeutet:

I: Alle Hintergrundinformationen. Es ist wichtig, dass man alle Informationen, die man genutzt hat, auch explizitiert, damit darüber keine Unklarheiten entstehen. So kann man unnötigen Debatten über die Schlussfolgerungen zuvorkommen.

Beachte, dass das Bayes-Theorem folgt, wenn man die Produktregel (3) sowohl für H als auch für D aufschreibt. 'I' hätte auch bereits in (3) eingeführt werden können.

Das Bayes-Theorem ist insbesondere in der Datenanalyse nützlich. In diesem Falle sollte man 'H' als 'Hypothese' verstehen und 'D' als Daten. Man will wissen, in welchem Maße man erwarten kann, dass eine Hypothese H richtig ist unter der Voraussetzung, dass bestimmte Daten D beobachtet wurden.

Verständnisproblem des Bayes-Theorem

Für eine Lösung einer Aufgabe muss die Informationen aus einem Aufgabentext als solche erkannt, kodiert und richtig notiert werden. Weiters müssen die "fehlenden" Wahrscheinlichkeiten ergänzt werden.

Die gleichen Informationen, die vielen schwer verständlich sind erscheinen , können auch ohne bedingte Wahrscheinlichkeiten aufbereitet werden, wie in absolute Häufigkeit aufgeführt. Typische Verständisprobleme im Umgang mit bedingten Wahrscheinlichkeiten sind (Quelle:mpib-berlin.mpg.de):

  1. Verwechslung von Konditionalität und Kausalität
  2. Verwechslung von bedingter und konjunktiver Wahrscheinlichkeit
  3. Verwechslung von bedingtem und bedingendem Ereignis
  4. Schwierigkeiten bei der exakten Definition des bedingenden Ereignisses (z.B. beim "Ziegenproblem")
  5. Missverstehen der Fragestellung durch mangelndes Grundverständnis für bedingte Wahrscheinlichkeiten, zu komplizierte Formulierung u.ä.