Bayessches Netz
Definition und Zweck Bayesscher Netze
Ein Bayessches Netz(werk) ist ein gerichteter azyklischer Graph (DAG), in dem die Knoten Zufallsvariablen und die Kanten bedingte Abhängigkeiten zwischen den Variablen beschreiben. Jedem Knoten des Netzes ist eine bedingte Wahrscheinlichkeitsverteilung der durch ihn repräsentierten Zufallsvariable gegeben die Zufallsvariablen an den Elternknoten zugeordnet. Diese Verteilung kann beliebig sein, jedoch wird häufig mit diskreten oder Normalverteilungen gearbeitet. Eltern eines Knotens v sind diejenigen Knoten, von denen eine Kante zu v führt.
Ein Bayessches Netz dient dazu, die gemeinsame Wahrscheinlichkeitsverteilung aller beteiligten Variablen unter Ausnutzung bekannter bedingter Unabhängigkeiten möglichst kompakt zu repräsentieren.
Sind einige der im Graphen vorkommenden Zufallsvariablen, so berechnet sich deren gemeinsame Verteilung als
Hat ein Knoten keine Eltern, so handelt es sich bei der assoziierten Wahrscheinlichkeitsverteilung um eine unbedingte Verteilung.
Inferenz in Bayesschen Netzen
Ist von manchen der Variablen, etwa der Wert bekannt, d.h. liegt Evidenz vor, so kann mit Hilfe verschiedener Algorithmen auch die bedingte Wahrscheinlichkeitsverteilung von gegeben berechnet und damit Inferenz betrieben werden.
Exakte Inferenz
Zur exakten Inferenz in Bayesschen Netzen eignen sich u.a. folgende Algorithmen:
- Variablenelimination
- Clustering-Algorithmen
Diese Algorithmen müssen noch genauer beschrieben werden
Approximative Inferenz
Sind exakte Inferenzverfahren zu ineffizient (Inferenz in Bayesschen Netzen ist NP-schwer) und fällt der Fehler, der bei approximativer Inferenz möglich ist, gegenüber einem bereits in den vorliegenden Daten enthaltenen Fehler nicht ins Gewicht, so bieten sich approximative Verfahren an:
- Rejection sampling
- Likelihood weighting
- Markov chain Monte Carlo
- Gibbs sampling
Diese Algorithmen müssen noch genauer beschrieben werden
Lernen Bayesscher Netze
Soll aus vorliegenden Daten automatisch ein Bayessches Netz generiert werden, das die Daten möglichst gut beschreibt, so stellen sich zwei mögliche Probleme: entweder ist die Graphenstruktur des Netzes bereits gegeben und man muss sich nicht mehr um die Ermittlung bedingter Unabhängigkeiten, sondern nur noch um die Berechnung der bedingten Wahrscheinlichkeitsverteilungen an den Knoten des Netzes kümmern, oder man muss neben den Parametern auch eine Struktur eines geeigneten Netzes lernen.
Parameterlernen
hier müssen noch einige Parameterlernalgorithmen erwähnt und beschrieben werden, unter Berücksichtigung fehlender Daten, ...
Strukturlernen
hier müssen noch einige Strukturlernalgorithmen erwähnt und beschrieben werden, ...
Bedingte Unabhängigkeit
Zur Ermittlung bedingter Unabhängigkeiten zweier Variablenmengen gegeben eine dritte solche Menge genügt es, die Graphenstruktur des Netzes zu untersuchen. Man kann zeigen, dass der (graphentheoretische) Begriff der d-Separation mit dem Begriff der bedingten Unabhängigkeit zusammenfällt.
Anwendung
Bayessche Netze werden eingesetzt, um Wissen zu modellieren, wobei die Anwendungsgebiete unter anderem in Medizin und Ingenieurswissenschaften liegen.
Literatur
- Finn V. Jensen, Bayesian Networks and Decision Graphs. Springer-Verlag, New York, 2001.
- Enrique Castillo, Jose Manuel Gutierrez, Ali S. Hadi, Expert Systems and Probabilistic Network Models. Springer-Verlag, New York, 1997.