Bayessches Netz

Definition und Zweck Bayesscher Netze

Ein Bayessches Netz(werk) ist ein gerichteter azyklischer Graph (DAG), in dem die Knoten Zufallsvariablen und die Kanten bedingte Abhängigkeiten zwischen den Variablen beschreiben. Jedem Knoten des Netzes ist eine bedingte Wahrscheinlichkeitsverteilung der durch ihn repräsentierten Zufallsvariable gegeben die Zufallsvariablen an den Elternknoten zugeordnet. Diese Verteilung kann beliebig sein, jedoch wird häufig mit diskreten oder Normalverteilungen gearbeitet. Eltern eines Knotens v sind diejenigen Knoten, von denen eine Kante zu v führt.

Ein Bayessches Netz dient dazu, die gemeinsame Wahrscheinlichkeitsverteilung aller beteiligten Variablen unter Ausnutzung bekannter bedingter Unabhängigkeiten möglichst kompakt zu repräsentieren.

Sind $X_{1},\dots ,X_{n}$ einige der im Graphen vorkommenden Zufallsvariablen, so berechnet sich deren gemeinsame Verteilung als

$P(X_{1},\dots ,X_{n})=\prod _{i=1}^{n}P(X_{i}|parents(X_{i}))$

Hat ein Knoten keine Eltern, so handelt es sich bei der assoziierten Wahrscheinlichkeitsverteilung um eine unbedingte Verteilung.

Inferenz in Bayesschen Netzen

Ist von manchen der Variablen, etwa $E_{1},\dots ,E_{m}$ der Wert bekannt, d.h. liegt Evidenz vor, so kann mit Hilfe verschiedener Algorithmen auch die bedingte Wahrscheinlichkeitsverteilung von $X_{1},\dots ,X_{n}$ gegeben $E_{1}=e_{1},\dots ,E_{m}=e_{m}$ berechnet und damit Inferenz betrieben werden.

Exakte Inferenz

Zur exakten Inferenz in Bayesschen Netzen eignen sich u.a. folgende Algorithmen:

Variablenelimination
Clustering-Algorithmen

Diese Algorithmen müssen noch genauer beschrieben werden

Approximative Inferenz

Sind exakte Inferenzverfahren zu ineffizient (Inferenz in Bayesschen Netzen ist NP-schwer) und fällt der Fehler, der bei approximativer Inferenz möglich ist, gegenüber einem bereits in den vorliegenden Daten enthaltenen Fehler nicht ins Gewicht, so bieten sich approximative Verfahren an:

Rejection sampling
Likelihood weighting
Markov chain Monte Carlo
Gibbs sampling

Diese Algorithmen müssen noch genauer beschrieben werden

Lernen Bayesscher Netze

Soll aus vorliegenden Daten automatisch ein Bayessches Netz generiert werden, das die Daten möglichst gut beschreibt, so stellen sich zwei mögliche Probleme: entweder ist die Graphenstruktur des Netzes bereits gegeben und man muss sich nicht mehr um die Ermittlung bedingter Unabhängigkeiten, sondern nur noch um die Berechnung der bedingten Wahrscheinlichkeitsverteilungen an den Knoten des Netzes kümmern, oder man muss neben den Parametern auch eine Struktur eines geeigneten Netzes lernen.

Parameterlernen

hier müssen noch einige Parameterlernalgorithmen erwähnt und beschrieben werden, unter Berücksichtigung fehlender Daten, ...

Strukturlernen

hier müssen noch einige Strukturlernalgorithmen erwähnt und beschrieben werden, ...

Bedingte Unabhängigkeit

Zur Ermittlung bedingter Unabhängigkeiten zweier Variablenmengen gegeben eine dritte solche Menge genügt es, die Graphenstruktur des Netzes zu untersuchen. Man kann zeigen, dass der (graphentheoretische) Begriff der d-Separation mit dem Begriff der bedingten Unabhängigkeit zusammenfällt.

Anwendung

Bayessche Netze werden eingesetzt, um Wissen zu modellieren, wobei die Anwendungsgebiete unter anderem in Medizin und Ingenieurswissenschaften liegen.

Literatur

Finn V. Jensen, Bayesian Networks and Decision Graphs. Springer-Verlag, New York, 2001.
Enrique Castillo, Jose Manuel Gutierrez, Ali S. Hadi, Expert Systems and Probabilistic Network Models. Springer-Verlag, New York, 1997.