Zum Inhalt springen

Bayessches Netz

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 8. März 2004 um 17:46 Uhr durch RobM (Diskussion | Beiträge) (nur ein Anfang, da muss noch viel gemacht werden). Sie kann sich erheblich von der aktuellen Version unterscheiden.
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Definition und Zweck Bayesscher Netze

Ein Bayessches Netz(werk) ist ein gerichteter azyklischer Graph (DAG), in dem die Knoten Zufallsvariablen und die Kanten bedingte Abhängigkeiten zwischen den Variablen beschreiben. Jedem Knoten des Netzes ist eine bedingte Wahrscheinlichkeitsverteilung der durch ihn repräsentierten Zufallsvariable gegeben die Zufallsvariablen an den Elternknoten zugeordnet. Diese Verteilung kann beliebig sein, jedoch wird häufig mit diskreten oder Normalverteilungen gearbeitet. Eltern eines Knotens v sind diejenigen Knoten, von denen eine Kante zu v führt.

Ein Bayessches Netz dient dazu, die gemeinsame Wahrscheinlichkeitsverteilung aller beteiligten Variablen unter Ausnutzung bekannter bedingter Unabhängigkeiten möglichst kompakt zu repräsentieren.

Sind einige der im Graphen vorkommenden Zufallsvariablen, so berechnet sich deren gemeinsame Verteilung als

Hat ein Knoten keine Eltern, so handelt es sich bei der assoziierten Wahrscheinlichkeitsverteilung um eine unbedingte Verteilung.

Inferenz in Bayesschen Netzen

Ist von manchen der Variablen, etwa der Wert bekannt, d.h. liegt Evidenz vor, so kann mit Hilfe verschiedener Algorithmen auch die bedingte Wahrscheinlichkeitsverteilung von gegeben berechnet und damit Inferenz betrieben werden.

Exakte Inferenz

Zur exakten Inferenz in Bayesschen Netzen eignen sich u.a. folgende Algorithmen:

  • Variablenelimination
  • Clustering-Algorithmen

Diese Algorithmen müssen noch genauer beschrieben werden

Approximative Inferenz

Sind exakte Inferenzverfahren zu ineffizient (Inferenz in Bayesschen Netzen ist NP-schwer) und fällt der Fehler, der bei approximativer Inferenz möglich ist, gegenüber einem bereits in den vorliegenden Daten enthaltenen Fehler nicht ins Gewicht, so bieten sich approximative Verfahren an:

  • Rejection sampling
  • Likelihood weighting
  • Markov chain Monte Carlo
  • Gibbs sampling

Diese Algorithmen müssen noch genauer beschrieben werden

Lernen Bayesscher Netze

Soll aus vorliegenden Daten automatisch ein Bayessches Netz generiert werden, das die Daten möglichst gut beschreibt, so stellen sich zwei mögliche Probleme: entweder ist die Graphenstruktur des Netzes bereits gegeben und man muss sich nicht mehr um die Ermittlung bedingter Unabhängigkeiten, sondern nur noch um die Berechnung der bedingten Wahrscheinlichkeitsverteilungen an den Knoten des Netzes kümmern, oder man muss neben den Parametern auch eine Struktur eines geeigneten Netzes lernen.

Parameterlernen

hier müssen noch einige Parameterlernalgorithmen erwähnt und beschrieben werden, unter Berücksichtigung fehlender Daten, ...

Strukturlernen

hier müssen noch einige Strukturlernalgorithmen erwähnt und beschrieben werden, ...

Bedingte Unabhängigkeit

Zur Ermittlung bedingter Unabhängigkeiten zweier Variablenmengen gegeben eine dritte solche Menge genügt es, die Graphenstruktur des Netzes zu untersuchen. Man kann zeigen, dass der (graphentheoretische) Begriff der d-Separation mit dem Begriff der bedingten Unabhängigkeit zusammenfällt.

Anwendung

Bayessche Netze werden eingesetzt, um Wissen zu modellieren, wobei die Anwendungsgebiete unter anderem in Medizin und Ingenieurswissenschaften liegen.

Literatur

  • Finn V. Jensen, Bayesian Networks and Decision Graphs. Springer-Verlag, New York, 2001.
  • Enrique Castillo, Jose Manuel Gutierrez, Ali S. Hadi, Expert Systems and Probabilistic Network Models. Springer-Verlag, New York, 1997.