Zum Inhalt springen

Markow-Kette

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Markowkette)

Eine Markow-Kette (englisch Markov chain; nach Andrei Andrejewitsch Markow; andere Schreibweisen Markov-Kette, Markoff-Kette, Markof-Kette) ist ein stochastischer Prozess. Ziel bei der Anwendung von Markow-Ketten ist es, Wahrscheinlichkeiten für das Eintreten nachfolgender Ereignisse anzugeben. Eine Markow-Kette ist darüber definiert, dass durch Kenntnis einer nur begrenzten Vorgeschichte ebenso gute Prognosen über die zukünftige Entwicklung möglich sind wie bei Kenntnis der gesamten Vorgeschichte des Prozesses. Diese sogenannte Markow-Eigenschaft (Gedächtnislosigkeit) erlaubte erstmals die mathematisch präzise Modellierung vieler realer Prozesse, etwa in Physik, Informatik, Biologie oder Finanzwesen. Dabei verbindet die Theorie Konzepte der Wahrscheinlichkeit mit Methoden der linearen Algebra, was weitreichende Analysemöglichkeiten eröffnet, etwa zur Bestimmung stationärer Verteilungen.

Einführende Beispiele

[Bearbeiten | Quelltext bearbeiten]

Markow-Ketten eignen sich sehr gut, um zufällige Zustandsänderungen eines Systems zu modellieren, falls man Grund zu der Annahme hat, dass die Zustandsänderungen nur über einen begrenzten Zeitraum hinweg Einfluss aufeinander haben oder sogar gedächtnislos sind. Ein Beispiel sind Auslastungen von Bediensystemen mit gedächtnislosen Ankunfts- und Bedienzeiten.

Diskrete, endliche Markow-Kette

[Bearbeiten | Quelltext bearbeiten]

Ein populäres Beispiel für eine zeitdiskrete Markow-Kette mit endlichem Zustandsraum ist die zufällige Irrfahrt auf einem diskreten Kreis, modelliert durch den Restklassenring . Der Zustandsraum ist durch gegeben. Ausgangspunkt ist die Äquivalenzklasse , wobei der Prozess in jedem Schritt aus dem aktuellen Zustand mit Wahrscheinlichkeit entweder in den Zustand oder übergeht. Die Addition und Subtraktion erfolgt dabei modulo , wodurch die zyklische Struktur des Zustandsraums gewährleistet ist. Dieser stochastische Prozess erfüllt die Markow-Eigenschaft, da der nächste Zustand ausschließlich vom aktuellen Zustand abhängt und nicht von den vorherigen Zuständen.

Diskrete, unendliche Markow-Kette

[Bearbeiten | Quelltext bearbeiten]

Als Beispiel für einen abzählbar unendlichen Zustandsraum wirft man eine Münze immer wieder und notiert bei jedem Wurf, wie oft bislang ‚Kopf‘ erschienen ist. Die Abfolge der so gebildeten Zahlen bildet eine (zeitdiskrete) Markow-Kette, diesmal mit Zustandsraum mit jeweils der Übergangswahrscheinlichkeit für den Übergang von nach und für das Verbleiben in .

Ein weiteres Beispiel für eine Markow-Kette mit unendlichem Zustandsraum ist der Galton-Watson-Prozess, der oftmals zur Modellierung von Populationen genutzt wird.

Diskrete Zeit und höchstens abzählbar unendliche Zustandsmenge

[Bearbeiten | Quelltext bearbeiten]

Gegeben sei eine Familie von Zufallsvariablen , wobei alle nur Werte aus dem höchstens abzählbaren Zustandsraum annehmen. Dann heißt eine (diskrete) Markow-Kette genau dann, wenn

gilt. Die Übergangswahrscheinlichkeiten hängen also nur von dem aktuellen Zustand ab und nicht von der gesamten Vergangenheit. Dies bezeichnet man als Markow-Eigenschaft oder auch als Gedächtnislosigkeit. Seien

die Übergangswahrscheinlichkeiten. Diese lassen sich dann in eine quadratische Übergangsmatrix zusammenfassen:

Sind die Übergangswahrscheinlichkeiten unabhängig vom Zeitpunkt , gilt also für alle , so heißt die Markow-Kette homogen oder Kette mit stationären Übergangswahrscheinlichkeiten. Bei Homogenität einer Kette definiert man als die -Schritt-Übergangswahrscheinlichkeit.

Markow-Kette n-ter Ordnung

[Bearbeiten | Quelltext bearbeiten]

Gelegentlich werden auch Markow-Ketten -ter Ordnung untersucht. Bei diesen hängt der zukünftige Zustand von den vorherigen Zuständen ab:

In diesem Sinn sind die oben betrachteten Markow-Ketten Ketten erster Ordnung. Ketten höherer Ordnung werden hier aber nicht weiter betrachtet.

Diskrete Zeit und allgemeiner Zustandsraum

[Bearbeiten | Quelltext bearbeiten]

Markow-Ketten können auch auf allgemeinen messbaren Zustandsräumen definiert werden. Ist der Zustandsraum nicht abzählbar, so benötigt man hierzu den stochastischen Kern als Verallgemeinerung zur Übergangsmatrix. Dabei ist eine Markow-Kette durch die Startverteilung auf dem Zustandsraum und den stochastischen Kern schon eindeutig bestimmt. Auf dem Gebiet der Markow-Ketten gibt es noch viele offene Probleme. Gut erforscht sind lediglich Harris-Ketten.

  • Die Verteilung von wird manchmal auch als Startverteilung oder Anfangsverteilung bezeichnet. Bei Vorgabe einer Startverteilung sind alle weiteren Verteilungen eindeutig bestimmt. Daher hat sich teilweise die verkürzte Notation eingebürgert, nur die Startverteilung und den Zeitschritt von Interesse anzugeben:
Startet man in einem eindeutigen Zustand , so wird meist geschrieben.
  • Bei einem endlichen Zustandsraum lassen sich Markow-Ketten mittels der Übergangsmatrix und von Wahrscheinlichkeitsvektoren beschreiben. Wählt man einen stochastischen Startvektor (als Zeilenvektor) als Startverteilung, so ergibt sich die Verteilung zum Zeitpunkt 1 durch . Damit folgt induktiv . Dabei ist dann genau der -te Eintrag von die Wahrscheinlichkeit zum Zeitpunkt im Zustand zu sein, wenn mit der Startverteilung gestartet wurde. Demgemäß lassen sich im Falle der Homogenität und der Endlichkeit des Zustandsraumes leicht die -Schritt-Übergangswahrscheinlichkeiten berechnen. Diese sind dann genau
,
also der Eintrag, der in der -ten Zeile und der -ten Spalte der -ten Potenz der Übergangsmatrix steht.
  • Allgemein gilt die Chapman-Kolmogorow-Gleichung. Im Falle eines endlichen Zustandsraumes ist sie genau das komponentenweise Ausschreiben der Matrixmultiplikation.
  • Markow-Ketten sind diskrete dynamische Systeme mit Zeitraum , der Indexmenge. Den Zustandsraum im Sinne des dynamischen Systems bilden dann alle Verteilungen auf dem Zustandsraum im Sinne der Markow-Kette. Die Operation ordnet dann der Verteilung im -ten Zeitschritt die Verteilung im -ten Zeitschritt zu. Im Falle eines endlichen Zustandsraumes der Markow-Kette ist dies dann genau die iterierte Anwendung der Übergangsmatrix wie oben beschrieben. Einige Begriffe aus der Theorie der dynamischen Systeme haben ein Pendant in der Theorie der Markow-Ketten wie z. B. kritische Punkte und stationäre Verteilungen.
  • Die oben definierte Übergangsmatrix ist unendlichdimensional, wenn der Zustandsraum abzählbar unendlich ist. Nur im Falle der Endlichkeit des Zustandsraumes handelt es sich um eine Matrix im Sinne der Linearen Algebra.

Endlicher Zustandsraum

[Bearbeiten | Quelltext bearbeiten]
Übergangsgraph für die beschriebene Markow-Kette

Wir versuchen, mithilfe einer Markow-Kette eine einfache Wettervorhersage zu bilden. Dazu kodieren wir 1 = „die Sonne scheint“, 2 = „es ist bewölkt“ und 3 = „es regnet“. Als Zeitschritt wählen wir einen Tag. Aus Erfahrung wissen wir, dass wenn heute die Sonne scheint, die Wahrscheinlichkeit, dass es morgen regnet, ungefähr 80 % ist und die Wahrscheinlichkeit, dass es bewölkt ist, ca. 20 % beträgt. Außerdem treffen wir die Annahme, dass sich diese Wahrscheinlichkeiten nicht ändern, die Markow-Kette also homogen ist. Somit wissen wir nun

Ist es aber bewölkt, so regnet es mit Wahrscheinlichkeit 0,5 am folgenden Tag und mit Wahrscheinlichkeit von 0,5 scheint die Sonne. Es gilt also

Regnet es heute, so scheint danach nur mit Wahrscheinlichkeit von 0,1 die Sonne und mit Wahrscheinlichkeit von 0,9 ist es bewölkt. Damit folgt für die Übergangswahrscheinlichkeiten

Damit ist die Markow-Kette vollständig beschrieben. Anschaulich lassen sich solche Markow-Ketten gut durch Übergangsgraphen darstellen, wie oben abgebildet. Ordnet man nun die Übergangswahrscheinlichkeiten zu einer Übergangsmatrix an, so erhält man

Wir wollen nun wissen, wie sich das Wetter entwickeln wird, wenn heute die Sonne scheint. Dazu geben wir die Anfangsverteilung vor in Form des stochastischen Startvektors . Wir starten also im Zustand 1. Multiplikation von rechts mit der Übergangsmatrix liefert . Mit achtzigprozentiger Wahrscheinlichkeit regnet es also. Am dritten Tag gilt . Somit ist die Regenwahrscheinlichkeit am dritten Tag knapp über 50 % und die Sonnenwahrscheinlichkeit knapp unter 40 %. Somit lässt sich für jedes vorgegebene Wetter am Starttag die Regen- und Sonnenwahrscheinlichkeit an einem beliebigen Tag angeben. Auch Fragestellungen wie: „Heute scheint die Sonne. Wie groß ist die Wahrscheinlichkeit, dass es vor drei Tagen geregnet hat?“ lassen sich mit dem Satz von Bayes beantworten.

Abzählbar unendlicher Zustandsraum

[Bearbeiten | Quelltext bearbeiten]

Definieren wir nun eine Markow-Kette auf dem Zustandsraum und mit Übergangswahrscheinlichkeiten

wobei , gelten. Dies lässt sich so veranschaulichen: Startet man an einem beliebigen Punkt, so bewegt man sich entweder mit einer Wahrscheinlichkeit von nach „rechts“, sprich, begibt sich zur Nachfolgerzahl. Mit Wahrscheinlichkeit wandert man nach „links“ zur Vorgängerzahl. Entsprechend diesem Vorgehen irrt man dann über die Zahlengerade. Daher wird diese Markow-Kette auch Irrfahrt auf genannt. Gelegentlich wird für solche Markow-Ketten auch der Begriff des Random Walk verwendet. Starten wir im Zustand 0, so ist mit den obigen Übergangswahrscheinlichkeiten

Daraus folgen dann , , . Hier zeigt sich ein gewisser Zusammenhang zur Binomialverteilung. Außerdem gilt aber auch . Gewisse Zustände können also nur zu bestimmten Zeiten besucht werden; diese Eigenschaft wird Periodizität genannt.

Ist allgemeiner eine Folge unabhängiger und identisch verteilter Zufallsvariablen mit Werten in , dann ist durch

eine Markow-Kette mit Übergangswahrscheinlichkeiten gegeben.

Klassische Beispiele

[Bearbeiten | Quelltext bearbeiten]

Einige der bekanntesten Markow-Ketten sind

  • Die Irrfahrt auf sowie Verallgemeinerungen auf Graphen.
  • Der Galton-Watson-Prozess, welcher die Fortpflanzung einer sich eingeschlechtlich fortpflanzenden Spezies modelliert.
  • Das Ehrenfest-Modell zur Modellierung der Diffusion von Molekülen durch Membrane.
  • Das Wright-Fisher-Modell zur Modellierung der Genhäufigkeit in einer Population.[1]

Markow-Ketten können gewisse Eigenschaften zukommen, welche insbesondere das Langzeitverhalten beeinflussen. Dazu gehören beispielsweise die folgenden:

Irreduzibilität

[Bearbeiten | Quelltext bearbeiten]

Irreduzibilität ist wichtig für die Konvergenz gegen einen stationären Zustand. Vereinfacht gesagt ist eine Markow-Kette irreduzibel, wenn für alle Zustände und gilt, dass die Wahrscheinlichkeit, in endlicher Zeit von nach zu kommen, echt positiv ist. Gilt dies für fixierte und , so sagt man auch, dass und miteinander kommunizieren.

Periodische Markow-Ketten erhalten trotz aller Zufälligkeit des Systems gewisse deterministische Strukturen. Ist eine Markow-Kette periodisch mit Periode , so kann sie höchstens alle Zeitschritte wieder zu ihrem Startpunkt zurückkehren (dies ist aber nicht zwingend).

Rekurrenz und Transienz

[Bearbeiten | Quelltext bearbeiten]

Die Rekurrenz und die Transienz beschreiben das Langzeitverhalten einer Markow-Kette. Wird ein Zustand fast sicher unendlich oft besucht, so heißt er rekurrent, ansonsten transient. Sind alle Zustände rekurrent (transient), so heißt die Markow-Kette rekurrent (transient). Wichtiges Hilfsmittel zur Bestimmung von Rekurrenz ist die Green-Funktion.

Eine (endliche) zufällige Irrfahrt mit zwei absorbierenden Zuständen (ganz links und ganz rechts). Die Zustände „–1“, „0“ und „1“ haben jeweils die gleiche Übergangswahrscheinlichkeit (0,5) zu den Zuständen links und rechts von ihnen.

Absorbierende Zustände

[Bearbeiten | Quelltext bearbeiten]

Absorbierende Zustände sind Zustände, welche nach dem Betreten nicht wieder verlassen werden können. Hier interessiert man sich insbesondere für die Absorptionswahrscheinlichkeit, also die Wahrscheinlichkeit, einen solchen Zustand zu betreten.

Stationäre Verteilungen

[Bearbeiten | Quelltext bearbeiten]

In der Anwendung sind oftmals besonders stationäre Verteilungen interessant. Gibt man diese Verteilungen als Startverteilung von vor, so sind alle darauf folgenden Verteilungen der Zustände für beliebiges gleich der Startverteilung. Interessant ist hier die Frage, wann solche Verteilungen existieren und wann eine beliebige Verteilung gegen solch eine stationäre Verteilung konvergiert.

Homogene Markow-Ketten mit einer stationären Verteilung als Startverteilung sind stark stationäre stochastische Prozesse. Somit sind zeitdiskrete Markow-Ketten mit abzählbarem Zustandsraum maßerhaltende dynamische Systeme, wenn sie in ihrer invarianten Verteilung starten. Sind sie zusätzlich positiv rekurrent sowie irreduzibel, so sind sie sogar ergodische stochastische Prozesse und erlauben die Anwendung von Aussagen der Ergodentheorie wie zum Beispiel des individuellen Ergodensatzes.

Reversibilität

[Bearbeiten | Quelltext bearbeiten]

Bei reversiblen Markow-Ketten lässt sich nicht unterscheiden, ob sie in der Zeit vorwärts oder rückwärts laufen, sie sind also invariant unter Zeitumkehr. Insbesondere folgt aus Reversibilität die Existenz eines stationären Zustandes.

Oft hat man in Anwendungen eine Modellierung vorliegen, in welcher die Zustandsänderungen der Markow-Kette durch eine Folge von zu zufälligen Zeiten stattfindenden Ereignissen bestimmt wird (man denke an obiges Beispiel von Bediensystemen mit zufälligen Ankunfts- und Bedienzeiten). Hier muss bei der Modellierung entschieden werden, wie das gleichzeitige Auftreten von Ereignissen (Ankunft vs. Erledigung) behandelt wird. Meist entscheidet man sich dafür, künstlich eine Abfolge der gleichzeitigen Ereignisse einzuführen. Üblicherweise unterscheidet man dabei zwischen den Möglichkeiten Arrival First und Departure First.

Arrival First (AF)

[Bearbeiten | Quelltext bearbeiten]

Bei dieser Disziplin wird zu Beginn eines Zeitschrittes das Bedienen gestartet. Danach treffen neue Forderungen ein, und erst am Ende eines Zeitschrittes tritt das Bedien-Ende auf.

Der Vorteil dieser Disziplin ist, dass Forderungsankünfte immer vor einem möglichen Bedien-Ende eintreffen und damit die PASTA-Eigenschaft (Poisson Arrivals See Time Averages) gilt. Mit Hilfe dieser Eigenschaft lassen sich für Ankünfte, die als Bernoulli-Prozess modelliert sind, unter anderem sehr einfach für Bediensysteme wichtige Eigenschaften wie die Verlustwahrscheinlichkeit berechnen.

Als Nachteil kann eine Forderung, die im Zeitschlitz eintrifft, frühestens in fertig bedient werden. Dies führt unter Umständen zu einer höheren Anzahl von benötigten Warteplätzen im modellierten System.

Departure First (DF)

[Bearbeiten | Quelltext bearbeiten]

Im Fall von Departure First kommen zu Beginn eines Zeitschrittes Forderungen im System an. Darauf folgt der Start von Bedienzeiten und am Ende eines Zeitschrittes das Ende von Bedienzeiten.

Bei diesem Ansatz gilt die PASTA Eigenschaft nicht mehr, was im Allgemeinen zu komplizierteren Berechnungen als im Falle von Arrival First führt. Eine Forderung kann im selben Zeitschritt eintreffen und fertig bedient werden.

Diskrete Markow-Ketten mit endlichem Zustandsraum können leicht simuliert werden, wenn Standardzufallszahlen verfügbar sind. Dazu definiert man

für alle . Ist nun , dann setze genau dann, wenn ist. Dieses Verfahren ist insbesondere dann effizient, wenn wenige ungleich null sind. Es entspricht der Inversionsmethode mit der Wahrscheinlichkeitsfunktion . Die Möglichkeit, auch große Markow-Ketten zu simulieren, macht man sich beim MCMC-Verfahren zunutze, um Verteilungen zu simulieren, die nicht durch klassische Verfahren simuliert werden können.

Markow-Ketten werden in unterschiedlichen Bereichen verwendet.

Markow selbst nutzte sie 1913 zur statistischen Untersuchung des Versepos Eugen Onegin[3][4] und 1924 des Textes Kinderjahre Bagrows des Enkels von Sergei Timofejewitsch Aksakow.[5][6]

  • Pierre Brémaud: Markov Chains. Springer Verlag, 1999, ISBN 0-387-98509-3.
  • Ehrhard Behrends: Introduction to Markov Chains. Vieweg, 2000, ISBN 3-528-06986-4.
  • Kai Lai Chung: Markov Chains: With Stationary Transition Probabilities (= Grundlehren der Mathematischen Wissenschaften Ser. v.104). 2nd ed Auflage. Springer Berlin / Heidelberg, Berlin, Heidelberg 1967, ISBN 978-3-540-03822-1 (englisch).
  • Franz Ferschl: Markovketten (= Lecture Notes in Economics and Mathematical Systems Ser. v.35). Springer Berlin / Heidelberg, Berlin, Heidelberg 1970, ISBN 978-3-540-04958-6.
  • Olle Häggström: Finite Markov Chains and Algorithmic Applications. Cambridge University Press, 2002.
  • Thorsten Imkamp, Sabrina Proß: Einstieg in stochastische Prozesse, Springer 2023, ISBN 978-3-662-66669-2
  • Daniel W. Stroock: An introduction to Markov processes. (= Graduate Texts in Mathematics. 230). 2. Auflage. Springer/Heidelberg 2014, ISBN 978-3-642-40522-8.
Commons: Markow-Kette – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Nicole Bäuerle et al.: Ausbreitung von Gerüchten – mit Markov-Ketten modellieren. In: Stochastik in der Schule. Band 40, Nr. 3, 2020 (Online [PDF; abgerufen am 24. April 2026]).
  2. Noemi Kurt: Markov-Ketten. In: Stochastik für das Informatikstudium. Band 31, Nr. 3. Springer Berlin Heidelberg, Berlin, Heidelberg 2025, ISBN 978-3-662-71047-0, S. 195–215, doi:10.1007/978-3-662-71048-7_11 (Online [abgerufen am 24. April 2026]).
  3. А. А. Марковъ: Versuche einer statistischen Untersuchung über den Text des Romans »Eugen Onegin« zur Beleuchtung des Zusammenhangs der Kettenversuche. In: Извѣстія Императорской Академіи Наукъ. VI серiя. Band 7, Nr. 3. Sankt-Petersburg 1913, S. 153–162 (Online russisch: Примѣръ статистическаго изслѣдованiя надъ текстомъЕвгенiя Онѣгина”, иллюстрирующiй связь испытанiй въ цѣпь.).
  4. Andrej A. Markow: Beispiel einer statistischen Untersuchung am Text »Evgenij Onegin« zur Veranschaulichung der Zusammenhänge von Proben in Ketten. In: Philipp von Hilgers, Sven Spieker, Wladimir Velminski (Hrsg.): Andrej A. Markov: Berechenbare Künste (= sequenzia). Diaphanes, Berlin 2018, ISBN 978-3-935300-69-8 (Online).
  5. Die Entwicklung der Wahrscheinlichkeitstheorie von den Anfängen bis 1933: Einführungen und Texte. Reprint 2024 Auflage. De Gruyter, Berlin Boston 1989, ISBN 978-3-11-273210-6, S. 444.
  6. Peter Grzybek, Emmerich Kelih: Zur Vorgeschichte quantitativer Ansätze in der russischen Sprach-und Literaturwissenschaft. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik / Quantitative Linguistics - Ein internationales Handbuch / An International Handbook. De Gruyter, Berlin 2005, ISBN 978-3-11-015578-5.