„Übergangskern“ – Versionsunterschied
[ungesichtete Version] | [gesichtete Version] |
Linkvorschlag-Funktion: 1 Link hinzugefügt. |
|||
(93 dazwischenliegende Versionen von 37 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
{{Dieser Artikel|behandelt Übergangswahrscheinlichkeiten in der Wahrscheinlichkeitstheorie. Zu Übergangswahrscheinlichkeiten in der Physik siehe auch [[Übergangsdipolmoment]] und [[Vibronischer Übergang]].}} |
|||
'''Übergangswahrscheinlichkeiten''' beschreiben in der [[Statistik]] die Wahrscheinlichkeiten, vom Zustand zu einem aktuellen Beobachtungszeitpunkt i in bestimmte andere Zustände überzugehen. Sie finden in der [[Bioinformatik]] eine breite Anwendung bei der Modellbildung unter Zuhilfenahme von [[Markow-Kette|Markow-]] und [[Hidden Markov Model|Hidden-Markow-Modellen]]. |
|||
Als '''Übergangskern''' bezeichnet man spezielle Abbildungen zwischen [[Messraum (Mathematik)|Messräumen]] in der [[Wahrscheinlichkeitstheorie]], die im ersten Argument [[Messbare Funktion|messbar]] sind und im zweiten Argument ein [[Maß (Mathematik)|Maß]] liefern. Spezialfälle von Übergangskernen sind die sogenannten '''stochastischen Kerne''', die auch '''Markow-Kerne''' oder '''Wahrscheinlichkeitskerne''' genannt werden. Bei ihnen ist das Maß immer ein [[Wahrscheinlichkeitsmaß]]. Ist das Maß immer ein [[Sub-Wahrscheinlichkeitsmaß]], so spricht man auch von '''Sub-Markow-Kernen''' oder '''substochastischen Kernen'''. |
|||
Insbesondere die Markow-Kerne spielen eine wichtige Rolle in der Wahrscheinlichkeitstheorie wie beispielsweise bei der Formulierung der [[Reguläre bedingte Verteilung|regulären bedingten Verteilung]] oder der Theorie der [[Stochastischer Prozess|stochastischen Prozesse]]. Hier bilden sie im Speziellen die Basis für die Formulierung der '''Übergangswahrscheinlichkeiten''' von [[Markow-Ketten]] oder Existenzaussagen wie den [[Satz von Ionescu-Tulcea]]. |
|||
=== Diskreter Fall === |
|||
== Definition == |
|||
<math>\Omega</math> und <math>\Omega'</math> seien endliche oder abzählbare Mengen. Eine Matrix <math>\pi = (\pi_{i,j})_{i\in\Omega, j\in\Omega'} </math> mit <math> \pi_{i,j} \in [0,1] </math> heißt '''stochastische Matrix''', wenn gilt <math> \sum_{j\in\Omega'} \pi_{i,j} = 1 </math> für jedes <math>i\in\Omega</math>. |
|||
Gegeben seien zwei [[Messraum (Mathematik)|Messräume]] <math> (\Omega_0, \mathcal A_0) </math> und <math> (\Omega_1, \mathcal A_1) </math>. Eine Abbildung <math> K \colon \Omega_0 \times \mathcal A_1 \to [0,\infty] </math> heißt ein ''Übergangskern'' von <math> (\Omega_0, \mathcal A_0) </math> nach <math> (\Omega_1, \mathcal A_1) </math>, wenn gilt: |
|||
* Für jedes <math> x \in \Omega_0 </math> ist <math> K(x, \;\cdot\;) </math> ein [[Maß (Mathematik)|Maß]] auf <math> (\Omega_1, \mathcal A_1) </math>. |
|||
* Für jedes <math> A_1 \in \mathcal A_1 </math> ist <math> K(\;\cdot\;, A_1) </math> eine <math> \mathcal A_0 </math>-[[messbare Funktion]]. |
|||
Ist das Maß für alle <math> x \in \Omega_0 </math> ein [[σ-endliches Maß]], so spricht man von einem σ-endlichen Übergangskern; ist es stets endlich, so spricht man von einem endlichen Übergangskern. |
|||
<math>\pi</math> beschreibt '''Übergangswahrscheinlichkeiten''' von <math>\Omega</math> nach <math>\Omega'</math>: Wenn eine [[Wahrscheinlichkeitsverteilung]] auf <math>\Omega</math> mit einer Zähldichte <math>\rho=(\rho_i)_{i\in\Omega}</math> gegeben ist, dann definiert <math>\rho\pi = (\sum_{i\in\Omega} \rho_i \pi_{i,j})_{j\in\Omega'} </math> eine Zähldichte in <math>\Omega'</math>. |
|||
Ist das Maß für alle <math> x \in \Omega_0 </math> ein [[Wahrscheinlichkeitsmaß]], so nennt man <math> K </math> einen ''stochastischen Kern'' oder ''Markow-Kern''. Ist das Maß für alle <math> x \in \Omega_0 </math> ein [[Sub-Wahrscheinlichkeitsmaß]], so heißt <math> K </math> ein ''substochastischer Kern'' oder ''sub-Markow'scher Kern''. |
|||
Bemerkung: Bei manchen Definitionen werden die Argumente von <math> K </math> in umgekehrter Reihenfolge geschrieben, <math>K(A',x)</math> oder auch <math>K(A'|x)</math>, in Anlehnung an [[bedingte Wahrscheinlichkeit]]en. |
|||
== Elementare Beispiele == |
|||
* Die [[Poisson-Verteilung]] <math> \operatorname{Poi}_x(A) := K(x,A) </math> ist ein Markow-Kern von <math> (\R_+, \mathcal B (\R_+)) </math> nach <math> (\N, \mathcal P(\N)) </math>. Denn die Funktion <math> f_A(x)=\operatorname{Poi}_x(A) </math> mit Parameter <math> A \in \mathcal P(\N)</math> ist stetig in <math> x \in \R_+ </math> und daher messbar. Des Weiteren ist für jedes <math> x \in \R_+ </math> die Poisson-Verteilung mit Parameter <math> x </math> eine Wahrscheinlichkeitsverteilung. Also handelt es sich um einen Übergangskern. |
|||
* Die [[stochastische Matrix]] |
|||
:<math> A= \begin{pmatrix} 0 & \tfrac{1}{2} & \tfrac{1}{2} \\ \tfrac{1}{2} & \tfrac{1}{2} & 0 \\ \tfrac{1}{2} & 0 &\tfrac{1}{2}\end{pmatrix} </math> |
|||
:kann als ein Markow-Kern von <math> (\{1,2,3\}, \mathcal P (\{1,2,3\})) </math> nach <math> (\{1,2,3\}, \mathcal P (\{1,2,3\})) </math> aufgefasst werden. Denn für jedes <math>i</math> ist die <math>i</math>-te Zeile ein [[Wahrscheinlichkeitsvektor]] und damit ein Wahrscheinlichkeitsmaß auf <math> \{1,2,3\} </math>. Außerdem ist sie eine Abbildung zwischen endlichen Mengen versehen mit der [[Potenzmenge]] und damit messbar. |
|||
<math> (\Omega, \mathcal A) </math> und <math> (\Omega', \mathcal A') </math> seien [[Messraum|Messräume]]. |
|||
Eine Abbildung <math> \pi : \Omega \times \mathcal A' \to [0,1] </math> heißt '''stochastischer Kern''' oder '''Markow-Kern''' von <math> (\Omega, \mathcal A) </math> nach <math> (\Omega', \mathcal A') </math>, wenn gilt: |
|||
* Für jedes <math> x \in \Omega </math> ist <math> \pi(x; \;\cdot\;) : A \mapsto \pi(x; A) </math> ein [[Wahrscheinlichkeitsmaß]] auf <math> (\Omega', \mathcal A') </math>. |
|||
* Für jedes <math> A \in \mathcal A' </math> ist <math> \pi(\;\cdot\;; A) : x \mapsto \pi(x; A) </math> eine <math> \mathcal A </math>-[[messbare Funktion]]. |
|||
== Eigenschaften == |
|||
<math>\pi</math> beschreibt '''Übergangswahrscheinlichkeiten''' von <math>\Omega</math> nach <math>\Omega'</math>: Wenn ein Wahrscheinlichkeitsmaß <math>P</math> auf <math> (\Omega, \mathcal A) </math> gegeben ist, dann definiert <math> A \mapsto \int_\Omega P(dx) \pi(x; A) </math> ein Wahrscheinlichkeitsmaß auf <math> (\Omega', \mathcal A') </math>. |
|||
=== Maße durch Kerne === |
|||
Jedem Maß <math>\mu</math> auf <math> (\Omega, \mathcal A) </math> ordnet <math>K</math> durch |
|||
:<math> \nu(A') = \int_\Omega K(x, A') \mu (\mathrm dx) </math> |
|||
ein Maß <math>\nu</math> auf <math> (\Omega', \mathcal A') </math> zu. Dieses Maß wird üblicherweise mit <math>\mu K</math> bezeichnet. Ist <math>\mu</math> ein Wahrscheinlichkeitsmaß, gilt also <math>\mu(\Omega) = 1</math>, dann ist auch <math>\mu K(\Omega') = 1</math>, das heißt, <math>\mu K</math> ist ebenfalls ein Wahrscheinlichkeitsmaß. |
|||
Im Fall <math>(\Omega, \mathcal{A}) = (\Omega', \mathcal{A}')</math> wird ein Maß <math>\mu</math>, für das <math>\mu = \mu K</math> gilt, ''stationäres Maß'' genannt. Ein stationäres Wahrscheinlichkeitsmaß heißt auch ''[[stationäre Verteilung]]''. |
|||
''Bemerkung:'' Bei manchen Definitionen werden die Argumente von <math> \pi </math> in umgekehrter Reihenfolge geschrieben, <math>\pi(A;x)</math> oder auch <math>\pi(A|x)</math>, in Anlehnung an [[bedingte Wahrscheinlichkeit|bedingte Wahrscheinlichkeiten]]. |
|||
=== Messbare Funktionen durch Kerne === |
|||
Jeder nichtnegativen messbaren Funktion <math>g\colon \Omega' \to \R</math> ordnet <math>K</math> durch |
|||
:<math>f(x) = \int_{\Omega'} g(y) K(x, \mathrm dy)</math> |
|||
eine nichtnegative messbare Funktion <math>f\colon \Omega \to \R</math> zu. Diese Funktion wird üblicherweise mit <math>Kg</math> bezeichnet. Mit der Kurzschreibweise <math>\mu f = \int_{\Omega} f(x) \, \mu(\mathrm dx)</math> gilt für alle Maße <math>\mu</math> auf <math> (\Omega, \mathcal A) </math> und alle nichtnegativen messbaren Funktionen <math>g\colon \Omega' \to \R</math> die Gleichung <math>(\mu K)g = \mu(K g)</math>. |
|||
== Diskreter Fall == |
|||
[[Kategorie:Stochastik]] |
|||
[[Kategorie:Stochastische Prozesse]] |
|||
[[Kategorie:Bedingte Wahrscheinlichkeit]] |
|||
Im diskreten Fall, wo <math>\Omega</math> und <math>\Omega'</math> endliche oder abzählbare Mengen sind, genügt es die Wahrscheinlichkeiten <math>p_{i,j}</math> anzugeben, mit denen man vom Zustand <math>i</math> in den Zustand <math>j</math> gelangt. Mit den Bezeichnungen des allgemeinen Falls gilt dann <math>p_{i,j} = K(i, \{j\})</math>. Diese Wahrscheinlichkeiten bilden eine [[Übergangsmatrix]] <math>M = (p_{i,j})_{i\in\Omega, j\in\Omega'}</math>, die die Eigenschaft hat, dass alle Elemente zwischen <math>0</math> und <math>1</math> liegen und dass die Zeilensummen <math> \sum_{j\in\Omega'} p_{i,j} </math> den Wert <math>1</math> haben. Eine solche Matrix wird als stochastische Matrix bezeichnet. Sie ordnet jeder [[Wahrscheinlichkeitsverteilung]] auf <math>\Omega</math> mit einer Zähldichte <math>\rho=(\rho_i)_{i\in\Omega}</math> die [[Wahrscheinlichkeitsfunktion|Zähldichte]] |
|||
[[en:Stochastic kernel]] |
|||
:<math>\rho M = \Bigl(\sum_{i\in\Omega} \rho_i p_{i,j}\Bigr)_{j\in\Omega'} </math> |
|||
einer Wahrscheinlichkeitsverteilung auf <math>\Omega'</math> zu, das heißt, <math>\rho M</math> wird mit der üblichen [[Matrixmultiplikation]] berechnet, wobei Zähldichten als Zeilenvektoren aufgefasst werden. |
|||
Ist <math>g \colon \Omega' \to \R</math> eine nichtnegative Funktion, aufgefasst als Spaltenvektor <math>(g_j)_{j \in \Omega'}</math> mit nichtnegativen Einträgen, dann gilt |
|||
:<math>Kg = \Bigl(\sum_{j \in \Omega'} p_{i,j} g_j \Bigr)_{i \in \Omega}</math>. |
|||
Das heißt, im diskreten Fall wird auch <math>Kg</math>, aufgefasst als Spaltenvektor mit Indizes in <math>\Omega</math>, mit der üblichen Matrixmultiplikation berechnet. |
|||
Bemerkung: Bei manchen Definitionen werden Zeilen und Spalten der Matrix umgekehrt verwendet. |
|||
== Operationen von Übergangskernen == |
|||
=== Verkettung === |
|||
Sind drei Messräume <math> (\Omega_0, \mathcal A_0), \; (\Omega_1, \mathcal A_1), \, (\Omega_2, \mathcal A_2) </math> gegeben sowie zwei substochastische Kerne <math> K_1 </math> von <math> (\Omega_0, \mathcal A_0) </math> nach <math>(\Omega_1, \mathcal A_1) </math> und <math> K_2 </math> von <math> (\Omega_1, \mathcal A_1) </math> nach <math>(\Omega_2, \mathcal A_2) </math>, so ist die Verkettung der Kerne <math> K_1 </math> und <math> K_2 </math> eine Abbildung |
|||
:<math> K_1 \cdot K_2 \colon \Omega_0 \times \mathcal A_2 \to [0,\infty) </math> |
|||
definiert durch |
|||
:<math> (K_1 \cdot K_2) (x_0,A_2)=\int_{\Omega_1}K_1(x_0, \mathrm d x_1)K_2(x_1,A_2) </math>. |
|||
Die Verkettung ist dann ein substochastischer Kern von <math> (\Omega_0, \mathcal A_0 ) </math> nach <math> (\Omega_2, \mathcal A_2 ) </math>. Sind <math>K_1</math> und <math>K_2</math> stochastisch, dann ist auch <math>K_1 \cdot K_2</math> stochastisch. |
|||
=== Produkte === |
|||
Gegeben seien die Maßräume <math> (\Omega_1, \mathcal A_1),(\Omega_2, \mathcal A_2) </math> und <math> (\Omega_3, \mathcal A_3) </math> und zwei endliche Übergangskerne <math> K_1 </math> von <math> (\Omega_1, \mathcal A_1)</math> nach <math> (\Omega_2, \mathcal A_2) </math> und <math> K_2 </math> von <math> (\Omega_1 \times \Omega_2, \mathcal A_1 \otimes \mathcal A_2) </math> nach <math> (\Omega_3, \mathcal A_3) </math> . Dann definiert man das Produkt der Kerne <math> K_1 </math> und <math> K_2 </math> |
|||
:<math>K_1 \otimes K_2 \colon \Omega_1 \times (\mathcal A_2 \otimes \mathcal A_3) \to [0, \infty) </math> |
|||
als |
|||
:<math> (\omega_1, A) \mapsto \int_{\Omega_2} K_1(\omega_1, \mathrm d \omega_2)\int_{\Omega_3}K_2((\omega_1, \omega_2),\mathrm d \omega_3)\chi_A((\omega_2, \omega_3))</math>. |
|||
Das Produkt <math> K_1 \otimes K_2 </math> ist dann ein σ-endlicher Übergangskern von <math> (\Omega_1, \mathcal A_1) </math> nach <math> (\Omega_2 \times \Omega_3, \mathcal A_2 \otimes \mathcal A_3) </math>. Sind beide Kerne stochastisch (bzw. substochastisch), so ist auch das Produkt der Kerne stochastisch (bzw. substochastisch). |
|||
Ist <math> K_2 </math> nur ein Kern von <math> ( \Omega_2, \mathcal A_2 ) </math> nach <math> (\Omega_3, \mathcal A_3) </math>, so fasst man den Kern als Kern von <math> (\Omega_1 \times \Omega_2, \mathcal A_1 \otimes \mathcal A_2) </math> auf, der unabhängig von der ersten Komponente ist. |
|||
== Weitere Beispiele == |
|||
* Ist <math>\nu\colon \mathcal{A}' \to [0,1]</math> ein Wahrscheinlichkeitsmaß auf <math>(\Omega', \mathcal{A}')</math>, dann ist <math>K(x, A') = \nu(A')</math> eine (von <math>x \in \Omega</math> unabhängige) Übergangswahrscheinlichkeit. |
|||
* Für <math>(\Omega, \mathcal{A}) = (\Omega', \mathcal{A}')</math> und das [[Diracmaß]] <math>\delta_x</math> im Punkt <math>x \in \Omega</math> wird durch <math>I(x, A) = \delta_x(A)</math> eine Übergangswahrscheinlichkeit von <math>(\Omega, \mathcal{A})</math> nach <math>(\Omega, \mathcal{A})</math> definiert, die auch ''Einheitskern'' genannt wird. Es gilt <math>\mu I = \mu</math> für alle Maße <math>\mu</math> auf <math>(\Omega, \mathcal{A})</math> und <math>If = f</math> für alle nichtnegativen messbaren Funktionen <math>f \colon \Omega \to \R</math>. |
|||
* Sind <math>k \colon \Omega \times \Omega' \to \R</math> eine nichtnegative und bezüglich der [[Produkt-σ-Algebra]] <math>\mathcal{A} \otimes \mathcal{A}'</math> messbare Funktion und <math>\nu</math> ein Maß auf <math>(\Omega', \mathcal{A}')</math> mit <math>\int_{\Omega'} k(x,y) \, \nu(\mathrm dy) = 1</math> für alle <math>x \in \Omega</math>, dann wird durch |
|||
::<math>K(x, A') = \int_{A'} k(x,y) \, \nu(\mathrm dy)</math> |
|||
:eine Übergangswahrscheinlichkeit definiert. Hier ist also <math>K(x, \;\cdot\;)</math> das Wahrscheinlichkeitsmaß auf <math>(\Omega', \mathcal{A}')</math> mit der <math>\nu</math>-Wahrscheinlichkeitsdichte <math>k(x, \;\cdot\;)</math>. |
|||
* Sei <math>n \in \N</math> fest und <math>B_{n,p}</math> die [[Binomialverteilung]] mit Parametern <math>n</math> und <math>p</math>, aufgefasst als Wahrscheinlichkeitsmaß auf <math>\Omega' = \{0,1,\dotsc,n\}</math>. Dann wird durch |
|||
::<math>K(p, A') = B_{n,p}(A')</math> |
|||
:eine Übergangswahrscheinlichkeit von <math>(\Omega, \mathcal{A}) = ([0,1], \mathcal{B}([0,1]))</math> nach <math>(\Omega', \mathcal{P}(\Omega'))</math> definiert. Ist beispielsweise <math>\beta_{a,b}</math> eine [[Betaverteilung]] auf <math>(\Omega, \mathcal{A})</math>, dann ist <math>\beta_{a,b} K</math> die zugehörige [[Beta-Binomialverteilung]] auf <math>\Omega'</math>. |
|||
== Darstellung als Daniell-stetige Abbildungen und Komposition == |
|||
Jedem Markow-Kern <math>K</math> von <math>(\Omega,\mathcal A)</math> nach <math>(\Omega,\mathcal A)</math> ist auf dem Raum <math>E^*</math> der numerischen, nichtnegativen Funktionen <math>f \colon \Omega \to [0,\infty]</math> über |
|||
:<math>(T f) (\omega) := \int f(\omega') K(\omega, \mathrm d\omega')</math> |
|||
eine Abbildung <math>T \colon E^* \to E^*</math> mit folgenden Eigenschaften zugeordnet: |
|||
# <math>f \ge 0 \Rightarrow T f \ge 0</math> für jedes <math>f \in E^*</math> (Positivität), |
|||
# <math>f_n \uparrow f \Rightarrow T f_n \uparrow T f</math> für jede [[Monoton wachsende Funktionenfolge|monoton wachsende]] Folge <math>(f_n)</math> in <math>E^*</math> (Daniell-Stetigkeit, nach [[Percy John Daniell]]), |
|||
# <math>T (f + g) = T f + T g </math> (Additivität). |
|||
Zu jeder Abbildung <math>T</math> mit diesen Eigenschaften gibt es wiederum genau einen Kern, für den <math>T</math> die so gebildete Abbildung darstellt. |
|||
Aus der Komposition dieser Abbildungen <math>T_1 \circ T_2</math> kann eine Definition für die Komposition der zugehörigen Kerne hergeleitet werden: Durch |
|||
:<math>K_1 K_2 (\omega, A) = \int K_1 (\omega, \mathrm{d}\omega') K_2 (\omega', A)</math> |
|||
ist ein stochastischer Kern von <math>(\Omega,\mathcal A)</math> nach <math>(\Omega,\mathcal A)</math> definiert, der als ''Komposition'' von <math>K_1</math> und <math>K_2</math> bezeichnet wird. Im diskreten Fall entspricht <math>K_1 K_2</math> der Multiplikation der beiden Übergangsmatrizen. |
|||
== Spezielle Anwendungen == |
|||
Markow-Kerne finden breite Anwendung bei der Modellbildung etwa unter Zuhilfenahme von [[Markow-Kette|Markow-]] und [[Hidden Markov Model|Hidden-Markow-Modellen]]. In der [[Quantenphysik]] werden oft Übergangswahrscheinlichkeiten zwischen [[Zustand (Quantenmechanik)|quantenmechanischen Zuständen]] untersucht. Außerdem werden Markow-Kerne in der [[Mathematische Statistik|mathematischen Statistik]] verwendet, um im Rahmen eines allgemeinen [[Statistisches Entscheidungsproblem|statistischen Entscheidungsproblems]] eine [[Entscheidungsfunktion]] zu definieren, die jedem Ausgang eines Experiments eine Entscheidung zuordnet. Dabei kann die Entscheidung sowohl eine Parameterschätzung als auch die Wahl eines Konfidenzintervalls oder die Entscheidung für oder gegen eine Hypothese sein. |
|||
== Literatur == |
|||
*{{Literatur|Autor=Achim Klenke|Titel=Wahrscheinlichkeitstheorie|Auflage=3.|Verlag=Springer-Verlag|Ort=Berlin Heidelberg|Jahr=2013|ISBN=978-3-642-36017-6 |DOI=10.1007/978-3-642-36018-3}} |
|||
* [[Heinz Bauer (Mathematiker)|Heinz Bauer]]: ''Wahrscheinlichkeitstheorie.'' De Gruyter, Berlin 2002, ISBN 3-11-017236-4. |
|||
* Erhan Çınlar: ''Probability and Stochastics.'' Springer, New York u. a. 2011, ISBN 978-0-387-87858-4. |
|||
{{SORTIERUNG:Ubergangskern}} |
|||
[[Kategorie:Stochastik]] |
Aktuelle Version vom 17. November 2024, 14:21 Uhr
Als Übergangskern bezeichnet man spezielle Abbildungen zwischen Messräumen in der Wahrscheinlichkeitstheorie, die im ersten Argument messbar sind und im zweiten Argument ein Maß liefern. Spezialfälle von Übergangskernen sind die sogenannten stochastischen Kerne, die auch Markow-Kerne oder Wahrscheinlichkeitskerne genannt werden. Bei ihnen ist das Maß immer ein Wahrscheinlichkeitsmaß. Ist das Maß immer ein Sub-Wahrscheinlichkeitsmaß, so spricht man auch von Sub-Markow-Kernen oder substochastischen Kernen.
Insbesondere die Markow-Kerne spielen eine wichtige Rolle in der Wahrscheinlichkeitstheorie wie beispielsweise bei der Formulierung der regulären bedingten Verteilung oder der Theorie der stochastischen Prozesse. Hier bilden sie im Speziellen die Basis für die Formulierung der Übergangswahrscheinlichkeiten von Markow-Ketten oder Existenzaussagen wie den Satz von Ionescu-Tulcea.
Definition
[Bearbeiten | Quelltext bearbeiten]Gegeben seien zwei Messräume und . Eine Abbildung heißt ein Übergangskern von nach , wenn gilt:
- Für jedes ist ein Maß auf .
- Für jedes ist eine -messbare Funktion.
Ist das Maß für alle ein σ-endliches Maß, so spricht man von einem σ-endlichen Übergangskern; ist es stets endlich, so spricht man von einem endlichen Übergangskern. Ist das Maß für alle ein Wahrscheinlichkeitsmaß, so nennt man einen stochastischen Kern oder Markow-Kern. Ist das Maß für alle ein Sub-Wahrscheinlichkeitsmaß, so heißt ein substochastischer Kern oder sub-Markow'scher Kern.
Bemerkung: Bei manchen Definitionen werden die Argumente von in umgekehrter Reihenfolge geschrieben, oder auch , in Anlehnung an bedingte Wahrscheinlichkeiten.
Elementare Beispiele
[Bearbeiten | Quelltext bearbeiten]- Die Poisson-Verteilung ist ein Markow-Kern von nach . Denn die Funktion mit Parameter ist stetig in und daher messbar. Des Weiteren ist für jedes die Poisson-Verteilung mit Parameter eine Wahrscheinlichkeitsverteilung. Also handelt es sich um einen Übergangskern.
- Die stochastische Matrix
- kann als ein Markow-Kern von nach aufgefasst werden. Denn für jedes ist die -te Zeile ein Wahrscheinlichkeitsvektor und damit ein Wahrscheinlichkeitsmaß auf . Außerdem ist sie eine Abbildung zwischen endlichen Mengen versehen mit der Potenzmenge und damit messbar.
Eigenschaften
[Bearbeiten | Quelltext bearbeiten]Maße durch Kerne
[Bearbeiten | Quelltext bearbeiten]Jedem Maß auf ordnet durch
ein Maß auf zu. Dieses Maß wird üblicherweise mit bezeichnet. Ist ein Wahrscheinlichkeitsmaß, gilt also , dann ist auch , das heißt, ist ebenfalls ein Wahrscheinlichkeitsmaß.
Im Fall wird ein Maß , für das gilt, stationäres Maß genannt. Ein stationäres Wahrscheinlichkeitsmaß heißt auch stationäre Verteilung.
Messbare Funktionen durch Kerne
[Bearbeiten | Quelltext bearbeiten]Jeder nichtnegativen messbaren Funktion ordnet durch
eine nichtnegative messbare Funktion zu. Diese Funktion wird üblicherweise mit bezeichnet. Mit der Kurzschreibweise gilt für alle Maße auf und alle nichtnegativen messbaren Funktionen die Gleichung .
Diskreter Fall
[Bearbeiten | Quelltext bearbeiten]Im diskreten Fall, wo und endliche oder abzählbare Mengen sind, genügt es die Wahrscheinlichkeiten anzugeben, mit denen man vom Zustand in den Zustand gelangt. Mit den Bezeichnungen des allgemeinen Falls gilt dann . Diese Wahrscheinlichkeiten bilden eine Übergangsmatrix , die die Eigenschaft hat, dass alle Elemente zwischen und liegen und dass die Zeilensummen den Wert haben. Eine solche Matrix wird als stochastische Matrix bezeichnet. Sie ordnet jeder Wahrscheinlichkeitsverteilung auf mit einer Zähldichte die Zähldichte
einer Wahrscheinlichkeitsverteilung auf zu, das heißt, wird mit der üblichen Matrixmultiplikation berechnet, wobei Zähldichten als Zeilenvektoren aufgefasst werden.
Ist eine nichtnegative Funktion, aufgefasst als Spaltenvektor mit nichtnegativen Einträgen, dann gilt
- .
Das heißt, im diskreten Fall wird auch , aufgefasst als Spaltenvektor mit Indizes in , mit der üblichen Matrixmultiplikation berechnet.
Bemerkung: Bei manchen Definitionen werden Zeilen und Spalten der Matrix umgekehrt verwendet.
Operationen von Übergangskernen
[Bearbeiten | Quelltext bearbeiten]Verkettung
[Bearbeiten | Quelltext bearbeiten]Sind drei Messräume gegeben sowie zwei substochastische Kerne von nach und von nach , so ist die Verkettung der Kerne und eine Abbildung
definiert durch
- .
Die Verkettung ist dann ein substochastischer Kern von nach . Sind und stochastisch, dann ist auch stochastisch.
Produkte
[Bearbeiten | Quelltext bearbeiten]Gegeben seien die Maßräume und und zwei endliche Übergangskerne von nach und von nach . Dann definiert man das Produkt der Kerne und
als
- .
Das Produkt ist dann ein σ-endlicher Übergangskern von nach . Sind beide Kerne stochastisch (bzw. substochastisch), so ist auch das Produkt der Kerne stochastisch (bzw. substochastisch).
Ist nur ein Kern von nach , so fasst man den Kern als Kern von auf, der unabhängig von der ersten Komponente ist.
Weitere Beispiele
[Bearbeiten | Quelltext bearbeiten]- Ist ein Wahrscheinlichkeitsmaß auf , dann ist eine (von unabhängige) Übergangswahrscheinlichkeit.
- Für und das Diracmaß im Punkt wird durch eine Übergangswahrscheinlichkeit von nach definiert, die auch Einheitskern genannt wird. Es gilt für alle Maße auf und für alle nichtnegativen messbaren Funktionen .
- Sind eine nichtnegative und bezüglich der Produkt-σ-Algebra messbare Funktion und ein Maß auf mit für alle , dann wird durch
- eine Übergangswahrscheinlichkeit definiert. Hier ist also das Wahrscheinlichkeitsmaß auf mit der -Wahrscheinlichkeitsdichte .
- Sei fest und die Binomialverteilung mit Parametern und , aufgefasst als Wahrscheinlichkeitsmaß auf . Dann wird durch
- eine Übergangswahrscheinlichkeit von nach definiert. Ist beispielsweise eine Betaverteilung auf , dann ist die zugehörige Beta-Binomialverteilung auf .
Darstellung als Daniell-stetige Abbildungen und Komposition
[Bearbeiten | Quelltext bearbeiten]Jedem Markow-Kern von nach ist auf dem Raum der numerischen, nichtnegativen Funktionen über
eine Abbildung mit folgenden Eigenschaften zugeordnet:
- für jedes (Positivität),
- für jede monoton wachsende Folge in (Daniell-Stetigkeit, nach Percy John Daniell),
- (Additivität).
Zu jeder Abbildung mit diesen Eigenschaften gibt es wiederum genau einen Kern, für den die so gebildete Abbildung darstellt.
Aus der Komposition dieser Abbildungen kann eine Definition für die Komposition der zugehörigen Kerne hergeleitet werden: Durch
ist ein stochastischer Kern von nach definiert, der als Komposition von und bezeichnet wird. Im diskreten Fall entspricht der Multiplikation der beiden Übergangsmatrizen.
Spezielle Anwendungen
[Bearbeiten | Quelltext bearbeiten]Markow-Kerne finden breite Anwendung bei der Modellbildung etwa unter Zuhilfenahme von Markow- und Hidden-Markow-Modellen. In der Quantenphysik werden oft Übergangswahrscheinlichkeiten zwischen quantenmechanischen Zuständen untersucht. Außerdem werden Markow-Kerne in der mathematischen Statistik verwendet, um im Rahmen eines allgemeinen statistischen Entscheidungsproblems eine Entscheidungsfunktion zu definieren, die jedem Ausgang eines Experiments eine Entscheidung zuordnet. Dabei kann die Entscheidung sowohl eine Parameterschätzung als auch die Wahl eines Konfidenzintervalls oder die Entscheidung für oder gegen eine Hypothese sein.
Literatur
[Bearbeiten | Quelltext bearbeiten]- Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-3.
- Heinz Bauer: Wahrscheinlichkeitstheorie. De Gruyter, Berlin 2002, ISBN 3-11-017236-4.
- Erhan Çınlar: Probability and Stochastics. Springer, New York u. a. 2011, ISBN 978-0-387-87858-4.