Importance Sampling
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.
Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen) |
Importance Sampling (im Deutschen manchmal auch Stichprobenentnahme nach Wichtigkeit, oder Stichprobenziehung nach Wichtigkeit[1] genannt) ist ein Begriff aus der Statistik, der die Technik zur Erzeugung von Stichproben anhand einer Wahrscheinlichkeitsverteilung beschreibt. Importance Sampling ist eine von mehreren Möglichkeiten zur Varianzreduktion, also zur Steigerung der Effizienz von Monte-Carlo-Simulationen.
Definition
Der Importance-Sampling-Schätzer des Mittelwertes einer Zufallsvariablen ist gegeben durch: .
Hintergrund
Monte-Carlo-Simulationen werden oft benutzt, um Erwartungswerte einer Größe (hier mit bezeichnet, sonst – insbesondere in der Mathematik – oft als dargestellt),
zu berechnen, wobei ein normiertes statistisches Gewicht wie beispielsweise ein Boltzmann-Faktor ist. ist der Wert der Größe im Zustand . Die Summation (oder Integration) läuft dabei den Ergebnisraum , (z. B. den Phasenraum der Teilchen im System). Da dieser Ergebnisraum im Allgemeinen sehr hochdimensional ist, kann die Summe bzw. das Integral im Allgemeinen nicht berechnet werden. Statt den wahren Erwartungswert zu berechnen, berechnet man einen Schätzer mithilfe einer Zufallsstichprobe S, die den Umfang hat.
Simple Sampling
Für den einfachsten Fall (einfache Stichprobenentnahme, englisch simple sampling) gleichverteilt zufällig ausgewählter Zustände ergibt sich für den geschätzten Mittelwert:
wobei die Summation über die zufälligen Realisierungen in der Stichprobe läuft, die Wahrscheinlichkeit(sdichte) der Realisierung ist (beispielsweise proportional zu ) sowie . Für eine große Stichprobe nähert sich der Schätzer dem Mittelwert:
Importance Sampling
Die Methode des Simple Sampling ist meistens nicht sehr effizient, da oft nur wenige relevante Zustände in die Mittelwertbildung eingehen. Um dieses Problem zu umgehen und so die Standardabweichung des gemessenen Mittelwertes bei gleichem Stichprobenumfang zu reduzieren, versucht man Zustände mit einem größeren Gewicht häufiger in die Mittelwertbildung eingehen zu lassen als Zustände mit einem geringeren Gewicht: Der obigen Schätzer des Simple Sampling kann durch Erweitern mit auch wie folgt ausgedrückt werden:
Werden Realisierungen mit der Wahrscheinlichkeit erzeugt (Stichprobenentnahme nach Wichtigkeit englisch importance sampling), wird also eine andere Stichprobe S' erzeugt, so berechnet sich der geschätzte Mittelwert in der Folge einfach mithilfe von
Beispiel
Werden die Systemzustände z. B. willkürlich mit einer Wahrscheinlichkeit proportional zu erzeugt (das ist gerade die Metropoliswahl), so ergibt sich
Gerade, dass hier nur die Proportionalität erforderlich ist, ist ein Vorteil der Methode.
Um eine Stichprobenentnahme nach Wichtigkeit in der Praxis zu erreichen, geht man von einer Startkonfiguration aus und erzeugt mithilfe des Metropolisalgorithmus eine Markow-Kette aus Systemzuständen.
Neben der Metropoliswahl für die Sampling-Wahrscheinlichkeit gibt es weitere Möglichkeiten. Z. B. kann mit der Wahl , wobei diejenige Zustandsdichte der Energie ist, die dem Zustand zugeordnet ist, das multikanonische Ensemble simuliert werden.
Literatur
- W. K. Hastings: Monte Carlo Sampling Methods Using Markov Chains and Their Applications. In: Biometrika. Band 57, 1970, S. 97–109.
- Thomas Müller-Gronbach, Erich Novak, Klaus Ritter: Monte Carlo-Algorithmen. Springer-Verlag, Berlin 2012, ISBN 978-3-540-89140-6, Abschnitt 5.4 Importance Sampling, S. 155–166, doi:10.1007/978-3-540-89141-3.
- Christian P. Robert, George Casella: Monte Carlo Statistical Methods (= Springer Texts in Statistics). 2. Auflage. Springer, 2004, ISBN 0-387-21239-6, Kap. 3.3 Importance Sampling, S. 90–107, doi:10.1007/978-1-4757-4145-2.
- R. Srinivasan: Importance sampling – Applications in communications and detection. Springer-Verlag, Berlin 2002, ISBN 978-3-540-43420-7.
- Suojin Wang: Importance Sampling. In: Samuel Kotz et al. (Hrsg.): Encyclopedia of Statistical Sciences. 2. Auflage. Band 5. Wiley, New York 2006, ISBN 978-0-471-15044-2, S. 3347–3353, doi:10.1002/0471667196.