Rasch-Modell
Das Rasch-Modell ist ein mathematisch-psychologisches Modell der Testtheorie und gehört zu den Latent-Trait-Theorien (im englischsprachigen Raum auch als Item Response Theory bekannt). Es wurde von dem dänischen Statistiker Georg Rasch entwickelt.
Überblick
Psychologische Tests (Fragebögen, Leistungstests) zur Messung psychischer Merkmale können auf verschiedenen Messmodellen basieren. Letztere unterscheiden sich darin, wie aus den Antworten auf die Items eines Tests auf die Ausprägung der Fähigkeiten bzw. Eigenschaften einer Person (z. B. Intelligenz oder Extraversion) geschlossen wird – und wie die Tests daraufhin konstruiert sein müssen. Zwei Modellarten bzw. -klassen sind vor allem zu unterscheiden, die Klassische Testtheorie und die Probabilistische Testtheorie, die bestimmte Nachteile der klassischen Testtheorie überwinden will. Zu letzterer gehört auch das Rasch-Modell. Der Vorteil probabilistischer Modelle liegt darin, dass aus dem beobachteten Antwortverhalten auf zwei latente Variablen geschlossen wird, welche das Antwortverhalten determinieren: die Itemschwierigkeit und der Fähigkeit der Person. Ein Effekt ist, dass die Schätzung der Fähigkeit dann unabhängig von der Itemschwierigkeit erfolgen kann. Ein ähnliches Modell fand z. B. auch innerhalb der Pisa-Studie Anwendung.
Wissenschaftlicher Hintergrund
Das Rasch-Modell postuliert im Vergleich zur Klassischen Testtheorie keinen deterministischen Zusammenhang zwischen dem Testverhalten einer Versuchsperson und deren Personenparameter. Vielmehr wird ein zugrundeliegendes Persönlichkeitsmerkmal („Latent Trait“) angenommen, von dessen Ausprägung das manifeste Lösungsverhalten in probabilistischer Weise abhängt.
Die Wahrscheinlichkeit der Antwort von Person av bei Aufgabe xi ist bestimmt durch:
wobei Xvi eine Zufallsvariable ist, welche den Wert 1 annimmt, wenn die Person av die Aufgabe xi löst, und die den Wert 0 annimmt, wenn die Person av die Aufgabe nicht löst. (θv ist die latente Fähigkeit der Person av, und σi ist die Schwierigkeit der Aufgabe xi). Formal liegt hier ein Logitmodell vor, das die Anteile von 0 bzw. 1 in eine stetige Verteilung überführt.
Parameterschätzung
Die Parameterschätzung erfolgt im Rasch-Modell über einen Maximum-Likelihood-Ansatz. Es kann eine gemeinsame Schätzung der Personen- und Aufgabenparameter erfolgen, dabei leidet allerdings die Konsistenz der Statistik. Eine andere Methode ist die bedingte Maximum-Likelihood-Schätzung. Hierbei werden zunächst die Aufgabenparameter unter der bedingten Likelihood der Daten, gegeben die suffiziente Summenstatistik für den Personenparameter geschätzt und nachfolgend die unbedingten Maximum-Likelihood-Schätzer der Personenparameter. Die dritte Methode ist die marginale Maximum-Likelihood-Schätzung bei der Annahmen über die Verteilung der Personenparameter in der Population getroffen werden.
Im Vergleich zur KTT kann im Rasch-Modell für jeden geschätzten Personenparameter θv ein individuelles Konfidenzintervall angegeben werden. Dieses wird eng, wenn für die jeweilige Personenfähigkeit θv mehrere Items Informationen liefern (Maximale Information gdw. θv = σi). Es wird breit bei wenig Items die für diesen Bereich Informationen liefern (i.d.R. ist dies bei extremen Ausprägungen der Fall).
Nutzen
Im Rasch-Modell erfolgt eine Trennung des Einflusses der Personenfähigkeit θv vom Einfluss der Testaufgabe σi. Damit wird eine Messung etabliert. Vergleiche von Personen (bzw. Aufgaben), die von den Aufgaben (bzw. Personen) unabhängig sind, werden möglich. Diese Eigenschaft wird von Rasch als „spezifische Objektivität“ bezeichnet. Weiterhin bildet das Rasch-Modell die Grundlage für adaptives Testen, da der Personenparameter nach jeder Aufgabe neu berechnet werden kann und dadurch entsprechend Items selegiert werden können, die maximale Information liefern. Ebenfalls etabliert wird eine Basis für Veränderungsmessungen. Die KTT setzt dagegen stabile Persönlichkeitsmerkmale voraus und ist aus psychometrischer Sicht dafür nicht konzipiert.
Modelltest

Innerhalb des Rasch-Modells kann ein Modelltest durch die Schätzung der Aufgabenparameter σi in Teilstichproben erfolgen. Dies ist möglich, da die Schätzungen unabhängig von den eingehenden Personenparametern ist (siehe spezifische Objektivität). Hierzu kann man eine Stichprobe z.B. am Median splitten. Trägt man die erhaltenen Schätzwerte gegeneinander ab, so sollten sie auf einer Geraden durch den Nullpunkt mit Steigung 1 liegen. Die Abweichung von dieser Geraden kann im Rahmen der Testkonstruktion als Kriterium zur Aufgabenselektion genutzt werden (siehe Abbildung). Die Vorhersagen können auch durch einen Likelihood-Quotienten-Test (Andersen, 1973) statistisch geprüft werden. Bei optimaler Modellpassung nimmt dieser Quotient einen Wert von 1 an.
Praktische Anwendung
Für die Auswertung mit dem Rasch-Modell stehen mehrere Software-Pakete zur Verfügung. Unter anderem das kostenfreie Bigsteps [1] oder andere Pakete [2]. Zudem finden sich dort auch Tutorials.
Literatur
- Fischer G. H., Molenaar, I.W., (1995), Rasch Models: Foundations, Recent Developments, and Applications, New York: Springer
- Andersen, E.B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38, 123-140.
- Embretson, S. & Reise, S. (2000): Item response theory for psychologists. Mahwah, NJ: Erlbaum.
- Gernot, F. (1993): Probabilistische Testmodelle in der Persönlichkeitsdiagnostik. Frankfurt am Main: Lang.
- Müller, H. (2000): Summenscore und Trennschärfe beim Rasch-Modell [Sum score and discrimination in the Rasch model]. Psychologische Rundschau, 51, 34–35.
- Multivariate and Mixture Distribution Rasch Models: Extensions and Applications / Hrsg. Matthias von Davier; Claus H. Carstensen. Berlin: Springer, 2006. ISBN 0-387-32916-1
- Rasch, G. (1960/1980): Probabilistic models for some intelligence and attainment tests. (Copenhagen, Danish Institute for Educational Research), expanded edition (1980) with foreword and afterword by B.D. Wright. Chicago: The University of Chicago Press.
- Rost, J. (1999): Was ist aus dem Rasch-Modell geworden? Psychologische Rundschau, 50, 140–156.
- Rost, J. (2003): Testtheorie - Testkonstruktion. Göttingen: Huber. ISBN 3456839642
Weblinks
- Walter: Probalistische Testtheorie.
- Software-Pakete:
- Psychologische Diagnostik Wien.
- ltm-Paket der freien Statistiksoftware R.