Skalenniveau
Das Skalenniveau oder Messniveau ist in der Statistik und Empirie eine wichtige Eigenschaft von Merkmalen. Je nach der Art eines Merkmals bzw. je nachdem, welche Vorschriften bei seiner Messung eingehalten werden können, lassen sich verschiedene Stufen der Skalierbarkeit unterscheiden:
- Nominalskala
- Ordinalskala
- Intervallskala
- Verhältnisskala (auch: Ratioskala)
- Absolutskala
Intervall-, Verhältnis- und Absolutskala werden zur Kardinalskala zusammengefasst. Merkmale auf dieser Skala werden dann als "metrisch" bezeichnet. Nominal- oder ordinalskalierte Merkmale bezeichnet man auch als kategorial.
Das Skalenniveau bestimmt
- die (mathematischen) Operationen, die mit einer entsprechend skalierten Variablen zulässig sind. Dabei können Operationen, die bei Variablen eines bestimmten Skalenniveaus zulässig sind, grundsätzlich auch auf Variablen aller höheren Skalenniveaus durchgeführt werden. Ein auf einem bestimmten Niveau skalierbares Merkmal kann auf allen darunter liegenden Skalenniveaus dargestellt werden, jedoch nicht umgekehrt.
- welche Transformationen mit entsprechend skalierten Variablen durchgeführt werden können, ohne Information zu verlieren bzw. zu verändern.
- welche Information das entsprechende Merkmal liefert, welche Interpretationen Ausprägungen des entsprechenden Merkmals zulassen.
Niedrigstes Skalenniveau. Für verschiedene Objekte oder Erscheinungen wird lediglich eine Entscheidung über Gleichheit oder Ungleichheit der Merkmalsausprägung getroffen (z.B. x <> y <> z). Es handelt sich also nur um qualitative Merkmale (z.B. Blutgruppen oder Geschlecht).Es gilt die Gleichheitsrelation, also ich kann entscheiden, ob zwei Ausprägungen gleich oder ungleich sind. Die Werte können aber nicht der Größe nach sortiert werden.
Für ein ordinalskalierbares Merkmal bestehen Beziehungen der Art "größer", "kleiner", "mehr", "weniger", "stärker", "schwächer" zwischen je zwei unterschiedlichen Merkmalswerten (z.B. x > y > z). Über die Abstände zwischen diesen benachbarten Urteilsklassen ist jedoch nichts ausgesagt. Meist handelt es sich um qualitative Merkmale, wie z.B. der in der Frage gesuchte "höchste erreichbare Bildungsabschluss". Ein weiteres Beispiel sind die Schulnoten: Note 1 ist besser als Note 2, ich habe aber keine Auskunft darüber, ob der Unterschied zwischen Note 1 und 2 gleichgroß ist wie der zwischen Note 3 und Note 4.
Die Reihenfolge der Merkmalswerte ist festgelegt, und die Größe des Abstandes zwischen zwei Werten lässt sich sachlich begründen. Als metrische Skala macht sie Aussagen über den Betrag der Unterschiede zwischen zwei Klassen. Die Ungleichheit der Merkmalswerte lässt sich quantifizieren (z.B. Temperatur in °C, Intelligenzquotient), und es ist erlaubt, Differenzen zu bilden (z.B. x = y - z). Der Nullpunkt und der Abstand der Klassen (Größe der Einheit) sind jedoch willkürlich festgelegt.
Verhältnisskala (auch Rationalskala)
Besitzt das höchste Skalenniveau. Bei ihr handelt es sich ebenfalls um eine metrische Skala, im Unterschied zur Intervallskala existiert jedoch ein absoluter Nullpunkt (z.B. Blutdruck, Temperatur in Kelvin, Lebensalter). Einzig bei diesem Skalenniveau sind Multiplikation und Division sinnvoll und erlaubt. Verhältnisse von Merkmalswerten dürfen also gebildet werden (z.B. x = y · z).
Grauzonen zwischen den Skalenniveaus
Es existieren Merkmale, die sich nicht genau einem Skalenniveau zuordnen lassen. So könnte sich z.B. bei einem Merkmal nicht sicher belegen lassen, dass es intervallskaliert ist, man ist sich aber sicher, dass es mehr als ordinalskaliert ist. In einem solchen Fall könnte man eine Interpretation auf einer Intervallskala versuchen, diese Annahme aber bei der Interpretation berücksichtigen und dort entsprechend vorsichtig vorgehen. Ein Beispiel dafür ist die Bildung von Durchschnitten bei Schulnoten als Ziffern kodiert, die eigentlich ein ordinalskaliertes Merkmal darstellen, weil sie in festen Begriffen definiert sind z.Z. in Deutschland von sehr gut bis ungenügend.
Andere Beispiele sind Uhrzeiten ohne Angabe des Datums (zirkadiane Daten) oder Himmelsrichtungen. Hier sind wie bei Intervallskalen Abstände interpretierbar, aber anders als bei Intervallskalen liegt keine Ordnung vor (liegt 2:00 Uhr vor oder nach 22:00 Uhr?).
Literatur
- Fahrmeir, L.; Hamerle, A.; Tutz, G. (Hrsg): Multivariate statistische Verfahren; 2., überarbeitete Auflage Berlin, New York; Walter de Gruyter 1996, ISBN 3110138069
- Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik; Der Weg zur Datenanalyse Berlin, Heidelberg, New York; Springer 1999, ISBN 3540678263
- Kan, S.H.: Metrics and Models in Software Quality Engineering; Second Edition Boston; Pearson Education 2003, ISBN 0201633396