Beurteilung eines binären Klassifikators

Überblick über die Beurteilung eines binären Klassifikators
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 10. Februar 2004 um 12:11 Uhr durch Zwobot (Diskussion | Beiträge) (Zwobot - User-controlled Bot: table syntax updated - 5 warnings!). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Wenn Menschen oder Maschinen Entscheidungen treffen, können sie Fehler machen. Dabei gibt es bei jedem Problem mit einer Ja/Nein-Entscheidung immer prinzipiell zwei richtige Entscheidungen und auch zwei verschiedene Fehlermöglichkeiten, die Fehler 1. und 2. Art genannt werden.

Diese Parameter sind wichtige Maße in der Statistik und hängen auch von der gewählten Fehlerwahrscheinlichkeit ab (z.B. 68 Prozent für das Zutreffen der Standardabweichung).

Allgemein

Wahrer Sachverhalt: H0 Wahrer Sachverhalt: H1
durch einen statist.Test fällt eine Entscheidung für: H0 1-alpha beta (Fehler 2. Art Falsch negativ)
durch einen statist.Test fällt eine Entscheidung für: H1 alpha (Fehler 1. Art, Falsch positiv) 1-beta. "Power"

Beispiele

Es brennt nicht Es brennt
durch Feuermelder fällt eine Entscheidung für: Es brennt nicht richtige Entscheidung Feuermelder bleibt stumm, obwohl es brennt
durch Feuermelder fällt eine Entscheidung für: Es brennt Fehlalarm wird ausgelöst richtige Entscheidung
Angeklagter ist unschuldig Angeklagter ist schuldig
durch ein Gericht fällt eine Entscheidung für: unschuldig richtige Entscheidung ein Schuldiger wird freigesprochen
durch ein Gericht fällt eine Entscheidung für: schuldig ein Unschuldiger wird verurteilt richtige Entscheidung
Person ist zugangsberechtigt Person ist nicht zugangsberechtigt
eine Zugangskontrolle fällt eine Entscheidung für: Person ist zugangsberechtigt richtige Entscheidung Unbefugter erhält Zugang
eine Zugangskontrolle fällt eine Entscheidung für: Person ist nicht zugangsberechtigt Berechtigter wird nicht eingelassen richtige Entscheidung

Fehler 1. Art

Vom Fehler 1. Art (alpha) spricht man, wenn man einen Effekt annimmt, der in Wirklichkeit gar nicht vorhanden ist. Mathematisch formuliert:

  • die so genannte Ausgangshypothese "H0" abgelehnt wird, obwohl sie richtig ist.

Die Ausgangshypothese (H0, "null" für keinen Unterschied) ist hierbei die Annahme, die Testsituation befindet sich im "Normalzustand", d.h. in den oben genannten Beispielen "es brennt nicht", "der Angeklagte ist unschuldig", "der Patient ist gesund" oder "die Person hat Zugangsberechtigung". Wird also dieser "Normalzustand" nicht erkannt, obwohl er tatsächlich vorliegt, handelt es sich um einen Fehler 1. Art.

Nota bene: Die Aussage "Ein Unterschied, etwa in einer Methode, wird auf einem Signikanzniveau von 5% festgestellt" ist nicht gleich bedeutend mit der Ausssage: "Wenn ich annehme, es gibt einen Unteschied, dann irre ich mich in 5% der Fälle." Für diese Aussage ist nämlich die Power (=1-beta) eines Tests zuständig!

Fehler 2. Art

Ein Fehler 2. Art (beta) liegt im umgekehrten Fall vor, wenn man es verabsäumt, einen Effekt als signifikant zu erklären, obwohl es ihn tatsächlich gibt, bzw.:

  • wenn die Ausgangshypothese nicht abgelehnt wurde, obwohl sie falsch ist.

Hier wird also nicht erkannt, dass nicht der "Normalzustand" vorliegt. Die solcherart falsch klassifizierten Zustände sind so genannte falsch positiv.

Die Häufigkeit für einen Fehler 1. Art wird bei der Berechnung von Signifikanzen als Irrtumswahrscheinlichkeit bezeichnet.

Nota bene:Bei der Berechnung mit Alpha und beta handelt es um sich bedingte Wahrscheinlichkeiten!

medizinischer Test

Ein Test auf Vorhandensein einer Krankheit kann im Prinzip vier Ergebnisse haben. Abhängig ob die untersuchte Person gesund ist, kann der Test ein richtiges Ergebnis (Sensitivität) liefern, oder auch ein falsches (falsch-negativ). Ist die Person gesund, kann sie richtig erkannt werden (Spezifität) oder falsch (falsch-positiv)

Krankheit vorhanden Krankheit nicht vorhanden
Testergebnis positiv Sensitivität falsch-positiv (Fehler 2. Art)
Testergebnis negativ falsch-negativ (Fehler 1. Art) Spezifität

Beide Fehlerraten eines (jeden) Tests hängen voneinander ab. Wenn man die Rate der Falsch-positiv Ergebnisse eines Tests verringert, so erhöht man die Falsch-negativ-Rate und umgekehrt. Mit anderen Worten je genauer man mit einem Test Kranke als solche identifizieren will, um so mehr Gesunde "erwischt" man und die Gefahr steigt, sie auch (fälschlich) als Kranke zu klassifizieren.

Dieser Zusammenhang wird bei verschiedenen Labortests ausgenutzt. Preiswerte Screening-Tests werden so justiert, dass eine möglich kleine anzahl falsch-negativer Ergebnisse vorliegt. Die produzierten falsch-positiven Testergebnisse werden anschließend durch einen Bestätigungstest identifiziert. Für schwerwiegende Erkrankungen sollte immer ein Bestätigungstest durchgeführt werden. Dieses Vorgehen ist für die Bestimmung von HIV sogar gefordert.

falsch positiv/falsch negativ

Bei einer diagnostischen Entscheidungssituation (gesund oder krank ?) kann es zu zwei Fehlklassifikationen kommen:

falsch positiv

1. eine Person wird zu Unrecht als krank bezeichnet, obwohl sie tatsächlich gesund ist: falsch positiv (Fehler 1. Art)

  • Falsch Positive (englisch: false positives) sind zu Unrecht als krank bezeichnete Gesunde.

falsch negativ

2. eine Person wird zu Unrecht als gesund bezeichnet, obwohl sie tatsächlich krank ist: falsch negativ (Fehler 2. Art)

  • Falsch Negative (englisch: false negatives) sind nicht entdeckte Kranke.

Beispiele

Beispiele für falsch positiv und falsch negativ:

Aids

Welche Konsequenzen ein falsch positiver Test haben kann, zeigt das Beispiel eines Menschen der sich auf AIDS testen ließ. Der Test war positiv. Daraufhin beendete der Mensch sein Leben durch Selbsttötung. Hinterher stellte sich heraus, dass er gar nicht von AIDS-Viren befallen waren. Der Test war falsch positiv ausgefallen.

Herzinfarkt

Es werden in den USA pro Jahr etwa 4 Millionen Frauen und Männer aufgrund von Schmerzen in der Brust unter der Verdachtsdiagnose Herzinfarkt in eine Klinik eingewiesen. Im Verlauf der aufwendigen und teuren Diagnostik stellt sich dann heraus, dass von diesen Patienten nur etwa 32 % tatsächlich einen Infarkt erlitten haben. Bei 68 % war die Diagnose Infarkt nicht korrekt. (falsch positive Verdachtsdiagnose). Andererseits werden in jedem Jahr etwa 34.000 Patienten aus dem Krankenhaus entlassen, ohne dass ein tatsächlich vorhandener Herzinfarkt erkannt wurde (ca 0,8 % falsch negative Diagnose).

Mammographie

Wie jeder Test liefert auch die Mammographie falsch positive Testergebnisse. Dies ist der Grund, dass jede zweite Frau, die regelmäßig zur Mammographieuntersuchung geht, einen positiven Befund bekommt, obwohl sie gar keinen Brustkrebs hat.

Siehe auch

Diagnose, Fehlerwahrscheinlichkeit, Glockenkurve, Signifikanz, Statistik, Testverfahren, statistischer Test