Zum Inhalt springen

Unüberwachtes Lernen

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 26. Januar 2006 um 18:11 Uhr durch 134.155.68.246 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Unüberwachtes Lernen (engl. unsupervised learning) bezeichnet maschinelles Lernen ohne im Voraus bekannte Zielwerte. Dabei können verschiedene Dinge gelernt werden. Beliebt sind die automatische Klassifikation (Clustering) oder die Komprimierung von Daten zur Dimensionsreduktion.

Klassifikation

Hier werden ähnliche Muster durch eine Klassifizierung auf ähnliche Klassen abgebildet.

Ein sehr vereinfachtes Beispiel: Man stelle sich verschiedene Früchte vor (Äpfel, Birnen, Erdbeeren, Orangen), die alle in einem gemeinsamen Korb liegen. Der Korb beinhaltet also die Menge der zu "klassifizierenden" Daten. Nun ist eine Frucht wahllos heraus zu nehmen. Danach sind Ähnlichkeiten mit den bereits auf dem Boden vorhandenen Früchten zu suchen. Wenn etwas passendes gefunden wurde, soll die Frucht dazugelegt werden. Wenn nicht, dann legt man sie irgendwo hin, wo Platz ist. Damit ist solange fortzufahren bis alle Früchte gemäß ihrer Eigenschaften (Aussehen, Geruch, Farbe, Geschmack etc.) "klassifiziert" wurden. Auf dem Boden liegen jetzt verschiedene Haufen von Früchten, mal größer, kleiner oder gleich je nach Häufigkeit des Auftretens. Das sind praktisch gesehen die Cluster.

Komprimierung

Hierbei wird versucht, viele Eingabewerte in einer kompakteren Form zu repräsentieren, wobei möglichst wenig Information verloren gehen soll. Die Hauptkomponentenanalyse kann zum Beispiel als Komprimierverfahren verstanden werden, wenn die unwichtigsten Komponenten der Daten weggelassen werden. Oder ein künstliches neuronales Netz, dessen Zielwerte die Eingabewerte sind, wobei eine versteckte Schicht mit weniger Knoten als Eingabewerte als Flaschenhals dient. Die Aktivierungen dieser Neuronen sind die komprimierten Daten.

Siehe auch