Zum Inhalt springen

Dendrogramm

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 20. November 2006 um 23:42 Uhr durch Avron (Diskussion | Beiträge) (Katagorie Diagramm hinzugefügt). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Dendrogramm: Die Objekte b und c, sowie d und e liegen sehr dicht zusammen, während f und a sich weiter entfernt davon befinden, siehe [1].

Ein Dendrogramm (griech. δένδρον (dendron) = Baum) dient zur Visualisierung einer Clusteranalyse in der multivariaten Statistik. Objekte werden nach Ähnlichkeit der Merkmalsausprägung zu Clustern gruppiert. Beginnend mit vielen Clustern wird die Anzahl nach und nach reduziert, so dass Objekte mit einer größeren Distanz in der Merkmalsausprägung im Fortgang der Analyse sich in einem Cluster wiederfinden.

Die hierarchische Clusterstruktur von Daten kann durch ein so genanntes Dendrogramm repräsentiert werden. Das ist ein Baum, der die hierarchische Zerlegung der Datenmenge in immer kleinere Teilmengen darstellt. Die Wurzel repräsentiert einen einzigen Cluster, der die gesamte Menge enthält. Die Blätter des Baumes repräsentieren Cluster, in denen sich je ein einzelnes Objekt der Datenmenge befindet. Ein innerer Knoten repräsentiert die Vereinigung aller seiner Sohnknoten. Jede Kante zwischen einem Knoten und einem seiner Sohnknoten hat als Attribut noch die Distanz zwischen den beiden repräsentierenden Mengen von Objekten.

Zusätzlich zur Distanzfunktion zwischen einzelnen Objekten muss hier auch eine Distanzfunktion zwischen Mengen von Objekten vorgegeben werden.

Siehe auch