Zum Inhalt springen

Dendrogramm

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 14. Mai 2009 um 12:36 Uhr durch 79.217.207.98 (Diskussion) (google.de). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Dendrogramm: Die Objekte b und c, sowie d und e liegen sehr dicht zusammen, während f und a sich weiter entfernt davon befinden, siehe [1].

Ein Dendrogramm (griech. δένδρον (dendron) = Baum) dient zur Visualisierung einer Clusteranalyse in der multivariaten Statistik. Objekte werden nach Ähnlichkeit der Merkmalsausprägung zu Clustern gruppiert. Beginnend mit vielen Clustern wird die Anzahl nach und nach reduziert, so dass Objekte mit einer größeren Distanz in der Merkmalsausprägung im Fortgang der Analyse sich in einem Cluster wiederfinden.

Die hierarchische Clusterstruktur von Daten kann durch ein so genanntes Dendrogramm repräsentiert werden. Das ist ein Baum, der die hierarchische Zerlegung der Datenmenge in immer kleinere Teilmengen darstellt. Die Wurzel repräsentiert ein einziges Cluster, das die gesamte Menge enthält. Die Blätter des Baumes repräsentieren Cluster, in denen sich je ein einzelnes Objekt der Datenmenge befindet. Ein innerer Knoten repräsentiert die Vereinigung aller seiner Kindknoten. Jede Kante zwischen einem Knoten und einem seiner Kindknoten hat als Attribut noch die Distanz zwischen den beiden repräsentierenden Mengen von Objekten.

Zusätzlich zur Distanzfunktion zwischen einzelnen Objekten muss hier auch eine Distanzfunktion zwischen Mengen von Objekten vorgegeben werden.

Siehe auch