Zum Inhalt springen

Dendrogramm

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 16. Juni 2005 um 21:49 Uhr durch Wst (Diskussion | Beiträge) (Siehe auch). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die hierarchische Clusterstrukur von Daten kann durch ein sogenanntes Dendrogramm repräsentiert werden. Das ist ein Baum, der die hierarchische Zerlegung der Datenmenge O in immer kleinere Teilmengen darstellt. Die Wurzel repräsentiert einen einzigen Cluster, der die gesamte Menge O enthält. Die Blätter des Baumes repräsentieren Cluster, in denen sich ein einzelnes Objekt der Datenmenge befindet. Ein innerer Knoten repräsentiert die Vereinigung aller seiner Sohnknoten. Jede Kante zwischen einem Knoten und einem seiner Sohnknoten hat als Attribut noch die Distanz zwischen den beiden repräsentierenden Mengen von Objekten.

Zusätzlich zur Distanzfunktion zwischen einzelnen Objekten muß hier auch eine Distanzfunktion zwischen Mengen von Objekten vorgegeben werden.

Siehe auch