Zum Inhalt springen

Diskussion:Clusteranalyse

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 5. Dezember 2006 um 02:32 Uhr durch Wumpus3000 (Diskussion | Beiträge) (k-nearest-neighbour ist kein Clusteringverfahren; EM basiert nicht auf k-means (eher umgekehrt)). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 18 Jahren von Wumpus3000 in Abschnitt EM-Algorithmus

Eine Clusteranalyse der Wikipedia-Artikel wäre einen schönen wissenschaftlichen Artikel wert. Mist, mein Tag hat zu wenig Stunden! -- Nichtich 17:55, 11. Dez 2003 (CET)

Stimmt das?

"Der k-means-Algorithmus muss nicht notwendigerweise konvergieren." Der konvergiert doch immer, er liefert nur nicht notwendigerweise die optimale Lösung?

-- Mhm, wenn er in leere Cluster läuft, konvergiert er nicht mehr, sondern bricht ab - oder sehe ich das falsch? --

Es kann wohl auch Faelle geben in denen er eine Reihe von moeglichen Loesungen zyklisch durchlaeuft. Dann konvergiert er nicht. Wie das Auftreten leerer Cluster behandelt wird ist Implementierungsabhaengig. Ausser abbrechen kommen z.B. auch noch das zuweisen (eines nach irgendeinem Verfahren ausgewaehlten) Objektes an den leeren Cluster oder das berechnen einer Loesung mit weniger Clustern in frage. Letzteres kann vorallem Sinnvoll sein wenn die tatsaechliche Anzahl der Cluster nicht bekannt ist.

--

Aus dem Paper "On the Worst-Case Complexity of the k-means Method" von Arthur und Vassilvitki geht eindeutig hervor, dass k-means a) keine Lösung mehrmals durchläuft und daurch b) garantiert terminiert.

FEHLT:

Der BIRCH-Algorithmus fehlt hier ("Balanced Iterative Reducing and Clustering using Hirarchies"). Vielleicht kann ja jemand was dazu schreiben?

Der Artikel wirkt irgendwie zusammengewürfelt. Kann es sein, dass die Partitionierenden Clustering-Verfahren eigentlich auch zu den Hierarchischen Verfahren gehören? Zumindest werden dort auch teilende Verfahren benannt.

FEHLT die zweite:

es gibt neben hierarchischen und partitionierenden noch dichtebasierte verfahren quelle zb: http://www.diplomarbeit.biz/diplomarbeiten.php/733 ok kostet was aber hab jetzt nicht genauer gesucht

average group linkage

Könnte es sein, dass der Normierungsfaktor 1/|C| falsch ist und eher 1/|C|^2 lauten müsste?

k-Nearest Neighbour

Wie im Text auch erwähnt, handelt es sich hierbei um ein Klassifizierungs-Verfahren, nicht jedoch um ein Clustering-Verfahren. Ich denke, diesen Absatz sollte man ganz aus dem Artikel streichen. --Wumpus3000 01:32, 5. Dez. 2006 (CET)Beantworten

EM-Algorithmus

"Die Idee des EM-Algorithmus basiert auf dem Clustern nach k-means." Ich denke das ist nicht ganz richtig. Sowohl der einfache k-means, als auch der hier beschriebene Algorithmus basieren auf dem EM-Algorithmus. So verstehe ich auch die Aussage in "Neural Networks for Pattern Recognition; Christopher M. Bishop" (bei Google books "bishop em k-means" momentan erster Link). --Wumpus3000 01:32, 5. Dez. 2006 (CET)Beantworten

Literatur

... die habe ich nach unter verschoben. Gemeint waren sie wohl als Quellenangaben, deswegen könnte ruhig etwas weniger spezielle Literatur hier Einzug halten. Bitte signieren! --chrislb 问题 20:42, 5. Mai 2006 (CEST)Beantworten

Maximum Margin Clustering

Der Artikel sollte bitte überarbeitet werden. Wenn man nicht tief in der Materie ist, weiß niemand, was hier mit labeln gemeint sein soll. Doch dazu kenne ich mich gerade mit dem Verfahren zu wenig aus.

ist Schrott - enthält alten C-Code, der nicht mehr richtig compiliert. Von den Büchern darf man sich die Cover angucken - toll.

  • anschauliche Einführung in die graphentheoretische Clusteranalyse

http://www-users.rwth-aachen.de/Sven.Dieckert/wp-content/uploads/Clustering.pdf

ist eine bestenfalls sehr mäßige Ausarbeitung.

-> beides entfernt.

Danke für's Aufräumen! -- Nichtich 23:50, 13. Jun 2006 (CEST)


Wenn Euch meine Ausarbeitung nicht gefällt, ok, bin ja kein Mathematiker. Wie wäre es dann aber mit der Originalquelle? Marco Gaertler - Clustering (eng.) Da sind dann auch Beweise dabei. Außerdem ist keine der Methoden im Artikel aufgeführt. --80.138.119.77 08:11, 14. Jun 2006 (CEST) Sven Dieckert

Proseminar- und Seminararbeiten erreichen meist nicht den gewünschten Standard. Generell deswegen lieber weiterführende Quellen. "Originalquelle" ist sehr ausführlich. --chrislb 问题 10:46, 14. Jun 2006 (CEST)

Kategorie

Passt die Kategorie Netzwerk hier oder sollte es vielleicht in Computernetzwerk eingetragen werden? --131.159.14.142 12:53, 24. Jul 2006 (CEST)