Zum Inhalt springen

Knowledge Discovery in Databases

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. Juni 2004 um 04:25 Uhr durch Mkleine (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Knowledge Discovery in Databases stellt einen Oberbegriff zum bekannteren Begriff Data Mining dar. Generell ist die Zielsetzung des KDD, in gegebenen großen Datenmengen bislang unbekannte Zusammenhänge zu erkennen. Während man mit Data Mining meist den eigentlichen Prozess der Datenanalyse meint, umfasst KDD auch die Vorbereitung der Daten sowie die Bewertung der Resultate.

Der KDD-Prozess läuft in einer Reihe von Schritten ab.

  1. Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich.
  2. Definition der Ziele der Wissensfindung.
  3. Datenauswahl.
  4. Datenbereinigung.
  5. Datenreduktion (z.B. durch Transformationen).
  6. Auswahl eines Modells, in welchem das gefundene Wissen repräsentiert werden soll.
  7. Data Mining, die eigentliche Datenanalyse.
  8. Interpretation der gewonnenen Erkenntnisse.

Ggf. können diese Schritte iterativ mehrfach durchlaufen werden.