Knowledge Discovery in Databases
Erscheinungsbild
Knowledge Discovery in Databases stellt einen Oberbegriff zum bekannteren Begriff Data Mining dar. Generell ist die Zielsetzung des KDD, in gegebenen großen Datenmengen bislang unbekannte Zusammenhänge zu erkennen. Während man mit Data Mining meist den eigentlichen Prozess der Datenanalyse meint, umfasst KDD auch die Vorbereitung der Daten sowie die Bewertung der Resultate.
Der KDD-Prozess läuft in einer Reihe von Schritten ab.
- Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich.
- Definition der Ziele der Wissensfindung.
- Datenauswahl.
- Datenbereinigung.
- Datenreduktion (z.B. durch Transformationen).
- Auswahl eines Modells, in welchem das gefundene Wissen repräsentiert werden soll.
- Data Mining, die eigentliche Datenanalyse.
- Interpretation der gewonnenen Erkenntnisse.
Ggf. können diese Schritte iterativ mehrfach durchlaufen werden.