Data Mining bezeichnet die systematische Anwendung mathematisch-statistischer Methoden auf große Datenbestände. Ziel ist dabei das Aufspüren und Erkennen von zuvor unbekannten, nicht trivialen Mustern und Regeln.
Methodologie des Data Mining Prozesses:
1. Extraktion und Selektion der Daten
2. Explorative Datenanalyse
3. Aufbereitung und Bereinigung der Daten
4. Modellierung, Mustererkennung
5. Evaluierung der Ergebnisse, Kommunikation
Der Nutzen von Data Mining Modellen liegt in der Anwendbarkeit der gefundenen Muster im Rahmen von Geschäftsprozessen. Die Herausforderung lautet, mit dem Wissen
über historische Daten Aussagen über die Zukunft zu treffen. Erfahrung und Business Know-how sind dabei die entscheidenden Faktoren.