»Torture the data and it will confess to anything.«

Ronald Coase, Economist, Nobel prize winner

Data Mining bezeichnet die systematische Anwendung mathematisch-statistischer Methoden auf große Datenbestände. Ziel ist dabei das Aufspüren und Erkennen von zuvor unbekannten, nicht trivialen Mustern und Regeln.

 

Methodologie des Data Mining Prozesses:

1. Extraktion und Selektion der Daten

2. Explorative Datenanalyse

3. Aufbereitung und Bereinigung der Daten

4. Modellierung, Mustererkennung

5. Evaluierung der Ergebnisse, Kommunikation


Der Nutzen von Data Mining Modellen liegt in der Anwendbarkeit der gefundenen Muster im Rahmen von Geschäftsprozessen. Die Herausforderung lautet, mit dem Wissen über historische Daten Aussagen über die Zukunft zu treffen. Erfahrung und Business Know-how sind dabei die entscheidenden Faktoren.