Per Definition bezeichnet Data-Mining den Prozess, große Datenmengen systematisch zu filtern und zu durchsuchen, um darin Muster, Zusammenhänge und verborgene Strukturen zu erkennen. Vereinfacht gesagt, handelt es sich beim Data-Mining um eine Art „Datenschürfen“. Dabei greift Data-Mining auf Erkenntnisse aus der Informatik, Mathematik, Statistik, künstlichen Intelligenz sowie aus spezifischen Anwendungsfeldern zurück.
Die rechnergestützte Analyse im Rahmen des Data-Mining erfolgt dabei nie zum Selbstzweck. Ziel ist es, damit Entscheidungen zu verbessern. Data-Mining-Modelle ermöglichen es, große und heterogene Datenbestände im Hinblick auf konkrete Geschäftsziele zu analysieren, sie in möglichst homogene Gruppen zu clustern und daraus die interessanten und nützlichen Informationen zu extrahieren. Außerdem können Data-Mining-Tools auf Basis bereits vorhandener Merkmale Prognosen für zukünftige Merkmale erstellen.
Die Data-Mining-Verfahren lassen sich grob in zwei Gruppen einteilen: Entweder dienen sie dazu, einen Zieldatensatz genauer zu beschreiben oder dazu, Vorhersagen zu machen.
Ein Beispiel: Ein Unternehmen, das Produkte für Verbraucher verkauft, möchte seine Gutschein-Strategie verbessern. Dazu durchsuchen die Data-Mining-Tools alle historischen Daten. Sie können alle Informationen miteinander in Beziehung setzen – also zum Beispiel prüfen, wann und wie oft Kunden in der Vergangenheit Gutscheine eingelöst haben und dies mit Verkaufszahlen, Lagerbeständen und weiteren Kundendaten vergleichen. All dies liefert dem Unternehmen eine verlässliche Entscheidungsbasis dafür, wie es zukünftige Aktionen am besten planen sollte.