Definition:

Data Mining ist ein analytischer Prozess, der eine möglichst autonome und effiziente Identifizierung und Beschreibung von Datenmustern aus großen Datenbeständen ermöglicht.

Für Unternehmen ist Data Mining sehr hilfreich um Datenmengen zu analysieren und dann die entsprechenden Entscheidungen zu treffen. Vorteile sind dabei:

Beim Data Mining unterscheidet man 4 Methoden:

Klassifikation: Die Suche nach Mustern anhand eines Klassifikationsmerkmals. Z.B. Die Modellierung einer Produktaffinität.

Prognose: Die Suche nach Mustern einer numerischen Zielvariable. Z.B. Vorhersagen von Absätzen des nächsten Monats.

Gruppierung: Das Finden von Gruppen in einem Datenbestand. Z.B. Zur Kundensegmentierung.

Abhängigkeitsentdeckung: Die Suche nach Mustern, bei denen ein Element in Abhängigkeit zu einem Anderen steht. Z.B. Eine Warenkorbanalyse.

Da mehrere Methoden für die selbe Problemstellung verwendet werden können, werden sie nach Aufgabentyp eingeteilt.