Entscheidungsrelevante Daten werden heutzutage von vielen Unternehmen in einer zentralen Datenbank gesammelt. Angesichts der Menge der dort gespeicherten Datenbestände ist eine manuelle Analyse jedoch in der Regel nicht mehr möglich. Hier sind Prozesse des Knowledge Discovery in Databases (KDD) mit dem Kernschritt des Data Mining gefragt, die bisher unbekannte Zusammenhänge und Muster in den Daten ermitteln können. Aber was genau ist Data Mining?
Dieses Zitat fasst das heutige Problem vieler Unternehmen zusammen und macht deutlich, dass ein Unterschied zwischen Daten und Informationen besteht. Heutzutage stehen Unternehmen nicht vor der Herausforderung zu wenige Daten zu erhalten. Im Gegenteil, es ist schwierig, die richtigen relevanten Informationen aus großen Datenmengen für die Entscheidungsfindung herauszufiltern und die Chancen und Risiken zu identifizieren.
Die zentrale Frage lautet also: Wie kann man nützliche Informationen bzw. verwertbares Wissen aus großen Datenbeständen erhalten?
Beim Data Mining werden aus vorhandenen Informationen neue und strategisch wertvolle Erkenntnisse abgeleitet.
Die wesentliche Aufgabe von Data-Mining-Experten ist es also, verborgene Zusammenhänge in großen Datenbanken aufzufinden, die für Unternehmen oder Forschungseinrichtungen nützlich sind. Der Zweck von Data Mining besteht also darin, Trends und Muster auf dem Markt und im Konsumentenverhalten zu finden, um geeignete Maßnahmen zu ergreifen.
Das Besondere an Data Mining ist, dass keine vorherigen Annahmen erforderlich sind. Das heißt, dass neue Zusammenhänge automatisch erkannt werden, ohne dass im Voraus eine Annahme aufgestellt werden muss.
Diese Annahmen werden während des Analyseprozesses, der sogenannten KDD (Knowledge Discovery in Database), entwickelt. Data Mining ist nur ein Teil des KDD-Prozesses und bezeichnet nur den eigentlichen Verarbeitungsschritt.
Knowledge Discovery in Databases (KDD) ist der Prozess der automatischen Extraktion von Wissen aus Datenbanken, das
Das Ziel von KDD ist es, aus den riesigen verfügbaren Datenmengen „nützliches“ Wissen zu generieren. Dabei ist Data Mining die Anwendung von speziellen Algorithmen, die Zusammenhänge und Muster aus den Daten ermittelt.
Wichtig: Nur aus dem Data Mining selbst kann kein „nützliches“ Wissen generiert werden. Erst mit all den anderen Teilschritten des Prozesses, können stichhaltige Muster und Aussagen gemacht werden.
Datenselektion → Datenvorverarbeitung → Datentransformation → Data Mining → Interpretation
Database Marketing steht im Marketing in direktem Zusammenhang mit Data Mining. Zum Teil werden die Begriffe auch synonym verwendet. Als das Database Marketing in den 1980er Jahren entwickelt wurde, wurden die heute unter Data Mining weiterentwickelten Analysen dem Database Marketing zugeschrieben. Heutzutage wird das Database Marketing jedoch als Marketinginstrument betrachtet, das sich auf die Anwendung und Implementierung des mithilfe von Data Mining erworbenen Wissens bezieht.
Einerseits wird mit der immer wachsenden Datenmenge das Auffinden der gewünschten Information, die sinnvolle Verdichtung von Daten und die Verwendung zu Zwecken der Entscheidungsunterstützung zu einem immer größeren Problem. Andererseits kann die wachsende Datenmenge auch als Chance begriffen werden, wenn es gelingt, das in den Daten liegende Wissen zu ermitteln und nutzbar zu machen. Analyseprozesse wie das Data Mining und Knowledge Discovery in Databases machen dies möglich.