Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

CRISP-DM steht für "Cross Industry Standard Process for Data Mining" und ist ein bewährtes Framework für den Datenanalyseprozess.

Unabhängig davon, ob Sie ein erfahrener Datenanalyst oder ein Neuling in der Welt der Datenanalyse sind, bietet CRISP-DM eine strukturierte Methode, um datengetriebene Projekte erfolgreich durchzuführen.

Auf dieser Seite geben wir Ihnen einen Überblick über die Phasen des CRISP-DM-Prozesses und wie Sie ihn erfolgreich in Ihrem Unternehmen anwenden können. Außerdem stellen wir Ihnen die Chancen, Herausforderungen und einige Best Practices vor.

Darüber hinaus haben Sie die Möglichkeit, von unserer Expertise zu profitieren, indem wir Ihnen ein kostenloses Strategiegespräch anbieten, um Ihre individuellen Datenanalysebedürfnisse zu besprechen.

 

 

 

Inhalt

 

Was ist CRISP-DM?

 

Im Jahr 2000 wurde mit dem CRISP-DM-Modell („Cross Industry Standard Process for Data Mining“) ein einheitlicher Prozessstandard für Data Mining geschaffen. Die Ursprünge des CRISP-DM-Modells lassen sich auf drei Unternehmen zurückführen, die seit 1996 als Branchenführer in der Auswertung großer Datenbestände, insbesondere im Bereich des Data Mining, tätig sind. Es handelt sich um die Firmen NCR System Engineering, SPSS Inc. und die DaimlerChrysler AG. Auch die Europäische Union beteiligt sich an der Entwicklungsfinanzierung.

Grundsätzlich ist das CRISP-DM-Verfahren unabhängig von Branche, Größe, Datenmengen, Vorkenntnissen und technischen Strukturen anwendbar.

Als Ergebnis der kontinuierlichen und tiefgreifenden Entwicklung auf dem Gebiet des Data Mining haben sie mit dem CRISP-DM-Modell einen einheitlichen Standard geschaffen. Dazu gehören NCR System Engineering, SPSS Inc. und die DaimlerChrysler AG. Kernziel des CRISP-DM-Modells ist es, Unternehmen einen standardisierten Data-Mining-Prozess zur Verfügung zu stellen, der branchen-, software- und anwendungsunabhängig ist. Kurzer Überblick über die Ziele des Data Mining Vorgehensmodells:

 

  • Schaffung eines einheitlichen Prozess- und Programmmodells für Data-Mining-Projekte
  • Weite Verbreitung in verschiedenen Industrien
  • Data Mining Leitfaden und Projekt in 6 Schritten

 

 

phasen crips dm 2

Die 6 Phasen des CRISP-DM Modells

 

1. Geschäftsverständnis

Die erste Phase von CRISP-DM ist das Geschäftsverständnis. In diesem ersten Schritt müssen die grundlegenden Probleme und Fragen des Projekts geklärt werden.

  • Welche Fragestellung soll gelöst werden?
  • Wie lautet die genaue Zielsetzung?
  • Wie laufen die zugrundeliegenden Geschäftsprozesse ab?

Hier werden hauptsächlich Informationen über die Geschäftssituation des KundenIdentifizierung von personelle und materielle Ressourcen, die genutzt werden könnten, gesammelt.

 

 

2. Datenverständnis

 

Der nächste Prozess im CRISP-DM-Modell ist die Datenaufbereitung und insbesondere das Datenverständnis. Diese Phase kann in die folgenden Schritte unterteilt werden:

  • Daten sammeln: In dieser Phase werden die für die Analyse benötigten Daten beschafft und ggf. in bestehende Datensätze integriert. Probleme bei der Datenbeschaffung sollten vom Analysten immer dokumentiert werden, um mögliche Diskrepanzen in einem späteren Folgeprojekt zu vermeiden.
  • Daten beschreiben: In diesem Schritt geht es darum, ein allgemeines Verständnis der Daten zu erlangen. Des Weiteren werden die Eigenschaften der Daten beschrieben, wie z.B. die Datenmenge, die Formateigenschaften, die Anzahl der Datensätze und Felder sowie die Eigenschaften der Felder. Die entscheidende Frage, die sich der Analytiker stellen sollte, ist, ob die verfügbaren Daten für die Datenanalyse ausreichen, um das Projekt erfolgreich abzuschließen.
  • Untersuchung der Daten: Bei der Datenanalyse werden erste Analysen mit den Daten durchgeführt, um z.B. bestimmte Produktgruppen zu identifizieren, die einen großen Teil des Umsatzes ausmachen. Dazu werden Berichte erstellt, um erste Erkenntnisse und Hypothesen zu visualisieren.
  • Auswertung der Daten: Anschließend werden die Daten ausgewertet. Es soll festgestellt werden, ob die Datenmenge für die Analyse ausreichend und brauchbar ist. Besonderes Augenmerk ist auf fehlende Attributwerte zu legen.

 

 

3. Datenaufbereitung

 

In der dritten Phase von CRISP-DM werden die für die Analyse relevanten Daten ausgewählt.

  • Datenauswahl: Die Auswahl der Daten für das Data Mining hängt stark von den Zielen ab, die für das Data Mining-Projekt festgelegt wurden. Dabei spielen die Datenqualität und die technischen Gegebenheiten eine wichtige Rolle. Am Ende dieses Prozesses sollte geklärt werden, welche Datensätze von der Analyse ausgeschlossen werden.
  • Datenbereinigung: Ohne Datenbereinigung ist ein erfolgreiches Datenverarbeitungsprojekt fraglich. Um die gewünschten Ergebnisse im Modell zu erhalten, sollte ein sauberer Datensatz ausgewählt oder der Datensatz bereinigt werden.
  • Datentransformation und -integration: Daten werden in ein Darstellungsformat umgewandelt, das zur Gewinnung von Informationen verwendet werden kann. Die Transformation organisiert die Daten und verändert ihre Details durch Gruppierung oder Sortierung. Es können Basiszahlen für Analysen erzeugt werden, z.B. Umsatz pro Kunde, Umsatzanteil pro Kunde oder prozentualer Umsatz in Produktgruppen pro Kunde etc.
  • Datenform: In einigen Fällen muss nur die Datenform geändert werden, um das Modell zu erstellen, z.B. muss der Datentyp geändert werden.

 

 

4. Modellierung

 

Die vierte Phase von CRISP-DM ist die Modellierung. Der Hauptteil dieser Phase besteht darin, verschiedene Modelle zu entwickeln und zu testen, um das beste Modell zu finden.

  • Es muss ein geeignetes Modell ausgewählt werden, mit dem das jeweilige Projekt am besten abgebildet werden kann.
  • Ein Testmodell wird erstellt, um die Genauigkeit und Qualität zu testen. Als Maß für die Qualität wird üblicherweise die auftretende Fehlerrate verwendet.
  • Es wird bewertet, ob das Modell die zu Beginn des Projektes festgelegten Ziele erfüllt. Darüber hinaus sind betriebswirtschaftliche Fragen zu bewerten.

 

 

5. Bewertung

 

In der fünften Phase von CRISP-DM geht es darum, das beste Modell zu evaluieren und zu überprüfen, ob es den Anforderungen entspricht.

  • Interpretation und Bewertung der Ergebnisse: In dieser Phase muss überprüft werden, ob und inwieweit die Projektziele erreicht wurden. Wenn die Ziele nicht erreicht wurden, muss dokumentiert werden, was geschehen ist.
  • Verfeinerung und Verbesserung des Modells: Nach der ersten Test- und Auswertungsphase können Anpassungen oder Änderungen vorgenommen werden. In einigen Fällen kann es auch ratsam sein, Projektattribute hinzuzufügen oder zu entfernen.
  • Schließlich muss der Projektleiter entscheiden, ob das vorliegende Projekt abgeschlossen und implementiert werden soll oder ob weitere Anpassungen erforderlich sind.

 

 

6. Bereitstellung

 

Die sechste und letzte Phase von CRISP-DM ist die Bereitstellungs- oder Implementierungsphase. Hier wird das Modell dem Kunden übergeben. Das erworbene Wissen wird nun so organisiert und präsentiert, dass der Kunde die Möglichkeit hat, dieses Wissen zu nutzen. Dazu gehören eine mögliche Implementierungsstrategie, die Überwachung der Modellvalidierung, ein zusammenfassender Bericht und die Präsentation beim Kunden.

  • Integration des Modells in die Produktionsumgebung
  • Benutzer- und Bedienerschulung durchführen
  • Überwachung und Wartung des Modells

Chancen und Herausforderungen des Modells

 

Chancen

 

  • Struktur: Durch standardisierte Prozesse und Aktivitäten gibt es eine klare Struktur und eine gemeinsame Terminologie für Data Mining Projekte.
  • Flexibilität: Der Prozess ist flexibel genug, um auf eine Vielzahl von Geschäftsproblemen und Datenquellen angewendet zu werden.
  • Iterativ: Der iterative Charakter des Prozesses ermöglicht die Modifikation und Verbesserung des Prozesses basierend auf dem Feedback aus früheren Schritten.
  • Transparenz: Der Prozess fördert Transparenz und Offenheit im Projektmanagement und erleichtert die Kommunikation zwischen verschiedenen Parteien.

 

Herausforderungen

 

  • Datenqualität: Die Qualität der Daten ist ein kritischer Faktor für den Erfolg von CRISP-DM. Wenn die Daten nicht vollständig, korrekt oder aktuell sind, können die Ergebnisse des Modellierungsprozesses beeinträchtigt werden.
  • Interpretation der Ergebnisse: Die Interpretation der Ergebnisse des Data Mining-Prozesses kann eine Herausforderung darstellen, insbesondere wenn komplexe Algorithmen zur Analyse und Modellierung der Daten verwendet werden.
  • Komplexität: Der CRISP-DM-Prozess ist komplex und erfordert viel Zeit und Ressourcen, um alle Phasen abzuschließen. Dies kann für einige Unternehmen oder Organisationen eine Herausforderung darstellen, insbesondere wenn es an Fachwissen oder Budget mangelt.

 

Ihr Ansprechpartner

 

Meinert Jacobsen, Diplom-Statistiker, wird Ihnen als Berater zur Seite stehen und Sie tatkräftig bei der Umsetzung und Implementierung des CRISP-DM Modells umfassend unterstützen.

 

Seit über 30 Jahren ist er in der Datenanalyse und Statistik tätig. Nach mehreren Stationen in großen internationalen Unternehmen ist er seit 2006 alleiniger Gesellschafter der marancon GmbH und seit 2016 Gründer der B2B Smart Data GmbH. 2024 fusionierten beide Schwesterfirmen zu datavance GmbH.

 

Darüber hinaus ist er als Dozent an der TuCed Chemnitz (seit 2014) sowie seit dem Jahr 2020 an der adg Montabaur und seit dem Jahr 2021 am International Management College tätig.

 

Jetzt Kontakt aufnehmen!

 

Referenz

 

 

Webinar Ankuendigung CRISP DM

Webinar: Erfolgsgarantie für Datenanalysen: Der Industriestandard CRISP DM

 

Vom Chaos zur Erkenntnis: Mit CRISP DM Ordnung in Ihre Daten bringen:
Datenanalysen sind heutzutage unverzichtbar, um erfolgreich am Markt agieren zu können. Doch wie kann man sicherstellen, dass eine Datenanalyse auch tatsächlich zum gewünschten Erfolg führt? Hier kommt der Industriestandard CRISP DM ins Spiel. Mit CRISP DM hat sich ein bewährtes Modell etabliert, das Unternehmen dabei unterstützt, ihre Datenanalyseprojekte erfolgreich umzusetzen.

In unserem Webinar zeigen wir Ihnen, wie Sie mit CRISP DM Schritt für Schritt durch den Datenanalyseprozess geführt werden und so eine Erfolgsgarantie für Ihre Datenanalysen erhalten. Verpassen Sie nicht diese Chance, um wertvolle Einblicke in eine der wichtigsten Methoden der Datenanalyse zu gewinnen!

 

Jetzt kostenfrei ansehen

Expertentalks

 

Tauchen Sie ein in die Welt der Expertentalks von datavance. Erfahren Sie aus erster Hand von führenden Experten der Branche, wie Sie datengetriebenes Marketing und Künstliche Intelligenz optimal für Ihr B2B-Unternehmen einsetzen können. Lassen Sie sich inspirieren, tauschen Sie sich aus und entdecken Sie neue Perspektiven für Ihren Erfolg.

Wir bieten Ihnen nicht nur klassische Expertentalks, sondern auch Podcasts, Vodcasts, Diskussionsrunden und vieles mehr! Hier finden Sie einen Überblick von Podcasts und Expertentalks, welche von Mitarbeitender der datavance mitgestaltet und durch Vorträge unterstützt wurden.

 

Jetzt Expertentalks anhören

FAQs

 

 

Gibt es bestimmte Voraussetzungen für CRISP-DM (bspw. Ein CRM)?

 

Nein, es gibt keine Voraussetzungen. Es gibt Kunden, die nicht über ein CRM-System verfügen und dieses auch nicht benötigen und trotzdem Analysen durchführen. Die Analyseprozesse können unabhängig von den Kundenprozessen durchgeführt werden. 

 

 

Welche Vorbereitungen müssen vor dem Projekt intern getroffen werden?

 

Es sind keine Vorbereitungen erforderlich. Wichtig ist nur, dass die richtigen Ansprechpartner gefunden werden und, dass diese auch Zeit für den Workshop haben und anwesend sind. Die Rahmenbedingungen werden im Rahmen des Projektes als erstes abgefragt und können dann in der Folge entsprechend umgesetzt werden.

 

 

Welche Personen müssen im CRISP-DM-Prozess beteiligt sein?

 

Wichtig sind die Fachabteilung, die Datenanalysten und diejenigen, die das Ganze hinterher anwenden müssen. Das ist zum Beispiel auch die IT. Idealerweise gehört auch die Geschäftsführung dazu, wenn sie im Projekt involviert ist und dahintersteht. Es macht auch Sinn, die Datenschutzbeauftragten und Rechtsabteilung am Anfang einzubinden.

 

 

Wie lange dauert das Projekt ungefähr?

 

Der erste Workshop dauert einen Tag. Dann folgt nach 2-3 Tagen die Dokumentation, aus der die nächsten Schritte abgeleitet werden. Es gibt Projekte, die 2 Wochen dauern, aber auch Projekte, die 5 Monate dauern. Die Dauer hängt immer davon ab, was am Ende umgesetzt wird und wie das Engagement ist. Das kann von einer Woche bis zu mehreren Jahren dauern. Aber in diesem Fall gibt es mehrere Prozesse, die parallel laufen.

 

 

Wie geht es nach dem Projekt weiter?

 

Nach dem Projekt ist vor dem Projekt. Das Deployment und die fertige Analyse sind abgeschlossen. Hier folgen meistens die nächsten Fragestellungen, die dann dementsprechend gelöst werden.