Die Abkürzung CRISP-DM steht für „Cross Industry Standard Process for Data Mining“, einen in den 1990er Jahren entwickelten Standard zum Aufsetzen von Datenanalyseprozessen. Der CRISP-DM-Prozess bietet allen Unternehmen einen Leitfaden, die Daten nutzen möchten, um strategische und operative Fragestellungen in Marketing, Vertrieb, Produktion, Beschaffung usw. zu beantworten. Der Einstieg in diesen Prozess besteht darin, ein umfassendes Geschäfts- und Datenverständnis in Bezug auf die zu untersuchende Fragestellung zu entwickeln.
Geschäfts- und Datenverständnis lassen sich gut in Form eines Workshops mit allen relevanten Beteilgten erarbeiten – dies sind die inhaltlich zuständige Fachabteilung, IT-Fachleute mit Kenntnissen über die vorhandenen Daten sowie die mit der Analyse betrauten Data Scientisten. Die mar.an.con hat für diesen Initial-Workshop zum Einstieg in den CRISP-DM-Prozess einen umfassenden Leitfragen-Katalog entwickelt. Auf diese Weise wird sichergestellt, dass alle relevanten Aspekte besprochen werden und nichts Wesentliches außer Acht bleibt.
Der Leitfragen-Katalog bildet alle Aspakte ab, die besprochen werden sollten, um das notwendige gemeinsame Geschäftsverständnis zu entwickeln. Sind alle diese Punkte besprochen, ist klar, welche konkrete Fragestellung zu beantworten ist, in welchem geschäftlichen Rahmen sich die zu behandelnde Fragestellung bewegt und wie der weitere Analyseprozess ablaufen soll: Am Ende sollte ein Projektplan stehen, aus dem sich Timing, Ressourceneinsatz und entstehende Kosten ergeben. Alle haben eine Vorstellung, wie das Zielfoto des Projekt-Ergebnisses aussehen könnte. Ergänzend dazu ist es wichtig, bereits zu Beginn gemeinsam einen Blick auf die Daten zu werfen: Welche Datenquellen stehen zur Verfügung, wie ist die Qualität und Aussagekraft dieser Daten zu beurteilen und an welchen Stellen bestehen möglicherweise noch Datenlücken, die zur Beantwortung der Fragestellung geschlossen werden sollten.
Im datavance-Whitepaper „CRISP-DM-Workshop“ werden die Inhalte dieses Initialworkshops näher vorgestellt. So gewinnen potenzielle Analyse-Einsteiger einen ersten Einblick in das, was sie auf der Reise zur datengetriebenen Beantwortung ihrer Fragestellung erwartet.