In dieser Arbeit werden grundlegende KPIs für IT-Projekte herausgearbeitet und in Bezug auf Data Science Projekte analysiert. In Data Science Projekten spielt das Projektcontrolling eine zentrale Rolle, da die zeitlichen Aufwände und Kosten häufig schwer einzuschätzen sind. Auftraggeber möchten ihre Use Cases mit Methoden des Machine Learnings effizient und erfolgreich umsetzen. In diesem Zusammenhang ist das erfolgreiche Projektcontrolling während des Projektverlaufs ein entscheidender Aspekt. Das konsequente Projektcontrolling kann durch den Einsatz von aussagekräftiger Kennzahlen, sogenannter Key Performance Indikatoren (KPIs) positiv beeinflusst werden. Nach einigen Studien schlagen 85% aller Data Science Projekte fehl, deshalb ist ein frühzeitiges Erkennen von Hindernissen essenziell. In klassischen IT-Projekten existieren viele KPIs zum Projektcontrolling, diese sind allerdings nicht ausreichend für Data Science Projekte.
Inhaltsverzeichnis
1 EINFÜHRUNG
2 GRUNDLAGEN
2.1 Projektcontrolling
2.2 Balanced-Scorecard-Konzept
2.2.1 Key Performance Indikatoren
3 ANALYSE
3.1 Geschäftsverständnis
3.2 Datenverständnis
3.3 Datenvorbereitung
3.4 Modellierung / Evaluation
3.5 Bereitstellung
4 DISKUSSION
5 ZUSAMMENFASSUNG
Zielsetzung & Themen
Die Arbeit untersucht, inwiefern klassische Key Performance Indikatoren (KPIs) aus dem IT-Bereich für das Projektcontrolling von Data Science Projekten geeignet sind und welche spezifischen Kennzahlen zur Erfolgsmessung ergänzend herangezogen werden müssen.
- Grundlagen des Projektcontrollings und des Balanced-Scorecard-Konzepts
- Analyse des Data Science Prozessmodells CRISP-DM in Bezug auf Controlling-Aspekte
- Identifikation und Definition spezifischer Data Science Kennzahlen
- Vergleich zwischen klassischen IT-Projekten und Data Science Projekten
- Diskussion über Transparenz und Erfolgsfaktoren in der Projektsteuerung
Auszug aus dem Buch
3.2 DATENVERSTÄNDNIS
Die Datenbasis bietet die Grundlage für ein erfolgreiches Data Science Projekt. In diesem Schritt muss sich ein Data Scientist einen Überblick über die Daten verschaffen und die Qualität bewerten. Hier schließt sich die Frage an, was unter Datenqualität zu verstehen ist. Die Datenqualität beschreibt, wie gut die Daten für den ausgearbeiteten Use Case geeignet sind. Ein Data Scientist prüft die Qualität der Daten anhand von Kriterien wie bspw. Korrektheit, Relevanz, Vollständigkeit, Konsistenz und Verfügbarkeit (vgl. [May20]). Der Fokus eines Data Scientisten sollte also stets auf der Datenqualität liegen und nicht nur auf der Quantität. Nach einer ersten Einschätzung durch einen Data Scientisten kommt es in der Regel zur Aufwandsabschätzung und damit zur Budgetplanung.
Zusammenfassung der Kapitel
EINFÜHRUNG: Erläutert die Relevanz des Projektcontrollings in IT-Projekten und leitet die Forschungsfragen zur Anwendung von KPIs in Data Science Projekten her.
GRUNDLAGEN: Beschreibt die theoretischen Basismodelle des Projektcontrollings sowie das Balanced-Scorecard-Konzept zur Definition von Kennzahlen.
ANALYSE: Untersucht anhand des CRISP-DM Modells die Anwendbarkeit von KPIs in den verschiedenen Phasen eines Data Science Projekts.
DISKUSSION: Reflektiert die Analyseergebnisse kritisch anhand von Praxiserfahrungen und bewertet die Eignung klassischer vs. spezifischer Kennzahlen.
ZUSAMMENFASSUNG: Fasst die wesentlichen Erkenntnisse über die Notwendigkeit von Data Science spezifischen KPIs zur erfolgreichen Projektsteuerung zusammen.
Schlüsselwörter
Data Science, Projektcontrolling, Key Performance Indikatoren, KPI, CRISP-DM, Machine Learning, Projektmanagement, Balanced Scorecard, Datenqualität, IT-Projekte, Modellgüte, Prozessmodell, ROI, Erfolgsmessung, Projekterfolg
Häufig gestellte Fragen
Worum geht es in dieser Studienarbeit grundsätzlich?
Die Arbeit beschäftigt sich mit dem Projektcontrolling in Data Science Projekten und der Frage, wie man durch den Einsatz geeigneter Key Performance Indikatoren (KPIs) den Projekterfolg messbar und transparenter machen kann.
Was sind die zentralen Themenfelder der Publikation?
Die zentralen Themen sind das klassische IT-Projektcontrolling, die Adaption des Balanced-Scorecard-Konzepts sowie die strukturierte Analyse von Data Science Prozessen mittels des CRISP-DM Modells.
Was ist das primäre Ziel der Untersuchung?
Das primäre Ziel ist es, herauszuarbeiten, ob herkömmliche IT-KPIs für Data Science Projekte ausreichen oder ob spezifische, auf Machine Learning und Datenprozesse zugeschnittene Kennzahlen für eine erfolgreiche Steuerung notwendig sind.
Welche wissenschaftliche Methode wird zur Analyse verwendet?
Der Autor nutzt eine methodische Analyse auf Basis des CRISP-DM Prozessmodells, ergänzt durch eine kritische Diskussion, die auf theoretischen Grundlagen und eigenen praktischen Erfahrungen in Data Science Projekten beruht.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die theoretischen Grundlagen des Projektcontrollings, die Definition allgemeiner IT-KPIs sowie die spezifische Betrachtung jeder Phase des Data Science Prozesses hinsichtlich geeigneter Steuerungsgrößen.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind Data Science, Projektcontrolling, Key Performance Indikatoren (KPIs), CRISP-DM, Machine Learning sowie die Modellgüte und Dateneffizienz.
Welche Rolle spielt das CRISP-DM Modell für das Controlling?
Das Modell dient als Strukturrahmen, um für jede Projektphase – vom Geschäftsverständnis bis zur Bereitstellung – konkrete Ansatzpunkte für das Projektcontrolling und die Anwendung von KPIs zu identifizieren.
Warum sind laut Autor klassische IT-KPIs oft nicht ausreichend?
Der Autor argumentiert, dass Data Science Projekte durch Besonderheiten wie die Modellgüte oder die Unvorhersehbarkeit der Datenvorbereitung gekennzeichnet sind, die durch Standard-KPIs (wie reine Budget- oder Zeitvorgaben) allein nicht vollständig abgedeckt werden.
- Quote paper
- Patrick Tinz (Author), 2021, Einsatz von Key Performance Indikatoren im Controlling von Data Science Projekten, Munich, GRIN Verlag, https://www.grin.com/document/1041311