S e i t e II
Inhaltsverzeichnis
Abk ürzungsverzeichnis IV
Abbildungsverzeichnis V
Tabellenverzeichnis VI
1. Einleitung und Motivation 1
2. Process Mining 2
2.1 Begriffsklärung. 2
2.2 Sichten des Process Mining 3
2.3 Einsatzmöglichkeiten 3
2.4 Grundkonzepte 5
2.4.1 Einführung 5
2.4.2 Annahmen 5
2.4.3 Log-basierte Ordnungsrelationen 6
2.4.4 Mining-Prozess 7
2.4.5 Herausforderungen 9
2.5 Methoden 10
2.7 Ordnungsrahmen 11
3. Markov Modelle 12
3.1 Einführung 12
3.2 Markov-Ketten 12
3.3 Markov Modelle 13
4. Markov-basiertes Process Mining 15
4.1 Einführung 15
4.2 Endlicher Zustandsautomat (FSM) 16
4.3 Parametrisierung. 17
4.4 Beispiel 17
4.5 Processing. 18
4.5.1 Erstellung von Wahrscheinlichkeitstabellen 18
4.5.2 Konstruktion eines gerichteten Graphen 19
4.5.3 Auflösung überladener Knoten 20
S e i t e III
4.5.4 Konvertierung in einen endlichen Zustandsautomaten 21
4.5.5 Zusammenführung nichtdeterministischer Transitionen. 21
4.6 Metriken zur Erkennung paralleler Abläufe. 22
4.6.1 Vorbemerkung. 22
4.6.2 Entropy 23
4.6.3 Event Type Counts 23
4.6.4 Periodicy 24
4.6.5 Deciding Causality 24
4.7 Evaluation. 25
4.8 „Related Work“ 26
5. Zusammenfassung und Fazit 28
Literaturverzeichnis VII
S e i t e
Abbildungsverzeichnis
Abb. 1: Petri-Netz (Beispiel)
Abb. 2: Beispiel - Übergangsgraph
Abb. 3: Endlicher Automat - Beispiel
Abb. 4: Beispielstream
Abb. 5: Ereignisgraph nach Schritt 2 (Markov)
Abb. 6: Ereignisgraph nach Schritt 3 (Markov)
Abb. 7: Endlicher Zustandsautomat nach Schritt 4 (Markov)
Abb 8: Endlicher Zustandsautomat nach Schritt 5 (Markov)
S e i t e VI
Tabellenverzeichnis
Tabelle 1: Event-Log (Beispiel) 6
Tabelle 2: Ordnungsrahmen Process Mining 11
Tabelle 3: Wahrscheinlichkeitsverteilung 1. Ordnung (Markov) 19
Tabelle 4: Wahrscheinlichkeitsverteilung 2 Ordnung (Markov) 19
1. Einleitung und Motivation
Seit Anfang der 1990er Jahre hält die modellbasierte Ausführung von Prozessen immer mehr Einzug in Unternehmen und deren Informationssysteme. Beispielsweise werden im Bereich der Software-Entwicklung vor der Implementierung Modelle, der zu unterstützenden Prozesse, erstellt, sodass Missverständnisse im Vorfeld beseitigt werden und somit die Erfolgsaussichten eines Projektes gesteigert werden. Gleiches gilt im betrieblichen Kontext - idealerweise werden hier Prozessmodelle entworfen, welche später in die Ausführung durch menschliche oder maschinelle Ressourcen überführt werden. Geschäftsprozessmanagement- oder Workflowmanagementsysteme sind heute sogar in der Lage die grafisch visualisierten Modelle direkt und ohne Umwege auszuführen.
Alle an einem solchen Prozess beteiligten Informationssysteme, beispielsweise ERP (Enterprise Ressource Planung), CRM (Customer-Relationship-Management) oder SCM (Supply Chain Management), stellen Informationen zu den einzelnen Prozessschritten bereit, wodurch das Monitoring und die Analyse der Prozesse ermöglicht wird. Die Technologien dazu fallen unter die Schlagwörter BPA (Business Process Analysis) und BAM (Business Activity Monitoring). Die Existenz dieser und anderer Schlagwörter kennzeichnen die Notwendigkeit entsprechender Software, wobei Process Mining einen entscheidenden Beitrag liefert.
Das Ziel des Process Mining besteht in der Extraktion explizierter Prozessmodelle anhand der protokollierten Prozessinformationen, welche im Allgemeinen in Log-Dateien abgelegt werden. Dabei sollen nicht nur die Prozessabläufe analysiert, sondern auch kausale Zusammenhänge zwischen den einzelnen Aktivitäten hergestellt werden. Hier müssen allerdings bestimmte Annahmen getroffen und Hindernisse überwunden werden.
In Kapitel 2 der vorliegenden Arbeit wird deshalb zunächst auf das Process Mining im Allgemeinen eingegangen. Hier werden die Grundlagen vermittelt, die für das korrekte Verständnis der Problemstellung notwendig sind, sowie ein Ordnungsrahmen entworfen, um die verschiedenen Themenfacetten korrekt einordnen zu können. Kapitel 3 setzt sich mit Markov Modellen auseinander, um die Grundlagen für das Verständnis der nachfolgenden Kapitel zu vermitteln. Kapitel 4 beschäftigt sich anschließend mit dem Process Mining im Speziellen - genauer gesagt mit der Theorie und der Anwendung von Markov Ketten im Process Mining. Dieses Kapitel stellt somit den Schwerpunkt der Arbeit dar. Anschließend werden die gewonnenen Kenntnisse in Kapitel 5 zusam- mengefasst und im Fazit konkretisiert.
2. Process Mining
2.1 Begriffsklärung
Der Begriff des Process Mining, häufig in der Literatur auch als Workflow Mining oder Control Flow Mining bezeichnet, hat seinen Ursprung im Data Mining. Beim Data Mining wiederum handelt es sich um einen Begriff mit populärwissenschaftlichem Ursprung, welcher sowohl in den Natur- als auch in den Wirtschaftswissenschaften genutzt wird 1 . Aufgrund des engen Bezugs soll zunächst eine grundlegende Definition des Data Mining angeboten werden. Data Mining beschreibt „die Extraktion implizit vorhandenen, nicht trivialen und nützlichen Wissens aus großen, dynamischen, relativ komplex strukturier- tenDatenbeständen. […]“. Es wird versucht „Muster zu identifizieren, daraus Regeln abzuleiten, Unterschiede zwischen Gruppen von Datensätzen zu erkennen, diese Gruppen beschreibende Attribute zu bestimmen, die repräsentativsten Beispiele zu finden und Gleichungen zu konstruieren, die für numerische Variablen gelten“. 2
Das Process Mining, als eine spezielle Form des Data Mining, zielt auf ein bestimmtes Wissen ab - das Prozesswissen 3 . Demnach wird versucht, aus vor-handenen Datenbeständen genau das Wissen zu extrahieren, welches für die Beschreibung eines Prozesses notwendig ist.
Ebenfalls beschreiben Bissantz und Hagedorn 4 , ebenso wie Peterson 5 in Ihren Beiträgen allgemeine Charakteristiken, welche für Verfahren, die dem Data Mining zuzuordnen sind, typisch erscheinen: „limately understandable“: Die gewonnen Informationen werden in verständlicher Form (z.B. Text oder Grafik) präsentiert oder von einer Software weiterverarbeitet.
„valid“: Die generierten Thesen sind mit einer statistischen Sicherheit versehen.
„novel“: Der Fokus liegt auf neuen Erkenntnissen.
1 H. Petersohn: Data Mining: Verfahren, Prozesse, Anwendungsarchitektur; Oldenbourg Wis-senschaftsverlag 2005, S. 8
2 N. Bissantz; J. Hagedorn: Data Mining (Datenmustererkennung) , In: Wirtschaftsinformatik
Volume 35 (1993), S. 481
3 Van der Aalst, W: Process Mining, In: Liu, Ling; Özsu, M.T.: Encyclopedia of Database Sys-tems, Springer 2009, S. 2173
4 N. Bissantz; J. Hagedorn: Data Mining (Datenmustererkennung) , In: Wirtschaftsinformatik
Volume 35 (1993), S. 481
5 H. Petersohn: Data Mining: Verfahren, Prozesse, Anwendungsarchitektur; Oldenbourg Wis-
senschaftsverlag 2005, S. 9
Arbeit zitieren:
Tom Thaler, 2011, Markov-basiertes Process Mining, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Informatik - Wirtschaftsinformatik: Markov-basiertes Process Mining ist nun auf dem Buchmarkt erhältlich
Informatik - Wirtschaftsinformatik: neuer Titel erschienen: Markov-basiertes Process Mining
Tom Thaler hat einen neuen Text hochgeladen
Latent Markov Models for Longitudinal Data
Francesco Bartolucci, Alessio Farcomeni, Fulvia Pennoni
Data Modeling for the Business: A Handbook for Aligning the Business w...
Steve Hoberman, Donna Burbank, Chris Bradley
0 Kommentare