Unterstützenden Informationssystemen in operativen Prozessen. Process Mining mit Disco und ProM


Seminararbeit, 2013

22 Seiten, Note: 1,0


Leseprobe


1 Einleitung

Die Verknüpfung operativer Prozesse1 mit unterstützenden Informationssystemen nimmt in der heutigen Unternehmenswelt mehr und mehr zu. Das Process Mining verfolgt das Ziel, aus diesen Daten einen Nutzen zu generieren und möglichst viele Informationen über Prozesse zu extrahieren. Dies geschieht, indem das aufgezeichnete Verhalten zu Pro- zessmodellen zusammengefasst und für vielseitige Analysen und schließlich zur Optimie- rung der Geschäftsabläufe genutzt werden kann (van der Aalst, 2011, S.1).

Ziel dieser Arbeit ist es, ein vorhandenes Beispielset an Ereignis-Logdaten eines Work- flowmanagementsystems für die Bearbeitung von Krediten mit Hilfe des Process Mining zu untersuchen. Dabei beschränkt sich diese Untersuchung auf die Prozesserkennung (Discovery) aus der Prozessperspektive. In der Unternehmenswelt stellt der entdeckte Prozess den Startpunkt für weitere Analysen dar, wie beispielsweise Vergleiche zu bereits bestehenden Prozessmodellen und Finden von Abweichungen (Conformance Checking), Erkennung von Engpässen, Reduzierung von unerwünschten Abweichungspotenzialen, Optimierung von Ressourcenallokationen, Zeitprognosen und Aussprache von Empfeh- lungen sowie Verbesserung der Prozessabläufe (Enhancement) (van der Aalst, 2011, S. 155).

Ob ein entdecktes Prozessmodell zweckmäßig ist oder nicht, hängt schlussendlich von der Fragestellung ab, unter welcher das Modell untersucht wird (van der Aalst, 2011, S.155). Das Modell aus der Prozessperspektive möglichst genau zu durchleuchten und ein umfangreiches Spektrum als Grundlage für weitere Analysen zu bieten, stellt für diese Untersuchung somit das Ziel dar. Im Zuge dessen werden Analysen zu Durchlaufzeiten, der Verteilung der Arbeit und der grundlegenden Prozessperformance durchgeführt und darüber hinaus ein Clustering angewendet, um typische Auftragsmuster erkennen zu können.

2 Grundlagen des Process Mining

Das Process Mining verfolgt das Ziel, aus prozessbezogenen2 Daten von Unternehmen, die mit Hilfe von Informationssystemen als Ereignis-Logdaten aufgezeichnet wurden, Pro- zessmodelle zu erstellen. Es handelt sich dabei um de facto Modelle, die einen deskripti ven Charakter besitzen und demnach lediglich die Realität erfassen (van der Aalst, 2011, S. 243).

Für die Erzeugung von Prozessmodellen aus den prozessbezogenen Informationen steht verschiedene Software zur Verfügung.3 Im Rahmen dieser Arbeit wird auf ProM und Disco zurückgegriffen. ProM4 stellt eine Process Mining Software aus dem akademischen Be- reich dar und besitzt eine Plugin-orientierte Architektur. Sie enthält eine Vielzahl verschie- dener Algorithmen und anderer Analysewerkzeuge. Disco5 dagegen ist eine Software des Unternehmens Fluxicon, das durch intuitive Handhabung überzeugt und das Prozessmo- dell durch unterschiedliche Darstellungsweisen und Filter effizient untersuchen lässt (Stocker, Accorsi & Rother, 2013, S. 95).

In der Untersuchung dieser Arbeit wird lediglich die Prozessperspektive beleuchtet. Sie fokussiert sich auf den Kontrollfluss, zielt also auf das Ordnen der Aktivitäten ab, um als Ergebnis alle möglichen Pfade durch den Prozess adäquat wiederzugeben (van der Aalst, 2011, S. 11).

3 Process Mining aus der Prozessperspektive zur Erstellung des Prozessmodells

Um einen Überblick über die Komplexität des Prozesses gewinnen zu können6, ist es sinnvoll, sich zu Beginn verschiedene Statistiken über die aufgezeichneten Informationen vor Auge zu führen. Die Ereignis-Logdatei weist 442 Prozessinstanzen, 9.164 Ereignisse (gleichverteilt in Start- und Endereignisse) und 28 verschiedene Aktivitäten auf [Disco: Statistics - Overview; ProM: Log Summary].

Für die Erstellung eines Prozessmodells können mithilfe verschiedener Algorithmen kau- sale Abhängigkeiten zwischen den einzelnen Aktivitäten in den vorhandenen Ereignis- Logdaten erforscht werden. Jedoch gibt es zwei Schwierigkeiten, die diese Systematik erschweren. Zum einen kann nicht davon ausgegangen werden, dass eine Logdatei alle möglichen Abläufe des Geschäftsprozesses abbildet (Unvollständigkeit der Logdaten bzw. Completeness) (van der Aalst et al., 2007, S. 721). Zum anderen können selten auftre- tende Abfolgen von Ereignissen in der Ereignis-Logdatei vorkommen. Hierbei kann es sich um von der Norm abweichende Ausnahmen handeln, es können aber auch inkorrek- te oder unvollständige Einträge sein (Rauschen bzw. Noise) (de Medeiros, Weijters & van der Aalst, 2007, S. 6).

Wenige Entdeckungs-Algorithmen sind in der Lage, mit diesen Schwierigkeiten umzuge- hen. Zu ihnen zählen Heuristic Mining, Fuzzy Mining und Genetic Process Mining (van der Aalst, 2011, S. 187). Für die folgende Untersuchung ist diese Fähigkeit jedoch von entscheidendem Interesse, da die bereitgestellte Ereignis-Logdatei vor dem Mining keiner eingehenden Nachprüfung unterzogen wurde und eine Rücksprache mit Beteiligten des Prozesses nicht möglich ist.

Das Genetic Mining benutzt einen evolutionären Ansatz bei der Erstellung der Prozessmodelle und kann interessante Einblicke erzielen, allerdings benötigt die Anwendung des Algorithmus eine unangemessen hohe Arbeitszeit des Computers und wird deshalb an dieser Stelle nicht weiter betrachtet (van der Aalst, 2011, S. 169 - 173).

3.1 Anwendung des Heuristics Miners in ProM

Um den zuvor genannten Schwierigkeiten adäquat begegnen zu können, wurde in dieser Arbeit ein heuristischer Ansatz gewählt. Im Gegensatz zu deterministischen Ansätzen werden zusätzlich zum deterministischen Algorithmus die Häufigkeiten von Ereignissen und Pfaden einbezogen. Ein deterministischer Ansatz, wie beispielsweise der Alpha Algo- rithmus, bildet ein zu komplexes Modell ab und kann mit weiteren Schwierigkeiten, mit denen die Ereignis-Logdatei behaftet sein könnte, nicht umgehen (Gehrke & Werner, 2013, S. 138).

Der Heuristics Miner ist relativ robust, kann also mit Unvollständigkeit und Rauschen umgehen (van der Aalst, 2011, S. 163). Die Einbeziehung von Häufigkeiten schafft die Möglichkeit, sich bei der Konstruktion des Modells auf die Hauptaspekte des Prozesses zu konzentrieren, statt den gesamten Prozess in allen Einzelheiten abbilden zu wollen (van der Aalst et al., 2007, S. 721). Zudem stellt der Heuristics Miner einen Algorithmus dar, der auch mit weniger strukturierten Prozessen umgehen kann (Rozinat, de Jong & van der Aalst, 2009, S. 477). Als Ergebnis des Heuristics Miners wird das Prozessmodell als Ursachen-Wirkungs-Diagramm (Causal Net) dargestellt.

Durch einmaliges Erproben des Heuristics Miners unter vorheriger Anwendung des Add Artificial Start Task Log Filters und des Add Artificial End Task Log Filters wurde erfolgreich geprüft, ob alle Prozessinstanzen die gleiche Start- und Endaktivität besitzen [ProM: Filter - Advanced - Add Artificial Start Task Log Filter & Add Artificial End Task Log Filter]. Um einen möglichst detaillierten Überblick über den gesamten Prozess zu erlangen wurden vor dem Mining keine weiteren Filter angewendet.

Die erzeugten Modelle wurden bei unterschiedlicher Einstellung der Parameter unter Nut zung des in ProM implementierte Conformance Checker 7 validiert.8 Er lässt Schlussfolgerungen zu globalen Konformitätsaussagen und lokale Diagnosen treffen (van der Aalst, 2011, S. 191 - 192).

In Tabelle 1 ist ein Überblick über die berechneten Werte mittels des Conformance Che- ckers gegeben [ProM: Analysis - Selected Petri net - Conformance Checker]. Die Anwendung des Conformance Checkers auf ein Ursache-Wirkungs-Diagramm ist möglich, indem man dieses zuvor in ein Petri Netz konvertiert [ProM: Conversion - Heuristics net - Heuristics net to Petri net].

Durch die Berechnung der Fitness des Alpha- und Alpha-Plus-Algorithmus hat sich bestätigt, dass die Anwendung eines deterministischen Algorithmus kein hinreichend zufriedenstellendes Ergebnis, sondern ein sogenanntes Spaghetti-Modell produziert.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Ergebnisse der Anwendung des Conformance Checkers (Standardeinstellungen) auf die verschiedenen Algorithmen; saB - simple behavioral appropriateness, saS - simple structural appropriateness.

Vor der weiterführenden Diskussion der Ergebnisse soll im Folgenden auf die anderen konkurrierenden Qualitätskriterien hingewiesen werden, mit deren Hilfe sich die Qualität eines Prozessmodells spezifizieren lässt. Neben der Fähigkeit, jedes aufgezeichnete Ver- halten einer Ereignis-Logdatei wiederzugeben (Fitness), sollte das Modell möglichst ein fach gestaltet sein (Simplicity) und trotzdem kein zusätzliches Verhalten zulassen, das vom aufgezeichneten Verhalten abweicht (Precision). Darüber hinaus sollte eine Abstrak- tion und Generalisierung der Fälle vorgenommen werden, sodass es nicht nur auf das Beispielverhalten im Log beschränkt ist (Generalization) (van der Aalst, 2011, S. 150 - 153).

An dieser Stelle soll besonderer Wert auf die Fitness und die Precision des Prozessmo- dells gelegt werden, um eine hinreichende Basis für fortführende Analysen zu bilden und einen Überblick über möglichst viele, auch weniger häufig auftretende Wege im Prozess- modell zu erhalten. Somit fallen die Kriterien der Generalization und Simplicity nur als nachrangige Nebenbedingungen ins Gewicht. Eine gute Grundlage für diesen Ansatz er- weist die Variante 7 der Parametereinstellungen des Heuristics Miners, die sowohl bei der Fitness als auch bei der Precision die besten Werte erreichte. Das Ergebnis der Anwen- dung ist in Abbildung 1 zu sehen [ProM: Mining - Heuristics miner]. Die Parameter der Vari- ante 79 wurden so gewählt, dass ein detailliertes Prozessmodell mit der Modellierung von Verbindungen und Aktivitäten entsteht, die auch relativ weniger häufig auftreten. Die Structure weist zwar einen sehr geringen Wert auf, jedoch wird bei der Berechnung der Simple Structural Appropriateness lediglich die Größe des Prozessmodells berücksichtigt (Process Mining Group, 2009). Relativ gesehen ist der Unterschied des Structure-Wertes zu den anderen Varianten demnach in einem zufrieden stellenden Rahmen, da die Abbil- dung von zusätzlichem Verhalten erwünscht ist.

Für die Erklärung, dass keine Fitness von 100% erreicht werden kann, lassen sich mehre- re Ansatzpunkte finden. Insbesondere eine Kombination von Rauschen und seltenen Pro- zesswegen ist eine große Herausforderung beim Process Mining. Zum einen ist es dem Heuristics Miner nicht möglich, wenig frequentiertes Verhalten von Rauschen zu differen- zieren. Während das Abbilden von außergewöhnlichem Verhalten von Interesse ist, wird automatisch auch Rauschen bei der Erstellung des Modells einbezogen. Zum anderen besitzt dieser Algorithmus nicht die Fähigkeit, Verbindungen von Aktivitäten abzubilden, die gleichzeitig AND- und XOR-splits/joints sind (Saravanan & Rama, 2011, S.60). Insge- samt ist die Erzeugung eines Models, das 100% der Logdaten erklären kann, ein utopi- scher Ansatz und zudem im Rahmen der Untersuchung der Geschäftsabläufe nicht ziel- führend, da Logdaten aus realen Prozessen mit den bereits erläuterten Schwierigkeiten behaftet sind und nur einen Auszug aus dem realen Prozess abbilden. Fehler und Un- stimmigkeiten, die beim Conformance Checker gefunden werden, können sowohl auf Fehler im Modell als auch auf Fehler im Log zurückgeführt werden.

[...]


1 Dieses Kapitel wurde von Claudia Hamann verfasst.

2 Dieses Kapitel wurde von Claudia Hamann verfasst.

3 Eine Übersicht über die Process Mining-Programme ist in van der Aalst, 2011 Kapitel 10, insbesondere S. 270-271 zu finden. Ein aktueller Vergleich ausgewählter Programme ist in Lehmanns, Fahland, van der Aalst, 2014 aufgestellt worden.

4 www.processmining.org; in dieser Arbeit wurde die Version 5.2 verwendet.

5 www.fluxicon.com

6 Dieses Kapitel wurde von Claudia Hamann verfasst.

7 Verwendung des Conformance Checkers mit Standardeinstellungen mit Herausnahme der aaB und aaS und dafür Anwendung der saB und saS.

8 Vorgehensweise in Anlehnung an Leyer, 2012, S. 176 - 180.

9 Die verwendeten Werte der Parameter zu allen Varianten finden sich in Anhang 1.

Ende der Leseprobe aus 22 Seiten

Details

Titel
Unterstützenden Informationssystemen in operativen Prozessen. Process Mining mit Disco und ProM
Hochschule
Universität Rostock
Note
1,0
Autoren
Jahr
2013
Seiten
22
Katalognummer
V302614
ISBN (eBook)
9783668007819
ISBN (Buch)
9783668007826
Dateigröße
5804 KB
Sprache
Deutsch
Schlagworte
unterstützenden, informationssystemen, prozessen, process, mining, disco, prom
Arbeit zitieren
Claudia Hamann (Autor:in)Jelena Marczinzik (Autor:in), 2013, Unterstützenden Informationssystemen in operativen Prozessen. Process Mining mit Disco und ProM, München, GRIN Verlag, https://www.grin.com/document/302614

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Unterstützenden Informationssystemen in operativen Prozessen. Process Mining mit Disco und ProM



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden