Die zunehmende Globalisierung und Liberalisierung der Märkte, der Wandel von Anbieter- zu Nachfragemärkten und die abnehmende Kundenloyalität verschärfen den Wettbewerb und führen dazu, dass Unternehmen ihre Aktivitäten immer stärker am Kunden ausrichten, um wettbewerbsfähig zu bleiben. Durch die sich ständig weiterentwickelnde Technologie entstehen immer neue Informationssysteme, die die Unternehmen in allen wichtigen Geschäftsprozessen unterstützen und zum Erhalt der Wettbewerbsfähigkeit und Positionierung am Markt beitragen. Im täglichen Einsatz dieser Systeme fallen eine große Menge unterschiedlichster Daten über Kunden, ihr Kaufverhalten, Reaktionen auf Werbeaktionen, etc. an, die sich ein Unternehmen durch eine entsprechende Auswertung und anschließende Integration der Analyseergebnisse in die Geschäftsprozesse zunutze machen kann. Um die enormen Datenmengen strukturiert analysieren, sinnvoll interpretieren und auf den Unternehmenserfolg abgestimmt auswerten zu können, werden computergestützte Werkzeuge und Methoden zur Datenuntersuchung benötigt. Ein Bereich, welcher zu diesem Zweck immer häufiger zum Einsatz kommt, ist das Gebiet des Data Mining (DM). Das Data Mining beinhaltet Verfahren und Algorithmen zur Wissensaufdeckung in Datenbanken und wird deshalb auch als „Knowledge Discovery in Databases (KDD)“ bezeichnet. Mit Hilfe von DM können für ein Unternehmen wichtige Fragestellungen wie „Werden Chips und Bier in der zweiten Jahreshälfte genauso häufig gekauft wie in der ersten?“ oder „Wie entwickelt sich der Aktienkurs der Firma Meier, wenn der Kurs der Konkurrenzfirma Müller sinkt?“ etc. beantwortet werden.
Inhaltsverzeichnis
1 Einleitung
1.1 Zielsetzung der Arbeit
1.2 Aufbau der Arbeit
2 Grundlagen des Data Mining
2.1 Data Mining
2.1.1 Einordnung des Begriffs Data Mining
2.1.2 Definition Data Mining
2.1.3 Data Mining als Prozess des Maschinellen Lernen
2.1.4 Beziehungsgefüge Data Mining und On-Line Analytical Processing
2.2 Text Mining
2.3 Web Mining
2.3.1 Informationen für das E-Business
2.3.2 Einsatzgebiete des Web Mining
3 Datenbasis
3.1 Informationsquellen
3.2 Datentypen
3.3 Data Warehouse
3.4 Betriebswirtschaftlicher Regelkreis
4 Funktionen und Ziele des Data Mining
4.1 Der Data Mining-Prozess
4.1.1 Vorverarbeitungsphase
4.1.2 Miningphase
4.1.3 Auswertungsphase
4.1.4 Text-/Web Mining-Prozess
4.2 Analysen und Aufgaben des Data Mining
4.2.1 Klassifizierung
4.2.2 Prognose
4.2.3 Assoziation
4.2.4 Segmentierung
4.2.5 Repräsentation
4.3 Methoden des Data Mining
4.3.1 Statistische Methoden
4.3.2 Entscheidungsbaumverfahren
4.3.3 Clusteranalyse
4.3.4 Künstliche Neuronale Netze (KNN)
4.3.5 Assoziationsmethoden
5 Einsatzgebiete von Data Mining
5.1 Data Mining im Customer Relationship Management
5.2 E-Commerce als Einsatzgebiet des Web Mining
5.3 Data Mining im Handel (Warenkorbanalyse)
6 Zusammenfassung und Fazit
Zielsetzung & Themen
Die vorliegende Diplomarbeit zielt darauf ab, den Prozess des Data Mining für den Leser transparent zu gestalten, dessen Anwendungspotenziale in innovativen Systemen zu erläutern und einen Ausblick auf zukünftige Anwendungsfelder zu geben.
- Grundlagen und Definitionen des Data Mining, Text Mining und Web Mining.
- Analyse der notwendigen Datenbasis und des betriebswirtschaftlichen Regelkreises.
- Detaillierte Darstellung des Data Mining-Prozesses und seiner verschiedenen Phasen.
- Methodische Ansätze, einschließlich Klassifizierung, Prognose, Assoziation und Segmentierung.
- Praktische Anwendungsgebiete im Customer Relationship Management (CRM), E-Commerce und Handel.
Auszug aus dem Buch
2.1.1 Einordnung des Begriffs Data Mining
Im Begriff DM steckt das aus dem Bergbau stammende Wort „Mining“. Hierbei werden enorme Gesteinsmengen mit großem technologischem Aufwand maschinell abgebaut und aufbereitet, um Edelmetalle ans Tageslicht zu fördern. Ähnlich werden beim DM riesige Datenbestände mit speziellen Methoden/Tools durchforstet, um an neue Informationen oder Wissen zu gelangen. Die Ergebnisse, die durch das „Schürfen“ und „Graben“ der DM-Tools erzielt werden, werden in Anlehnung an frühere Goldgräberzeiten auch als „Knowledge Nuggets“ bzw. „Wissensbarren“ bezeichnet.
Die Tools entstammen Verfahren der Datenanalyse aus den Forschungsgebieten der Künstlichen Intelligenz, der Statistik, des Maschinellen Lernens und der Mustererkennung. Die Methoden aus diesen Gebieten haben die Aufgabe, aus riesigen Datenvolumina autonom aussagekräftige und nicht triviale Hypothesen zu generieren, ohne zuvor eine konkrete Fragestellung erhalten zu haben. Es wurde jedoch schnell klar, dass DM alleine noch kein Garant für ein solches Ergebnis ist. E. Thomsen schrieb in einem seiner Bücher: „… you need to know a lot about your data to mine successfully …“.
DM gilt daher als Intelligenzverstärker für die Mitarbeiter, die mit diesen Tools arbeiten. Daher wird in der Literatur von einem Wissensentdeckungsprozess gesprochen. Dieser Prozess des „Knowledge Discovery in Databases“ (KDD = Wissensentdeckung in Datenbanken) beinhaltet neben den DM-Methoden zunächst einmal die Aufgabendefinition und die Datenaufbereitung und nach der eigentlichen Anwendung der Analysetools die Ergebnisevaluation. DM ist somit im eigentlichen Sinne nur eine Maßnahme innerhalb des KDD-Prozesses, die bestimmte DM-Algorithmen/-Methoden beinhaltet, welche besondere Muster entdecken können. Die meisten Autoren – sowie auch der Verfasser dieser Arbeit – verwenden DM oder den DM-Prozess synonym zu KDD oder dem KDD-Prozess. Bei den Beschreibungen des Prozesses oder der Werkzeuge wird dabei vielfach auf die Literatur zu KDD zurückgegriffen.
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung thematisiert den wachsenden Wettbewerbsdruck und die Notwendigkeit für Unternehmen, computergestützte Analysemethoden einzusetzen, um aus umfangreichen Kundendaten wertvolle Informationen zu generieren.
2 Grundlagen des Data Mining: Dieses Kapitel definiert Data Mining, Text Mining und Web Mining und bettet diese als Werkzeuge zur Wissensentdeckung (KDD) in betriebswirtschaftliche Kontexte ein.
3 Datenbasis: Hier werden die Quellen von unternehmensinternen und -externen Daten, verschiedene Datentypen sowie die Rolle des Data Warehouse und des betriebswirtschaftlichen Regelkreises beschrieben.
4 Funktionen und Ziele des Data Mining: Es erfolgt eine detaillierte Erläuterung des Data Mining-Prozesses, der Aufgabenbereiche wie Klassifizierung und Prognose sowie der mathematisch-technischen Methoden zur Mustererkennung.
5 Einsatzgebiete von Data Mining: Dieses Kapitel veranschaulicht den praktischen Nutzen von Data Mining in CRM-Systemen, E-Commerce-Umgebungen und durch Warenkorbanalysen im Handel.
6 Zusammenfassung und Fazit: Die Arbeit schließt mit einem Resümee über die Bedeutung von Data Mining als strategisches Instrument für Unternehmen zur Wissensgenerierung und kundenorientierten Prozessoptimierung.
Schlüsselwörter
Data Mining, Knowledge Discovery in Databases, KDD, Web Mining, Text Mining, Data Warehouse, Kundenbeziehungsmanagement, CRM, Customer Lifetime Value, Warenkorbanalyse, Klassifizierung, Prognose, Clusteranalyse, Künstliche Neuronale Netze, Entscheidungsbaumverfahren
Häufig gestellte Fragen
Worum geht es in dieser Diplomarbeit?
Die Arbeit untersucht Data Mining als Komponente innovativer Systeme, wobei der Fokus auf der Wissensentdeckung aus großen Datenbeständen zur Unterstützung unternehmerischer Entscheidungen liegt.
Welche zentralen Themenfelder behandelt die Arbeit?
Die zentralen Themen sind die theoretischen Grundlagen des Data Mining, der technische Datenaufbereitungsprozess, die methodische Analyse von Daten sowie die Anwendung dieser Verfahren in CRM, E-Commerce und Handel.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, den Data Mining-Prozess transparent darzustellen und aufzuzeigen, wie Unternehmen durch den Einsatz dieser Methoden wettbewerbsfähig bleiben und Kundenbeziehungen personalisiert steuern können.
Welche wissenschaftliche Methode wird primär verwendet?
Es handelt sich um eine theoretische Arbeit, die sich auf die Literatur zu KDD, Data Mining-Algorithmen und betriebswirtschaftlichen Anwendungen stützt, um den Prozess von der Datenbasis bis zur Ergebnisimplementierung zu modellieren.
Was steht im Hauptteil der Arbeit im Mittelpunkt?
Der Hauptteil behandelt den Data Mining-Prozess (Vorverarbeitung, Miningphase, Auswertung), die verschiedenen Aufgabenkategorien sowie spezifische Methoden wie Entscheidungsbäume und Neuronale Netze.
Welche Schlüsselwörter charakterisieren die Arbeit am besten?
Die Arbeit lässt sich durch Begriffe wie Data Mining, KDD, CRM, Web Mining, Warenkorbanalyse und statistische Methoden charakterisieren.
Warum ist das Data Warehouse für den Data Mining-Prozess essenziell?
Das Data Warehouse dient als zentrale Datenbasis, die vereinheitlichte Daten historisiert vorhält, was eine konsistente Analyse über verschiedene Zeiträume hinweg erst ermöglicht.
Was ist der Unterschied zwischen dem deduktiven und dem induktiven Ansatz?
Beim deduktiven Ansatz bestätigen Experten bestehende Hypothesen mit Tools, während der induktive Ansatz (Data Mining) aus einer Datenbasis autonom neue, bisher unbekannte Muster generiert.
- Quote paper
- Stefan Kempka (Author), 2003, Data Mining als Komponente innovativer Systeme, Munich, GRIN Verlag, https://www.grin.com/document/85571