Inhaltsverzeichnis
Inhaltsverzeichnis 2
Abkürzungsverzeichnis 4
Abbildungsverzeichnis 5
1. Einführung und Inhalt der Arbeit 7
2. - 7
2.1 Der CRISP Data Mining Prozess 8
2.1.1 Business Understanding 9
2.1.2 Data Understanding 10
2.1.3 Data Preperation 11
2.1.4 Modeling 12
2.1.5 Evaluation 12
2.1.6 Deployment 13
2.2 Phasen des Data Mining 13
3. Aufgaben und geeignete Methoden des Data Mining 14
3.1 Segmentierung 15
3.1.1 Clusteranalyse als Methode der Segmentierung 15
3.1.2 Beispiel: Single Linkage Verfahren 16
3.2 Klassifikation 19
3.2.1 Entscheidungsbäume als Methode der Klassifikation 19
3.2.2 Fallbeispiel Werbeaktion einer Autoversicherung 19
3.3 Prognose 21
3.4 Abhängigkeitsanalyse 21
3.4.1 Abhängigkeitsanalyse mit Assoziationsregeln 22
3.4.2 Beispiel Getränketransaktionen 22
3.5 Abweichungsanalyse 24
4. Anwendungsfelder 24
5. Data Mining Werkzeuge 25
2
5.1 IBM Intelligent Miner 26
5.2 SPSS Clementine 27
5.3 SAS Enterprise Miner 27
6. Zielkonflikt Data Mining und Datenschutz 27
7. Fazit 28
Literaturverzeichnis 30
1. Zeitschriften Zeitungen 30
2. Bücher 30
3. Internetquellen 30
3
Abkürzungsverzeichnis
ASCII
bzw.
CRISP
CRM Customer Relationship Management
d.h. das heißt
DM Data Mining
usw. und so weiter
vgl. vergleiche
z.B. zum Beispiel
4
Abbildungsverzeichnis
Abbildung 1: What main methodology are you using for data mining
Umfrage im August 2004
www kdnuggets com polls 2004 data mining methodology htm vom 22 12 2004
Abbildung 2: Phases of the - Process Model
www - org Process index htm vom 16 10 2004
Abbildung 3: Skalenniveau und Datentypen
vgl Otte Ralf Otte Viktor Kaiser Volker Data Mining für die industrielle Praxis 2004
Abbildung 4: Data Mining Aufgaben und zugeordnete Techniken
eigene Darstellung
Abbildung 5: Verfahrensklassen der Clusteranalyse
vgl Witten Ian H Eibe Frank 2001 Data Mining Praktische Werkzeuge und Techniken für
das maschinelle Lernen München: Hanser Verlag
Abbildung 6: Datenmatrix
eigene Darstellung
Abbildung 7: Abstandsmatrix 1
eigene Darstellung
Abbildung 8: Abstandsmatrix 2
eigene Darstellung
Abbildung 9: Abstandsmatrix 3
eigene Darstellung
Abbildung 10: Abstandsmatrix 4
eigene Darstellung
5
Abbildung 11: Beispiel eines Entscheidungsbaumes vgl. www.dirk-loss.de vom 20.11.2004
Abbildung 12: Transaktionen
www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004
Abbildung 13: Assoziationsregeln mit Mindestsupport 50% www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004
Abbildung 14: Anwendungsfelder des Data Mining vgl. Wiedmann, Klaus- Peter. Buckler, Frank. Neuronale Netze im Marketing- Management; ferner www.doag.org/pub/docs/sig/dwh/2000-07/data-mining.ppt vom 12.11.2004
Abbildung 15: Marktpositionen von Data Mining Tools Alpar, Paul. Niedereichholz, Joachim. Data Mining im praktischen Einsatz. 2000.
6
1. Einführung und Inhalt der Arbeit
Durch die Informationsflut haben die Datenmengen in den letzten Jahren rasant zugenommen. Diese Datenberge können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen beitragen oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen. Nicht zu unrecht wird Wissen oftmals als vierter Produktionsfaktor oder als entscheidender Wettbewerbsfaktor bezeichnet 1 . Doch dieses Wissen in den Datenbergen kann oft nicht oder nur unzureichend genutzt werden. Denn Daten sind nicht gleich Information, bzw. Wissen. Im Gegensatz zu den herkömmlichen Verfahren, die auf einfachen statistischen Methoden und Datenbankmanagementsystemen basieren, verbinden Data-Mining Verfahren Methoden aus den Bereichen Statistik, Maschinelles Lernen, Datenbanken und Visualisierung 2 . Diese unterstützen den Benutzer dabei, in großen Datenbeständen verborgene und für das Unternehmen wertvolle Daten aufzufinden. Mithilfe von Data Mining können die Unternehmen quasi einen Blick in die Zukunft werfen und Ereignisse mit einer gewissen Wahrscheinlichkeit voraussagen 3 .
In der nachfolgenden Arbeit wird zuerst in einer Einführung dargestellt, was man unter Data- Mining versteht und der Data-Mining Prozess anhand des CRISP- DM Modells erklärt. Anschließend werden die Data Mining Aufgaben und ihnen zugeordnete Methoden anhand von Beispielen veranschaulicht.
Um die große Bedeutung für die Praxis zu verdeutlichen wird danach ein Überblick der wichtigsten Anwendungsfelder gegeben. Da ein Data Mining ohne Daten unmöglich ist, muss der Zielkonflikt zwischen Data Mining und dem Datenschutz diskutiert werden, bevor in einem Fazit auf die zukünftige Bedeutung des Data Mining eingegangen wird.
2. Data-Mining
Der Begriff Data-Mining lässt sich vom Englischen „to mine“ = „schürfen nach“ ableiten. Unter Data- Mining versteht man wörtlich übersetzt das Schürfen in Massendaten 4 . Häufig wird Data Mining mit dem Schürfen nach Gold verglichen, da das Wissen, das die
1 vgl. Wittmann, Thomas. Hunscher, Matthias. Kischka, Peter. Ruhland, Johannes. Data Mining. Entwicklung und Einsatz robuster Verfahren für betriebswirtschaftliche Anwendungen. 2000.
2 vgl. kd.cs.uni-magdeburg.de/data-mining-ueberblick.pdf vom 14.10.2004 3 vgl. Schausten, Jutta. Blick in die Zukunft. e-commerce Magazin 03/ 2004.
4 vgl. Lusti, Markus. Data Warehousing und Data Mining. 2002.
7
Unternehmen mithilfe intelligenter Data Mining Methoden aus den Datenbergen gewinnen, für die Unternehmen sehr wertvoll ist.
„Data Mining ist ein Prozess zum Auffinden von unbekannten und nicht- trivialen Strukturen, Zusammenhängen und Trends in Datenbeständen 5 .“ Ein erfolgreicher Data Mining Prozess liegt demzufolge nur dann vor, wenn neue und hinreichend komplexe Ergebnisse gewonnen werden 6 .
2.1 Der CRISP Data Mining Prozess
Durch das CRISP-DM (Cross Industry Standard Process for Data Mining) Modell wurde im Jahr 2000 ein einheitlicher Standard für Data Mining Prozesse geschaffen. Dieses Modell wurde seit 1996 von den Firmen NCR Systems Engineering, Daimler Chrysler AG, SPSS Inc. und der niederländischen Versicherungsgruppe OHRA Verzekeringen en Bank Groep B.V. entwickelt und wird mittlerweile am häufigsten angewendet 7 .
Abbildung 1: What main methodology are you using for data mining? (August 2004) (Quelle: vgl. www.kdnuggets.com/polls/2004/data_mining_methodology.htm vom 23.12.2004)
Es gliedert einen Data-Mining Prozess in folgende sechs Phasen, die jeweils aus Aufgaben und Zwischenergebnissen bestehen:
- Business Understanding
- Data Understanding
- Data Preperation
5 Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004
6 vgl. Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004.
7 vgl. www.crisp-dm.org vom 16.10.2004
Arbeit zitieren:
Diplom-Betriebswirtin (FH) Sandra Feist, 2005, Data Mining, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Der Rechtsschutz des DRM im Wandel
Eine Analyse des digitalen Rec...
Jura - Medienrecht, Multimediarecht, Urheberrecht
Seminararbeit, 27 Seiten
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Referat (Ausarbeitung), 15 Seiten
Data Mining mit SPSS Clementine (Zielsetzung, unterstützte Methoden, A...
Informatik - Wirtschaftsinformatik
Seminararbeit, 27 Seiten
Rechtemanagement in Verteilten Systemen mit Web-Services
Informatik - Internet, neue Technologien
Diplomarbeit, 97 Seiten
Digitale Produkte und Digital Rights Management
Informatik - Wirtschaftsinformatik
Seminararbeit, 18 Seiten
Digitale Produkte und Digital Rights Management
Informatik - Wirtschaftsinformatik
Hausarbeit, 17 Seiten
Formen der internationalen Koordination
BWL - Unternehmensführung, Management, Organisation
Hausarbeit, 26 Seiten
Erstellung eines Produktionsplanes in Zusammenarbeit mit Vertrieb und ...
Seminararbeit, 14 Seiten
Elektronische Programmführer und ihre Auswirkung auf die Wettbewerbssi...
Medien / Kommunikation - Film und Fernsehen
Magisterarbeit, 135 Seiten
Einfluss der Internationalität auf Organisationsstrukturen - Structure...
BWL - Personal und Organisation
Seminararbeit, 43 Seiten
Corporate Identity in der Unternehmensführung
BWL - Unternehmensführung, Management, Organisation
Studienarbeit, 44 Seiten
Softwareentwicklung und Vertragstypen
Jura - Medienrecht, Multimediarecht, Urheberrecht
Seminararbeit, 25 Seiten
Prognoseverfahren in der Disposition
BWL - Unternehmensführung, Management, Organisation
Hausarbeit, 26 Seiten
Formate im interaktiven Fernsehen
Eine explorative Analyse
Medien / Kommunikation - Film und Fernsehen
Hauptseminararbeit, 47 Seiten
Kommunikationsansätze und Kommunikationsstrukturen in Unternehmen und ...
Rhetorik / Phonetik / Sprechwissenschaft
Vordiplomarbeit, 39 Seiten
Plattform für interaktives Live-Internet-TV
Kostengünstige Distribution/Ve...
Informatik - Angewandte Informatik
Bachelorarbeit, 174 Seiten
Corporate Identity Management - Aufbau einer ganzheitlichen Unternehme...
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Studienarbeit, 38 Seiten
Sandra Feist hat den Text Data Mining veröffentlicht
Sandra Feist hat einen neuen Text hochgeladen
0 Kommentare