Data Mining als Hilfsmittel für gezielte Datensuche


Studienarbeit, 2005

31 Seiten, Note: 1,3


Leseprobe

Inhaltsverzeichnis

Abkürzungsverzeichnis

Abbildungsverzeichnis

1. Einführung und Inhalt der Arbeit

2. Data-Mining
2.1 Der CRISP Data Mining Prozess
2.1.1 Business Understanding
2.1.2 Data Understanding
2.1.3 Data Preperation
2.1.4 Modeling
2.1.5 Evaluation
2.1.6 Deployment
2.2 Phasen des Data Mining

3. Aufgaben und geeignete Methoden des Data Mining
3.1 Segmentierung
3.1.1 Clusteranalyse als Methode der Segmentierung
3.1.2 Beispiel: Single- Linkage Verfahren
3.2 Klassifikation
3.2.1 Entscheidungsbäume als Methode der Klassifikation
3.2.2 Fallbeispiel Werbeaktion einer Autoversicherung
3.3 Prognose
3.4 Abhängigkeitsanalyse
3.4.1 Abhängigkeitsanalyse mit Assoziationsregeln
3.4.2 Beispiel Getränketransaktionen
3.5 Abweichungsanalyse

4. Anwendungsfelder

5. Data Mining Werkzeuge
5.1 IBM Intelligent Miner
5.2 SPSS Clementine
5.3 SAS Enterprise Miner

6. Zielkonflikt Data Mining und Datenschutz

7. Fazit

Literaturverzeichnis
1. Zeitschriften/ Zeitungen
2. Bücher
3. Internetquellen

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Abbildungsverzeichnis

Abbildung 1: What main methodology are you using for data mining?

Umfrage im August 2004

www.kdnuggets.com/polls/2004/data_mining_methodology.htm vom 22.12.2004

Abbildung 2: Phases of the CRISP-DM Process Model

www.crisp-dm.org/Process/index.htm vom 16.10.2004

Abbildung 3: Skalenniveau und Datentypen

vgl. Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004.

Abbildung 4: Data Mining Aufgaben und zugeordnete Techniken

eigene Darstellung

Abbildung 5: Verfahrensklassen der Clusteranalyse

vgl. Witten, Ian H. Eibe, Frank. 2001. Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. München: Hanser- Verlag.

Abbildung 6: Datenmatrix

eigene Darstellung

Abbildung 7: Abstandsmatrix 1

eigene Darstellung

Abbildung 8: Abstandsmatrix 2

eigene Darstellung

Abbildung 9: Abstandsmatrix 3

eigene Darstellung

Abbildung 10: Abstandsmatrix 4

eigene Darstellung

Abbildung 11: Beispiel eines Entscheidungsbaumes

vgl. www.dirk-loss.de vom 20.11.2004

Abbildung 12: Transaktionen

www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004

Abbildung 13: Assoziationsregeln mit Mindestsupport 50%

www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004

Abbildung 14: Anwendungsfelder des Data Mining

vgl. Wiedmann, Klaus- Peter. Buckler, Frank. Neuronale Netze im Marketing- Management; ferner www.doag.org/pub/docs/sig/dwh/2000-07/data-mining.ppt vom 12.11.2004

Abbildung 15: Marktpositionen von Data Mining Tools

Alpar, Paul. Niedereichholz, Joachim. Data Mining im praktischen Einsatz. 2000.

1. Einführung und Inhalt der Arbeit

Durch die Informationsflut haben die Datenmengen in den letzten Jahren rasant zugenommen. Diese Datenberge können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen beitragen oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen. Nicht zu unrecht wird Wissen oftmals als vierter Produktionsfaktor oder als entscheidender Wettbewerbsfaktor bezeichnet[1].

Doch dieses Wissen in den Datenbergen kann oft nicht oder nur unzureichend genutzt werden. Denn Daten sind nicht gleich Information, bzw. Wissen. Im Gegensatz zu den herkömmlichen Verfahren, die auf einfachen statistischen Methoden und Datenbankmanagementsystemen basieren, verbinden Data-Mining Verfahren Methoden aus den Bereichen Statistik, Maschinelles Lernen, Datenbanken und Visualisierung[2]. Diese unterstützen den Benutzer dabei, in großen Datenbeständen verborgene und für das Unternehmen wertvolle Daten aufzufinden. Mithilfe von Data Mining können die Unternehmen quasi einen Blick in die Zukunft werfen und Ereignisse mit einer gewissen Wahrscheinlichkeit voraussagen[3].

In der nachfolgenden Arbeit wird zuerst in einer Einführung dargestellt, was man unter Data-Mining versteht und der Data-Mining Prozess anhand des CRISP- DM Modells erklärt.

Anschließend werden die Data Mining Aufgaben und ihnen zugeordnete Methoden anhand von Beispielen veranschaulicht.

Um die große Bedeutung für die Praxis zu verdeutlichen wird danach ein Überblick der wichtigsten Anwendungsfelder gegeben. Da ein Data Mining ohne Daten unmöglich ist, muss der Zielkonflikt zwischen Data Mining und dem Datenschutz diskutiert werden, bevor in einem Fazit auf die zukünftige Bedeutung des Data Mining eingegangen wird.

2. Data-Mining

Der Begriff Data-Mining lässt sich vom Englischen „to mine“ = „schürfen nach“ ableiten. Unter Data- Mining versteht man wörtlich übersetzt das Schürfen in Massendaten[4]. Häufig wird Data Mining mit dem Schürfen nach Gold verglichen, da das Wissen, das die Unternehmen mithilfe intelligenter Data Mining Methoden aus den Datenbergen gewinnen, für die Unternehmen sehr wertvoll ist.

„Data Mining ist ein Prozess zum Auffinden von unbekannten und nicht- trivialen Strukturen, Zusammenhängen und Trends in Datenbeständen[5].“ Ein erfolgreicher Data Mining Prozess liegt demzufolge nur dann vor, wenn neue und hinreichend komplexe Ergebnisse gewonnen werden[6].

2.1 Der CRISP Data Mining Prozess

Durch das CRISP-DM (Cross Industry Standard Process for Data Mining) Modell wurde im Jahr 2000 ein einheitlicher Standard für Data Mining Prozesse geschaffen. Dieses Modell wurde seit 1996 von den Firmen NCR Systems Engineering, Daimler Chrysler AG, SPSS Inc. und der niederländischen Versicherungsgruppe OHRA Verzekeringen en Bank Groep B.V. entwickelt und wird mittlerweile am häufigsten angewendet[7].

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: What main methodology are you using for data mining? (August 2004)

(Quelle: vgl. www.kdnuggets.com/polls/2004/data_mining_methodology.htm vom 23.12.2004)

Es gliedert einen Data-Mining Prozess in folgende sechs Phasen, die jeweils aus Aufgaben und Zwischenergebnissen bestehen:

- Business Understanding
- Data Understanding
- Data Preperation
- Modeling
- Evaluation
- Deployment[8]

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Phases of the CRISP-DM Process Model (Quelle: www.crisp-dm.org/Process/index.htm vom 16.10.2004)

Dabei muss ein Data Mining Prozess als dynamischer Prozess verstanden werden, weshalb die Phasen nicht nacheinander abgearbeitet werden, sondern zwischen den Phasen hin- und hergesprungen wird[9]. Das CRISP-DM Modell legt dabei den Fokus nicht auf den technischen, sondern hauptsächlich auf den betriebswirtschaftlichen Bereich. Im weiteren Verlauf dieses Kapitels werden die einzelnen Phasen des Modells genauer erläutert.

2.1.1 Business Understanding

Dass die Fokussierung im betriebswirtschaftlichen Bereich liegt, wird schon in der ersten Phase, dem Business Understanding deutlich erkennbar.

Hier werden die betriebswirtschaftlichen Projektziele aus der Sicht der Fachabteilung festgelegt. Außerdem muss abgeschätzt werden, welche Daten und Ressourcen im Unternehmen für die Analyse vorhanden sind[10]. Besonders schwierig ist dies für ein Unternehmen, das sich erstmalig entscheidet, Problemstellungen mithilfe von Data Mining Techniken zu lösen. Diese Unternehmen können die Qualität ihrer Daten nicht oder nur schlecht einschätzen und sind oftmals der Meinung, dass sich diese nicht für Data Mining Auswertungen eignen. Allerdings ist diese Angst unbegründet, denn selbst fehlerhafte und lückenhafte Datenbestände können mithilfe der robusten Data Mining Techniken untersucht werden.

Des weiteren müssen in dieser Phase die Erfolgskriterien festgelegt und die zur Verfügung stehenden Mittel abgeschätzt werden. Hierbei muss auch überlegt werden, ob im Unternehmen ein eigenes Data Mining Werkzeug implementiert wird, bzw. bereits vorhanden ist, oder ob das Projekt einem externen Data Mining Dienstleister übergeben wird[11]. Um zu gewährleisten, dass die Ziele erreicht werden, muss in dieser Phase außerdem ein Projektplan erstellt werden, indem der zeitliche Ablauf dargestellt wird und außerdem die benötigten Tools und Techniken fixiert werden.

[...]


[1] vgl. Wittmann, Thomas. Hunscher, Matthias. Kischka, Peter. Ruhland, Johannes. Data Mining. Entwicklung und Einsatz robuster Verfahren für betriebswirtschaftliche Anwendungen. 2000.

[2] vgl. kd.cs.uni-magdeburg.de/data-mining-ueberblick.pdf vom 14.10.2004

[3] vgl. Schausten, Jutta. Blick in die Zukunft. e-commerce Magazin 03/ 2004.

[4] vgl. Lusti, Markus. Data Warehousing und Data Mining. 2002.

[5] Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004

[6] vgl. Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004.

[7] vgl. www.crisp-dm.org vom 16.10.2004

[8] vgl. www.crisp-dm.org vom 16.10.2004

[9] vgl. Schausten, Jutta. Blick in die Zukunft. e-commerce magazin 03/2004

[10] vgl. www.absatzwirtschaft.de vom 18.11.2004

[11] vgl. www.ipd.uni-karlsruhe.de/~ovid/Seminare/DWVSS03/ Vortraege/OVID-DWVSS03%20-%20KDD%20und%20Data%20Mining.pdf vom 20.11.2004

Ende der Leseprobe aus 31 Seiten

Details

Titel
Data Mining als Hilfsmittel für gezielte Datensuche
Hochschule
Hochschule für angewandte Wissenschaften Würzburg-Schweinfurt
Veranstaltung
Information und Kommunikation
Note
1,3
Autor
Jahr
2005
Seiten
31
Katalognummer
V70663
ISBN (eBook)
9783638619233
Dateigröße
583 KB
Sprache
Deutsch
Anmerkungen
Methoden und Einsatzgebiete des Data Mining
Schlagworte
Data, Mining, Information, Kommunikation
Arbeit zitieren
Diplom-Betriebswirtin (FH) Sandra Feist (Autor), 2005, Data Mining als Hilfsmittel für gezielte Datensuche, München, GRIN Verlag, https://www.grin.com/document/70663

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Data Mining als Hilfsmittel für gezielte Datensuche



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden