Für fast alle Entscheidungen in Unternehmen werden Daten benötigt. Information als Produktionsfaktor gewinnt heute immer mehr an Bedeutung. Während kleine Unternehmen oftmals noch überschaubare Datenbestände verwalten müssen, produzieren und sammeln große internationale Unternehmen mehr Daten innerhalb einer Woche, als ein Mensch in seinem Leben lesen könnte [ADRI96, S. 2]. Dieses Datenwachstum führt dazu, dass Unternehmen „den Wald vor lauter Bäumen nicht mehr sehen“, da diese Datenmengen selbst für große Unternehmen ohne maschinelle Unterstützung einfach nicht mehr handhabbar sind. Immer mehr Daten bedeuten deswegen immer weniger Information. Aus diesem Grund dürfen Daten nicht nur gesammelt werden, sondern müssen konsistent und nutzbar aufbereitet werden. Hier spricht man vom so genannten „data warehousing“ [ADRI96, S. 2; BERR97, S. 3-4]. Data Warehouses sind integrierte Datenbestände, die eine Schicht zwischen den analytischen und operativen Informationssystemen eines Unternehmens bilden [MERT01, S. 131]. Um schließlich einen Nutzen aus diesen Daten generieren zu können müssen die Daten analysiert, verstanden und in entscheidungsunterstützende Informationen umgewandelt werden. Dies ist die Aufgabe von „Data Mining“ [BERR97, S. 3-4].
Inhaltsverzeichnis
- Einführung
- Data Mining
- Was ist Data Mining?
- Warum findet Data Mining erst jetzt so viel Beachtung?
- Abgrenzung zu anderen Datenanalyseverfahren...
- Data Mining und SQL.....
- Data Mining und traditionelle Statistik
- Data Mining und Online Analytical Processing (OLAP)
- Data Mining und Ethik.
- Data Mining-Algorithmen und Methoden
- Data Mining zum Auffinden von Zusammenhängen..
- Data Mining zum Auffinden von Strukturen..
- Data Mining zum Generieren von Regeln
- Weitere Data Mining-Methoden....
- Data Mining-Prozessmodell CRISP-DM.
- Business Understanding..
- Data Understanding..
- Data Preparation...
- Modelling
- Evaluation.
- Deployment
- Data Mining mit SPSS Clementine 9.0.
- SPSS GmbH..
- Marktsituation.
- SPSS Clementine 9.0
- Vorgehensweise
- Anwendungsbeispiel Kündigeranalyse bei O2
- Problemstellung
- Ergebnis
- Fazit und Ausblick
Zielsetzung und Themenschwerpunkte
Dieses Dokument befasst sich mit dem Thema Data Mining, einem wichtigen Instrument zur Analyse und Interpretation großer Datenmengen. Es beleuchtet die Zielsetzung, die unterstützten Methoden und Anwendungsbeispiele im Kontext von SPSS Clementine.
- Die Bedeutung und Funktionsweise von Data Mining
- Die Abgrenzung von Data Mining zu anderen Datenanalysemethoden
- Die Anwendung von Data Mining-Algorithmen und -Methoden
- Das Data Mining-Prozessmodell CRISP-DM
- Die Anwendung von SPSS Clementine für Data Mining
Zusammenfassung der Kapitel
Die Einführung erläutert die wachsende Bedeutung von Daten und die Notwendigkeit, diese zu analysieren, um nutzbare Informationen zu gewinnen. Data Mining wird als ein Verfahren zur Erkennung von Mustern und Zusammenhängen in großen Datenmengen vorgestellt.
Das Kapitel über Data Mining beschreibt verschiedene Aspekte dieses Feldes, darunter seine Definition, die Gründe für seine zunehmende Popularität und seine Abgrenzung zu anderen Datenanalysemethoden. Es werden verschiedene Data Mining-Algorithmen und Methoden sowie das Data Mining-Prozessmodell CRISP-DM vorgestellt.
Das Kapitel über Business Understanding behandelt die ersten Schritte des CRISP-DM-Modells: die Definition des Problems, die Analyse der Daten und die Vorbereitung der Daten für die Modellierung. Die anschließenden Kapitel beschäftigen sich mit der Modellierung, der Evaluation und der Implementierung von Data Mining-Lösungen.
Im Kapitel über SPSS Clementine 9.0 wird die Software von SPSS für Data Mining vorgestellt, einschließlich ihrer Funktionalität und Anwendungsbereiche.
Das Kapitel über Vorgehensweise beschreibt die Anwendung von Data Mining in einem konkreten Beispiel, der Kündigeranalyse bei O2. Es geht auf die Problemstellung ein und erklärt die Vorgehensweise bei der Datenanalyse.
Schlüsselwörter
Data Mining, SPSS Clementine, Datenanalyse, Datenmustererkennung, Knowledge Discovery in Databases (KDD), CRISP-DM, Business Understanding, Data Understanding, Data Preparation, Modelling, Evaluation, Deployment, Multivariate Statistik, SQL, Online Analytical Processing (OLAP), Künstliche Intelligenz, Machine Learning, Mustererkennung, Regelgenerierung.
- Arbeit zitieren
- Christian Fuchs (Autor:in), 2005, Data Mining mit SPSS Clementine (Zielsetzung, unterstützte Methoden, Anwendungsbeispiele), München, GRIN Verlag, https://www.grin.com/document/45918