Ein stetiges Wachstum der Datenbestände macht den Zugriff auf gewünschte Informationen bzw. auf in Datenbasen enthaltenes Wissen immer schwieriger. Traditionelle Methoden wie Tabellenkalkulation und ad hoc Datenbankabfragen sind den aktuellen und werden den zukünftigen Anforderungen an Datenanalyse nicht gewachsen sein.(1)
Ziel dieser Arbeit ist die Untersuchung von Segmentierungsmöglichkeiten – bereits vorhandener Kundendaten – zur Neukundengewinnung mit Hilfe von OLAP und Data Mining. Dadurch soll dem virtuellen Unternehmen VMall die Möglichkeit eröffnet werden, gezielt Marketingaktionen durchzuführen und somit neue, umsatzkräftige Kunden zu werben. Dabei steht vor allem die Analyse mit Data Mining, im Speziellen mit dem Tool Skyon, im Vordergrund dieser Arbeit.
Bei der Erstellung dieser Arbeit wurden der Aufbau und die Struktur eines Data Warehouse sowie das OLAP-Tool MicroStrategy7 als bekannt vorausgesetzt. Diese Gebiete wurden von der Beschreibung ausgenommen, da sie keinen Untersuchungsschwerpunkt der Arbeit darstellen. Beide Themen bilden jedoch die Grundlage und sollten dem Leser deshalb bekannt sein.
Inhaltsverzeichnis
1. Einleitung
1.1 Einführung/Zielstellung
1.2 Abgrenzung
1.3 Methodik
2. Grundlagen Business Intelligence
2.1 OLAP
2.2 Data Mining
2.2.1 Einordnung des Data Mining in den Prozess des KDD
2.2.2 Entdecken von Hypothesen
2.2.3 Data Mining Verfahren
2.3 Vergleich OLAP und Data Mining
3. Data Mining Tool Skyon
3.1 Datenanbindung
3.2 Datenaufbereitung
3.3 Skyon Developer
3.3.1 Der Data Manager
3.3.2 Der Visualizer
4. VMall – ein virtuelles Beispielunternehmen
4.1 Einführung VMall
4.2 Beschreibung der Aufgabenstellung
4.3 Ansatz zur Lösung der Aufgabenstellung
4.3.1 Lösung mit MicroStrategy
4.3.2 Lösung mit Skyon
4.4 Gegenüberstellung der Lösungen von MicroStrategy7 und Skyon
5. Schlussbemerkung
5.1 Arbeit mit einem OLAP-Tool
5.2 Arbeit mit einem Data Mining-Tool
Zielsetzung & Themen
Die vorliegende Arbeit untersucht und vergleicht Segmentierungsmöglichkeiten von Kundendaten zur Neukundengewinnung unter Einsatz der Business-Intelligence-Methoden OLAP (am Beispiel MicroStrategy7) und Data Mining (am Beispiel des Tools Skyon) anhand eines virtuellen Datensatzes.
- Grundlagen der Business Intelligence, insbesondere OLAP und Data Mining
- Prozessmodell des Knowledge Discovery in Databases (KDD) nach Fayyad
- Funktionsweise neuronaler Netze, speziell der Kohonen Self-Organizing Maps (SOM)
- Experimentelle Kundensegmentierung in einem virtuellen Unternehmen
- Methodischer Vergleich der beiden Software-Ansätze in Bezug auf Handhabung und Ergebnisse
Auszug aus dem Buch
3.3.1 Der Data Manager
Nach der Auswahl der zu analysierenden Datenquelle wird dem Benutzer durch den Data Manager die Möglichkeit geboten, die Segmentierung der Daten zu beeinflussen.
Hierzu hat der Anwender die Wahl zwischen dem Single SOM Training und dem Multi SOM Training. Der Unterschied besteht in dem Verfahren der Auswahl der Netzgröße. Bei der Anwendung des Single SOM Training wird manuell die Netzgröße festgelegt.
Gegensätzlich dazu ermittelt das Multi SOM Training selbständig die optimale Netzgröße für die Darstellung der gruppierten Daten. Dabei müssen zwei Eigenschaften (partition limit = Anzahl von Datensätze die mindestens in einem Datenwürfel enthalten sein müssen; min net size = minimale Netzgröße) manuell eingegeben werden. Diese Eigenschaften dienen Skyon als Startgrößen der Netzberechnung. Die Berechnung geschieht über zwei Fehler, die sich im Trend gegenläufig verhalten, d.h. der Quantisierungsfehler QE sinkt und im Gegensatz dazu steigt der topographische Fehler TE bei zunehmender Netzgröße an. Der Quantisierungsfehler bewertet die Ähnlichkeit der Datensätze innerhalb eines Würfels. Somit ist der Fehler am geringsten, wenn jeder Datensatz einen eigenen Würfel zugewiesen bekommt. Bei dem topographischen Fehler wird der Abstand von dem Würfel, in den der Datensatz fällt, und dem Würfel, in den der Datensatz als nächstes gefallen wäre, bewertet. Dieser erhöht sich bei zunehmender Netzgröße.
Im Anschluss an die Auswahl der Netzgröße (Single SOM und Multi SOM) erfolgt die Gruppierung der Daten zu Datenwürfeln über das Verfahren Kohonen SOM.
Zusammenfassung der Kapitel
1. Einleitung: Definiert die Problemstellung der effizienten Datenanalyse bei wachsenden Datenbeständen und legt die Zielsetzung sowie die methodische Vorgehensweise der Arbeit fest.
2. Grundlagen Business Intelligence: Erläutert die Konzepte von OLAP und Data Mining, ordnet letzteres in den KDD-Prozess ein und beschreibt Verfahren neuronaler Netze wie Kohonen SOM.
3. Data Mining Tool Skyon: Beschreibt die technischen Funktionen des Tools Skyon, insbesondere die Datenanbindung, die Datenaufbereitung durch den MetaDatenEditor sowie die Analyse- und Visualisierungskomponenten.
4. VMall – ein virtuelles Beispielunternehmen: Detaillierte Darstellung des praktischen Experiments, bei dem Kundendaten eines virtuellen Versandhandels sowohl mit MicroStrategy7 als auch mit Skyon segmentiert und deren Ergebnisse verglichen werden.
5. Schlussbemerkung: Zieht ein Fazit über die Eignung von OLAP und Data Mining in der Praxis und bewertet die Vor- und Nachteile der jeweiligen Arbeitsweisen bei unterschiedlichen Fragestellungen.
Schlüsselwörter
Business Intelligence, Data Mining, OLAP, Wissensgewinnung, Kundensegmentierung, Knowledge Discovery in Databases, KDD, Kohonen SOM, neuronale Netze, MicroStrategy, Skyon, Datenanalyse, Marketing, Datensätze, Virtuelles Unternehmen
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Untersuchung und dem Vergleich von Kundensegmentierungsmethoden unter Einsatz von OLAP und Data Mining, um Marketingpotenziale bei einem virtuellen Versandhändler aufzudecken.
Was sind die zentralen Themenfelder?
Zentrale Themen sind Business Intelligence, die Methoden des Data Mining, spezifisch neuronale Netze (Kohonen SOM), sowie die praktische Anwendung von BI-Software auf ein konkretes Datenmodell.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, Kundendaten zur gezielten Neukundengewinnung zu segmentieren und dabei die Unterschiede in der methodischen Herangehensweise und Ergebnisauswertung zwischen OLAP und Data Mining aufzuzeigen.
Welche wissenschaftliche Methode wird verwendet?
Es wird eine experimentelle Untersuchung auf Basis von Daten eines virtuellen Unternehmens durchgeführt, ergänzt durch Literaturanalyse zur Einordnung der Data-Mining-Verfahren nach dem KDD-Prozessmodell von Fayyad.
Was wird im Hauptteil behandelt?
Der Hauptteil umfasst theoretische Grundlagen, eine detaillierte Einführung in das Tool Skyon, die Beschreibung der Aufgabenstellung am Beispiel "VMall" sowie eine systematische Gegenüberstellung der erzielten Segmentierungsergebnisse.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen zählen Data Mining, OLAP, Wissensgewinnung, Kundensegmentierung, neuronale Netze, Kohonen SOM, KDD-Prozess und Business Intelligence.
Wie unterscheiden sich die Anforderungen an den Anwender bei OLAP und Data Mining laut der Arbeit?
OLAP setzt detaillierte Kenntnisse über den Aufbau des Data Warehouse und die Struktur der Daten voraus, während bei Data Mining die explorative Suche nach Mustern im Vordergrund steht, was geringere Vorkenntnisse erfordert, aber inhaltliche Interpretationsfähigkeit bedingt.
Welche Rolle spielt das "Multi SOM Training" bei der Segmentierung mit Skyon?
Es ermöglicht die selbständige Ermittlung der optimalen Netzgröße basierend auf benutzerdefinierten Parametern (partition limit und min net size), um eine homogene Gruppierung der Kundendaten zu erzielen.
- Citar trabajo
- Torsten Hildebrandt (Autor), 2002, OLAP vs. Data Mining - experimentelle Untersuchung auf der Basis eines Ausschnittes von MicroStrategy´s VMall für die Wissensgewinnung mit Skyon, Múnich, GRIN Verlag, https://www.grin.com/document/5220