Inhaltsverzeichnis II
Inhaltsverzeichnis
Abbildungsverzeichnis IV
Abk ürzungsverzeichnis. V
1 Einleitung 1
2 Rahmen und Umfeld des Data Minings im Marketing. 4
2.1 Die Datenbasis. 4
2.1.1 Daten - Information - Wissen. 4
2.1.2 Mögliche Datenquellen 5
2.1.3 Data Warehouse und Data Mart 6
2.2 Die Analyse 8
2.2.1 Online Analytical Processing (OLAP) 8
2.2.2 Data Mining. 9
2.2.3 Der Data Mining Prozess oder Knowledge Discovery in Databases (KDD) 11
3 Data Mining im Marketing entlang des Kundenlebenszyklus 13
3.1 Mit Data Mining verbundene Marketingkonzepte 13
3.2 Systematik der Einsatzmöglichkeiten. 15
3.3 Kundenakquisition. 17
3.3.1 Segmentierung potenzieller Kunden 17
3.3.2 Bearbeitung der ausgewählten Segmente 20
3.4 Kundenaktivierung 25
3.4.1 Datensammlung zur Optimierung vorheriger und künftiger Analysen. 25
3.4.2 Risikoerkennung und -beurteilung 26
3.5 Kundenbeziehungsmanagement 27
3.5.1 Selektion profitabler Beziehungen - Kundenbewertung 27
Inhaltsverzeichnis III
3.5.2 Entwicklung der Beziehungen - Steigerung des Kundenwerts. 29
3.5.3 Pflege der Beziehungen - Kundenbindung und Abwanderungsverhinderung.33
3.6 Bewertung der Einsatzmöglichkeiten. 35
4 Neuere Entwicklungen und Potenziale für Data Mining im Marketing 37
4.1 Externe Einflussfaktoren 37
4.1.1 Technologie 37
4.1.2 Gesellschaft und Recht 38
4.2 Anwendungsgebiete 41
4.2.1 Web Mining im Marketing 41
4.2.2 Text Mining im Marketing 46
4.3 Perspektiven im Data Mining Prozess. 51
4.3.1 Datenerhebung und -speicherung 51
4.3.2 Datenverarbeitung und -analyse 55
4.3.3 Informationsdarstellung, -interpretation und -nutzung. 57
5 Fazit 60
Literaturverzeichnis VI
Anhang XIV
Abbildungsverzeichnis
Abbildungsverzeichnis
Abb. 1 - Begriffshierarchie Zeichen/Daten/Information/Wissen.
Abb. 2 - Architektur eines Data Warehouses.
Abb. 3 - Dreidimensionaler OLAP-Würfel
Abb. 4 - Überblick über den Prozess der Knowledge Discovery in Databases (KDD)
Abb. 5 - Komponenten einer CR-MLösung
Abb. 6 - Der Kundenlebenszyklus
Abb. 7a - Beispielhafte Netzwerkarchitektur eines KNN.
Abb. 7b - Modell eines Neurons
Abb. 8 - Beispielhafter Entscheidungsbaum.
Abb 9 - Visualisierung von Assoziationsregeln
1 Einleitung 1
1 Einleitung
Generell kann beobachtet werden, dass die Menge verfügbarer Informationen in den letzten Jahren stark zugenommen hat und diese Entwicklung sich auch in baldiger Zukunft nicht abschwächen wird. Eine Studie der University of Berkeley kommt zu dem Ergebnis, dass im Jahr 2002 fünf Exabyte 1 neuer Informationen produziert und gespeichert wurden. Das entspricht bei Zugrundelegung der Weltbevölkerung fast 800 Megabyte pro Person. 2 Im Jahr 1999 waren es nur 250 Megabyte pro Erdbewohner, was einem Wachstum von über 300% in drei Jahren entspricht. 3 Das anhaltende exponentielle Wachstum des weltumspannenden unternehmensexternen Wissensspeichers Internet unterstreicht diese Ergebnisse. 4
Auch im Marketingbereich werden Unternehmen mit diesem Phänomen der „Datenflut“ konfrontiert. Dabei können zwei Einflussbereiche identifiziert werden. Einerseits ermöglicht der technische Fortschritt die Generierung und Speicherung von Daten in noch nie dagewesenem Umfang durch billigere Speichermedien, bessere Speichertechnologien und leistungsfähigere Datenbankverwaltungssysteme. 5 Andererseits führen organisationale Ursachen zu immer größeren Datenbeständen. Hier zeigen sich die Auswirkungen einer zunehmenden Automatisierung. So speichern Anwendungssysteme zur Unterstützung und Steuerung operativer Prozesse wachsende Mengen an Daten aufgrund einer Asymmetrie zwischen Datengewinnung und Datenvernichtung (vertikales Wachstum). Außerdem wird aufgrund zunehmender Umweltkomplexität die Erfassung einer größeren Anzahl von Fakten erforderlich (horizontales Wachstum). 6
Die bereitstehende Masse von Daten führt jedoch nicht unbedingt zu einer besseren Infor-mationsversorgung im Marketing. Es kann im Gegenteil sogar festgestellt werden, dass das Auffinden der gewünschten Information, die sinnvolle Verdichtung von Daten und generell eine Verwendung zu Zwecken der Entscheidungsunterstützung zu einem immer größeren Problem wird.
1 Das sind über fünf Millionen Terabyte bzw. über fünf Milliarden Gigabyte oder ungefähr die Menge an Speicherplatz, die 9,5 Billiarden digitalisierte Bücher belegen würden.
2 Vgl. Lyman und Varian (2003).
3 Vgl. Lyman und Varian (2000).
4 Vgl. Anlage 1.
5 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996a), S. 1f.
6 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 38.
1 Einleitung 2
Andererseits kann aber auch die wachsende Datenmenge als Chance begriffen werden, wenn es gelingt, das in den Daten liegende Wissen aufzuspüren und nutzbar zu machen. Traditionelle Methoden der Datenanalyse wie Berichte oder ad-hoc Abfragen können die wachsenden Datenbestände jedoch kaum noch bewältigen. Einfache statistische Auswertungen bringen geringen Mehrwert. Deshalb wurde die Notwendigkeit erkannt, neue Methoden und Techniken zu entwickeln und einzusetzen, um dieses Problem zu lösen.
Gerade im Marketing wird das Problem durch eine steigende Angewiesenheit auf entscheidungsunterstützende Informationen verschlimmert. Grund dafür ist vor allem der Wechsel vom transaktionsbezogenen Massenmarketing hin zu einem individuellen Beziehungsmarketing aufgrund einer sich verschärfenden Wettbewerbssituation. Durch eine zunehmende Angleichung konkurrierender Unternehmen wird eine Differenzierung über Qualität, Preis oder Zeit schwieriger. Deshalb wird versucht, sich mit Hilfe individualisierter Kundenbeziehungen und Produkte einem individualisierten Marketing zu nähern. Konkret kann dies beispielsweise mit persönlichen Anschreiben oder kundenspezifischen Cross-Selling Angeboten realisiert werden. Um jedoch die Individualisierung adäquat durchführen zu können, ist das Marketing auf relevantes Wissen über den Kunden angewiesen. Der Ressource Information kommt somit entscheidende Bedeutung zu. 7
Spezielle Data Mining 8 Methoden können nun aus bereitstehenden Daten derartig relevante Informationen generieren. Mit Hilfe von Data Mining ist es möglich, automatisch oder semiautomatisch Muster in großen Datenmengen zu erkennen und damit Hypothesen zu generieren. 9 Besonders im Marketing lassen sich diese Methoden auf vielfältige Art nutzbringend einsetzen. So können beispielsweise im Handel die Warenkörbe der Kunden analysiert werden. Aus den Ergebnissen sind konkrete Maßnahmen ableitbar, die helfen können, Kundenzufriedenheit und Umsatz zu steigern. Auch Prognosen können durch den Einsatz von Data Mining erstellt werden. Dadurch können zum Beispiel abwanderungsgefährdete Kunden identifiziert und mit entsprechenden Maßnahmen weiterhin an das Unternehmen gebunden werden. Diese beispielhaft herausgegriffenen Einsatzmöglichkeiten sollen nur die große Anwendungsvielfalt von Data Mining illustrieren.
7 Vgl. Hippner und Wilde (2001a), S. 973ff.
8 Vgl. Abschnitt 2.2.2 dieser Arbeit für eine Definition.
9 Ebenda.
1 Einleitung 3
Ziel dieser Arbeit ist es nun, mögliche Anwendungsbereiche des Data Minings im Marketing systematisch aufzuzeigen und darauf aufbauend Entwicklungspotenziale darzustellen. Dazu wird zunächst in Kapitel 2 dieser Arbeit der Rahmen des Data Mining im Marketing abgesteckt. Neben der Klärung wichtiger Begrifflichkeiten und einer Darstellung der Grundlagen der Bereitstellung von Daten wird dabei auch auf den allgemeinen Analyseprozess von Marketingdaten mit Hilfe von Data Mining eingegangen.
In Kapitel 3 werden dann konkrete Einsatzmöglichkeiten von Data Mining im Marketing erläutert. Das Vorgehen lehnt sich in diesem Teil der Arbeit an die verschiedenen Phasen des Kundenlebenszyklus an. Ausgehend von Nichtkunden wird aufgezeigt, welche Rolle Data Mining bei der Gewinnung von Interessenten, deren Überführung zu Neukunden und deren Weiterentwicklung zu Bestandskunden spielen kann. So wird es möglich, Aspekte des Data Minings und des Marketings integriert zu betrachten. Dabei wird knapp die Funktionsweise der wichtigsten Data Mining Methoden erklärt und deren typische Anwendungen veranschaulicht. Ziel ist nicht eine detaillierte statistisch-mathematische Beschreibung der Methoden. Vielmehr soll ein grundlegender Überblick gegeben werden, der es ermöglicht, den Einsatz im Marketing nachzuvollziehen. Ebenso können auch aufgegriffene Marketingaspekte nicht in ihrer vollen Breite dargestellt werden. Anschließend findet eine Bewertung der Einsatzmöglichkeiten statt.
Darauf aufbauend wird in Kapitel 4 der Fokus auf Entwicklungsmöglichkeiten von Data Mining im Marketing gelegt. Zunächst werden technologische, gesellschaftliche und rechtliche Faktoren identifiziert, die extern auf das Data Mining im Marketing einwirken. Im Anschluss werden die Folgen insbesondere technologischer Entwicklungen für das Data Mining aufgezeigt. Dabei steht im Rahmen des Marketings die Ausweitung von Data Mining auf das Internet (Web Mining) und auf unstrukturierte Daten, insbesondere Texte (Text Mining) im Vordergrund. Zum Abschluss des Kapitels rückt dann ein auf die drei Phasen Datenerhebung, Datenanalyse und Informationsnutzung vereinfachter Data Mining Prozess in den Mittelpunkt. Entlang dieses Prozesses erfolgt dabei die Darstellung weiterer Potenziale, wobei die Möglichkeiten neuer Technologien und Anwendungsgebiete einfließen.
Abschließend wird in Kapitel 5 ein Fazit gezogen, in das die gewonnenen Erkenntnisse eingearbeitet werden. Neben einer wertenden Betrachtung stehen hier auch weitere Her- ausforderungen an das Data Mining im Marketing im Vordergrund.
2 Rahmen und Umfeld des Data Minings im Marketing 4
2 Rahmen und Umfeld des Data Minings im Marketing
2.1 Die Datenbasis
2.1.1 Daten - Information - Wissen
„We live in an expanding universe of data in which there is too much data and too little information.” 10 Dieses Zitat fasst die anfangs beschriebene Problematik zusammen und macht deutlich, dass ein Unterschied zwischen Daten und Informationen besteht.
In der Literatur finden sich viele Definitionen und Abgrenzungen der Begriffe „Daten“ und „Information“. Heinrich beschränkt Informationen eng auf den Zweck der Entscheidungs-vorbereitung. 11 Hierbei kann die Subjektivität bei der Beurteilung, was einen Zweck hat und was nicht, kritisiert werden. Ferstl und Sinz dagegen definieren Information sehr weit als den „Sinngehalt“ von Daten. 12 Diese Abgrenzung lässt einen großen Interpretationsfreiraum.
Deshalb wird in dieser Arbeit eine
klar abgegrenzte, hierarchisch aufgebaute Definition auf Grundlage der Semiotik verwendet (vgl. Abb. 1). Zeichen sind demnach die Grundelemente zur Darstellung von Daten und Informationen. Sie stammen aus einem Zeichenvorrat, der Alphabet genannt wird, wenn er linear geordnet ist. Werden Zeichen mit einer Syntax
versehen, d.h. sind sie nach vorgegebenen Regeln strukturiert, so spricht
man von Daten. Daten in einem Sinn gebenden Kontext, der Semantik, sind Informationen. 13 Wissen entsteht durch die Vernetzung von verschiedenen Informationen. Je weiter oben man sich auf der dargestellten Pyramide befindet (vgl. Abb. 1), desto mehr nimmt die
10 Adriaans und Zantinge (1996), S. 2.
11 Vgl. Heinrich (1993), S. 104.
12 Vgl. Ferstl und Sinz (1998), S. 126.
2 Rahmen und Umfeld des Data Minings im Marketing 5
Qualität und damit der Wert der jeweiligen Ressource zu. Wissen stellt dann die Grundlage für Entscheidungen dar.
2.1.2 Mögliche Datenquellen
Für die Daten, die die Grundlage für erfolgreiches Data Mining im Marketing darstellen, sind die verschiedensten Quellen denkbar. Dabei handelt es sich in der Regel um Kundendaten. Diese lassen sich in Grund-, Potenzial-, Aktions- und Reaktionsdaten einteilen. 14 Grunddaten sind längerfristig gleich bleibende und produktunabhängige Daten wie beispielsweise Name und Adresse. Potenzialdaten liefern produktgruppen- und zeitpunktbezogene Hinweise auf das kundenindividuelle Nachfragevolumen (zum Beispiel Leasinglaufzeiten oder anstehende Wartungstermine). Aktionsdaten beziehen sich auf kundenbezogene Maßnahmen wie Werbebriefe oder Kundenbesuche. Reaktionsdaten spiegeln die Verhaltensweisen der Kunden wieder (zum Beispiel Anfragen, Bestellungen, Reklamationen). 15
Diese Daten fallen im unternehmensinternen Bereich im Umfeld von Marketing und Vertrieb an, aber auch in anderen Bereichen wie dem Rechnungswesen werden für das Data Mining im Marketing relevante Daten gesammelt. So bergen beispielsweise die von Telekommunikationsanbietern zu Abrechnungszwecken erhobenen Gesprächsdaten ein erhebliches Wissenspotenzial, das mit Hilfe von Data Mining erschlossen werden kann. Auch im Bereich der Logistik erhobene Daten, zum Beispiel über das Retourenverhalten von Kunden, können hilfreich sein. 16
Daneben stehen aber auch unternehmensexterne Daten zur Verfügung. Diese Daten können von darauf spezialisierten Dienstleistungsunternehmen, kooperierenden Unternehmen, die Kundendaten austauschen, oder auch dem Staat, zum Beispiel in Form von Daten des Kraftfahrtbundesamtes oder des Statistischen Bundesamtes stammen. Generell kann bei externen Daten zwischen Individual- und Aggregatdaten unterschieden werden. Individualdaten können über Name und Adresse eindeutig einem intern vorhandenen Kundendatensatz zugeordnet werden. Aggregatdaten dagegen beziehen sich auf Kundenaggregate wie beispielsweise Marktsegmente, Kundengruppen oder Regionen und können nur mittel-
13 Vgl.Krcmar (2000), S. 11.
14 Für andere Kategorien vgl. zum Beispiel Kotler und Bliemel (1999), S. 436f.
15 Vgl. Link und Hildebrand (1994), S. 5ff.
16 Vgl. dazu auch Abschnitt 3.5.2 dieser Arbeit.
2 Rahmen und Umfeld des Data Minings im Marketing 6
bar den vorhandenen Kundendaten zugeordnet werden. Auf Datensammlung undaufbereitung spezialisierte Unternehmen bieten beispielsweise Individualdaten in Form von elektronischen Telefon- und Adressenverzeichnissen, Firmendatenbanken im Bereich des B2B-Marketing, Lifestyledaten (detaillierte Konsumprofile und -interessen) oder Wohngebäudedatenbanken (individuelle Wohnverhältnisse) an. Im Bereich der Aggregatdaten offerieren sie mikrogeografische Segmentierungen (Wohngebietstypologien) oder Marktforschungsdaten. 17
Für erfolgreiches Data Mining ist am besten eine umfassende, integrierte und bereinigte Datenbasis geeignet, die Daten verschiedener individueller Datenbanken integriert und auch historische Daten vorhält, um Trends und Entwicklungen erkennen und berücksichtigen zu können. 18 Allerdings sammeln Unternehmen anfallende Daten häufig nur aus operativen Gründen wie beispielsweise zur Lagerbestandskontrolle oder zu Abrechnungszwecken. Haben die Daten ihren originären Zweck erfüllt, werden sie gelöscht oder liegen ungenutzt brach, da sich die Unternehmen des in ihnen liegenden Potenzials für das Marketing nicht bewusst sind. Teilweise finden sich jedoch auch historisch gewachsene bereichsspezifische Insellösungen, die eine eingeschränkte Analyse und Wissensgewinnung ermöglichen, dennoch aber nur einen beschränkten Einblick in das Kundenverhalten geben können. Verstärkt wird dieses Problem durch eine fehlende Standardisierung bei der Datenspeicherung. So werden etwa Datenfelder gleichen Inhalts in verschiedenen Unternehmensbereichen anders benannt oder Daten redundant, d.h. mehrfach gespeichert. Zur Lösung dieses Problems der verteilten Speicherung und inkonsistenten Organisation der Daten wurde das Konzept des Data Warehouses entwickelt. 19
2.1.3 Data Warehouse und Data Mart
Das Konzept des Data Warehouses (DWH) wurde von Inmon (1992) eingeführt. Er definierte es wie folgt: „A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management’s decisions.“ 20
Ein Data Warehouse kann analog zu einem zentralen Warenlager als ein zentraler Speiche-rort für Daten betrachtet werden. Einen Überblick über die typische Architektur eines Data
17 Vgl. Hippner und Wilde (2001b), S. 30ff.
18 Vgl. dazu auch Abschnitt 2.2.3 dieser Arbeit.
19 Vgl. Lusti (2002), S. 130ff.
20 Vgl. Inmon (1992), S. 25.
2 Rahmen und Umfeld des Data Minings im Marketing 7
Warehouse gibt Abbildung 2. Die Informationseinheiten im Data Warehouse sind auf die
inhaltlichen Kernbereiche einer Organisation („subject oriented“) fokussiert. Die Daten in
einem Data Warehouse werden zu einem einheitlichen und konsistenten („integrated“)
Datenbestand zusammengefasst. Der Import aktueller Daten wird durch ETL-
Komponenten gewährleistet, wobei ETL für Extraktion, Transformation und Laden steht.
Monitoring -Komponenten überwachen zu berücksichtigende externe und interne Daten-
quellen auf Änderungen. Aktualisierte oder neue Daten werden dann extrahiert und trans-
formiert. Bei der Transformation wird unter Berücksichtigung von Metadaten, die die
Beziehungen , Strukturen und Zusammenhänge der zu transformierenden Daten beschrei-
ben , eine Bereinigung und Integration der Daten vorgenommen. Danach werden sie in das
Data Warehouse geladen. Nach einer fehlerfreien Übernahme werden die Daten nicht mehr
verändert, sie sind dann dauerhaft („nonvolatile“) im Data Warehouse vorhanden. Die
Speicherung der Daten erfolgt in den operativen Systemen zeitpunktbezogen, im Data
Warehouse dagegen zeitraumbezogen („time variant“) Die auf diese Weise über einen
l ängeren Zeitraum gesammelten Daten („collection of data“) können dann zur Entschei-
dungsunterst ützung herangezogen werden („support of management’s decisions“) und
bilden die Grundlage für weitere Analysen mit Hilfe von aufgesetzten Werkzeugen, insbe-
sondere auch mit Hilfe von Data Mining Tools. 21
Festzuhalten ist jedoch, dass für die Anwendung
Analysewerkzeuge
von Data Mining Methoden ein Data Warehouse
DWH -
nicht zwingend erforderlich ist, es jedoch den Data DWH
System
Meta -
daten
Mining Prozess wesentlich effizienter gestalten
Laden
kann. 22 Das Data Warehouse liefert eine für die
Transformation
Datenanalyse im Marketing geeignete Aufbereitung
Extraktion Monitoring
der relevanten Daten.
Datenquellen
(intern und extern)
Eine Variante innerhalb des Data Warehouse
Konzepts stellen Data Marts dar, die als eine kleine-
Abb. 2 - Architektur eines Data Warehouses
(Quelle: in Anlehnung an Muksch und Behme
re Version eines Warehouses gelten. Data Marts
(2000), S. 14 und Schinzer, Bange und
Mertens (1999), S. 30.)
stellen lediglich eine inhaltlich beschränkte Sicht
21 Vgl. Schinzer, Bange und Mertens (1999), S. 14ff.
22 Vgl Berry und Linoff (2004), S 508ff
2 Rahmen und Umfeld des Data Minings im Marketing 8
auf das Data Warehouse bereit, häufig nur einen abteilungsspezifisch zugeschnittenen Teilausschnitt. 23
2.2 Die Analyse
2.2.1 Online Analytical Processing (OLAP)
Online Analytical Processing (OLAP) bezeichnet einen Ansatz zur multidimensionalen Analyse von Daten in einem Data Warehouse. Dieses Konzept wurde von E.F. Codd anhand von 12 Regeln eingeführt. 24 OLAP zielt darauf ab, die in Interaktion mit einem Nutzer durchgeführte Datenanalyse zu vereinfachen und die Datenbestände auf vielfältige Art und Weise und aus verschiedenen Blickwinkeln zu betrachten. Ein wesentlicher Vorteil von OLAP ist, dass aufgrund der intuitiven Benutzeroberfläche für die Nutzung von OLAP keine Spezialisten erforderlich sind, so dass auch ein Fachbereichsmitarbeiter ohne tief greifende Statistikkenntnisse erfolgreiche Analysen durchführen kann. Die übersichtliche Visualisierung der Ergebnisse in Form von Graphiken und Tabellen ermöglicht einen schnellen Überblick über die Resultate und erleichtert den Umgang mit den umfangreichen Datenbeständen. 25
Zur Veranschaulichung der mehrdimensionalen Datenbasis wird aus Darstellungsgründen häufig eine dreidimensionale Darstellung gewählt (vgl. auch Abb. 3). OLAP ist jedoch nicht auf drei Dimensionen beschränkt. 26
Auf dem Datenwürfel können verschiedene
Operationen durchgeführt werden. „Roll up“ führt eine Aggregation durch, zum Beispiel von der regionalen Betrachtung hin zur Betrachtung auf Länderebene. Die Dimensionen bleiben dabei erhalten. „Drill down“ verhält sich komplementär zu „Roll up“, dabei wird von verdichteten zu detaillierten Daten navigiert, beispielsweise von
Quartalsebene zu Monatsebene. Beim „Drill
23 Vgl. Samli, Pohlen und Bozovic (2002), S. 217f.
24 Vgl. Codd, Codd und Salley (1993), S. 12ff.
25 Vgl. Schinzer, Bange und Mertens (1999), S. 39.
26 Ebenda, S. 40f.
2 Rahmen und Umfeld des Data Minings im Marketing 9
across“ wird die angezeigte Kennzahl gewechselt, zum Beispiel verkaufte Stückzahl statt Umsatz. „Slice“ und „Dice“ unterstützen den Nutzer bei der Beantwortung typischer Geschäftsfragen. Beim „Slicing“ wird ein bestimmter Bereich aus dem Würfel herausgeschnitten, während beim „Dicing“ der Würfel gedreht oder gekippt wird. So lässt sich beispielsweise die Frage „Wie hat sich der Umsatz von Produkt A in der Region III in den letzten 2 Jahren entwickelt?“ beantworten. 27
Während OLAP für einfachere Analysen gut geeignet ist, stößt es bei komplexen oder mit Prognosen behafteten Fragestellungen auch aufgrund eines beschränkten Methodenarsenals und der rein deskriptiven Darstellung der Daten schnell an seine Grenzen. 28 An dieser Stelle setzt Data Mining an. Deshalb sind OLAP und Data Mining auch keine konkurrierenden Ansätze, sondern sie ergänzen sich. So können die Ergebnisse einer OLAP-Analyse Fragestellungen aufwerfen, die durch eine Data Mining Analyse beantwortet werden können. Andererseits können mit Hilfe von Data Mining entdeckte Muster die Basis für OLAP bilden. 29 Dennoch werden mit OLAP überwiegend hypothesengetriebene Untersuchungen durchgeführt.
2.2.2 Data Mining
Data Mining kann als die Anwendung spezifischer Algorithmen verstanden werden, die eingesetzt werden, um Muster aus Daten zu extrahieren. 30 Dabei handelt es sich um die nicht-triviale Entdeckung gültiger, neuer, potenziell nützlicher und verständlicher Muster. 31
Teilweise wird Data Mining auch auf die automatische Analyse begrenzt. 32 Dies stellt jedoch eine zu starke Einschränkung dar, da einige Methoden semiautomatisch, d.h. beispielsweise im Dialog mit dem Nutzer eine Analyse durchführen. Berry und Linoff sehen den Anwendungsbereich von Data Mining nur in Bezug auf große Datenmengen. 33 Dies mag in der Praxis häufig der Fall sein, dennoch können entsprechende Methoden auch
27 Vgl. Chamoni (2001), S. 553f.
28 Vgl. Wilde (2001), S. 12f.
29 Vgl. Zipser (2000), S. 193ff.
30 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 39.
31 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996a), S. 6ff.
32 Vgl. Samli, Pohlen und Bozovic (2002), S. 219.
33 Vgl. Berry und Linoff (2004), S. 7.
2 Rahmen und Umfeld des Data Minings im Marketing 10
auf kleinere Datenmengen angewendet werden und darin enthaltene interessante Muster aufdecken. 34
Es muss auch festgehalten werden, dass das Ziel von Data Mining in der Regel die Generierung neuer Hypothesen aus einem Datenbestand ist, eine so genannte hypothesenfreie Bottom-Up Vorgehensweise. Im Rahmen einer derartigen datengetriebenen Analyse im Marketing kann zum Beispiel der Frage: „Welche Artikel werden häufig gemeinsam gekauft?“ nachgegangen werden. 35 Anhand des genannten Beispiels wird deutlich, dass eine völlig hypothesenfreie Vorgehensweise kaum möglich ist, da immer gewisse Vermutungen eine Rolle spielen und eine Suche nach irgendwelchen Auffälligkeiten in den seltensten Fällen brauchbare Ergebnisse liefern wird. 36 Generell kann Data Mining einen hohen Erfolgsbeitrag leisten, da die Aufdeckung völlig unbekannter und nicht vermuteter Muster und Zusammenhänge große Potenziale birgt.
Data Mining kann weiter in Verfahren des überwachten Lernens (Lernen aus vorgegebenen Beispielen) und Verfahren des unüberwachten Lernens (Lernen aus Beobachtungen) unterteilt werden. 37 Daneben kann anhand verwendeter Methoden auch Data Mining zu deskriptiven bzw. prädiktiven Zwecken unterschieden werden. 38
Data Mining hat sich als eigenständige Forschungsrichtung durch eine Synthese bestehender Wissenschaftsdisziplinen entwickelt. Einen Einfluss hatten dabei insbesondere die Statistik, die Datenbankforschung, die grafische Datenverarbeitung und die Künstliche Intelligenz. 39 Deshalb finden sich auch viele weitere Begriffe, die den Prozess der Erkennung von Mustern in Daten beschreiben. Hier sind beispielsweise „knowledge extraction“, „information discovery“, „information harvesting“, „data archaeology“ oder „data pattern processing“ zu nennen. 40
Aufgrund der generellen Nützlichkeit des Data Mining wird es nicht nur im Marketing, sondern im betriebswirtschaftlichen Bereich beispielsweise auch im Controlling oder in der
34 Vgl. Bensberg (2001), S. 63f.
35 Vgl. Knobloch und Weidner (2000), S. 351ff.
36 Vgl. Küppers (1999), S. 82.
37 Vgl. Knobloch und Weidner (2000), S. 352.
38 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 44.
39 Vgl. Hagedorn, Bissantz und Mertens (1997), S. 601.
40 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 39.
2 Rahmen und Umfeld des Data Minings im Marketing 11
Produktion eingesetzt. Auch in anderen Gebieten, wie beispielsweise der Astronomie 41 , der Biologie 42 oder der Chemie 43 finden die Methoden des Data Mining Anwendung.
2.2.3 Der Data Mining Prozess oder Knowledge Discovery in Databases (KDD) Data Mining wird häufig in den Prozess der Knowledge Discovery in Databases (KDD)
eingeordnet. Nach der ursprünglichen Definition von Fayyad et al. 44 stellt Data Mining ein Schritt innerhalb dieses Prozesses dar. In diesem Fall wird Data Mining auf die konkrete Durchführung von Analysen mit Hilfe von Data Mining Algorithmen begrenzt. 45 Diese Betrachtungsweise kann auch als Data Mining im engeren Sinne verstanden werden.
Teilweise werden die Begriffe Data Mining und KDD jedoch auch synonym verwendet. 46 Dann kann aber in der Regel auch davon ausgegangen, dass dem Prozess des Data Mining neben der eigentlichen Analyse auch vor- und nachbereitende Schritte zugeschrieben werden 47 , so dass hier von Data Mining im weiten Sinne gesprochen werden kann. Data Mining im weiten Sinne entspricht dann dem KDD-Prozess und wird auch als Data Mining Prozess bezeichnet.
Da auch für Data Mining im engeren Sinne vorbereitende Maßnahmen erforderlich sind, wird nun kurz der KDD-Prozess bzw. Data Mining im weiten Sinne dargestellt (vgl. Abb. 4).
Der Prozessablauf ist iterativ und interaktiv 48 , d.h. der Anwender bestimmt auf der Grundlage des Ergebnisses einzelner Phasen oder des gesamten Prozesses den weiteren Prozessablauf. Dabei können einzelne Phasen oder der gesamte Prozess erneut durchlaufen werden.
41 Vgl. Fayyad, Djorgovski und Weir (1996), S. 471ff.
42 Vgl. Fayyad, Haussler, und Stolorz (1996), S. 53f.
43 Vgl. Hemmer und Gasteiger (2000), S. 1ff.
44 Vgl. Fayyad, Piatetsky-Shapiro und Smyth (1996b), S. 41.
45 Ebenda, S. 42.
46 Vgl. Adriaans und Zantinge (1996), S. 5.
47 Vgl. zum Beispiel den Cross Industry Standard Process for Data Mining (CRISP-DM) bei Chapman et al. (2000), S. 13ff. oder den SEMMA Prozess (Sample, Explore, Modify, Model, Assess) des SAS Institute (http://www.sas.com/technologies/analytics/datamining/miner/semma.html, zugegriffen am 06.02.2005).
48 Vgl. Wrobel (1998), S. 5.
Arbeit zitieren:
Bastian Schoenrade, 2005, Einsatzmöglichkeiten von Data Mining im Marketing: Status Quo und Entwicklungspotenzial, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Geschäftsprozesse im Unternehmen - Teil 3 - Gestalten von Prozessen
Skript, 15 Seiten
Konzept zur Veränderung von Software-Entwicklung und Vertrieb bei IT-U...
Informatik - Wirtschaftsinformatik
Diplomarbeit, 149 Seiten
Konzept für den modularen Aufbau eines Warenwirtschaftssystems für ein...
Informatik - Angewandte Informatik
Diplomarbeit, 149 Seiten
Vertriebscontrolling: Ziele, Aufgaben und Instrumente
Hausarbeit, 25 Seiten
Vertriebsorientierte Kommunikation mit besonderem Blick auf die sprach...
Kommunikationstechiken im Vert...
Ingenieurwissenschaften - Wirtschaftsingenieurwesen
Seminararbeit, 12 Seiten
Bastian Schoenrade hat den Text Einsatzmöglichkeiten von Data Mining im Marketing: Status Quo und Entwicklungspotenzial veröffentlicht
Bastian Schoenrade hat einen neuen Text hochgeladen
Data Mining and Market Intelligence for Optimal Marketing Returns
Susan Chiu, Domingo Tavella
Data Mining Cookbook: Modeling Data for Marketing, Risk, and Customer ...
Olivia C. Rud, O. C. Rud, Olivia Parr Rud
0 Kommentare