Die Informationsmenge wächst rasant in der heutigen kundenorientierten Wirtschaft. Die Daten sind Rohstoff fürs Unternehmenswachstum. Die Ergebnisse der Analyse von Daten mit Hilfe von Data Mining Methoden stellen für die Unternehmen, die sie nutzen, ein großes Informationspotenzial dar.

Mitte der 90-er Jahre beschäftigten sich immer mehr Unternehmen mit den Werkzeugen des Data Mining. Anfang 90-er Jahre wurden die ersten Prototypen vorgestellt. Sie waren in der Betriebswirtschaftslehre vor allem im Bereich Marketing interessant. „Data Mining hat das Ziel, Wissen aus Daten zu extrahieren“. Die Methode, die selbständig Wissen in großen Datenbeständen entdeckt³. Ende der 80-er Jahre entwickelte sich Knowledge Discovery in Databases KDD, die interdisziplinäre Forschungsrichtung, die mittlerweile überwiegend als Data Mining bezeichnet wird. Im betriebswirtschaftlichen Bereich sind sie Synonyme. Die erste Begriffsverwendung wurde schon in den 60-er Jahren in der Statistik für das Suchen nach Datenmustern entstanden.

Im Rahmen dieser Arbeit soll der Begriff von Data Mining definiert werden, seine Entstehung, Entwicklung beschrieben werden. Seine Methoden, Aufgaben sollen geklärt werden und sein typischer Prozess soll beschrieben werden.

Excerpt

Inhaltsverzeichnis

1. Einleitung

1.1 Problemstellung

1.2 Ziel der Arbeit

2. Methoden und Aufgaben

2.1 Clustering

2.2 Assoziierung

2.3 Entscheidungsbäume

3. Data Mining Prozess

4. Fazit

Zielsetzung und Themen der Arbeit

Die vorliegende Arbeit befasst sich mit der Definition, Entstehung und Entwicklung des Data Mining sowie der Klärung zentraler Methoden und Prozesse zur Gewinnung von Wissen aus großen Datenmengen in der modernen Wirtschaft.

Grundlagen und Definition von Data Mining
Methoden der Kundensegmentierung (Clustering)
Analyse von Kundenverhalten durch Assoziationsregeln
Einsatz von Entscheidungsbäumen zur Verhaltensvorhersage
Herausforderungen und Probleme im Data Mining Prozess

Auszug aus dem Buch

2.2 Assoziierung

Die 2. Methode ist Assoziierung, mit Hilfe von Assoziationsregel kann man unbekannte Abhängigkeiten beim Kundenverhalten entdecken. Es geht eine klassische Frage: Welche Kunden, die Produkt A gekauft haben, kommen auch für den Kauf von Produkt B in Frage. Die Zusammenhänge erkläre ich am Beispiel aus dem Obst und Gemüseverkauf.

Wir haben 6 Transaktionen.

Tabelle 1 zeigt uns, was in allen 6 Transaktionen gekauft wurde. Wir wollen nun eine Regel formulieren, die besagt: wenn Äpfel gekauft werden, werden auch Birnen gekauft. Die Qualität einer Regel wird durch ihren Grad an Unsicherheit bestimmt. Die Unsicherheitsgrad wird durch 2 Zahlen gekennzeichnet, die als Support und Confidence bezeichnet werden.

Der Support ist die Anzahl der Transaktionen, die alle Produkte sowohl der Bedingung wenn und des dann Teils einschließen. Er wird als prozentualer Anteil an den gesamten Transaktionen ausgedrückt. Für unser Beispiel ist der Support gleich 4/6 oder 2/3, d.h. 66%. In 2/3 Transaktionen werden Äpfel und Birnen gemeinsam gekauft.

Der 2. Wert ist als Confidence der Regel bezeichnet. Er ist der Quotient aus der Anzahl der Transaktionen, die im Wenn und Dann- Teil enthalten sind und der Anzahl der Transaktionen aus dem Wenn-Teil. Er drückt die Abhängigkeit aus, die liegt zwischen 0 und 1. Der Wert 1 druckt eine zwingende Abhängigkeit aus; Äpfel und Birnen werden immer gemeinsam gekauft.

Zusammenfassung der Kapitel

1. Einleitung: Beschreibt die steigende Bedeutung von Data Mining in der heutigen informationsorientierten Wirtschaft und definiert das Ziel der Arbeit.

2. Methoden und Aufgaben: Erläutert zentrale Techniken wie Clustering, Assoziierungsregeln und Entscheidungsbäume anhand praktischer Beispiele.

3. Data Mining Prozess: Beschreibt den Prozess der Mustererkennung aus Daten und thematisiert kritische Erfolgsfaktoren sowie mögliche Datenproblematiken.

4. Fazit: Fasst den Nutzen von explorativer Statistik und Data Mining Methoden für Unternehmen zusammen.

Schlüsselwörter

Data Mining, Knowledge Discovery, explorative Statistik, Clustering, Assoziierungsregeln, Entscheidungsbäume, Kundensegmentierung, Support, Confidence, Datenanalyse, Mustererkennung, Unternehmenswachstum, Datensicherheit

Häufig gestellte Fragen

Worum geht es in der Arbeit grundsätzlich?

Die Arbeit behandelt die explorative Statistik und Data Mining als Instrumente, um aus großen, in Unternehmen anfallenden Datenmengen wertvolle Informationen für das Unternehmenswachstum zu gewinnen.

Was sind die zentralen Themenfelder?

Zentrale Themen sind die theoretischen Grundlagen des Data Mining sowie spezifische Methoden wie Clustering, Assoziationsregeln und Entscheidungsbäume.

Was ist das primäre Ziel der Arbeit?

Das Ziel ist die Definition und Einordnung von Data Mining sowie die verständliche Darstellung der methodischen Vorgehensweisen und des zugrunde liegenden Prozesses.

Welche wissenschaftliche Methode wird verwendet?

Es werden gängige analytische Methoden des Data Mining (Clustering, Assoziierungsregeln, Entscheidungsbäume) anhand von Beispielen aus der Wirtschaftspraxis erläutert.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die Vorstellung der Methoden inklusive konkreter Berechnungsbeispiele sowie die Darstellung des allgemeinen Data Mining Prozesses und möglicher Fehlerquellen.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Begriffe sind Data Mining, Knowledge Discovery, Clustering, Entscheidungsbäume und Assoziationsregeln.

Wie lässt sich die Qualität einer Assoziationsregel bestimmen?

Die Qualität wird durch die Kennzahlen "Support" (prozentualer Anteil der Transaktionen) und "Confidence" (Quotient der Abhängigkeit) gemessen.

Welche Probleme können im Data Mining Prozess auftreten?

Herausforderungen umfassen Datenschutzaspekte, unvollständige oder fehlerhafte Datensätze sowie Ausreißer mit ungewöhnlichen Attributwerten.

Excerpt out of 7 pages - scroll top

Details

Title: Explorative Statistik. Data Mining einfach erklärt
College: University of Applied Sciences Braunschweig / Wolfenbüttel; Salzgitter
Grade: 1,7
Author: Valentina Barysava (Author)
Publication Year: 2014
Pages: 7
Catalog Number: V1730808
ISBN (PDF): 9783389193679
Language: German
Tags: Clustering Assoziierung Knowledge Discovery in Databases Entscheidungsbäume explorative Statistik Datenmuster Datenproblematiken
Product Safety: GRIN Publishing GmbH

Quote paper: Valentina Barysava (Author), 2014, Explorative Statistik. Data Mining einfach erklärt, Munich, GRIN Verlag, https://www.grin.com/document/1730808

Explorative Statistik. Data Mining einfach erklärt