Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Miscellaneous

Explorative Statistik. Data Mining einfach erklärt

Title: Explorative Statistik. Data Mining einfach erklärt

Term Paper , 2014 , 7 Pages , Grade: 1,7

Autor:in: Valentina Barysava (Author)

Computer Science - Miscellaneous
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Die Informationsmenge wächst rasant in der heutigen kundenorientierten Wirtschaft. Die Daten sind Rohstoff fürs Unternehmenswachstum. Die Ergebnisse der Analyse von Daten mit Hilfe von Data Mining Methoden stellen für die Unternehmen, die sie nutzen, ein großes Informationspotenzial dar.

Mitte der 90-er Jahre beschäftigten sich immer mehr Unternehmen mit den Werkzeugen des Data Mining. Anfang 90-er Jahre wurden die ersten Prototypen vorgestellt. Sie waren in der Betriebswirtschaftslehre vor allem im Bereich Marketing interessant. „Data Mining hat das Ziel, Wissen aus Daten zu extrahieren“. Die Methode, die selbständig Wissen in großen Datenbeständen entdeckt³. Ende der 80-er Jahre entwickelte sich Knowledge Discovery in Databases KDD, die interdisziplinäre Forschungsrichtung, die mittlerweile überwiegend als Data Mining bezeichnet wird. Im betriebswirtschaftlichen Bereich sind sie Synonyme. Die erste Begriffsverwendung wurde schon in den 60-er Jahren in der Statistik für das Suchen nach Datenmustern entstanden.

Im Rahmen dieser Arbeit soll der Begriff von Data Mining definiert werden, seine Entstehung, Entwicklung beschrieben werden. Seine Methoden, Aufgaben sollen geklärt werden und sein typischer Prozess soll beschrieben werden.

Excerpt


Inhaltsverzeichnis

1. Einleitung

1.1 Problemstellung

1.2 Ziel der Arbeit

2. Methoden und Aufgaben

2.1 Clustering

2.2 Assoziierung

2.3 Entscheidungsbäume

3. Data Mining Prozess

4. Fazit

Zielsetzung und Themen der Arbeit

Die vorliegende Arbeit befasst sich mit der Definition, Entstehung und Entwicklung des Data Mining sowie der Klärung zentraler Methoden und Prozesse zur Gewinnung von Wissen aus großen Datenmengen in der modernen Wirtschaft.

  • Grundlagen und Definition von Data Mining
  • Methoden der Kundensegmentierung (Clustering)
  • Analyse von Kundenverhalten durch Assoziationsregeln
  • Einsatz von Entscheidungsbäumen zur Verhaltensvorhersage
  • Herausforderungen und Probleme im Data Mining Prozess

Auszug aus dem Buch

2.2 Assoziierung

Die 2. Methode ist Assoziierung, mit Hilfe von Assoziationsregel kann man unbekannte Abhängigkeiten beim Kundenverhalten entdecken. Es geht eine klassische Frage: Welche Kunden, die Produkt A gekauft haben, kommen auch für den Kauf von Produkt B in Frage. Die Zusammenhänge erkläre ich am Beispiel aus dem Obst und Gemüseverkauf.

Wir haben 6 Transaktionen.

Tabelle 1 zeigt uns, was in allen 6 Transaktionen gekauft wurde. Wir wollen nun eine Regel formulieren, die besagt: wenn Äpfel gekauft werden, werden auch Birnen gekauft. Die Qualität einer Regel wird durch ihren Grad an Unsicherheit bestimmt. Die Unsicherheitsgrad wird durch 2 Zahlen gekennzeichnet, die als Support und Confidence bezeichnet werden.

Der Support ist die Anzahl der Transaktionen, die alle Produkte sowohl der Bedingung wenn und des dann Teils einschließen. Er wird als prozentualer Anteil an den gesamten Transaktionen ausgedrückt. Für unser Beispiel ist der Support gleich 4/6 oder 2/3, d.h. 66%. In 2/3 Transaktionen werden Äpfel und Birnen gemeinsam gekauft.

Der 2. Wert ist als Confidence der Regel bezeichnet. Er ist der Quotient aus der Anzahl der Transaktionen, die im Wenn und Dann- Teil enthalten sind und der Anzahl der Transaktionen aus dem Wenn-Teil. Er drückt die Abhängigkeit aus, die liegt zwischen 0 und 1. Der Wert 1 druckt eine zwingende Abhängigkeit aus; Äpfel und Birnen werden immer gemeinsam gekauft.

Zusammenfassung der Kapitel

1. Einleitung: Beschreibt die steigende Bedeutung von Data Mining in der heutigen informationsorientierten Wirtschaft und definiert das Ziel der Arbeit.

2. Methoden und Aufgaben: Erläutert zentrale Techniken wie Clustering, Assoziierungsregeln und Entscheidungsbäume anhand praktischer Beispiele.

3. Data Mining Prozess: Beschreibt den Prozess der Mustererkennung aus Daten und thematisiert kritische Erfolgsfaktoren sowie mögliche Datenproblematiken.

4. Fazit: Fasst den Nutzen von explorativer Statistik und Data Mining Methoden für Unternehmen zusammen.

Schlüsselwörter

Data Mining, Knowledge Discovery, explorative Statistik, Clustering, Assoziierungsregeln, Entscheidungsbäume, Kundensegmentierung, Support, Confidence, Datenanalyse, Mustererkennung, Unternehmenswachstum, Datensicherheit

Häufig gestellte Fragen

Worum geht es in der Arbeit grundsätzlich?

Die Arbeit behandelt die explorative Statistik und Data Mining als Instrumente, um aus großen, in Unternehmen anfallenden Datenmengen wertvolle Informationen für das Unternehmenswachstum zu gewinnen.

Was sind die zentralen Themenfelder?

Zentrale Themen sind die theoretischen Grundlagen des Data Mining sowie spezifische Methoden wie Clustering, Assoziationsregeln und Entscheidungsbäume.

Was ist das primäre Ziel der Arbeit?

Das Ziel ist die Definition und Einordnung von Data Mining sowie die verständliche Darstellung der methodischen Vorgehensweisen und des zugrunde liegenden Prozesses.

Welche wissenschaftliche Methode wird verwendet?

Es werden gängige analytische Methoden des Data Mining (Clustering, Assoziierungsregeln, Entscheidungsbäume) anhand von Beispielen aus der Wirtschaftspraxis erläutert.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die Vorstellung der Methoden inklusive konkreter Berechnungsbeispiele sowie die Darstellung des allgemeinen Data Mining Prozesses und möglicher Fehlerquellen.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Begriffe sind Data Mining, Knowledge Discovery, Clustering, Entscheidungsbäume und Assoziationsregeln.

Wie lässt sich die Qualität einer Assoziationsregel bestimmen?

Die Qualität wird durch die Kennzahlen "Support" (prozentualer Anteil der Transaktionen) und "Confidence" (Quotient der Abhängigkeit) gemessen.

Welche Probleme können im Data Mining Prozess auftreten?

Herausforderungen umfassen Datenschutzaspekte, unvollständige oder fehlerhafte Datensätze sowie Ausreißer mit ungewöhnlichen Attributwerten.

Excerpt out of 7 pages  - scroll top

Details

Title
Explorative Statistik. Data Mining einfach erklärt
College
University of Applied Sciences Braunschweig / Wolfenbüttel; Salzgitter
Grade
1,7
Author
Valentina Barysava (Author)
Publication Year
2014
Pages
7
Catalog Number
V1730808
ISBN (PDF)
9783389193679
Language
German
Tags
Clustering Assoziierung Knowledge Discovery in Databases Entscheidungsbäume explorative Statistik Datenmuster Datenproblematiken
Product Safety
GRIN Publishing GmbH
Quote paper
Valentina Barysava (Author), 2014, Explorative Statistik. Data Mining einfach erklärt, Munich, GRIN Verlag, https://www.grin.com/document/1730808
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  7  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint
  • Withdraw Contract