Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Commercial Information Technology

Techniken des Data Mining, Knowledge Discovery und SPSS

Title: Techniken des Data Mining, Knowledge Discovery und SPSS

Seminar Paper , 2004 , 32 Pages , Grade: 1,7

Autor:in: Holger Herrmann (Author)

Computer Science - Commercial Information Technology
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

1 Einleitung
1.1 Definition und Ziele des Data Mining
1.2 Vorgehensweise
1.3 Probleme beim Data Mining
1.4 Aufbereitung der Daten

2 Data Mining und Knowledge Discovery
2.1 Definition: „Knowledge Discovery“
2.2 Die Phasen des Knowledge Discovery

3 Data Mining als Bestandteil des Data Warehousing

4 Techniken des Data Mining
4.1 Klassifikation und Entscheidungsbaum
4.1.1 Ziele der Verfahren
4.1.2 Beschreibung der Klassifikation und des Entscheidungsbaums
4.1.3 Anwendungsbeispiel eines Entscheidungsbaums
4.1.4 Probleme bei Klassifikation und Entscheidungsbaum
4.2 Die Assoziationsregeln
4.2.1 Ziel der Assoziationsregeln
4.2.2 Erzeugung von Assoziationsregeln
4.2.3 Anwendungsbeispiel von Assoziationsregeln
4.2.4 Probleme bei Assoziationsregeln
4.3 Das Clustering
4.3.1 Ziel des Clustering
4.3.2 Beschreibung des Clustering
4.3.3 Anwendungsbeispiel des Clustering
4.3.4 Probleme beim Clustering

5 Data Mining mit SPSS
5.1 Was ist SPSS?
5.2 Ein Beispiel zur Entscheidungsbaum-Analyse

6 Data Mining mit SAS
6.1 Das Unternehmen „SAS“
6.2 Die Lösungen von SAS
6.3 Die Brücke zwischen Theorie und Praxis: Musterbeispiel KSFE

7 Zusammenfassung und Ausblick

Excerpt


Inhaltsverzeichnis

1 Einleitung

1.1 Definition und Ziele des Data Mining

1.2 Vorgehensweise

1.3 Probleme beim Data Mining

1.4 Aufbereitung der Daten

2 Data Mining und Knowledge Discovery

2.1 Definition: „Knowledge Discovery“

2.2 Die Phasen des Knowledge Discovery

3 Data Mining als Bestandteil des Data Warehousing

4 Techniken des Data Mining

4.1 Klassifikation und Entscheidungsbaum

4.1.1 Ziele der Verfahren

4.1.2 Beschreibung der Klassifikation und des Entscheidungsbaums

4.1.3 Anwendungsbeispiel eines Entscheidungsbaums

4.1.4 Probleme bei Klassifikation und Entscheidungsbaum

4.2 Die Assoziationsregeln

4.2.1 Ziel der Assoziationsregeln

4.2.2 Erzeugung von Assoziationsregeln

4.2.3 Anwendungsbeispiel von Assoziationsregeln

4.2.4 Probleme bei Assoziationsregeln

4.3 Das Clustering

4.3.1 Ziel des Clustering

4.3.2 Beschreibung des Clustering

4.3.3 Anwendungsbeispiel des Clustering

4.3.4 Probleme beim Clustering

5 Data Mining mit SPSS

5.1 Was ist SPSS?

5.2 Ein Beispiel zur Entscheidungsbaum-Analyse

6 Data Mining mit SAS

6.1 Das Unternehmen „SAS“

6.2 Die Lösungen von SAS

6.3 Die Brücke zwischen Theorie und Praxis: Musterbeispiel KSFE

7 Zusammenfassung und Ausblick

Zielsetzung & Themen

Diese Seminararbeit gibt einen strukturierten Überblick über das Themenfeld Data Mining, erläutert die theoretischen Grundlagen und die wesentlichen Verfahrensschritte. Dabei wird der Fokus auf die Bedeutung der Datenaufbereitung, die Abgrenzung zum Knowledge Discovery und die praktische Anwendung mittels der Softwarelösungen SPSS und SAS gelegt.

  • Definition, Ziele und Vorgehensweise beim Data Mining
  • Theoretische Grundlagen und Verfahren (Klassifikation, Assoziationsregeln, Clustering)
  • Problematiken bei der Datenqualität und der praktischen Umsetzung
  • Integration in den Data Warehouse-Prozess
  • Praxisorientierte Beispiele zur Entscheidungsbaum-Analyse und Warenkorbanalyse

Auszug aus dem Buch

1.4 Aufbereitung der Daten

Wie bereits in Abschnitt 1.3 ausführlicher dargelegt, bestehen die größten Probleme beim Data Mining durch die zu Grunde liegenden Daten. Dementsprechend nimmt die Aufbereitung der Daten (auch „data cleaning“) einen großen Bestandteil des Vorgangs beim Data Mining ein. Folgende Verfahren können im Vorlauf des DM in Frage kommen:

• Behandlung fehlender Attributswerte

Die einfachste Möglichkeit, fehlende Werte eines Attributs zu behandeln ist, dieses Attribut bei der Auswertung nicht zu berücksichtigen. Diese Möglichkeit ist jedoch nicht immer wünschenswert. Ein zweiter Weg besteht darin, fehlende Werte zu ergänzen, beispielsweise durch das arithmetische Mittel der gefüllten Attributwerte. Schließlich können fehlende Werte besonders gekennzeichnet werden, beispielsweise „durch Einträge [...], die außerhalb des Gültigkeitsbereichs liegen, beispielsweise eine negative Zahl (z.B. -1) in einem numerischen Feld, das normalerweise nur positive Zahlen enthalten darf“ (WITTEN und FRANK 2001).

• Behandlung doppelt vorhandener Datensätze

Redundante Datensätze lassen sich mit Hilfe einfacher Methoden herausfiltern. Doppelte Datensätze sollten im Rahmen der Aufbereitung der Daten entfernt werden.

• Datenanreicherung

Bei der Analyse der Daten kann die Erkenntnis zu Tage treten, dass die vorhandenen Daten für die Analyse nicht ausreichen. In diesem Fall ist es notwendig, weitere Datenquellen zu erschließen. Eine Möglichkeit hierzu ist der Zukauf von Fremddaten (z.B. mikrogeographische Daten). Dass hier die Grenze zwischen legaler und illegaler Datenbeschaffung sehr eng gezogen ist, soll an dieser Stelle nur erwähnt werden.

• Datenreduktion

Umgekehrt kann es der Fall sein, dass die vorhandene Datenfülle im Data Mining-Verfahren nicht verarbeitet werden kann. Hier ist es angebracht, bestimmte Daten aus der Analyse auszuschließen. Dabei muss man sich jedoch absolut sicher sein, dass das Entfernen der Daten keinen Einfluss auf das Ergebnis haben kann.

Zusammenfassung der Kapitel

1 Einleitung: Dieses Kapitel definiert Data Mining, beschreibt das grundlegende Vorgehen sowie die Herausforderungen bei der Datenaufbereitung.

2 Data Mining und Knowledge Discovery: Hier wird der theoretische Rahmen gesteckt und die Abgrenzung zwischen Data Mining und Knowledge Discovery vorgenommen.

3 Data Mining als Bestandteil des Data Warehousing: Dieses Kapitel erläutert, wie Data Mining-Prozesse effizient auf die Infrastruktur eines Data Warehouse zugreifen können.

4 Techniken des Data Mining: Es werden zentrale Methoden wie Klassifikation, Entscheidungsbäume, Assoziationsregeln und Clustering detailliert vorgestellt und anhand von Beispielen verdeutlicht.

5 Data Mining mit SPSS: Das Kapitel präsentiert die Softwarelösung SPSS und demonstriert praktisch die Anwendung einer Entscheidungsbaum-Analyse.

6 Data Mining mit SAS: Hier wird das Unternehmen SAS, dessen Lösungsportfolio und die Verbindung zwischen wissenschaftlicher Theorie und wirtschaftlicher Praxis durch Konferenzen wie die KSFE erläutert.

7 Zusammenfassung und Ausblick: Das Fazit fasst die Relevanz der Datenqualität zusammen und diskutiert ethische Grenzen sowie die Verantwortung bei der Interpretation von Data Mining-Ergebnissen.

Schlüsselwörter

Data Mining, Knowledge Discovery, Data Warehouse, Klassifikation, Entscheidungsbaum, Assoziationsregeln, Clustering, Warenkorbanalyse, SPSS, SAS, Datenaufbereitung, Business Intelligence, k-Mittelwerte-Algorithmus, Datenschutz, Entscheidungsunterstützung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit bietet eine fundierte Einführung in das Thema Data Mining, von der theoretischen Einordnung über die technischen Analyseverfahren bis hin zu Softwareanwendungen und ethischen Aspekten.

Was sind die zentralen Themenfelder?

Im Zentrum stehen die Gewinnung von Wissen aus großen Datenbeständen, die Aufbereitung von Rohdaten und die Anwendung spezieller Algorithmen wie Clustering oder Klassifikation.

Was ist das primäre Ziel der Arbeit?

Das primäre Ziel ist es, dem Leser ein grundlegendes Verständnis für den gesamten Data Mining-Prozess zu vermitteln – inklusive der kritischen Erfolgsfaktoren wie Datenqualität und methodische Auswahl.

Welche wissenschaftlichen Methoden werden verwendet?

Die Arbeit stützt sich auf eine Literaturanalyse und veranschaulicht Data Mining-Verfahren anhand theoretischer Modelle sowie praktischer Beispiele aus dem Marketing und dem Vertrieb.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil gliedert sich in die theoretische Abgrenzung zum Knowledge Discovery, die technische Beschreibung von Data Mining-Techniken und die praktische Software-Demonstration anhand von SPSS und SAS.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Begriffe sind Data Mining, Knowledge Discovery, Entscheidungsbaum, Clustering, Assoziationsregeln sowie die Bedeutung der Datenaufbereitung für das Management.

Warum ist die Datenaufbereitung laut Autor so kritisch?

Ohne eine saubere Datenaufbereitung besteht die Gefahr, dass fehlerhafte Analysen zu trivialen oder falschen Ergebnissen führen, die wirtschaftlich nicht verwertbar oder schlicht irreführend sind.

Welche ethischen Bedenken werden im Fazit geäußert?

Der Autor weist auf die Gefahren bei der Verarbeitung personenbezogener Daten hin, wie etwa die Diskriminierung bei Kreditentscheidungen oder den Verlust der Privatsphäre („gläserner Mensch“).

Was unterscheidet Clustering von Klassifikationsverfahren?

Während bei der Klassifikation Klassen vorab bekannt sind und Instanzen diesen zugeordnet werden, identifiziert das Clustering natürliche Gruppen in Datenbeständen, bei denen die Zielkategorien zu Beginn noch nicht feststehen.

Excerpt out of 32 pages  - scroll top

Details

Title
Techniken des Data Mining, Knowledge Discovery und SPSS
College
University of Hagen
Course
Wirtschaftsinformatik
Grade
1,7
Author
Holger Herrmann (Author)
Publication Year
2004
Pages
32
Catalog Number
V80443
ISBN (eBook)
9783638897907
ISBN (Book)
9783638904230
Language
German
Tags
Data Mining Wirtschaftsinformatik
Product Safety
GRIN Publishing GmbH
Quote paper
Holger Herrmann (Author), 2004, Techniken des Data Mining, Knowledge Discovery und SPSS, Munich, GRIN Verlag, https://www.grin.com/document/80443
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  32  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint