Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Mathematics - Statistics

Einführung in den Einsatz von Data Mining

Title: Einführung in den Einsatz von Data Mining

Diploma Thesis , 2003 , 92 Pages , Grade: 1,3

Autor:in: Diplom-Betriebswirt Andre Hiller (Author)

Mathematics - Statistics
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Diese Arbeit soll eine Einführung in den Einsatz von Data Mining bei der Störungsbeseitigung geben. Als Testobjekt wurde die Störungsdatenbank der SOLVAY Deutschland GmbH in Bernburg gewählt. Es soll geprüft werden, ob diese die Voraussetzungen für Data Mining – Analysen erfüllt und welche Ergebnisse erzielt werden können. Des Weiteren soll ein Ausblick auf weitere Möglichkeiten des Data Mining – Einsatzes gegeben werden. Das Interesse an Data Mining wurde durch ständig auftauchende Berichte, abgehaltene Konferenzen und Wettbewerbe geweckt. Wie z.B. durch den Artikel von Michael Gonzales, dem Geschäftsführer der „Focus Group, Ltd „ einer Unternehmensberatung, die sich auf Data Mining spezialisiert hat. In seinem Artikel beschreibt er die Notwendigkeit der Nutzung von Data Mining für die Bewältigung der Informationsflut und den daraus entstehenden Informationsvorsprung gegenüber anderen Unternehmen. Seiner Meinung ist die Bereitstellung der Daten durch ein Data Warehouse die wichtigste Voraussetzung für die Durchführung von Data Mining – Projekten, da 80% der benötigten Zeit für die Datenaufbereitung benötigt werden. Durch die richtige Vorbereitung der Daten können schneller Ergebnisse erzielt werden und diese für die Entscheidungsfindung genutzt werden.

Excerpt


Inhaltsverzeichnis

1. Zielstellung und Vorgehensweise

2. Grundlagen des Data Mining

2.1 Daten und Skalen

2.2 Die Entwicklung der Datensammlung und –Auswertung

2.2.1 Historische Entwicklung

2.2.2 Das Data Warehouse Konzept

2.2.3 Definition von Data Mining und KDD

3. Vorgehensweise beim Data Mining

3.1 Analyse des Anwendungsgebietes

3.2 Datenaufbereitung

3.3 Methoden der Datenanalyse

3.4 Datenpräsentation

3.5 Basismethoden des Data Mining

3.6 Software

3.6.1 Weka

3.6.2 SPSS 10 für Windows

3.6.3 Clementine 7.0

4. Solvay Soda Deutschland GmbH

4.1 Allgemeines

4.2 Die Störungsdatenbank

5. Durchführung des Data Mining

5.1 Vermutete Zusammenhänge

5.2 Auswahl der Analysemethoden und der Software

5.4 Übernahme der Daten

5.5 Die Attribute

5.6 Vorbereitung der Daten

5.7 Anwendung der Analysemethoden

5.7.1 Deskriptive Statistiken

5.7.2 Vergleich der Zeitdauer mit anderen Attributen

5.7.3 Kreuztabellen wichtiger Attribute

5.7.4 Diskriminanzanalyse

6. Fazit

Zielsetzung & Themen

Die Arbeit untersucht den praktischen Einsatz von Data-Mining-Methoden zur Optimierung der Störungsbeseitigung am Beispiel der Störungsdatenbank der SOLVAY Soda Deutschland GmbH, um die Eignung der Datenbasis zu prüfen und Erkenntnisse für das Instandhaltungsmanagement zu gewinnen.

  • Grundlagen des Data Mining und des KDD-Prozesses
  • Methodik zur Datenaufbereitung und -analyse
  • Vorstellung relevanter Data-Mining-Softwarelösungen
  • Analyse der Störungsdaten der Solvay Soda Deutschland GmbH
  • Bewertung der Möglichkeiten zur Störungsvorhersage und Prozessoptimierung

Auszug aus dem Buch

2.2.3 Definition von Data Mining und KDD

Der Begriff Data Mining kommt von dem englischen Wort mine, das Mine oder Bergwerk bedeutet. Mining steht für den Bergbau. Übertragen bedeutet Data Mining somit die Suche nach versteckten Informationen in einer Datenmasse. Dazu gehören u.a. Muster, Trends und Prognosen.

Der Data Mining Prozess wird in der englischen Literatur auch als KDD Prozess bezeichnet. Data Mining stellt darin nur den eigentlichen Teil der Suche nach Datenmustern dar (siehe Abb. 3).1

Da aber heutige Data Mining Tools auch für die anderen Phasen, wie z.B. Datenaufbereitung, konzipiert sind, sollte der Begriff Data Mining nicht nur auf die Suche nach unbekannten Datenzusammenhängen eingeschränkt werden. Data Mining wird deshalb in dieser Arbeit als gesamter Prozess von der Datenaufbereitung über die Datenanalyse bis hin zur Datenpräsentation angesehen. Eine anschließende ausführliche Phase der Informationsinterpretation, um schließlich zum sog. Wissen zu gelangen, kann als zusätzliche Phase im Anschluss an den Data Mining Prozess angesehen werden. In dieser Phase sind letztendlich auch menschliche Fähigkeiten, wie z.B. Intuition oder Kreativität, gefragt.

Zusammenfassung der Kapitel

1. Zielstellung und Vorgehensweise: Definition der Aufgabenstellung und Vorstellung des methodischen Vorgehens für die Einführung von Data Mining bei der Störungsbeseitigung.

2. Grundlagen des Data Mining: Erläuterung der theoretischen Basis, von der Datenskalierung über die historische Entwicklung bis hin zum Data Warehouse und KDD-Prozess.

3. Vorgehensweise beim Data Mining: Detaillierte Darstellung der Prozessschritte: Analyse, Vorbereitung, Analyse, Präsentation sowie Überblick über eingesetzte Software.

4. Solvay Soda Deutschland GmbH: Unternehmensvorstellung und detaillierte Beschreibung der genutzten Störungsdatenbank als Datengrundlage.

5. Durchführung des Data Mining: Dokumentation der angewandten Methoden, der Datenbereinigung und der anschließenden statistischen Analysen und Kreuztabellen zur Identifikation von Mustern.

6. Fazit: Zusammenfassende Bewertung der Ergebnisse, kritische Reflexion der Datengüte und Ausblick auf notwendige Anforderungen für zukünftige Prognosemodelle.

Schlüsselwörter

Data Mining, KDD-Prozess, Störungsbeseitigung, Störungsdatenbank, Data Warehouse, Statistik, Clusteranalyse, Klassifikation, Diskriminanzanalyse, Prozessoptimierung, Instandhaltung, Entscheidungsunterstützung, Datenaufbereitung, Software, Solvay Soda Deutschland GmbH.

Häufig gestellte Fragen

Worum geht es in der Arbeit primär?

Die Diplomarbeit untersucht die praktische Anwendbarkeit von Data-Mining-Techniken zur Analyse und Optimierung der Störungsbeseitigung bei der Solvay Soda Deutschland GmbH.

Welche zentralen Themenfelder werden bearbeitet?

Zentral sind die theoretischen Grundlagen des Data Mining, der KDD-Prozess, die Datenaufbereitung für industrielle Anwendungen sowie die konkrete Anwendung statistischer Analysemethoden auf Störungsdaten.

Was ist die primäre Forschungsfrage?

Es wird untersucht, ob die bestehende Störungsdatenbank die Voraussetzungen für Data-Mining-Analysen erfüllt und welche Erkenntnisse zur Verbesserung des Instandhaltungsprozesses daraus abgeleitet werden können.

Welche wissenschaftliche Methode kommt zum Einsatz?

Die Arbeit kombiniert deskriptive Statistik, Kreuztabellenanalysen und eine Diskriminanzanalyse, um Zusammenhänge zwischen Störungsursachen, Zeitaufwand, Produktion und Außentemperatur zu untersuchen.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die theoretische Fundierung, die Beschreibung der Datengrundlage, die Dokumentation der Datenaufbereitung und die Anwendung verschiedener Analysemethoden zur Validierung von Vermutungen über Störungszusammenhänge.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit fokussiert sich auf Begriffe wie Data Mining, Störungsanalyse, KDD-Prozess, Instandhaltungsdatenbank und Entscheidungsunterstützung.

Warum konnte die Diskriminanzanalyse keine besseren Ergebnisse liefern?

Die unzureichende Vorhersagegenauigkeit lag primär an der mangelnden Granularität der Daten, da nur Tages- anstatt ereignisbezogener Messdaten (Druck, Füllstand, Durchfluss) zur Verfügung standen.

Welche Empfehlungen gibt der Autor für die Zukunft?

Der Autor empfiehlt eine genauere Aufzeichnung ereignisbezogener Messdaten über einen längeren Zeitraum, um komplexe Zusammenhänge zwischen Betriebszuständen und Störungen vorhersagbar zu machen.

Excerpt out of 92 pages  - scroll top

Details

Title
Einführung in den Einsatz von Data Mining
College
Anhalt University of Applied Sciences
Grade
1,3
Author
Diplom-Betriebswirt Andre Hiller (Author)
Publication Year
2003
Pages
92
Catalog Number
V75722
ISBN (eBook)
9783638849760
ISBN (Book)
9783638849159
Language
German
Tags
Einführung Einsatz Data Mining
Product Safety
GRIN Publishing GmbH
Quote paper
Diplom-Betriebswirt Andre Hiller (Author), 2003, Einführung in den Einsatz von Data Mining, Munich, GRIN Verlag, https://www.grin.com/document/75722
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  92  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint