Das unternehmensweite Data Warehouse bietet die Lösung eines umfassenden Informationsmanagements auf Basis des Information Retrievals. In diesem Zusammenhang sind Verfahren des Knowledge Discovery in Databases (Data Mining, Datenvisualisierung) von großer Bedeutung und essentiell für entscheidungsunterstützende Prozesse, da in gigantischen Datenmengen durch traditionell mathematisch-statistische Methoden, sowie durch Techniken der informationstheoretischen Kybernetik nach Informationen gesucht wird, aus denen im weiteren Wissen extrahiert wird.
In dieser Arbeit wird Ein Fuzzy Approach im Information Retrieval vorgestellt, der ein innovatives Verfahren darstellt, um vage bzw. ungenaue Daten, die in Form von Präferenz-Intervallen vorliegen, zur Wissensextraktion zu verwenden. Der neue Ansatz kombiniert die entscheidenden Theorien zur Behandlung unscharfer Daten und Mengen, Rough Sets und Fuzzy Sets, und extrahiert Zielintervalle, die einer approximativen Abbildung der Eingabedaten entsprechen. Aus diesen Rough Intervals werden Regeln formuliert, die als Regelbasis in wissensbasierten Systemen zur automatischen Entscheidungsunterstützung verwendet werden können.

In Kapitel 2 wird der Begriff des Information Retrieval in seinen Facetten erfaßt und klassifiziert. Dabei werden die unterschiedlichen Datenstrukturen, die Verfahren zur Indexierung von Dokumenten, sowie die Suchtechniken im Information Retrieval, verbunden mit den verschiedenartigen Computer-Informationssystemen, berücksichtigt. Dieser Teil versucht zudem, anhand der Entwicklung des elektronischen Information Retrievals den Bedarf und die Entstehung des heutigen Data Warehouse zu verdeutlichen.
Kapitel 3 betrachtet informationstheoretische Aspekte im Zusammenhang mit dem neuen Medium Internet, sowie die wachsende Informationsglobalisierung und die Problematiken der daraus resultierenden, exponentiell wachsenden Informationsmenge.
[...]

Extrait

Inhaltsverzeichnis

Einleitung
Aspekte des Information Retrieval
- Definition und Abgrenzung
- Datenstrukturen in Informationssystemen
  - Hashbasierte und Intervallbasierte Datenstrukturen
  - Signature Files und Inverted Files
- Verfahren zur Indexierung von Dokumenten
- Suchtechniken im Information Retrieval
  - Boolesches Retrieval
  - Fuzzy Retrieval
  - Vektorraum-Modell
  - Probabilistisches Retrieval
- Typologie von Informationssystemen
  - Information Retrieval Systeme
  - Datenbankmanagementsysteme
  - Expertensysteme
    - Werkzeuge für Expertensysteme
  - Weitere Informationssysteme
Der Einsatz von Information
- Internet - Entwicklung und Wachstum
- Information Overload
  - Information Overload im Unternehmen
  - Vom Information Retrieval zum Information Overload
  - Information Overload im Internet
Die Data Warehouse-Technologie
- Einführung
- Definition
- Entwicklung der Data Warehouse-Technologie
- Data Warehouse Konzepte
  - Data Warehouse Modell der META Group
  - Data Warehouse Funktionen nach SINGH
- Datenverarbeitung im Data Warehouse
  - Transaction Processing und OLTP
  - Decision Support Processing
  - Online Analytical Processing (OLAP)
- Data Warehouse und Data Marts
- Data Warehouse Reifemodell
- Data Warehousing in der Praxis
Verfahren des Data Mining
- Einleitung
- Definition
- Knowledge Discovery in Databases (KDD)
- Prozeßmodelle
- Methoden und Muster
  - Muster
  - Methoden
    - Klassifikation
    - Schätzung
    - Vorhersage
    - Ähnlichkeitsgruppierung
    - Clustering
    - Deskription
- Techniken
  - Fallbasiertes Schließen
  - Entscheidungsbaumverfahren
  - Analyse von Beziehungen zwischen Datensätzen
  - Automatische Clusteranalyse
  - Genetische Algorithmen
  - Neuronale Netze
  - Visualisierung
- Data Mining-spezifische Problematiken
  - Datenprobleme
  - Prozeẞprobleme
- Data Mining im Unternehmen
  - Corporate Intranets
- Anwendungen in der Praxis
Ein Fuzzy Approach im Information Retrieval
- Verarbeitung unscharfer Daten
  - Rough Sets
    - Allgemein
    - Rough Set-Theorie
  - Fuzzy Logic
    - Allgemein
    - Entwicklungsüberblick
    - Fuzzy Sets
    - Possibilität versus Probabilität
    - Approximatives Schließen
    - Fuzzy Systeme
- Entwicklung eines Fuzzy Approachs
  - Allgemein
  - Konzept
  - Realisierung
Die Implementierung eines Prototypen in C++
- Allgemeine Programmbeschreibung
- Klassen und Methoden
- Input/Output Schnittstelle
- Ein Musterbeispiel
- Berechnung multipler Kategorie -Dependenzen
Zusammenfassung und Schlußbetrachtung

Zielsetzung und Themenschwerpunkte

Diese Diplomarbeit befasst sich mit der Anwendung eines Fuzzy Approachs im Information Retrieval. Ziel der Arbeit ist es, die Herausforderungen des Information Overloads im Kontext von modernen Informationssystemen zu analysieren und einen Lösungsansatz basierend auf Fuzzy Logic zu entwickeln.

Information Overload und seine Auswirkungen
Data Warehouse-Technologie und ihre Rolle im Information Retrieval
Data Mining-Verfahren und ihre Bedeutung für die Analyse großer Datenmengen
Fuzzy Logic und ihre Anwendung im Information Retrieval
Entwicklung eines Prototypen zur Implementierung eines Fuzzy Approachs

Zusammenfassung der Kapitel

Die Arbeit beginnt mit einer Einführung in das Information Retrieval und behandelt verschiedene Aspekte, wie z.B. Definition, Datenstrukturen, Indexierung, Suchtechniken und Typologien von Informationssystemen. Anschließend wird das Problem des Information Overloads beleuchtet, insbesondere im Kontext von Unternehmen und dem Internet.

Kapitel 4 beschäftigt sich mit der Data Warehouse-Technologie und erläutert deren Entwicklung, Konzepte, Funktionen und Anwendungen. Kapitel 5 behandelt Verfahren des Data Mining, darunter Definition, Prozeßmodelle, Methoden, Muster, Techniken und spezifische Problematiken.

Kapitel 6 fokussiert auf die Anwendung eines Fuzzy Approachs im Information Retrieval, wobei die Verarbeitung unscharfer Daten mit Hilfe von Rough Sets und Fuzzy Logic im Vordergrund steht. Kapitel 7 beschreibt die Implementierung eines Prototypen in C++ und beleuchtet die allgemeinen Programmbeschreibung, Klassen und Methoden, die Input/Output Schnittstelle und ein Musterbeispiel.

Schlüsselwörter

Information Retrieval, Fuzzy Logic, Data Warehouse, Data Mining, Information Overload, Rough Sets, Fuzzy Sets, Prototypenentwicklung, C++.

Fin de l'extrait de 152 pages - haut de page

Résumé des informations

Titre: Ein Fuzzy Approach im Information Retrieval
Université: Vienna University of Technology (Angewandte Informatik)
Note: Sehr Gut
Auteur: Lucian Rehm (Auteur)
Année de publication: 1999
Pages: 152
N° de catalogue: V1066
ISBN (ebook): 9783638106580
Langue: allemand
mots-clé: Data Mining Data Warehouse Fuzzy Logic Information Retrieval Rough Sets
Sécurité des produits: GRIN Publishing GmbH

Citation du texte: Lucian Rehm (Auteur), 1999, Ein Fuzzy Approach im Information Retrieval, Munich, GRIN Verlag, https://www.grin.com/document/1066