Die Ähnlichkeitensuche gewinnt mit zunehmender Komplexit¨at der Dokumente an Bedeutung. Während existierende Ansätze den inhaltlichen Aspekt der Suche in den Fokus der Betrachtung setzten, wird die strukturelle Ähnlichkeit weitestgehend außen vor gelassen. Im Rahmen dieser Diplomarbeit wird ein einheitlicher Ansatz für die Ähnlichkeitensuche vorgestellt, welcher die strukturellen Aspekte der Zusammensetzung der komplexen Datentypen ebenfalls berücksichtigt und separat als strukturelle Ähnlichkeit ausweist. Die Berechnung der inhaltlichen Ähnlichkeit erlaubt die Erkennung ähnlicher Teilbäume innerhalb beliebiger komplexer Datentypen. Die Daten werden dem System im XML-Dokument- Format übergeben. Diese werden vom System so weit abstrahiert, dass keine Unterschiede aufgrund verschiedener stilistischer Möglichkeiten der Serialisierung von komplexen Datentypen in das XML-Dokument-Format Auswirkungen auf den inhaltlichen Vergleich nehmen können. Dies ermöglicht den Vergleich komplexer Datentypen hinsichtlich ihres Aufbaus und ihres Inhalts.
Inhaltsverzeichnis (Table of Contents)
- 1 Einführung
- 2 Grundlagen
- 2.1 Eigenschaften komplexer Datentypen
- 2.1.1 Komplexe Datentypen und ihre primitiven Bestandteile
- 2.1.2 Das XML-Transport-Dokumentformat
- 2.1.3 Feste und lose Strukturen
- 2.1.4 Das RDF-System zur Beschreibung von Ressourcen
- 2.2 Distanz-Berechnungsvorschriften in Räumen
- 2.2.1 Suchräume
- 2.2.2 Edit-Distanzen
- 2.2.3 Werte-Distanzen
- 2.2.4 PlusMinus-Ähnlichkeit
- 2.2.5 Bildung von Teilmengen
- 2.3 Logische Kombination der Distanzwerte
- 2.3.1 Aussagenlogik
- 2.3.2 Prädikatenlogik
- 2.4 Abfragesprachen mit Datenstrukturen
- 2.4.1 Abfragesprachen
- 2.4.2 Datenstrukturen
- 2.4.3 Bekannte Ansätze auf Datenstrukturen
- 2.4.4 Ontologien
- 2.1 Eigenschaften komplexer Datentypen
Zielsetzung und Themenschwerpunkte (Objectives and Key Themes)
Die vorliegende Diplomarbeit beschäftigt sich mit der Entwicklung eines Verfahrens zur Analyse komplexer Daten, insbesondere auf strukturelle Ähnlichkeit. Ziel ist es, einen einheitlichen Ansatz zu schaffen, der sowohl die inhaltlichen als auch die strukturellen Aspekte von Daten berücksichtigt. Der Fokus liegt dabei auf der Identifizierung ähnlicher Teilbäume innerhalb komplexer Datentypen, die in XML-Dokumenten dargestellt werden.
- Analyse komplexer Daten
- Strukturelle Ähnlichkeit
- XML-Dokumentformat
- Teilbaum-Vergleich
- Entwicklung eines einheitlichen Ansatzes
Zusammenfassung der Kapitel (Chapter Summaries)
Das erste Kapitel liefert eine Einführung in die Thematik der Ähnlichkeitssuche und die Motivation für die Entwicklung des Verfahrens. Kapitel 2 befasst sich mit den Grundlagen der Analyse komplexer Daten, einschließlich der Eigenschaften von komplexen Datentypen, dem XML-Transport-Dokumentformat und Distanz-Berechnungsvorschriften. Kapitel 3 beschreibt die Konzeption und Implementierung des entwickelten Verfahrens zur Analyse komplexer Daten auf strukturelle Ähnlichkeit.
Schlüsselwörter (Keywords)
Komplexe Daten, Ähnlichkeitssuche, strukturelle Ähnlichkeit, XML-Dokumentformat, Teilbaum-Vergleich, Distanz-Berechnungsvorschriften, RDF, Ontologien
- Citation du texte
- Maciej Niemczyk (Auteur), 2010, Entwurf und Implementierung eines Verfahrens zur Analyse komplexer Daten insbesondere auf strukturelle Ähnlichkeit, Munich, GRIN Verlag, https://www.grin.com/document/167375