Das World Wide Web [W3C01a, BLF99], neben eMail der prominenteste Bestandteil des Internets, hat sich in den letzten Jahren zu einer der wichtigsten Informationsquellen des t¨ aglichen Lebens entwickelt. Es wird zusammen mit Zeitung, Fernsehen und Radio zur Einholung von tagesaktuellen Nachrichten genutzt, leistet aber auch wertvolle Dienste als Nachschlagewerk und f¨ ur den Austausch und die Konservierung von Erfahrungen, Erlebnissen und Berichten. Dabei ist es durch seine urspr¨ ungliche Bedeutung als Ver¨ offentlichungsmedium f¨ ur Wissenschaftler [Con00, Gro02] stark an den Belangen des Nutzers orientiert, vor allem an seinen visuellen Bed¨ urfnissen, da der enthaltene Text in erster Linie gut lesbar sein sollte. Diese Orientierung hat ¨ uber die Jahre mit der enormen

Erweiterung der graﬁschen M¨ oglichkeiten und der Erh¨ ohung der dem Leser zur Verf¨ ugung stehenden Bandbreite noch zugenommen. Die in der Sprache HTML (HyperText Markup Language) [W3C99a, ISO00b] verfassten Webseiten sind zwar weiterhin maschinenlesbar, logische Textauszeichnungen wie em (emphatisch), strong (stark betont), samp (Beispiel) oder cite (Zitat), die zumindest einen rudiment¨ aren Hinweis auf den Inhalt geben, sind dagegen fast vollst¨ andig ver-schwunden. Davon, dass Maschinen den Inhalt einer Seite verstehen, kann keine Rede sein. In HTML k¨ onnen zwar auch ¨ uber die Verwendung von Meta-Tags wie

description und keywords zus¨ atzliche Informationen, sogenannte Metadaten, in die Seiten eingebettet werden; das folgende Beispiel gibt aber schon einen Hinweis auf die dabei auftretenden Unzul¨ anglichkeiten:

In der Beschreibung steht Fließtext, der zwar f¨ ur einen menschlichen Leser gute Hinweise gibt, mangels Standardisierung f¨ ur eine Maschine aber v¨ ollig unverst¨ andlich bleibt. F¨ ur die Schl¨ usselw¨ orter gilt ¨ ahnliches; ob ein Programm aus ihnen eine Bedeutung herauslesen kann, bleibt Zufall.

Extracto

Inhaltsverzeichnis

1 Einleitung und Motivation

1.1 Vom World Wide Web zum Semantic Web

1.1.1 Annotation mit Metadaten

1.1.2 Zielsetzung

1.2 Aufbau der Arbeit

I Grundlagen

2 Annotation

2.1 Sprachen

2.1.1 XML

2.1.2 DTD und XML Schema

2.1.3 Erweiterungen

2.1.3.1 Namespaces

2.1.3.2 XInclude

2.2 Metadatenformate

2.2.1 RDF

2.2.2 RDF Schema

2.2.3 Dublin Core

2.2.3.1 W3C Date Time Format

2.2.3.2 DCMI Period

2.3 Temporale Annotation

2.3.1 Anforderungen an temporale Annotation

2.3.1.1 Benennung

2.3.1.2 Grenzen

2.3.1.3 Strukturen

2.3.1.4 Explizite qualitative Relationen

2.3.2 Bewertung bestehender Ansätze

3 Temporale Repräsentation und temporales Schließen

3.1 Punktstrukturen

3.2 Periodenstrukturen

3.3 Allens Zeitlogik

3.4 Freksa: Konzeptuelle Nachbarschaft

3.5 Bewertung bestehender Ansätze

II Konzeption und Realisierung

4 Das temporale Modell: period names

4.1 Definition und Benennung

4.2 Grenzen

4.2.1 Exakte Grenzen

4.2.2 Unscharfe Grenzen

4.2.3 Persistente Grenzen

4.2.4 Unbekannte Grenzen

4.2.5 Kombinationen

4.3 Datumsformat RFC3339mod

4.4 Referenzierung

4.5 Relationen

4.6 Formeln

5 Temporale Relevanz

5.1 Abstand zwischen Perioden

5.2 Überschneidung von Perioden

5.3 Überschneidung statt Abstand

6 Reasoning

6.1 Beschreibung des Problemumfangs

6.2 Relationsbestimmung

6.2.1 Relationen zwischen Grenzen

6.2.2 Relationen zwischen zwei Perioden

6.2.2.1 Positiv und negativ hinreichende Bedingungen

6.2.3 Relationen zwischen mehreren Perioden

6.3 Implementierung eines Reasoners

6.3.1 Interne Repräsentation

6.3.1.1 Transitive Expansion

6.3.1.2 Behandlung von contemporary

6.3.1.3 Verifikation: Erkennung von Inkonsistenzen

6.3.2 Anfrage

III Anwendung und Diskussion

7 Anwendung

7.1 Rein qualitative Aussagen

7.2 Rein quantitative Aussagen

7.3 Inkonsistenz I: quantitativ/qualitativ

7.4 Inkonsistenz II: Reasoner-implizit/qualitativ

7.5 Inkonsistenz III: qualitativ/qualitativ

8 Diskussion der Arbeit

8.1 Abschlussbetrachtung

8.1.1 period names

8.1.2 Temporale Relevanz

8.1.3 Reasoning

8.2 Ausblick

IV Anhang

A XML Schema

A.1 periodNames.xsd

Zielsetzung & Themen

Die Arbeit befasst sich mit der Verbesserung der zeitlichen Annotation und des Information Retrievals im Semantic Web durch die Einführung eines flexiblen, qualitativen Modells für Zeiträume. Ziel ist es, computergestützte Systeme befähigen, umgangssprachliche zeitliche Begriffe und Relationen zu verarbeiten, ohne auf exakte quantitative Daten angewiesen zu sein.

Entwicklung des Modells "period names" zur qualitativen Repräsentation von Zeit.
Integration von unscharfen, persistenten und unbekannten zeitlichen Grenzen.
Definition einer formalen Basis für temporale Relevanz und Reasoning-Algorithmen.
Implementierung eines Reasoners zur Konsistenzprüfung und Beantwortung von Anfragen.
Evaluierung der Konzepte mittels praxisnaher Anwendungsbeispiele im Semantic Web.

Auszug aus dem Buch

1.1.1 Annotation mit Metadaten

Das Hinzufügen von zusätzlichen, beschreibenden Hinweisen an eine Webseite, Datenquelle oder allgemein eine beliebige Entität wird als Annotation bezeichnet, die Hinweise selbst als Metadaten („Daten über Daten“) [Las98].

Dieses Prinzip ist altbekannt und wird vielfältig verwendet; so finden sich auf jedem Buch Angaben über den Verfasser, den Verlag oder das Veröffentlichungsjahr, und jede Bibliothek führt Kataloge über die vorhandenen Bände, ihre Standorte (Stockwerk, Regal, Brett, . . .) oder Gattungen (Kinderroman, Sachbuch/Biologie, Lexikon, . . .). Gerade beim Auffinden eines Buches zu einem bestimmten Problembereich in einer riesigen Bibliothek ist die Art der erfassten Metadaten – in diesem Beispiel vor allem Schlüsselwörter und Kurzbeschreibungen – von besonderer Bedeutung.

Zusammenfassung der Kapitel

1 Einleitung und Motivation: Einführung in die Problematik der Informationssuche im World Wide Web und Motivation für den Einsatz von Metadaten und semantischen Technologien.

2 Annotation: Vorstellung der Basistechnologien wie XML, RDF und Dublin Core sowie Formulierung der Anforderungen an eine flexible temporale Annotation.

3 Temporale Repräsentation und temporales Schließen: Analyse bestehender mathematischer und logischer Modelle für Zeitpunkte und Intervalle, inklusive Allens Zeitlogik und Freksas Ansatz.

4 Das temporale Modell: period names: Einführung des eigenen Modells zur qualitativen Abstraktion von Zeiträumen durch intuitive Namen und flexible Grenzdefinitionen.

5 Temporale Relevanz: Definition und Berechnung der zeitlichen Relevanz für Anfragen, basierend auf dem Abstand und der Überschneidung von Perioden unter Berücksichtigung unscharfer Grenzen.

6 Reasoning: Entwicklung von Algorithmen für die Schlussfolgerung und Konsistenzprüfung, basierend auf den definierten Relationen und Grenzwerten.

7 Anwendung: Validierung der entwickelten Konzepte und des Reasoners anhand von praxisnahen Beispielszenarien und Inkonsistenzprüfungen.

8 Diskussion der Arbeit: Zusammenfassende Betrachtung der Ergebnisse sowie Ausblick auf zukünftige Erweiterungsmöglichkeiten und Integration in größere Systeme.

A XML Schema: Technische Dokumentation der XML-Struktur für die Definition der "period names"-Modelle.

Schlüsselwörter

Semantic Web, Annotation, Metadaten, Zeit, Zeitraum, period names, temporale Relevanz, Reasoning, XML, RDF, Dublin Core, Constraint-System, Wissensrepräsentation, Zeitlogik, Fuzzy-Logik.

Häufig gestellte Fragen

Worum geht es in dieser Diplomarbeit grundsätzlich?

Die Arbeit beschäftigt sich mit der Verbesserung der zeitlichen Annotation und des Retrievals im Semantic Web, um flexibler und benutzerfreundlicher mit Zeiträumen umgehen zu können.

Welche zentralen Themenfelder behandelt die Arbeit?

Die Schwerpunkte liegen auf der formalen Repräsentation von Zeit, der Modellierung von unscharfen Zeiträumen, der Berechnung zeitlicher Relevanz und der Implementierung von Schlussfolgerungsalgorithmen.

Was ist das primäre Ziel oder die Forschungsfrage?

Das Ziel ist die Schaffung eines Modells, das qualitative Aussagen über Zeit ermöglicht, damit auch umgangssprachliche zeitliche Informationen für Maschinen verständlich und abfragbar werden.

Welche wissenschaftliche Methode wird verwendet?

Es werden bestehende Modelle wie die Intervalllogik von James F. Allen und Freksas konzeptuelle Nachbarschaften analysiert, bewertet und durch ein eigenes, erweitertes Modell ("period names") modifiziert.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil umfasst die Konzeption des Modells, die Definition von Grenzarten, die Berechnung der temporalen Relevanz sowie die Implementierung eines Reasoners zur Konsistenzprüfung.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Begriffe sind Semantic Web, temporale Annotation, period names, Reasoning, XML, RDF und temporale Relevanz.

Was ist das Konzept "period names"?

Es ist ein Modell, das es erlaubt, Zeitintervalle mit bedeutungs-tragenden Namen zu definieren, statt sie nur über exakte numerische Datumsangaben zu beschreiben, wobei zudem unscharfe oder unbekannte Grenzen unterstützt werden.

Wie geht der Reasoner mit Inkonsistenzen um?

Der Reasoner prüft das Modell auf Widersprüche zwischen expliziten Angaben und implizit abgeleiteten Relationen und identifiziert inkonsistente Zustände, bei denen keine korrekte Beantwortung von Anfragen mehr möglich ist.

Final del extracto de 147 páginas - subir

Detalles

Título: Qualitative Abstraktion von Zeit für Annotation und Retrieval im Semantic Web
Universidad: University of Bremen (Technologie-Zentrum Informatik, Fachbereich Mathematik/Informatik)
Calificación: 1,0
Autor: Sebastian Hübner (Autor)
Año de publicación: 2004
Páginas: 147
No. de catálogo: V24541
ISBN (Ebook): 9783638273923
Idioma: Alemán
Etiqueta: Qualitative Abstraktion Zeit Annotation Retrieval Semantic
Seguridad del producto: GRIN Publishing Ltd.

Citar trabajo: Sebastian Hübner (Autor), 2004, Qualitative Abstraktion von Zeit für Annotation und Retrieval im Semantic Web, Múnich, GRIN Verlag, https://www.grin.com/document/24541

Qualitative Abstraktion von Zeit für Annotation und Retrieval im Semantic Web