II
Zusammenfassung
„Semantisches Web – State of the art und Entwicklungstrends“
von Manuel Kerstan
Die wahrscheinlich bedeutendste Erfindung nach dem Rad war die weltweite Vernet- zung der Menschen durch das Internet. Dadurch ist unsere Welt transparent und sehr kommunikativ geworden. Allerdings ist zu Beginn des 21. Jahrhunderts diese Entwicklung soweit vorangeschritten, dass die Menschheit im Datenaufkommen und Vielfalt zu ersticken droht. Unabhängig von dieser Vielfalt, beinhaltet das aktuelle In- ternet eine konzeptuelle Unzulänglichkeit. Diese liegt darin begründet, dass das Web im eigentlichen Sinne nur ein Transport- und Präsentationsmedium für Dokumente ist. Inhalte sind für Computer zwar lesbar, aber nicht „versteh- oder interpretierbar“. Suchanfragen verweisen via Volltexterkennung sehr häufig auf tausende „Treffer“, welchen aus Zeit- und Effektivitätsgründen nicht nachgegangen werden kann. Der Ruf nach einem „intelligenteren Internet“, welches Wissen, relevante Informationen und Lösungen statt tausender Dokumente liefert, wird immer lauter. Um diesen Prob- lemen zu begegnen, sollen die Visionen des Interneterfinders Tim Berners-Lee vom Semantischen Web ausführlich vorgestellt werden. Die Idee des Semantischen Webs ist, Informationen so aufzubereiten, dass Computer darauf algorithmisch arbei- ten und semantische Zusammenhänge automatisch ableiten können. Das bisherige Web soll dafür durch eine zusätzliche Schicht strukturierter Semantik erweitert wer- den. Hierzu ist zunächst Mehrarbeit menschlicher Autoren nötig, die ihre Informatio- nen mit einer geeigneten Sprache um eine semantische Beschreibung erweitern muss. Ist aber diese zusätzliche Arbeit getan - und es gibt auch schon Ansätze die- sen Prozess ansatzweise zu automatisieren - eröffnet sich mit der Realisierung des Semantischen Webs eine Fülle von faszinierenden, neuen Anwendungen. Erste Pro- totypen und erfolgreiche Projekte sollen in diesem Rahmen vorgestellt werden. Sie sind ein Vorgeschmack auf die künftige Internetnutzung. Diese Arbeit fokussiert ins- besondere Verfahren, mit welchen den Computern die Bedeutung der im Web ent- haltenen Informationen gelehrt werden können. State of the art und denkbare Ent- wicklungstendenzen sollen ergründet werden. Ergänzend wird eine gezielte Untersu- chung der momentan sehr populären und eher benutzerbetonten Web 2.0- Technologien vorgenommen. Sie soll die Frage klären, ob diese beiden auf den ers- ten Blick konträren Herangehensweisen zur selbsternannten „(R)evolution des
III
Webs“ wirklich differieren oder ausbaufähige Schnittstellen zum Semantischen Web existieren.
Abstract
„Semantic Web – State of the art and trends of development“
by Manuel Kerstan
The most important invention of the 20th century was the World Wide Web. Though
this our world became transparent and communicative. In the beginning of the 21 th
century the process of the development of this network produces a lot of data smog. Independently of this diversity it consist a gap of concept inside. It’s the fact that the internet itself is only a transportation and presentation medium. The contents are readable for PC´s, but not interpretable. A query refers thousands of hits, which can’t be all looked. There was a call for a more intelligent web, which provides relevant in- formation’s instead of thousands of documents. To solve the problems the ideas of Tim Berners-Lee, the inventor of the web, should be visualised. The idea of the Se- mantic Web is to prepare information’s that PC´s can work in semantic contexts. The web gets an additional Layer of a semantic structure, but this need the support of the human actor, who has to add a semantic description. This process could be auto- mated and with the realisation of the Semantic Web there are many and diverse uses. First projects and prototypes should be presented in this context. This work focuses practices which important information’s in the web could have for PC´s. State of the art and other tendencies should be fathomed. Accordingly there’s a focussed survey about actual and popular web 2.0 technologies. There should be answered if the first sight of contrary approach of the self-appointed “(r)evolution of the web” exist or if there are gateways to the semantic web.
IV
Inhaltsverzeichnis
Zusammenfassung II
Abstract III
Inhaltsverzeichnis IV
Einführung 5
1.1 Zielstellung Themenabgrenzung und Vorgehensweise 5
1.2 Problematik des Suchens und Findens im Internet 5
1.3 Motivationen und Ziele zur Entwicklung des Semantischen Webs 6
1 Technologien für ein Semantisches Web 9
1.4 Architektur des Semantischen Web nach Berners-Lee 9
1.5 Funktionsweise des Semantischen Web 11
Uniform Resource Identifier (URI) - Globale Namensgeber 11
1.5.1
RDF und RDFS einheitliche Syntax zur Beschreibung von Daten 12
1.5.2
Taxonomien Ontologien und Web Ontology Language (OWL) 14
1.5.3
SPARQL RDF Abfragesprache für semantische Suchen 16
1.5.4
1.6 Auswahl semantsicher Applikationen und Prototypen 16
Piggy Bank - semantische Suche und Anreicherung von Daten 17
1.6.1
Semantic Media Wiki erste freie Daten-Enzyklopädie 18
1.6.2
Friend of a Friend menschliche Netzwerke beschreiben 19
1.6.3
Web 2 0 3 0 vs Semantisches Web 19
1.7 Begriff und Charakterisierung des Web 2 0 Web 3 0 20
1.8 Technologien und populäre Anwendungen des Web 2 0 21
Tagging und Folksonomies gemeinschaftliches Indexieren 21
1.8.1
Mash-ups Kombination mehrerer Webseiten und -Services 22
1.8.2
AJAX Internetstandard für dynamische Seiteninhalte 23
1.8.3
Zusammenfassung der Ergebnisse und Ausblick 24
Abkürzungsverzeichnis 27
Literaturverzeichnis 28
Internetquellenverzeichnis 29
Anhangsverzeichnis 32 NA
5
Einführung
1.1 ZIELSTELLUNG, THEMENABGRENZUNG UND VORGEHENSWEISE
Diese Hausarbeit verfolgt den Anspruch, den aktuellen Entwicklungsstand des Inter- nets zu Beginn des 21. Jahrhunderts aufzuzeigen. Mit Fokus auf die Visionen des In- ternetbegründers Tim Berners-Lee vom Semantischen Web, soll dessen mögliche zukünftige Funktionsweise, Bedeutung und Potenzial untersucht werden. Ausgehend von der Problematik des Suchens und Findens im heutigen World Wide Web, soll die Zweckmäßigkeit eines solchen semantisch angereicherten Webs aufgezeigt werden [Kapitel 1]. Schlüssel zu solch einem echten Quantensprung im Internet, ist die zugrunde liegende Technologie. Aktueller Stand und erfolgreiche Anwendungen, insbesondere der Auszeichnungssprache zur Beschreibung von Wissensbeziehun- gen Resource Description Framework (nachfolgend RDF) und den damit erstellten komplexen Datenrepräsentationen in Form von Ontologien, sollen eingehend zum Verständnis der Funktionsweise des Semantischen Webs erläutert werden [Kapitel 2+Anhang]. Gegenstand der Untersuchung sind weiterhin die bewusst benutzerorien- tierten Technologien des so genannten "Web 2.0", die derzeit eine Wende im Netz- verständnis und –Nutzung einläuten. Eine Analyse bemerkenswerter Web 2.0- Technologien und –Anwendungen soll zeigen, welche Wechselwirkungen und Schnittmengen zum Semantischen Web bestehen und welche Erkenntnisse in die weitere Entwicklung semantischer Technologien einfließen könnten. [Kapitel 3 + An- hang].
Abschließend sollen die Ergebnisse zusammengefasst und offene Punkte für die weitere Zukunft des Semantischen Webs abgeleitet werden [Kapitel 4].
1.2 PROBLEMATIK DES SUCHENS UND FINDENS IM INTERNET
Fast jeder Benutzer des Internet kennt das Problem des oft zeitraubenden Suchens und tatsächlichen Findens im heutigen Internet. Man kann nie genau sagen, ob auch wirklich die beste Quelle für die Suchanfrage gefunden wurde oder nicht. Es bleibt keine andere Wahl, als sich auf die Suchalgorithmen von Suchmaschinen zu verlas- sen. Allerdings liefern diese für eine Suchanfrage bis zu mehrere tausend „Treffer“, welchen man theoretisch nacheinander einzeln nachgehen und nach Relevanz aus- werten müsste. Ursache ist eine durch den Benutzer nicht mehr überschaubare Da- tenflut im Internet. Unstrukturierte Daten und isolierte Informationen erschweren
6
massiv die Recherchen. Dieses Problem verschärft sich durch täglich neue Websei- tenpublikationen und ein oftmaliges Überlappen von Informationen bei der gängigen Volltextsuche. Viele Webseiten führen die Suchwörter eher zufällig auf, ohne dass diese im Kontext zur Anfrage stehen. Andererseits liefern einige Anfragen nur unzu- reichende Informationsquellen, wobei der Benutzer ahnt, dass es eine relevantere Wissensquelle gibt. Es gibt dabei nur ein Problem: besonders im Geschäftsleben Entscheidungen unter hohem Zeitdruck schnell und auf sicherer Informationsbasis zu treffen. In diesen Augenblicken wünschen sich fast alle Suchenden ein „intelligente- res Internet“, eines welches sogar Fragen direkt beantworten kann oder man die Hil- fe eines „virtuellen Agenten“ in Anspruch zu nehmen. Bei der Suchanfrage könnte dieser Eingrenzungen vorschlagen, womöglich aus Erfahrungen durch die Anfragen weltweiter Anwender, die bereits ein ähnliches Problem lösen mussten. Informatio- nen haben teilweise sehr viele Bedeutungen, die aber heute aufgrund fehlender Se- mantik von den Maschinen nicht oder nur fehlerhaft interpretiert werden können. Das benötigte Wissen verbirgt sich verteilt auf sämtlichen Rechnern und Datenbanken dieser Welt. Es geht um die Frage: „Wie könnte man diesen Problemen begegnen?“ Dieser möchte der Erfinder des World Wide Web Tim Berners-Lee und mit ihm ein Netzwerk von Wissenschaftlern des World Wide Web Consortiums (nachfolgend W3C) entgegnen. Sie arbeiten energisch an der Realisierung des „Semantischen Webs“.
1.3 MOTIVATIONEN UND ZIELE ZUR ENTWICKLUNG DES SEMANTISCHEN WEBS
Bei der Erfindung des Internet war für Tim Berners-Lee von Anfang an die Imple- mentierung von Links wichtig, um verschiedenste Seiten miteinander zu verknüpfen. Dies gelang mit den Hyperlinks, allerdings mit einem sehr geringen Informationsge- halt, da diese nur die Adresse der Seiten verraten, aber kaum etwas über deren In- halt oder Bedeutung aussagen. Von Bedeutung sind dabei die Metadaten - ergän- zende Daten meist im Kopf des Quellcodes, welche die Beziehung zweier verlinkter Seiten zueinander beschreiben können. Wenn zum Beispiel zwei Menschen ihre Webseiten verlinken, dann tun sie das, weil sie vielleicht als Kollegen oder Freunde zusammenarbeiten oder sie sich mit ähnlichen Themen beschäftigen. Menschen kennen die Bedeutungen der Links, Maschinen allerdings nicht. In diesen Bezie- hungsinformationen liegt aber ein enormes Potenzial. Das einbetten größerer Men- gen an Metadaten, ließ sich mit der Hypertext Markup Language allerdings nicht rea-
7
lisieren. 1 Das Semantische Web versucht Daten und nicht nur Dokumente zu vernet- zen, welche über das gesamte Netz und Datenbanken lose verstreut sind. Das W3C erklärte, dass das Web sein volles Potenzial nur ausschöpfen kann, wenn es ein Medium wird, in dem strukturierte und mit Bedeutung versehene Daten und Informa- tionen durch Maschinen und automatisierte Werkzeuge verarbeitet und ausgetauscht werden können, wie es bisher nur Menschen vermögen. Dabei können diese völlig unabhängig voneinander entwickelt worden sein. Um dies zu ermöglichen, wollen Berners-Lee (als leitender Architekt, Impulsgeber und Konsensvermittler) 2 , das W3C und eine Anzahl von externen Forschern und Industriepartnern das bisherige Web – was heute einem riesigen Buch mit verlinkten Dokumenten gleicht – in eine riesige verlinkte Datenbank umwandeln. 3 Bereits 1998 äußerte Berners-Lee, dass das „Kon- zept von maschinen-verständlichen Dokumenten keine magische künstliche Intelli- genz sei, die menschliche Belange versteht, sondern vielmehr bedeutet , dass Ma- schinen dadurch in der Lage sind, gut definierte Probleme mit gut definierten und ausgereiften Operationen auf Basis vorhandener gut definierter Daten zu lösen“ 4 . Das Wort „semantisch“ bedeutet dabei auch nicht, dass die Computer die Bedeutung von allem verstehen werden, aber dass die logischen Stücke der Bedeutung durch eine Maschine zu den nützlichen menschlichen Enden mechanisch manipuliert wer- den können. 5 Das Semantische Web soll also keineswegs ein eigenes Web werden, sondern eine Erweiterung des heutigen Webs.
In der Folge sollen Maschinen (Computer) und Menschen besser zusammenarbeiten können. Beispielsweise soll es möglich sein, dass Software-Agenten komplexe Auf- gaben für die Benutzer ausführen. Das W3C hat dabei die Aufgaben der Definition von Standards und Technologien übernommen. Sie sollen es erlauben, Daten im Web so zu definieren und verlinken, dass sie ihren jeweiligen Wissensbereich reprä- sentieren. Nachfolgend sollen die wichtigsten Ziele der Entwickler zur Realisierung der Visionen und daraus ableitbare Vorteile übersichtlich dargestellt werden. Das
1 Vgl. Berners-Lee, Tim: Weaving a Semantic Web, MIT Technologies Conference 2001; online unter: http://www.digitaldivide.net/articles/view.php?ArticleID=20; letzter Abruf 18.01.2007
2 Vgl. Frauenfelder, Mark: Das Unvollendete (Interview mit Tim Berners-Lee), in Technology Report, Ausgabe 11/2004, online unter: http://www.heise.de/tr/artikel/52516; letzter Abruf am 05.01.2007
3 Vgl. W3C: Official Semantic Web Definition, online unter: http://www.w3.org/2001/sw/; letzter Abruf 02.11.2006
4 Vgl. Berners-Lee, Tim: Semantic Web Road Map, online unter:
hppt://www.w3.org/DesignIssues/Semantic.html; letzter Abruf 25.11.2006
5 Vgl. Tauberer, Joshua: What is RDF?, online unter: http://www.xml.com/lpt/a/1665; letzter Abruf 03.03.2007
8
wirklich dahinter verborgene Potenzial der resultierenden Möglichkeiten und Anwen-
dungen lassen sich in Umfang und Tiefe derzeit noch sehr schwer erschließen. Die
hier dargestellten Möglichkeiten der Anwendung sind daher nur ein Ausschnitt des
Nutzenpotentials semantischer Technologien (siehe nachfolgende Übersicht).
9
1 TECHNOLOGIEN FÜR EIN SEMANTISCHES WEB
Im diesem Kapitel sollen die Schlüsseltechnologien zur Realisierung des Semanti- schen Web vorgestellt und beispielhaft erläutert werden. Der aktuelle Entwicklungs- stand der semantischen Webtechnologien (Anfang 2007) und erste nennenswerte Ergebnisse und Prototypen sollen das Nutzenpotenzial visualisieren und Verständ- nis für die Herangehensweise vermitteln. Es soll deutlich werden, auf welche Weise sich Semantik im Web einfach und dennoch sehr wirksam integrieren lässt.
1.4 ARCHITEKTUR DES SEMANTISCHEN WEB NACH BERNERS-LEE
Berners-Lee entwickelte zur Vision auch einen Vorschlag (keine statische Gebrauch- anweisung) einer siebenstufigen Schichten-Architektur als Bauplan des Semanti- schen Webs. (siehe nachfolgende Abbildung)
Die Schichten der Architektur sind so aufgebaut, das die jeweils obere Schicht eine Teilmenge der unteren ist. Diese Reihenfolge sollte bei der Entwicklung auch ein- gehalten werden, da eine stabile Ontologieumgebung aufgebaut werden soll. Die o-
10
beren Schichten machen von den jeweils unteren Gebrauch. Die Komplexität der Entwicklung steigt mit jeder Stufe. 1 Absolut elementar ist dabei das Fundament des Semantischen Web:
Unicode 2 und Unified Resource Identifier (nachfolgend URI), sowie die Auszeich- nungssprachen und Datenaustauschformate XML / XML Schema, Resource Descrip- tion Framework (nachfolgend RDF) und RDF- Schema (nachfolgend RDFS).
Zunächst wird, abstrakt betrachtet, mit Unicode und URI ein Raum im Web begrün- det, worauf mit Auszeichnungssprachen ganze Webseiten mit spezifischen Inhalten entstehen können. Sie stellen sicher, dass internationale Zeichensätze verwendet werden und stellen ein Medium zur Verfügung, um Objekte im Semantischen Web einheitlich zu identifizieren. XML, XML-Schema und deren Namensräume, ermögli- chen die Integration der semantischen Web-Definitionen mit anderen XML-basierten Standards. RDF und RDFS ermöglichen Aussagen über Objekte mit Hilfe der URIs. Außerdem kann man Vokabularien definieren, auf welche mittels URIs verwiesen werden kann. Hier erfolgt die Typisierung von Ressourcen und Beziehungen. Durch den Einsatz so genannter Ontologiesprachen wird es nun möglich, Daten nicht nur zu repräsentieren, sondern insbesondere für Maschinen verarbeitbar und interpre- tierbar zu gestalten. Dabei wird die Syntax der Auszeichnungssprachen XML/XML Schema für den effektiven Einsatz der RDF und RDFS verwendet. Um das zusätzli- che Wissen schichtenartig in den Code zu implementieren, wird ein entsprechendes Ontologie-Vokabular (4. Stufe) benötigt. Vergleichbar mit einem Katalog oder Glos- sar, beinhaltet dieses eine Vielzahl an Begriffen, deren Bedeutungen und vor allem die semantischen Beziehungen zwischen den einzelnen Ressourcen. Als einheitliche Sprache, wurde die Ontologiesprache Web Ontology Language (nachfolgend OWL) vom W3C entwickelt. Dieses Vokabular kann nach definierten Deduktionsregeln (Ru- les) der Logik (5. Stufe) von Suchmaschinen gefunden werden. Wenn Informationen zudem nach den Regeln des Beweises (Proof, 6. Stufe) ihre Richtigkeit behalten, können auf die Vertrauensschicht (Trust, 7. Stufe) überführt werden. Besonders die äußerst komplexen letzten drei Stufen deuten bereits heute auf ein auftretendes Problem des Semantischen Webs der Zukunft hin: die Glaubwürdigkeit der Daten. Der Endbenutzer hat dann keinen Einfluss mehr auf die Richtigkeit kombinierter Da-
1 Eberhart, Andreas: Ontology-based Infrastructure of Intelligent Applications (Disseration 2004); online
unter: http://scidok.sulb.uni-saarland.de/volltexte/2004/260/pdf/EberhartProfDrWolfgangWahlster.pdf;
2 Linkhinweis: http://www.unicode.org.
11
ten, da er die Quelle nicht einsehen kann. Dieses Vertrauen muss deshalb bereits
vor Weiterverwendung der Daten technisch erzeugt werden. 1
1.5 FUNKTIONSWEISE DES SEMANTISCHEN WEB
1.5.1 UNIFORM RESOURCE IDENTIFIER (URI) - GLOBALE NAMENSGEBER
Im Zusammenhang mit der Informationsgewinnung und gemeinsamen Nutzung von Informationen entsteht der Anspruch auf Kompatibilität und Flexibilität der Daten. Die richtige Verwendung von Daten und Informationen setzt voraus, dass den Daten auch die richtige Bedeutung zugewiesen wird und in weiterer Folge nicht nur vom
Menschen sondern auch von Maschinen interpretiert werden können. 2 Grundlegende Veränderung im Semantischen Web im Vergleich zum heutigen Internet ist, dass fast jedes Objekt als Ressource aufgefasst und mit Hilfe von URIs eindeutig benannt
werden kann. 3 Auf diese Weise können Suchbegriffe von Maschinen nicht nur im Volltext erkannt, sondern zur weiteren Verarbeitung wieder verwendet werden – ein entscheidender Gestaltungsgrundsatz für Daten im Semantischen Web. Eine Teil- menge der URIs sind die Uniform Resource Locator (nachfolgend URL). Klassische Web-Ressourcen wie Internetseiten, werden über eine eigene URL definiert. Sie ver- rät neben der Namensgebung auch den Aufenthaltsort (Host) der Webseite. URIs können die gleiche Syntax haben wie Webseiten durch URLs adressiert werden. In RDF-Bibliotheken wie http://www.w3.org /1999/02/22-rdf-syntax-ns#type können Ressourcen zusammenhängend definiert werden. Die Tatsache, dass sie wie Netz- adressen aussehen, ist dabei beiläufig. Die Möglichkeiten dieser Auszeichnungsform eröffnet ein nahezu unlimitiertes Spektrum und wird somit der Funktion als globaler Bezeichner absolut gerecht. Da URIs ziemlich lang sein können, werden sie in den RDF-Darstellungen normalerweise mit dem Konzept von Namensräumen von XML
abgekürzt. 4 Die Suche nach bestimmten Personen, Produkten oder Orten wird da- durch eineindeutig und verhindert zahllose vermeintliche „Treffer“ aufgrund des Missverstehens der Bedeutung der Suchbegriffe. So müssen Personen auch nicht zwangsläufig in Texten auftauchen, um gefunden zu werden. Sie können ebenso gut
1 Anmerkung: Um dies schon im Code zu realisieren, werden bereits ab der 3. Stufe (RDF), die
Technologie der Public Key Kryptographie angewendet. Diese elektronischen Signatur baut parallel
mit den genannten Stufen Vertrauen in das System (Trust) seitens der Anwender auf.
2 Vgl. Tusek, Jana: Semantic Web, Saarbrücken 2006, S. 15.
3 Siehe dazu Anhang 01 – Programmieren mit eindeutigen URI-Zuweisungen, S.28
4 Vgl. Tauberer, Joshua: What is RDF?, online erreichbar unter: http://www.xml.com/lpt/a/1665; letzter
Abruf 03.03.2007
12
in Beziehung zu bestimmten Seiten stehen oder über mehrere Dokumente verteilt
sein. Die semantische Verschmelzung von Objekten kann erst realisiert werden,
wenn Maschinen ihre Zuordnung eindeutig interpretieren können. Somit wird auch
aktiv gegen das Problem der Mehrdeutigkeit von Begriffen interveniert.
1.5.2 RDF UND RDFS – EINHEITLICHE SYNTAX ZUR BESCHREIBUNG VON DATEN
Um die Beziehungen der einzelnen Ressourcen zueinander zu beschreiben, benötigt
man eine weltweit einheitliche formale Syntax, welche im Endeffekt eine automati-
schen Informations- und Datenverarbeitung ermöglicht. 1 Unter der Leitung des W3C wurde dafür die Auszeichnungssprache für Metadaten
RDF entwickelt und 2004 standardisiert. Sie soll es Entwicklern erleichtern, Wissen
und Beziehungen zu codieren und dabei einheitlich nach einem Musterschema vor-
zugehen. RDF als Fundament des Semantischen Webs, muss entsprechend stabil,
weitestgehend lückenlos, durchdacht und sorgfältig getestet sein. Müssen Änderun-
gen im Fundament vorgenommen werden, kann dies schwerwiegende Änderungen
in den darauf aufbauenden Standards und Applikationen nach sich ziehen.
Das RDF-Modell basiert vereinfacht auf einem gerichteten und beschrifteten Graph
(siehe nachfolgende Abbildung), welcher in RDF-Browsern auch auf diese Weise
Beziehungsnetze visualisieren kann.
Die Endpunkte repräsentieren dabei jeweils die in Beziehung gesetzten Ressourcen,
der beschriftete und gerichtete Graph die entsprechende Beziehung oder Eigen-
schaft mit ihrem definierten Namen (durch URI). 2 Die Eigenschaften sind also selbst Ressourcen und müssen über eine eigene URI-Referenz verfügen. Diese URI ver-
weist auf den so genannten RDF-Namensraum. Der Namensraum stellt ein Vokabu-
lar der Eigenschaften in Form einer Menge von RDF-Ressourcen bereit (somit ver-
1 Vgl. Fensel, Dieter (Hrsg.) / Hendler, James / Lieberman, Henry: Spinning the Semantic Web –
Bringing the World Wide Web to Its Full Potential; MIT Press, Cambridge 2005, S. 51.
2 Herman, Ivan: Questions and answers on the Semantic Web; online unter:
http://www.w3.org/2006/Talks/0927-Berlin-IH/Slides.html, letzter Abruf 13.02.2007.
13
besserte Wiederverwendbarkeit und Wartbarkeit) und beschreibt deren Bedeutun-
gen. 1 Zwei miteinander durch eine Eigenschaft verbundene Ressourcen werden als eine
RDF-Aussage bezeichnet. Sie können als einfacher Satz mit Subjekt (Ressource A),
Prädikat (Ressource B - Eigenschaft, Typ) und Objekt (Ressource C) aufgefasst
werden. So können durch das Zusammenfügen vieler kleiner Sätze auch komplizier-
te Sachverhalte dargestellt werden. 2
RDF liefert somit eine flexible Methode, um jedes mögliche Wissen in kleine Stücke
(so genannten Triples) zu zerlegen, mit eigenen Richtlinien über die Semantik jener
Stücke. 3 Mit einem Triple kann auf semantische Art ein Objekt, Konzept oder Wert mit einem anderen in Beziehung gesetzt werden.
Mit der RDF-Standard-Familie werden zwei Namensräume vorgegeben, die ein Ba-
sisvokabular zur Erstellung und Beschreibung eigener Konstrukte bereitstellen und
die für RDF notwendigen Strukturen beschreiben. 4 Zusammen bilden die das RDF- Kernvokabular (auch Core genannt). Jede Anwendung des Semantischen Webs soll-
te sich laut W3C an diesem Kernvokabular ausrichten und darauf operieren können.
Dieses Dataset muss für Maschinen serialisiert werden, was auf Empfehlung des
W3C in XML in Form von RDF/XML 5 oder anderen Formaten wie Turtle, Notation 3, N-Triple, TriG oder Trix verlustfrei, das heißt vollständig kompatibel und standardi-
siert, erfolgen kann. Somit gewährleistet RDF erst die notwendige Interoperationalität
zwischen den Anwendungen, die maschinen-verständliche Informationen im Web
austauschen. RDF und XML sind dabei komplementär zueinander. 6 Ingesamt beste- hen drei Möglichkeiten RDF-Aussagen darzusstellen: die Tripledarstellung, der ge-
richtete Graph oder in RDF/XML-Syntax. 7 Wenn man aus seinen Daten einen RDF- Graph abgeleitet hat, kann man nun via eindeutiger URI zusätzliche Daten, die zum
1 Anmerkung: RDF-Namensräume haben also eine größere Bedeutung als bei XML.
2 Tolle, Karsten: Semantisches Web und Kontext – Speicherung von und Anfragen auf RDF-Daten
unter Berücksichtigung des Kontextes (Diss.), Frankfurt am Main, 2006, S. 13.
3 Vgl. Tauberer, Joshua: What is RDF?, online erreichbar unter: http://www.xml.com/lpt/a/1665,
letzter Abruf 03.03.2007
4 Anmerkung: RDF-Namensraum http://www.w3.org/1999/02/22-rdf-syntax-ns# (Abkürzung rdf, enthält
Basis-RDF-Konstrukte); RDF-Schema-Namensraum http://www.w3.org/2000/01/rdf-schema# (Ab
kürzung rdfs, Namensraum zur Erstellung eigener Vokabularien).
5 Anmerkung: Entwicklung vom W3C; festgelegt in W3C Syntax 2004; Linkhinweis: Beckett, Dave:
RDF/XML Syntax Specification (Revised). W3C Working Draft ; online unter:
www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210.
6 Anmerkung: Die XML Syntax ist dabei allerdings nur eine mögliche Variante für RDF. Die Entwick-
lung anderer RDF-Datenmodelle ist nicht ausgeschlossen, denn Ziel ist es möglichst viele
verschiedene Datenquellen, vor allem relationale Datenbanken im Web semantisch zu integrieren.
7 Siehe dazu Anhang 02 – RDF-Aussage in drei Darstellungsformen Graph, Triple und RDF/XML, S.29
14
Kontext gehören, in Verbindung setzen. Auf diese Weise wird nach und nach ein
semantisches Netz gesponnen. 1 Wie die meisten objektorientierten Programmiersprachen hat auch RDF ein Klassen- system. Eine Sammlung von RDF-Klassen wird als RDF-Schema bezeichnet. Diese Klassen sind in einer Hierarchie angeordnet und bieten somit Möglichkeiten der Er-
weiterung und Verfeinerung der Beziehungsbeschreibungen in Unterklassen an. 2 Durch RDFS ist es möglich eigene Eigenschaften, Klassen oder weitere RDF- Konstrukte zu beschreiben. Es wird dadurch jedem ermöglicht, sich ein eigenes Vo- kabular zu definieren, zu nutzen und zu veröffentlichen. Dabei muss nicht jedes mal ein neues Schema gefunden werden, sondern Entwickler können sich an den von W3C standardisierten Basis-Schemen orientieren und diese schrittweise an eigene Vorstellungen modifizieren. Durch die simultane Benutzbarkeit der RDF-Basis- schemen wird die Wiederverwendbarkeit von Metadaten für standardisierte Bezie-
hungen unterstützt. 3 Die Standards sind heute soweit ausgereift, dass jeder Entwick- ler damit beginnen kann RDF-basierte Applikationen zu entwickeln. Die Einfachheit und die Flexibilität der Triples in Verbindung mit dem Gebrauch von URIs macht RDF
sehr leistungsfähig. 4
1.5.3 TAXONOMIEN, ONTOLOGIEN UND WEB ONTOLOGY LANGUAGE (OWL)
RDFS ist sehr nützlich, kann aber nicht alle semantischen Anforderungen von Soft-
ware erfüllen. Auf der nächsten und zugleich komplexeren Stufe des Semantischen Webs, werden Ontologien gebildet. Eine Ontologie ist definiert als ein formales, d.h. maschinenverständliches, definiertes System aus einer Vielzahl von Instanzen, Kon-
zepten und Relationen zwischen diesen Begriffen. 5 Es ist in der Lage eine ganze Reihe von RDFS, die einen komplexen Wissens- oder Fachbereich und deren Be-
ziehungen beschreiben und als Konzept zusammenfassen. 6 Laut der Definition des Protégé-Teams stellt eine Ontologie das Vokabular für eine Domäne zur Verfügung inklusive den Bedeutungen dieser Begriffe und beschreibt Konzepte und Beziehun-
2 Anmerkung: Beispiel: rdf:Roman subclass of rdf:Literatur in einer Bibliothek
3 Vgl. W3C Recommendation: Resource Description Framework (RDF) Model and Syntax Specificati-
ons.; online unter: http://w3.org/TR/1999/REC-rdf-syntax-19990222, letzter Abruf 27.02.2007
4 Siehe Anhang 04 – State of the Art der RDFS-Entwicklung, S.36
5 Vgl. Wikipedia – Semantisches Web, online unter: http://www.wikipedia.org/wiki/SemantischesWeb,
letzter Aufruf 12.03.2007
6 Siehe Anhang 05 – Beispiel für eine Ontologie, S. 37
Arbeit zitieren:
Diplom-Kaufmann Manuel Kerstan, 2007, Semantisches Web, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formulierungsmuster in der 'Geblümten Rede'
Philosophie - Theoretische (Erkenntnis, Wissenschaft, Logik, Sprache)
Hauptseminararbeit, 32 Seiten
Mentale Repräsentation - Vorzüge und Nachteile von Jerry Fodors Theori...
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Referat (Ausarbeitung), 9 Seiten
Wittgenstein über das Bewusstsein (PU 412 – 427)
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Hauptseminararbeit, 17 Seiten
Neurowissenschaften und Philosophie
Zur Diskussion über die geford...
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Magisterarbeit, 101 Seiten
The spiral of silence - Über die Theorie der „Schweigespirale“ von Eli...
Medien / Kommunikation - Theorien, Modelle, Begriffe
Seminararbeit, 18 Seiten
Anomaler Monismus als Lösung für das Leib-Seele-Problem?
Hausarbeit, 18 Seiten
Inneres ist Äußeres. Ludwig Wittgenstein über das Leib-Seele-Problem
Philosophie - Theoretische (Erkenntnis, Wissenschaft, Logik, Sprache)
Hauptseminararbeit, 31 Seiten
Ein Versuch der Anwendung von Kants Deduktion der reinen ästhetischen ...
Philosophie - Philosophie des 17. und 18. Jahrhunderts
Seminararbeit, 18 Seiten
Durch das Schöne zum Selbstbewusstsein
Wie durch die ästhetische Betr...
Philosophie - Philosophie des 17. und 18. Jahrhunderts
Hauptseminararbeit, 22 Seiten
Zur Stellung von Philosophie und Neurowissenschaften
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Seminararbeit, 17 Seiten
Die vermeintliche Revolution Darwins bei Daniel C. Dennet
Anmerkungen zu Dennetts "...
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Essay, 14 Seiten
Bewusstsein - Aspekte der Philosophie des Geistes
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Magisterarbeit, 108 Seiten
Haben Bienen wirklich Empfindungen?
Zu Michael Tyes Repräsentation...
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Hauptseminararbeit, 21 Seiten
Das Problem vollständigen Wissens - Eine Kritik an Frank Jacksons Argu...
Philosophie - Philosophie des 20. Jahrhunderts / Gegenwart
Hauptseminararbeit, 31 Seiten
Manuel Kerstan's Text Semantisches Web ist nun auf dem Buchmarkt erhältlich
Manuel Kerstan hat den Text Semantisches Web veröffentlicht
Manuel Kerstan hat einen neuen Text hochgeladen
Planung ingenieurwissenschaftlicher Qualifizierung mit Semantik-Web-Wi...
Carsten Reise, Günther Seliger
Web Services, E-Business, and the Semantic Web
CAiSE 2002 International Works...
Christoph Bussler, Richard Hull, Sheila A. McIlraith, Maria E. Orlowska, Barbara Pernici, Jian Yang
Aspecten Van de Woordvolgorde in Het Nederlands. Een Syntactische, Sem...
P. Godin, Godin Ap
Les Moyens Techniques de L'Art: Portee de la Sociologie Musicale de Ma...
Philippe Despoix, Nicolas Donin, Jean Molino
0 Kommentare