Semantic Web - Architektur und Status Quo


Term Paper, 2009

40 Pages


Excerpt


Inhaltsverzeichnis

1 Einführung

2 Grundlagen des Semantic Webs
2.1 Semantische Lücke
2.2 Definition Semantic Web
2.3 Architektur des Semantic Webs
2.3.1 URI/IRI
2.3.2 XML (eXtensible Markup Language)
2.3.3 RDF (Resource Desription Framework)
2.3.4 Ontologien
2.3.5 SPARQL.
2.3.6 Proof, Trust
2.4 Semantic Web Services.

3 Good Practices – Semantic Web im Einsatz
3.1 Yahoo! SearchMonkey.
3.2 DBpedia – Semantisches Wikipedia

4 Fazit

Abbildungsverzeichnis

Abbildung 1: Schichtenmodell des Semantic Web

Abbildung 2: RDF-Triple „Mutter pflegt Kind“

Abbildung 3: Open Data Cloud - Quellen vernetzter Daten

Abbildung 4: Semantische Treppe

Abbildung 5: Web Service Standards

Abbildung 6: Yahoo SearchMonkey Ergebnisanzeige

Abbildung 7: DBpedia Mobile mit Kartenansicht

1 Einführung

Das Internet steht vor einer neuen Entwicklungsphase, die es Computern in naher Zukunft ermöglicht, Informationen im Web eine formale Bedeutung zuzuschreiben. Die Bedeutung von Daten kann unter Verwendung derzeitiger Informationstechnologien zum größten Teil nur von Menschen interpretiert werden. Zum Beispiel kann die Farbe Rot bei einem Menschen nur deshalb eine Signalwirkung auslösen, weil der Mensch Assoziationen bilden kann, die auf seinen persönlichen Erfahrungen und Weltbildern basieren. Für den Computer bleibt die Farbe Rot lediglich eine Dezimal- oder Hexadezimalzahl.[1] Diese unterschiedliche Interpretationsvielfalt von Informationen bestimmt die Störanfälligkeit des Kommunikationsprozesses zwischen Mensch und Computer. Das World Wide Web (WWW) konnte sich trotz, oder vielleicht gerade wegen der unterschiedlichen Art und Weise wie Mensch und Computer Informationen miteinander austauschen, zu einem Massenmedium entwickeln. Die Informations- und Kommunikationstechnik konnte die Beherrschung der komplexen Mensch-Computer-Kommunikation in den letzten Jahren durch intelligentere, computergestützte Informationssysteme und verbesserter Schnittstellen erheblich steigern. Weitere Gründe führten zu einer neuen Gesellschaftsstruktur, die auf Netzwerken beruht: Die Bedürfnisse der Wirtschaft nach flexiblem Management und Globalisierung von Kapital, Produktion und Handel; Die Forderung der Gesellschaft nach individueller Freiheit und offener Kommunikation; und die außerordentlichen Fortschritte in der Mikroprozessortechnik. Ende des zweiten Jahrtausends hatte sich das Internet explosionsartig entwickelt und strukturiert mittlerweile wirtschaftliche, gesellschaftliche und politische Kernaktivitäten.[2] Komplexere und anspruchsvollere Aufgaben der Benutzer stehen immer mehr Möglichkeiten gegenüber, das Zusammenleben und Wirtschaften zu vereinfachen beziehungsweise effektiver zu gestalten. Neue Geschäftsmodelle haben die technologischen Fortschritte aufgegriffen und nutzen das Internet als eine Basis-Technologie des elektronischen Handels. Der gegenwärtige Wandel von der Dienstleistungsgesellschaft zur Informationsgesellschaft drückt sich in zunehmender Vernetzung von Menschen, Institutionen, Web-Anwendungen und Inhalten aus, und wird in Zukunft durch semantische Technologien zu einer Wissensgesellschaft fortschreiten.

Diese Vernetzung gepaart mit der Offenheit des Internets als Informationsraum, führt zu einer Revolution im Management, weil Fortschritte in der Informationstechnologie die sehr genaue Messung von Marktveränderungen ermöglichen können.[3] Das Wachstum des Internets im letzten Jahrzehnt, und die daraus entstandenen Möglichkeiten für den Zugang zu Informationen, sowie die erfolgreich geführten Geschäftsmodelle im E-Commerce, begründen sich in der Einfachheit des Internets. Allerdings ist es auch die Einfachheit, welche einen weiteren Wachstumsschub erheblich erschwert.[4] An dieser Stelle erreichen wir die Schwelle zum Semantic Web.

Das Semantic Web (WWW-Diktion „Web 3.0“) zielt auf eine erheblich erweiterte digitale Kodierung kommunizierter Inhalte ab, welche das Wirtschaften von Unternehmen, ausgehend vom derzeitigen Internet, weiter effektiviert. Digitale Informationen werden mit formaler Bedeutung ergänzt, die es Computern ermöglicht, sinnvolle Zusammenhänge zwischen Daten zu erkennen und dadurch den Nutzer bei der Navigation durch große Datenbestände und dem Auffinden von relevanten Informationen unterstützt. Intelligentere und nutzerorientierte Web-Anwendungen werten dadurch den Kommunikations- prozess in sozialen Netzwerken, Anbietern, Nachfragern, Geschäftspartnern und Applikationen enorm auf.

Diese Arbeit gliedert sich in die Hauptbereiche Grundlagen, Praxisbeispiele und Fazit. Aufgrund der sehr aktiven Bewegung in der aktuellen Forschung um das Semantic Web, welche sich in einer Reichhaltigkeit von wissenschaftlichen Publikationen ausdrückt, wird der vorliegende Inhalt keineswegs Anspruch auf Vollständigkeit erheben können. Vielmehr wird ein komprimierter Einblick in das weit gespannte Forschungsfeld des Semantic Webs gewährt, um Perspektiven für die Zukunft des Internets zu eröffnen.

2 Grundlagen des Semantic Webs

Dieses Kapitel ist eine Einführung in die theoretischen Grundlagen des Semantic Webs und bereitet das Verständnis zur Funktionsweise der Praxisbeispiele vor. Vorausgesetzt wird die Kenntnis über grundlegende Begriffe aus der Informatik. Welche Motive stehen hinter dem Semantic Web? Wie funktioniert das Semantic Web aus technologischer Sicht und wie sehen Szenarien im Einsatz aus? Um diese Fragen zu beantworten wird ein Blick in die Theorie der Informatik geworfen und es werden etablierte Ergebnisse von Forschungsgruppen vorgestellt.

2.1 Semantische Lücke

Die geistigen Fähigkeiten des Menschen und die komplexen Zusammenhänge der Welt in der er lebt, lassen sich nicht von automatisierten Computermodellen vollständig abbilden. Die Informatik definiert zu dieser Problematik den Begriff „Semantische Lücke“, welche bei der Beschreibung eines Sachverhalts durch die Verwendung unterschiedlicher Repräsentationsformen (Sprache) entsteht. Für die Entwicklung informationstechnischer Systeme ist es also das Ziel, die umgangssprachliche Formulierung aus der realen Welt, in eine formalisierte, automatisiert reproduzierbare und verarbeitbare Repräsentation von Informationen zu überbrücken. Eine sehr hohe Abstraktion der realen Welt ist oftmals Voraussetzung, damit ein realer Sachverhalt in eine eindeutige maschinenverständliche Sprache übersetzt werden kann. Diese Abstraktion der realen Welt hat die Hermeneutik (Lehre des Verstehens) zu einem Korrektiv verleiten lassen und betont, dass mittels der Sprache als „poröse“ Grundlage zwar auch das Semantic Web gewebt werden kann[5], allerdings aufgrund der Endlichkeit und Offenheit menschlichen Existierens all jene begrifflichen Anstrengungen der Informationstechnik nicht zu dem Irrglauben führen sollten, es gäbe „da draußen“ eine Welt von Bedeutungen „an sich“, die im digitalen Netz eindeutig abgebildet oder repräsentiert werden können.“[6] Gleichwohl gilt das Semantic Web derzeit in Fachkreisen als technologische Revolution mit dem Potenzial, dass die „Semantische Lücke“ durch eine maschinenverständliche Bedeutungsebene leichter überbrückt werden kann. Methoden der künstlichen Intelligenz könnten zwar auch herangezogen werden, um kognitive Aufgaben bis zu einem gewissen Grade von Computern übernehmen zu lassen, allerdings lassen die erreichten Resultate in diesem Forschungsfeld eine webweite, zuverlässige Anwendung sehr fragwürdig erscheinen.[7] Eine alternative Herangehensweise wäre das Semantic Web. Im Unterschied zur künstlichen Intelligenz werden Informationen im Semantic Web von vornherein machinenverständlich zur Verfügung gestellt, um anschließend von Maschinen eindeutig interpretiert werden zu können.

2.2 Definition Semantic Web

In diesem Kapitel werden zwei Definitionen vorgestellt, die das Semantic Web aus jeweils zwei verschiedenen Perspektiven betrachtet. Tim Berners-Lee unterstreicht den Aspekt der „Erweiterung des vorhandenen Internet“ und Andreas Blumauer die „Reduzierung der Transaktionskosten“. Die Idee des Semantic Webs stammt von Tim Berners-Lee, dem Erfinder des „World Wide Web“ (WWW) und Leiter des World Wide Web Consortium (W3C)[8]. Sein viel zitierter Satz aus der Zeitschrift „Scientific American“ (Mai 2001) hat bis heute kein Stück an aktueller Brisanz verloren:

„The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.“[9]

Berners-Lee bekräftigt in dieser Aussage den Zusammenhang zwischen derzeitigem Web und Semantic Web durch den Begriff der „Erweiterung“. Die Erweiterung basie]rt auf den etablierten Standards des bestehenden Internets, welche nicht durch neue Standards ersetzt werden, sondern auf ihnen aufbauen. Andreas Blumauer beschreibt das Semantic Web aus einer ökonomischen Perspektive indem er den Einfluss auf die Transaktionskosten beschreibt:

„Das Semantic Web ist ein globales Projekt, um Transaktionskosten durch den Einsatz von syntaktischen und semantischen Übereinkünften zu reduzieren, die aufgrund der unverbindlichen Form der inhaltlichen Organisation im bestehenden HTML- dominierten WWW im Zuge jeglicher Bedeutungsübertragung entstehen“ Transaktionskosten, als Kosten der wirtschaftlichen Interaktion von Unternehmen (Informationsgewinnung, Anbahnungskosten, Vereinbarungs- kosten),[10] können nach Blumauer durch eine zielgerechtere Informationsverteilung und Bedeutungsübertragung reduziert werden. Er bestimmt jene Transaktionskosten als reduzierbar, welche durch die Kommunikation über das derzeitige Web (HTML-dominiert) entstehen.

Fehlende Übereinkünfte in der Form, wie Informationen repräsentiert werden, führen zur Ausfilterung bedeutungstragender Informationen durch jedes Individuum und schließlich zu Transaktionskosten in der Informations- gewinnung. Das Semantic Web stellt technologische Lösungen bereit, um syntaktische und semantische Übereinkünfte in der Repräsentation von Informationen zu generieren und computergestützt zu verarbeiten. In Folge dieser technologisch unterstützten Übereinkünfte werden Information- sasymmetrien und Transaktionskosten sinken.

2.3 Architektur des Semantic Webs

Die syntaktischen und semantischen Übereinkünfte können nur durch offene Standards erreicht werden, die vom World Wide Web Consortium (W3C) vorgeschlagen werden. Solche Übereinkünfte in der Beschreibung von Informationen bestimmen die Interoperabilität, eine Fähigkeit, Informationen zwischen Web-Anwendungen auszutauschen. Das W3C entwickelt einheitliche Technologien, die den Fortschritt des Webs im ganzen, sowie des Semantic Webs im speziellen, durch eine Architektur sicherstellt:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Schichtenmodell des Semantic Web. Quelle: W3C[11]

2.3.1 URI/IRI

URIs (Uniform Resource Identifiers) identifizieren abstrakte und physikalische Ressourcen im Web und dienen einer eindeutigen Adressierung. Somit können durch eine Zeichenfolge Webseiten, digitale Daten, Web-Anwendungen oder auch E-mail Empfänger adressiert werden.[12] Zum Beispiel ist eine Webadresse wie „http://www.google.de“ ebenso eine URI wie die Emailadresse „mailto:John.Doe@example.com“. Webadressen werden auch URLs bezeichnet und zusammen mit URNs (Uniform Resource Names) URIs zugeordnet. URNs finden Verwendung für die Identifizierung einer Ressource durch einen vorhandenen oder frei verfügbaren Namen. Die strikte Trennung zwischen URNs und URLs wurde mittlerweile allerdings aufgehoben, da es einige URIs gibt, die weder URLs noch URNs zugeordnet werden können. IRIs (Internationalized Resource Identifiers) erlauben es, internationale Zeichensätze in URIs zu verwenden. URIs/IRIs werden in RDF[13] Graphen eingesetzt, um Ressourcen zu verbinden und stellen damit eine wichtige Komponente im Semantic Web dar. RDF wird im Kapitel „RDF“ eingehend erläutert.

2.3.2 XML (eXtensible Markup Language)

XML ist gleichermaßen wie der URI/IRI Standard im engeren Sinne nicht speziell dem Semantic Web zuzuordnen sondern eher dem klassischen Web. Dieser Zusammenhang hebt die Vision von einem „erweiterten und nicht eigenständigen Web“ auf eine operable Ebene, indem etablierte Standards wie XML oder URI/IRI als Basis-Technologien erhalten bleiben und durch zusätzliche Komponenten erweitert werden. XML ist eine Markup-Sprache und dient dazu, Textteile in einem Dokument auszuzeichnen, beziehungsweise zu annotieren. Mittels einer Auszeichnungssprache können Dokumente durch beschreibende Informationen ergänzt und spezifiziert werden. Software- Programme (z.B. Web-Browser) erhalten durch die Auszeichnungen Anweisungen, wie Dokumente dargestellt werden sollen.

Beispiel einer Auszeichnung von Text in XML:

Kapitel Kapitel 2/Kapitel beschreibt Grundlagen des Thema Semantic Webs /Thema XML bietet im Gegensatz zu HTML die Möglichkeit zur Definition von benutzereigenen Formatierungsanweisungen, welche in HTML auf eine bestimmte Menge von Auszeichnungsformaten (Tags) begrenzt sind.[14] Auszeichnungen z.B. Textformatierungen werden bei der Verwendung von XML-Dokumenten in einer XSL-Datei ausgelagert. XML-Dokumente können eine flexible Struktur beinhalten und grenzen sich damit von der festen Struktur in HTML ab. Die Struktur wird mit einer ausgelagerten DTD (Document Type Declaration) beschrieben und kann zu einer Vereinbarung eines individuellen Standard für den Austausch von Daten zwischen Sender und Empfänger beitragen. Die DTD wird im Laufe seiner Weiterentwicklung vom XML-Schema verdrängt, aufgrund reichhaltigerer Möglichkeiten in den Vorgaben.[15] Diese Eigenschaften machen XML zu einem universellen Austauschformat, welches Daten aus unterschiedlichen Darstellungsweisen neutralisiert und computergestützt verarbeitet. Innerhalb von Unternehmen und deren Datenaustausch zwischen Kunden und Lieferanten ist XML nicht mehr wegzudenken, weil es heterogene Systemlandschaften miteinander harmonisiert und somit einen strategischen Faktor für die Wettbewerbsfähigkeit darstellt. In Bezug auf das Semantic Web reicht XML alleine nicht aus, um Dokumente in der Art und Weise auszuzeichnen, damit Computer Zusammenhänge und explizites Wissen herleiten können. Nur die Hierarchie der Inhalte in einem XML-Dokument, dargestellt in einer Baumstruktur, kann als Indikator für einen formalen Bedeutungszusammenhang dienen. Ein Tag mit dem Namen „Mutter“ und ein anderes Tag mit dem Namen „Kind“ wird hingegen für den Computer in reinem XML zu keiner Schlussfolgerung wie z.B. einer Verwandtschaft führen. Eine Herangehensweise wäre, alle Bedeutungen von Tags zu definieren, um sie bei Bedarf nachschlagen zu können. Abgesehen von der Flut an Datenbeständen, die jeden Kontext von Tag-Kombinationen definieren müssten, könnten diese Nachschlagewerke (Glossare) nur von Informatikern und Entwicklern verwendet werden.[16] Praktischer ist es die Bedeutung von Inhalten von vornherein maschinenlesbar auszuzeichnen, ohne die genannten Vorteile des XML-Formats zu verlieren. Das W3C spezifiziert RDF als Sprache für die formale Beschreibung von Bedeutungen, um Inhalte im Web, strukturiert (semantisch annotiert) darzustellen.

[...]


[1] Vgl. McKelvey, R.: Hypergraphics, Design und Architektur von Websites, Hamburg 2000, S.48

[2] Vgl. Castells, M.: The Internet Galaxy, Reflections in Internet, Business and Society, Oxford University Press 2001, S.11

[3] Vgl. Müller-Stewens, G., Fleisch, E.: Die Macht über Informationen. In: Harvard Business Manager, o. Jg (2008), S.39

[4] Vgl. Fensel, D. Et al: Spinning The Semantic Web. Bringing the World Wide Web to its Full Potential, London 2003, S.3

[5] Vgl. Putman H.: Represäntation und Realität. Frankfurt am Main, 1991

[6] Capurro, R.: Hermeneutik Revisited, in: Pellegrini, T; Blumauer, A.: Semantic Web. Wege zur Wissensgesellschaft. Berlin 2006, S. 531

[7] Vgl. Hitzler, P. Et al.: Semantic Web – Grundlagen. Berlin 2008, S. 9

[8] Homepage des W3C: http://w3c.org. Aufgerufen am 14.11.2008

[9] Berners-Lee, T., Hendler, J., Lassila, O.: The Semantic Web.A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 2001. Online verfügbar: www.sciam.com/article.cfm?id=the-semantic-web

[10] Die Bedeutung der Kosten wirtschaftlicher Interaktion von Unternehmen wurde von Ronald Coase durch seinen Artikel „The nature of the firm“ (1937) initiert und durch Oliver E. Williamson weiter vertieft, indem er Einflussgrößen auf die Höhe der Transaktionskosten bestimmt hat (1971).

[11] Schichtenmodell des Semantic Web, Erstellt vom W3C (2004):http://www.w3.org/2007/03/layerCake.png. Aufgerufen am 25.11.2008

[12] Vgl. W3C Spezifikation für URI/IRI: http://www.w3.org/Addressing/. Aufgerufen am 25.11.2008

[13] Vgl. Becket, D.: RDF/XML Syntax Specification (Revised), W3C, 2004, http://www.w3.org/TR/rdf-syntax-grammar/. Aufgerufen am 25.11.2008

[14] Vgl. W3C Spezifikation für XML: http://www.w3.org/TR/2006/REC-xml-20060816/. Aufgerufen am 27.11.2008

[15] Vgl. Rothfuss, G., Ried, Ch., Content Management mit XML – Grundlagen undAnwendungen, 2. Auflage, Berlin-Heidelberg 2003, S.231f

[16] Hitzler, P. Et al.: Semantic Web – Grundlagen. Berlin-Heidelberg 2008, S.28.

Excerpt out of 40 pages

Details

Title
Semantic Web - Architektur und Status Quo
College
Fachhochschule Bonn-Rhein-Sieg
Course
Wirtschaftsinformatik
Author
Year
2009
Pages
40
Catalog Number
V121172
ISBN (eBook)
9783640252275
ISBN (Book)
9783640252312
File size
921 KB
Language
German
Keywords
Semantic Web, Web 3.0, Linked Data, RDF, Ontologien, Social Semantic Web
Quote paper
Thomas Werres (Author), 2009, Semantic Web - Architektur und Status Quo, Munich, GRIN Verlag, https://www.grin.com/document/121172

Comments

  • No comments yet.
Look inside the ebook
Title: Semantic Web - Architektur und Status Quo



Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free