Häufig gestellte Fragen zum Semantic Web
Was ist das Semantic Web und welche Ziele verfolgt es?
Das Semantic Web erweitert das World Wide Web (WWW) um semantische Inhalte, die es Maschinen ermöglichen, Informationen besser zu verstehen und zu verarbeiten. Es zielt darauf ab, die hohe Redundanz von Informationen im WWW zu verringern und die Effizienz durch Prozessintegration und Datenbankintegration zu steigern. Im Gegensatz zum bisherigen Web, das primär für Menschen optimiert ist, soll das Semantic Web ein "Web für Maschinen" sein, das die automatische Kommunikation zwischen verschiedenen Maschinen und "smarten Objekten" ermöglicht.
Welche Technologien bilden die Grundlage des Semantic Web?
Drei Haupttechnologien bilden die Basis: eXtensible Markup Language (XML) als genereller Syntaxstandard, Resource Description Framework (RDF) zur Formulierung von maschinenlesbaren Aussagen mittels Tripeln (Subjekt, Prädikat, Objekt) und Ontologien zur Vermeidung von Inkonsistenzen durch verschiedene URIs mit gleicher Bedeutung. Zusätzliche Technologien wie HTML, SGML und XHTML spielen ebenfalls eine Rolle in der historischen Entwicklung und Anwendung.
Was sind Tripel im RDF und wie funktionieren sie?
Tripel im Resource Description Framework (RDF) sind die Bausteine zur Formulierung von Sachverhalten. Jedes Tripel besteht aus einem Subjekt, einem Prädikat (der Beziehung) und einem Objekt. Das Prädikat beschreibt die Beziehung zwischen Subjekt und Objekt. Die Knoten des Systems (Subjekt oder Objekt) erhalten ihre Eigenschaften durch einen Uniform Resource Identifier (URI), der sowohl eine URL als auch eine alphanumerische Zeichenfolge sein kann. Beispiel: "Max Semantitsch ist Professor an der Fachhochschule Pforzheim".
Was sind Ontologien und welche Rolle spielen sie im Semantic Web?
Ontologien sind, wissenschaftlich betrachtet, die Lehre vom Sein und seinen Prinzipien. Im Semantic Web dienen sie der Vermeidung von Inkonsistenzen, indem sie verschiedene URIs mit der gleichen Bedeutung zusammenführen. Sie sind auf spezifische Gebiete beschränkt und vergleichbar mit intelligenten Datenbanken, die maschinenlesbare Definitionen und deren Beziehungen enthalten. Sie ermöglichen Äquivalenzbeziehungen, Taxonomien (Klassifizierung und Gliederung) und Inferenzregeln (Schlussfolgerungen basierend auf Taxonomien).
Welche Arten von Beziehungen können Ontologien darstellen?
Ontologien können verschiedene Beziehungen darstellen: Äquivalenzbeziehungen (gleichbedeutende Begriffe), Taxonomien (Gliederung und Klassifizierung von Elementen in hierarchischen Strukturen, z.B. Ober- und Unterklassen), und Inferenzregeln (das Ziehen von Schlussfolgerungen basierend auf Taxonomien und logischen Regeln).
Welche Sprachen werden für Ontologien verwendet?
Die führenden Sprachen für Ontologien waren zunächst Ontology Inference Layer (OIL) und DARPA Agent Markup Language (DAML). Das W3C Konsortium hat sich auf eine einheitliche Sprache namens DAML+OIL geeinigt.
Welche Datenschutzprobleme ergeben sich aus dem Semantic Web?
Das Semantic Web birgt datenschutzrechtliche Probleme, insbesondere hinsichtlich der Glaubwürdigkeit der Informationsquellen. Digitale Signaturen können die Authentizität des Urhebers überprüfen und unterschiedliche Glaubwürdigkeitsgrade für Autoren ermöglichen, aber die grundsätzliche Problematik der Vertrauenswürdigkeit bleibt bestehen.
Welche Anwendungsmöglichkeiten hat das Semantic Web?
Einfache Anwendungen sind z.B. Terminkalender, die Termine selbstständig aushandeln können. Komplexere Anwendungen sind Reiseplanungs- und Buchungssysteme, die Flugpläne, Tarife und Nutzerpräferenzen in einer Wissensdatenbank (Ontologie) verarbeiten und so die Reiseplanung automatisieren.
Wie entwickelte sich das Semantic Web historisch?
Die Entwicklung begann mit der Erweiterung des WWW durch bessere Darstellungsmöglichkeiten (HTML, basierend auf SGML). Die eXtensible Markup Language (XML) wurde als neuer Standard für strukturierte Dokumente eingeführt. Die Weiterentwicklung zum Semantic Web wurde von Tim Berners-Lee angestoßen und gliedert sich in zwei Generationen: das WWW mit statischen und dynamischen Inhalten und das neue WWW basierend auf XML, RDF und maschinenlesbaren Datenformaten.
Inhaltsverzeichnis
1 Einleitung
2 Entwicklung des Semantic Web
3 Einführung in das Semantic Web
4 Technik des Semantic Web
5 Anwendungsmöglichkeiten
6 Kontrollfragen
Abkürzungsverzeichnis
Literatur
Quellen aus dem Internet
1 Einleitung
Max Semantitsch kommt heute früher von der Arbeit nach Hause. Heute Abend hat er eine Dame, die er bei einem Geburtstag eines Freundes kennen gelernt hat und sehr nett fand, zu einen Abendessen zu zweit bei sich zuhause eingeladen. Da alle Geräte in seinem Haus vernetzt sind und daher smarte Objekte darstellen, wissen diese durch den automatischem Abgleich mit dem elektronischen Organizer von Max Semantitsch, dass dieser heute Abend ein romantisches Abendessen geplant hat. Bereits auf der Heimfahrt kommuniziert der Bordrechner von Semantitschs Auto mit den intelligenten Systemen in dessen Haus und avisiert die Ankunft. Dadurch wird im Haus bereits die von Max Semantitsch gewünschte Konfiguration der Beleuchtung, der Unterhaltungselektronik, des Heizungs- und Klimasystems, der Küchengeräte sowie sämtlicher Rollläden und Jalousien hergestellt. Nach Betreten seines Hauses geht Max Semantitsch in die Küche. Dort liegen bereits alle Zutaten für das von ihm gewünschte Gericht bereit. Sein Küchenrechner hat diese bereits automatisch im Auftragsverwaltungssystem des Lebensmittelhändlers bestellt.
Zum jetzigen Zeitpunkt ist das Zukunftsmusik. Allerdings bietet das Semantic Web die Basistechnologien, um eine automatische Kommunikation zwischen verschiedenen Maschinen bzw. smarten Objekten zu ermöglichen. In den folgenden Kapiteln werden sowohl die historischen Entwicklungen in Richtung des Semantic Web wie auch die technologischen Anforderungen, die hinter dem Semantic Web stehen, aufgezeigt. Am Ende werden zwei Anwendungen aus der Praxis dargestellt, wobei die sich eine davon noch im Entwicklungsstadium befindet.
2 Entwicklung des Semantic Web
Zur Erläuterung der Techniken des Semantic Web erfolgt im folgenden Kapitel zuerst ein kurzer Abriss über die Evolution der Internettechnologien im World Wide Web (WWW), welches wie auch z. B. das File Transfer Protokoll (FTP) in die oberste Schicht der Protokollebenen des Internetprotokolls (TCP/IP) eingeordnet wird.
Die Evolution der Internettechnologien für die Allgemeinheit begann mit der Erweiterung des bestehenden Internets durch bessere Darstellungsmöglichkeiten . Daraus entwickelte sich die Hypertext Markup Language (HTML), eine einfach zu erlernende Sprache zur Visualisierung von Inhalten, die eine große Bandbreite von Formatierungen und Gestaltungselementen enthält sowie auch das Einfügen von Bildern ermöglicht. Die Grundlagen für die Entwicklung von HTML liegen in der Metasprache Standard Generalized Markup Language (SGML), einer Seitenbeschreibungssprache, die 1986 durch das Conseil Européen de Recherches Nucleaires (CERN) (vgl. /CER-03/) in Genf entwickelt wurde. Der nächste große Schritt in der Evolution des WWW wurde 1998 parallel mit der Definition der Version 4 des HTML-Standards eingeleitet. Die eXtensible Markup Language (XML) war geboren. Die Eliminierung unnötiger Befehle aus SGML und die Unterstützung für Auszeichnungsbefehle machte XML zum neuen Quasi-Standard für die Erstellung strukturierter Dokumente im WWW. Als Fortführung des XML-Standards wurde XHTML als Ableger von HTML und XML erstellt. Mit XHTML wird die Darstellung von Webseiten als strukturierte Daten im WWW erleichtert. Dadurch wird XHTML HTML zukünftig ersetzen. Dabei sind HTML und XHTML keine eigenständigen Metasprachen, sondern nur als Erweiterungssprachen von SGML und XML zu verstehen, die hierarchisch eine Ebene über HTML und XHTML angeordnet sind (vgl. /Ger-02, S. 3-5/ i. V. m. /Net-03/).
Die Weiterentwicklung der Technologien in Richtung des Semantic Web im Jahr 1999 wurde hauptsächlich von Tim Berners-Lee, dem Mitbegründer des World Wide Web (WWW) inspiriert (vgl. /c´t-02/). Hierzu teilen Geromenko und Chen das Web in zwei Generationen ein.
Die erste Generation besteht aus dem WWW der statischen Inhalte, in dem Seiten statisch, also ohne Interaktionen auf einem Internetserver, vorhanden waren, und dem WWW der dynamischen Inhalte. Bei statischen Seiten beschränkten sich die Interaktionen auf Verweise in Form von Hyperlinks und animierte Grafiken in CompuServes Graphics Interlaced Format (GIF). Datensätze aus Datenbanken konnten dabei unter Verwendung der Structured Query Language (SQL) abgefragt werden. Das WWW der dynamischen Inhalte besteht hingegen aus dynamischen Ergänzungen wie Active Server Pages (ASP), JavaScript, Macromedia Flash, dynamischem HTML (DHTML) usw. Datenbankanbindungen zur Ausgabe von dynamisch erstellten Webseiten werden durch ASP und andere serverseitige Technologien zur Erstellung von Internetseiten während der Übertragung bereitgestellt.
In der Weiterentwicklung des WWW wird die zweite Generation des WWW von Technologien wie XML, dem Resource Description Framework (RDF) und anderen maschinenlesbaren Formaten von Daten geprägt. Dabei fungiert das WWW als eine einheitliche XML – basierte, selbsterklärende Datenbank mit Softwareagenten, die aus diesen Daten Schlussfolgerungen ziehen können (vgl. /Ger-03/ S. 10).
3 Einführung in das Semantic Web
Die Idee des Semantic Web entstand vor dem Hintergrund einer unüberschaubaren Anzahl von Dokumenten im WWW, hoher Redundanz von Informationen, aber auch aufgrund wirtschaftlich getriebener Überlegungen nach Steigerung der Effizienz, welche häufig durch Prozessintegration und damit verbundene Integration verschiedener Datenbanken erreicht wird (vgl. /Guh-01/). Alle diese Dokumente sind hinsichtlich der Darstellung und Programmierung auf die Nutzung durch Menschen optimiert. Maschinen können Informationen aus diesen Seiten nur bedingt, z. B. über mächtige Suchalgorithmen großer Suchmaschinen, auswerten. Zum leichteren Auffinden und Erhöhung der Relevanz der gefundenen Seiten muss eine Maschine in der Lage sein, Gliederungen und Klassifizierungen diverser Informationen aus einer einzelnen Seite bzw. aus mehreren Seiten vornehmen zu können. Dazu müssen die Informationen zusätzlich zur visuellen Darstellungsform auch in maschinenlesbarer Form dargestellt sein. Hier setzt das Semantic Web an.
Das Semantic Web verfolgt den Ansatz, alle Seiten im WWW um einen semantischen Inhalt zu erweitern. Anhand dieser Zusatzinformationen wird der Inhalt der Seite für andere Maschinen oder genauer Programme lesbar. Man spricht in diesem Zusammenhang auch oft von einem Web für Maschinen (vgl. /Euz-02/). Dabei ist der zugrundeliegende Begriff Semantik als die Lehre von der Bedeutung sprachlicher Zeichen (Wörter, Vor- und Nachsilben o. ä.) sowie der Benennung von Begriffen definiert (vgl. /WAH-00/).
Die Kommunikation im Semantic Web erfolgt in Form von elektronischen Agenten, die im Auftrag von Menschen autonom handelt. Dies verdeutlicht auch den Unterschied zur künstlichen Intelligenz, d. h. der Artificial Intelligence (AI), bei der Maschinen selbstlernend autonom ohne den Eingriff von Menschen handeln. Neues Wissen und Schlussfolgerungen sind nur bedingt im Rahmen sogenannter Inferenzen möglich, die im weiteren Verlauf noch näher erklärt werden (vgl. /c´t-02/).
4 Technik des Semantic Web
Das Semantic Web baut hauptsächlich auf drei Technologien auf (vgl. /c´t-02/):
1. eXtensible Markup Language (XML)
2. Resource Description Framework (RDF)
3. Ontologien
Weitere Technologien, die bereits im historischen Abriss erwähnt wurden, sind ebenfalls Bestandteil des Semantic Web. Sie werden hier aufgrund der Übersichtlichkeit nicht nochmals erwähnt.
XML dient als genereller Standard für die Syntax für alle Technologien im Rahmen des Semantic Web.
Das Resource Description Framework (RDF) dient zur Formulierung von Sachverhalten auf maschinenlesbaren Internetseiten,. Hierzu bedient RDF sog. Tripels. Diese bestehen immer aus Subjekt, Prädikat und Objekt, wobei das Prädikat die Eigenschaft (vgl. auch Prädikat als Satzaussage in der Grammatik) also die Beziehung zwischen Subjekt und Objekt darstellt. Die verschiedenen Knoten des Systems sind entweder Subjekt oder Objekt, je nachdem wie die Eigenschaft vergeben wird. Die Eigenschaft eines Elements im System wird durch einen Uniform Resource Identifiers (URI) vergeben. Ein URI kann sowohl ein Verweis auf eine Internetseite in Form eines Uniform Resource Locators (URL) z. B. http://www.beispielweb.de/beispiel sein als auch einer beliebige alphanumerische Zeichenfolge. Ein Beispiel für ein Tripel wäre Max Semantisch ist Professor an der Fachhochschule Pforzheim. Hierbei wäre Max Semantisch das Subjekt und die Fachhochschule Pforzheim das Objekt. Die Beziehung bzw. Aussagekraft des Satzes kommt durch das Prädikat „ist die Professur“ zustande (vgl. Kyl-03).
Zur Vermeidung von Inkonsistenzen durch verschiedene URI´s, welche die gleiche Bedeutung haben aber auf unterschiedliche Ressourcen verweisen, benötigt das Semantic Web Ontologien. Diese sind wissenschaftlich als die Lehre vom Sein und seinen Prinzipien definiert (vgl. /WAH-00). Unterschiedliche Ressourcen können anhand von Prinzipien z. B. mit der gleichen Bedeutung können dadurch zusammengeführt. Die Effektivität der Suche wird erhöht. Aufgrund der Komplexität der Sprachen und der Bedeutung der Wörter sind Ontologien immer nur auf ein spezifisches Gebiet beschränkt. Ontologien sind vergleichbar mit intelligenten Datenbanken, in denen maschinenlesbare Definitionen eines spezifischen Gebiets und die entsprechenden Beziehungen unter diesen Definitionen enthalten sind (vgl. /Hef-03/). Grundsätzlich können folgende Beziehungen dargestellt werden:
1. Äquivalenzbeziehungen
Hierunter wird die Erkennung von gleichbedeutenden Begriffen verstanden.
2. Taxonomien Die Gliederung und Klassifizierung von Elementen des Systems kann ebenfalls erfolgen. Objekte und Eigenschaften werden in Klassen eingeteilt. Die Oberklasse über allen Klassen der Objekte heißt „thing“ (zu deutsch Ding, oder besser Sache). Eine Klasse wäre z. B. die Klasse Person. Sie umfasst die Subjekte Mann, Frau und Kind. Die drei Subjekte könnten aber jeweils wieder eine Unterklasse der Klasse Person sein. Gleiche Hierarchien sind auch auf die Beziehungen zwischen den Klassen bzw. Eigenschaften anwendbar. Z. B. kann die Beziehung „hat Geschwister“ als Untereigenschaft der Beziehung „hat Verwandte“ angesehen werden. Der Vorteil zeigt sich z. B. bei der Suche nach einem Prozessor. Ein passender Fund wie Athlon würde aber nur durch Taxonomien als Prozessor erkannt (Hierarchie Prozessor – AMD – Athlon).
3. Inferenzregeln Inferenzen bauen auf Taxonomien auf und könne aufgrund der hierarchischen Einordnung von Taxonomien Folgerungen ziehen. Dies sei an einem Beispiel aus den Verwandtschaftsverhältnissen verdeutlicht. Eine Taxonomie besagt, dass ein Kind eine Tochter oder / und Sohn sein kann. Die zweite Taxonomie besagt, dass eine Frau, die Kinder hat, eine Mutter ist. Sucht der Agent nach Müttern und findet eine Frau mit einem Sohn, kann eraus den Taxonomien zuordnen, dass ein Sohn ein Kind ist. Im zweiten Schritt sieht er, dass eine Frau mit einem Kind eine Mutter ist und zieht den entsprechenden Schluss (vgl. /McG-03/).
Die zwei führenden Sprachen für Ontologien sind Ontology Inference Layer (OIL) und DARPA Agent Markup Language (DAML). Dabei ist OIL eine europäische Entwicklung unter Federführung der Universität Karlsruhe und DAML die amerikanische Entwicklung unter der Leitung der Universität von Maryland. Inzwischen haben die Standardisierungsbestrebungen des W3C Konsortiums einen Konsens zugunsten einer einheitlichen Sprache unter dem Namen DAML + OIL erreicht (vgl. /Euz-02/).
Unter den gegebenen Umständen würde das Semantic Web große datenschutzrechtliche Probleme mit sich bringen. Ein Problem ist die Glaubwürdigkeit des Urhebers der Informationen. Nicht jede Resource ist vertrauenswürdig. Allerdings können durch den Nutzer sowie den Autor der Information bestimmte Vertrauensstellungen definiert werden. Dabei unterzeichnet der Autor das Dokument mit seiner digitalen Signatur, wodurch der Empfänger die Authentizität des Urhebers feststellen kann. Dabei kann der Informationsempfänger auch jeden Autor mit unterschiedlichen Graden an Glaubwürdigkeit versehen. Dadurch werden Beiträge des Autors mit höherem Glaubwürdigkeitsgrad einem Beitrag eines Autor mit niedrigerer Glaubwürdigkeit vorgezogen.
5 Anwendungsmöglichkeiten
Das einfachste, aber beliebteste Anwendungsszenario ist der Terminkalender. Dabei können Terminkalender verschiedener Benutzer nach einem Terminwunsch eines Benutzers anhand ihrer Daten selbständig Termine aushandeln. Dieses Beispiel wird in der Praxis schon recht häufig benutzt. Herausgeber entsprechender Semantic Web Lösungen für Terminkalender stellen im Internet Synchronizationswerkzeuge für alle gängigen Personal Digital Assistants (PDA) und Groupwareplattformen bereit.
Wesentlich nützlicher und komplexer ist z. B. eine Reiseplanungs- und Buchungssystem. Eckpunkte eines Reiseagenten wären dabei ein Netzwerk von URI´s mit aktuellen Ressourcen wie Flugplänen, Tarifen, usw. sowie eine Wissensdatenbank (Ontologie) mit entsprechender Klassifizierung und entsprechenden Inferenzen, wie z. B. Berlin liegt in Deutschland, bestehen. Auch die Nutzerpräferenzen sollten als Instanz der Ontologie vorliegen. Das System könnte über diese Aufbau nach Angabe des Reiseziels und des Datums die Arbeit einer Sekretärin im Hinblick auf die Reiseplanung verrichten (vgl. /Euz-02/).
6 Kontrollfragen
1. Welche Gründe führten zur Entwicklung des Semantic Web ?
2. Welche drei Technologien bilden die Grundlage für das Semantic Web ?
3. Welche Bedeutung haben die Tripels des Resource Description Frameworks ?
4. Was sind Ontologien ?
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Literatur
/Ger-03/ Geroimenko, Vladimir und Chen, Chaomei (Hrsg.): Visualizing the Semantic Web – XML – based Internet and Information Visualization, London, 2003
/c´t-02/ Heise, Christian (Hrsg.): c´t Magazin für Computertechnik Heft 6/2002, S. 132 ff. Hannover, 2002
/Wah-00/ Wahrig-Burfeind, R. (Hrsg.): Wahring Fremdwörterlexikon. Gütersloh / München, 2000
Quellen aus dem Internet
/Ber-01/ Berners-Lee, Tim: Semantic Web Activity Statement, Stand: 20.12.2003,
http://www.w3c.org/2001/sw/Activity
/Cer-03/ Conseil Européen de Recherches Nucléaires: About us, Genf, Stand: 12.12.2003, http://public.web.cern.ch/public/about/aboutCERN.html
/Euz-02/ Euzenat, Jerôme, A Few Words about the Semantic Web in ERCIM News Nr. 51, Sophia Antipolis (Frankreich), Stand: Oktober 2002,
http://www.ercim.org/publication/Ercim_News/enw51/
/Guh-01/ Guha, R. V., Semantic Web in Industry, Stand: 17.12.2003,
http://www.w3.org/2003/Talks/0522-swinf-guha/SWInRealWorld.ppt
/Hef-03/ Heflin, Jeff: OWL Ontology Language Use Cases and Requirements (W3C Proposed Recommendation 2003-12-15, Stand: 04.01.2004,
http://www.w3c.org/TR/2003/PR-webont-req-20031215/
/Kly-03/ Klyne, Graham und Carroll, Jeremy J.: Resource Description Framework – Concepts and Abstract Syntax (W3C Proposed Recommendation 2003-12-15), Stand: 04.01.2004 http://www.w3c.org/TR/2003/PR-rdf-concepts-20031215/
/McG-03/ McGuinness, Deborah L. und van Harmelen, Frank: OWL Web Ontology Language – Overview (W3C Proposed Recommendation 2003-12-15), Stand: 04.01.2004
http://www.w3c.org/TR/2003/PR-owl-features-20031215/
/Net-03/ Akademie.de asp GmbH (Hrsg.): Netlexikon, Berlin, Stand: 12.12.2003,
http://www.net-lexikon.de
- Arbeit zitieren
- Andreas Hofstetter (Autor:in), 2004, Semantic Web - Das Web für Maschinen, München, GRIN Verlag, https://www.grin.com/document/108942