I
Inhaltsverzeichnis
1 Einleitung. 1
1.1 Motivation der Arbeit 1
1.2 Aufbau der Arbeit 1
2 Ontologie 4
2.1 Ursprung des Begriffes 4
2.2 Ontologie in der Informatik. 4
2.2.1 Grundlegendes. 4
2.2.2 Wichtige Ontologietypen und ihre Beziehung. 5
2.2.2.1 Top-Level-Ontologie 6
2.2.2.2 Domain-Ontologie und Task-Ontologie. 6
2.2.2.3 Application-Ontologie. 6
2.2.3 Ontologie im Kontext dieser Arbeit 7
2.2.3.1 Definition nach Gruber. 7
2.2.3.2 Abox und Tbox. 8
2.2.3.3 Zusammenfassung 9
3 Relevante Technologien. 10
3.1 Das klassische Web. 10
3.1.1 Geschichte des klassischen Web in Kurzform 10
3.1.2 Eigenschaften des klassischen Web 11
3.1.3 Vorteile des klassischen Web 11
3.2 Anforderungen an ein neues Web 12
3.3 Die Lösung: Das Semantic Web 12
3.3.1 Entstehungsgeschichte 13
3.3.2 Die Schichten Architektur des Semantic Web 13
3.4 Die modifizierten Schichten im Kontext dieser Arbeit. 15
3.4.1 URIs und Namespaces 15
3.4.2 XML und XMLS Datentypen. 17
3.4.3 RDF und RDF/XML 20
3.4.3.1 RDF und Metadaten 20
3.4.3.2 RDF Spezifikation und RDF Datenmodell 21
II
3.4.3.3 RDF/XML 23
3.4.4 RDFS 27
3.4.4.1 RDFS Klassen 28
3.4.4.2 RDFS Eigenschaften 29
3.4.4.2.1 Core Properties 29
3.4.4.2.2 Clarification Properties 31
3.4.4.2.3 Container Classes Properties. 32
3.4.4.2.4 Documentation Properties 32
3.4.4.3 RDFS Zusammenfassung und Bewertung 32
3.4.5 Ontologie-Sprachen und Anwendungen. 33
3.5 Zusammenfassung 34
4 OWL: Web Ontology Language. 35
4.1 Definition. 35
4.2 Spezifikation 35
4.3 Die OWL Dialekte 36
4.3.1 OWL Full 37
4.3.2 OWL DL 37
4.3.3 OWL Lite 37
4.3.4 Zusammenfassung. 38
4.4 Die wichtigsten OWL Sprachkonstrukte. 39
4.4.1 OWL Lite Sprachkonstrukte 40
4.4.1.1 Syntax. 40
4.4.1.2 Header, Body und Footer 40
4.4.1.3 Klassen und Eigenschaften 41
4.4.1.3.1 Klassen. 41
4.4.1.3.2 Datatype Properties. 43
4.4.1.3.3 Object Properties. 44
4.4.1.3.4 Annotation Properties 44
4.4.1.3.5 Ontology Properties. 45
4.4.1.3.6 Globale einschränkende Eigenschaften 45
4.4.1.3.7 Lokale einschränkende Eigenschaften. 46
4.4.1.3.8 Weitere Eigenschaften 47
III
4.4.1.4 Konstrukte und Einschränkungen im Überblick 48
4.4.2 OWL DL Sprachkonstrukte im Überblick 49
4.4.3 OWL Full Sprachkonstrukte im Überblick. 50
4.4.4 Instanzen vs. Individuen. 50
4.5 Zusammenfassung 51
5 Ontologie-Editor Protégé 53
5.1 Systemvoraussetzungen, Download und Installation. 53
5.2 Eine kurze Einführung. 53
5.2.1 Anlegen von Klassen. 53
5.2.2 Beziehungen zwischen Objekten 55
5.3 Reasoning. 56
5.3.1 FaCT , Pellet und RacerPro 59
5.4 Alternative OWL Ontologie-Editoren 60
6 Ontologie-basierte Beschreibung eines Kurses der FernUniversität 61
6.1 Anforderungsermittlung. 61
6.1.1 Beispiel für ein Szenario. 62
6.1.2 Beispiel für einen Anwendungsfall. 62
6.2 Entwurf. 65
6.3 Implementierung und Test 68
6.3.1 Implementierung der Tbox 68
6.3.2 Implementierung der Abox 72
6.3.3 Implementierung der Metadaten 77
6.3.4 Test der Ontologie. 82
6.3.5 Exkurs 84
7 Fazit und Ausblick 86
8 Literaturverzeichnis 87
Anhang A 90
Anhang B 93
IV
Abbildungsverzeichnis
Abb. 1: Ontologiebeziehungen nach Guarino ( 7 : S. 7)
Abb. 2: Ontologie Definition nach Gruber ( 9 : S. 28)
Abb. 3: Zusammenhang zwischen Tbox und Abox ( 9 : S. 26)
Abb. 4: Sir Tim Berners-Lee.
Abb. 5: Semantic Web Layer Cake ( 17 )
Abb. 6: Modifizierter Layer Cake.
Abb. 7: URI/Namespace Schicht.
Abb. 8: Zusammenhang zwischen URI, URN und URL ( 6 : S. 89)
Abb. 9: URI und Fragment ( 9 : S. 55)
Abb. 10: XML/XMLS Schicht.
Abb. 11: RDF u. RDF/XML Schicht.
Abb. 12: RDF Tripel Prinzip
Abb. 13: Erweitertes RDF Tripel Prinzip
Abb. 14: Das RDF-Modell ( 9 : S. 82)
Abb. 15: RDFS Schicht
Abb. 16: RDFS Super-, Subklassen und Transitivität
Abb. 17: Ontologie Sprachen und Anwendungsschicht
Abb. 18: Eigenschaften der OWL Dialekte.
Abb. 19: Zusammenhang der OWL Dialekte
Abb. 20: Beziehung zwischen RDFS und OWL
Abb. 21: OWL Lite Eigenschaften
Abb. 22: Instanzen vs. Individuen
Abb. 23: Anlegen von Klassen mit Protégé.
Abb. 24: Anlegen von disjunkten Klassen mit Protégé.
Abb. 25: Anlegen von weiteren Klassen mit Protégé
Abb. 26: Anlegen von Eigenschaften mit Protégé.
Abb. 27: Benutzen von Eigenschaften mit Protégé.
Abb. 28: Reasoner Konsistenz Check
Abb. 29: Reasoner Taxonomie Check
Abb 30: Neue Taxonomie
V
Abb. 31: Anwendungsfall Beispiel.
Abb. 32: Klassen der Kursontologie I.
Abb. 33: Klassen der Kursontologie II.
Abb. 34: ER-Modell der Kursontologie.
Abb. 35: OWL Klassenhierarchie der Kursontologie in Protégé.
Abb. 36: OWL Eigenschaften der Kursontologie in Protégé
Abb. 37: OWL Singleton
Abb. 38: Strukturelemente den Inhaltselementen zuweisen
Abb. 39: Der Standardlernpfad
Abb. 40: Beispiel für eine Lernkarte
Abb. 41: DC Metadaten Beispiel
Abb. 42: Verifizierung der Konsistenz der Kursontologie
Abb. 43: Verifizierung der Taxonomie der Kursontologie I.
Abb. 44: Standardlernpfad Query
Abb. 45: Lernkarten Query.
Abb. 46: Beispiele Query
Abb. 47: Grafik Query
Abb. 48: Lernkarte Screenshot
Abb 49: Verifizierung der Taxonomie der Kursontologie II
VI
Tabellenverzeichnis
Tab. 1: Wichtige XMLS Datentypen ( 9 : S. 71) 19
Tab. 2: RDF Spezifikation 21
Tab. 3: RDF/XML Spezifikation. 24
Tab. 4: RDF/XML MIME-Typ und Namespace. 24
Tab. 5: Zusammenfassung der RDF/XML Elemente ( 9 : S. 109) 26
Tab. 6: RDFS Spezifikation und Namespace. 27
Tab. 7: Vordefinierte RDFS Klassen 29
Tab. 8: RDSF Core Properties 31
Tab. 9: OWL Spezifikation Dokumente 36
Tab. 10: OWL Lite Konstrukte ( 9 : S. 216) 48
Tab. 11: OWL Lite Einschränkungen ( 9 : S. 218) 49
Tab. 12: Zusätzliche Konstrukte von OWL DL ( 9 : S. 223) 49
Tab. 13: Gelockerte Einschränkungen von OWL DL ( 9 : S. 223) 50
Tab. 14: ER-Modell und OWL 65
Tab. 15: ER-Diagramm Konventionen 67
Tab 16: Strukturelle Aufteilung des Datenbankkurses 74
1
1 Einleitung
1.1 Motivation der Arbeit
In der Informatik ist es in vielen Bereichen nötig, Erkanntes oder Erdachtes zu repräsentieren und damit Wissen und Zusammenhänge zu kommunizieren. Für diesen Sachverhalt hat sich in den letzten Jahren der Begriff Ontologie eingebürgert. Insbesondere im Zuge der Idee des „Semantic Web“ haben diese Ontologien in jüngster Zeit einen beachtlichen Aufschwung erlebt. Im selben Zeitraum wurden auch die Anforderungen, die an webbasierte eLearning Umgebungen gestellt werden immer komplexer. Von modernen eLearning Anwendungen werden heute Eigenschaften erwartet, die über das bloße Bereitstellen von Lernmaterialien weit hinausgehen. Oft genannte Schlagworte sind hier „Just-in-Time Learning“ und „Relevant Learning“. Es wird also in Zukunft darum gehen die Lerninhalte so zu beschreiben, dass eine flexible, computergestützte und von den jeweiligen Anforderungen abhängige Präsentation der Lernmaterialien möglich wird. Die vorliegende Arbeit zeigt anhand der Erstellung einer Ontologie eine Möglichkeit zur Beschreibung digitaler Lernmaterialien auf, die diesen Bestrebungen gerecht werden kann. Dafür wird die OWL 1 , eine ursprünglich für das „Semantic Web“ entwickelte Ontologiesprache, genutzt.
1.2 Aufbau der Arbeit
Zuerst findet eine kurze Einführung in die Ursprünge des Begriffes Ontologie statt. Im Anschluss wird dieser zunächst noch vielsagende Begriff hinsichtlich der Bedeutung in der Informatik abgegrenzt, um dann zu einer auf diese Arbeit zugeschnittenen Ontologiedefinition zu kommen.
Das darauffolgende Kapitel gibt einen Überblick über die für diese Arbeit relevanten Technologien zur Beschreibung der Lerninhalte. Es beginnt mit einer Einführung in Geschichte, Eigenschaften und Vorteile des klassischen Web, um dann anhand der Anforderungen an ein neues Web die Wurzeln des „Semantic
1 Web Ontology Language
2
Web“ Konzepts herauszuarbeiten. Nach der Darstellung der
Entstehungsgeschichte des „Semantic Web“ wird dessen Schichtenmodell kurz vorgestellt, um daraus eine für diese Arbeit modifizierte Variante abzuleiten, welche die Techniken, auf denen die zu erstellende Ontologie aufbaut, beschreibt. Das Kapitel schließt mit der detaillierten Darstellung der für dieses abgeleitete Modell vorgesehenen Technologien. Diese sind im Einzelnen: URIs 1 und Namespaces, XML 2 und XMLS Datentypen, RDF 3 und RDF/XML, RDFS und schließlich OWL. OWL Ist eine für das „Semantic Web“ entwickelte Sprache zur Beschreibung von Ontologien.
Das sich daran anschließende Kapitel widmet sich nun ausführlich dieser Kerntechnologie für den ontologie-basierten Ansatz in dieser Arbeit. Nach einer kurzen Definition und Spezifikation werden die einzelnen Dialekte OWL Full, OWL DL und OWL Lite vorgestellt und eine begründete Auswahl für die weitere Arbeit getroffen. Das Kapitel schließt mit der Beschreibung der wichtigsten OWL Sprachkonstrukte.
Wie bei jeder Programmiersprache steht und fällt auch die Nutzbarkeit von OWL für die Ontologieerstellung mit der Qualität der zur Verfügung stehenden Programme. Der augenblicklich bekannteste, die OWL unterstützende und kostenlos verfügbare Ontologie-Editor ist Protégé. Deshalb findet in diesem Abschnitt neben der Klärung von Systemvoraussetzungen, „Download“möglichkeiten und der Installation eine kurze Beschreibung in Form eines kleinen Tutorials statt. Im Einzelnen wird das Anlegen von Klassen, die Beschreibung der Beziehungen zwischen diesen und die Möglichkeiten des sogenannten „Reasoning“ vorgestellt. Dazu findet eine kurze Vorstellung der Reasoner FaCT++, Pellet und RacerPro statt. Anschließend wird noch kurz auf verfügbare alternative Produkte zur Ontologiemodellierung eingegangen. Im letzten Teil der Arbeit wird dargestellt, wie mit Hilfe der vorgestellten Möglichkeiten und Programme eine Beschreibung digitaler Lernmaterialien
1 Uniform Resource Identifier
2 eXtensible Markup Language
3 Resource Description Framework
3
aussehen kann. Als Grundlage für das dort entwickelte Konzept dient ein Datenbankkurs der FU Hagen.
Der Schluss dieser Arbeit beinhaltet neben einem Fazit auch noch einen Ausblick auf die Möglichkeiten der Erstellung ontologie-basierter Anwendungen mit dem „Jena 2 Framework“.
4
2 Ontologie
2.1 Ursprung des Begriffes
Ontologie ist ein in der Wissenschaft vielfach gebrauchter Begriff, der heute unter anderem für das steht, was Aristoteles 1 bereits im 4. Jahrhundert v. Chr. als Metaphysik bezeichnet hat ([1]). Der Begriff selbst hat seinen Ursprung im 13. Jahrhundert und meint die Lehre vom Sein und vom Seienden ([2]). In diesem Zusammenhang sei als ein bedeutender Vertreter moderner Forschung im Bereich der philosophischen Ontologie der Argentinier Mario Augusto Bunge 2 genannt. Dem interessierten Leser werden als Einstieg in dieses Gebiet die Abhandlungen [3] und [4] von Bunge empfohlen.
„Ontological (or metaphysical) views are answers to ontological questions. And
ontological (or metaphysical) questions are questions with an extremely wide
scope, such as 'Is the world material or ideal - or perhaps neutral?', 'Is there
radical novelty, and if so how does it come about?', 'Is there objective Chance or
just an appearance of such due to human ignorance?', 'How is the mental related
to the physical?', ‘Is a community anything but the set of its members?', and ‘Are
there laws of history?'.”
([3]: S. 1)
Ontologie in der Philosophie ist also der Ursprung des Begriffes, im nun folgenden Kapitel soll das Aufkommen und die Verwendung von Ontologie in der Informatik näher beleuchtet werden.
2.2 Ontologie in der Informatik
2.2.1 Grundlegendes
Nach Fensel ([5]) beginnt die Verwendung von Ontologie in der Informatik in den 90er Jahren durch die Vertreter der KI 3 .
„Since the beginning of the nineties ontologies have become a popular research
topic investigated by several Artificial Intelligence research communities […].”
([5]: S. 11)
1 * 384 v. Chr, † 322 v. Chr
2 * 1919
3 Künstliche Intelligenz
5
In jüngster Zeit findet Ontologie auch in Feldern wie „Intelligent Information Integration“, „Cooperative Information Systems“, „Information Retrieval“, „Electronic Commerce“ und „Knowledge Management“ immer mehr Anhänger. Der Grund dafür ist sicherlich die Aussicht auf ein allgemein gültiges und gleiches Verständnis einer bestimmten Domäne zwischen den Anwendern und den Anwendungen ([5]: S. 11). Fensel schreibt dazu: „Ontologies are developed to provide a machine-processable semantics of
information sources that can be communicated between different agents (software
and humans).“
([5]: S.11)
Das Ziel einer Ontologie in der Informatik ist demnach eine formale und maschinenlesbare Definition einer Domäne zu bekommen. Die eigentliche Hoffnung dabei ist die Möglichkeit, dass verschiedenste Systeme später nur mit Hilfe einer ihnen innewohnenden Ontologie miteinander kommunizieren können ([6]: S. 344). Es gibt mittlerweile eine Vielzahl von Ontologietypen und
Klassifizierungsbestrebungen in den verschiedensten Bereichen der Informatik, so dass eine vollständige Aufzählung und Beschreibung hier nicht sinnvoll ist. Aus diesem Grund folgt im nächsten Kapitel zunächst eine eher allgemeine Zuordnung nach den Anwendungsbereichen bzw. dem Grad der Generalisierung einer Ontologie.
2.2.2 Wichtige Ontologietypen und ihre Beziehung
Guarino ([7]) wählt eine Kategorisierung, welche den Grad der Generalisierung als Entscheidungskriterium verwendet. Er unterscheidet dabei vier Typen von Ontologien: „Top-Level“-Ontologie, „Domain“-Ontologie, „Task“-Ontologie und „Application“-Ontologie. Damit erhält man die gewünschte Zuordnung nach den Anwendungsbereichen. Abb. 1 stellt den Zusammenhang dieser Ontologietypen untereinander graphisch dar. Die folgenden Kapitel geben jeweils eine kurze Erläuterung zu den einzelnen Typen.
2.2.2.1 Top-Level-Ontologie
Eine „Top-Level“-Ontologie beschreibt sehr allgemeine Konzepte wie Raum, Zeit, Sache, Gegenstand, Ereignis, Handlung usw.. Diese sind von einem besonderen Problem oder Gebiet unabhängig und klassifizieren damit ein bereichsübergreifendes Gebiet oder Problem. Aus diesem Grund ist es vernünftig, zumindest in der Theorie, nur eine einzige „Top-Level“-Ontologie für eine Vielzahl von Anwendungsbereichen zu haben ([7]: S. 7).
2.2.2.2 Domain-Ontologie und Task-Ontologie
Eine „Domain“-Ontologie bzw. eine „Task“-Ontologie beschreibt das Vokabular einer Domäne (wie z.B. Medizin oder Automobil) bzw. eine allgemeine Aufgabe oder Tätigkeit (wie z.B. das Diagnostizieren oder den Verkauf), indem die Begriffe der entsprechenden „Top-Level“-Ontologie spezifiziert werden ([7]: S. 8). Es handelt sich hierbei also um Ontologien, die den konkreten Anwendungsbereich näher beschreiben und somit klassifizieren.
2.2.2.3 Application-Ontologie
Eine „Application“-Ontologie ist die speziellste Form der Ontologie. Sie beschreibt Konzepte, die sowohl vom Gebiet der „Domain“-Ontologie als auch von der Aufgabe der „Task“-Ontologie abhängen. Diese Konzepte entsprechen häufig den Rollen der Entitäten in einer Anwendung bei der Durchführung einer
7
bestimmten Aufgabe ([7]: S. 8). Mit anderen Worten handelt es sich hier also um die bekannten konzeptuellen Daten- und Klassenmodelle, die im Wesentlichen durch den Begriff Ontologie einen neuen Bezeichner erhalten. Die in dieser Arbeit erstellte Ontologie zur Beschreibung der Lernmaterialien fällt hauptsächlich in diesen Bereich der Kategorisierung nach Guarino.
2.2.3 Ontologie im Kontext dieser Arbeit
In Kapitel 2.2.1 wurde deutlich, wie unterschiedlich die Anforderungen und damit auch die Ausprägungen von Ontologien in der Informatik sind. Gerade aus diesem Grund ist es wichtig immer genau darzulegen, was mit Ontologie im konkreten Kontext gemeint ist. Deshalb folgt nun eine genaue Beschreibung, wie der Ontologiebegriff innerhalb dieser Arbeit zu deuten ist.
2.2.3.1 Definition nach Gruber
Thomas Gruber liefert eine allgemein akzeptierte Definition, welche auch für die vorliegende Arbeit gut geeignet ist:
„An ontology is an explicit specification of a conceptualization.” ([8]: S. 199)
Eine Ontologie Spezifizierung ist also eine formell beschriebene, maschinenlesbare Sammlung von Ausdrücken und deren Beziehung zueinander. Die Konzeptualisierung bezieht sich dabei auf ein abstraktes Modell einer Domäne ([9]: S.27). Abb. 2 verdeutlicht diese Definition.
8
Um den Erfordernissen der OWL und damit auch dieser Arbeit gerecht zu werden, bedarf es allerdings noch einer Erweiterung dieser Definition, welche im Folgenden erläutert wird.
2.2.3.2 Abox und Tbox
In der Informatik, insbesondere in der KI, wird oft zwischen der sogenannten Tbox 1 (Terminologische Komponenten) und der Abox 2 (Deklarative Komponenten) unterschieden. Das Tbox Vokabular definiert dabei Konzepte, welche die Abox Komponenten verknüpfen, um somit entscheidbare Beschreibungslogiken zu erhalten. Den Zusammenhang zwischen Tbox und Abox verdeutlicht Abb. 3.
Das folgende einfache Beispiel aus der Beschreibungslogik, welche in den meisten Fällen eine Untermenge der Prädikatenlogik erster Stufe ist soll das Abox-Tbox-Konzept veranschaulichen.
1 terminological components
2 assertional components
9
Die Unterscheidung zwischen Tbox und Abox spielt bei der Definition einer Ontologie und der zugehörigen Instanzen im Kontext dieser Arbeit eine wichtige Rolle, weil sie den Unterschied zwischen den Klassen der OWL Ontologie (Tbox) und den jeweiligen Instanzen, auch Individuen genannt (Abox), widerspiegelt ([9]. S. 26).
2.2.3.3 Zusammenfassung
Mit Hilfe der Ontologie Definition nach Gruber und der Unterscheidung zwischen Tbox und Abox erhalten wir die für diese Arbeit gültige Ontologie Definition. Es handelt sich dabei um eine Erweiterung der Gruber Definition mit dem Fokus auf der Tbox Komponente der Ontologie. Ontologie bedeutet somit im Kontext dieser Arbeit:
„An OWL-encoded […] vocabulary of declarative formalisms describing a model of a
domain“
([9]: S. 27)
Lacy liefert dazu selbst eine gelungene Beschreibung:
„Ontologies […] are vocabularies that declare a set of specific terms with formal
definitions. The definitions describe a model of a domain. Ontologies are encoded
into files using the Web Ontology Language - OWL.”
([9]: S. 28)
Somit besteht nun Klarheit, was innerhalb dieser Arbeit unter Ontologie zu verstehen ist. Das nächste Kapitel widmet sich ausführlich den technischen Aspekten, welche zur erfolgreichen Implementierung einer solchen Ontologie für digitale Lerninhalte benötigt werden.
10
3 Relevante Technologien
3.1 Das klassische Web
3.1.1 Geschichte des klassischen Web in Kurzform
Das Web entstand 1989 als Projekt von Sir Tim Berners-Lee (Abb. 4) am CERN 1 . Ursprünglich war dieses erste Hypertext-System dazu gedacht Forschungsergebnisse mit Kollegen austauschen zu können. Das erste Web-Anzeigeprogramm wurde 1990 entwickelt und von Berners-Lee „World Wide Web“ genannt. Es konnte nur Text anzeigen, aber spätere „Browser“ fügten dann auch die Fähigkeit Grafiken anzuzeigen hinzu. Damit einher ging die Entwicklung der heutigen Web Standards HTTP 2 und HTML 3 , welche ebenfalls auf Berners-Lee zurückgehen.
Marc Andreesen veröffentlichte 1994 einen Browser, der dem Web eine bis dato ungekannte Popularität jenseits der bisherigen Nutzerkreise und ein sehr schnelles Wachstum ermöglichte. Marc Andreesen gründete dazu die Firma „Mosaic Communications Corporation", später „Netscape Communication". Deren Browser „Netscape“ legte den Grundstein für die heutige Popularität und Verbreitung des Internet. ([10] u. [11])
1 European Organization for Nuclear Research
2 Hypertext Transfer Protocol
3 Hypertext Markup Language
11
3.1.2 Eigenschaften des klassischen Web
Das gegenwärtige Web ist in erster Linie eine Ansammlung von HTML-Seiten. Diese bilden einen virtuellen Behälter von Informationen. Der dezentralisierte Inhalt dieser Ansammlung von Webseiten wächst ständig, weil fortwährend neuer Inhalt in der Form von HTML-Seiten hinzugefügt wird. Auf der ganzen Welt beheimatete Webseiten-Programmierer erzeugen und erhalten diese Seiten aufrecht, indem sie verschiedenste Entwicklungsumgebungen verwenden, allerdings ohne dabei an einen verbindlichen Standard gebunden zu sein. Es besteht inzwischen sogar die Möglichkeit Inhalte der HTML-Seiten automatisch „on the fly“ aus Datenbanken generieren zu lassen (vgl. dazu [12]).
Die Kommunikation zwischen und innerhalb der HTML-Seiten wird durch offene Standards ermöglicht, von denen die meisten durch das W3C 1 verwaltet werden. HTML-Seiten können heute mit Hilfe der verschiedenen zur Verfügung stehenden „Browser“ auf einer Vielzahl von Geräten fast überall und jederzeit betrachtet und benutzt werden. Diese Webseiten sind demzufolge in erster Linie für den menschlichen Benutzer gestaltet und optimiert. ([9]: S. 2)
3.1.3 Vorteile des klassischen Web
Das Web wurde schnell populär, weil es die Bedürfnisse der Benutzer erfüllt. Die Möglichkeiten des Web im Hinblick auf den gemeinsamen Zugriff auf Informationen sind denen privater Netze weit überlegen. So wird die benötigte Zeit für das Auffinden und den Zugang zu Information dramatisch reduziert. Jeder, der Information benötigt, kann auf diese zugreifen und jeder, der dies möchte, kann selbst neue Information beisteuern. Dadurch wurden auch enorme Kosteneinsparungen in diesen Bereichen ermöglicht. Viele Vereinigungen ziehen aus dem heutigen Web einen großen Nutzen. Zum Beispiel wurde die OSI 2 durch die Webtechnologie wesentlich gestärkt.
1 World Wide Web Consortium, Deutsche URL: http://www.w3c.de/ [Stand 13.01.2006]
2 Open Source Initiative, URL: http://www.opensource.org/ [Stand 13.01.2006]
12
Leider ergeben sich aus der aktuellen, ungeordneten Struktur des Web auch diverse Probleme. Diese haben dazu geführt, dass über eine Weiterentwicklung nachgedacht wurde und wird, die helfen soll diese Probleme zu lösen. Welche neuen Anforderungen an ein Web der Zukunft gestellt werden, soll im Folgenden Kapitel näher betrachtet werden. ([9]: S. 3)
3.2 Anforderungen an ein neues Web
Obwohl sich das gegenwärtige Web geradezu unglaublich entwickelt hat, ist es nicht strukturiert genug, um den Erfordernissen einer fortschrittlichen computergestützten Verarbeitung des Inhalts gerecht zu werden. Das Web hat sowohl im privaten, als auch im geschäftlichen Umfeld eine dominante Rolle eingenommen. Dennoch sind die hier zur Verfügung gestellten Informationen nicht ausreichend verknüpft, um damit komplexe Abfragen oder Aktualisierungen computergestützt zu ermöglichen. Dafür wird eine andere Darstellung und Verarbeitung der Information benötigt. Natürlich ermöglichte erst die Einfachheit des gegenwärtigen Webs seinen Durchbruch. HTML-Seiten sind leicht zu erstellen. Jedoch führt gerade diese Einfachheit auch zu vielen Variationen bei der Strukturierung der HTML-Seiten und damit zu Problemen bei der computergestützten Verarbeitung. Bis heute liegt der Schwerpunkt beim Design einer HTML-Seite auf der Formatierung derselben. In Zukunft wird aber weitergehende Information benötigt werden, die auch die Semantik 1 der Information beschreibt. Semantik ist zwingend für die effiziente automatisierte Interpretation eines strukturierten Webinhalts erforderlich. ([9]: S. 4)
3.3 Die Lösung: Das Semantic Web
„The Semantic Web is not a separate Web but an extension of the current one, in
which information is given well-defined meaning, better enabling computers and
people to work in cooperation.“
([13]: S. 37)
1 Bedeutung
13
3.3.1 Entstehungsgeschichte
Das Konzept des „Semantic Web“ wurde ebenfalls von Berners-Lee ins Leben gerufen ([13]). Als der Erfinder des klassischen Web und als Direktor des W3C werden die Visionen von Berners-Lee hoch geschätzt und respektiert. Die DARPA 1 des DoD 2 war die erste Organisation, die in die Erforschung der Möglichkeiten des „Semantic Web“ investierte. Der wichtigste DARPA Beitrag zum „Semantic Web“ war die DAML 3 . DAML half wichtige „Semantic Web“ Konzepte zu definieren.
Die EU war ebenfalls am „Semantic Web“ interessiert. Ihre Wissenschaftler waren ebenso wie die US-Wissenschaftler vom Potential der Ontologien überzeugt. Ein Produkt der EU-Forschung war OIL 4 . Schließlich vereinigte ein gemeinsames EU/US-Projekt die beiden Konzepte OIL und DAML, um eine gemeinsame Sprache zu entwickeln. DAML+OIL war geboren. Das W3C startete anschließend eine Initiative, um eine gemeinsame Sprache für das „Semantic Web“ zu standardisieren. Die W3C WOG 5 stellte dann letztendlich im Februar 2004 die OWL der Öffentlichkeit vor. Damit hatte das „Semantic Web“ nun endgültig eine standardisierte Ontologiesprache erhalten, auf die im weiteren Verlauf dieser Arbeit noch detailliert eingegangen wird, da diese die Grundlage für die Beschreibung der Lernmaterialien bilden wird. ([9]: S. 16, [14]: S. 132f u. [15]: S. 2f)
3.3.2 Die Schichten Architektur des Semantic Web
Die einzelnen Ebenen des „Semantic Web“ lassen sich übersichtlich in einem graphischen Modell darstellen, das "Semantic Web Tower" oder auch "Semantic Web Layer Cake" genannt wird (Abb. 5). Da die Schichtenarchitektur des „Semantic Web“ aber nicht Gegenstand dieser Arbeit ist, sondern nur als
1 Defense Advanced Research Projects Agency
2 Department of Defense
3 DARPA Agent Markup Language
4 Ontology Interface Layer
5 Web Ontology Group
14
theoretische Basis dienen soll, wird auf eine weitergehende Beschreibung an dieser Stelle verzichtet. Stattdessen wird nur eine kurze Erläuterung zu den im weiteren Verlauf dieser Arbeit nicht oder nur am Rande behandelten Schichten „Logic“, „Proof“ und „Trust“ gegeben.
Die „Logic“-Schicht betrachtet die Korrektheit und Konsistenz der Daten und beinhaltet auch das logische Erschließen neuer Information aus den durch die Ontologie gelieferten Daten. Die „Proof“-Schicht erläutert das Zustandekommen dieser neuen Information, indem die einzelnen Schritte des Schließens im Rahmen der „Logic“-Schicht betrachtet werden. In der „Trust“-Schicht schließlich geht es um die Zuverlässigkeit bzw. Glaubwürdigkeit der Daten die zu den neuen Informationen geführt haben.
Dem interessierten Leser sei an dieser Stelle [16] als weiterführende Literatur in dieses Gebiet empfohlen.
Auf der Basis dieser Schichten Architektur wird nun eine für diese Arbeit modifizierte Variante vorgestellt und deren Schichten aus technologischer Sicht detailliert beschrieben.
15
3.4 Die modifizierten Schichten im Kontext dieser Arbeit
Der in Abb. 6 dargestellte, modifizierte „Semantic Web Layer Cake“ bildet die Grundlage für die nun folgende Ausarbeitung, der für eine Beschreibung von digitalen Lernmaterialien in Frage kommenden Technologien.
3.4.1 URIs und Namespaces
Die unterste Schicht ist die URI-Namespace-Schicht. Mit Hilfe der Standards dieser Schicht ist es später möglich, die im weiteren Verlauf dieser Arbeit mit RDF und OWL eingeführten Objekte und Instanzen zu referenzieren. Eine URI stellt ein einfaches und erweiterbares Konzept zur Verfügung, um eine physikalische oder abstrakte Ressource eindeutig zu identifizieren. Das Konzept der URIs wurde vom W3C entwickelt und ist im RFC 1 3986 vollständig beschrieben (vgl. dazu [18]). Demzufolge gibt es drei wichtige Formate, nämlich URI, URL 2 und URN 3 . URI ist der Überbegriff. URLs bilden somit eine Untermenge der URIs. Es sind diejenigen URIs, die mit „http://“ oder „ftp://“ oder ähnlich beginnen. URLs identifizieren Ressourcen über ihren Ort im Netz und
1 Request for Comments
2 Uniform Resource Locator
3 Uniform Resource Name
16
das Protokoll, über das auf sie zugegriffen wird. URNs bilden wiederum eine Untermenge der URIs, nämlich diejenigen Ressourcen, die, auch wenn sie ihren Ort im Web ändern, weltweit eindeutig identifizierbar bleiben sollen. Den Zusammenhang zwischen URI, URL und URN zeigt Abb. 8.
URIs haben eine vom W3C vorgegebene Syntax (vgl. dazu [18]):
17
Die Tatsache, dass es erlaubt ist beliebige URIs zu definieren, erfordert die Einführung von Namespaces. Die Syntax für die Einführung eines Namespaces ist:
xmlns:namespacePrefix=“nsURIref“
Die vollständige Referenz für diese (XML-)Namespaces findet sich in [19]. Die Einführung der Namespaces führt nun zwangsläufig zu den XML und XMLS Datentypen, welche im folgenden Kapitel beschrieben sind. ([6]: S. 89f u. 133, [9]: S. 49-57, [18] u. [19])
3.4.2 XML und XMLS Datentypen
Als Einstieg in dieses Kapitel zuerst ein kleiner Ausschnitt aus einem Interview von Jon Bosak, der bei vielen als der Erfinder der XML gilt: „Question: What's the most common nonsensical notion about XML?
Bosak: I guess that XML will, by itself, solve the information interchange problem. In reality, XML just clears away some of the syntactical distractions so that we can
get down to the big problem: how we arrive at common understandings about
knowledge representation. That's the biggie. XML says, "let's stop arguing about
how we're going to represent trees and how we're going to represent attribute/value
pairs." We'll just decide, "Let's do it [as XML]".”
([20])
XML ist eine auf Tags 1 basierende Metasprache, die verwendet wird um Domänen spezifische Grammatiken zu definieren. Eine Metasprache ist eine Sprache, die dazu benutzt wird andere Sprachen zu definieren. Also ist XML eine Metasprache, weil es mit ihr möglich ist Tags zu erzeugen, die die Struktur und Syntax von Dokumenten bestimmen. In [21] finden sich die vollständigen Empfehlungen der W3C für die XML. XML ist heute der de facto Standard für
1 Kürzel, das es erlaubt Textelemente zu formatieren und deren Darstellung zu beeinflussen.
18
den Austausch von strukturierten Inhalten im Web. Bei COTS 1 Anwendungen erfreut sich die XML ebenfalls großer Beliebtheit, was wohl weiter zu ihrer Verbreitung beitragen wird (vgl. dazu [22]: S.4f). Nachfolgendes Beispiel verdeutlicht den Aufbau eines einfachen XML Dokuments:
Man erkennt sofort, dass dieser Aufbau dem einer normalen HTML Seite sehr ähnlich ist. Jedes XML Dokument beginnt mit der Versionsangabe und ggf. dem sogenannten Encoding, z.B. ISO-8859-1 für deutsche Umlaute. Das Attribut „xml:lang“ enthält das Kürzel für die vorgegebene Sprache nach ISO 639 2 . Die Syntax der Tags sollte selbsterklärend sein, sie entspricht der gleichen Syntax wie sie auch bei den HTML Tags Verwendung findet. XMLS 3 ist ein wichtiger, zu XML gehörender Standard. XMLS stellt eine Umgebung zur Verfügung, um die Struktur von Dokumenten in XML ohne die Verwendung von DTDs 4 dokumentieren bzw. einschränken zu können. XMLS sieht dabei auch die Möglichkeit vor Datentypen zu definieren bzw. schon vorhandene wiederzuverwenden. Ein XML Dokument ohne entsprechendes XMLS macht demzufolge wenig Sinn.
Die W3C XMLS Spezifikation besteht aus drei Teilen („Primer“, „Structures“ und „Datatypes“), die unter [23] eingesehen werden können. Tab. 1 gibt eine Übersicht der wichtigsten XMLS Datentypen.
Es wurde dargestellt, dass XML in Kombination mit XMLS die Möglichkeit bietet Inhalte zu repräsentieren und Informationen auszutauschen. Dies ist für die
1 Commercial Off The Shelf
2 http://www.iso.org/ bzw. http://www.w3.org/WAI/ER/IG/ert/iso639.htm [Stand 13.01.2006]
3 XML Schema
4 Document Type Definitions
19
Strukturierung von Inhalten wichtig, für die Anforderungen an eine Beschreibung digitaler Lerninhalte allerdings nicht ausreichend. Das liegt schlicht daran, dass XML nur die Syntax und nicht die Semantik definiert. XML Tags sind ohne weitere Beschreibung für den Computer einfache Strings ohne jede Semantik. So wird z.B. eine Software zwischen den beiden Tags
Hier kommt nun das RDF ins Spiel, welches für diese Problematik eine vielversprechende Lösung anbietet und deshalb auch Bestandteil der nächsten zu behandelnden Schicht ist. ([6]: S. 129-136, [9]: S. 61-73, [21] u. [23])
20
3.4.3 RDF und RDF/XML
„The most fundamental benefit of RDF compared to other meta-data approaches is
that using RDF, you can say anything about anything. Anyone can make RDF statements about any identifiable resource. Using RDF, the problems of extending
meta-data and combining meta-data of different formats, from different schemas
disappear, as RDF does not use closed documents.”
([24])
Das RDF wird im weiteren Verlauf dieser Arbeit dazu verwendet, um OWL Instanzen bzw. Individuen zu beschreiben. Hier soll es nun zunächst aber nur darum gehen einen Überblick über das RDF zu bekommen. Dazu werden im Folgenden die wichtigsten Eigenschaften näher betrachtet.
3.4.3.1 RDF und Metadaten
Ursprünglich wurde das RDF entwickelt, um damit Metadaten zu verschlüsseln. RDF wird deshalb oft als eine Standardsprache für Metadaten betrachtet. Metadaten ist ein in sehr vielen Bereichen verwendeter Begriff, der deshalb auch viel Raum für Interpretationen lässt. Dies hat dazu geführt, dass nicht immer klar ist, wie sich der Zusammenhang zwischen RDF und OWL in dieser Beziehung darstellt.
Im Prinzip leistet das RDF im OWL Kontext zwei Arten von Metadatenunterstützung. Einmal die Metadaten auf der Dokumentenebene, wie z.B. Titel, Autor und Datum. Die zweite Art von Metadaten bezieht sich auf die Metadaten, die in der Regel durch die XML Tags eines Dokuments beschrieben werden, also Metadaten auf der Dokumentenbeschreibungsebene, wie z.B. Überschrift, Beispiel oder Schwierigkeit. Diese Art von Metadaten wird im Rahmen dieser Arbeit mit Hilfe der Ontologie beschrieben werden und somit nicht mehr mit XML, sondern OWL implementiert.
Arbeit zitieren:
Ralf Degle, 2005, Ontologie-basierte Beschreibung digitaler Lernmaterialien, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Erfolgsfaktoren im Relationship Marketing bei mittelständischen Untern...
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Diplomarbeit, 122 Seiten
Qualitatives Räumliches Schließen - Repräsentation qualitativ-räumlich...
Erstellen einer Experimentierp...
Informatik - Internet, neue Technologien
Bachelorarbeit, 86 Seiten
State of the Art des IT-Service Managements
Informatik - Wirtschaftsinformatik
Diplomarbeit, 244 Seiten
Die Rückzahlung von Fortbildungskosten in der neueren Rechtsprechung
Jura - Zivilrecht / Arbeitsrecht
Wissenschaftlicher Aufsatz, 13 Seiten
Ralf Degle's Text Ontologie-basierte Beschreibung digitaler Lernmaterialien ist nun auf dem Buchmarkt erhältlich
Ralf Degle hat den Text Ontologie-basierte Beschreibung digitaler Lernmaterialien veröffentlicht
Ralf Degle hat einen neuen Text hochgeladen
Softwareagenten im Einsatz
Hermann Drewes, Alan H. Dodson, Pedro Sandoval, Laura Sanchez, Luiz P. S. Fortes
Wirksamkeit multimedialer Lernmaterialien
Kritische Bestandsaufnahme und...
Anja Zwingenberger
Lernaufgaben und Lernmaterialien im kompetenzorientierten Unterricht
Sebastian Peters, Stephanie Schlump, Stefan Schmit, Hanna Kiper, Waltraud Meints
A Zimmermann
0 Kommentare