Mikrokosmos Ontology


Hausarbeit (Hauptseminar), 2002
23 Seiten, Note: 2+

Leseprobe

Inhaltsverzeichnis

1 Einleitung

2 Die Mikrokosmos Ontology

3 Aufbau der Mikrokosmos Ontology
3.1 Lexikon und Ontologie
3.2 Struktur der Ontologie
3.3 Struktur eines Konzepts

4 Wozu wird die Ontologie gebraucht?
4.1 Auflösung von Ambiguität, Metapher und Metonymie
4.1.1 Ambiguität
4.1.2 Folgerungen aus Lücken schließen
4.1.3 Metonymie

5 Fazit

Literatur- und Quellenverzeichnis

Anhang

1 EINLEITUNG

Die Suchmaschine Google zeigt in ihrem Startfenster immer die aktuelle Anzahl der Dokumente an, die in der Google Datenbank erfasst sind. Am 28.08.02 waren das etwa 2,5 Milliarden Web-Seiten (Abbildung 1-1)

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-1

Diese Zahl stellt nicht den gesamten Inhalt des WWW dar und schon gar nicht die damit verknüpften Inhalte, die Firmen- und Universitätsnetze bieten. Die Vorstellung, aus diesem gigantischen Haufen eine brauchbare Information zu extrahieren, scheint absurd. Suchmaschinen bewältigen höchstens die Aufgabe, die gesuchten Wörter in Web-Seiten zu finden. Eine Frage wie: „Was kommt nach dem Graduale?“ gibt als Antwort alle Web-Seiten, in denen diese Abfolge von Wörtern vorkommt, aber nicht die eigentliche Antwort auf diese Frage: “Nach dem Graduale kommt das Alleluia.“ Durch das Lesen der Ergebnisdokumente würde diese Antwort wahrscheinlich auch irgendwann zustande kommen. Jedoch ist schon der Begriff „Graduale“ so mehrdeutig, dass es nicht nur eine Antwort auf diese Frage gibt.

Das Graduale Romanum oder auch Graduale Triplex bezeichnet z.B. ein Buch, das die Ge- sänge der Messe enthält, während das Gra- duale ein in der Messe vorkommender Gesang ist, auf den das Alleluia folgt (Abbildung 1- 2). Im Semantik Web von Tim Berners Lee2 soll die Beantwortung solcher Fragen möglich sein. Lee geht davon aus, das sich im Web die Antworten schon befinden, nur eben noch nicht in der Form, die für die maschinelle Beantwortung nötig wäre. Deshalb müssten die Inhalte der Web-Seiten in relationale Datenbanken gespeichert werden. Eine einfa- che Vorstellung für eine relationale Daten- bank wäre in diesem Fall eine zweispaltige Datenbank mit einer Zeitspalte und einer Na- mensspalte, in der die chronologische Reihen- folge der Messeteile steht. Die Beziehungen zwischen den Spalten wird Relation genannt und stellt damit die Semantik des Semantik Web dar. In dieser Datenbank sollen also alle Informationen so abgespeichert sein, dass der Computer mit ihnen selbstständig die Fragen beantworten kann. (Das maschinelle Erstellen von Antworten auf vom Menschen gestellte Fragen fällt übrigens in die Disziplin „natural language processing“ oder NLP. NLP ist eine

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-21 der vielen Disziplinen, die sich um das Haupt-

thema „künstliche Intelligenz“ drehen. Ma- chine Translation (MT) gehört ebenfalls da- zu.)

Wenn bei einem NLP-Vorgang eine Frage an diese Datenbank gestellt wird, muss vor allem eines funktionieren: Das Einordnen der Information in die richtigen Teile der Da- tenbank. Dies erfordert einen Entscheidungsprozess, nämlich wozu die Information be- nötigt wird und in welchem Kontext sie auftaucht. Etwa, dass mit Graduale ein Begriff aus der Musik gemeint ist, oder noch näher: ein Begriff aus der Kategorie Musik und der Unterkategorie Liturgie.

Dafür wird ein Modell benötigt, dass über dieses Wissen verfügt. Und mehr noch: es sollte sogar Relationen der Kategorien untereinander beinhalten. Die Bedeutung von „kommt nach“, die das Alleluia und das Graduale in eine Relation setzt, muss in diesem Modell verankert sein. Solch ein Modell wird in der Computerlinguistik „Ontologie“ genannt. Seinen Beitrag zur maschinellen Übersetzung leistet dieses Modell z.B. in der Mikrokosmos Ontology, mit der sich diese Seminararbeit auseinandersetzt.

Diese Seminararbeit entstand im Rahmen des Seminars „Computerlinguistische Aspekte des Semantik Web“ im Sommersemester 2002, betreut von Prof. Dr. Franz Guenthner und MA Jörg Schuster am Centrum für Informations- und Sprachverarbeitung (CIS) an der Ludwig-Maximilians-Universität München. In diesem Seminar wurde über die Möglichkeiten und die prinzipielle Realisation des Semantik Web diskutiert und als Beispiel für Ontologien die Mikrokosmos Ontologie der New Mexico State University genannt. Im Wesentlichen stützt sich diese Arbeit auf den Text „Ontology Development for Machine Translation: Ideology and Methodology“ von Kavi Mahesh aus dem Jahre 1995.

2 DIE MIKROKOSMOS ONTOLOGY

Eine Ontologie ist „das Set von Symbolen und möglichen Beziehungen zwischen ih- nen“3. Diese Definition wird von Kavi Mahesh folgendermaßen erklärt: Um einen Text maschinell übersetzen zu können, muss er zunächst in einer sprachneutralen Computer- repräsentation vorliegen. Diese wird „interlingual meaning representation“ (TMR) ge- nannt. Die Ontologie und Computerlexika helfen, diese TMR zu erstellen. In der Onto- logie ist das Weltwissen maschinell gespeichert, so dass die Repräsentation des Textes, der übersetzt werden soll, mit der Welt, wie sie in der Ontologie beschrieben wird, ver- glichen werden kann.

Im Wesentlichen besteht die Ontologie aus den Konzepten (Concepts) und den Relatio- nen, die sie verknüpfen. Ein mögliches Konzept für das Graduale und das Alleluia wäre z.B. Propriumsgesang, was einen Teil der Gesänge der Messe beschreibt, die sich auf Grund des Anlasses der Messe verändern. An einem Tag wird das Stück xy im Graduale gesungen und am anderen Tag das Stück xz. Allerdings ist bereits hier eine wichtige Unterscheidung zu machen, zwischen dem konkreten Graduale, das jetzt im Moment in der Kirche gesungen wird, und dem Begriff „Graduale“. Der Begriff Graduale be- schreibt einen Gesang. Das Konzept heißt also nicht Graduale sondern Gradualgesang. Von diesem Konzept können Instanzen erstellt werden, die die einzelnen konkreten Gradualgesänge darstellen. Instanzen sind aber kein Bestandteil der Ontologie, sondern werden aus der Ontologie erstellt. Der Gradualgesang gehört zu dem Propriumsgesang, der wiederum zum Messgesang gehört. Es bildet sich also ein Baum, bei dem die Kin- der immer eine Art der Eltern sind. Der Gradualgesang ist das Kind vom Propriumsge- sang und damit eine Art des Propriumsg esangs.

Auf diese Weise soll ein Netzwerk aus Konzepten entstehen, eine Repräsentation eines Wissensgebiets und im Idealfall eine Darstellung der Welt zustande kommen. Die Ein- zelteile werden durch semantische Relationen (semantic relations) noch dichter ver- knüpft. Bezogen auf die Mikrokosmos Ontology schreibt Mahesh davon, dass diese Ontologie im Zusammenhang mit anderen Mikrotheorien eingesetzt werden kann, um den Prozess der NLP (natural language processing) zu unterstützen. Auf diese Mirko- theorien wird im Text und in dieser Arbeit aber nicht näher eingegangen.

3 AUFBAU DER MIKROKOSMOS ONTOLOGY

3.1 Lexikon und Ontologie

Die Einführung in die Mikrokosmos Ontology führt zu der Erkenntnis, dass sie nur mit einem zusätzlichen Element funktionsfähig ist. Die Rede ist von dem Lexikon. In ihm müssen die lexikalischen Eigenschaften des Wortes stehen, etwa die Wortart und die damit verbundenen syntaktischen Eigenschaften wie Person bei Verben oder Genus bei Nomen. Im Mikrokosmosübersetzungsprozess hat die Ontologie keinen Einfluss auf die Übersetzung der Syntax, wie in Abbildung 3-1 zu sehen ist.

Dafür wird die Rolle, die die Ontologie bei der se- mantischen Übersetzung spielt, hervorgehoben, woraus zu schließen ist, dass hier die Hauptfunktion der Ontologie liegt, und nicht in der syntaktischen Übersetzung. Zur Verdeut- lichung des Zusammen- hangs zwischen Lexikon und Ontologie dient die Abbildung 3-2. Hier gibt es eine Verbindung zwischen dem Lexikoneintrag eines Wortes zu einem Konzept

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3-1 in der Ontologie.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3-2

Wie diese Verknüpfung der Ontologie mit dem Lexikon bei der Übersetzung hilft, er- klärt folgendes Beispiel: In einem französischen Lexikon steht der Eintrag „écraser“. „Écraser“ würde im Deutschen mit „ausdrücken“, „zertreten“ oder „zermalmen“ über- setzt. Dies sind alles physikalische Vorgänge. Im deutschen Lexikon stehen mehrere Einträge für „ausdrücken“, da das Wort in verschiedenen Kontexten verschiedene Be- deutungen hat. Eine Person kann eine Zigarette ausdrücken oder eine Idee. Die Wörter aus dem Lexikon werden mit den Konzepten in der Ontologie fest verbunden. In der Ontologie erscheint also nur ein Konzept für das Wort „écraser“ und „ausdrücken“, weil die Repräsentation der Bedeutung der beiden Wörter identisch ist. Die Wörter „écraser“ und „ausdrücken“ werden z.B. durch die Zeichen [ausdrücken] repräsentiert. Die ecki- gen Klammern sollen anzeigen, dass es sich hier um die Bedeutung des Wortes handelt und nicht um das Wort selbst. Ebenso könnte in den eckigen Klammern auch [xyz] ste- hen. Wichtig ist nur, dass eine statische Verbindung zwischen den Lexikoneinträgen „écraser“ und „ausdrücken“ zum Konzept [ausdrücken] in der Ontologie besteht (hier markiert durch die Pfeile)4. Die Bedeutung der Wörter hängt stark von ihren Modifizie- rern (xt1 und yt1) ab. In dem Fall, in dem eine Person eine Zigarette ausdrückt, bezeich- net yt1 ein konkretes Objekt, etwas was anfassbar ist: xt1 [ausdrücken] yt1 . Die andere Bedeutung -das Ausdrücken einer Idee- erfordert dann an der Y-Stelle ein „abstraktes“ Objekt. Wir nennen es yt2 wobei t2 “abstraktes“ bedeutet: xt1 [ausdrücken] yt2. Sobald in dieser Arbeit auf die Struktur eines Konzepts eingegangen wird, wird klarer, wo die Modifizierer in den Konzepten stecken.

Die Frage wird immer wieder aufgeworfen, wie ein System, das mit primitiven Symbo- len arbeitet und von sich behauptet sprachunabhängig zu sein, überhaupt funktionieren kann. Oft benutzt sie nämlich für die Definition von Bedeutungen die Wörter, aus denen die Bedeutung besteht. Und es macht wenig Sinn, ein Wort durch die Benutzung des- selben Wortes zu definieren. Die Antwort ergibt sich durch die Verknüpfung mit einem Lexikon. Ein System ohne Lexikon würde im luftleeren Raum hängen, da es dann nur aus verknüpften Symbolen bestehen würde, die keine Bedeutung hätten.

3.2 Struktur der Ontologie

Im letzten Beispiel wurde das Wort „ausdrücken“ aus dem Lexikon auf ein Konzept in der Ontologie abgebildet.

[...]


1 Michels, Ulrich:dtv-Atlas Musik, Band 1, Deutscher Taschenbuch Verlag, München, 2000

2 Berners Lee, Tim: Weaving the Web, Harper,San Francisco,1999

3 Mahesh, Kavi: Ontology Developement for MT: Ideology and Methodology, New Mexico State University, USA, 1995

4 Im späteren Verlauf werden Konzeptnamen immer in Großbuchstaben geschrieben.

Ende der Leseprobe aus 23 Seiten

Details

Titel
Mikrokosmos Ontology
Hochschule
Ludwig-Maximilians-Universität München  (Centrum für Informations- und Sprachverarbeitung)
Veranstaltung
Computerlinguistische Aspekte des Semantic Web
Note
2+
Autor
Jahr
2002
Seiten
23
Katalognummer
V7599
ISBN (eBook)
9783638148108
Dateigröße
829 KB
Sprache
Deutsch
Anmerkungen
Die Bezeichnung des Fachs ist Computerlinguistik. Sehr dichte Arbeit. 547 KB
Schlagworte
Ontologie, Computerlinguistik
Arbeit zitieren
Ramon Schalleck (Autor), 2002, Mikrokosmos Ontology, München, GRIN Verlag, https://www.grin.com/document/7599

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Mikrokosmos Ontology


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden