Please wait
Please install the Adobe Flash Player if no e-book is displayed.
Scholary Paper (Seminar), 2003, 8 Pages
Author: Susanne Matthäs
Subject: Computer Science - Miscellaneous
Details
Institution/College: University of Vienna (Artificial Intelligence)
Tags: Automatische, Disambiguierung, Wortbedeutungen, Proseminar
Year: 2003
Pages: 8
Grade: 2
Language: German
ISBN (E-book): 978-3-638-24634-7
File size: 56 KB
Other users also were interested in the following titles:
Excerpt (computer-generated)
Universität Wien
Automatische Disambiguierung von Wortbedeutungen
Susanne Matthäs
Zusammenfassung.
Diese Arbeit gibt einen kurzen Überblick über die Disambiguierung von Wortbedeutungen und wie das ihr zugrundeliegende Prinzip funktioniert. Arbeitsweisen und Methoden dieses Forschungsgebietes werden vorgestellt. Des weiteren werden Probleme der WSD vorgestellt sowie Lösungsansätze um eine möglichst hohe Disambiguierungsrate zu erzielen.
Inhaltsverzeichnis
1 Einleitung
2 Integrierte Wörterbücher und Homographen
3 Word Sense Tagger
4 Probleme der WSD
5 Ein Lösungsansatz zur WSD
6 Zusammenfassung und Diskussion
7 Danksagung
8 Literatur
1 Einleitung
Die automatische Disambiguierung von Wortbedeutungen, im folgenden WSD (Word Sense Disambiguierung) genannt, ist ein aktuelles Forschungsthema, das sich mit der „Entmehrdeutung“ von Wörtern innerhalb eines Textes beschäftigt.
Anwendungsgebiete dieses Prozesses, der jedem Wort den entsprechenden Sinn zuordnen soll, sind mitunter die Übersetzung von Texten sowie das Verstehen einer Sprache.[1] Innerhalb eines Dokumentes können homonyme Wörter [2], wie „Bank“, „Schloss“ oder „Stock“ und polyseme Wörter [2] und Wortgruppen wie „das sagt mir nichts“ oder „er sagt mir etwas“ auftreten. Diese Wörter besitzen 2 oder mehr Bedeutungen und können sogar unterschiedlichen Wortarten angehören. So steht „Bank“ auf der einen Seite für die „Sitzgelegenheit“, auf der anderen Seite für die „Institution“.
Die Aufgabe der WSD ist es, die jeweils richt ige Bedeutung dem entsprechenden Wort zuzuweisen. Im Laufe der Entwicklung der WSD wurden verschiedene Verfahren entwickelt, um eine möglichst hohe Rate korrekter Bedeutungszuordnungen zu erzielen. Werkzeuge der Disambiguierung bilden die „Part-of-Speech Tagger“[2] und integrierte Wörterbücher [3].
2 Integrierte Wörterbücher und Homographen
Integrierten Wörterbücher sind eine Grundlage der WSD. Jedem Disambiguierungsalgorithmus liegt ein solches Bedeutungswörterbuch zugrunde. Die Wörterbücher selbst unterscheiden sich in der Anzahl der gespeicherten Wörter, der Sprache(n) und in den angelegten Homographen [2]. So sind einige fähig zwischen den Sprachen, also multilingual, zu arbeiten, andere hingegen nicht.
Die Wahl des Wörterbuches kann somit die Leis tungsfähigkeit eines Programms zur Disambiguierung von Wortbedeutungen mitbestimmen. Im Folgenden werden das LDOCE, ULTRA und WordNet näher erklärt:
LDOCE (Longman Dictionary of Contemporary English). Das LDOCE ist ein vollständiges Englischwörterbuch, was ursprünglich für Studenten geschrieben wurde. [2]
Es besteht aus 41.000 Hauptwörtern, die in Termen mit 72.000 Wortbedeutungen definiert sind. Neben diesen Eigenschaften enthält das LDOCE außerdem grammatikalische Kategorien und Unterkategorien, die eine Disambiguierung erleichtern sollen. [3]
ULTRA (Universal Language Translator). Das ULTRA ist ein multilinguales System, welches dazu in der Lage ist auch zwischen verschiedenen Sprachen (Englisch, Chinesisch, Deutsch, Japanisch und Spanisch) zu übersetzen. Das ULTRA enthält demzufolge 2 verschiedene Lexikas. Eines, welches zwischen den Sprachen die entsprechend übersetzten Worte disambiguiert und eines, welches in der gleichen Sprache einem Wort oder einer Wortgruppe die entsprechende Bedeutung zuordnet. [3]
WordNet. Das WordNet ist eine sehr große Wissensbasis, die englische Verben, Substantive und Adjektive enthält, die ebenfalls in einer Form von Homographen angeordnet sind. Die Homographen werden je nach Häufigkeit im SemCor einsortiert, damit die Disambiguierung leichter fällt. Das WordNet ist dem LDOCE sehr ähnlich. [4]
Auf einem Homographen werden die möglichen Bedeutungen eines Wortes zusammengefasst. Nach Wilks und Stevenson [2] besitzt das Wort „Bank“ bspw. Folgende 5 Bedeutungen auf einem Homographen (zusätzlich zu den 2 bereits genannten).
1 Land entlang der Seite eines Flusses, Sees, etc.
2 Erde, die zu einem Haufen aufgetürmt wird, oftmals zur Ziehung einer Grenze
3 Eine Ansammlung von Wolken, Schlamm, Schnee, etc.
4 Absperrungen einer Rennstrecke, um diese für Fahrer sicherer zu machen
5 Sandbank
[....]
Comments
No comments yet
Other users also were interested in the following titles:
Das Phänomen der männlichen Eifersucht bei Max Frisch
Author: Dagmar WallkuschGerman Studies - Modern German Literature, 2001 Download as PDF-file for 9,99 EUR
Die Darstellung der Weiblichkeit in den Werken Max Frischs. Rollen und deren Darstellung.
Author: Jessica KarcherGerman Studies - Modern German Literature, 2002 Download as PDF-file for 2,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für Microsoft Word
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für OpenOffice.org
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 9,99 EUR
Formatvorlage zur Erstellung einer Diplomarbeit / Vorlage zur Erstellung einer Hausarbeit
Author: Marco FeindlerPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2008 Download as PDF-file for 6,99 EUR
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wissenschaftlichen Arbeit
Author: Zoran ZivkovicPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Erstellen einer schriftlichen Hausarbeit
Author: Claudia NickelPresentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR
Grundtechniken wissenschaftlichen Arbeitens
Author: Maik PhilippPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - Hausarbeiten - Seminararbeiten
Author: Mark RichterPresentations, Models, Tutorials, Instructions, 2008
This text can be quoted and accessed from this url: