Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
Automatische Disambiguierung von Wortbedeutungen close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

Automatische Disambiguierung von Wortbedeutungen

Scholary Paper (Seminar), 2003, 8 Pages
Author: Susanne Matthäs
Subject: Computer Science - Miscellaneous

Details

Category: Scholary Paper (Seminar)
Year: 2003
Pages: 8
Grade: 2
Language: German
Archive No.: V20872
ISBN (E-book): 978-3-638-24634-7

File size: 56 KB


Excerpt (computer-generated)

Universität Wien

Automatische Disambiguierung von Wortbedeutungen

Susanne Matthäs

 

Zusammenfassung. 
Diese Arbeit gibt einen kurzen Überblick über die Disambiguierung von Wortbedeutungen und wie das ihr zugrundeliegende Prinzip funktioniert. Arbeitsweisen und Methoden dieses Forschungsgebietes werden vorgestellt. Des weiteren werden Probleme der WSD vorgestellt sowie Lösungsansätze um eine möglichst hohe Disambiguierungsrate zu erzielen.

Inhaltsverzeichnis

1 Einleitung

2 Integrierte Wörterbücher und Homographen

3 Word Sense Tagger

4 Probleme der WSD

5 Ein Lösungsansatz zur WSD

6 Zusammenfassung und Diskussion

7 Danksagung

8 Literatur

 

1 Einleitung

Die automatische Disambiguierung von Wortbedeutungen, im folgenden WSD (Word Sense Disambiguierung) genannt, ist ein aktuelles Forschungsthema, das sich mit der „Entmehrdeutung“ von Wörtern innerhalb eines Textes beschäftigt.

Anwendungsgebiete dieses Prozesses, der jedem Wort den entsprechenden Sinn zuordnen soll, sind mitunter die Übersetzung von Texten sowie das Verstehen einer Sprache.[1] Innerhalb eines Dokumentes können homonyme Wörter [2], wie „Bank“, „Schloss“ oder „Stock“ und polyseme Wörter [2] und Wortgruppen wie „das sagt mir nichts“ oder „er sagt mir etwas“ auftreten. Diese Wörter besitzen 2 oder mehr Bedeutungen und können sogar unterschiedlichen Wortarten angehören. So steht „Bank“ auf der einen Seite für die „Sitzgelegenheit“, auf der anderen Seite für die „Institution“.

Die Aufgabe der WSD ist es, die jeweils richt ige Bedeutung dem entsprechenden Wort zuzuweisen. Im Laufe der Entwicklung der WSD wurden verschiedene Verfahren entwickelt, um eine möglichst hohe Rate korrekter Bedeutungszuordnungen zu erzielen. Werkzeuge der Disambiguierung bilden die „Part-of-Speech Tagger“[2] und integrierte Wörterbücher [3].

2 Integrierte Wörterbücher und Homographen

Integrierten Wörterbücher sind eine Grundlage der WSD. Jedem Disambiguierungsalgorithmus liegt ein solches Bedeutungswörterbuch zugrunde. Die Wörterbücher selbst unterscheiden sich in der Anzahl der gespeicherten Wörter, der Sprache(n) und in den angelegten Homographen [2]. So sind einige fähig zwischen den Sprachen, also multilingual, zu arbeiten, andere hingegen nicht.

Die Wahl des Wörterbuches kann somit die Leis tungsfähigkeit eines Programms zur Disambiguierung von Wortbedeutungen mitbestimmen. Im Folgenden werden das LDOCE, ULTRA und WordNet näher erklärt:

LDOCE (Longman Dictionary of Contemporary English). Das LDOCE ist ein vollständiges Englischwörterbuch, was ursprünglich für Studenten geschrieben wurde. [2]

Es besteht aus 41.000 Hauptwörtern, die in Termen mit 72.000 Wortbedeutungen definiert sind. Neben diesen Eigenschaften enthält das LDOCE außerdem grammatikalische Kategorien und Unterkategorien, die eine Disambiguierung erleichtern sollen. [3]

ULTRA (Universal Language Translator). Das ULTRA ist ein multilinguales System, welches dazu in der Lage ist auch zwischen verschiedenen Sprachen (Englisch, Chinesisch, Deutsch, Japanisch und Spanisch) zu übersetzen. Das ULTRA enthält demzufolge 2 verschiedene Lexikas. Eines, welches zwischen den Sprachen die entsprechend übersetzten Worte disambiguiert und eines, welches in der gleichen Sprache einem Wort oder einer Wortgruppe die entsprechende Bedeutung zuordnet. [3]

WordNet. Das WordNet ist eine sehr große Wissensbasis, die englische Verben, Substantive und Adjektive enthält, die ebenfalls in einer Form von Homographen angeordnet sind. Die Homographen werden je nach Häufigkeit im SemCor einsortiert, damit die Disambiguierung leichter fällt. Das WordNet ist dem LDOCE sehr ähnlich. [4]

Auf einem Homographen werden die möglichen Bedeutungen eines Wortes zusammengefasst. Nach Wilks und Stevenson [2] besitzt das Wort „Bank“ bspw. Folgende 5 Bedeutungen auf einem Homographen (zusätzlich zu den 2 bereits genannten).


1 Land entlang der Seite eines Flusses, Sees, etc.
2 Erde, die zu einem Haufen aufgetürmt wird, oftmals zur Ziehung einer Grenze
3 Eine Ansammlung von Wolken, Schlamm, Schnee, etc.
4 Absperrungen einer Rennstrecke, um diese für Fahrer sicherer zu machen
5 Sandbank

[....]


Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:

Erstellen einer schriftlichen Hausarbeit

Author: Claudia Nickel
Presentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR

Grundtechniken wissenschaftlichen Arbeitens

Author: Maik Philipp
Presentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR

This text can be quoted and accessed from this url:

http://www.grin.com/e-book/20872/automatische-disambiguierung-von-wortbedeutungen
please wait Please wait