Please wait
Please install the Adobe Flash Player if no e-book is displayed.
Scholarly Paper (Advanced Seminar), 2006, 27 Pages
Author: Steffen Kuegler
Subject: German Studies - Linguistics
Details
Institution/College: http://www.uni-jena.de/ (Institut für Germanistische Sprachwissenschaft)
Tags: Abkürzungen, Akronyme, Verfahren, Erkennung, Abkürzungen, Auflösung, Mehrdeutigkeiten, Texten, Namen, Verfahren, Erkennung
Year: 2006
Pages: 27
Grade: 1,3
Bibliography: ~ 7 Entries
Language: German
ISBN (E-book): 978-3-638-50208-5
ISBN (Book): 978-3-638-66377-9
File size: 227 KB
Other users also were interested in the following titles:
Abstract
Ein wichtiger Bestandteil der Schriftsprache sind die vielfältigen Formen von Abkürzungen. Während die Anzahl von Texten, Publikationen und Mitteilungen immer rasanter wächst, ist es wichtig, dass Abkürzungen und deren Bedeutungen immer richtig vom jeweiligen Rezipienten erkannt und verstanden werden. Je komplizierter und größer der Wortschatz jedoch wird, desto schwieriger wird es ebenfalls, dieses Gebot zu erfüllen. Vor allem in wissenschaftlichen Sprachzweigen stellt es daher eine immense Herausforderung dar, Abkürzungen in den ständig neuen Veröffentlichungen richtig ihren jeweiligen Bedeutungen zuzuordnen. Vor allem durch die rasante Neuschöpfung von Abkürzungen und die kaum noch zu gewährleistende Aktualität von entsprechenden Abkürzungswörterbüchern, kann diese Aufgabe von Hand kaum mehr erledigt werden. Darüber hinaus kommt dazu noch das Problem, dass viele Abkürzungen und Bedeutungen häufig mehrdeutig in Texten vorkommen und neben der zuverlässigen Erkennung auch die Auflösung dieser ambigen Begriffen stehen muss. Für fachspezifische Domänen, bestimmte Berufszweige und die vielfältigen Forschungsbemühungen ist daher die automatisierte Informationsextraktion und -Verarbeitung eines der wesentlichsten Ziele der computerlinguistischen Behandlung von Abkürzungen und Begriffen. In der vorliegenden Arbeit sollen einige Verfahren vorgestellt werden, die sich mit der automatischen Erkennung von Abkürzungen und deren Auflösung zu der entsprechenden Langform beschäftigen. Dies wird am Beispiel des biomedizinischen Arbeitsgebiets geschehen, da hier ein sehr großer und exemplarischer Forschungsaufwand besteht. Darüber hinaus soll eine Auswahl an Methoden erläutert werden, welche mehrdeutigen Abkürzungen und Terme ihre eigentlichen kontextuellen Bedeutungen zuweisen sollen. Zunächst soll jedoch eine Einführung die Gründe und Ursachen für die Bedeutsamkeit von Abkürzungen beleuchten und unterschiedliche Typen von Abkürzung darstellen. Besonderes Augenmerk soll dabei auf Akronymen liegen, die den Drang nach Einfachheit in der Sprache wohl am besten verkörpern. Im Hauptteil der Arbeit wird deutlich werden, dass sich einige Methoden neben der Behandlung von gewöhnlichen Abkürzungen auch maßgeblich mit der Erkennung und Auflösung von Akronymen beschäftigen. Doch auch Lösungsansätze für Spezialfälle wie Gen- und Proteinbezeichnungen, welche ebenfalls Abkürzungen darstellen, werden vorgestellt.
Excerpt (computer-generated)
Friedrich-Schiller-Universität Jena
Philosophische Fakultät
Institut für Germanistische Sprachwissenschaft
Wintersemester: 2005/2006
HS: „Namen – Verfahren zu ihrer Erkennung und Interpretation“
Abkürzungen und Akronyme - Verfahren zur automatischen Erkennung
von Abkürzungen und Auflösung von Mehrdeutigkeiten in biomedizinischen Texten
von
Steffen Kügler
(9. Fachsemester)
Inhaltsverzeichnis 1
1. Einleitung 2
2. Abkürzungen 3
2.1. Varianten von Abkürzungen 3
2.2. Phänomene 5
2.3. Abkürzungsgebrauch in der Wissenschaft 5
3. Automatische Erkennung von Abkürzungen 6
3.1. Methode von Schwartz und Hearst 6
3.1.1. Precision und Recall 10
3.1.2. Resultate 12
3.2. Methode von Taghva und Gilbreth 13
3.2.1. Phase 1 13
3.2.2. Phase 2 14
3.2.3. Phase 3 14
3.2.4. Phase 4 15
3.2.5. Resultate 16
3.3. Methode von Yu, Hripcsak und Friedman 17
3.3.1. Phase 1 17
3.3.2. Phase 2 18
3.3.3. Resultate 18
3.3.4. Erweiterung der Methode für Gen- und Proteinbezeichnungen 19
4. Auflösung von Mehrdeutigkeiten 20
4.1. Methode von Liu, Lussier und Friedman 21
4.1.1. Phase 1 21
4.1.2. Phase 2 22
4.1.3. Resultate 22
4.2. Weitere Methoden 23
4.2.1. Methode von Pakhmov 23
4.2.2. Methode von Nenadic, Spasic und Ananiadou 23
5. Ausblick 24
6. Referenzen 26
1. Einleitung
Ein wichtiger Bestandteil der Schriftsprache sind die vielfältigen Formen von Abkürzungen. Während die Anzahl von Texten, Publikationen und Mitteilungen immer rasanter wächst, ist es wichtig, dass Abkürzungen und deren Bedeutungen immer richtig vom jeweiligen Rezipienten erkannt und verstanden werden. Je komplizierter und größer der Wortschatz jedoch wird, desto schwieriger wird es ebenfalls, dieses Gebot zu erfüllen. Vor allem in wissenschaftlichen Sprachzweigen stellt es daher eine immense Herausforderung dar, Abkürzungen in den ständig neuen Veröffentlichungen richtig ihren jeweiligen Bedeutungen zuzuordnen. Vor allem durch die rasante Neuschöpfung von Abkürzungen und die kaum noch zu gewährleistende Aktualität von entsprechenden Abkürzungswörterbüchern, kann diese Aufgabe von Hand kaum mehr erledigt werden. Darüber hinaus kommt dazu noch das Problem, dass viele Abkürzungen und Bedeutungen häufig mehrdeutig in Texten vorkommen und neben der zuverlässigen Erkennung auch die Auflösung dieser ambigen Begriffen stehen muss. Für fachspezifische Domänen, bestimmte Berufszweige und die vielfältigen Forschungsbemühungen ist daher die automatisierte Informationsextraktion und -Verarbeitung eines der wesentlichsten Ziele der computerlinguistischen Behandlung von Abkürzungen und Begriffen.
In der vorliegenden Arbeit sollen einige Verfahren vorgestellt werden, die sich mit der automatischen Erkennung von Abkürzungen und deren Auflösung zu der entsprechenden Langform beschäftigen. Dies wird am Beispiel des biomedizinischen Arbeitsgebiets geschehen, da hier ein sehr großer und exemplarischer Forschungsaufwand besteht. Darüber hinaus soll eine Auswahl an Methoden erläutert werden, welche mehrdeutigen Abkürzungen und Terme ihre eigentlichen kontextuellen Bedeutungen zuweisen sollen. Zunächst soll jedoch eine Einführung die Gründe und Ursachen für die Bedeutsamkeit von Abkürzungen beleuchten und unterschiedliche Typen von Abkürzung darstellen. Besonderes Augenmerk soll dabei auf Akronymen liegen, die den Drang nach Einfachheit in der Sprache wohl am besten verkörpern. Im Hauptteil der Arbeit wird deutlich werden, dass sich einige Methoden neben der Behandlung von gewöhnlichen Abkürzungen auch maßgeblich mit der Erkennung und Auflösung von Akronymen beschäftigen. Doch auch Lösungsansätze für Spezialfälle wie Gen- und Proteinbezeichnungen, welche ebenfalls Abkürzungen darstellen, werden vorgestellt.
2. Abkürzungen
Abkürzungen haben im Sprachgebrauch eine lange Tradition. Schon in der Antike wurden sie in großem Stil benutzt. Zu dieser Zeit waren Steintafeln und Pergament ein sehr teures Medium und die Verfasser mussten den begrenzten Platz mit Umsicht nutzen. Im Römischen Reich wurde so zum Beispiel statt ›IMPERATOR CAESAR‹ oftmals nur ›IMP CAES‹ in Schriften festgehalten. Natürlich kann auch bei manchen Schreibern bloße Faulheit oder Zeitdruck als Grund für die Verwendung von Abkürzungen angeführt werden. In jedem Fall haben sich Abkürzungen bis in die heutige Zeit, in der Papier und Speicherplatz beinahe unbegrenzt zur Verfügung stehen, erhalten. Latein, welches u.a. als Basis für den europäischen Kultur und Sprachraum gilt, hat auch in unserer Gegenwartssprache eine Vielzahl von Spuren hinterlassen. Medizinische Ausdrücke oder Fachbegriffe anderer Domänen, ja sogar ganz normale Ausdrücke des täglichen Gebrauchs gehen direkt auf die lateinische Sprache zurück. Auch der Habitus des Abkürzens wurde bewahrt. Mit der weiteren kulturellen und wissenschaftlichen Entwicklung hat sich der Sprachschatz sehr stark erweitert. Viele neue Entdeckungen und Erkenntnisse mussten benannt werden und oftmals wurden sehr lange und schwer aussprechbare Bezeichnungen gewählt. Das Gros der heute bekannten Bakterienarten wird dadurch in der Fachliteratur fast ausschließlich abgekürzt wiedergegeben. Auch chemische Elemente finden oft nur in abgekürzter Form Erwähnung, im Periodensystem der Elemente dient dies sogar primär der Übersicht.
Natürlich können nicht alle Abkürzung gleichwertig betrachtet werden. Es haben sich im Laufe der Zeit sehr große Unterschiede zwischen verschiedenen Abkürzungen herausgebildet. Die am häufigsten vorkommenden Arten sollen nun kurz vorgestellt werden
2.1. Varianten von Abkürzungen
Es lassen sich im Wesentlichen fünf verschiedene Arten von Abkürzungen beschreiben. Die erste umfasst die bruchstückhaften Abkürzungen oder Kurzwörter. Diese Abkürzungen entstehen durch das Weglassen von ganzen Wortteilen, wodurch neue Wörter entstehen, die oftmals die eigentliche Ursprungsform im Sprachgebrauch völlig ersetzen. Als Beispiel kann hier AUTO (AUTOMOBIL) bzw. AKKU (AKKUMULATOR) genannt werden. Beim Sprechen oder Lesen der Abkürzungen wird in diesen Fällen ausschließlich die Abkürzung wiedergegeben. Die Langform bleibt jedoch unausgesprochen.
[....]
Comments
No comments yet
Other users also were interested in the following titles:
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für Microsoft Word
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für OpenOffice.org
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 9,99 EUR
Formatvorlage zur Erstellung einer Diplomarbeit / Vorlage zur Erstellung einer Hausarbeit
Author: Marco FeindlerPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2008 Download as PDF-file for 6,99 EUR
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wissenschaftlichen Arbeit
Author: Zoran ZivkovicPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Erstellen einer schriftlichen Hausarbeit
Author: Claudia NickelPresentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR
Grundtechniken wissenschaftlichen Arbeitens
Author: Maik PhilippPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - Hausarbeiten - Seminararbeiten
Author: Mark RichterPresentations, Models, Tutorials, Instructions, 2008
This text can be quoted and accessed from this url: