Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
Abkürzungen und Akronyme - Verfahren zur automatischen Erkennung von Abkürzungen... close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

Abkürzungen und Akronyme - Verfahren zur automatischen Erkennung von Abkürzungen und Auflösung von Mehrdeutigkeiten in biomedizinischen Texten

Scholarly Paper (Advanced Seminar), 2006, 27 Pages
Author: Steffen Kuegler
Subject: German Studies - Linguistics

Details

Category: Scholarly Paper (Advanced Seminar)
Year: 2006
Pages: 27
Grade: 1,3
Bibliography: ~ 7  Entries
Language: German
Archive No.: V55182
ISBN (E-book): 978-3-638-50208-5
ISBN (Book): 978-3-638-66377-9
File size: 227 KB

Abstract

Ein wichtiger Bestandteil der Schriftsprache sind die vielfältigen Formen von Abkürzungen. Während die Anzahl von Texten, Publikationen und Mitteilungen immer rasanter wächst, ist es wichtig, dass Abkürzungen und deren Bedeutungen immer richtig vom jeweiligen Rezipienten erkannt und verstanden werden. Je komplizierter und größer der Wortschatz jedoch wird, desto schwieriger wird es ebenfalls, dieses Gebot zu erfüllen. Vor allem in wissenschaftlichen Sprachzweigen stellt es daher eine immense Herausforderung dar, Abkürzungen in den ständig neuen Veröffentlichungen richtig ihren jeweiligen Bedeutungen zuzuordnen. Vor allem durch die rasante Neuschöpfung von Abkürzungen und die kaum noch zu gewährleistende Aktualität von entsprechenden Abkürzungswörterbüchern, kann diese Aufgabe von Hand kaum mehr erledigt werden. Darüber hinaus kommt dazu noch das Problem, dass viele Abkürzungen und Bedeutungen häufig mehrdeutig in Texten vorkommen und neben der zuverlässigen Erkennung auch die Auflösung dieser ambigen Begriffen stehen muss. Für fachspezifische Domänen, bestimmte Berufszweige und die vielfältigen Forschungsbemühungen ist daher die automatisierte Informationsextraktion und -Verarbeitung eines der wesentlichsten Ziele der computerlinguistischen Behandlung von Abkürzungen und Begriffen. In der vorliegenden Arbeit sollen einige Verfahren vorgestellt werden, die sich mit der automatischen Erkennung von Abkürzungen und deren Auflösung zu der entsprechenden Langform beschäftigen. Dies wird am Beispiel des biomedizinischen Arbeitsgebiets geschehen, da hier ein sehr großer und exemplarischer Forschungsaufwand besteht. Darüber hinaus soll eine Auswahl an Methoden erläutert werden, welche mehrdeutigen Abkürzungen und Terme ihre eigentlichen kontextuellen Bedeutungen zuweisen sollen. Zunächst soll jedoch eine Einführung die Gründe und Ursachen für die Bedeutsamkeit von Abkürzungen beleuchten und unterschiedliche Typen von Abkürzung darstellen. Besonderes Augenmerk soll dabei auf Akronymen liegen, die den Drang nach Einfachheit in der Sprache wohl am besten verkörpern. Im Hauptteil der Arbeit wird deutlich werden, dass sich einige Methoden neben der Behandlung von gewöhnlichen Abkürzungen auch maßgeblich mit der Erkennung und Auflösung von Akronymen beschäftigen. Doch auch Lösungsansätze für Spezialfälle wie Gen- und Proteinbezeichnungen, welche ebenfalls Abkürzungen darstellen, werden vorgestellt.


Excerpt (computer-generated)

Friedrich-Schiller-Universität Jena
Philosophische Fakultät
Institut für Germanistische Sprachwissenschaft
Wintersemester: 2005/2006
HS: „Namen – Verfahren zu ihrer Erkennung und Interpretation“

Abkürzungen und Akronyme - Verfahren zur automatischen Erkennung 
von Abkürzungen und Auflösung von Mehrdeutigkeiten in biomedizinischen Texten

von

Steffen Kügler

(9. Fachsemester)

 

Inhaltsverzeichnis 1

1. Einleitung 2

2. Abkürzungen 3
2.1. Varianten von Abkürzungen 3
2.2. Phänomene 5
2.3. Abkürzungsgebrauch in der Wissenschaft 5

3. Automatische Erkennung von Abkürzungen 6
3.1. Methode von Schwartz und Hearst 6
3.1.1. Precision und Recall 10
3.1.2. Resultate 12
3.2. Methode von Taghva und Gilbreth 13
3.2.1. Phase 1 13
3.2.2. Phase 2 14
3.2.3. Phase 3 14
3.2.4. Phase 4 15
3.2.5. Resultate 16
3.3. Methode von Yu, Hripcsak und Friedman 17
3.3.1. Phase 1 17
3.3.2. Phase 2 18
3.3.3. Resultate 18
3.3.4. Erweiterung der Methode für Gen- und Proteinbezeichnungen 19

4. Auflösung von Mehrdeutigkeiten 20
4.1. Methode von Liu, Lussier und Friedman 21
4.1.1. Phase 1 21
4.1.2. Phase 2 22
4.1.3. Resultate 22
4.2. Weitere Methoden 23
4.2.1. Methode von Pakhmov 23
4.2.2. Methode von Nenadic, Spasic und Ananiadou 23

5. Ausblick 24

6. Referenzen 26

 

 

1. Einleitung

Ein wichtiger Bestandteil der Schriftsprache sind die vielfältigen Formen von Abkürzungen. Während die Anzahl von Texten, Publikationen und Mitteilungen immer rasanter wächst, ist es wichtig, dass Abkürzungen und deren Bedeutungen immer richtig vom jeweiligen Rezipienten erkannt und verstanden werden. Je komplizierter und größer der Wortschatz jedoch wird, desto schwieriger wird es ebenfalls, dieses Gebot zu erfüllen. Vor allem in wissenschaftlichen Sprachzweigen stellt es daher eine immense Herausforderung dar, Abkürzungen in den ständig neuen Veröffentlichungen richtig ihren jeweiligen Bedeutungen zuzuordnen. Vor allem durch die rasante Neuschöpfung von Abkürzungen und die kaum noch zu gewährleistende Aktualität von entsprechenden Abkürzungswörterbüchern, kann diese Aufgabe von Hand kaum mehr erledigt werden. Darüber hinaus kommt dazu noch das Problem, dass viele Abkürzungen und Bedeutungen häufig mehrdeutig in Texten vorkommen und neben der zuverlässigen Erkennung auch die Auflösung dieser ambigen Begriffen stehen muss. Für fachspezifische Domänen, bestimmte Berufszweige und die vielfältigen Forschungsbemühungen ist daher die automatisierte Informationsextraktion und -Verarbeitung eines der wesentlichsten Ziele der computerlinguistischen Behandlung von Abkürzungen und Begriffen.

In der vorliegenden Arbeit sollen einige Verfahren vorgestellt werden, die sich mit der automatischen Erkennung von Abkürzungen und deren Auflösung zu der entsprechenden Langform beschäftigen. Dies wird am Beispiel des biomedizinischen Arbeitsgebiets geschehen, da hier ein sehr großer und exemplarischer Forschungsaufwand besteht. Darüber hinaus soll eine Auswahl an Methoden erläutert werden, welche mehrdeutigen Abkürzungen und Terme ihre eigentlichen kontextuellen Bedeutungen zuweisen sollen. Zunächst soll jedoch eine Einführung die Gründe und Ursachen für die Bedeutsamkeit von Abkürzungen beleuchten und unterschiedliche Typen von Abkürzung darstellen. Besonderes Augenmerk soll dabei auf Akronymen liegen, die den Drang nach Einfachheit in der Sprache wohl am besten verkörpern. Im Hauptteil der Arbeit wird deutlich werden, dass sich einige Methoden neben der Behandlung von gewöhnlichen Abkürzungen auch maßgeblich mit der Erkennung und Auflösung von Akronymen beschäftigen. Doch auch Lösungsansätze für Spezialfälle wie Gen- und Proteinbezeichnungen, welche ebenfalls Abkürzungen darstellen, werden vorgestellt.

2. Abkürzungen

Abkürzungen haben im Sprachgebrauch eine lange Tradition. Schon in der Antike wurden sie in großem Stil benutzt. Zu dieser Zeit waren Steintafeln und Pergament ein sehr teures Medium und die Verfasser mussten den begrenzten Platz mit Umsicht nutzen. Im Römischen Reich wurde so zum Beispiel statt ›IMPERATOR CAESAR‹ oftmals nur ›IMP CAES‹ in Schriften festgehalten. Natürlich kann auch bei manchen Schreibern bloße Faulheit oder Zeitdruck als Grund für die Verwendung von Abkürzungen angeführt werden. In jedem Fall haben sich Abkürzungen bis in die heutige Zeit, in der Papier und Speicherplatz beinahe unbegrenzt zur Verfügung stehen, erhalten. Latein, welches u.a. als Basis für den europäischen Kultur und Sprachraum gilt, hat auch in unserer Gegenwartssprache eine Vielzahl von Spuren hinterlassen. Medizinische Ausdrücke oder Fachbegriffe anderer Domänen, ja sogar ganz normale Ausdrücke des täglichen Gebrauchs gehen direkt auf die lateinische Sprache zurück. Auch der Habitus des Abkürzens wurde bewahrt. Mit der weiteren kulturellen und wissenschaftlichen Entwicklung hat sich der Sprachschatz sehr stark erweitert. Viele neue Entdeckungen und Erkenntnisse mussten benannt werden und oftmals wurden sehr lange und schwer aussprechbare Bezeichnungen gewählt. Das Gros der heute bekannten Bakterienarten wird dadurch in der Fachliteratur fast ausschließlich abgekürzt wiedergegeben. Auch chemische Elemente finden oft nur in abgekürzter Form Erwähnung, im Periodensystem der Elemente dient dies sogar primär der Übersicht.

Natürlich können nicht alle Abkürzung gleichwertig betrachtet werden. Es haben sich im Laufe der Zeit sehr große Unterschiede zwischen verschiedenen Abkürzungen herausgebildet. Die am häufigsten vorkommenden Arten sollen nun kurz vorgestellt werden

2.1. Varianten von Abkürzungen

Es lassen sich im Wesentlichen fünf verschiedene Arten von Abkürzungen beschreiben. Die erste umfasst die bruchstückhaften Abkürzungen oder Kurzwörter. Diese Abkürzungen entstehen durch das Weglassen von ganzen Wortteilen, wodurch neue Wörter entstehen, die oftmals die eigentliche Ursprungsform im Sprachgebrauch völlig ersetzen. Als Beispiel kann hier AUTO (AUTOMOBIL) bzw. AKKU (AKKUMULATOR) genannt werden. Beim Sprechen oder Lesen der Abkürzungen wird in diesen Fällen ausschließlich die Abkürzung wiedergegeben. Die Langform bleibt jedoch unausgesprochen.

[....]


Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:

Erstellen einer schriftlichen Hausarbeit

Author: Claudia Nickel
Presentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR

Grundtechniken wissenschaftlichen Arbeitens

Author: Maik Philipp
Presentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR

This text can be quoted and accessed from this url:

http://www.grin.com/e-book/55182/abkuerzungen-und-akronyme-verfahren-zur-automatischen-erkennung-von-abkuerzungen
please wait Please wait