Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › German Studies - Miscellaneous

Computer- und Textlinguistik. Entwicklung eines Systems für die automatische Auflösung von Pronominaladverbienanaphern

Ein Beitrag zur theoretischen und angewandten Computerlinguistik

Title: Computer- und Textlinguistik. Entwicklung eines Systems für die automatische Auflösung von Pronominaladverbienanaphern

Doctoral Thesis / Dissertation , 2025 , 328 Pages , Grade: 1,2 (A)

Autor:in: Nelson Fogo (Author)

German Studies - Miscellaneous
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Die vorliegende Studie basiert auf der Motivation, textlinguistische Fragestellungen mithilfe informatischer Werkzeuge zu untersuchen. Im Ergebnis ist es uns gelungen, ein System zu entwickeln, das Pronominaladverbien (PA) innerhalb sprachlicher Ketten nicht nur erkennt, sondern sie auch entsprechend ihrer phorischen Kategorien – Anapher, Katapher oder Deixis – klassifiziert. Darüber hinaus kann das System im Fall eines anaphorischen Pronominaladverbs (PAA) dieses direkt auflösen. Dieses System trägt den Namen PAAR (Pronominaladverbien-Anaphern-Resolver).

Excerpt


Inhaltsverzeichnis

KAPITEL 0: EINFÜHRUNG

1. Motivationen und Vorstellung des Themas

2. Forschungsstand

3. Problemstellung, Fragestellungen und Hypothesen

4. Theoretische und methodische Vorgehensweise

5. Aufbau der Arbeit

ERSTER TEIL: TERMINOLOGISCHE ANNÄHRUNGEN (Computerlinguistik und Textlinguistik)

KAPITEL 1: COMPUTERLINGUISTIK (CL)

1.1. Gegenstandsbestimmung

1.1.1. Computerlinguistik als Fachbereich und computerlinguistische Fachgesellschaften

1.2. Methodische und theoretische Grundlage der Computerlinguistik

1.3. Computerlinguistische Systeme und Ihre alltäglichen Anwendungen

1.3.1. Texttechnologische Anwendungen

1.3.2. Dialogsysteme (Chatboots)

1.3.3. CL& DIDAKTIK

1.3.4. CL &WIRTSCHAFT : Berufsfelder von Computerlinguisten

KAPITEL 2: TEXTLINGUISTIK UND DIE ANAPHORIK

2.1. Zu Begriffen Text und Textlinguistik

2.1.1. Der Text

2.1.2. Die Textlinguistik

2.2. Zum Begriff Textgrammatik

2.2.1. Die Textkohäsion

2.2.2. Textkohärenz und Thematische Progression

2.3. Die Anaphorik

2.3.1. Anfänge der Forschungen zu Verweisphänomenen in der Textlinguistik

2.3.2. Die expliziten Anaphern

2.3.2.1. Explizite pronominale Anaphern

2.3.2.1.1. Personalpronomen, Relativpronomen, Possessivpronomen und Interrogativpronomen

2.3.2.1.2. Indefinitpronomen und Demonstrativpronomen

2.3.2.2. Die Nullanapher

2.3.2.3. Explizite Nominalphrasenanaphern

2.3.2.4. Pluralanaphern

2.3.2.5. Komplexe Anaphern

2.3.3. Die impliziten Anaphern

ZWEITER TEIL: THEORETISCHE ANNÄHRUNGEN (PRONOMINALADVERBIEN & AR-SYSTEME)

KAPITEL 3: PRONOMINALADVERBIEN (PAn) UND DIE ANAPHORIK: Das Pronominaladverb (PA) als Anapher

3.1. Adverb oder Adverbial: Begriffsbestimmung

3.2. Klassifikation von Adverbien: Inhaltliche und Funktionale Kriterien

3.2.1. Der inhaltliche Faktor: Semantische Klassen von Adverbien

3.2.1.1. Lokaladverbien - Adverbien des Ortes

3.2.1.2. Temporaladverbien - Adverbien der Zeit

3.2.1.3. Kausaladverbien - Adverbien des Grundes

3.2.1.4. Modaladverbien - Adverbien der Art und Weise

3.2.2. Nach dem Funktionalen Faktor: Funktionsklasse von Adverbien

3.3. Pro-Adverbien und Pronominaladverbien (PAn)

3.3.1. Pro-Adverbien

3.3.2. Pronominaladverbien oder Präpositionaladverbien? Formbestand und Wortbezeichnung

3.3.2.1. Allgemeinheiten

3.3.2.2. Pronominaladverbien vs Präpositionaladverbien

3.3.3. Gebrauch und Funktionen von Pronominaladverbien (PAn)

3.3.3.1. Allgemeinheiten zum Gebrauch von Pronominaladverbien

3.3.3.2. Grammatische Subkategorien von Pronominaladverbien:Nichtpronominaler Gebrauch von PAn?

3.3.3.2.1. Pronominaladverbien als Verbzusatz

3.3.3.2.2. Pronominaladverbien als Subjunktionen: Fall von „Damit“

3.3.3.3. Textlinguistische Funktionen von Pronominaladverbien: Pronominaler Gebrauch von PAn

3.3.3.3.1. Pronominaladverbien als Katapher: Die Pronominaladverbienkataphern

3.3.3.3.2. Pronominaladverbien als Deixis oder als Anapher

3.3.3.3.2.1. Die Da- und Hier- Pronominaladverbienanaphern

3.3.3.3.2.2. Die Wo- Pronominaladverbienanaphern

3.3.3.3.3. Prototypischer/ vorübergehender Algorithmus zur automatischen Auflösung von Pronominaladverbienanaphern

KAPITEL 4: ANSÄTZE UND THEORIEN ZUR AUTOMATISCHEN ANAPHERNAUFLÖSUNG: Algorithmen, AR-Ansätze und AR-Systeme

4.1. Historische und thematische Darstellung von bestehenden AR-Ansätzen; -Algorithmen und -Systemen (Von 1960 bis 1990)

4.1.1. Das System STUDENT von Bobrow (1964); SHERDLU von Winograd (1972); LUNAR von Woods &Co (1977) und der Algorithmus von Hobbs (1977)

4.1.2. Der BFP Algorithmus von Brennan, Friedman & Pollard (1987): Eine Implementation der Centeringtheorie

4.2. Computerlinguistische Ansätze, Algorithmen & Systeme zur Auflösung von koreferenten Pronominalanaphern (Personal- Possessiv- und Reflexivpronomina)

4.2.1. Auf Heuristiken basierende AR-Algorithmen und oder AR-Systeme für Pronomen im Deutschen und im Englischen.

4.2.1.1. Das AR-System von Shalom Lappin und Herbert J. Leass (1994)

4.2.1.2. Der wissensarme Ansatz von Kennedy & Bougarrev (1996): Die sogenannte KP-RAP

4.2.1.3. Die Übertragung von RAP ins Deutsche (G-RAP)

4.2.1.3.1. Der Ansatz von Hinrichs & Co. (2005)

4.2.1.3.2. G-RAP nach Hollger Wunsch (2010)

4.2.2. Auf Technik des Maschinenlernens basierende AR-Systeme: Einsatz der Künstlichen Intelligenz bei der automatischen Auflösung von Anaphern.

4.2.2.1. Künstliche Intelligenz (KI) und Maschinenlernen (ML)

4.2.2.1.1. Intelligenz und Intelligenzarten

4.2.2.1.2. Zum Begriff Künstliche Intelligenz (KI)

4.2.2.1.3. Das maschinelle Lernen (Machine Learning)

4.2.2.2. Einsatz des maschinellen Lernens (ML) bei der Auflösung von Anaphern

4.3. Entworfener Algorithmus zur automatischen Auflösung von Pronominaladverbienanaphern

DRITTER TEIL: EMPIRISCHER TEIL (HERSTELLUNG; EINSETZUNG UND AUSWERTUNG DES PAAR/TOOLS)

KAPITEL 5 Umwandlung des AR-Algorithmus ins AR-System: Entstehung des Pronominaladverbienanaphernreolvers (PAAR)

5.1. Algorithmen zur Ausschließung von kataphorischen/deiktischen PA

5.1.1. Der Filter für kataphorische hier- und da-PA

5.1.2. Der Filter für kataphorische/deiktische wo-PA

5.2. Angaben über die Auswahl des Parsers

5.3. Angaben über den Ausbau eines geeigneten morpho-orthographischen Taggers

5.4. Angaben über die Kollaboration mit dem Programmierer: Entstehung des PAARS

5.5. Aufbereitung der Datensätze und Einsatz des PAAR

5.5.1. Aufbau eines Textkorpus

5.5.1.1. Bestehende Textkorpora für korpuslinguistische Untersuchungen im Deutschen

5.5.2. Einsatz des PAAR aufs PAK (Pronominaladverbien-Korpus)

KAPITEL 6: AUSWERTUNG DES PAAR-EINSATZES: ANALYSEN, INTERPRETATIONEN, ERGEBNISSE UND HYPOTHESENPRÜFUNG.

6.1. Analyse und Interpretation des Einsatzes vom PAAR auf das Textkorpus

6.1.1. EINSATZ DES PAAR AUF DEN TEXT N°2

6.1.2. EINSATZ DES PAAR AUF DEN TEXT N°3

6.1.3. EINSATZ DES PAAR AUF DEN TEXT N°4

6.1.4. EINSATZ DES PAAR AUF DEN TEXT N°5

6.1.5. EINSATZ DES PAAR AUF DEN TEXT N°6

6.1.6. EINSATZ DES PAAR AUF DEN TEXT N°7

6.1.7. EINSATZ DES PAAR AUF DEN TEXT N°8

6.1.8. EINSATZ DES PAAR AUF DEN TEXT N°9

6.1.9. EINSATZ DES PAAR AUF DEN TEXT N°10

6.1.10. EINSATZ DES PAAR AUF DEN TEXT N°11

6.1.11. EINSATZ DES PAAR AUF DEN TEXT N°12

6.1.12. EINSATZ DES PAAR AUF DEN TEXT N°13

6.1.13. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT (N°14-20)

6.1.14. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT ( N°21-30)

6.1.15. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT ( N°31-50)

6.2. Ergebnisse der Einsatzaktion: Berechnung der Präzision von PAAR

6.3. Hypothesenprüfung; Schlussbetrachtung und Ausblicke

Zielsetzung & Themen

Ziel der Arbeit ist die Entwicklung eines Informatik-Systems namens PAAR, das die automatische Auflösung von Pronominaladverbienanaphern in deutschen Texten ermöglicht. Die Forschungsarbeit geht der Fragestellung nach, wie ein solches System unter Berücksichtigung computerlinguistischer Ansätze und der Integration semantischer sowie pragmatischer Heuristiken konzipiert werden kann, um über herkömmliche, rein syntaktisch arbeitende Verfahren hinauszugehen.

  • Entwicklung und Implementierung eines Algorithmus zur Anaphernauflösung
  • Kombination von theoretischer Linguistik und angewandter Informatik
  • Analyse und Bewertung der Performanz mittels korpuslinguistischer Methoden
  • Entwurf von Filtern zur Differenzierung zwischen anaphorischen, kataphorischen und deiktischen Verweisformen
  • Integration in eine automatisierte Sprachverarbeitungspipeline

Auszug aus dem Buch

Die Anaphorik

Das Wort Anaphorik bezieht sich, etymologisch betrachtet, auf das griechische Verb ἀναφέρειν. Dieses griechische Verb hat die gleiche Bedeutung mit den deutschen Verben herauftragen und sich beziehen (auf etwas) (Wiktionary). Demnach kann das Wort Anaphorik sowohl für Rückwärts- als auch für Vorwärtsverweise gebraucht werden. Jedoch wird diesem Wort in der Sprachwissenschaft eine Rückwärtsbedeutung zugeschrieben (M.Schwarz 1997: 445-456). In dieser Hinsicht wird der Begriff Anaphorik in den textlinguistischen Forschungen als der Verweis eines Satz- oder Textteiles (Anapher) auf einen anderen, vor ihm stehenden Satz- oder Textteil (Antezedent) aufgefasst (Konrad Ehlich2007: 23). Man unterscheidet im allgemeinen zwei Arten von Anaphorik: Die direkte und die indirekte, wobei jeweils zwischen intrasentialer (Anapher und Antezedent stehen im selben Satz) und intersentialer (Anapher und Antezedent stehen in verschiedenen Sätzen) Anaphora zu unterscheiden ist (Schwarz-Friesel, Monika/Consten, Manfred, 2007: 268).

Eine anaphorische Konstruktion (Anaphorik) wird als direkt genannt, wenn sie durch Anwendung morphosyntaktischer Regeln aufgelöst (also interpretiert bzw. verstanden) werden kann. Hingegen wird eine anaphorische Verbindung als indirekt genannt, wenn sie außer grammatischen Kenntnissen noch zusätzliche Wissen (Text-und Weltwissen) für ihr Verständnis voraussetzt (vgl. M. Schwarz 2000b: 118).

Zusammenfassung der Kapitel

KAPITEL 0: EINFÜHRUNG: Dieses Kapitel erläutert die Motivation des Forschungsprojekts, den Forschungsstand sowie die methodische Vorgehensweise und den Aufbau der Arbeit.

KAPITEL 1: COMPUTERLINGUISTIK (CL): Dieser Abschnitt definiert den Begriff Computerlinguistik und beleuchtet deren theoretische Grundlagen sowie aktuelle Anwendungsfelder.

KAPITEL 2: TEXTLINGUISTIK UND DIE ANAPHORIK: Hier wird das Phänomen der Anaphorik in den textlinguistischen Kontext eingebettet und verschiedene Anapherntypen werden theoretisch klassifiziert.

KAPITEL 3: PRONOMINALADVERBIEN (PAn) UND DIE ANAPHORIK: Dieses Kapitel bietet eine tiefgehende Analyse von Pronominaladverbien als Wortart und deren textlinguistische Eigenschaften.

KAPITEL 4: ANSÄTZE UND THEORIEN ZUR AUTOMATISCHEN ANAPHERNAUFLÖSUNG: Dieser Teil präsentiert einen historischen Überblick über bestehende Algorithmen und Systeme zur Anaphernauflösung.

KAPITEL 5: Umwandlung des AR-Algorithmus ins AR-System: Entstehung des Pronominaladverbienanaphernreolvers (PAAR): Die Umsetzung des theoretischen Algorithmus in ein lauffähiges informatisches System (PAAR) mittels Python wird hier beschrieben.

KAPITEL 6: AUSWERTUNG DES PAAR-EINSATZES: ANALYSEN, INTERPRETATIONEN, ERGEBNISSE UND HYPOTHESENPRÜFUNG.: Das Kapitel enthält die Evaluierung des PAAR-Systems anhand eines Testkorpus sowie die Prüfung der aufgestellten Hypothesen.

Schlüsselwörter

Computerlinguistik, Anaphernauflösung, Pronominaladverbien, Textlinguistik, Algorithmus, Maschinelles Lernen, künstliche Intelligenz, Syntax, Textkohäsion, Textkohärenz, Anaphorik, Katapher, Deixis, Korpuslinguistik, PAAR-System.

Häufig gestellte Fragen

Worum geht es in dieser Dissertation grundlegend?

Die Arbeit beschäftigt sich mit der Entwicklung eines Informatik-Systems zur automatischen Identifizierung und Auflösung von sogenannten Pronominaladverbienanaphern (wie "daran", "hierauf", "womit") in deutschen Texten.

Welche zentralen Themenfelder deckt die Arbeit ab?

Die zentralen Felder sind die theoretische Computerlinguistik, die Textlinguistik (insbesondere Anaphorik) sowie die technische Implementierung von Algorithmen zur automatischen Sprachverarbeitung.

Was ist das primäre Ziel oder die Forschungsfrage der Dissertation?

Das Ziel ist die Entwicklung eines Algorithmus, der Pronominaladverbien im Text erkennt, ihre Art (anaphorisch, kataphorisch, deiktisch) bestimmt und bei anaphorischem Gebrauch den richtigen Antezedenten korrekt identifiziert.

Welche wissenschaftliche Methode kommt zur Anwendung?

Es wird ein heuristischer Ansatz verwendet, der auf morphosyntaktischen Regeln basiert, ergänzt durch eine empirische Evaluierung mittels eines selbst konfigurierten Textkorpus (PAK) und Programmierimplementierung in Python.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil behandelt die linguistische Theorie von Anaphern und Adverbien, analysiert existierende Anaphernauflösungssysteme und detailliert die Entwicklung sowie Evaluierung des PAAR-Tools.

Welche Schlagworte charakterisieren die Arbeit am besten?

Computerlinguistik, Anaphernauflösung, Pronominaladverb, Textkohäsion, PAAR, automatisierte Sprachverarbeitung, Parser.

Was ist die spezifische Leistung des entwickelten PAAR-Tools?

PAAR ist in der Lage, Pronominaladverbien innerhalb eines automatisierten Prozesses von anderen Verwendungsweisen (wie Subjunktionen) zu unterscheiden und ihre anaphorische Natur in über 70% der Fälle korrekt aufzulösen.

Inwiefern unterscheidet sich diese Arbeit von bestehenden Systemen?

Während sich die meisten bestehenden Systeme auf Personalpronomen konzentrieren, leistet diese Arbeit Pionierarbeit bei der spezifischen Behandlung von Pronominaladverbien, die als anaphorische Konstruktionen semantisch komplexer sind.

Excerpt out of 328 pages  - scroll top

Details

Title
Computer- und Textlinguistik. Entwicklung eines Systems für die automatische Auflösung von Pronominaladverbienanaphern
Subtitle
Ein Beitrag zur theoretischen und angewandten Computerlinguistik
College
University of Yaoundé 1  (Philosophische Fakultät/ Deutschabteilung)
Grade
1,2 (A)
Author
Nelson Fogo (Author)
Publication Year
2025
Pages
328
Catalog Number
V1594474
ISBN (PDF)
9783389151761
ISBN (Book)
9783389151778
Language
German
Tags
Computerlinguistik; Textlinguistik Anapher AR-Systeme zur Anapherauflösung
Product Safety
GRIN Publishing GmbH
Quote paper
Nelson Fogo (Author), 2025, Computer- und Textlinguistik. Entwicklung eines Systems für die automatische Auflösung von Pronominaladverbienanaphern, Munich, GRIN Verlag, https://www.grin.com/document/1594474
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  328  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint