Die empirische Arbeit >>RST-basierte Zusammenfassung von Texten<< beschäftigt sich mit der Frage, ob und in welchem Maße das von Daniel Marcu entwickelte RST-Tool zur Generierung von Zusammenfassungen längerer deutscher Texte (ca. 2000 Zeichen) geeignet ist.

Dabei werden zunächst der Begriff der Textzusammenfassung eingegrenzt und einige grundlegende theoretische Ansätze vorgestellt, wie text extraction und fact extraction.

Ausgehend von der Erläuterung der Rhetorical Structure Theory (Mann/Thompson et al. 1983) werden der Ansatz von Marcu und das RST-Tool vorgestellt.

Der textlinguistischen Beschreibung und Einordnung des im empirischen Teil verwendeten Datenmaterials folgt die Erläuterung der Methodik inklusive der Beschreibung und Diskussion des verwendeten Annotationsschemas.

Die Präsentation und Diskussion der Ergebnisse und das Fazit schließen die Arbeit ab.

Leseprobe

Inhaltsverzeichnis

Einleitung
Zusammenfassung von Texten
- Text Extraction
- Fact Extraction
Die rhetorische Struktur von Texten
- Rhetorical Structure Theory
- Der Ansatz von Marcu
Die Texte
Die Annotationen
Die Ergebnisse
- Die rhetorische Struktur der Texte
- Die Zusammenfassungen
- Weitere Diskussion der Ergebnisse
Kritische Evaluation
Fazit

Zielsetzung und Themenschwerpunkte

Diese Magisterarbeit untersucht die Anwendung der Rhetorical Structure Theory (RST) zur automatisierten Zusammenfassung von Texten. Ziel ist es, die Effektivität verschiedener RST-basierter Ansätze zur Textextraktion und Faktextraktion zu evaluieren und die Ergebnisse kritisch zu diskutieren.

Automatische Textzusammenfassung mittels RST
Vergleich verschiedener RST-basierter Ansätze
Analyse der rhetorischen Struktur verschiedener Texttypen
Evaluation der Genauigkeit und Qualität der erzeugten Zusammenfassungen
Kritische Reflexion der Methode und ihrer Grenzen

Zusammenfassung der Kapitel

Einleitung: Die Einleitung führt in die Thematik der automatischen Textzusammenfassung ein und beschreibt den Forschungsstand sowie die Zielsetzung der Arbeit. Sie begründet die Wahl des RST-Ansatzes und skizziert den Aufbau der Arbeit. Die Bedeutung der effizienten Informationsgewinnung aus großen Textmengen wird hervorgehoben, und die Arbeit wird als Beitrag zur Weiterentwicklung automatisierter Textanalysemethoden positioniert.

Zusammenfassung von Texten: Dieses Kapitel beschreibt die Methodik der Textextraktion und Faktextraktion im Kontext der RST. Es werden die verschiedenen Ansätze detailliert erläutert und ihre jeweiligen Stärken und Schwächen analysiert. Die Grundlagen für die spätere Anwendung dieser Methoden auf konkrete Texte werden gelegt, wobei der Fokus auf der automatisierten Identifizierung von Schlüsselsätzen und der Strukturierung der Information liegt.

Die rhetorische Struktur von Texten: Dieses Kapitel befasst sich eingehend mit der Rhetorical Structure Theory (RST) als theoretischem Fundament der Arbeit. Es erläutert die Kernkonzepte der RST, wie die Definition von Nucleus und Satellit sowie die verschiedenen rhetorischen Relationen zwischen Textabschnitten. Die Anwendung des RST-Ansatzes von Marcu wird detailliert vorgestellt und in den Kontext der automatischen Textanalyse eingeordnet, um das Verständnis der im späteren Teil der Arbeit verwendeten Methode zu gewährleisten.

Die Texte: Dieses Kapitel präsentiert die acht ausgewählten Texte, die im Rahmen der Arbeit analysiert wurden. Es werden die jeweiligen Themen der Texte kurz vorgestellt und die Gründe für ihre Auswahl erläutert. Die Auswahl der Texte dient der repräsentativen Abbildung verschiedener Textsorten und Themenbereiche, die für eine umfassende Evaluation des RST-basierten Ansatzes essentiell sind. Die Diversität der Texte ist entscheidend für die Validität der Ergebnisse.

Die Annotationen: Dieses Kapitel beschreibt den Prozess der manuellen Annotation der ausgewählten Texte mit Hilfe der RST. Es erläutert die Vorgehensweise bei der Identifizierung von Nucleus- und Satellit-Einheiten sowie der Zuordnung der entsprechenden rhetorischen Relationen. Die Bedeutung der Inter-Annotator-Übereinstimmung wird hervorgehoben, um die Zuverlässigkeit der Annotationen zu gewährleisten. Dieser Abschnitt ist wichtig für die Nachvollziehbarkeit und Validität der Ergebnisse der späteren Analyse.

Die Ergebnisse: Dieses Kapitel präsentiert die Ergebnisse der automatischen Textzusammenfassung auf Basis der RST-Annotationen. Es werden die Ergebnisse der verschiedenen RST-basierten Ansätze detailliert analysiert und miteinander verglichen. Der Fokus liegt auf der Genauigkeit und Qualität der erzeugten Zusammenfassungen, gemessen an verschiedenen Metriken. Die Ergebnisse geben Aufschluss über die Effektivität des gewählten Ansatzes und identifizieren mögliche Verbesserungsbereiche.

Kritische Evaluation: Dieses Kapitel bietet eine kritische Reflexion der angewandten Methodik und der erzielten Ergebnisse. Es werden die Stärken und Schwächen des RST-basierten Ansatzes diskutiert und mögliche Limitationen der Methode identifiziert. Die Ergebnisse werden im Kontext des aktuellen Forschungsstandes eingeordnet und es werden Perspektiven für zukünftige Forschung aufgezeigt. Dies umfasst eine Bewertung der Genauigkeit, der Robustheit und der Skalierbarkeit des entwickelten Systems.

Schlüsselwörter

Rhetorical Structure Theory (RST), automatische Textzusammenfassung, Textextraktion, Faktextraktion, Textanalyse, Annotation, Evaluierung, Maschinelles Lernen.

Häufig gestellte Fragen (FAQ) zur Magisterarbeit: Automatische Textzusammenfassung mittels Rhetorical Structure Theory

Was ist das Thema der Magisterarbeit?

Die Magisterarbeit untersucht die Anwendung der Rhetorical Structure Theory (RST) zur automatisierten Zusammenfassung von Texten. Das Ziel ist die Evaluierung der Effektivität verschiedener RST-basierter Ansätze zur Textextraktion und Faktextraktion sowie eine kritische Diskussion der Ergebnisse.

Welche Methoden werden in der Arbeit angewendet?

Die Arbeit verwendet die Rhetorical Structure Theory (RST) als theoretisches Fundament. Es werden verschiedene RST-basierte Ansätze zur Textextraktion und Faktextraktion detailliert erläutert, angewendet und verglichen. Die Arbeit beinhaltet auch die manuelle Annotation von Texten mit RST und die anschließende automatische Zusammenfassung basierend auf diesen Annotationen.

Welche Texte wurden analysiert?

Die Arbeit analysiert acht ausgewählte Texte, die verschiedene Textsorten und Themen repräsentieren. Die Auswahl der Texte soll eine umfassende Evaluation des RST-basierten Ansatzes ermöglichen und die Validität der Ergebnisse gewährleisten.

Wie wurden die Texte annotiert?

Die ausgewählten Texte wurden manuell mit Hilfe der RST annotiert. Der Prozess der Annotation umfasste die Identifizierung von Nucleus- und Satellit-Einheiten sowie die Zuordnung der entsprechenden rhetorischen Relationen. Die Inter-Annotator-Übereinstimmung wurde berücksichtigt, um die Zuverlässigkeit der Annotationen zu gewährleisten.

Welche Ergebnisse wurden erzielt?

Die Arbeit präsentiert die Ergebnisse der automatischen Textzusammenfassung basierend auf den RST-Annotationen. Die Ergebnisse verschiedener RST-basierter Ansätze werden detailliert analysiert und verglichen, wobei der Fokus auf Genauigkeit und Qualität der Zusammenfassungen liegt. Die Ergebnisse geben Aufschluss über die Effektivität des gewählten Ansatzes und identifizieren mögliche Verbesserungsbereiche.

Wie wird die Methodik kritisch evaluiert?

Die Arbeit enthält eine kritische Reflexion der angewandten Methodik und der erzielten Ergebnisse. Es werden Stärken und Schwächen des RST-basierten Ansatzes diskutiert, mögliche Limitationen der Methode identifiziert und die Ergebnisse im Kontext des aktuellen Forschungsstandes eingeordnet. Perspektiven für zukünftige Forschung werden aufgezeigt.

Welche Schlüsselwörter beschreiben die Arbeit?

Schlüsselwörter sind: Rhetorical Structure Theory (RST), automatische Textzusammenfassung, Textextraktion, Faktextraktion, Textanalyse, Annotation, Evaluierung, Maschinelles Lernen.

Welche Kapitel umfasst die Arbeit?

Die Arbeit gliedert sich in die Kapitel: Einleitung, Zusammenfassung von Texten, Die rhetorische Struktur von Texten, Die Texte, Die Annotationen, Die Ergebnisse, Kritische Evaluation und Fazit. Jedes Kapitel behandelt einen spezifischen Aspekt der automatischen Textzusammenfassung mittels RST.

Was ist die Zielsetzung der Arbeit?

Die Zielsetzung der Arbeit ist die Evaluierung der Effektivität verschiedener RST-basierter Ansätze zur automatisierten Textzusammenfassung. Es geht um den Vergleich der Ansätze, die Analyse der rhetorischen Struktur verschiedener Texttypen und die kritische Reflexion der Methode und ihrer Grenzen.

Ende der Leseprobe aus 453 Seiten - nach oben

Details

Titel: RST-basierte Zusammenfassung von Texten
Hochschule: Rheinische Friedrich-Wilhelms-Universität Bonn
Note: 1
Autor: Tanja Udelhofen (Autor:in)
Erscheinungsjahr: 2001
Seiten: 453
Katalognummer: V186664
ISBN (eBook): 9783869435565
ISBN (Buch): 9783869433509
Sprache: Deutsch
Schlagworte: rst-basierte zusammenfassung texten
Produktsicherheit: GRIN Publishing GmbH

Arbeit zitieren: Tanja Udelhofen (Autor:in), 2001, RST-basierte Zusammenfassung von Texten, München, GRIN Verlag, https://www.grin.com/document/186664