Ziel dieser Arbeit ist es, am Beispiel einiger Ausschnitte aus J.R.R. Tolkiens „Lord of the Rings“ zu beweisen, dass selbst die neusten und weitentwickeltsten maschinellen Übersetzungssysteme (MÜ Systeme) noch nicht in der Lage sind, einen literarischen Text zu produzieren, ohne dass Post-Editing nötig ist.
Hierfür werden passende Textstellen aus dem Buch, welche möglichst viele idiomatische Wendungen beinhalten, mit den Übersetzungsprogrammen „DeepL“ und „Google Translate“ übersetzt und die Fehler nach ausgewählten Kategorien des Multidimensional Quality Metric analysiert und miteinander verglichen. Aufgrund der fortgeschrittenen Technik ist zu erwarten,
dass grammatikalische Fehler eher seltener vorkommen, als Fehler bei der Übersetzung von Redewendungen. Dennoch wird voraussichtlich ersichtlich werden, dass noch einige Forschungen nötig sind, bis die MÜ Systeme auch mit komplizierteren Satzteilen und Sätzen zurechtkommen.
Inhaltsverzeichnis
1. Einleitung
2. Theorie
2.1. Geschichte und Entwicklung der MÜ Systeme
2.2. Ansätze und Methoden der Maschinellen Übersetzung
2.2.1. Regelbasierte Methode
2.2.2. Korpusbasierte Methode
2.2.3. Wissensbasierte Methode
2.3. Probleme bei der Verwendung von MÜ-Systemen
2.4. Phraseologie
3. Verwendete Ressourcen und Methoden
4. Quantitative Analyse
5. Qualitative Analyse
5.1. Zu wörtlich übersetzte Redewendungen
5.2. Unidiomatische Übersetzungen
5.3. Falsch übersetzte Redewendungen
5.4. Richtig übersetzte Redewendungen
6. Fazit
Zielsetzung & Themen
Die vorliegende Arbeit untersucht die Leistungsfähigkeit aktueller neuronaler maschineller Übersetzungssysteme (NMT) bei der Übersetzung literarischer Texte, speziell im Hinblick auf idiomatische Wendungen. Ziel ist es, nachzuweisen, dass auch moderne Systeme bei komplexen literarischen Inhalten, die ein hohes Maß an Kontextwissen und kulturellem Verständnis erfordern, noch nicht ohne manuelles Post-Editing auskommen.
- Historische Entwicklung der maschinellen Übersetzung (von SMT zu NMT)
- Theoretische Grundlagen der Phraseologie und Idiomatik
- Vergleichende Analyse der Systeme „DeepL“ und „Google Translate“
- Anwendung des „Multidimensional Quality Metric“ (MQM) zur Fehlerklassifizierung
- Bewertung der Übersetzungsqualität anhand von Beispielen aus J.R.R. Tolkiens „Lord of the Rings“
Auszug aus dem Buch
5.1. Zu wörtlich übersetzte Redewendungen
Die Kategorie mit den meisten Fehlern ist overly literal. Grund dafür ist meist das Nicht-Erkennen der Redewendungen.
Beispiel 1:
'Well, I have rather a rascally look, have I not?' said Strider with a curl of his lip and a queer gleam in his eye (Tolkien 2012a:215).
Die Wendung with a curl of his lip ist eine abgewandelte Form des Idioms to curl one’s lip und bedeutet „raise a corner of your upper lip to show contempt; sneer “(Ayto 2009:212). Es sollte in diesem Falle als spöttisches oder verkniffenes Grinsen übersetzt werden. In der Übersetzung von Google Translate wurde a curl weggelassen. Der Sinn wird in beiden Übersetzungen nicht richtig wiedergegeben. Die zweite Wendung gleam in his eye hingegen wurde in beiden Fällen richtig und sinnvoll übersetzt. In der Übersetzung von DeepL wurde his eye in die Pluralform versetzt, wodurch die Wendung idiomatischer klingt und nahe liegt, dass das System das Idiom auch als solches erkannt hat. Bei Google Translate könnte es sein, dass bloß wörtlich übersetzt wurde, ohne dass das Idiom erkannt wurde. Ein weiterer Fehler in diesem Abschnitt ist, dass Strider nicht übersetzt wurde. Hier handelt es sich jedoch um einen Eigennamen, der nicht erkannt wurde. Im Deutschen wird er Streicher genannt. Dass solche Fehler vorkommen legt nahe, dass die Systeme nicht mit Texten aus der Herr der Ringe-Welt trainiert wurden.
Zusammenfassung der Kapitel
1. Einleitung: Die Arbeit führt in die Problematik ein, dass maschinelle Übersetzungssysteme Schwierigkeiten mit kulturell geprägten, idiomatischen Ausdrücken in literarischen Texten haben.
2. Theorie: Dieser Abschnitt beschreibt umfassend die Geschichte der maschinellen Übersetzung, die Ansätze von SMT und NMT sowie die linguistischen Herausforderungen der Phraseologie.
3. Verwendete Ressourcen und Methoden: Die methodische Vorgehensweise zur Auswahl von 26 Textstellen aus Tolkiens Werk und deren Analyse mittels MQM-Fehlerkategorien wird erläutert.
4. Quantitative Analyse: Hier erfolgt eine statistische Auswertung der Fehlerhäufigkeit und -arten bei „DeepL“ und „Google Translate“ unter Verwendung von Diagrammen.
5. Qualitative Analyse: Das Kapitel bietet eine detaillierte Prüfung ausgewählter Beispiele, unterteilt in wörtliche, unidiomatische, falsch und richtig übersetzte Wendungen.
6. Fazit: Die Arbeit schließt mit der Erkenntnis, dass trotz technischer Fortschritte menschliche Nachbearbeitung aufgrund fehlenden Weltwissens und Kreativität der Maschinen weiterhin unerlässlich bleibt.
Schlüsselwörter
Maschinelle Übersetzung, NMT, SMT, Idiomatik, Phraseologie, J.R.R. Tolkien, Lord of the Rings, DeepL, Google Translate, Multidimensional Quality Metric, Fehleranalyse, Post-Editing, Künstliche Intelligenz, Linguistik, Polysemie.
Häufig gestellte Fragen
Worum geht es in dieser Bachelorarbeit grundsätzlich?
Die Arbeit untersucht, wie gut moderne neuronale maschinelle Übersetzungssysteme literarische Texte, speziell die darin enthaltenen Idiome, in das Deutsche übertragen können.
Was sind die zentralen Themenfelder der Untersuchung?
Die Arbeit verknüpft die technische Entwicklung der maschinellen Übersetzung mit den theoretischen Grundlagen der Phraseologie und der Fehleranalyse am Beispiel literarischer Quellen.
Was ist das primäre Ziel oder die Forschungsfrage?
Es soll bewiesen werden, dass moderne NMT-Systeme trotz ihrer Fortschritte noch immer nicht in der Lage sind, literarische Idiome ohne menschliches Post-Editing korrekt zu übersetzen.
Welche wissenschaftliche Methode wird zur Analyse verwendet?
Die Autorin verwendet einen vergleichenden methodischen Ansatz, indem sie 26 Abschnitte aus J.R.R. Tolkiens „Lord of the Rings“ mit den Systemen DeepL und Google Translate übersetzt und die Fehler nach den Kategorien des Multidimensional Quality Metrics (MQM) klassifiziert.
Welche Aspekte werden im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine theoretische Einführung in Übersetzungssysteme und Phraseologie, gefolgt von einer quantitativen und qualitativen Fehleranalyse der gewählten Übersetzungen.
Welche Schlüsselbegriffe definieren diese Arbeit?
Die Arbeit wird durch Begriffe wie neuronale maschinelle Übersetzung (NMT), Idiomatik, Fehlerkategorien und literarische Übersetzung charakterisiert.
Warum wurden als Beispiel Texte aus J.R.R. Tolkiens „Lord of the Rings“ gewählt?
Diese Texte wurden gewählt, da sie ein hohes Aufkommen an idiomatischen Wendungen und komplexen, bildhaften Formulierungen aufweisen, die eine große Herausforderung für maschinelle Trainingsdaten darstellen.
Was sind die wesentlichen Unterschiede zwischen den analysierten Systemen DeepL und Google Translate?
Die Ergebnisse zeigen, dass DeepL insgesamt eine geringere Fehlerrate aufweist als Google Translate, wobei beide Systeme bei Idiomen mit ähnlichen Problemen der wörtlichen Übersetzung kämpfen.
Welche Rolle spielt die „Fehlerkategorie mistranslated idiom“ in der Arbeit?
Diese Kategorie wurde eigens von der Autorin zum MQM-System hinzugefügt, da sie für die gezielte Analyse der übersetzerischen Leistung bei Redewendungen in dieser Studie essenziell ist.
Was ist das Hauptergebnis bezüglich der Nutzbarkeit der automatischen Übersetzung für Literatur?
Das Fazit lautet, dass eine Veröffentlichung ohne umfassendes Post-Editing derzeit nicht empfehlenswert ist, da den KI-Systemen das notwendige Weltwissen und die schöpferische Kreativität zur korrekten Übertragung idiomatischen Geistes fehlt.
- Quote paper
- Jennifer Ringeisen (Author), 2019, Maschinelle Übersetzungssysteme im literarischen Übersetzen. Vergleich zweier neuronaler MÜ Systeme und die Rolle von Idiomen, Munich, GRIN Verlag, https://www.grin.com/document/1351945