Die vorliegende Bachelorarbeit vergleicht die Übersetzungsergebnisse des Sprachenpaares Englisch - Deutsch von Google translate (SMÜ) und dem Online translator der Firma Systran (RBMÜ). Anhand der Bewertungskriterien von Philipp Koehn, Andreea Calude und des Thomas J. Watson Research Centers wird eine neue Evaluationsmethode hergeleitet. Diese wird auf die Übersetzung eines juristischen Fachtextes (AGB von Facebook) angewendet. Ziel ist es, die Fehler der maschinellen Übersetzungssysteme und die Bereiche, in denen konkreter Verbesserungsbedarf besteht, aufzuzeigen. Letztlich werden beide Systeme gegenübergestellt, um die Ergebnisse direkt miteinander zu vergleichen.
Inhaltsverzeichnis
1. Einleitung
2. Die Geschichte der Maschinenübersetzung
3. Ziel der Maschinenübersetzung
4. Arten der maschinellen Übersetzung
5. Ansätze der maschinellen Übersetzung
5.1 Regelbasierte Ansätze
5.1.1 Direkte Systeme
5.1.2 Indirekte Systeme
5.1.2.1 Interlingua Systeme
5.1.2.2 Transfersysteme
5.2 Korpusbasierte Systeme
5.2.1 Beispielbasierte maschinelle Übersetzung
5.2.2 Statistisch maschinelle Übersetzung
5.3 Hybridsysteme
5.4 Weitere Ansätze
6. Auswahl der maschinellen Übersetzungssysteme
7. Auswahl des Textes
8. Evaluation des Textes
8.1 Evaluation nach dem Thomas J. Watson Research Center
8.2 Evaluation nach Koehn
8.3 Evaluation nach Calude
8.4 Kombinierte Evaluation
9. Analyse und Fehlerauswertung
9.1 Google translate
9.1.1 Der Sprachfluss
9.1.2 Adäquater Ausdruck
9.2 Systran Online-translator
9.2.1 Der Sprachfluss
9.1.2 Adäquater Ausdruck
9.3 Die Ergebnisse im Vergleich
10. Fazit und Zukunftsprognose
Zielsetzung & Themen
Die vorliegende Arbeit zielt darauf ab, die Qualität zweier maschineller Übersetzungssysteme, Google Translate und Systran, anhand eines juristischen Fachtextes zu vergleichen, um deren Eignung für die Übersetzung auf Knopfdruck zu evaluieren und konkreten Verbesserungsbedarf aufzuzeigen.
- Vergleich zwischen statistischer (SMÜ) und regelbasierter maschineller Übersetzung (RBMÜ)
- Entwicklung und Anwendung einer kombinierten Evaluationsmethode
- Analyse und Fehlerauswertung anhand der AGB von Facebook
- Untersuchung von Sprachfluss und adäquatem Ausdruck
Auszug aus dem Buch
1. Einleitung
Seit Anbeginn der Zeit will der Mensch Abläufe vereinfachen und beschleunigen. Während der Bau von Gebäuden im Mittelalter teils Jahrhunderte in Anspruch genommen hat, können heute innerhalb weniger Tage Fertighäuser gebaut werden. Auch wurde die Automobilindustrie durch die Erfindung des Fließbands durch Henry Ford revolutioniert und die mühsame Einzelproduktion wurde durch die Massenfertigung abgelöst. Der Übersetzungsbereich bleibt hier nicht außen vor und entwickelt sich stetig weiter.
Angefangen bei Übersetzungen mit Wörterbüchern, über die Nutzung von Onlinewörterbüchern und Translation-Memory-Systemen bis hin zur maschinellen Übersetzung (MÜ). Heute dient die MÜ dem Übersetzer als Werkzeug, obwohl sie ursprünglich den Humanübersetzer ersetzen sollte. Dieser Umstand ist vergleichbar mit dem Tempomat im Auto. Er kann zwar nach dem Aktivieren die Geschwindigkeit halten, aber er kann niemanden ans Ziel bringen. Er dient also nur als Werkzeug und nicht als Lösung, wie die MÜ.
Zusammenfassung der Kapitel
1. Einleitung: Diese Einleitung stellt die Motivation für den Vergleich maschineller Übersetzungssysteme dar und definiert das Ziel, die Qualität von Google Translate und Systran anhand eines juristischen Fachtextes zu untersuchen.
2. Die Geschichte der Maschinenübersetzung: Dieses Kapitel zeichnet die historische Entwicklung der maschinellen Übersetzung von ersten Versuchen zur Code-Entschlüsselung über den ALPAC-Bericht bis hin zu modernen statistischen Ansätzen nach.
3. Ziel der Maschinenübersetzung: Es wird zwischen informativen und qualitativen Übersetzungen unterschieden und erläutert, warum bei langlebigen Texten ein hoher Anspruch an die Genauigkeit und Fehlerfreiheit besteht.
4. Arten der maschinellen Übersetzung: Das Kapitel differenziert zwischen verschiedenen Unterstützungstypen wie MAHT, HAMT und FA(HQ)MT und ordnet deren praktische Anwendung sowie Realisierbarkeit ein.
5. Ansätze der maschinellen Übersetzung: Hier werden die verschiedenen technischen Methoden der maschinellen Übersetzung, unterteilt in regelbasierte, korpusbasierte, hybride und weitere Ansätze, theoretisch fundiert beschrieben.
6. Auswahl der maschinellen Übersetzungssysteme: Dieses Kapitel begründet die Auswahl von Google Translate als Vertreter für statistische Systeme und Systran als Vertreter für regelbasierte Systeme für die Analyse.
7. Auswahl des Textes: Es wird die Entscheidung für die allgemeinen Geschäftsbedingungen (AGB) von Facebook als Analyseobjekt aufgrund ihrer Struktur und Relevanz für den Rechtsbereich begründet.
8. Evaluation des Textes: In diesem Kapitel werden bestehende Evaluationsmethoden, wie die des Thomas J. Watson Research Centers, von Koehn und von Calude, vorgestellt und zu einer eigenen kombinierten Methode zusammengeführt.
9. Analyse und Fehlerauswertung: Dieser Hauptteil beinhaltet die konkrete Untersuchung der Übersetzungsergebnisse von Google Translate und Systran auf Basis der entwickelten Kriterien sowie den direkten Vergleich der Systeme.
10. Fazit und Zukunftsprognose: Die Arbeit schließt mit einer Zusammenfassung der Ergebnisse, einer Reflexion der angewandten Methode sowie einem Ausblick auf zukünftige Entwicklungen, insbesondere im Bereich neuronaler maschineller Übersetzung.
Schlüsselwörter
Maschinelle Übersetzung, MÜ, Google Translate, Systran, Statistische MÜ, Regelbasierte MÜ, Evaluation, Sprachfluss, Adäquater Ausdruck, Fehleranalyse, Sprachwissenschaft, Fachtextübersetzung, AGB, Korpusbasierte Systeme, Fehlerquotient.
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundsätzlich?
Die Arbeit vergleicht zwei unterschiedliche Ansätze der maschinellen Übersetzung (statistisch vs. regelbasiert) anhand eines praxisnahen juristischen Fachtextes.
Was sind die zentralen Themenfelder der Untersuchung?
Die zentralen Themen sind die theoretischen Grundlagen der Maschinenübersetzung, die Methoden zur Evaluation der Übersetzungsqualität und eine detaillierte Fehleranalyse.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist es, durch einen linguistischen Vergleich herauszufinden, welches der beiden Systeme qualitativ hochwertigere Ergebnisse bei der Übersetzung von AGBs liefert.
Welche wissenschaftliche Methode wird für die Analyse verwendet?
Der Autor verwendet eine kombinierte Evaluationsmethode, die Aspekte des Thomas J. Watson Research Centers, Ansätze von Koehn und die detaillierte Kategorisierung von Calude vereint.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil umfasst die detaillierte Untersuchung und statistische Fehlerauswertung der durch Google Translate und Systran generierten Übersetzungen sowie deren anschließenden Vergleich.
Welche Schlüsselwörter charakterisieren diese Arbeit?
Charakteristische Begriffe sind unter anderem maschinelle Übersetzung (MÜ), Evaluation, Sprachfluss, Fehleranalyse und Äquivokation.
Warum wurde ausgerechnet der AGB-Text von Facebook als Analyseobjekt gewählt?
Die AGB bieten aufgrund ihrer standardisierten Formulierungen, klaren Struktur und hohen rechtlichen Relevanz ein ideales Analyseobjekt, um die Leistung der MÜ-Systeme bei Fachtexten zu prüfen.
Welches Ergebnis erzielt der Vergleich zwischen den beiden Systemen?
Google Translate schneidet in der Gesamtwertung besser ab als der Online-Translator von Systran, wobei beide Systeme bei komplexen Satzstrukturen und fachspezifischer Terminologie Schwierigkeiten zeigen.
Was schlägt der Autor für die zukünftige Bewertung von MÜ-Systemen vor?
Der Autor regt an, das Bewertungssystem bei zukünftigen Studien gegebenenfalls umzudrehen, um sich verstärkt auf die korrekt übersetzten Textstellen zu fokussieren und die Bewertung effizienter zu gestalten.
Welche Rolle spielt die neuronale maschinelle Übersetzung im Fazit?
Die neuronale MÜ wird als technologische Zukunftsperspektive betrachtet, die langfristig das Potenzial hat, die Qualität und Geschwindigkeit maschineller Übersetzungen erheblich zu steigern.
- Citar trabajo
- Julien Appler (Autor), 2016, Linguistischer Vergleich statischer und regelbasierter maschineller Übersetzung. "Google translate" gegen den "Systran Onlinetranslator", Múnich, GRIN Verlag, https://www.grin.com/document/352622