Die maschinelle Übersetzung. Möglichkeiten und Grenzen entwickelter Übersetzungsprogramme

Eine Analyse anhand des Sprachenpaars Französisch-Deutsch


Thèse de Bachelor, 2019

49 Pages, Note: 1,3


Extrait


Inhaltsverzeichnis

Einleitung

Theoretischer Teil
Was ist maschinelle Übersetzung?
Funktionsweise
Typologie
Bewertungsansatz
Konsequenzen aus der Funktionsweise
Differenzierung der Nutzer
Bedeutung der Funktionalität
Linguistische Analyse

Praktischer Teil
Wörter und Phrasen
Fachterminologie
Kultursprachliche Begriffe
Metaphern
Fazit Wörter und Phrasen
Satzebene
Syntax
Präpositionen (Lexik)
Übersetzungslücken
Subjonctif
Optativ und Jussiv
Irrealis
Relaysprache Englisch
Tempus
Indirekte Rede
Fazit Satzebene
Textverständnis
Stringenz der Eigennamen
Pronominale Kohäsion
Tempus
Fazit Textverständnis
Wissen zur realen Welt und Metaebene

Synthese

Literaturverzeichnis

Einleitung

Kommunikation ist immer dann von Übersetzung geprägt, wenn Menschen mit verschiedenen Muttersprachen und folglich differenten Kulturen in einen Austausch treten. Mit der fortschreitenden Globalisierung von Wirtschaft und Gesellschaft und der Intensivierung zwischenstaatlicher Kooperation, wie in der UNO oder der EU, wächst der Bedarf an dieser interkulturellen Vermittlung. Das quantitative Leistungsvermögen menschlicher Übersetzer kann nur einen Teil des Bedarfs decken, sodass die maschinelle Übersetzung (MÜ) stetig an Bedeutung gewinnt.

Im Informationszeitalter erlaubt die Technik, insbesondere das Internet, eine revolutionäre Geschwindigkeit des Informationsaustausches – sobald die Sprachbarriere überwunden worden ist. Je einfacher und schneller sie überwunden werden kann, desto besser kann Wissen geteilt werden, können Menschen und Organisationen aus beliebigen Kulturen miteinander kooperieren und Unternehmen neue Märkte erschließen. Durch die Digitalisierung von Texten kann Übersetzungssoftware in immer größerem Umfang angewendet werden, welche Rohübersetzungen erheblich schneller anfertigt als menschliche Übersetzer.

Es bestehen also mehr denn je Anreize, die Entwicklung der MÜ voranzutreiben.

Die vorliegende Arbeit soll zeigen wie weit die bisherigen Bemühungen die Qualität der MÜ gebracht haben. Zu diesem Zweck wird die MÜ zunächst allgemein vorgestellt. Es folgt ein Überblick über die gängigen Funktionsweisen und es werden Maßstäbe der Bewertung erörtert. Auf dieser theoretischen Basis aufbauend werden in einer linguistischen Analyse die derzeitigen Möglichkeiten und Grenzen der MÜ vorgestellt.

Theoretischer Teil

Was ist maschinelle Übersetzung?

Die maschinelle Übersetzung ist die Übertragung von Texten aus ihrer Ausgangssprache in eine Zielsprache durch eine Maschine, im Sinne eines vom Menschen geschaffenen, selbstständig arbeitenden Werkzeugs. Im Kontext der MÜ ist das für gewöhnlich eine auf einem Computer operierende Software, auch System genannt.

Als Sprachverarbeitung per Computer ist die MÜ der Disziplin der Computerlinguistik zugeordnet, deren Aufgabe die Übernahme der geistig-flexiblen Arbeit des Menschen ist. Die Simulierung der menschlichen Sprachverarbeitung ist insofern flexibel, als dass die Abfolge der Arbeitsschritte nicht eindeutig festgelegt ist, es mehr als ein akzeptables Resultat gibt, der Umgang mit Regelverstößen gestaltet werden muss und dem ständigen Wandel des simulierten Objektes Sprache nachzufolgen ist.1

In der MÜ sind also viele translatorische Entscheidungen gefordert, deren Bewertung von den subjektiven Erwartungen des oder der Evaluierenden abhängt, unabhängig davon wie gut sich diese objektiv begründen lassen.

Das angestrebte Ziel der MÜ ist eine menschengleiche Translatqualität2, weil die menschliche Übersetzung das einzige verfügbare Vorbild ist. An diesem muss sie sich messen lassen, auch wenn es unerreichbar scheint, weil die Funktionsweise der MÜ andere Bedingungen und Einschränkungen mit sich bringt.

Der Anspruch an jede Übersetzung ist eine optimale Äquivalenz zwischen dem Ausgangstext und dem Zieltext, auch Translat genannt. Aufgrund der Beschaffenheit der Welt kann diese nicht zur Gleichheit genügen:

„Equivalence is constructed, not out of absolute identity but out of rich diversity of similarities“ (Yallop, 2001, S. 242)

Die Äquivalenz soll über eine Invarianz in den Dimensionen Inhalt, Funktion, Form und Stil erreicht werden. Der Übersetzer, ob Mensch oder Maschine, muss über die Gewichtung der Dimensionen eine heuristische Entscheidung treffen, denn gleichzeitig lassen sich die Dimensionen im Translat nicht maximal invariant halten.

Funktionsweise

Neben der Translation selbst gehören auch die vorausgehende Präparierung und die nachträgliche Revision zu den Arbeitsschritten der MÜ.3

Im Vorhinein können die Auswahl des Textes sowie seine mögliche Anpassung an die Fähigkeiten des Systems das Resultat bereits beeinflussen. Denn je einfacher und standardisierter ein Text ist, desto besser ist im Allgemeinen die Translatqualität.4 Diese Anpassung geschieht über eine kontrollierte Sprache, einer natürlichen Sprache, die auf das System zugeschnittenen Restriktionen unterworfen ist.

Die Revision durch einen menschlichen Posteditor ist der Normalfall, weil ausschließlich maschinell übersetzte Texte immer Rohübersetzungen sind.5 Ein Ergebnis von menschlich-muttersprachlicher Qualität sollte folglich von der Maschine nicht erwartet werden. Wenn der Zieltext nicht erhalten bleiben soll, nur zum kurzfristigen Verständnis des Nutzers dient, dann findet die (mentale) Revision gleichzeitig mit der Rezeption statt.

Typologie

Die gegenwärtig marktprägenden Systeme arbeiten auf der Basis folgender Funktionsweisen:

- Regelbasierter Ansatz

Beim Parsen wird die Struktur anhand einer aus Regeln bestehenden ausgangssprachlichen Grammatik so verallgemeinert, also abstrahiert, dass sie im nächsten Schritt, der Generierung, mithilfe grammatikalischer Regeln der Zielsprache in eine zielsprachliche Struktur übertragen werden kann. In diese werden die den Wörterbüchern entnommenen Entsprechungen eingefügt. Ein solches System aufzubauen wird bei höherem Abstraktionsgrad zeit- und kostenintensiver, weil mehr Regeln geschaffen werden müssen.

- Direktübersetzung

Die ausgangssprachliche Satzstruktur wird vollständig übernommen. Die Übersetzung geschieht Wort-zu-Wort. Dieses einfache Verfahren reicht meist nicht zu einem guten Resultat und ist nur bei näher verwandten Sprachen möglich.

- Transferübersetzung

Syntaktische, morphologische und semantische Informationen eines Satzes werden analysiert, zu einem gewissen Grad abstrahiert und die Abstraktion zu einem zielsprachlichen Satz generiert. Gängig ist die Abstraktion zu Phrasen.Im Kontext der MÜ werden sämtliche Wortgruppen Phrasen genannt, in einer weiter gefassten Definition als der linguistischen.

- Interlingua Übersetzung

Eine derart abstrakte Darstellung der sprachlichen Informationen in einer Universalsprache wird erreicht, dass sie sich in jeder Sprache wieder generieren ließen. Diese Universalsprache ist ein unerreichtes Ideal.

Da der Ausgangstext anhand einer Grammatik geparst wird, ist dieser Ansatz darauf angewiesen, dass er gemäß dieser korrekt ist. Denn eine unbekannte Struktur kann nicht abstrahiert werden. Und auch das Fehlen einer äquivalenten Struktur in der zielsprachlichen Grammatik machte die Übersetzung unmöglich. Demnach muss ein solches System schon recht weit entwickelt sein, bevor es zur weiteren Optimierung getestet werden kann.

Diese Funktionsweise führt auch dazu, dass die Grammatiken alle richtigen Sätze der jeweiligen Sprache beschreiben können müssten und die generierende Grammatik keinen falschen Satz erlauben dürfte um ein perfektes System zu bilden.6 Warum das ein unerreichbares Ziel ist, wird in den Konsequenzen aus der Funktionsweise für die Bewertung von Translaten erläutert werden.

- Statistikbasierter Ansatz

Aus einem umfangreichen, parallelen Korpus sucht ein Algorithmus die wahrscheinlichste Übersetzung z der ausgangssprachlichen Einheit a. Dazu findet in der Regel der Satz von Bayes Anwendung7:

Abbildung in dieser Leseprobe nicht enthalten

In Worten: Die Wahrscheinlichkeit, dass z die Entsprechung von a ist, ist gleich der Wahrscheinlichkeit, mit der z in der Zielsprache vorkommt, multipliziert mit der Wahrscheinlichkeit, dass a die Entsprechung von z ist, geteilt durch die Wahrscheinlichkeit mit der a in der Ausgangssprache vorkommt. Die zuletzt erläuterte Pr(a) kann aus der Formel reduziert werden, weil die ausgangssprachliche Einheit für alle zielsprachlichen Einheiten dieselbe ist.

Praktikabel ist dieses Vorgehen nur dann, wenn nicht ganze Sätze oder einzelne Wörter, sondern Phrasen durch den Algorithmus übersetzt werden. Um dieses Vorgehen zu ermöglichen müssen im Vorhinein über Trainings- und Testdatensätze Wörter in Phrasen gruppiert worden sein.8

Auch zur Berechnung der Wortfolge wird in der Generierung die Wahrscheinlichkeit herangezogen.9 Deren Berechnung wurde über einen statistischen Abgleich mit dem zielsprachlichen Teil des Korpus ebenfalls zuvor durchgeführt.

Je größer der parallele Korpus ist, desto besser wird das zu erwartende Ergebnis. Er sollte also gewaltige Datenmengen zu jedem Sprachenpaar beinhalten, was problematisch wird, je weniger davon es zum ausgewählten Sprachenpaar gibt. Falls es unzureichend wenig gibt, bietet sich ein Umweg über Englisch als Relaysprache an, weil diese Weltsprache die meisten Parallelkorpora mit anderen Sprachen bietet. Das kann allerdings zu Interferenzen führen und eigentlich einfache Übertragungen von parallelen Strukturen in Ausgangs- und Zielsprache können fehlschlagen, wenn es diese parallele Struktur im Englischen nicht gibt.10

Dadurch, dass ohne linguistisches Fachwissen solide Systeme unter vergleichsweise geringem Zeitaufwand erstellt werden können, ist der statistikbasierte Ansatz erheblich kosteneffizienter als der regelbasierte.11

- Beispielbasierter Ansatz

Das System sucht nach Analogien auf der Satzebene in einem Korpus von Paralleltexten, der relativ zur SMÜ klein ist. Aus den dann angepassten, ähnlichen Textfragmenten fügt das System den Text zusammen.

Bei einer begrenzten Anzahl an Textsorten verspricht dieser Ansatz gute Ergebnisse. Um ganze Sprachen umfassend abzubilden mangelt es schlicht an den nötigen Korpora.12

- Hybride Ansätze

Mehrere Herangehensweisen werden in der Absicht kombiniert, ihre Stärken zu bündeln.

Da die mit diesen Ansätzen Texte nicht als Einheiten übersetzt werden, sondern höchstens ganze Sätze, können die Translate in struktureller und kultureller Hinsicht nur nah am Ausgangstext bleiben, zielkulturelle Adaptionen sind ausgeschlossen.

Bewertungsansatz

Konsequenzen aus der Funktionsweise

Um die Leistungen von MÜ-Systemen richtig einzuordnen, sollte den Rahmenbedingungen Rechnung getragen werden, die sich aus deren Funktionsweisen ergeben.

Dadurch, dass in allen Ansätzen äquivalente Wörter oder Phrasen in die generierten Strukturen eingefügt werden, ist insbesondere die lexikalische Mehrdeutigkeit eine wichtige Fehlerquelle, die auf Homonymie zurückgeht.13

Auch die Einteilung der Phrasen und deren Gruppierung im Rahmen des syntaktischen Parsings können zu Fehlern führen.

Die hohe Qualität menschlicher, geschulter Übersetzer ist unerreichbar. Das liegt laut Ramlow hauptsächlich an zwei Faktoren:

„Erstens: Die menschliche Sprache und die damit beschriebene Welt sind derartig komplex, dass es unmöglich ist, das gesamte sprachliche und außersprachliche Wissen zu erfassen, das notwendig ist, um jeden Text unabhängig von der Textsorte, vom Fachgebiet und vom Fachlichkeitsgrad korrekt maschinell übersetzen zu können. Zweitens: Die menschliche Sprache ist nicht statisch, sondern äußerst dynamisch, d.h. insbesondere die existierenden Wörter, in geringerem Umfang auch die Regeln, nach denen diese Wörter zu Sätzen zusammengefügt werden, und die Regeln, nach denen die Sätze zu Texten zusammengefügt werden, sind einer ständigen Veränderung unterworfen.“ (Ramlow, 2009, S. 348)

Die zuerst genannte Unmöglichkeit das gesamte sprachliche und außersprachliche Wissen zu erfassen ist die entscheidende Hürde. Schließlich wurde gegenüber Stachowitz schon die zunächst überschaubar erscheinende Aufgabe der Erstellung einer vollständigen Grammatik einer Sprache von bedeutenden Linguisten auf über 100 Jahre geschätzt.14 Und damit wäre das außersprachliche Wissen noch gar nicht erfasst.

Unüberwindbar ist diese Hürde, weil menschliches Wissen nicht über Lexikoneinträge organisiert ist, sondern über Netze, bei denen es nicht genügt Verbindungen zu kennen, sondern auch deren Beschaffenheit bekannt sein muss. Solche neuronalen Netze lassen sich zwar schon nachbilden, aber solange Computer diese nicht selbstständig bilden, also lernen, können Sprachen so nicht vollständig erfasst werden. Immerhin gibt es schon lernfähige Computer, aber zum Erlernen einer Sprache braucht es zwei der wichtigsten menschlichen Fähigkeiten: Verständnis und Kreativität. Denn in geistig-flexiblen Aktivitäten, zu denen sowohl Übersetzung als auch Spracherwerb gehören, sind Entscheidungen zu treffen, deren bestes Ergebnis nicht immer das statistisch gehaltsvollste ist. Nun treffen Computer aber keine Entscheidung selbst, die auf Verständnis, Kreativität oder anderen menschlichen Denkmustern beruht, sondern befolgen stets Regeln, die Wahrscheinlichkeiten und Zufallskomponenten enthalten können.

Die von Ramlow angeführte Dynamik der Sprache ist eine nebensächliche Erschwernis. Das gilt insbesondere für die sehr normierten Sprachen in modernen Gesellschaften, in denen, durch ständige Präsenz der Norm aufgrund einer Fülle an Texten und der Mobilität der Sprecher im Sprachraum, der Sprachwandel deutlich entschleunigt wird. Des Weiteren gehört es auch zum menschlichen Sprachvermögen, dass neue Phänomene zunächst unbekannt sind, es möglicherweise sogar bleiben. Für gewöhnlich können Humanübersetzer nur besser Quellen in der Recherche auswerten, aber das könnte sich durch immer effizientere Datenverarbeitung in Zukunft ändern.

Differenzierung der Nutzer

Für die Bewertung kann eine Unterscheidung gemacht werden: Wer ist Nutzer der MÜ? Das kann auf der einen Seite ein Kenner der Ausgangssprache sein, der sich von der Nutzung eines Systems einen Zeitvorteil im eigenen Übersetzungsprozess erhofft. Andererseits kann es sich um einen Nutzer handeln, der der Ausgangssprache nicht mächtig ist und den Ausgangstext verstehen möchte. Diese verschiedenen Ziele sollten zu differenten Gewichtungen je Nutzertypus in der Bewertung führen.

Dem nicht der Ausgangssprache mächtigen Nutzer wird eine vollautomatische Übersetzung angeboten, bei der das vom System erzeugte Translat unverändert übernommen wird. Er nutzt diese häufig zur sogenannten Informationsübersetzung, welche ihm einen groben Überblick zum Textinhalt bringt.15

Der professionelle Übersetzer hingegen kann dem System einen präparierten Text anbieten und wird das Translat nachbearbeiten. Wenn er so vorgeht, handelt es sich um benutzerunterstützte MÜ.16 Ihm sollte ein möglichst fehlerarmer Text präsentiert werden, der wenig Posteditionsaufwand nach zieht. Aus seiner Sicht können also grammatikalisch schwerwiegende Fehler und grobe Sinnverzerrungen durchaus unproblematisch sein, wenn sie sich unkompliziert und schnell korrigieren lassen. Das bedeutet allerdings, dass ein technisch, also linguistisch, besser arbeitendes System für den Übersetzer nicht zwangsläufig das geeignetere ist.

Bedeutung der Funktionalität

Gemäß Hartley und Paris müssten für die Generierung natürlicher Sprache kommunikative Ziele, die abstrakt sind, durch konkreten Text erreicht werden.17 Insofern es sich um einen nicht der Ausgangssprache mächtigen Nutzer handelt, muss der generierte Text dieser Aufgabe gerecht werden, da ansonsten die Textfunktion für jenen verloren geht.

Aufgrund der zwangsläufigen Nähe zum Ausgangstext ist ein maschinell generierter Text das Ergebnis einer overt translation, wie sie House beschreibt. Für die funktionelle Äquivalenz bedeute das:

„it can be described as enabling access to the function the original has in its discourse world or frame.“ (House, 2001, S. 141)

Dem Nutzer sollte also die ursprüngliche Textfunktion in ihrem textexternen Kontext verständlich werden, ohne dass sie direkt übertragen werden müsste. Diesem Anspruch muss auch eine MÜ gerecht werden, damit sich dem Nutzer der Sinn des Ausgangstextes erschließt. Es muss bei der Evaluierung nichtsdestotrotz berücksichtigt werden, dass dieses translatorische Ziel nicht bewusst erarbeitet wird.

Das reicht allerdings nicht aus um die textexternen Faktoren wie Anlass, Ort, Zeit, Medium, Sender und Empfänger als wichtiger als textinterne Faktoren zu bewerten, wie etwa bei Nord. Sie begründet diese Einschätzung damit, dass jene die Erwartungen des Zieltextempfängers maßgeblich beeinflussten. Über textinterne Normverstöße könne dieser solange hinwegsehen, wie diese Erwartungen erfüllt werden.18 Das ist unrealistisch, weil durch einige der typischen MÜ-Fehler, wie Bezugsfehler oder missgedeutete Homonymie, gewaltige inhaltliche Verwerfungen gebildet werden können.

Linguistische Analyse

Unter Berücksichtigung der Erschließbarkeit der Funktion für nicht der Ausgangssprache mächtige Nutzer sollte sich eine Analyse zur Bewertung von Systemen vor allem auf der textinternen Ebene bewegen. Wie es House auf den Punkt bringt:

„However, despite all these “external factors” translation is at its core a linguistic-textual phenomenon, and it can be legitimately described, analysed and evaluated as such.“ (House, 2001, S. 155)

Nicht zuletzt sollte eine Bewertung textintere Faktoren zum Untersuchungsgegenstand haben, weil daraus am besten Rückschlüsse auf in der Funktionsweise liegende Ursachen für Mängel getroffen werden können.

Allgemein dürfte der Posteditionsaufwand für den professionellen Übersetzer in einem proportionalen Zusammenhang zu der Güte der textinternen Faktoren stehen. Dessen direkte Ermittlung wäre ohnehin durch seinen subjektiven Charakter verzerrt und von der Funktionsweise entkoppelt.

Da die Systeme Software sind, ist von ihnen ceteris paribus eine konstante übersetzerische Leistung in Bezug auf Grammatik, Lexik und Textualität zu erwarten. Daher lassen sich schon über den Vergleich weniger Beispiele Aussagen zu ihren Stärken und Schwächen treffen.

Als Vorgehensweise empfiehlt House für (menschliche) Übersetzungen von einem makro-analytischen zu einem mikro-analytischen Fokus überzugehen.19 Da die Systeme insbesondere mit Mehrdeutigkeiten Schwierigkeiten haben, die sich aus Homonymie ergeben, ist das Fehlerpotenzial vor allem auf der Wortebene im Vergleich zum menschlichen Übersetzer nennenswert höher, was Folgefehler nach sich ziehen könnte. Deshalb sollte bei der Bewertung von maschinell übersetzten Texten in umgekehrter Weise zunächst mit dem mikro-analytischen Fokus begonnen werden, bevor der makro-analytische folgt.

Praktischer Teil

In der folgenden Analyse wird erläutert, welche translatorischen Möglichkeiten der derzeitige Stand von Übersetzungssoftware aufweist und wo seine Grenzen liegen. Hierzu werden exemplarisch die online verfügbaren Programme Google Translate des Technologiekonzerns Google LLC, DeepL Übersetzer des Unternehmens DeepL GmbH und Online-Translator.com der Firma PROMT Service LLC in ihren Übersetzungen im Sprachenpaar Deutsch-Französisch verglichen. Diese werden in den nachfolgenden Ausführungen als Google, DeepL und Promt abgekürzt.

Die zwei Übersetzungsrichtungen werden nur dann gesondert betrachtet, wenn signifikante Unterschiede festzustellen sind, bzw. sprachliche Muster der einen Sprache keine direkte Entsprechung in der anderen aufweisen.

Anhand von Beispielsätzen, vereinzelt auch –abschnitten, soll erläutert werden, mit welchen sprachlichen Strukturen Probleme, seien es Fehler, Sinnverfremdungen oder Stilbrüche, in der Übertragung in die Zielsprache auftreten und inwiefern die drei Programme die identifizierten Probleme unterschiedlich gut überwinden.

Über die Ursachen dieser Unterschiede können Thesen aufgestellt werden, aber die Programme müssen als „Black Boxes“, also in ihrer Funktionsweise uneinsehbar, definiert werden, da erstens ein Zugriff auf die Quelltexte im Rahmen dieser Untersuchung nicht möglich ist und es zweitens selbst mit diesem Zugriff schwierig bis unmöglich ist, die konkreten Ursachen einzelner Übersetzungsprobleme zu benennen. Denn sie könnten beim regelbasierten Ansatz in den Grammatiken oder den umfangreichen Wörterbüchern begründet sein, im Rahmen der statistischen Methode aus den gewaltigen Korpora hervorgehen oder in den Paralleltextsammlungen des beispielbasierten Ansatzes verursacht werden. Auch die Arbeitsschritte wie Parsing und Generierung sind mögliche Störquellen.

Es wird nicht auf jede Unstimmigkeit oder gelungene Übersetzung in den einzelnen Beispielen eingegangen, sondern lediglich auf die jeweils relevanten.

Der Analyse zugrunde liegen zwölf Texte mit insgesamt über 3800 Wörtern. Es sind jeweils ein französischer und ein deutscher Wetterbericht, Wikipedia-Artikel, Zeitungsartikel, Literaturausschnitt, Sportbericht und die Erläuterung zur Legislativbefugnis des Europaparlaments.

Die Betrachtung vollzieht sich entlang der Größe der sprachlichen Einheiten. Die kleinste betrachtete Einheit ist das Wort, nicht das Morphem, da die Programme kaum allein auf das Morphem zurückzuführende Probleme, wie etwa in der Kongruenz, aufweisen. Gemeinsam mit den Wörtern geht es um Phrasen20, dann folgen Sätze und schließlich Texte als Betrachtungsobjekte. Bei letzteren liegt der Fokus auf der Frage: Werden Ausgangstexte als sprachliche Einheit aufgefasst, zumindest ausreichend als zielsprachliche Einheit vermittelt oder sind die Programme nicht in der Lage Ausgangstexte in Zieltexte zu übertragen?

Zum Abschluss werden Fehler vorgestellt, die mit Wissen zur realen Welt oder Kenntnis der Meta-Ebene nicht passieren würden. Solche Fehler zu unterbinden ist zwar längst nicht von den Programmen zu erwarten, sie markieren aber einen wichtigen Unterschied zu Humanübersetzern, weshalb sich die Betrachtung lohnt.

Wörter und Phrasen

Auf Ebene der Wörter und Phrasen ergeben sich für die drei Programme quantitativ die größten Schwierigkeiten. Bestenfalls in jedem vierten Satz tritt mindestens eine auf. Bei Promt sind es signifikant mehr. Um nachzuvollziehen warum es dazu gekommen ist, lohnt sich ein Blick auf anspruchsvolle Wörter und Phrasen.

Fachterminologie

Beispiel 1:

Abbildung in dieser Leseprobe nicht enthalten

Im Ausschnitt geht es um die Leistungen eines Rugby Spielers. Bis auf die Tackles werden die Fachvokabeln nicht getroffen. Scrum Holding ist die korrekte Entsprechung für die gemeinte Standfestigkeit im Gedränge, aber auf Englisch. Da es sich um einen Sport aus der englischen Kultur handelt, ist diese Übersetzung zielgerechter als das Beibehalten des französischen Begriffs oder das sinnverfremdete, weil auch außerhalb des Gedränges mögliche, Nahkampfverhalten, oder der sinnfreie Anzug im Handgemenge. Tackles werden nicht getroffen oder versetzt, sondern gesetzt.

Irreführend ist die Übersetzung von buteur zu Stürmer. Denn im Rugby gehört der hier gemeinte Kicker eben nicht zu den Stürmern, sondern zur Hintermannschaft. Wie auch Torjäger bei Promt, geht diese Übersetzung auf das Fußballvokabular zurück. Es scheint plausibel, dass in den Wörterbüchern beziehungsweise Korpora Fußballvokabeln aufgrund der höheren Popularität und der größeren Interkulturalität als bei anderen Sportarten in den meisten Sprachen besser repräsentiert sind und somit auf Wörter aus dem Bereich anderer (Ball-) Sportarten übergeneralisiert werden, sobald die korrekte Entsprechung unbekannt oder unwahrscheinlich ist.21

Beispiel 2:

Abbildung in dieser Leseprobe nicht enthalten

In diesem Beispiel fallen drei juristische Begriffe: faux, escroquerie und recel d’abus de confiance. Im Falle des Mittleren wurde mit Betrug stets das zielsprachliche Äquivalent gefunden. Bei faux und recel d’abus de confiance gibt es ein solches hingegen nicht, da es sich um Rechtsbegriffe ohne deutsche Entsprechung handelt. Bei erstem deutet Fälschung zwar die grobe Richtung an, allerdings sind die strafrechtlich relevanten Fälschungen voneinander unabhängige Rechtsbegriffe und es könnte etwa im Sinne von Kunstfälschung missverstanden werden. Hier geht es mutmaßlich um Urkundenfälschung. Der recel d’abus de confiance wird nur bei DeepL treffend umschrieben, mit Vertuschung von Untreue. Bei Rechtsbegriffen stellt sich die Frage, ob es nicht sinnvoller wäre, den Ausgangsbegriff unübersetzt zu lassen, statt eine direkte Übersetzung anzustreben. Schließlich ist die Gesetzeslage und damit die von den Rechtsbegriffen beschriebene Welt in jedem Land einmalig. In das zweisprachige Wörterbuch (sofern damit gearbeitet wird) könnte ein Eintrag eingefügt werden, z.B.:

recel d’abus de confiance → recel d’abus de confiance (Vertuschung von Untreue)

Ein solches Vorgehen wird jedoch nicht gewählt. Das dürfte mit dem hohen Arbeitsaufwand zu tun haben, denn jeder so erklärte Begriff müsste einen eigenen Wörterbucheintrag oder eine Regel erhalten. Diese Arbeit könnte nur von Menschen ausgeführt werden, wodurch sie teuer und zeitaufwendig wäre.22 23

Beispiel 3:

Abbildung in dieser Leseprobe nicht enthalten

Der Begriff VW-Vorstandsvorsitzende ist aufgrund der verschiedenen Wirtschaftsgesetze nicht einfach aus dem Deutschen ins Französische zu übertragen. Als PDG wurde Martin Winterkorn zwar schon häufig bezeichnet, wie es sich im Internet über eine Suchmaschine herausfinden lässt. Allerdings ist der Président-directeur général der höchste Manager einer Aktiengesellschaft ohne Aufsichtsrat und weder diese Rechtsform (société anonyme) noch dieses Amt gibt es in Deutschland, also auch nicht bei VW. Der président du conseil d'administration ist für das gesamte Management einer SA verantwortlich, leitet es aber nicht selbst. Auch dieser Posten ist hier nicht gemeint. Einer AG nach deutschem Recht (société à directoire) steht das directoire vor. Herr Winterkorn war daher Président du directoire oder PDD.24

Die gewählten Übersetzungen sind zwar nicht ausgangstextgerecht, aber die Kernaussage des Begriffs ist für den französischen Nutzer verständlich, nämlich, dass Herr Winterkorn der Hauptverantwortliche bei VW war. Diese Aussage würde mit dem korrekten Président du directoire oder PDD wahrscheinlich sogar seltener verstanden, wenn denn dieses Fachvokabular des deutschen Unternehmensrechts unbekannt ist. Da es sich hier nicht um ein rechtlich relevantes Dokument, sondern um einen Zeitungsbericht handelt, ist die Übertragung der Kernaussage wichtiger als rechtliche Korrektheit.

Eine nicht ausgangstextgerechte Übersetzung eines Fachbegriffs kann also unter translatorischen Gesichtspunkten durchaus sinnvoll sein.25

Die Fachbegriffe werden insgesamt selten mit einer exakten Entsprechung übersetzt, häufig aber mit einer verständlichen. Promt schneidet etwas schlechter ab, als die anderen beiden Programme. Außergewöhnlich fachliche oder rechtlich bedeutende Texte müssen unbedingt einer eingehenden Postedition unterzogen werden und sollten mit spezialisierten Systemen übersetzt werden.

Kultursprachliche Begriffe

Beispiel 4:

Abbildung in dieser Leseprobe nicht enthalten

Mit an de grâce wird ein Jahr bezeichnet, wenn Neujahr gemäß dem Nativitätsstil auf den 25. Dezember definiert wird. Hingegen ist ein Gnadenjahr ein Jahr, in dem vollkommener kirchlicher Ablass gewährt wird. Zwar keine fremde Bedeutung, aber auch nicht die richtige, trägt das Jahr Gunst 1759 und ist zudem syntaktisch inkorrekt.

Da es keine direkte Entsprechung gibt, und auf keine Umschreibung zurückgegriffen werden kann, lag eine lexikalische Lücke vor. Ihr begegneten die Programme, indem sie das Nächstliegende ausgewählt haben. Insofern erkannt würde, dass es sich hier um eine unbekannte Form der Zeitangabe handelt, wäre es eine bessere Option gewesen, auf die bekannte Form im Jahr 1759 zu vereinfachen. Das wäre hier höchstwahrscheinlich sogar inhaltlich korrekt.26

Google und DeepL sind durchaus dazu bereit Übersetzungslücken zu lassen, wie später noch erläutert werden wird. Warum das hier nicht geschehen ist: Es wurde ein ähnlich zusammengesetztes Substantiv gefunden.

Beispiel 5:

Abbildung in dieser Leseprobe nicht enthalten

Die richtige Übersetzung findet sich bei Promt. Auch wenn Magistrat im Deutschen der städtischen Verwaltung zugeordnet wird, ist zumindest der lateinische Wortstamm zielgerecht und könnte richtig verstanden werden. Es müsste konsequenterweise entweder für die oberste Magistratur oder als oberster Magistrat heißen. DeepL hat sich möglicherweise durch den Kontext täuschen lassen: Es geht um den Prozess gegen Herrn Sarkozy. Dementsprechend fallen viele juristische Vokabeln. Hier wäre eine Gegenprobe hilfreich: Für wie wahrscheinlich hält DeepL magistrature surprême als Übersetzung von Oberster Gerichtshof ? Gemäß dem Ergebnis sollte wahrscheinlich eine andere Lösung gefunden werden.

[...]


1 Vgl. Ramlow 2009: 41-42

2 Vgl. Dorna 2001: 514

3 Vgl. Arnold, Balkan, Lee Humphreys, Meijer, & Sadler, 1994: 27

4 Vgl. Schreiber 2006: 55

5 Vgl. Arnold, Balkan, Lee Humphreys, Meijer, & Sadler, 1994: 8

6 Vgl. Arnold, Balkan, Lee Humphreys, Meijer, & Sadler, 1994: 44

7 Vgl. Stein, 2009:10

8 Vgl. Stein, 2009:11-12

9 Vgl. Arnold, Balkan, Lee Humphreys, Meijer, & Sadler, 1994: 202

10 Siehe „Relaysprache Englisch“

11 Vgl. Stein, 2009:12-13

12 Vgl. Ramlow 2009: 336

13 Vgl. Ramlow 2009: 230-231

14 Vgl. Stachowitz, 1971: 2

15 Vgl. Schreiber 2006: 54-55

16 Vgl. Schreiber 2006: 55

17 Vgl. Hartley & Paris, 2001: 317

18 Vgl. Nord 1991: 197

19 Vgl. House 2001: 156

20 im Sinne der Computerlinguistik: Wortgruppen

21 Quelle: https://www.lequipe.fr/Rugby/Actualites/Demba-bamba-l-apprentissage-continue/953095 (26.10.18)

22 Quelle: https://www.lemonde.fr/politique/article/2018/10/25/affaire-bygmalion-la-cour-d-appel-de-paris-confirme-le-renvoi-en-correctionnel-de-nicolas-sarkozy_5374306_823448.html (25.10.2018)

23 Quelle: https://www.zeit.de/politik/deutschland/2018-10/abgasskandal-stuttgart-porsche-verurteilung-schadensersatz (26.10.18)

24 Übersetzung der Grundsätze der Unternehmensführung: http://www.ecgi.org/codes/documents/cg_code_germany_june2007_fr.pdf (14.11.18)

25 Quelle: Voltaire (1987): Candide. Philipp Reclam: Stuttgart, S. 3.

26 Quelle: https://www.lemonde.fr/politique/article/2018/10/25/affaire-bygmalion-la-cour-d-appel-de-paris-confirme-le-renvoi-en-correctionnel-de-nicolas-sarkozy_5374306_823448.html (25.10.2018)

Fin de l'extrait de 49 pages

Résumé des informations

Titre
Die maschinelle Übersetzung. Möglichkeiten und Grenzen entwickelter Übersetzungsprogramme
Sous-titre
Eine Analyse anhand des Sprachenpaars Französisch-Deutsch
Université
University of Duisburg-Essen  (Romanistik)
Note
1,3
Auteur
Année
2019
Pages
49
N° de catalogue
V584033
ISBN (ebook)
9783346209849
ISBN (Livre)
9783346209856
Langue
allemand
Mots clés
Übersetzungssoftware, Maschinelle Übersetzung
Citation du texte
Leon Siegel (Auteur), 2019, Die maschinelle Übersetzung. Möglichkeiten und Grenzen entwickelter Übersetzungsprogramme, Munich, GRIN Verlag, https://www.grin.com/document/584033

Commentaires

  • Pas encore de commentaires.
Lire l'ebook
Titre: Die maschinelle Übersetzung. Möglichkeiten und Grenzen entwickelter Übersetzungsprogramme



Télécharger textes

Votre devoir / mémoire:

- Publication en tant qu'eBook et livre
- Honoraires élevés sur les ventes
- Pour vous complètement gratuit - avec ISBN
- Cela dure que 5 minutes
- Chaque œuvre trouve des lecteurs

Devenir un auteur