Die vorliegende Semesterarbeit handelt von der Maschinellen Übersetzung (MÜ) als Form der künstlichen Intelligenz in der Computerlinguistik. Die MÜ ist im Laufe der letzten Jahre vor allem durch das Internet und die Omnipräsenz digitaler Technologien in Gestalt von Smartphones, Tablet-PCs oder anderen mobilen Endgeräten wie Smartwatches zu einem alltäglichen Begleiter geworden. Kostenlose Online-Übersetzungsdienste haben zum Boom der MÜ im Privatbereich enorm beigetragen. Neben multikulturellen und multilingualen Gesellschaften sorgen für diese Popularität die höheren Kosten für Übersetzungen durch den Menschen, die Geschwindigkeit der MÜ und eine mögliche fehlende Verfügbarkeit eines menschlichen Übersetzers.
Viele wissen jedoch nicht, dass sie regelmäßig auf künstliche Intelligenz zurückgreifen, die hinter dem Konzept der MÜ steckt. Konkrete Beispiele sind Google Translate oder Microsoft Translator. Besonders der Dienst Google Translate ist den meisten Menschen, die das Internet benutzen, inzwischen ein Begriff. Der Microsoft Translator ist das von Microsoft angebotene Pendant zum Übersetzungsdienst von Google.
Die MÜ, oder auch im Englischen Machine Translation (MT) genannt, bietet viele Möglichkeiten der wissenschaftlichen Forschung. Diese, im Rahmen des Übersetzungstechnologischen Seminars erstellte Arbeit, befasst sich mit den Grundlagen der MÜ. Zu diesem grundlegenden Wissen gehört die geschichtliche Entwicklung, die Vorstellung der verschiedenen Ansätze der MÜ und Evaluationsmöglichkeiten von maschinell übersetzten Texten. Um einen praktischen Eindruck der MÜ zu bekommen, wird der Microsoft Translator als statistisches maschinelles Übersetzungssystem (SMÜ) vorgestellt.
Um den Umfang der Seminararbeit nicht zu sprengen und damit Vorgaben nicht einzuhalten, wird der Microsoft Translator nicht evaluiert, sondern nur exemplarisch für SMÜ-Systeme präsentiert.
Inhaltsverzeichnis
1 Einleitung
2 Maschinelle Übersetzung
2.1 Geschichtliche Entwicklung
2.2 Begriffserklärung und Abgrenzung
2.3 Arten der maschinellen Übersetzung
2.3.1 Regelbasierte maschinelle Übersetzung
2.3.2 Korpusbasierte maschinelle Übersetzung
2.3.3 Vor- und Nachteile der MÜ-Ansätze
2.4 Praktischer Nutzen der maschinellen Übersetzung
3 Die Evaluation der maschinellen Übersetzung
3.1 Evaluationsmöglichkeiten
3.1.1 Manuelle Evaluation
3.1.2 Automatische Evaluation
3.1.3 Aufgabenorientierte Evaluation
3.1.4 Bewertung der Evaluationskriterien
4 Das SMÜ-System Microsoft Translator
4.1 Geschichte und Eigenschaften des Microsoft Translator
4.2 Bedienung des Microsoft Translator im Browser
4.3 Weitere Einsatzgebiete des Microsoft Translator
5 Fazit
Zielsetzung & Themen
Diese Arbeit befasst sich mit den Grundlagen der maschinellen Übersetzung (MÜ) im Kontext der Computerlinguistik. Das primäre Ziel ist es, dem Leser einen umfassenden Überblick über die historische Entwicklung, die technologischen Ansätze sowie die Methoden zur Evaluation der Übersetzungsqualität zu vermitteln und den Microsoft Translator als praktisches Beispiel für statistische MÜ-Systeme vorzustellen.
- Historische Entwicklung der maschinellen Übersetzung.
- Differenzierung zwischen regelbasierten, korpusbasierten und hybriden MÜ-Ansätzen.
- Kriterien und Verfahren zur Evaluation von Übersetzungsergebnissen.
- Vorstellung der Funktionen und Einsatzbereiche des Microsoft Translator.
- Gegenüberstellung von Nutzen und Herausforderungen der automatisierten Übersetzung.
Auszug aus dem Buch
2.3.1 Regelbasierte maschinelle Übersetzung
Die regelbasierte maschinelle Übersetzung, oder auch Rule-Based Machine Translation (RBMT), ist neben der statistischen maschinellen Übersetzung (SMÜ) die Hauptart der MÜ (Stein 2009: 7) und ist folgendermaßen definiert:
Der Ausgangstext wird analysiert, und diese Analyse wird mittels eines Satzes von linguistischen Regeln und eines Wörterbuchs in Strukturen der Zielsprache übersetzt, aus denen der Zieltext generiert wird. (Azzano 2009: 20)
Somit lässt sich ableiten, dass die regelbasierte MÜ durch drei aufeinanderfolgende, einzelne Ebenen eine Übersetzung erstellt. Diese Ebenen sind die Analyse-Ebene, die Transfer-Ebene und die Synthese-Ebene. Des Weiteren finden sich beim regelbasierten Ansatz drei verschiedene Komplexitätsstufen der gerade genannten Ebenen (Stein 2009: 7).
Eine dieser Komplexitätsstufen ist die direkte Übersetzung. Die direkte Übersetzung transferiert aus der Ausgangssprache Wort für Wort in die Zielsprache. Dabei werden die einzelnen übersetzten Wörter an die Satzstellung der zu übersetzenden Sprache aligniert. Dies geschieht durch eine syntaktische Komponente, jedoch liegen die Nachteile auf der Hand: Für die meisten Wörter findet sich mehr als eine Übersetzung. Auch Mehrwortlexeme, welche nicht wörtlich übersetzt werden können, werden nicht erkannt (Stein 2009: 7). Zur besseren Veranschaulichung wird das Prinzip der direkten Übersetzung von Jekat/Volk (2004: 566) in Abbildung 2.1 schematisch dargestellt.
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung führt in das Thema der maschinellen Übersetzung als Teilgebiet der künstlichen Intelligenz ein und stellt den Aufbau der Arbeit sowie den Fokus auf den Microsoft Translator dar.
2 Maschinelle Übersetzung: Dieses Kapitel erläutert die geschichtliche Entwicklung, definiert den Begriff der maschinellen Übersetzung und beschreibt detailliert die verschiedenen technologischen Ansätze wie regelbasierte und korpusbasierte MÜ.
3 Die Evaluation der maschinellen Übersetzung: Das Kapitel widmet sich den Methoden zur Bewertung der Übersetzungsqualität, inklusive manueller und automatischer Verfahren sowie der aufgabenorientierten Evaluation.
4 Das SMÜ-System Microsoft Translator: Hier wird der Microsoft Translator als Beispiel eines statistischen Übersetzungssystems vorgestellt, inklusive dessen Geschichte, Bedienung und spezifischer Einsatzgebiete.
5 Fazit: Das abschließende Kapitel fasst die zentralen Erkenntnisse der Arbeit zusammen und bietet einen Ausblick auf künftigen Forschungsbedarf.
Schlüsselwörter
Maschinelle Übersetzung, MÜ, Statistik, Regelbasiert, Korpus, Evaluation, Microsoft Translator, Sprachverarbeitung, Post-Editing, BLEU, METEOR, Computerlinguistik, Translation, Sprachpaare, Datensicherheit.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit?
Die Arbeit behandelt die Grundlagen der maschinellen Übersetzung als Form der künstlichen Intelligenz, ihre Entwicklung sowie Möglichkeiten zur technologischen und qualitativen Evaluation.
Welche zentralen Themenfelder werden abgedeckt?
Zentral sind die historische Entwicklung, die Typologie der MÜ-Systeme, verschiedene Evaluierungsmethoden für übersetzte Texte sowie die praktische Anwendung am Beispiel des Microsoft Translator.
Was ist das primäre Ziel dieser Arbeit?
Das Ziel ist es, ein fundiertes Verständnis für die Funktionsweisen automatisierter Übersetzungssysteme zu vermitteln und aufzuzeigen, wie deren Qualität in der Praxis objektiv beurteilt werden kann.
Welche wissenschaftlichen Methoden werden verwendet?
Die Arbeit basiert auf einer Literaturanalyse der Fachdisziplin Computerlinguistik und nutzt schematische Modelle sowie Tabellen zur Veranschaulichung der MÜ-Ansätze und Evaluationskriterien.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die technologische Analyse der MÜ-Ansätze, eine detaillierte Diskussion von Evaluationskriterien und die Vorstellung der Funktionen des Microsoft Translator.
Welche Schlüsselbegriffe charakterisieren die Arbeit?
Wichtige Begriffe sind maschinelle Übersetzung, Evaluation, statistische Verfahren (SMÜ), regelbasierte Systeme, Postedition, BLEU-Metrik und Sprachpaare.
Warum wird zwischen manueller und automatischer Evaluation unterschieden?
Die manuelle Evaluation gilt als präzise, ist aber zeit- und kostenintensiv, während die automatische Evaluation wie die BLEU-Metrik eine schnelle und objektivere, wenn auch teils fehleranfällige Beurteilung ermöglicht.
Welche Rolle spielt der Microsoft Translator in der Arbeit?
Er dient als exemplarisches, praxisnahes Beispiel für ein modernes, statistisches MÜ-System und verdeutlicht die einfache Nutzbarkeit sowie die Einsatzgebiete im Web und in Unternehmenslösungen.
Was sind laut der Arbeit die größten Herausforderungen der MÜ?
Herausforderungen ergeben sich insbesondere durch Ambiguitäten in Sprachen, komplexe Satzstrukturen, die Notwendigkeit von Posteditionen und die Schwierigkeit, in automatisierten Verfahren linguistisches Verständnis abzubilden.
Welcher Ausblick wird im Fazit gegeben?
Das Fazit weist auf weiteren Forschungsbedarf hin, insbesondere im Hinblick auf neue Technologien wie die Echtzeit-Spracherkennung sowie kritische Aspekte wie den Datenschutz bei der Nutzung kostenloser Online-Übersetzungsdienste.
- Quote paper
- Thomas Buchmaier (Author), 2016, Die maschinelle Übersetzung als Form der künstlichen Intelligenz in der Computerlinguistik. Das statistikbasierte Übersetzungssystem Microsoft Translator, Munich, GRIN Verlag, https://www.grin.com/document/321954