Die maschinelle Übersetzung als Form der künstlichen Intelligenz in der Computerlinguistik. Das statistikbasierte Übersetzungssystem Microsoft Translator


Hausarbeit (Hauptseminar), 2016

43 Seiten, Note: 1,0


Leseprobe


Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Maschinelleübersetzung
2.1 Geschichtliche Entwicklung
2.2 Begriffserklärung und Abgrenzung
2.3 Arten der maschinellenübersetzung
2.3.1 Regelbasierte maschinelleübersetzung
2.3.2 Korpusbasierte maschinelleübersetzung
2.3.3 Vor- und Nachteile der MÜ-Ansätze
2.4 Praktischer Nutzen der maschinellenübersetzung

3 Die Evaluation der maschinellenübersetzung
3.1 Evaluationsmöglichkeiten
3.1.1 Manuelle Evaluation
3.1.2 Automatische Evaluation
3.1.3 Aufgabenorientierte Evaluation
3.1.4 Bewertung der Evaluationskriterien

4 Das SMÜ-System Microsoft Translator
4.1 Geschichte und Eigenschaften des Microsoft Translator
4.2 Bedienung des Microsoft Translator im Browser
4.3 Weitere Einsatzgebiete des Microsoft Translator

5 Fazit

Literaturverzeichnis

Abbildungsverzeichnis

Abb. 2.1 Schematische Darstellung einer direktenübersetzung

Abb. 2.2 Schematische Darstellung einer transferbasiertenübersetzung

Abb. 2.3 Schematische Darstellung einer Interlingua-Übersetzung

Abb. 2.4 Schematische Darstellung eines Pyramidendiagramms

Abb. 2.5 Praktischer Nutzen der MÜ

Abb. 3.1übersetzungsergebnisse zweier Systeme mit Referenzübersetzung

Abb. 4.1 Screenshot einerübersetzung des Microsoft Translator im Browser

Abb. 4.2 Screenshot einerübersetzung eines Tweets durch den Microsoft Translator

Abb. 4.3 Screenshot der angeboten Unternehmenslösungen

Abb. 4.4 Screenshot der angebotenen Webseiten-Lokalisierung

Tabellenverzeichnis

Tab. 2.1 Vor- und Nachteile der MÜ-Ansätze

Tab. 3.1 Unterschiedlicheübersetzungsvorschläge

Tab. 3.2 Auszug einer Rating Scale

Tab. 3.3 Bewertung der Evaluationskriterien

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Die vorliegende Semesterarbeit handelt von der Maschinelleübersetzung (MÜ) als Form der künstlichen Intelligenz in der Computerlinguistik. Die MÜist im Laufe der letzten Jahre vor allem durch das Internet und der Omnipräsenz digitaler Technologien in Gestalt von Smart- phones, Tablet-PCs oder anderen mobilen Endgeräten wie Smartwatches zu einem alltägli- chen Begleiter geworden. Kostenlose Online-Übersetzungsdienste haben zum Boom der MÜim Privatbereich enorm beigetragen. Neben multikulturellen und multilingualen Gesellschaften sorgen für diese Popularität die höheren Kosten fürübersetzungen durch den Menschen, die Geschwindigkeit der MÜund eine mögliche fehlende Verfügbarkeit eines menschlichenüber- setzers (Maia 2008: 124).

Viele wissen jedoch nicht, dass sie regelmäßig auf künstliche Intelligenz zurückgreifen, die hinter dem Konzept der MÜsteckt. Konkrete Beispiele sind Google Translate oder Microsoft Translator. Besonders der Dienst Google Translate ist den meisten Menschen, die das Internet benutzen, inzwischen ein Begriff. Der Microsoft Translator ist das von Microsoft angebotene Pendant zumübersetzungsdienst von Google.

Die MÜ, oder auch im Englischen Machine Translation (MT) genannt, bietet viele Möglichkeiten der wissenschaftlichen Forschung. Diese, im Rahmen desübersetzungstechnologischen Seminars erstellte Arbeit, befasst sich mit den Grundlagen der MÜ. Zu diesem grundlegenden Wissen gehört die geschichtliche Entwicklung, die Vorstellung der verschiedenen Ansätze der MÜund Evaluationsmöglichkeiten von maschinellübersetzten Texten. Um einen praktischen Eindruck der MÜzu bekommen, wird der Microsoft Translator als statistisches maschinellesübersetzungssystem (SMÜ) vorgestellt.

Um den Umfang der Seminararbeit nicht zu sprengen und damit Vorgaben nicht einzuhalten, wird der Microsoft Translator nicht evaluiert, sondern nur exemplarisch für SMÜ-Systeme prä- sentiert.

In der Arbeit wird zu Beginn in Kapitel 2 häufig auf William John Hutchins referiert. In der Entwicklung der MÜtrifft man in vielen wissenschaftlichen Abhandlungen auf Hutchins, und fehlt daher auch hier nicht. Folgend eine kurze Vorstellung von William John Hutchins:

Hutchins wurde am 27. Januar 1939 geboren und graduierte 1960 an der University of Nottin- gham mit einem Bachelor in Deutsch und Französisch. 1962 erwarb er ein Diplom in Biblio- thekswesen am University College London. Seine Doktorarbeit im Bereich der Philosophie fertigte er 2000 an der University of East Anglia in Norwich, England an. Während seiner be- ruflichen Laufbahn als Bibliothekar arbeitete er an der Durham University, der Sheffield Uni- versity und der University of East Anglia. Hutchins ist Autor mehrerer Bücher und Artikel im Linguistik-Bereich und seit 1978 hat er sich hauptsächlich auf die MÜkonzentriert. Von 1995 bis 2004 war Hutchins Präsident der European Association for Machine Translation und von 1999 bis 2001 Präsident der International Association for Machine Translation (Hutchins 2000: 15).

Auf seiner Internetseite (Biographical outline John Hutchins o.J.) hebt er folgende Werke und Tätigkeiten hervor:

- Machine translation: past, present, future
- Introduction to machine translation

- Early years in machine translation: memoirs and biographies of pioneers Außerdem werden die nachstehenden Tätigkeiten herausgestellt:

- Herausgeber der MT News International (1991 - 1997)
- Verfasser des Compendium of Translation Software (2000 - 2010)
- Verfasser des Machine Translation Archive (seit 2004)

2 Maschinelleübersetzung

Dieses zweite Kapitel ist eine Einführung in das Thema. Zunächst wird die geschichtliche Ent- wicklung aufgezeigt, denn um die maschinelleübersetzung in der heutigen Art und Weise zu verstehen, ist der Blick auf den historischen Hintergrund hilfreich. In Punkt 2.2 wird der Begriff maschinelleübersetzung anschließend definiert und zur Humanübersetzung abgegrenzt. Ab- schließend werden in Punkt 2.3 die verschiedenen Arten der MÜbeschrieben und deren Vor- und Nachteile genannt.

2.1 Geschichtliche Entwicklung

Weltweit gibt es mehr als 5000 Sprachen. Eine solche Sprachenvielfalt kann jedoch nachteilig sein. Es ist unmöglich, dass Menschen alle Sprachen beherrschen. Dadurch entstand das Konzept der Translation, um Sprache als effektives Kommunikationsmedium benutzen zu kön- nen (Tripathi/Sarkhel 2010: 388). Seit Jahrhunderten wuchs der Wunsch,übersetzungen zu vereinfachen. Aber erst der technische Fortschritt konnte diesen Wunsch Stück für Stück rea- lisieren. Im 17. Jahrhundert existierten ersteüberlegungen, Kommunikationsprobleme durch mechanische Wörterbücher zuüberwinden. Bis zu dieser Zeit blieb die lateinische Sprache eine universelle Wissenschaftssprache. Diesen Stellenwert begann sie jedoch zu verlieren. Es gab immer stärker werdende Meinungen, dass natürliche Sprachen keine eindeutige und un- missverständliche Kommunikationsform, um geistige Denkeinheiten klar und deutlich anderen Menschen mitzuteilen, darstellen (Hutchins 1986: 21). Descartes und Leibniz vermuteten eine Möglichkeit, Wörterbücher durch universelle, numerische Codes anzufertigen. Es entstanden zu dieser Zeitüberlegungen, eine universelle Sprache zu erschaffen, die auf logischen Regeln und Bildsymbolen basiert. Hierdurch sollte eine Kommunikation zwischen Menschen, unab- hängig des Kultur- und Sprachkreises, gewährleistet sein. Die schriftliche Ausarbeitung Essay towards a Real Character and a Philosophical Language von John Wilkins aus dem Jahr 1668 gehört zu einer der bekanntesten Schriften zu diesem Thema. In den nachfolgenden Jahrhun- derten gab es konkretere Ansätze, eine universelle Sprache aufzubauen. Esperanto war hier- bei das bekannteste Beispiel. Jedoch dauerte es bis zur Mitte des 20. Jahrhunderts, bisüber- setzungen maschinell möglich waren (Hutchins 1992: 5). 1933 gab es weitere Entwicklungen der MÜ: Der französisch-armenische Georges Artsrouni und der Russe Petr Trojanskii melde- ten Patente fürübersetzungsmaschinen an, wobei das Patent von Trojanskii bedeutsamer war. Er schlug eine Methode eines automatischen zweisprachigen Wörterbuches vor und er- gänzte sein Patent, welches das Kodieren einer Interlingua mit grammatischen Regeln be- schreibt. Zusätzlich nannte er im Rahmen dieses Patentesüberlegungen zur Satzanalyse und zur Texterstellung in anderen Sprachen (Hutchins 2000: 5). Hutchins deklarierte diesen Zeit- raum in der Entwicklung der MÜals Die Zeit vor dem Computer. Den folgenden geschichtlichen Verlauf der MÜim 20. Jahrhundert teilt Hutchins in weitere Perioden ein.

So definiert er die Jahre zwischen 1947 und 1954 als erste Periode. Mehrere Treffen von Andrew Booth (London University) und Warren Weaver (Rockefeller Foundation) läuteten die Zeit der Ersten Pioniere ein. Sie trafen sich 1946 und 1947 und hatten konkrete Ideen, auto- matischeübersetzungen durch die bis zu diesem Zeitpunkt vorhandene Technologie anzufer- tigen (Hutchins 2000: 5). Bei diesen Treffen stand außerdem die Frage im Raum, ob die Ro- ckefeller Foundation bereit wäre, sich finanziell an der Installation eines Computers an der Universität von London zu beteiligen. Dieser Computer sollte nicht für mathematische oder physikalische Berechnungen verwendet werden, sondern für translatorische Aufgaben (Hut- chins 1968: 24-25). Das Weaver-Memorandum war ein weiteres erwähnenswertes Ereignis während der Ersten Pioniere. Im Juli 1949 veröffentlichte Warren Weaver in diesem Memo- randum mögliche Vorschläge, um Probleme der MÜentgegenzutreten. Als problematisch nannte er zum Beispiel Ambiguitäten. Dieses Memorandum inspirierte andere Forscher. Im Mai 1951 wurde der ersten Wissenschaftler im Bereich der maschinellenübersetzung, der Israeli Yehoshua Bar-Hillel, ernannt. Er brachte noch im selben Jahr den damals innovativsten Bericht heraus. Im Sommer 1952 fand die erste Konferenz rund um die MÜam Massachusetts Institute of Technology (MIT) statt. Besondere Aufmerksamkeit während dieser Konferenz er- hielten das Pre-Editing, Post-Editing, Micro-Glossaries und die syntaktische Analyse. Ein Ge- meinschaftsprojekt von Peter Sheridan von IBM und Paul Garvin von der Georgetown Univer- sity machte 1954 Schlagzeilen. In New York, Sitz des IBM Headquarters, fand eine Demonst- ration eines russisch-englischen Systems statt (Hutchins 2000: 5-6). Dieses System basierte auf 250 Wörterbucheinträgen und sechs grammatischen Regeln. Bei der Präsentation wurden Sätze vom Russischen ins Englischeübersetzt und sowohl die Öffentlichkeit als auch Fach- leute waren beeindruckt (Hutchins 1986: 36-37).

Hutchins typisiert 1954 bis 1959 als den Zeitraum der Innovation und des Enthusiasmus. Auf- grund des IBM-Georgetown-Systems wurden ausreichend Forschungsgelder für die MÜbe- reitgestellt. Die Forschung fand zusätzlich auch jenseits des Atlantiks statt. Der Russe Dmitrij Panov gilt als der Begründer der MÜ-Forschung in der damaligen Sowjetunion. 1954 ist auch das Jahr, in dem das erste Journal veröffentlicht und Anthony Oettinger als erster im Fachbe- reich MÜan der Harvard University promovierte. Um die MÜzu verbessern, forschte man in den nächsten Jahren nicht nur am MIT. Beispiele für andere Forschungsstätte sind hier die Ramo-Wooldridge Corporation, die Cambridge Language Research Unit, die Charles Univer- sität in Prag oder das Electro-Technical Laboratory (ETL) in Tokio.überdies gab es während dieser Zeit zahlreiche Fachkonferenzen. Die zunehmende Wichtigkeit derübersetzung durch Maschinen erkennt man anhand der Vorführungen des Georgetown-Systems in den Sprachen Russisch und Englisch im Pentagon im Juni 1959. Bar-Hillel führte 1958 eine Untersuchung durch und veröffentlichte 1959 diese als Report. Ein Jahr später erschien dieser kritische Bei- trag in Advances in Computers. Zwar erweiterten russische Forschergruppen den Report um zusätzliche Informationen, jedoch beinhaltete er große Kritik an der MÜ: Die Aussichten auf eine qualitativ hochwertigeübersetzung durch Maschinen ständen nicht gut. Im Report wurde sogar davon gesprochen, dass eine hochwertige, vollautomatische Translation durch Maschi- nen, oder auch fully accurate high quality translation (FAHQT) genannt, nie erreicht werden könne (Hutchins 2000: 6-9).

Nach diesen Jahren folgt von 1960 bis 1964 das Zeitalter der Wachsenden Komplexität und der Desillusion. In den ersten Jahren des neuen Jahrzehnts zweifelten immer mehr Forscher an den Zielen der MÜ. Die Qualität derübersetzung durch Maschinen verbesserte sich bisher noch nicht wie erhofft. Auf der ganzen Welt fanden große Konferenzen statt und neue For- schergruppen taten sich zusammen. An der größten internationalen Konferenz in der Nähe von London nahmen 170 Forscher aus 15 Ländern teil. Das Jahr 1963 repräsentiert einen Wendepunkt, denn die CIA stellte die Fördermittel für die Georgetown-Gruppe ein. Im selben Jahr wollte die National Science Foundation (NSF), die bisher auch Geldgeber für Forschungs- projekte war, ein Komitee mit dem Ziel ins Leben rufen, den derzeitigen Stand der MÜzu untersuchen. Im April 1964 formierte sich das Automatic Language Processing Advisory Com- mittee (ALPAC) unter dem Vorsitz von John Pierce von Bell Labs. Dieses Komitee sollte her- ausfinden, ob weitere Forschungsgelder von staatlicher Seite angebracht seien. Bis zur Ver- öffentlichung des ALPAC-Reports im November 1966 fanden jedoch noch nennenswerte Er- eignisse statt. Das erste gemeinsame amerikanisch-japanische Seminarüber die MÜfand im April in Tokio statt. Das deutete darauf hin, dass dieübersetzung durch Maschinen nicht nur im amerikanischen, russischen und europäischen Sprachraum relevant war. Dank der Ent- wicklung des Systran-Systems durch Peter Thoma, erreichte die MÜin diesem Zeitraum auch endgültig Deutschland. Darüber hinaus installierte man das zweite Georgetown-System am Oak Ridge National Labratory (Hutchins 2000: 5-11).

Ein weiterer Abschnitt in der Ära der MÜumfasst laut Hutchins die Jahre 1966 - 1975. Die Zeit des ALPAC-Report und dessen Folgen war ernüchternd. Monetäre Investitionen in die MÜsollten aufgrund der Ergebnisse des ALPAC-Reports eingestellt werden. Auch die russi- schen Behörden begannen Fördergelder zu streichen. Die Folgen des Reports gingen sogar soweit, dass sich einige Forscher von dem nun aufgekommenen Stigma der maschinellenübersetzung distanzierten. Die Entwicklung der MÜwurde jedoch weitergeführt, wenn auch nicht mehr so intensiv und mit weniger Enthusiasmus wie vorher. Mitte der siebziger Jahre fand eine Wiederbelebung der maschinellenübersetzung mit dem bereits erwähnten SystranSystem statt. Die NASA verwendete 1974 Systran fürübersetzungen während des ApolloSojus-Projekts. Die Europäische Kommission verwendete nach Vorführungen von Systran in Bonn, Zürich und Luxemburg im Juni 1975 das System als Basis für alle maschinellenübersetzungen. Durch den Einsatz des Météo-Systems 1976 in Montreal wurden Wetterberichte vollautomatischübersetzt. Systran und Météo zeigten zu diesem Zeitpunkt, dass MÜauch vom praktischen Nutzen war und nicht nur zu theoretischen Zwecken erforscht werden sollte. Somit begann der Wiederaufstieg der MÜ(Hutchins 2000: 11-12).

Die Wiederbelebung der MÜäußerte sich durch die Entwicklung und Einführung vieler weiterer Systeme. Das erwähnenswerteste ist METAL (Mechanical Translation and Analysis of Langu- age) von 1989. Das System war bis zu diesem Zeitpunkt eines der besten am Markt existie- renden und wurde von Siemens in München für das Sprachpaar Deutsch-Englisch entwickelt. METAL arbeitete hauptsächlich nach dem transferbasierten Ansatz1. Beeindruckend an ME- TAL war dessen Entwicklung, denn an der University of Texas begann die Forschung dafür schon 1961. Zunächst war der Hauptgeber der Fördermittel das US Air Force Rome Air De- velopment Center bis 1979. Ab 1980 finanzierte das Projekt nur noch Siemens. Das Interesse des Unternehmens an der Entwicklung eines solchen Systems zur maschinellenübersetzung galt der Verbesserung der eigenenübersetzungsdienstleistungen. METAL sollte umfangrei- che Texteditionen und Zugang zu Terminologiedatenbanken ermöglichen. Auch die Verarbei- tung sehr hoherübersetzungsmengen von Technischer Dokumentationen mit vielen Tabel- lendiagrammen und Flowcharts sollten Ziel von METAL sein (Hutchins 1992: 259-260). Eva- luationen Mitte der 1980er Jahre bestätigten den Erfolg. Es gab innerhalb fünf Jahren eine Verbesserung derübersetzungsqualität um 30 Prozent. Auch das Post-Editing verbesserte sich von 15 - 20 Seiten pro Tag aufüber 40 Seiten pro Tag (Hutchins 1992: 277).

Zusammenfassend erkennt man, dass die MÜnoch eine relativ junge Disziplin ist. Jedoch existiert der Wunsch nach einer annähernd fehlerfreienübersetzung durch Maschinen schon mehrere Jahrhunderte. Da die Entwicklung und die Forschung der maschinellenübersetzung auch von Zeiten wenigen Enthusiasmus und rückläufigen Interesse geprägt sind, lässt auf die Schwachstellen und Probleme der automatischenübersetzung durch Maschinen schließen. Im Kapitel 2.3 werden die Arten der maschinellenübersetzungen näher betrachtet und auf die Schwachstellen hingewiesen, die für das rückläufige Interesse an der maschinellenüberset- zung in der Vergangenheit möglicherweise verantwortlich gemacht werden können. Zunächst wird im folgenden Abschnitt die MÜjedoch noch genau definiert und abgegrenzt. Die differen- zierten Definitionen zeigen, dass die MÜkeine einfach zu beschreibende Technologie ist.

2.2 Begriffserklärung und Abgrenzung

Hutchins definiert die maschinelleübersetzung zunächst prägnant mit „Machine translation is the application of computers to the translation of texts from one natural language into another.“ (Hutchins 1986: 15). Sechs Jahre später publiziert Hutchins zusammen mit Somers eine erweiterte Begriffserklärung:

The term Machine Translation (MT) is the now traditional and standard name for computerised systems responsible for the production of translations from one natural language into another, with or without human assistance. (Hutchins/Somers 1992: 3)

Hutchins und Somers halten jedoch laut Ramlow die Erklärung zu allgemein. Die Definition sei zwar gültig, aber was genau der Mensch und was genau die Maschine während desübersetzungsprozesses mache, bliebe unklar.überdies könne sogar angenommen werden, dass dieübersetzungsqualität bei derübersetzung durch Maschinen eine gleich hohe oder zumindest zur Humanübersetzung ähnliche Qualität erreichen könne (Ramlow 2009: 110). Ramlow erstellt eine Definition, in der er seine Kritik mit einfließen lässt:

Maschinelleübersetzung ist dieübertragung einzelner Sätze von einer natürlichen Sprache in eine andere mithilfe eines Computerprogramms. Bei dem Ergebnis des maschinellenübersetzungsprozesses handelt es sich um eine inkohärente Abfolge von Sätzen, nicht aber um einen Text. Daher ist eine Postedition durch ein Human-übersetzer auf jeden Fall vonnöten, wenn das Ergebnis des maschinellenüberset- zungsprozesses von hoher Qualität sein muss (z.B. weil der Text veröffentlicht werden soll). Wird einübersetzungssystem eingesetzt, um nur die wesentlichen Informatio- nen eines Textes, der in einer Fremdsprache verfasst ist, zu erhalten, so kann eine maschinell erstellte inkohärente Abfolge von nicht posteditierten Sätzen diesem An- spruch gerecht werden. Ob dies tatsächlich so ist, hängt jedoch stark von der Kom- plexität des Textes, besser gesagt: der einzelnen Sätze und der Leistungsfähigkeit des jeweiligenübersetzungssystems ab und ist keineswegs immer der Fall. (Ramlow 2009: 112)

Wie zu sehen ist, findet man eine Definition leichter, indem man die Humanüberset- zung zur MÜabgrenzt. Ein entscheidender Unterschied zwischenübersetzung durch den Menschen und einer maschinellenübersetzung ist zweifelslos die Kommunikati- onsart: Eine Humanübersetzung ist eine Art der menschlichen Kommunikation. Diese findet nicht nur auf sprachlicher, sondern auch auf kultureller Ebene statt.übersetzen bedeutet somit ein interkultureller Kommunikationsaustausch, der von kennzeichnen- den kulturellen Kenntnissen geprägt ist. Bei einerübersetzung von Menschenhand wird dieses Wissen berücksichtigt. MÜ-Systeme können solche Qualitäten nicht auf- weisen (Ramlow 2009: 112-213). Gemäß Ramlow „handelt es sich bei der maschi- nellenübersetzung allenfalls um ein auf die Satzebene beschränkten Interlingua Kommunikationsprozess“ (Ramlow 2009: 113).

2.3 Arten der maschinellenübersetzung

Im Laufe der Zeit haben sich mehrere Arten derübersetzung durch Maschinen entwickelt. Wie in der Einleitung bereits beschrieben, hat sich die MÜgerade in den letzten Jahren verändert. Somers belegt dies im The Oxford Handbook of Computational Linguistics: Den größten Ein- fluss auf die Forschung an der maschinellenübersetzung hatten das Internet und letztlich die Internet-Benutzer mit der Verwendung der MÜ-Tools. Das World Wide Web stellte für die breite Masse eine MÜminderer Qualität zur Verfügung (Somers 2003: 513-514). Bevor auf das Thema Internet und maschinelleübersetzung eingegangen wird, werden zunächst die verschiedenen Arten der MÜdargestellt.

2.3.1 Regelbasierte maschinelleübersetzung

Die regelbasierte maschinelleübersetzung, oder auch Rule-Based Machine Translation (RBMT), ist neben der statistischen maschinellenübersetzung (SMÜ) die Hauptart der MÜ(Stein 2009: 7) und ist folgendermaßen definiert:

Der Ausgangstext wird analysiert, und diese Analyse wird mittels eines Satzes von linguistischen Regeln und eines Wörterbuchs in Strukturen der Zielspracheübersetzt, aus denen der Zieltext generiert wird. (Azzano 2009: 20)

Somit lässt sich ableiten, dass die regelbasierte MÜdurch drei aufeinanderfolgende, einzelne Ebenen eineübersetzung erstellt. Diese Ebenen sind die Analyse-Ebene, die Transfer-Ebene und die Synthese-Ebene. Des Weiteren finden sich beim regelbasierten Ansatz drei verschiedene Komplexitätsstufen der gerade genannten Ebenen (Stein 2009: 7).

Eine dieser Komplexitätsstufen ist die direkteübersetzung. Die direkteübersetzung transfe- riert aus der Ausgangssprache Wort für Wort in die Zielsprache. Dabei werden die einzelnenübersetzten Wörter an die Satzstellung der zuübersetzenden Sprache aligniert. Dies ge- schieht durch eine syntaktische Komponente, jedoch liegen die Nachteile auf der Hand: Für die meisten Wörter findet sich mehr als eineübersetzung. Auch Mehrwortlexeme, welche nicht wörtlichübersetzt werden können, werden nicht erkannt (Stein 2009: 7). Zur besseren Veran- schaulichung wird das Prinzip der direktenübersetzung von Jekat/Volk (2004: 566) in Abbil- dung 2.1 schematisch dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2.1 Schematische Darstellung einer direktenübersetzung (Jekat/Volk 2004: 566)

Durch diese Abbildung von Jekat/Volk (2004: 566) ist der Prozess vom Quell- zum Zieltext genau erkennbar. Nach einer morphologischen Analyse wird ein bilinguales Wörterbuch und folgend die Wortstellungskorrektur verwendet, bevor der Zieltext generiert wird.

Die zweite Komplexitätsstufe nach der direktenübersetzung ist die transferbasierteüberset- zung. Der transferbasierte Ansatz ist eine Weiterentwicklung und wird von Tripathi/Sarkhel (2010: 389) als zweite Generation der MÜbezeichnet. Beim Transferansatz durchläuft eineübersetzung drei verschiedene Phasen. Zuerst findet das Parsing2 des Quelltextes und im Anschluss dessen eine rudimentäre semantische Analyse statt (Jekat/Volk 2010: 646). Als nächsten Schritt beschreiben Jekat und Volk (2010: 646) den Ablauf durch das folgende Zitat: „anschließend wird die quellsprachliche Repräsentation durch die Anwendung von Transferregeln in eine abstrakte, zielsprachliche Repräsentation abgebildet.“.

Anhand diesen Informationen kann man ableiten, dass die Regeln des Transfers notwendig sind, um einen natürlich-sprachlichen Text zu generieren. Die Regeln entsprechen hierbei bestimmtenübersetzungsentsprechungen. Diese Entsprechungen werden jedoch unter Berücksichtigung von intelligenten Kontexten verwendet (Jekat/Volk 2010: 646).

Es können Tausende dieser Transferregeln verwendet werden, jedoch gilt hier, dass dieüber- setzungsqualität mit der Anzahl der Regeln ab einem gewissen Punkt eher abnimmt anstatt besser zu werden. Ein zu komplexes Regelwerk kann sich widersprechen und zu Fehlern füh- ren (Stein 2009: 7).

Zusammenfassend ist dieser Ansatz der maschinellenübersetzung in Abbildung 2.2 darge- stellt.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2.2 Schematische Darstellung einer transferbasiertenübersetzung (Jekat/Volk 2010: 646)

Die dritte Komplexitätsstufe ist die Interlingua-Übersetzung. Hier ist eine schematische Darstellung durch die folgende Abbildung 2.3 zur besseren Veranschaulichung hilfreich.

[...]


1 In Kapitel 2.3 werden die verschiedenen MÜ-Ansätze ausführlich vorgestellt.

2 Parsing bedeutet, einen String als grammatisch oder ungrammatisch bezüglich einer gegebenen Grammatik zu klassifizieren und ihm einen Strukturbaum zuzuordnen. Das Parsing ist eine Methode, für eine gegebene Grammatik und einen gegebenen Satz zu bestimmen, ob diese Grammatik diesen Satz generiert (und wie der entsprechende Ableitungsbaum aussieht). (Universität Potsdam Depart- ment Linguistik o.J.)

Ende der Leseprobe aus 43 Seiten

Details

Titel
Die maschinelle Übersetzung als Form der künstlichen Intelligenz in der Computerlinguistik. Das statistikbasierte Übersetzungssystem Microsoft Translator
Hochschule
Technische Hochschule Köln, ehem. Fachhochschule Köln  (Institut für Translation und Mehrsprachige Kommunikation)
Note
1,0
Autor
Jahr
2016
Seiten
43
Katalognummer
V321954
ISBN (eBook)
9783668212497
ISBN (Buch)
9783668212503
Dateigröße
1539 KB
Sprache
Deutsch
Schlagworte
übersetzung, form, intelligenz, computerlinguistik, vorstellung, übersetzungssystems, microsoft, translator
Arbeit zitieren
Thomas Buchmaier (Autor:in), 2016, Die maschinelle Übersetzung als Form der künstlichen Intelligenz in der Computerlinguistik. Das statistikbasierte Übersetzungssystem Microsoft Translator, München, GRIN Verlag, https://www.grin.com/document/321954

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Die maschinelle Übersetzung als Form der künstlichen Intelligenz in der Computerlinguistik. Das statistikbasierte Übersetzungssystem Microsoft Translator



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden