1 Einführung in die Korpuslinguistik
1. 1 Fachsprache
1. 1. 1 Definition
1. 1. 2 Das Fachwort
1. 1. 3 Computerlinguistische Untersuchungen von Fachsprachen
1. 2 Maschinelle Übersetzung
1. 3 Korpuslinguistik
1. 3. 1 Einführung
1. 3. 2 Korpora
1. 3. 3 Korpusannotation
1. 3. 3. 1 Definition
1. 3. 3. 2 Tagging
1. 3. 3. 3 Parsing
1. 3. 3. 4 Alignierung
1. 3. 4 Das Programm Termight
2 Eine Exemplarische Evaluation: Textanalyse- und
Konkordanzprogramme Monoconc 2.0 Pro der Firma Athelstan
und Concordance 3.0
2. 1 Monoconc 2.0
2. 2 Concordance 3.0
2. 3 Evaluation
Anlagen
Bibliografie
2
Die computergestützte Extraktion von Fachtermini aus Textkorpora: Textanalysetools und Konkordanzprogramme
1 Einführung in die Korpuslinguistik
1. 1 Fachsprache
1. 1. 1 Definition
„Fachsprache” wird oft in Gegensatz zum Begriff der Gemein- oder Standardsprache gestellt. Bis jetzt gibt es keine einheitliche Fachsprachendefinition. Die verschiedenen Definitionen betonen die Verwendungszusammenhänge von Sprache und machen deutlich, dass Fachsprachen keine eigenen Sprachsysteme sind, sondern vielfältige Beziehungen zur Gemeinsprache besitzen. Außerdem zeigen sie, dass es keine befriedigende Definition von Fachsprache geben kann und es die Fachsprache nicht gibt.
Der Sprachwissenschaftler Hoffmann stellt in seiner Definition den kommunikativen Aspekt in den Vordergrund:
„Fachsprache - das ist die Gesamtheit aller sprachlichen Mittel, die in
einem fachlich begrenzbaren Kommunikationsbereich verwendet werden, um die Verständigung zwischen den in diesem Bereich tätigen Menschen zu gewährleisten.“
Hoffmann, Kommunikationsmittel Fachsprache, Tübingen: Narr, 1985.
Meistens wird eine horizontale und eine vertikale Gliederung der Fachsprachen unterschieden. Die horizontale Gliederung bezieht sich auf die Einteilung des Wissens in die einzelnen Fachgebiete. Unter vertikaler Gliederung versteht man die Unterteilung der Fachsprache eines Fachgebiets in verschiedene Sprachebenen.
Die Frage, in welchen Punkten sich fachsprachliche Texte von gemeinsprachlichen unterscheiden, lässt sich nur schwer pauschal beantworten. Der Grund liegt in der Vielschichtigkeit des Phänomens Fachsprache.
3
Vertreter der funktionalen Stilistik erarbeiteten auf der Grundlage von Fachtexten der wichtigeren europäischen Sprachen eine Reihe von Merkmalen, die fast alle Fachsprachen gemeinsam haben; die wichtigsten von ihnen sind nach Hoffmann:
1. Das Verb verliert seinen konkreten Zeitbezug und steht zumeist im Präsens, insbesondere in der 3. Person Singular.
2. Das Verb steht häufig im Passiv.
3. Das Verb als Wortart spielt eine geringe Rolle.
4. Das Substantiv spielt eine wichtige Rolle.
5. Der Singular ist wesentlich häufiger als der Plural.
6. Das Adjektiv tritt verhältnismäßig häufig auf.
1. 1. 2 Das Fachwort
Das Fachwort (=Terminus) ist nicht das einzige Wesensmerkmal von Fachsprache, ist jedoch für die Fachsprache von zentraler Bedeutung.
Es gibt zwar verschiedene definitorische Ansätze allerdings herrscht über die Funktion und die Kennzeichen des Terminus weitgehend Einigkeit. Die wichtigsten, von den Sprachwissenschaftlern übereinstimmend genannten Charakteristika werden von Fluck folgendermaßen zusammengefasst:
„Gegenüber den gemeinsprachlichen Wörtern zeichnen sich die Fachwörter vor allem durch ihren fachbezogenen Inhalt und ihre Kontextautonomie aus. Als weitere Eigenschaften werden in der Literatur die Tendenz zu Exaktheit, Eindeutigkeit, Begrifflichkeit, Systematik, Neutralität und Ausdrucksökonomie genannt.“
Fluck, Fachsprachen, Tübingen: Francke, 3. Auflage, 1985.
4
Die hier von Fluck angeführten Kriterien gehen zum Teil auf die Ausführungen von Eugen Wüster, dem Begründer der Allgemeinen Terminologielehre, zurück und sind von fast allen Fachsprachenforschern aufgegriffen und ergänzt worden.
Kontextautonomie bedeutet, dass der Terminus auch ohne Kontext verständlich ist. Exaktheit steht für die genaue Bedeutungsfestlegung des Fachworts und seine Abgrenzung gegenüber anderen Fachwörtern. Eindeutigkeit (Monosemantizität) meint, dass das Fachwort nur einen fachlichen Begriff repräsentiert. Begrifflichkeit bezeichnet die Einbindung des Fachworts in ein Begriffssystem und seine Funktion als sprachliches Zeichen für eine gedankliche Einheit, den Begriff. Systematik ist die Beziehung des Begriffs zu anderen Begriffen, d. h. seine Einbettung in ein Begriffssystem. Neutralität weist auf die Rationalität und Objektbezogenheit der fachsprachlichen Verständigung hin, die sich im weitgehenden oder völligen Fehlen ästhetischer, expressiver und modaler Komponenten im Fachwortschatz äußert. Ausdrucksökonomie leitet sich aus dem Bestreben nach fachlicher Präzision und nach formaler Kürze und Knappheit ab.
1. 1. 3 Computerlinguistische Untersuchungen von Fachsprachen
Terminologiearbeit kann in der Übersetzungswissenschaft unter zwei Aspekten betrieben werden: normativ oder deskriptiv.
Die normative Terminologiearbeit definiert einen Soll-Zustand von Fachsprache. Wird die normative Terminologiearbeit mehrsprachig betrieben, so geht man von einer interlingualen Äquivalenz von Benennungen aus, d. h. von der Annahme, dass einer bestimmten Benennung eines Begriffs in der einen Sprache auch eine bestimmte Benennung desselben Begriffs in der anderen Sprache entspricht (1:1 Benennungen). Die fachsprachliche Realität sieht jedoch oft anders aus.
In der deskriptiven Terminologiearbeit geht es um die Beschreibung des bestehenden Sprachzustands (Ist-Zustand ).
Übersetzungsbezogene Terminologiearbeit wird in der Regel von Terminologen und Übersetzern durchgeführt. Werden ein Sachgebiet und seine Terminologie im Zusammenhang bearbeitet, so spricht man von systematischer Terminologiearbeit. Die berufliche Wirklichkeit lässt dies allerdings nicht immer zu. Daher spielen
5
„punktuelle” Untersuchungen häufig eine weit wichtigere Rolle, d. h. der Terminologe bemüht sich, einzelne Wortgleichungen möglichst mit einem relevanten, d. h. aussagekräftigen Kontext zu finden, die der Fachübersetzer für eine konkrete Übersetzung benötigt.
Aufgrund des wachsenden Bedarfs an Fachübersetzungen ist es verständlich, dass gegenwärtig ein starkes Interesse an Maschineller Übersetzung bzw. an effizienten Werkzeugen zur Unterstützung des Übersetzungsprozesses besteht. Vollautomatisch erstellte und gleichzeitig qualitativ hochwertige Übersetzungen sind allerdings selten.
Computerlinguistischen Ansätze zur Analyse von Fachsprachen und Fachtexten, besonders unter dem Aspekt der Übersetzung, sind durch die Ergebnisse der Forschung zur maschinellen Übersetzung und durch die Korpuslinguistik beeinflusst.
1. 2 Maschinelle Übersetzung
Die meisten Forschungen in dieser Richtung beschäftigen sich heutzutage mit der Interaktion zwischen menschlichen Übersetzern und elektronischen Hilfsmitteln im Übersetzungsprozess: die computergestützte Übersetzung (computer-aided translation: CAT). Diese Interaktion wird unter zwei Aspekten untersucht:
• CAT-C: Übersetzung durch den Computer, vom Menschen durch Präedition, Interaktion und/oder Postedition gesteuert bzw. korrigiert
• CAT-H: Eine vorwiegend intellektuell angefertigte (Human-) Übersetzung, Die Arbeit des Übersetzers wird durch spezielle Hilfsmittel in Form von Textverarbeitungswerkzeugen, elektronischen Wörterbüchern, Terminologiedatenbanken usw. unterstützt.
6
1. 3 Korpuslinguistik
1. 3. 1 Einführung
Die Korpuslinguistik entwickelte sich aus der Computerlinguistik.
„Given the staggering volume of translations produced year after year,
it is quite obvious that existing translations contain more solutions to
more translation problems than any other existing resource. Unfortunately
translators can currently derive very little benefit of this fact.“
Isabelle, Bi-textual aids for translators, 1992.
Texte bzw. Korpora waren schon immer ein Untersuchungsgegenstand sprachwissenschaftlicher und computerlinguistischer Forschungen. Die zunehmende Verfügbarkeit von großen textuellen Ressourcen in maschinenlesbarer Form hat dazu beigetragen, dass Statistische Methoden für die Lösung verschiedener linguistischer Fragestellungen entwickelt wurden und werden, so z. B. in der monolingualen und bilingualen Lexikographie und bei der automatischen Wortklassenannotation.
1. 3. 2 Korpora
John Sinclair definiert ein Korpus als
„A collection of naturally occurring language text, chosen to characterize a state or variety of a language.“
John Sinclair, Corpus, Concordance, Collocation, OUP, 1991
Demzufolge kann jede Sammlung von Texten, gesprochene Texte mit eingeschlossen, als Korpus aufgefasst werden, sofern die Texte gezielt ausgewählt wurden. Wichtig ist hierbei der Gedanke, dass ein Korpus zu einem bestimmten Zweck erstellt wird und einen bestimmten Ausschnitt einer Sprache darstellt.
7
Arbeit zitieren:
Maria Nitsche, 2003, Die computergestützte Extraktion von Fachtermini aus Textkorpora: Textanalysetools und Konkordanzprogramme, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Grundlagen der übersetzungsbezogenen Terminologiearbeit
Hausarbeit (Hauptseminar), 27 Seiten
Performativität der Identitäten im HipHop
Kulturwissenschaften - Allgemeines und Begriffe
Referat (Ausarbeitung), 22 Seiten
Typische Bestandteile eines ein- bzw. zweisprachigen (lernerbezogenen)...
Sprachwissenschaft / Sprachforschung (fachübergreifend)
Seminararbeit, 21 Seiten
Texttypologie und Übersetzungsstrategie - Eine linguistisch-translator...
Diplomarbeit, 130 Seiten
Grundsätzliche Aspekte der Entwicklung von Fachsprachen
Sprachwissenschaft / Sprachforschung (fachübergreifend)
Hausarbeit, 23 Seiten
Eine kurze Geschichte der Sprachwissenschaft
Sprachwissenschaft / Sprachforschung (fachübergreifend)
Wissenschaftlicher Aufsatz, 24 Seiten
Exemplarische Kodierung ausgewählter Zeitungsartikel mit Hilfe des Pro...
Verbale Daten analysieren – Ei...
Soziologie - Methodologie und Methoden
Hausarbeit (Hauptseminar), 118 Seiten
Die Verständlichkeit von Wissenschaftstexten
Sprachwissenschaft / Sprachforschung (fachübergreifend)
Hausarbeit (Hauptseminar), 27 Seiten
Zu: 'Schwere Stunde' von Thomas Mann
Germanistik - Neuere Deutsche Literatur
Referat (Ausarbeitung), 12 Seiten
Geschichte der Terminologiearbeit vom 19. Jahrhundert bis heute
Seminararbeit, 14 Seiten
Claudio - Leben eines Toten. Analyse des Dramas "Der Tor und der ...
Hausarbeit (Hauptseminar), 32 Seiten
Grundlagen der übersetzungsbezogenen Terminologiearbeit - Terminologi...
Sprachwissenschaft / Sprachforschung (fachübergreifend)
Seminararbeit, 24 Seiten
Hugo von Hofmannsthal und sein "Jedermann" - Biographie, zen...
Germanistik - Neuere Deutsche Literatur
Hausarbeit, 58 Seiten
Shake it!- Frauenbild und Sexismus in der Jugendkultur des HipHop
Sozialpädagogik / Sozialarbeit
Diplomarbeit, 81 Seiten
Maria Nitsche's Text Die computergestützte Extraktion von Fachtermini aus Textkorpora: Textanalysetools und Konkordanzprogramme ist nun auf dem Buchmarkt erhältlich
Maria Nitsche hat den Text Die computergestützte Extraktion von Fachtermini aus Textkorpora: Textanalysetools und Konkordanzprogramme veröffentlicht
Maria Nitsche hat einen neuen Text hochgeladen
Terminologie Du Management de Projet/Project Management Terminology
Project Management Institute
Terminologie der Berufsbildungspolitik
Mehrsprachiges Glossar für ein...
. Cedefop - Europäisches Zentrum für die Förderung der Berufsbildung, European Commission
Textcorpus Und Worterbuch: Aspekte Zur Agyptischen Lexikographie
Stefan Grunert, Ingelore Hafemann
0 Kommentare