Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?


Hausarbeit, 2016
22 Seiten, Note: 2,0

Leseprobe

Inhalt

1. Einleitung

2. Methoden der Sprachwissenschaften

3. Was ist ein Korpus?

4. Wie ist ein Korpus aufgebaut?
4.1 Repräsentativität
4.2 Beständigkeit
4.3 Korpusgröße
4.4 Textproben
4.5 Inhalt
4.6 Metadaten

5. Wofür werden Korpora verwendet?
5.1 Erforschung von sprachlichen Strukturen und Varietäten
5.2 Erstellung von Wörterbüchern (Lexikografie)
5.3 Erstellung von Grammatiken (Grammatikografie)
5.3 Fremdsprachenunterricht und Übersetzung
5.5 Computerlinguistik

6. Welche Arten von Korpora gibt es?
6.1 Computerlesbare Korpora und nicht-computerlesbare Korpora
6.2 Gesamtkorpus und Teilkorpus
6.3 Volltextkorpus und Probenkorpus
6.4 Statische Korpora und Monitorkorpora
6.5 Annotierte Korpora und nicht-annotierte Korpora
6.6 Korpus der geschriebenen Sprache und der gesprochenen Sprache
6.7 Korpora der Gegenwartssprache und historische Korpora
6.8 Referenzkorpora und Spezialkorpora
6.9 Einsprachige und mehrsprachige Korpora

7. Verfahren zur Analyse von Korpusdaten
7.1 Stichwortsuche
7.2 Konkordanzen
7.3 Kollokationsanalyse
7.4 Wortlisten

8. Welche Suchtools gibt es?
8.1 World Wide Web als Korpus
8.2 Die Korpora des DWDS
8.3 COSMAS II
8.4 Das TIGER-Korpus

9. Fazit

1. Einleitung

Korpuslinguistische Methoden gehören mittlerweile zum Standardrepertoire der sprachwissenschaftlichen Forscherinnen und Forscher. Bereits im 19. Jhd. und früher1 wurden Textsammlungen zur Untersuchung des Sprachwandels sowie der Belegung von grammatikalischen Aussagen dokumentiert und analysiert. Diese galten auch als Vergleichsmaterial und zur Illustration vom Sprachgebrauch in Fremdsprachen. In der Korpuslinguistik wird u.a. die deutsche Sprache in ihren verschiedenen Erscheinungsformen bzw. ihrem Gebrauch untersucht. Dabei werden mittels verschiedener Korpora Hypothesen oder neue Erkenntnisse erstellt. Bei der Untersuchung des Sprachgebrauchs kann man verschiedene Methoden heranziehen. Da für die Datenanalyse technisches Know-how notwendig ist, liegt Korpuslinguistik folglich an der Schnittstelle zwischen Philologie und Informationstechnologie.

Was ist eigentlich ein Korpus? - ,,Ein Korpus ist eine Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen. Die Daten des Korpus sind digitalisiert, d.h. auf Rechnern gespeichert und maschinenlesbar. Die Bestandteile des Korpus, die Texte oder Äußerungsfolgen, bestehen aus den Daten selbst sowie möglicherweise aus Metadaten, die diese Daten beschreiben, und aus linguistischen Annotationen, die diesen Daten zugeordnet sind.“, so lautet die Definition nach Lemnitzer und Zinsmeister.2 Doch worauf muss man bei einer Analyse von Korpusdaten achten? Wie trifft man die geeignete Wahl eines Korpus für linguistische Recherchen? Welche Typen von Daten können in welchen Korpora untersucht werden? Diese aber auch andere Fragestellungen gelten als Ausgangspunkt jeder wissenschaftlichen Untersuchung. Wie schon erwähnt ist Korpuslinguistik somit eine `wissenschaftliche Tätigkeit, d.h. sie muss wissenschaftlichen Prinzipien folgen und wissenschaftlichen Ansprüchen genügen`.3 Sprachwissenschaftler untersuchen unter anderem folgende Fragestellungen: `Welche Pluralform von Konto ist die üblichste: Kontos, Konten, oder Konti?`, `Welche Schreibweise kommt am häufigsten vor: Schiffahrt oder Schifffahrt ?`, `Was sind die häufigsten Kollokationen für folgende Wörter: Hund, Katze, Maus, rot, Karte, weiß, Haus, Mutter, Vater ?`4, (…).

Welche gegenwärtigen Bezüge verbinden Korpuslinguistik mit unserem Alltag, d.h. weshalb ist Korpuslinguistik in der heutigen Forschung unabdingbar? Diese Frage kann durch die Relevanz der Sprache beantwortet werden. Denn wir leben in einer Welt, wo Kommunikation ohne (mündliche oder schriftliche) Sprache kaum möglich ist. Die Ausdrucksvarianten in unserem Sprachgebrauch bestimmen fein differenzierte Botschaften an die Gesprächspartner. Wichtig ist hierbei, inwiefern semantische Unterschiede durch den Sprachwandel entstehen und wie durch Suchtools analysiert werden können, weshalb wir z.B. im Laufe der Zeit/in bestimmten Situationen andere Wörter verwenden. Die Analyse zur Variation von Sprachelementen kann also u.a. aus soziolinguistischer Sicht, aus semantischer Sicht, aber auch aus historischer Sicht erfolgen. Diese Seminararbeit spezialisiert sich jedoch nur auf die linguistische Herangehensweise. Möchte man in der Germanistischen Linguistik empirisch arbeiten, um etwa die Form ` wegen dem Regen` im Dativ und `wegen des Regens` im Genitiv zu bestimmen oder zu diskutieren, so gibt es zwei sprachwissenschaftliche Ansätze, die dies ermöglichen. Man unterscheidet zwischen dem Sprachwissenschaftler und dem Sprachbenutzer. Der Unterschied liegt darin, dass der Sprachwissenschaftler das Zustandekommen der Formen erklärt und der Sprachbenutzer hinterfragt, welche Form richtig oder falsch ist. Der Sprachwissenschaftler bewertet die Formen jedoch nicht. Um die Auftretenshäufigkeit eines bestimmten Phänomens näher zu bestimmen, wäre vielmehr eine Untersuchung des Sprachgebrauchs5 notwendig.

Am Anfang der Seminararbeit werden Methoden der Sprachwissenschaft genannt, die zur Analyse der Sprache notwendig sind. Darauf folgt die Definition des Begriffes `Korpus`. Anschließend werden sowohl der Aufbau eines Korpus, die Verwendungsgebiete und Arten von Korpora, als auch Verfahren zur Analyse von Korpusdaten, sowie einige Beispiele für Suchtools vorgestellt und näher beschrieben. Ziel ist es also, eine Einführung in die Korpuslinguistik zu verschaffen und wichtige Begriffe zu erklären. Die Bücher ,, Korpuslinguistik“ von Carmen Scherer und ,,Korpuslinguistik“ von Lemnitzer und Zinsmeister waren für diese Seminararbeit auschlaggebend

2. Methoden der Sprachwissenschaften

Bei der Untersuchung des Sprachgebrauchs kann man drei verschiedene Methoden anwenden:

Zum einen kann man Sprecher per Interviews, mittels Briefen oder E-Mails befragen. Möchte man herausfinden, inwiefern eine Pluralform verbreitet ist, könnte man eine `Gruppe von Sprechern deutscher Muttersprache befragen, ob diese die Pluralform bereits gehört haben bzw. sie verwenden`6. Zum anderen kann man Experimente durchführen, indem die Versuchspersonen Sätze vervollständigen, die die Präposition „wegen“ enthalten oder man sammelt Sprachdaten (Texte, Druckstücke, etc.), um das sprachwissenschaftliche Phänomen zu analysieren und zu bewerten. Beide Methoden (Sprecherbefragung und Erstellen von Experimenten) rufen aber Nachteile hervor, da die Versuchspersonen eventuell nicht die gewünschten Antworten geben können, die dem spontanen Sprachgebrauch entsprechen. Dies liegt daran, dass eine objektive Einschätzung des Sprachgebrauchs nicht so leicht ist. Außerdem werden Formen, die für schlecht eingestuft werden, meist vermieden. Negativ ist zudem, dass das Sammeln von größeren Mengen an Sprachdaten sehr aufwendig ist. Diese werden benötigt, um signifikante Aussagen über den Sprachgebrauch zu formulieren. Möchte man beispielsweise das Partizip Perfekt von `downloaden` bestimmen, so gibt es zwei Formen: `downgeloaded` oder `gedownloaded`. Um zufällige Ergebnisse auszuschließen, braucht man hier also größere Datenmengen, die bei einer Befragung oder Experimenten einen sehr großen Aufwand nach sich ziehen würden. Bei Sprachdaten arbeitet man mit Textkorpora. Mithilfe eines Korpus und speziellen Suchmaschinen konnte Elter 7 innerhalb von fünf Wochen die Verwendung des Genitivs oder Dativs nach der Präposition `wegen` empirisch untersuchen. Es konnte nach der Analyse von deutschsprachigen Zeitungsartikeln nachgewiesen werden, dass die Präposition `wegen` ausschließlich mit einem Genitiv-Anschluss vorzufinden ist.

3. Was ist ein Korpus?

Nach Scherer lautet die Definition wie folgt:

,,Ein Korpus ist eine Sammlung von Texten oder Textteilen, die bewusst nach bestimmten sprachwissenschaftlichen Kriterien ausgewählt und geordnet werden. Unter Text sind in diesem Zusammenhang nicht nur Produkte der Schriftsprache wie Zeitungsartikel, Romane, Kochbücher, E-Mails, Briefe oder Tagebücher zu verstehen, sondern auch mündliche Äußerungen, sei es in Form von Vorträgen, Radiosendungen, Telefongesprächen oder dem zwanglosen Gespräch am Mittagstisch.“8 Ein Korpus dient also als Datengrundlage für empirische Untersuchungen und beinhaltet sog. Primärdaten. Es dient dazu, unter anderem die Sprache in ihrer Gesamtheit, aber auch Varietäten, d.h. Ausprägungen der Sprache (z.B. die Sprache von Jugendlichen oder die Fachsprache der Medizin) zu untersuchen.

Sprechergruppenabhängige Varietäten weisen auch arttypische Texte auf. So enthält ein Korpus der Jugendsprache überwiegend SMS-Nachrichten, Chatverläufe oder aber auch Gesprächsprotokolle unter Freunden. Bei der Analyse der Standardsprache, wäre es nicht effektiv, wenn ein Korpus nur Texte von Jugendlichen beinhalten würde. Denn dafür wären genaue Aussagen über alle Bereiche der Standardsprache nötig.

4. Wie ist ein Korpus aufgebaut?

Korpora werden durch bestimmte sprachwissenschaftliche Faktoren bestimmt: Größe, Inhalt, Beständigkeit und Repräsentativität9.

4.1 Repräsentativität

Ziel der Repräsentativität ist es, Aussagen über die Grundgesamtheit treffen zu können.

Deshalb ist es wichtig, schon zu Beginn der Analyse zu definieren, wer beispielsweise ein `Jugendlicher` ist und was die Merkmale eines Jugendlichen sowie seiner Fachsprache sind.

[...]


1 Die moderne Korpuslinguistik entstand erst in den 60er Jahren. Die Sammlung von Sprachdaten ist aber weit älter. Vgl. hierzu:
http://www.academia.edu/332185/Das_Internet_als_Korpus_Aktuelle_Fragen_und_Methoden_der_Korpuslinguistik (zuletzt besucht am 25.02.2016)

2 Vgl.: Lothar Lemnitzer, Heike Zinsmeister: Korpuslinguistik - Eine Einführung. Gunter Narr Verlag 2006 Tübingen, S. 40.

3 Vgl. ebd., S.9.

4 Vgl.: http://homepage.rub.de/Stephen.Berman/Korpuslinguistik/Allgemeines.html (zuletzt besucht am 22.02.2016)

5 Scherer, Carmen: Korpuslinguistik. Heidelberg: Universitätsverlag Winter. (2., aktual. Aufl.) 2014, S. 1.

6 Vgl. ebd., S. 2.

7 Scherer, Carmen: Korpuslinguistik. Heidelberg: Universitätsverlag Winter. (2., aktual. Aufl.) 2014, S. 3.

8 Vgl.ebd., S. 3.

9 Vgl.ebd., S. 5.

Ende der Leseprobe aus 22 Seiten

Details

Titel
Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?
Hochschule
Ludwig-Maximilians-Universität München
Note
2,0
Autor
Jahr
2016
Seiten
22
Katalognummer
V463785
ISBN (eBook)
9783668945401
ISBN (Buch)
9783668945418
Sprache
Deutsch
Schlagworte
einführung, korpuslinguistik, korpusuntersuchung
Arbeit zitieren
Merve Kosmaz (Autor), 2016, Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?, München, GRIN Verlag, https://www.grin.com/document/463785

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden