Das Ziel dieser Arbeit ist, eine Einführung in die Korpuslinguistik zu geben und wichtige Begriffe zu erklären. Am Anfang der Seminararbeit werden Methoden der Sprachwissenschaft genannt, die zur Analyse der Sprache notwendig sind. Darauf folgt die Definition des Begriffes "Korpus". Anschließend werden sowohl der Aufbau eines Korpus, die Verwendungsgebiete und Arten von Korpora, als auch Verfahren zur Analyse von Korpusdaten, sowie einige Beispiele für Suchtools vorgestellt und näher beschrieben.
Korpuslinguistische Methoden gehören mittlerweile zum Standardrepertoire der sprachwissenschaftlichen Forscherinnen und Forscher. Bereits im neunzehnten Jahrhundert und früher wurden Textsammlungen zur Untersuchung des Sprachwandels sowie der Belegung von grammatikalischen Aussagen dokumentiert und analysiert. Diese galten auch als Vergleichsmaterial und zur Illustration vom Sprachgebrauch in Fremdsprachen. In der Korpuslinguistik wird unter anderem die deutsche Sprache in ihren verschiedenen Erscheinungsformen beziehungsweise ihrem Gebrauch untersucht. Dabei werden mittels verschiedener Korpora Hypothesen oder neue Erkenntnisse erstellt.
Bei der Untersuchung des Sprachgebrauchs kann man verschiedene Methoden heranziehen. Da für die Datenanalyse technisches Know-how notwendig ist, liegt Korpuslinguistik folglich an der Schnittstelle zwischen Philologie und Informationstechnologie. Doch worauf muss man bei einer Analyse von Korpusdaten achten? Wie trifft man die geeignete Wahl eines Korpus für linguistische Recherchen? Welche Typen von Daten können in welchen Korpora untersucht werden?
Inhaltsverzeichnis
1. Einleitung
2. Methoden der Sprachwissenschaften
3. Was ist ein Korpus?
4. Wie ist ein Korpus aufgebaut?
4.1 Repräsentativität
4.2 Beständigkeit
4.3 Korpusgröße
4.4 Textproben
4.5 Inhalt
4.6 Metadaten
5. Wofür werden Korpora verwendet?
5.1 Erforschung von sprachlichen Strukturen und Varietäten
5.2 Erstellung von Wörterbüchern (Lexikografie)
5.3 Erstellung von Grammatiken (Grammatikografie)
5.3 Fremdsprachenunterricht und Übersetzung
5.5 Computerlinguistik
6. Welche Arten von Korpora gibt es?
6.1 Computerlesbare Korpora und nicht-computerlesbare Korpora
6.2 Gesamtkorpus und Teilkorpus
6.3 Volltextkorpus und Probenkorpus
6.4 Statische Korpora und Monitorkorpora
6.5 Annotierte Korpora und nicht-annotierte Korpora
6.6 Korpus der geschriebenen Sprache und der gesprochenen Sprache
6.7 Korpora der Gegenwartssprache und historische Korpora
6.8 Referenzkorpora und Spezialkorpora
6.9 Einsprachige und mehrsprachige Korpora
7. Verfahren zur Analyse von Korpusdaten
7.1 Stichwortsuche
7.2 Konkordanzen
7.3 Kollokationsanalyse
7.4 Wortlisten
8. Welche Suchtools gibt es?
8.1 World Wide Web als Korpus
8.2 Die Korpora des DWDS
8.3 COSMAS II
8.4 Das TIGER-Korpus
9. Fazit
Zielsetzung & Themen
Das Hauptziel dieser Arbeit ist es, eine grundlegende Einführung in die Korpuslinguistik zu geben, zentrale Begriffe zu definieren und die Bedeutung korpuslinguistischer Methoden für die moderne Sprachwissenschaft sowie angrenzende Fachgebiete aufzuzeigen.
- Grundlegende Definition und Aufbau eines digitalen Sprachkorpus
- Anwendungsgebiete korpuslinguistischer Forschung in der Praxis
- Klassifizierung verschiedener Arten von Korpora
- Methoden und Werkzeuge zur computergestützten Analyse von Korpusdaten
Auszug aus dem Buch
1. Einleitung
Korpuslinguistische Methoden gehören mittlerweile zum Standardrepertoire der sprachwissenschaftlichen Forscherinnen und Forscher. Bereits im 19. Jhd. und früher wurden Textsammlungen zur Untersuchung des Sprachwandels sowie der Belegung von grammatikalischen Aussagen dokumentiert und analysiert. Diese galten auch als Vergleichsmaterial und zur Illustration vom Sprachgebrauch in Fremdsprachen. In der Korpuslinguistik wird u.a. die deutsche Sprache in ihren verschiedenen Erscheinungsformen bzw. ihrem Gebrauch untersucht. Dabei werden mittels verschiedener Korpora Hypothesen oder neue Erkenntnisse erstellt. Bei der Untersuchung des Sprachgebrauchs kann man verschiedene Methoden heranziehen. Da für die Datenanalyse technisches Know-how notwendig ist, liegt Korpuslinguistik folglich an der Schnittstelle zwischen Philologie und Informationstechnologie.
Was ist eigentlich ein Korpus? - ,,Ein Korpus ist eine Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen. Die Daten des Korpus sind digitalisiert, d.h. auf Rechnern gespeichert und maschinenlesbar. Die Bestandteile des Korpus, die Texte oder Äußerungsfolgen, bestehen aus den Daten selbst sowie möglicherweise aus Metadaten, die diese Daten beschreiben, und aus linguistischen Annotationen, die diesen Daten zugeordnet sind.“, so lautet die Definition nach Lemnitzer und Zinsmeister. Doch worauf muss man bei einer Analyse von Korpusdaten achten? Wie trifft man die geeignete Wahl eines Korpus für linguistische Recherchen? Welche Typen von Daten können in welchen Korpora untersucht werden? Diese aber auch andere Fragestellungen gelten als Ausgangspunkt jeder wissenschaftlichen Untersuchung. Wie schon erwähnt ist Korpuslinguistik somit eine `wissenschaftliche Tätigkeit, d.h. sie muss wissenschaftlichen Prinzipien folgen und wissenschaftlichen Ansprüchen genügen`.
Zusammenfassung der Kapitel
1. Einleitung: Diese Einleitung führt in die Bedeutung der Korpuslinguistik ein, definiert den Begriff Korpus und erläutert die Notwendigkeit korpusbasierter Ansätze für die moderne Sprachforschung.
2. Methoden der Sprachwissenschaften: Das Kapitel stellt verschiedene empirische Methoden der Sprachforschung vor und verdeutlicht die Vorteile der Arbeit mit Korpora gegenüber Befragungen oder Experimenten.
3. Was ist ein Korpus?: Hier wird die Definition eines Korpus vertieft und dessen Funktion als Datengrundlage für die Untersuchung verschiedener Sprachvarietäten erläutert.
4. Wie ist ein Korpus aufgebaut?: Es werden die zentralen Faktoren wie Repräsentativität, Beständigkeit, Korpusgröße, Textproben, Inhalt und Metadaten vorgestellt, die den Aufbau eines Korpus bestimmen.
5. Wofür werden Korpora verwendet?: Dieses Kapitel beleuchtet verschiedene Anwendungsbereiche, darunter die Erforschung von Sprachstrukturen, Lexikografie, Grammatikografie, Fremdsprachenunterricht und Computerlinguistik.
6. Welche Arten von Korpora gibt es?: Es werden diverse Korpusarten systematisiert, beispielsweise nach Speichermedium, Vollständigkeit, Zeitlichkeit und dem Sprachmedium.
7. Verfahren zur Analyse von Korpusdaten?: Das Kapitel beschreibt konkrete analytische Verfahren wie die Stichwortsuche, die Erstellung von Konkordanzen, die Kollokationsanalyse und die Nutzung von Wortlisten.
8. Welche Suchtools gibt es?: Hier werden praktische Suchwerkzeuge und Datenbanken wie das World Wide Web, das DWDS, COSMAS II und das TIGER-Korpus vorgestellt.
9. Fazit: Das Fazit fasst die wesentlichen Aspekte der Arbeit zusammen und betont die Unverzichtbarkeit korpuslinguistischer Methoden für zahlreiche wissenschaftliche Disziplinen.
Schlüsselwörter
Korpuslinguistik, Korpus, Sprachwissenschaft, Digitalisierung, Sprachgebrauch, Korpusaufbau, Sprachvarietäten, Konkordanzen, Kollokationsanalyse, Wortlisten, Suchtools, Annotation, Metadaten, empirische Forschung, Sprachwandel
Häufig gestellte Fragen
Worum geht es in der Arbeit grundsätzlich?
Die Arbeit bietet eine fundierte Einführung in die Korpuslinguistik, ihre theoretischen Grundlagen sowie ihre praktischen Anwendungen in der Sprachwissenschaft.
Was sind die zentralen Themenfelder?
Zu den zentralen Themen gehören der Aufbau und die Klassifizierung von Korpora, die verschiedenen Anwendungsgebiete sowie die computergestützten Verfahren zur Datenanalyse.
Was ist das primäre Ziel der Arbeit?
Das primäre Ziel ist es, dem Leser ein Verständnis für die wissenschaftliche Arbeit mit digitalen Korpora zu vermitteln und wichtige Begriffe sowie Methoden praxisnah zu erläutern.
Welche wissenschaftliche Methode wird verwendet?
Es wird ein korpuslinguistischer Ansatz verfolgt, der auf der Analyse digitalisierter Textsammlungen und der Nutzung empirischer statistischer Verfahren basiert.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die theoretische Definition des Korpus, dessen Aufbaukriterien, die verschiedenen Arten von Korpora sowie die Vorstellung konkreter Analysewerkzeuge und Suchtools.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit ist maßgeblich durch Begriffe wie Korpuslinguistik, Sprachvarietäten, Datenanalyse, Konkordanzen, Annotation und digitale Sprachressourcen geprägt.
Warum ist das World Wide Web nur bedingt als Korpus geeignet?
Das Internet bietet zwar große Datenmengen, aber es fehlen verlässliche Angaben zu Größe, Struktur und Repräsentativität der Texte, was systematische linguistische Auswertungen erschwert.
Was ist der Unterschied zwischen einem Gesamtkorpus und einem Teilkorpus?
Ein Gesamtkorpus bildet die übergeordnete Dateneinheit, während Teilkorpora spezifisch gegliederte Untereinheiten sind, die beispielsweise nach Sprechereigenschaften oder Epochen zusammengestellt werden.
Warum ist die Metadaten-Dokumentation für Korpora so wichtig?
Metadaten liefern essenzielle Informationen über Herkunft, Entstehungskontext und soziolinguistische Merkmale der Daten, wodurch erst eine präzise Definition von Teilkorpora für spätere Studien möglich wird.
- Citation du texte
- Merve Kosmaz (Auteur), 2016, Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?, Munich, GRIN Verlag, https://www.grin.com/document/463785