Heutzutage wird mit der modernen Sprachwissenschaft meistens die Verarbeitung von riesigen Mengen an sprachlichen Daten, dank neuster Computertechnik assoziiert. Voraussetzung für die digitale Analyse dieses sprachlichen Materials ist jedoch das Vorhandensein von Korpora. Diese systematischen Sammlungen von Texten bzw. Sprachdaten ermöglichen erst die eingehende linguistische oder auch literaturwissenschaftliche Prüfung und Forschung an dem vorgelegten Material. Dennoch ist die empirische Methodik der Korpuserstellung und Analyse – kurz der Korpuslinguistik - eigentlich kein modernes Phänomen, sondern baut vielmehr auf traditionellen Untersuchungen, die ohne Computer durchgeführt wurden, auf. Abgesehen von der Linguistik ist heutzutage fast jede wissenschaftliche Beschäftigung mit Sprache auf Korpora angewiesen. So basiert beispielsweise jedes Wörterbuch auf der Auswertung eines festgesetzten sprachlichen Materials. Aber auch für ein literatur- bzw. sprachwissenschaftliches Studium an sich, sind Korpora heutzutage nicht mehr weg zu denken. So gilt die Bedeutsamkeit der Datensammlungen nicht nur für die „großen“ Werke der Forschung, sondern auch für die „kleinen“ Beiträge zur Wissenschaft. Da heutzutage mit der technischen Entwicklung und dem Internet dem Studierenden vielfältige Korpora frei zugänglich im Internet zur Verfügung stehen, will diese Hausarbeit einen Überblick über die verschiedenen Korpora der italienischen Sprache, welche
digital im Internet abrufbar sind, geben. Natürlich wurde aus der Vielzahl der zugänglichen Medien, nur eine kleine repräsentative Auswahl getroffen, welche entweder der wissenschaftlichen Analyse
dienen kann oder das Studium der italienischen Sprache an sich erleichtert.
Inhaltsverzeichnis
EINFÜHRUNG
1. EINFÜHRUNG ZUR KORPUSLINGUISTIK
1.1. Verwendung und Bedeutung von Korpora
1.1.1. Korpus - Definition und Eigenschaften
1.1.2. Korpuslinguistik
1.2. Die Bedeutung des Computers in der Korpuslinguistik
1.3. Digitale Korpora im Internet
1.3.1. Die Verbreitung via Internet
1.3.2. Möglichkeiten und Grenzen der digitalen Korpusanalyse
2. ITALIENISCHSPRACHIGE KORPORA IM INTERNET
2.1. Web-Kataloge zur Italianistik im Netz
2.2. Korpora zur italienischen Literatur
2.2.1. Anthologien und Textdatenbanken
2.2.2. Korpora zur literaturwissenschaftlichen Analyse
2.3. Sprachwissenschaftliche Korpora
2.3.1. Korpora der gesprochenen Sprache
2.3.2. Korpora der geschriebenen Sprache
2.4. Korpora zur Sprachpraxis und Sprachdidaktik
2.4.1. Wörterbücher
2.4.2. Korpora zum Spracherwerb
2.4.3. Korpora zur Sprachdidaktik
2.5. Korpora zur italienischen Kultur und Landeskunde
2.5.1. Öffentliche Medien als Quellen der italienischer Landeskunde und Kultur
2.5.1.1. Zeitungen
2.5.1.2. Fernsehen
2.5.1.3. Radiostationen
2.5.2. Andere Archive zur italienischen Landeskunde
Zielsetzung und Themen
Das Hauptziel dieser Arbeit besteht darin, einen fundierten Überblick über digital im Internet abrufbare Korpora der italienischen Sprache zu geben, die für das Italianistikstudium relevant sind. Dabei wird untersucht, wie diese Ressourcen für wissenschaftliche Analysen genutzt werden können und welche Möglichkeiten sie für Studierende bieten.
- Grundlagen der Korpuslinguistik und die Bedeutung der computergestützten Korpusanalyse.
- Methoden und Herausforderungen bei der Nutzung digitaler Textkorpora.
- Kategorisierung italienischsprachiger Korpora in den Bereichen Literatur, Sprachwissenschaft, Didaktik und Landeskunde.
- Vorstellung ausgewählter, frei zugänglicher Internet-Ressourcen für die Italianistik.
Auszug aus dem Buch
1.1.1. Korpus - Definition und Eigenschaften
Ein Korpus (auch oft Corpus; Plural: Korpora) ist im Allgemeinen eine Sammlung von sprachlichen Daten, die jedoch – und das ist der entscheidende Punkt – systematisiert zusammengestellt wurde. D.h. die vorliegenden Sprachdaten sind nach festgelegten Kriterien ausgewählt und nach diesen in eine bestimmte Ordnung gebracht. So ist nach dem Verständnis von John Sinclair ein Korpus “a collection of naturally-occuring language text, chosen to characterize a state or variety of language.” (Sinclair, 1991; S. 171)
Bei den Sprachdaten handelt es sich außerdem zu meist um geschriebene Sprache bzw. um Texte in den verschiedensten Formen, so zum Beispiel auch transkribierte Gespräche. Nichtsdestotrotz existieren unter den verschiedenen Korpora auch solche, die aus Audio- oder Videodateien bestehen und ebenso sprachliches Material enthalten. Wie bereits angedeutet besteht der Unterschied zwischen den Korpora vor allem in ihrer Systematisierung bzw. in der Aufbereitung und Zusammensetzung der Daten. Wichtige Kriterien bei der Auswahl und Zusammenstellung der Korpusdaten sind dabei vor allem: die Repräsentativität, die Beständigkeit des Korpus und seine Größe.
Die Repräsentativität bestimmt die Auswahl der Texte am stärksten. Umso repräsentativer ein Korpus ist, umso vielfältiger ist die Gesamtmenge aus der die Stichproben für den Korpus ausgewählt sind. D.h. die Repräsentativität setzt gleichzeitig die Grenzen für den Korpus. So kann man einen Korpus z.B. eingrenzen auf das Alter und Geschlecht des Urhebers der Sprachdaten, auf sozio-kulturelle oder regionale Aspekte, auf einen bestimmten Zeitraum usw. Ein Korpus der äußerst repräsentativ ist kann daher auch als balancierter Korpus bezeichnet werden. Solch ein Korpus enthält demnach in seiner Gesamtzusammenstellung viele Textformen- und Sorten sowie unterschiedliche Sprachvarianten in einer vorher bestimmten Anzahl.
Zusammenfassung der Kapitel
EINFÜHRUNG ZUR KORPUSLINGUISTIK: Dieses Kapitel definiert den Begriff Korpus, erläutert die Grundlagen der Korpuslinguistik als empirische Methode und beleuchtet die Rolle der modernen Computertechnik für die Analyse sprachlicher Daten.
ITALIENISCHSPRACHIGE KORPORA IM INTERNET: Der Hauptteil der Arbeit bietet einen umfassenden Überblick über diverse Online-Korpora, kategorisiert nach Literatur, Sprachwissenschaft, Sprachpraxis/Didaktik sowie Landeskunde, inklusive praktischer Recherchehinweise.
Schlüsselwörter
Korpuslinguistik, italienische Sprache, Textdatenbanken, Literaturwissenschaft, Sprachdidaktik, Online-Korpora, Korpusanalyse, Landeskunde, digitale Sprachdaten, Internet, Wörterbücher, Dialektologie, Sprachwissenschaft, Repräsentativität, Computerlinguistik.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der Bedeutung und Nutzung von digital verfügbaren Korpora der italienischen Sprache, die über das Internet zugänglich sind.
Was sind die zentralen Themenfelder der Arbeit?
Die Arbeit deckt die Bereiche italienische Literatur, Sprachwissenschaft, Spracherwerb, Sprachdidaktik sowie Landeskunde ab.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, Studierenden der Italianistik einen Überblick über hilfreiche digitale Datensammlungen zu geben, die für das Studium oder wissenschaftliche Arbeiten genutzt werden können.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit stützt sich auf die Methodik der Korpuslinguistik, um das Potenzial computergestützter Analysen für das Studium der italienischen Sprache aufzuzeigen.
Was wird im Hauptteil behandelt?
Im Hauptteil werden verschiedene Web-Kataloge, Textdatenbanken zur Literatur, sprachwissenschaftliche Korpora, Wörterbücher sowie landeskundliche Archive detailliert präsentiert.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zentrale Begriffe sind Korpuslinguistik, digitale Korpora, Italianistik, Sprachdatenanalyse und Internet-Ressourcen.
Warum ist das Korpus "Duecento" für die Literaturwissenschaft so bedeutend?
Es bietet eine exzellente, freizugängliche Sammlung altitalienischer Dichtungen und ermöglicht durch Suchfunktionen eine tiefe Auseinandersetzung mit der Literatur des 13. Jahrhunderts.
Welche Rolle spielt die "Biblioteca Italiana" (BibIt)?
Sie dient als umfangreiche Online-Bibliothek für das italienische Kulturerbe und bietet eine große Volltextdatenbank für die Literatur vom Mittelalter bis zum 20. Jahrhundert.
Warum wird VIVALDI für Linguisten empfohlen?
Das Projekt dokumentiert die italienische Dialektlandschaft flächendeckend und ermöglicht durch abhörbare Audiodateien und Analysesektionen eine tiefgehende Beschäftigung mit Dialekten.
- Citation du texte
- Helen-Marie Hecker (Auteur), 2008, Digitale Korpora der Italianistik, Munich, GRIN Verlag, https://www.grin.com/document/140216