Zur Repräsentativität von Kollokationen im World Wide Web. Eine korpuslinguistische Untersuchung


Hausarbeit (Hauptseminar), 2015
23 Seiten, Note: 1,0

Leseprobe

Gliederung

1. Einführung - Zur Repräsentativität von Kollokationen im Web
1.1. Was sind Kollokationen?
1.2. Fragestellung
1.3. Das Web als Korpus
a) Korpuslinguistik als empirische Forschungsmethode
b) Vor- und Nachteile des Web als Korpus
c) Zur Untersuchung von Kollokationen im Web

2. Eigene korpuslinguistische Untersuchung ausgewählter Kollokationen im Web
2.1. „Das Wörterbuch der Kollokationen im Deutschen“ - Auswahl zu untersuchender Kollokationen
2.2. Korpusanalyse mithilfe von WebCorp
2.3. Ergebnisse und Vergleich mit dem Kollokationswörterbuch

3. Interpretation und Diskussion der Ergebnisse
3.1. Ausblick

4. Anhang

5. Literatur

1. Einführung - Zur Repräsentativität von Kollokationen im Web

Die korpuslinguistische Untersuchung einer Einzelsprache ermöglicht die Ermitt- lung der Bedeutung sowie der Verwendung eines Wortes in seinem sprachlichen Kontext. Treten bestimmte Wortverbindungen gehäuft zutage, sprechen wir von Kollokationen. Die korpusgestütze Kollokationsanalyse bildet somit die empiri- sche Basis für die Erstellung von einzelsprachlichen, lexikographischen Wörter- büchern. Des Weiteren lassen sich hierdurch, etwa im Bereich des Fremdspra- chenunterrichts, Implikaturen für die Konzeption von Lehrmaterialien ziehen. Diese Arbeit wird sich insbesondere mit Kollokationen im „World Wide Web“ auseinandersetzen. Ein Vergleich des Webkorpus mit dem „Wörterbuch der Kol- lokationen im Deutschen“ von Quasthoff (2011) soll Aufschluss über die Reprä- sentativität des Webs hinsichtlich deutschsprachiger Kollokationen geben. Dies- bezüglich werden vorab sowohl Möglichkeiten als auch Grenzen dieses Korpustyps aufgezeigt werden. Eine eigenständige Analyse ausgewählter Kollo- kationen wird mithilfe des Online-Tools „WebCorp“ durchgeführt, bei dem es sich um ein Programm zur spezifischen Korpusanalyse des „World Wide Web“ han- delt. Zunächst soll jedoch eine detailliertere Bestimmung des Begriffes Kollokati- on erfolgen, um ein besseres Verständnis für den Untersuchungsgegenstand sowie grundlegende Anhaltspunkte für die Durchführung der späteren Korpusanalyse zu gewinnen.

1.1. Was sind Kollokationen?

Der Terminus Kollokation wird in der sprachwissenschaftlichen Forschung zum Teil recht unterschiedlich definiert (vgl. Reder 2006: 158, Radzik 2013: 65). Der Begriff der Kollokation taucht zum ersten Mal in dem Werk „Modes of Meaning“ von John R. Firth (1957) auf (vgl. Lehr 1996: 21). Dieser gilt als Begründer des britischen Kontextualismus, der die Methodik einer empirischen Analyse natür- lich-sprachlicher Texte entwickelte und somit den Grundstein für die spätere (computergestützte) Korpuslinguistik legte (vgl. 1996: 2). In der Firthschen Kol- lokationstheorie werden Kollokationen als „Miteinandervorkommen sprachlicher Einheiten“ (1996: 28f.) innerhalb eines Textes beschrieben. Es handelt sich hierbei um eine lexikorientierte Auffassung, die grammatische sowie referenzsemantische Relationen weitgehend außer Acht lässt (vgl. 1996: 14). Welche Wörter eines Tex- tes tatsächlich als Kollokationen gelten, wird durch Firth nicht näher bestimmt (vgl. 1996: 29). Spätere Arbeiten kontextualistischer Sprachwissenschaftler beschreiben die interne Struktur von Kollokationen eingehender (vgl. 1996: 37). So lässt sich festhalten, dass Kollokationen in zwei Komponenten unterschieden werden, in Kollokant und Kollokat beziehungsweise Kollokator (vgl. 1996: 37, Hausmann 2004: 311). Ersteres benennt den Teil einer Kollokation, der als soge- nannte Basis (vgl. Hausmann 2004: 311) fungiert und von dem die Betrachtung und Bedeutungsbestimmung einer Kollokation ausgeht. Das Kollokat bezie- hungsweise der Kollokator hingegen umgibt den Kollokant und wird durch diesen bestimmt. Dies bedeutet, dass die Basis einer Kollokation nicht auf einen Kollo- kator angewiesen ist, umgekehrt ist dies jedoch der Fall (vgl. Lehr 1996: 38). Hausmann (vgl. 2004: 312) führt hier das Beispiel Tisch decken an: Der Kolloka- tor decken benötigt als Basis ein Substantiv, da das Verb nicht isoliert stehen kann. Im deutschen Sprachgebrauch ist der Kollokator decken signifikant mit der Basis Tisch verknüpft. Hierin zeichnet sich bereits ein syntaktisches Schema kollokatorischer Wortverbindungen ab. Demzufolge bilden Substantive eine häu- fige Basis für „verbale Kollokatoren“ (vgl. Radzik 2013: 66), wie bei dem vorhe- rigen Beispiel (Substantiv + Verb) oder bei der Kollokation kaputt gehen (Adverb + Verb). Zugleich sind Substantive auch häufig Basis für „substantivische“ Kollo- kationen (vgl. Radzik 2013: 66), bei denen Adjektive das Kollokat bilden, wie etwa bei der Kollokation himmelweiter Unterschied. Umgekehrt stellen Adjektive oftmals die Basis für „adjektivische Kollokatoren“ (vgl. 2013: 66) dar, wie es bei dem Ausdruck hundertprozentig sicher (Adjektiv + Adverb) oder der Fall ist. Es werden weitere Strukturtypen von Kollokationen unterschieden (vgl. 2013: 66), auf die hier nicht näher eingegangen werden soll.

In der Phraseologieforschung wird der Begriff Kollokation „zur Bezeichnung fes- ter nichtidiomatischer Wortverbindungen“ (vgl. Reder 2006: 160) gebraucht. Kol- lokationen sind demnach einzelsprachlich konventionalisiert, bestimmte Wortver- bindungen sind in einer Einzelsprache stark verankert und stellen somit feste „Einheiten des Sprachsystems“ dar (vgl. Lehr 1996: 1). In der linguistischen For- schung werden Kollokationen dabei häufig als binäre lexikalische Einheiten be- handelt, wie etwa in den oben genannten Beispielen. Es kommen jedoch auch „Mehr-als-Zwei-Wort-Verbindungen“ (vgl. Hollós 2010: 85) vor, wie bei dem Beispiel massiv Kritik üben (vgl. Hausmann 2004: 316). Diese sollen hier jedoch nicht behandelt werden, da sie den Rahmen dieser Arbeit sprengen würden.

Zusammenfassend lege ich meiner korpuslinguistischen Untersuchung das fol- gende Verständnis von Kollokationen zugrunde: Kollokationen sind statistisch häufig vorkommende Wortverbindungen binärer Art, die sich durch syntagmati- sche sowie semantische Abhängigkeiten eines Kollokators zu einer Basis aus- zeichnen (vgl. Hausmann 2001: 316, Reder 2006: 158). Die vorliegende Arbeit wird sich dabei auf verbale sowie substantivische Kollokationen fokussieren, da sie korpuslinguistisch leicht zu identifizieren sind und sich folglich gut für die Beurteilung der Repräsentativität von Kollokationen im Webkorpus eignen (vgl. Breidt 1995: 5). Gerade die Verschiedenartigkeit möglicher kollokativer Wortver- bindungen kann zu Unklarheiten bei der Suche und Auswertung von Korpora füh- ren, weshalb eine klare Eingrenzung des zu untersuchenden Gegenstandes not- wendig ist.

1.2. Fragestellung

Bevor ich im nachfolgenden Kapitel auf die Chancen und Risiken des Webs als Korpus für die Kollokationsanalyse eingehe, möchte ich an dieser Stelle die ziel- führende Fragestellung dieser Untersuchung festhalten. Es soll untersucht werden, ob das „World Wide Web“ repräsentativ für die Verwendung von verbalen sowie substantivischen Kollokationen ist. Die Ergebnisse der eigenen Korpusanlyse des Webs sollen mit den Einträgen des „Wörterbuch der Kollokationen im Deut- schen“ (Quasthoff 2011) vergleichen werden, um die Repräsentativität des tat- sächlichen Sprachgebrauchs im Web bewerten zu können. Die Einträge im Wör- terbuch weisen bereits auf eine entsprechend hohe Vorkommenshäufigkeit der jeweiligen Kollokationen in der deutschen Sprache hin (vgl. Quasthoff 2011: XII). Da im Webkorpus eine quantitative Analyse nur eingeschränkt möglich ist1, soll bei der Auswertung der Korpusdaten zusätzlich eine qualitative Analyse der Er- gebnisse erfolgen.

1.3. Das Web als Korpus

Im folgenden Kapitel sollen Vorüberlegungen zur Eignung des Webs als linguistisches Korpus getroffen werden, die in die Diskussion der späteren Ergebnisse der Kollokationsanalyse einfließen werden.

a) Korpuslinguistik als empirische Forschungsmethode

Mithilfe der Korpuslinguistik kann der Gebrauch verschiedener sprachlicher Phä- nomene einer Einzelsprache empirisch untersucht werden. Anhand authentischen Sprachmaterials können beispielsweise Belege für die Bedeutung und Verwen- dung spezifischer Kollokationen geliefert sowie deren Vorkommenshäufigkeit bestimmt werden. Sie sind demzufolge qualitativ sowie quantitativ analysierbar (vgl. Scherer 2006: 35f.). Dies kann sodann eine Basis für die Erstellung von Wörterbüchern sein, wie im Falle des „Wörterbuch der Kollokationen im Deut- schen. Die meisten Korpora - sprich „Sammlung[en] von Texten oder Textteilen, die (…) nach bestimmten sprachwissenschaftlichen Kriterien ausgewählt und ge- ordnet werden“ (2006: 3) - sind heutzutage digitalisiert und mithilfe von PCs analysierbar. Das „World Wide Web“ stellt dabei eine überaus große Sammlung von Daten geschriebener (und zum Teil gesprochener) Sprache zur Verfügung und erweitert die Möglichkeiten der linguistischen Korpusanalyse. Dem stehen jedoch einige Nachteile beziehungsweise Eingrenzungen gegenüber. Die verschiedenen Charakteristika sogenannter „Webkorpora“2 sollen nachfolgend eingehender be- leuchtet werden.

b) Vor- und Nachteile des Web als Korpus

Ein wesentlicher Vorteil des Webkorpus für linguistische Untersuchungen wurde bereits genannt. Seine überragende Größe ermöglicht zudem den Nachweis selte- ner Sprachphänomene, die in einem kleinen Korpus bisweilen nicht belegt werden können (vgl. Fletcher 2013: 2). Dies ist insbesondere für die Untersuchung von Neologismen nützlich, da die Textsammlungen im Web immer auf dem neuesten Stand sind (vgl. 2013: 1). Das Webkorpus deckt zudem verschiedene Arten von Textsorten ab, wie etwa Chat- und Forenbeiträge, politische sowie juristische Tex- te, Werbetexte oder wissenschaftliche Schriften (vgl. Fletcher 2013: 1, Bickel 2006: 80). Zusätzlich können zahlreiche Einzelsprachen mithilfe des Webkorpus untersucht werden (vgl. Fletcher 2013: 1). Leider gibt es auch einige Nachteile, die die Arbeit mit dem Web als Korpus erschwert beziehungsweise begrenzt. Trotz der herausragenden Größe des Korpus lassen sich Vorkommenshäufigkeiten ein- zelner sprachlicher Phänomene nur schwer bestimmen. Verschiedene Autoren weisen darauf hin, dass Suchmaschinen (wie z. B. Google) lediglich die Anzahl von mit der Suchanfrage übereinstimmenden Webseiten angeben, und nicht die Frequenz tatsächlicher Vorkommen innerhalb der Dokumente (vgl. Juska- Bacher/Biemann/Quasthoff 2013: 21, Fletcher 2013: 3). Zudem kann es zu Dop- pelungen bei der Zählung kommen, da Inhalte einzelner Websites häufig in ande- ren Webseiten dupliziert werden (vgl. Juska-Bacher/Biemann/Quasthoff 2013: 21). Allein durch den Fakt, dass sich die Sprachdaten im „World Wide Web“ stän- dig erweitern und erneuern, ist eine definitive Häufigkeitsangabe folglich kaum möglich (vgl. Lüdeling/Evert/Baroni 2007: 15). Dennoch hebt Diemer (2011: 12) hervor, dass sich das Web in besonderem Maße für qualitative Analysen eignet: „[The] age of closed corpora is coming to an end rather sooner than we think. So why not use the fastest existing algorithm to search the full field of online dis- course, extracting some quantitative, but mainly qualitative features (…)”. Für komplexe grammtische Untersuchungen bringt das Web als Korpus jedoch Prob- leme mit sich, da in den seltensten Fällen semantisch-syntaktische Annotationen sowie Metadaten der Sprachdaten vorliegen (vgl. Juska- Bacher/Biemann/Quasthoff 2013: 21f., Storrer 2011: 12, Lüdeling/Evert/Baroni 2007: 13f.).

c) Zur Untersuchung von Kollokationen im Web

Trotz der oben besprochenen Einschränkungen ist das Web für lexikographische und sprachstatistische Untersuchungen nutzbar (Scherer 2006: 75, Diemer 2008: 36). Bickels korpuslinguistische Untersuchungen3 verdeutlichen, dass trotz des großen Wachstums und der stetigen Weiterentwicklung des Webkorpus Sucher- gebnisse zu bestimmten Zeitpunkten „in sich konsistent“ und „reproduzierbar“ (Bickel 2006: 80) sind. Es konnten sehr ähnliche Resultate zu unterschiedlichen Zeiten erzielt werden, was auf eine gewisse Stabilität des Webkorpus hinweist (vgl. 2006: 78ff.).

2. Eigene korpuslinguistische Untersuchung ausgewählter Kollokationen im Web

Um zu untersuchen, ob das „World Wide Web“ repräsentativ für die Verwendung verbaler sowie substantivischer Kollokationen ist, möchte ich meiner Korpusanlayse ausgewählte Kollokationen aus dem „Wörterbuch der Kollokationen im Deutschen“ zum Vergleich zugrundelegen.

2.1. „Das Wörterbuch der Kollokationen im Deutschen“ - Auswahl zu untersuchender Kollokationen

Bei dem „Wörterbuch der Kollokationen im Deutschen“ handelt es sich um das erste Kollokationswörterbuch der deutschen Sprache (vgl. Quasthoff 2011: XII). Da es auf Grundlage der empirischen, korpuslinguistischen Untersuchung des Leipziger Sprachkorpus konzipiert wurde, bildet es die Sprachwirklichkeit kollokativer Verwendungen ab (vgl. Radzik 2013: 64, Quasthoff 2011: XII). Quasthoffs Kollokationswörterbuch sammelt die häufigsten Kollokatoren zu ins- gesamt 3253 Substantiven, Verben und Adjektiven, die als Basis binärer Wort- kombinationen gelistet sind (2011: X). Radzik (2013: 71) erachtet die korpusba- sierte Erstellung des „Wörterbuchs für Kollokationen im Deutschen“ als „große Errungenschaft der deutschen Lexikographie“. Die jeweiligen Kollokationen eines Stichwortes werden hierbei jedoch nicht entsprechend ihrer tatsächlichen Vorkommenshäufigkeit im Referenzkorpus strukturiert, sondern sind nach syntak- tischer und semantischer Verwandheit in sogenannten Kollokationsgruppen sor- tiert4 (vgl. Quasthoff 2011: X).

Für die eigenständige Korpusanalyse werden zum einen verbale Kollokationen (Substantiv + Verb) analysiert, die von der Basis Ernährung ausgehen. Zum ande- ren sollen substantivische Kollokationen (Adjektiv + Substantiv) der oben ge- nannten Basis untersucht werden. Das Kollokationswörterbuch listet zunächst die folgenden Verben und Adjektive als Kollokatoren des Substantivs Ernährung auf (vgl. 2011: 150):

[...]


1 s. Abschnitt 1.3b).

2 Bei „Webkorpora“ handelt es sich um linguistisch aufbereitetes Sprachmaterial aus dem Internet. Davon zu unterscheiden sind „online verfügbare Korpora“, die im Internet zugänglich, jedoch nicht linguistisch aufbereitet sind (vgl. Storrer 2011: 12).

3 Zum Aufbau und zur Durchführung dieser korpuslinguistischen Untersuchung s. Bickel (vgl. 2006: 75ff.). 6

4 Diese Kollokationsgruppen werden durch ein Semikolon getrennt aufgelistet. In Anlehnung an diese Struktur, habe ich auch die Ergebnisse dieser korpuslinguistischen Arbeit ab Punkt 2.3 (S. 10) dargestellt.

Ende der Leseprobe aus 23 Seiten

Details

Titel
Zur Repräsentativität von Kollokationen im World Wide Web. Eine korpuslinguistische Untersuchung
Hochschule
Universität Potsdam  (Institut für Romanistik)
Note
1,0
Autor
Jahr
2015
Seiten
23
Katalognummer
V337301
ISBN (eBook)
9783656987895
ISBN (Buch)
9783656987901
Dateigröße
1367 KB
Sprache
Deutsch
Schlagworte
Korpusanalyse, Kollokationen, Linguistik, World Wide Web
Arbeit zitieren
B.A. Henriette Frädrich (Autor), 2015, Zur Repräsentativität von Kollokationen im World Wide Web. Eine korpuslinguistische Untersuchung, München, GRIN Verlag, https://www.grin.com/document/337301

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Zur Repräsentativität von Kollokationen im World Wide Web. Eine korpuslinguistische Untersuchung


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden