Leseprobe
Inhaltsverzeichnis
1. Einleitung
2. Grundlagen der Untersuchung
2.1 Datensammlung
2.2 Überblick über das Korpus
3. Häufigkeiten der Buchstaben im Deutschen
3.1 Die 10 häufigsten Anfangsbuchstaben
3.2 Die 10 häufigsten Endbuchstaben
4. Worthäufigkeiten
5. Vorfeldanalyse
6. Schlussbemerkung
Referenzen
Quellen der Korpustexte
1. Einleitung
Die vorliegende Arbeit soll anhand korpuslinguistischer Analysen Aussagen über den Sprachgebrauch im Bereich Fußballs treffen. Dazu wurde zunächst aus einer Sammlung von Livetickern aus dem Internet ein Korpus erstellt. Bei einem Korpus handelt es sich um „eine Sammlung schriftlicher oder gesprochener Äußerungen“ (LEMNITZER/ZINSMEISTER 2006: 7). Der Begriff Korpuslinguistik definiert demnach eine wissenschaftliche Beschreibung von Sprachäußerungen, „ihrer Elemente und Strukturen und die darauf aufbauende Theoriebildung“ (LEMNITZER/ZINSMEISTER 2006: 9). Grundlage ist die Korpusanalyse von authentischen Texten (vgl. LEMNITZER/ZINSMEISTER 2006: 79.
Bei der vorliegenden Arbeit wurden bei der Korpusanalyse insbesondere die Buchstabenhäufigkeiten, die zehn häufigsten Anfangs- und Endbuchstaben und die zehn häufigsten Wörter betrachtet. Des weiteren wurde eine Vorfeldanalyse durchgeführt, um festzustellen, welche Satzarten in der Sprache des Fußballs überwiegen. Die einzelnen Ergebnisse der Korpusanalyse werden darüber hinaus mit den jeweiligen Häufigkeiten des gesamten deutschen Wortschatzes verglichen. Wir wollen damit herausfinden, welche Gemeinsamkeiten und Unterschiede der „Fußballsprache“ mit dem Deutschen bestehen, um zu erkennen, ob sich diese durch spezifische sprachliche Mittel abgrenzt.
2. Grundlagen der Untersuchung
2.1 Datensammlung
Bei dem vorliegenden Korpus handelt es sich um eine Sammlung von Fußball- Livetickern aus dem Internet, die von www.sportal.de und www.liveticker.bundesliga.de entnommen wurden. Bei Livetickern finden wir eine natürliche Kommunikationsform, da sie spontan, parallel zum stattfindenden Spiel, verläuft und vom Satzaufbau her stark der gesprochenen Sprache ähnelt. Oft entstehen verkürzte, phrasenhafte Sätze bzw. Aussagen, wie wir sie auch in der mündlichen Kommunikation vorfinden. Somit sind Liveticker, da sie authentische Texte darstellen, gut für eine Korpusanalyse geeignet.
Die Sprachdaten des Korpus wurden mithilfe des Konkordanzprogrammes MonoConc Pro analysiert. Zur weiteren Untersuchung kamen das Textverarbeitungsprogramm OpenOffice.org Writer 2010 und das Tabellenkalkulationsprogramm OpenOffice.org Calc 2010 zum Einsatz.
2.2 Überblick über das Korpus
Das vorliegende Korpus besteht aus insgesamt 35000 Wörtern, die aus 21 Livetickern entnommen wurden, sodass jeder einzelne Korpus aus etwa 1666 Wörtern besteht. Eine Bestimmung der Satzzahl ist nicht möglich, da sehr häufig kurze Phrasen auftreten, die z.T. keine vollständige syntaktische und grammatikalisch korrekte Satzstruktur aufweisen. Der erste Liveticker, der im folgenden weiter Verwendung finden wird, besteht beispielsweise aus 99 vollständigen Sätzen und eignet sich deshalb auch gut für weitere Analysen.
3. Häufigkeiten der Buchstaben im Deutschen
Im folgenden werden die Häufigkeiten der einzelnen Buchstaben des Deutschen am Beispiel eines einzelnen Livetickers veranschaulicht. Dazu wurde der erste Liveticker1 unseres Korpus verwendet. Anschließend soll ein Vergleich unserer Livetickeranalyse mit den Buchstabenhäufigkeiten des gesamten deutschen Wortschatzes vorgenommen werden. Die folgende Übersicht stellt die Häufigkeitsverteilung der einzelnen Buchstaben innerhalb unseres Livertickers im Vergleich mit dem Deutschen aus den Angaben von www.Wikipedia.de dar (vgl. Tabelle 1).
Tabelle 1- Vergleich der Buchstabenhäufigkeiten des Deutschen mit unserem Liveticker
Abbildung in dieser Leseprobe nicht enthalten
Schaut man sich zunächst die Relativen Häufigkeiten der Buchstaben des gesamten Deutschen an, sticht der Buchstabe E stark hervor, da er mit 17,4% fast doppelt so häufig vorkommt, wie das N auf dem zweiten Platz mit 9,78%. Danach folgen mit naher Rangfolge die Buchstaben I, S und R. An letzter Stelle stehen mit knapp über 0% die Buchstaben Y,X und letztlich Q. Auch in unserem Liveticker steht der Buchstabe E an erster Stelle, mit 15,2% Relativer Häufigkeit. Der Buchstabe N steht auch hier mit fast gleicher Häufigkeit an zweiter Stelle. Die Buchstaben I, S und R folgen mit annähernd gleicher Prozentzahl auf den gleichen Rängen wie zuvor im gesamten Deutschen. Auf den letzten Plätzen stehen Y, X, Q und letztlich J, wobei J in diesem Liveticker mit 0% gar nicht vorkommt.
Vergleicht man beide Buchstabenhäufigkeiten miteinander fällt auf, dass sich die
Häufigkeiten der einzelnen Buchstaben sehr stark annähern. Die größte Abweichung liegt bei 2,2% bei dem ersten Buchstaben E und ansonsten bei maximal 0,86% (bei V). Insgesamt lässt sich festhalten, dass sich die Häufigkeiten der Buchstaben unseres Livetickers mit den Buchstabenhäufigkeiten des gesamten Deutschen decken.
3.1 Die 10 häufigsten Anfangsbuchstaben
Wir wollen nun genauer untersuchen, wie häufig die einzelnen Buchstaben in initialer Stellung im Wort erscheinen. Eine Auflistung der ersten zehn am häufigsten initial vorkommenden Buchstaben findet sich in Tabelle 2. Wieder solle in Vergleich mit dem gesamten Deutschen erfolgen. Die Angaben entstammen www.Wikipedia.de und sind in Tabelle 3 aufgeführt.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2- Die häufigsten Anfangsbuchstaben im Deutschen
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 3- Die häufigsten Anfangsbuchstaben im Korpus
Im direkten Vergleich der Häufigkeiten der Anfangsbuchstaben lässt sich erkennen, dass der Buchstabe D im gesamten Deutschen, sowie auch in unserem Liveticker der Buchstabe mit der häufigsten initialen Wortstellung ist. In unserem Liveticker liegt die Relative Häufigkeit mit 22,69% sogar noch um 8,49% höher. Auf dem zweiten Platz folgt in beiden Korpora der Buchstabe S mit relativ ähnlicher Prozentzahl. Die Ränge 3-5 unterscheiden sich im Vergleich recht stark. So kommen I und W bei den häufigsten Anfangsbuchstaben unseres Korpus nicht vor. Der Buchstabe E belegt zwar unterschiedliche Ränge, jedoch liegt die Relative Häufigkeit innerhalb unseres Korpus bei näherer Betrachtung sogar noch um ca. 1% höher als im gesamten Deutschen.
3.2 Die 10 häufigsten Endbuchstaben
Im Gegensatz zu zuvor möchten ich nun feststellen, wie häufig ein Buchstabe als letzter Buchstabe eines Wortes im Liveticker-Korpus vorkommt. Dazu findet sich unter Tabelle 4 eine Auflistung der häufigsten Endbuchstaben aus dem gesamten deutschen Wortschatz (nach www.Wikipedia.de), die zum Vergleich herangezogen werden soll. Tabelle 5 veranschaulicht die häufigsten Endbuchstaben des Korpus.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 4- Die häufigsten Endbuchstaben im Deutschen
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 5- Die häufigsten Endbuchstaben im Korpus
In unserem Liveticker, sowie im gesamten deutschen Wortschatz steht der Buchstabe N mit relativ gleicher Prozentzahl von 21-22% an erster Stelle. An letzter Stelle befindet sich beiderseits der Buchstabe S, wiederum mit annähernd gleicher Häufigkeit von rund 9,5%. Das S kommt folglich nur noch halb so oft als Endbuchstabe vor wie das N. Auf den Plätzen 3-5 befinden sich zwar die selben drei Buchstaben, jedoch in veränderter Reihenfolge. So kommt das R mit 17,77% um 4,77% häufiger im Korpus vor als im gesamten Deutschen.
[...]
1 Unter: http://www.sportal.de/fussball/champions-league/st-petersburg/shakhtar-donezk/2011-11-01.html