Korpuslinguistische Analyse von Fußball-Livetickern


Hausarbeit (Hauptseminar), 2012

11 Seiten, Note: 1,7


Leseprobe

Inhaltsverzeichnis

1. Einleitung

2. Grundlagen der Untersuchung
2.1 Datensammlung
2.2 Überblick über das Korpus

3. Häufigkeiten der Buchstaben im Deutschen
3.1 Die 10 häufigsten Anfangsbuchstaben
3.2 Die 10 häufigsten Endbuchstaben

4. Worthäufigkeiten

5. Vorfeldanalyse

6. Schlussbemerkung

Referenzen

Quellen der Korpustexte

1. Einleitung

Die vorliegende Arbeit soll anhand korpuslinguistischer Analysen Aussagen über den Sprachgebrauch im Bereich Fußballs treffen. Dazu wurde zunächst aus einer Sammlung von Livetickern aus dem Internet ein Korpus erstellt. Bei einem Korpus handelt es sich um „eine Sammlung schriftlicher oder gesprochener Äußerungen“ (LEMNITZER/ZINSMEISTER 2006: 7). Der Begriff Korpuslinguistik definiert demnach eine wissenschaftliche Beschreibung von Sprachäußerungen, „ihrer Elemente und Strukturen und die darauf aufbauende Theoriebildung“ (LEMNITZER/ZINSMEISTER 2006: 9). Grundlage ist die Korpusanalyse von authentischen Texten (vgl. LEMNITZER/ZINSMEISTER 2006: 79.

Bei der vorliegenden Arbeit wurden bei der Korpusanalyse insbesondere die Buchstabenhäufigkeiten, die zehn häufigsten Anfangs- und Endbuchstaben und die zehn häufigsten Wörter betrachtet. Des weiteren wurde eine Vorfeldanalyse durchgeführt, um festzustellen, welche Satzarten in der Sprache des Fußballs überwiegen. Die einzelnen Ergebnisse der Korpusanalyse werden darüber hinaus mit den jeweiligen Häufigkeiten des gesamten deutschen Wortschatzes verglichen. Wir wollen damit herausfinden, welche Gemeinsamkeiten und Unterschiede der „Fußballsprache“ mit dem Deutschen bestehen, um zu erkennen, ob sich diese durch spezifische sprachliche Mittel abgrenzt.

2. Grundlagen der Untersuchung

2.1 Datensammlung

Bei dem vorliegenden Korpus handelt es sich um eine Sammlung von Fußball- Livetickern aus dem Internet, die von www.sportal.de und www.liveticker.bundesliga.de entnommen wurden. Bei Livetickern finden wir eine natürliche Kommunikationsform, da sie spontan, parallel zum stattfindenden Spiel, verläuft und vom Satzaufbau her stark der gesprochenen Sprache ähnelt. Oft entstehen verkürzte, phrasenhafte Sätze bzw. Aussagen, wie wir sie auch in der mündlichen Kommunikation vorfinden. Somit sind Liveticker, da sie authentische Texte darstellen, gut für eine Korpusanalyse geeignet.

Die Sprachdaten des Korpus wurden mithilfe des Konkordanzprogrammes MonoConc Pro analysiert. Zur weiteren Untersuchung kamen das Textverarbeitungsprogramm OpenOffice.org Writer 2010 und das Tabellenkalkulationsprogramm OpenOffice.org Calc 2010 zum Einsatz.

2.2 Überblick über das Korpus

Das vorliegende Korpus besteht aus insgesamt 35000 Wörtern, die aus 21 Livetickern entnommen wurden, sodass jeder einzelne Korpus aus etwa 1666 Wörtern besteht. Eine Bestimmung der Satzzahl ist nicht möglich, da sehr häufig kurze Phrasen auftreten, die z.T. keine vollständige syntaktische und grammatikalisch korrekte Satzstruktur aufweisen. Der erste Liveticker, der im folgenden weiter Verwendung finden wird, besteht beispielsweise aus 99 vollständigen Sätzen und eignet sich deshalb auch gut für weitere Analysen.

3. Häufigkeiten der Buchstaben im Deutschen

Im folgenden werden die Häufigkeiten der einzelnen Buchstaben des Deutschen am Beispiel eines einzelnen Livetickers veranschaulicht. Dazu wurde der erste Liveticker1 unseres Korpus verwendet. Anschließend soll ein Vergleich unserer Livetickeranalyse mit den Buchstabenhäufigkeiten des gesamten deutschen Wortschatzes vorgenommen werden. Die folgende Übersicht stellt die Häufigkeitsverteilung der einzelnen Buchstaben innerhalb unseres Livertickers im Vergleich mit dem Deutschen aus den Angaben von www.Wikipedia.de dar (vgl. Tabelle 1).

Tabelle 1- Vergleich der Buchstabenhäufigkeiten des Deutschen mit unserem Liveticker

Abbildung in dieser Leseprobe nicht enthalten

Schaut man sich zunächst die Relativen Häufigkeiten der Buchstaben des gesamten Deutschen an, sticht der Buchstabe E stark hervor, da er mit 17,4% fast doppelt so häufig vorkommt, wie das N auf dem zweiten Platz mit 9,78%. Danach folgen mit naher Rangfolge die Buchstaben I, S und R. An letzter Stelle stehen mit knapp über 0% die Buchstaben Y,X und letztlich Q. Auch in unserem Liveticker steht der Buchstabe E an erster Stelle, mit 15,2% Relativer Häufigkeit. Der Buchstabe N steht auch hier mit fast gleicher Häufigkeit an zweiter Stelle. Die Buchstaben I, S und R folgen mit annähernd gleicher Prozentzahl auf den gleichen Rängen wie zuvor im gesamten Deutschen. Auf den letzten Plätzen stehen Y, X, Q und letztlich J, wobei J in diesem Liveticker mit 0% gar nicht vorkommt.

Vergleicht man beide Buchstabenhäufigkeiten miteinander fällt auf, dass sich die

Häufigkeiten der einzelnen Buchstaben sehr stark annähern. Die größte Abweichung liegt bei 2,2% bei dem ersten Buchstaben E und ansonsten bei maximal 0,86% (bei V). Insgesamt lässt sich festhalten, dass sich die Häufigkeiten der Buchstaben unseres Livetickers mit den Buchstabenhäufigkeiten des gesamten Deutschen decken.

3.1 Die 10 häufigsten Anfangsbuchstaben

Wir wollen nun genauer untersuchen, wie häufig die einzelnen Buchstaben in initialer Stellung im Wort erscheinen. Eine Auflistung der ersten zehn am häufigsten initial vorkommenden Buchstaben findet sich in Tabelle 2. Wieder solle in Vergleich mit dem gesamten Deutschen erfolgen. Die Angaben entstammen www.Wikipedia.de und sind in Tabelle 3 aufgeführt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2- Die häufigsten Anfangsbuchstaben im Deutschen

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3- Die häufigsten Anfangsbuchstaben im Korpus

Im direkten Vergleich der Häufigkeiten der Anfangsbuchstaben lässt sich erkennen, dass der Buchstabe D im gesamten Deutschen, sowie auch in unserem Liveticker der Buchstabe mit der häufigsten initialen Wortstellung ist. In unserem Liveticker liegt die Relative Häufigkeit mit 22,69% sogar noch um 8,49% höher. Auf dem zweiten Platz folgt in beiden Korpora der Buchstabe S mit relativ ähnlicher Prozentzahl. Die Ränge 3-5 unterscheiden sich im Vergleich recht stark. So kommen I und W bei den häufigsten Anfangsbuchstaben unseres Korpus nicht vor. Der Buchstabe E belegt zwar unterschiedliche Ränge, jedoch liegt die Relative Häufigkeit innerhalb unseres Korpus bei näherer Betrachtung sogar noch um ca. 1% höher als im gesamten Deutschen.

3.2 Die 10 häufigsten Endbuchstaben

Im Gegensatz zu zuvor möchten ich nun feststellen, wie häufig ein Buchstabe als letzter Buchstabe eines Wortes im Liveticker-Korpus vorkommt. Dazu findet sich unter Tabelle 4 eine Auflistung der häufigsten Endbuchstaben aus dem gesamten deutschen Wortschatz (nach www.Wikipedia.de), die zum Vergleich herangezogen werden soll. Tabelle 5 veranschaulicht die häufigsten Endbuchstaben des Korpus.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4- Die häufigsten Endbuchstaben im Deutschen

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 5- Die häufigsten Endbuchstaben im Korpus

In unserem Liveticker, sowie im gesamten deutschen Wortschatz steht der Buchstabe N mit relativ gleicher Prozentzahl von 21-22% an erster Stelle. An letzter Stelle befindet sich beiderseits der Buchstabe S, wiederum mit annähernd gleicher Häufigkeit von rund 9,5%. Das S kommt folglich nur noch halb so oft als Endbuchstabe vor wie das N. Auf den Plätzen 3-5 befinden sich zwar die selben drei Buchstaben, jedoch in veränderter Reihenfolge. So kommt das R mit 17,77% um 4,77% häufiger im Korpus vor als im gesamten Deutschen.

[...]


1 Unter: http://www.sportal.de/fussball/champions-league/st-petersburg/shakhtar-donezk/2011-11-01.html

Ende der Leseprobe aus 11 Seiten

Details

Titel
Korpuslinguistische Analyse von Fußball-Livetickern
Hochschule
Technische Universität Berlin  (Fakultät 1 – Geisteswissenschaften)
Veranstaltung
Seminar: Einführung in das computergestützte linguistische Arbeiten
Note
1,7
Autor
Jahr
2012
Seiten
11
Katalognummer
V337306
ISBN (eBook)
9783656987611
ISBN (Buch)
9783656987628
Dateigröße
743 KB
Sprache
Deutsch
Schlagworte
Korpusanalyse, Live-Ticker, Worthäufigkeit, Vorfeldanalyse
Arbeit zitieren
B.A. Henriette Frädrich (Autor:in), 2012, Korpuslinguistische Analyse von Fußball-Livetickern, München, GRIN Verlag, https://www.grin.com/document/337306

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Korpuslinguistische Analyse von Fußball-Livetickern



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden