Grin logo
de en es fr
Shop
GRIN Website
Texte veröffentlichen, Rundum-Service genießen
Zur Shop-Startseite › Germanistik - Linguistik

Satzlänge in Hausarbeiten als Stilcharakteristikum der quantitativen Autorschaftserkennung

Titel: Satzlänge in Hausarbeiten als Stilcharakteristikum der quantitativen Autorschaftserkennung

Hausarbeit (Hauptseminar) , 2021 , 27 Seiten , Note: 2,3

Autor:in: Anonym (Autor:in)

Germanistik - Linguistik
Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

Ich möchte in der vorliegenden Arbeit keine vollständige Autorschaftsattribution vornehmen, sondern mithilfe empirischer Daten, die ich aus Hausarbeiten von vier Kommilitonen entnehme, Untersuchungen dazu anstellen, inwieweit der Faktor Satzlänge als Stilcharakteristikum Aussagen über eine mögliche Autorenschaft zulässt. Die dafür benötigten Daten werden aus 16 Hausarbeiten automatisiert und manuell extrahiert und in einer Exceldatei aufbereitet. Mithilfe der erhobenen Daten soll sowohl ein intra- als auch interindividueller Vergleich von Autorschaft vorgenommen werden und ggf. mögliche Einsichten zu Einflussfaktoren wie sprachliche Variation im Zeitverlauf oder der Textsorte Hausarbeit zu erhalten. Die grundlegende Fragestellung meiner Hausarbeit lautet also: „Ist Satzlänge (in Hausarbeiten) ein geeignetes Merkmal, um als Stilcharakteristikum von quantitativer Autorschaftserkennung in Betracht gezogen zu werden?“.

Untersuchungen zu Satzlängen werden mit den unterschiedlichsten Fragestellungen im Rahmen eines breiten Forschungsspektrums durchgeführt. Vor allem können Untersuchungen zur Satzlänge als spezifisches Stilcharakteristikum und damit Indikator für Autorenschaft herangezogen werden. Nun können Besonderheiten von Sprache in zweierlei Hinsicht in Betracht gezogen werden: auf quantitativer und qualitativer Ebene. Die für meine Hausarbeit relevanten theoretischen und praktischen Forschungsansätze beziehen sich auf quantitativ ausgerichtete empirische Untersuchungen von Linguistik, die in der Regel das Ziel haben, große Mengen sprachlichen Materials mit geeigneten Analysemethoden auf Besonderheiten oder Phänomene zu untersuchen, ist die Grundannahme von quantitativer Autorschaftsattribution, dass Autor*innen eines Textes aus einer Menge möglicher Autor*innen auf Grund von textuellen Messungen ausgewählt werden kann.

Leseprobe


Inhaltsverzeichnis

1 Einleitung

2 Satzlänge (in Hausarbeiten) als Autorspezifisches Stilmerkmal

3 Quantitatives Berechnungsverfahren

3.1 Input

3.2 Textuelle Messung von Satzlängen

3.3 (Autorenbasierte) Korpus-Zusammenstellung

3.4 Vergleich und Output

4 Ergebnisse

4.1 Deskriptive Ergebnisdarstellung

4.2 Inferenzstatistische Ergebnisdarstellung

5 Diskussion & Fazit

Zielsetzung & Themen

Die vorliegende Arbeit untersucht die Eignung der Satzlänge als quantitatives Stilmerkmal zur Autorschaftserkennung innerhalb der Textsorte "Hausarbeit". Dies geschieht auf Basis eines empirischen Korpus, das 16 Hausarbeiten von vier verschiedenen Autoren umfasst, wobei sowohl intra- als auch interindividuelle Unterschiede statistisch analysiert werden, um die Validität dieses Parameters für die Autorenbestimmung kritisch zu hinterfragen.

  • Quantitative linguistische Analyse der Satzlänge in wissenschaftlichen Texten
  • Vergleich von intra- und interindividuellen Stilmerkmalen
  • Einsatz statistischer Verfahren (t-Test, ANOVA, Produkt-Moment-Korrelation) zur Attributionsprüfung
  • Kritische Reflexion über den Einfluss von Textsortenvorgaben auf den individuellen Schreibstil
  • Evaluierung der Satzlänge als distinktives Merkmal der Autorenerkennung

Auszug aus dem Buch

3.2 Textuelle Messung von Satzlängen

Um festzustellen welche Schriftprobe eines möglichen Autors dem zu untersuchenden Text am ähnlichsten ist, besteht die Notwendigkeit einige Informationen aus jedem dieser Texte zu extrahieren. Im Rahmen der quantitativen Autorschaftszuschreibung per Satzlänge besteht diese Information aus den Werten eines Satzes von einem oder mehreren Textmaßen, wobei das Textmaß als Funktion der Häufigkeit einer oder mehrerer Zeichenketten in einem Text definiert ist (Grieve, 2005); anders gesagt, um statistische Methoden vorzunehmen, wird die Satzlänge quantitativ erfasst. Bei der Erhebung der Daten lehne ich mich an die Methode zur Satzlängenmessungen von Grieve (2007) an, bei der die Daten in vier Größen erfassen werden:

durchschnittliche Satzlänge in Wörtern, indem die Gesamtzahl der Wörter in einem Text durch die Gesamtzahl der Sätze geteilt wird,

Satzlängenverteilung in Wörtern, die aus der relativen Häufigkeit von n-Wort-Sätzen des Textes besteht. Dabei wird die relative Häufigkeit der Satzlängen durch Division der Gesamtzahl der Sätze ermittelt,

durchschnittliche Satzlänge in Zeichen, die berechnet wird, indem die Gesamtzahl der Zeichen durch die Gesamtzahl der Sätze geteilt wird,

und Satzlängenverteilung in Zeichen, die aus der relativen Häufigkeit von x- bis y-Zeichen-Sätzen in 25-Zeichenintervallen gebildet wird. Auch hier wird die relative Häufigkeit der Satzlängen durch Division der Gesamtzahl der Sätze gemittelt.

Um die Tokenisierung bzw. quantitative Charakterisierung von Wort- und Zeichenanzahl mithilfe statistischer Methoden zu erheben, muss zunächst genau definiert werden, welche Bedingungen festgelegt werden, um einen Satz als solchen messbar zu machen. Für den Vergleich der Schreibproben wird die grundlegendste Charakterisierung zur textuellen Messung von Satzlängen herangezogen: Ein Satz ist eine durch Punkt, Frage- oder Ausrufezeichen abgegrenzte Einheit.

Zusammenfassung der Kapitel

1 Einleitung: Diese Einleitung führt in das Forschungsthema ein, definiert die zentrale Forschungsfrage hinsichtlich der Eignung der Satzlänge als Stilmerkmal und skizziert das methodische Vorgehen der Arbeit.

2 Satzlänge (in Hausarbeiten) als Autorspezifisches Stilmerkmal: Das Kapitel verortet das Konzept des "Stils" in der Linguistik und erläutert die Bedeutung von Satzlängen als potenziell autorcharakteristisches Merkmal vor dem Hintergrund der besonderen Anforderungen an das wissenschaftliche Schreiben.

3 Quantitatives Berechnungsverfahren: Hier werden das Datensammelverfahren, der Aufbau des autorenbasierten Korpus sowie die statistischen Messmethoden zur Gewinnung von Wort- und Zeichenstatistiken detailliert beschrieben.

4 Ergebnisse: Die Ergebnisse werden sowohl deskriptiv als auch inferenzstatistisch (u.a. via t-Test und ANOVA) präsentiert, wobei die statistischen Parameter der verschiedenen Schreibproben und Autoren gegenübergestellt werden.

5 Diskussion & Fazit: Das Kapitel diskutiert die gewonnenen Daten kritisch im Hinblick auf die Forschungsfrage und kommt zu dem Schluss, dass die Satzlänge in der vorliegenden Untersuchung keine hinreichende Aussagekraft für eine robuste Autorenerkennung besitzt.

Schlüsselwörter

Satzlänge, Autorschaftserkennung, Stilistik, Quantitative Linguistik, Korpusanalyse, Inferenzstatistik, Hausarbeit, Idiolekt, Sprachvariation, Textsorte, Attributionsalgorithmus, Varianzanalyse, Korrelationsanalyse, Forensische Linguistik, Schreibstil

Häufig gestellte Fragen

Worum geht es in dieser wissenschaftlichen Arbeit?

Die Arbeit untersucht, ob die Satzlänge als messbares Stilmerkmal genutzt werden kann, um die Autorschaft von akademischen Hausarbeiten zweifelsfrei oder mit hoher Wahrscheinlichkeit zu bestimmen.

Was sind die zentralen Themenfelder der Studie?

Zu den zentralen Themen gehören die quantitative Stilanalyse, die Definition des Idiolekts im Kontext von Hausarbeiten sowie die Anwendung statistischer Methoden zur linguistischen Mustererkennung.

Wie lautet die zentrale Forschungsfrage der Untersuchung?

Die Forschungsfrage lautet: „Ist Satzlänge (in Hausarbeiten) ein geeignetes Merkmal, um als Stilcharakteristikum von quantitativer Autorschaftserkennung in Betracht gezogen zu werden?“

Welche wissenschaftlichen Methoden werden angewendet?

Der Autor nutzt automatisierte Datenerhebung aus 16 Hausarbeiten, gefolgt von einer statistischen Auswertung mittels t-Tests, einfaktorieller Varianzanalyse (ANOVA) und Produkt-Moment-Korrelationen.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil befasst sich mit der methodischen Herleitung der Satzlängenmessung, der Beschreibung des Korpusaufbaus sowie der anschließenden statistischen Ergebnisdarstellung anhand tabellarischer und grafischer Auswertungen.

Durch welche Schlüsselwörter lässt sich diese Arbeit charakterisieren?

Wichtige Begriffe sind Satzlänge, Autorschaftserkennung, quantitative Linguistik, Korpusanalyse, Inferenzstatistik und Stilistik.

Warum konnte die Hypothese der Autorenunterscheidung nicht bestätigt werden?

Der Autor vermutet, dass die engen strukturellen Vorgaben für wissenschaftliche Hausarbeiten und die Praxis des Literaturparaphrasierens zu einer Homogenisierung der Satzlängen führen, die individuelle Unterschiede statistisch überlagert.

Welche Rolle spielt die Kapitelstruktur für das Ergebnis der Analyse?

Der Einfluss der Gliederung (Einleitung, Hauptteil, Fazit) auf die Satzlänge wurde explizit untersucht, konnte jedoch nicht als signifikanter Faktor für variierende Satzlängen nachgewiesen werden.

Warum wird zwischen Wort- und Zeichenebene unterschieden?

Der Vergleich dient der Präzisierung: Die Analyse zeigt, dass die Wortanzahl pro Satz eine tendenziell höhere Aussagekraft besitzt als die Zeichenanzahl, welche stärker durch grammatikalische Flexionsformen beeinflusst wird.

Was ist das zentrale Fazit zur Eignung der Satzlänge als Merkmal?

Das Fazit der vorliegenden Untersuchung ist, dass die Satzlänge in der von ihm gewählten Form kein ausreichend robustes oder eindeutiges Merkmal darstellt, um innerhalb der Textsorte "Hausarbeit" eine valide Autorenerkennung zu gewährleisten.

Ende der Leseprobe aus 27 Seiten  - nach oben

Details

Titel
Satzlänge in Hausarbeiten als Stilcharakteristikum der quantitativen Autorschaftserkennung
Hochschule
Ruhr-Universität Bochum  (Fakultät für Philologie der Ruhr-Universität Bochum)
Veranstaltung
Linguistische Autor*innenerkennung
Note
2,3
Autor
Anonym (Autor:in)
Erscheinungsjahr
2021
Seiten
27
Katalognummer
V1297806
ISBN (PDF)
9783346762221
ISBN (Buch)
9783346762238
Sprache
Deutsch
Schlagworte
Quantitative Autorschaftsattribution stilometrische Autorschaftsattribution
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Anonym (Autor:in), 2021, Satzlänge in Hausarbeiten als Stilcharakteristikum der quantitativen Autorschaftserkennung, München, GRIN Verlag, https://www.grin.com/document/1297806
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  27  Seiten
Grin logo
  • Grin.com
  • Versand
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum