Männersprache versus Frauensprache. Empirische Untersuchung der literarischen Sprache von Autorinnen und Autoren mit den Mitteln der Digital Humanities


Hausarbeit, 2016
53 Seiten, Note: 1,0

Leseprobe

Inhaltsverzeichnis

1. Einleitung

2. Analyse
2.1 Korpus
2.2 R-Stylo 'Cluster Analyse'
2.3 R-Stylo 'Consensus Tree'
2.4 Gephi Visualisierungen
2.5 R-Stylo 'Oppose'-Funktion

3. Fazit

Korpusübersicht

Literaturverzeichnis

Abbildungsverzeichnis

1. Einleitung

Die vorliegende Hausarbeit beschäftigt sich mich mit den sprachlichen Gemeinsamkeiten und Unterschieden der literarischen Sprache von Männern und Frauen. Das Klischee von geschlechtstypischer Sprache oder geschlechtstypischen Kommunikationsstilen sieht 'Männersprache' als tendenziell sachbezogener, konfrontativer, selbstbezogener, aber auch selbstsicherer. 'Frauensprache' hingegen gilt als emotionaler, personenorientiert und harmo­niebestrebt.

So untersuchte Else Ryen bereits 1970 die unterschiedlichen Sprachmerkmale von Schü­lerinnen und Schülern. Die Auswertung der Aufsätze von 151 Schülerinnen und Schülern ei­nes Gymnasiums in Schweden zum Thema Familie und Ehe ergab, dass „dieMädchen über einen weit reicheren Wortschatz zur Bezeichnung von Gefühlen verfügten als Jungen. Die Wortwahl der Jungen war unpersönlicher und mehr nach außen orientiert, die der Mädchen persönlicher und gefühlsbezogener. Wörter wie Vater, Mutter, Kind, Mensch, Heim, Eifer­sucht, Treue, Geborgenheit überwogen bei den Mädchen; Diskussion, Frage, Problem, Be­ziehung, Gesellschaft waren eher typisch für die Jungen. [...] Die Orientiertheit der Frauen auf Personen und Gefühle und die Gegenstandsorientiertheit der Männer sind charakteris­tische Unterschiede, die auch von einigen skandinavischen Sprachforschern in der ersten Hälfte unseres Jahrhunderts wahrgenommen wurden.“ (Ryen 1978, S.69)

Auch andere Untersuchungen kommen bezüglich des Wortschatzes zu dem Ergebnis, dass Frauen, wenn sie über Gefühle reden, häufiger Wörter gebrauchen, die sich auf Gefühle, Emotionen und Motivationen beziehen und dass sie dabei häufiger auf sich selbst referieren. (Gleser et al. 1959)

Ein weiterer Aspekt, der in mehreren Untersuchungen bestätigt wurde, ist, dass Frauen im Allgemeinen die höflichen Anredeformen häufiger benutzen (Kramer 1975). Robert Lakoff beschreibt diesen Aspekt der Höflichkeit als stärkere Gebundenheit von Frauen an die Kon­vention:

„ Women don't use off-color or indelicate expressions; women are the experts at euphemism; more positively, women are the repositories of tact and know the right thing to say to other people, while men carelessly blurt out whatever they are thinking. Women are supposed to be particularly careful to say 'please' and 'thankyou' and to uphold the other social conven­tions“ (Lakoff 1975, S. 55)

Schramm (1981) sagt über die größere 'Korrektheit' der Sprache von Mädchen:

„Eines der am besten nachgewiesenen Ergebnisse zur geschlechtsspezifischen Sprache be­sagt, daß [sic] Mädchen 'korrekter' sprechen als Jungen. Frauen sprechen weniger in Satz­fragmenten. Sie bilden häufiger vollständige Sätze. Sie verwenden weniger Dialekt - zumin­dest seitdem sie ebenso wie Männer mit der 'Hochsprache' in der Schule und über die Medi­en in Berührung kommen. (Noch vor einigen Jahrzehnten war es gerade umgekehrt. Frauen sprachen den Dialekt ihrer näheren Umgebung ausgeprägter, eben weil sie weniger Kontak­te zur Außenwelt und damit zu verschiedenen Sprachregionen und Gesellschaftsschichten hatten.)“ (Schramm 1981, S. 22)

Die Methoden der 'Digital Humanities' bieten nun die Möglichkeit, ohne Kostenaufwand und auf verhältnismäßig einfache Weise große Korpora, im Hinblick auf den Einfluss des Faktors Geschlecht auf die Sprache, miteinander zu vergleichen und auf verschiedene Arten zu analysieren. So lassen sich aus großen Textmengen unter anderem Wortlisten extrahieren, die es ermöglichen, die geschlechtsspezifischen Unterschiede, vor allem in Bezug auf den Wortschatz, zu untersuchen.

Die folgende Untersuchung konzentriert sich aus Gründen der Praktikabilität auf die literari­sche Schriftsprache des 18.-20. Jahrhunderts. Für diesen Zeitabschnitt ist es verhältnismä­ßig einfach, einen entsprechend großen Korpus zusammenzustellen, da die Urheberrechtsan­sprüche der Autorinnen und Autoren in der Regel schon erloschen sind und viele Werke in digitalisierter Form bei 'Project Gutenberg' oder anderen Plattformen wie WikiSource ver­fügbar sind.

Ich möchte in meiner Ausarbeitung neben dem Untersuchungsgegenstand 'Frauensprache - Männersprache' einen besonderen Fokus auf die technischen Details und Möglichkeiten der 'Digital Humanities' legen, insbesondere auf frei zugängliche Programme ('R' und 'Rstudio' mit dem 'stylo'-Modul, 'Gephi', 'AntConc', 'VoyantTools') und Korpora ('ProjectGutenberg', 'WikiSource').

2. Analyse

2.1 Korpus

Den Korpus meiner Untersuchung bilden alle Texte von Autorinnen aus der französischen Sparte „Littérature“ des Projekt Gutenberg[1] und eine Auswahl an Texten von Autoren aus der gleichen Sparte . Außerdem habe ich den Übungskorpus von Jan Rybicki 'French(Prose)'[2] integriert. Eine vollständige Liste der Autorinnen und Autoren sowie ihrer Werke befindet sich im Anhang.

Autorinnen sind mit 23 Texten vertreten, Autoren sind mit 61 Texten deutlich stärker reprä­sentiert. Der Korpus enthält in 104 Dateien (einige Werke lagen in mehreren getrennten Bänden/Dateien vor) 9 732 413 Token. Der niedrigere Anteil an Autorinnen ist bedauerlich und müsste für eine vertiefte Analyse ausgeweitet werden.

Ein wichtiger Aspekt, 'Project Gutenberg' als Datenquelle zu nutzen ist die Möglichkeit die Texte im richtigen Format (.TXT) und der richtigen Kodierung (UTF-8) herunterzuladen. Die Kodierung spielt bei französischen Texten eine wichtige Rolle, um die Akzente und Tre­mas richtig verarbeiten zu können. Die Texte erst richtig formatieren zu müssen, wäre bei einem solch großen Korpus sehr zeitaufwendig. Um eine gute Lesbarkeit zu erreichen, wur­den die Dateien nach dem Schema AUTOR_TITEL(evtl. gekürzt) umbenannt. Die verwen­deten Abkürzungen sind in der Korpusübersicht zu finden.

Für die einzelnen Schritte der folgenden Verfahren muss der Korpus in unterschiedlicher Ordnerstruktur zur Verarbeitung vorliegen, worauf im jeweiligen Abschnitt eingegangen wird.

2.2 R-Stylo Cluster Analyse

Die formatierten Daten befinden sich alle in einem gemeinsamen Ordner mit dem Namen 'corpus', die Dateinamen der Texte von Autorinnen wurden aus Gründen der Übersichtlich­keit mit dem Präfix 'f_' ausgestattet. Somit werden sie in den Dendrogrammen in derselben Farbe dargestellt.

Das Programm zählt jedes Wort in jedem Text des Korpus und erstellt eine Wortliste und eine Frequenztabelle für den gesamten Korpus. Durch den intertextuellen Vergleich der Wortfrequenzen errechnet das stylo-Modul die sprachliche Nähe/Distanz der verschiedenen Texte zueinander und stellt sie in einem Dendrogramm grafisch dar. Diese Analyse erfolgt bei einer beliebigen Menge der häufigsten Wörter (most frequent words - MFW) in frei wählbaren Inkrementen. Für die vorliegende Untersuchung wurden zunächst die 25 bis 250 häufigsten Wörter des Korpus in 25er Schritten untersucht und anschließend die 50 - 800 häufigsten Wörter in 50er Schritten.

Beim Betrachten der Dendrogramme erkennt man vor allem bei den ersten Inkrementen (25-100 MFW) starke Schwankungen innerhalb der Ergebnisse. Bei Erhöhung der Zahl un­tersuchter Wörter scheinen sich die Ergebnisse zu stabilisieren.

Auf den Dendrogrammen lassen sich einige Tendenzen bezüglich des Clusterverhaltens fest­stellen.

In meinen nun folgenden Ausführungen beziehe ich mich auf die Cluster-Analyse der 225 häufigsten Wörter, da sie die allgemeine Tendenz, die auch in folgenden Analysen erkennbar wird, gut visualisiert. Der Einfachheit halber wurde das Dendrogramm in 3 große Gruppen A, B, C eingeteilt (siehe Abbildung S.7).

Bezüglich des Untersuchungsthemas Frauensprache-Männersprache lässt sich feststellen, dass es zwar keine strenge Trennung zwischen den Geschlechtern gibt, aber Autorinnen bis auf wenige Ausnahmen in zwei Untergruppen von A clustern. Man sieht außerdem, dass die untere Bildhälfte (Gruppen B und C) von Autoren dominiert wird. Innerhalb dieser Gruppe finden sich nur zwei Autorinnen, nämlich einerseits Colette, andererseits Bazan.

Auffällig ist zudem, dass die Autoren innerhalb der Gruppe A, trotz der sprachlichen Nähe zu den Autorinnen, auf der untersten Ebene tendenziell auch eher mit Autoren clustern (sie­he Sand-Dumas, Voltaire-Stendhal). Abseits vom Thema fällt auf, dass die Texte desselben Autors bzw. derselben Autorin oft gemeinsam clustern und, dass vor allem Proust einen ganz eigenen Stil zu haben scheint, der wenig Ähnlichkeiten mit dem anderer Autoren und Autorinnen hat. Er bildet, wie später noch deutlicher zu sehen sein wird, seine eigene Grup- pe·

Abbildung in dieser Leseprobe nicht enthalten

2.3 R-Stylo Consensus Tree

Wie im letzten Abschnitt beschrieben und in den Abbildungen der Cluster-Analyse ersicht­lich wird, schwanken die errechneten Nähe-/Distanzverhältnisse je nach Anzahl der unter­suchten häufigsten Wörter.

Um diesen Schwankungen zu begegnen hält stylo die Funktion des ConsensusTree bereit. Diese errechnet aus den unterschiedlichen Ergebnissen aus der Cluster Analyse einen gemit­telten Konsens. Aufgrund der Anzahl an untersuchten Werten stößt die programminterne Vi­sualisierung von R-Studio an ihre Grenzen.

Abbildung in dieser Leseprobe nicht enthalten

2.4 Gephi Visualisierungen

Da alleine schon wegen der Anzahl der Texte im Korpus die Visualisierung mit Hilfe eines Consensus-Trees nicht hilfreich ist, bietet sich die Visualisierung mit Gephi an. Dies bietet abseits einer anschaulicheren Darstellungsweise auch die Möglichkeit, nicht nur die Nähe zwischen Autorinnen und Autoren innerhalb einer Gruppe darzustellen, sondern auch Ver­bindungen zwischen einzelnen Texten oder Autoren aus verschiedenen Gruppen.

Zu diesem Zweck wird in R-Stylo durch einen zusätzlichen Befehl ( stylo(network=TRUE, network.type=“undirected“) ) im Anschluss an die Berechnungen eine .CSV Datei erstellt, welche die Ergebnisse des 'BootstrapConsensusTree' enthält und von Gephi verarbeitet wer­den kann. Jeder Text des Korpus wird als Knoten dargestellt, die Kanten und ihre Dicke symbolisieren Verbindungen und den Grad der sprachlichen Nähe. Zunächst liegen sie in ei­nem ungeordneten würfelförmigen Haufen vor, der hinsichtlich verschiedener Kriterien or­ganisiert beziehungsweise strukturiert werden kann.

Die Bearbeitung der Daten mit Gephi erfolgt in mehreren Schritten. Zunächst wird die Mo­dularität errechnet. Die Modularität meint in der Analyse von Netzwerken „ the appearance of densely connected groups of vertices, with only sparser connections between groups“ (Newman 2006). Viele Netzwerke, seien es soziale Netzwerke, Computer-Netzwerke oder biologische Netzwerke unterteilen sich natürlich in verschiedene Gruppen. Gephi stellt eine Funktion bereit, welche den Grad der Modularität und die Anzahl dieser Gruppen errechnet. Im Fall der ersten Untersuchung mit den 250 häufigsten Wörter ergibt sich eine Modularität von 0,712 mit einer Verteilung auf 9 Gruppen (siehe Modularity Report 1). Bei der zweiten Untersuchung mit den 800 häufigsten Wörtern lag die Modularität bei 0,734 bei einer Ver­teilung auf 9 Gruppen (siehe Modularity Report 2).

In beiden Fällen zeigen sich deutlich signifikante Ergebnisse, die mit Hilfe verschiedener Layout-Verfahren von Gephi graphisch aufbereitet werden können. Zu diesem Zweck wurde der ForceAtlas2 Algorithmus verwendet. (Jacomy et al.) Dieser Algorithmus simuliert ein physikalisches System. Die Knoten stoßen sich ab, während die Kanten die miteinander ver­bundenen Knoten anziehen. Nach kurzer Zeit stellt sich in der Regel ein Gleichgewicht ein, welches die Gruppenstruktur innerhalb des Netzwerkes graphisch visualisiert.

Eine weitere Funktion ermöglicht das Einfärben der Gruppen in verschiedenen Farben. Die folgenden Gephi-Visualisierungen finden sich zusätzlich in voller Größe im Abbildungsver­zeichnis.

Zunächst betrachten wir die Visualisierung der ersten Untersuchung über die 250 häufigsten Wörter. Erste Auffälligkeit ist wieder die stilistische Abgeschiedenheit Prousts. In dieser Ab­bildungsform ist jedoch eine Verbindung zu Loti sichtbar, die zuvor nicht erkennbar war. Auf den Untersuchungsgegenstand Männersprache-Frauensprache bezogen lässt sich kon­statieren, dass sich fast alle Autorinnen, verteilt auf 2 Gruppen (orange/lila), im oberen Teil des Netzwerks befinden. Innerhalb der orangen Gruppe scheinen sich zwei Strömungen zu

Abbildung in dieser Leseprobe nicht enthalten

zeigen, die vor allem durch die gemeinsame Verbindung des Textes deBovet-Après le divor­ce zusammengehalten werden. Eine wichtige Verbindung, welche die zwei 'weiblichen' Gruppen zusammenhält, stellt der Text Caroline de Lichtfield von Isabelle de Montolieu dar.

Einige Texte von Autorinnen clustern innerhalb der 'männlichen' Gruppen (Bazan- Le Natu­ralisme, Colette-maisclaud, Colette-Chéri, duNouy-Amitié amoureuse, Gyp-Bijou, Segur- blaise). Im Fall von Bazan-Le Naturalisme zeigt sich bei allen bisherigen Untersuchungen eine Zuordnung zu den jeweiligen 'männlichen' Gruppen. Dies könnte einerseits auf das Thema des Textes zurückgeführt werden, andererseits muss bei diesem Text berücksichtigt werden, dass es sich um die Übersetzung eines männlichen Übersetzers handelt.

Im unteren Teil des Netzwerkes befinden sich außer den genannten Ausnahmen nur Texte von Autoren. Sie verteilen sich auf 7 Gruppen. Einige Texte von Autoren clustern in den 'weiblichen ' Gruppen. Einerseits Balzac - maison und Balzac - grandet, andererseits Du­mas - Camelias, Diderot - La Religieuse und Sand - chateau. Diese Texte von Autoren ver­binden den oberen mit dem unteren Teil des Netzwerkes und bilden eine Art Brücke zwi­schen der männlichen und der weiblichen Gruppe

Die Visualisierung der Untersuchung über die 800 häufigsten Wörter (Abbildung folgt) be­stätigt die allgemeine Tendenz, die schon in der ersten Untersuchung auffiel. Proust steht bei Erhöhung der untersuchten MFW noch weiter im Abseits und bildet eine eigene Gruppe. Die zwei Gruppen der Autorinnen haben sich in drei Gruppen aufgeteilt.

Auch die 'Brückenfunktion' einiger Autoren, vor allem Balzac, Diderot und Stendhal wird wieder deutlich.

Abbildung in dieser Leseprobe nicht enthalten

2.4 R-Stylo Oppose-Funktion

Mit Hilfe der Oppose-Funktion (Eder et al. 2013) wird eine kontrastive Analyse zwischen zwei Korpora durchgeführt an deren Ende eine Liste von bevorzugten/vermiedenen Wörtern aus Sicht der jeweiligen Gruppen erstellt wird.

Das Verfahren basiert auf dem Zeta-Verfahren von Burrows (Burrows 2005, 2006; Hoover 2007a, 2007b, 2008), das effektiv kontrastive Textanalysen mit großen Korpora durchführen kann. Im Gegensatz zu vielen anderen stilistischen Analyseverfahren werden nicht die häu­figsten Wörter untersucht, sondern die Wörter aus dem mittleren Bereich des Wortfrequenz­spektrums.

In dieser Untersuchung wurde das modifizierte Zeta-Verfahren von Craig genutzt. Dazu werden zwei Korpora in je gleichgroße Abschnitte eingeteilt (in unserem Fall 10 000 Wör­ter).

„ The heart of the method is that it combines the ratio of the sections by one author in which each word occurs with the ratio of the sections by the other author from which it is absent into a single measure of distinctiveness for each word. Zeta scores theoretically range from two (for a word found in every section by one author and absent from every section by the other), to zero (for a word found in no sections by one author and in all sections by the other). Sorting the words on this composite score produces two lists of words, one favored by the first author and avoided by the second, the other favored by the second author and avoided by the first.“

(Hoover 2010)

R-Stylo erstellt darüber hinaus eine Grafik mit den 70 am stärksten bevorzugten/vermiede­nen Wörtern der beiden Korpora (siehe Abbildung). In diesem Fall bezieht sich prefered/avoided auf die Perspektive des 'weiblichen' Korpus. Man kann also davon ausge­hen, dass die bevorzugten Wörter von den Autorinnen, bezogen auf die Frequenz pro Text­abschnitt, signifikant häufiger verwendet werden. Die vermiedenen Wörter werden von Au­toren signifikant häufiger genutzt. Wichtig ist auch bei dieser Funktion mit der Codezeile (oppose(encoding = "UTF-8")) sicherzustellen, dass die richtige Kodierung angewendet wird.

Experiment Frauensprache-Männersprache oppose3 Craig's Zeta

Abbildung in dieser Leseprobe nicht enthalten

Die Ergebnisse der Oppose-Funktion zeigen auf den ersten Blick, wie hoch bei den Autorin­nen im Vergleich zu den Autoren der Anteil an Emotionswörtern ist.

Wenn man 'madame' außen vor lässt, bestehen die ersten zehn Wörter, also die am deut­lichsten von den Autoren differierenden, ausschließlich aus Emotionswörtern. Vor allem die Morpheme [aim- / am-] sind stark vertreten (aimer, aime, aimable, aimé / amour, amie, amitié).

Die Emotionswörter referieren auf eine breite Vielzahl an Emotionen, vor allem aus den Be­reichen Freude (plaisir, heureux), Liebe/Leidenschaft (aim-/am-,tendre, tendresse, affection, doux, douce) Leid/Schmerz/Unglück (trouble, douleur, supporter, regrets, souffrir, peines, chagrin, malheur).

Eine weitere Auffälligkeit ist, dass der Begriff der Emotion selbst von den Autorinnen häufi­ger thematisiert wird (sentiments, émotion). Dies lässt die Mutmaßung zu, dass Autorinnen nicht nur tendenziell häufiger Emotionswörter nutzen, sondern auch häufiger auf einer Art Meta-Ebene über Emotionen schreiben.

Anhand der Vergleichsliste lässt sich auch erahnen, dass Autorinnen häufiger über Frauen schreiben (madame, mademoiselle, aber auch dit-elle,elle-même) und Autoren häufiger über Männer (monsieur). Außerdem kürzen Männer häufiger das Wort Madame (mme).

Während man bei den bevorzugten Wörtern der Autorinnen noch überlegen muss, ob nicht noch mehr Wörter als Emotionswörter bestimmt werden könnten/müssten (z.B. confiance, torts, mariage, sacrifice, pensée), findet man bei den Autoren keinen einzigen potentiellen Kandidaten.

Die Autoren benutzen demnach jedoch signifikant häufiger Zahlwörter (quatre, cinq, cent, trois, dix, vingt) oder schreiben über Geld/Vermögen (or, argent, francs evtl. sous, affaire). Des Weiteren sind viele Wörter der räumlichen Beschreibung vorzufinden (face, derrière, gauche, droite, coté, gros, large). Bei dem Wort 'sous' ist keine genaue Eingruppierung möglich, da es zwei mögliche Bedeutungen (les sous / sous la table) gibt. Eine weitere Auf­fälligkeit der 'Männersprache' ist der tendenziell bevorzugte Gebrauch der Hilfsverben 'avoir' und 'être' und somit möglicherweise des Imparfait beziehungsweise Plus-que-parfait (avait, avaient, était, étaient).

Als allgemeine Tendenz lässt sich festhalten, dass bei den bevorzugten Wörtern der Autorin­nen die Innenperspektive des Menschen eine größere Rolle spielt. Emotionen, Liebe, Freundschaft, Eindrücke, Ideen und Gedanken sind die zentralen Begriffsfelder.

Bei den Autoren dominieren hingegen Wörter der Außenperspektive/Außenwelt. Es finden sich neben Wörtern der Beschreibungsebene (s.o.) und Wörtern über Geld/Geschäfte viele Dinge oder Orte der Außenwelt (rue, pied, épaule, mer).

3. Fazit

Zunächst möchte ich in diesem Kapitel die Ergebnisse und Erkenntnisse dieser Untersu­chung zusammenfassend präsentieren und diskutieren. Im Anschluss werde ich mich kritisch mit den Verfahren und den möglichen Rückschlüssen aus der Untersuchung be­schäftigen.

Im Kapitel Cluster-Analyse habe ich gezeigt, dass die Autorinnen und Autoren mithilfe der Wortfrequenzen in verschiedene Gruppen eingeteilt werden können. Autorinnen clustern mit wenigen Ausnahmen gemeinsam, in zwei separaten Untergruppen. Diese Ergebnisse werden sowohl durch die verschiedenen Verfahren (Cluster-Analyse, Consensus-Tree, Gephi-Visua- lisierung) als auch durch die zwei verschiedenen Wortspektren (250 MFW / 800 MFW) be­stätigt.

Ausgehend von diesem, zumindest rechnerischen, Unterschied zwischen 'Männersprache' und 'Frauensprache' habe ich unter Zuhilfenahme der oppose-Funktion von R-Stylo eben diese besonders unterschiedlich häufig gebrauchten Wörter herausgefiltert. Wichtig ist an dieser Stelle festzuhalten, dass die bevorzugten Wörter der Autorinnen natürlich zugleich die vermiedenen Wörter der Autoren sind und vice versa.

Anhand der 70 bevorzugten/vermiedenen Wörter der Autorinnen und Autoren habe ich fest­gestellt, dass bei den Autorinnen deutlich häufiger Emotionsbegriffe benutzt werden. Die Emotionsbegriffe referieren auf eine breite Gefühlspalette. Insgesamt dominieren Wörter des Innenlebens.

Dem gegenüber sind bei den 70 bevorzugten Wörtern der Autoren keinerlei Emotionsbegrif­fe zu finden. Die Sprache der Autoren zeichnet sich gegenüber den Autorinnen vor allem durch beschreibende Wörter der 'Außenwelt', Zahlwörter und Wörter, die sich mit dem The­menkomplex Geld-Vermögen-Geschäft beschäftigen, aus.

Bezogen auf die, in der Einleitung thematisierte Gefühlskomponente der 'Frauensprache' scheint die Untersuchung die Ergebnisse zu bestätigen. Die untersuchten Autorinnen benut­zen in ihren Texten deutlich häufiger Emotionswörter, als die untersuchten Autoren. Die Au­toren zeichnen sich in ihrer Wortwahl tatsächlich durch einen starken Sachbezug aus.

Kritisch anzumerken ist diesbezüglich, dass die Ergebnisse natürlich nicht ausschließlich auf den Faktor Geschlecht zurückgeführt werden können. Sicherlich spielen auf Faktoren wie Bildungsgeschichte oder sozialer Status der Autorin/des Autors und auch das Genre des Textes eine große Rolle. Die untersuchten Autorinnen entstammen, man bedenke den Zeit­rahmen, vor allem den sozial höhergestellten Schichten oder dem Adel. Eine mögliche The­se wäre beispielsweise, dass die wenigen Frauen, die zu dieser Zeit geschrieben haben, ver­öffentlicht wurden und so relevant geblieben sind, dass ihre Texte digitalisiert wurden, vor allem 'Liebesgeschichten' oder Geschichten aus dem Leben der 'Hofdame' verfasst haben. Diese durch das Genre beeinflusste Sprache wäre vermutlich nicht repräsentativ für die 'Frauensprache' an sich, falls man diese Kategorie überhaupt anlegen kann.

Was die Methoden der Digital Humanities betrifft, die ich für diese Untersuchung eingesetzt habe, muss betont werden, dass, trotz aller begründeter Euphorie, diese Art des 'distant-rea­ding' nur begrenzt Erkenntnisse liefern kann, solange keine vertieften Informationen zu den Autoren und den Texten miteinbezogen werden. Dass Unterschiede vorliegen und welche dies sind, kann festgestellt werden. Warum diese Unterschiede vorliegen und worauf sie zu­rückzuführen sind, bedarf weiterer ausführlicher Studien.

Zusammenfassend lässt sich feststellen, dass die Untersuchgsergebnisse die These stützen, dass sich 'Frauensprache' tendenziell eher auf Gefühle bezieht und 'Männersprache' tenden­ziell sachbezogener ist. Dies müsste jedoch in weiteren Untersuchungen validiert werden, bei denen man versucht, andere Faktoren wie sozialer Status, Bildungsgeschichte oder ähn­liches zu eliminieren.

[...]


[1] http://www.gutenberg.org/wiki/FR_Litt%C3%A9rature_%28Genre%29

[2] http://dl.dropboxusercontent.com/u/2274698/French%20Prose%20UTF-8.zip

Ende der Leseprobe aus 53 Seiten

Details

Titel
Männersprache versus Frauensprache. Empirische Untersuchung der literarischen Sprache von Autorinnen und Autoren mit den Mitteln der Digital Humanities
Hochschule
Bergische Universität Wuppertal  (Geistes- und Kulturwissenschaften - Romanistik)
Veranstaltung
Lexikon
Note
1,0
Autor
Jahr
2016
Seiten
53
Katalognummer
V324170
ISBN (eBook)
9783668269415
Dateigröße
80689 KB
Sprache
Deutsch
Schlagworte
Männersprache - Frauensprache, Männersprache, Frauensprache, Digital Humanities, DH, Digitale Geisteswissenschaften, Computerlinguistik, Big Data, Gephi, Stylometry, stylo, Stilometrie, Emotionswörter, lterarische Sprache, R-Studio
Arbeit zitieren
Raphael Müller (Autor), 2016, Männersprache versus Frauensprache. Empirische Untersuchung der literarischen Sprache von Autorinnen und Autoren mit den Mitteln der Digital Humanities, München, GRIN Verlag, https://www.grin.com/document/324170

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Männersprache versus Frauensprache. Empirische Untersuchung der literarischen Sprache von Autorinnen und Autoren mit den Mitteln der Digital Humanities


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden