Der Schwerpunkt dieser Hausarbeit liegt auf einem bestimmten Untersuchungsgegenstand, der für eine eigene Sentiment-Analyse herangezogen werden soll. Bei diesem Untersuchungsgegenstand handelt es sich um das bisweilen kontroverse Videospiel The Sims 4, welches insbesondere in jüngerer Zeit auf unterschiedlichen sozialen Plattformen im Internet diskutiert worden ist. Im Vordergrund steht dabei die Annahme, dass es aufgrund seiner mitunter kontroversen Natur vor allem häufig aus einer kritischen, wenn nicht sogar negativen Perspektive heraus diskutiert und bewertet wird; daraus schließt sich die Hypothese, dass sich entsprechend eine wesentliche Anzahl von negativ besetzten Meinungen und Gefühlen auf der ausgewählten sozialen Plattform, nämlich Twitter, wiederfinden lassen sollte.
Die Frage danach, wie sich Menschen über bestimmte Ereignisse, Themen, Personen und dergleichen auf einer Meinungs- und Gefühlsebene äußern, ist vor allem heutzutage, da theoretisch jedermann über eine öffentliche Stimme dank des Internets und seiner diversen sozialen Plattformen verfügt, besonders spannend und aufschlussreich. Unter anderem davon inspiriert ist das Forschungsfeld der Sentiment Analysis, welches sich eben damit auseinandersetzt, auf welche Arten und Weisen Meinungen, Gefühle und Stimmungen von Menschen zu den unterschiedlichsten Dingen zum Ausdruck gebracht werden, und wie sie sich ggf. kategorisieren und quantifizieren lassen – sowohl für wissenschaftlich geprägte Zwecke als auch für diverse Marketing-Absichten.
Das Internet als eine schier unendliche Quelle von verfügbarem Datenmaterial für ebendiese Zwecke und Absichten nimmt dabei eine besonders tragende Rolle ein, da in einer Vielzahl der sozialen Netzwerke und sozialen Medien eine enorme Bandbreite von unterschiedlichen alltäglichen und weniger alltäglichen Ereignissen, Themen, Personen etc. von verschiedensten Menschen diskutiert und bewertet werden.
Inhaltsverzeichnis
1. Einleitung
2. Sentiment Analysis: Definition und Stand der Forschung
3. Methodische Grundlagen
3.1. Datenquelle Twitter und Untersuchungsgegenstand The Sims 4
3.2. Verwendete Software und Erläuterung des Python-Skripts
4. Durchführung der Sentiment-Analyse
4.1. Betrachtung verschiedener Suchanfragen und deren Ergebnis-Kategorisierung
4.2. Beobachtungen zur Zuverlässigkeit der TextBlob-Analyse
5. Fazit
Zielsetzung & Themen
Diese Arbeit untersucht die Eignung einer automatisierten Sentiment-Analyse mittels Python zur Auswertung von Nutzerreaktionen auf Twitter. Im Fokus steht die Überprüfung der Hypothese, ob kontroverse Ereignisse rund um das Videospiel The Sims 4 zu einer messbaren Häufung negativ besetzter Meinungen auf der Plattform führen.
- Grundlagen der Sentiment Analysis im Natural Language Processing.
- Technische Implementierung einer Analyse-Pipeline mit Tweepy und TextBlob.
- Analyse und Kategorisierung von Twitter-Daten zu einem spezifischen Videospiel-Thema.
- Diskussion der methodischen Herausforderungen bei der automatisierten Meinungsanalyse.
- Kritische Reflexion der Zuverlässigkeit von TextBlob-Ergebnissen im Anwendungsfall.
Auszug aus dem Buch
3.1. Datenquelle Twitter und Untersuchungsgegenstand The Sims 4
Twitter ist ein öffentlicher und webbasierter Service, der es seinen Nutzern erlaubt, mithilfe von kurzen Nachrichten – max. 280 Zeichen sind erlaubt – eine Art der asynchronen (Quasi-)Kommunikation aufrechtzuhalten. Das primäre Ziel von Twitter ist es, auf die Frage „Was passiert gerade?“ kurz und bündig antworten zu können, woraus sich auch die Beschränkung auf 280 Zeichen pro Tweet ergibt. Konversationen lassen sich auf Twitter führen, indem andere Benutzer mithilfe des @-Zeichens angesprochen – getaggt – werden. Bemerkenswert daran ist, dass auf Twitter diesbezüglich keine Restriktionen vorherrschen; jeder Benutzer kann auf den Tweet eines anderen Benutzers sogleich reagieren und antworten, ohne ihn zwangsläufig kennen zu müssen, und auch Unternehmen, politische Figuren und Berühmtheiten, die einen eigenen Account auf Twitter pflegen, sind hiervon nicht ausgenommen. Daher bietet Twitter seinen Benutzern indirekt eine Plattform an, die sich zum Äußern von Beschwerden oder zum Hervorheben von Missständen gut eignet, da es zumindest über das Potenzial verfügt, diejenigen Personen, Unternehmen oder Organisationen direkt zu erreichen, die für einen Missstand o.ä. verantwortlich sind (vgl. Murthy 2013, S. 3): Twitter „[…] has redefined the way in which customers complain.“ (ebd., S. 13) Die Beliebtheit von Twitter lässt sich zum einen also auf diesen Sachverhalt zurückführen, zum anderen ist es aber auch deswegen populär, weil es vergleichsweise einfach zu benutzen ist und wenig Lern- und Zeitaufwand erfordert (vgl. ebd., S. 1).
Zusammenfassung der Kapitel
1. Einleitung: Die Einleitung führt in das Forschungsfeld der Sentiment Analysis ein, erläutert die Bedeutung sozialer Plattformen für die Meinungsbildung und stellt den Untersuchungsgegenstand The Sims 4 sowie die methodische Zielsetzung der Arbeit vor.
2. Sentiment Analysis: Definition und Stand der Forschung: Dieses Kapitel definiert Sentiment Analysis als Teilgebiet des Natural Language Processing, beschreibt die Entwicklung seit ca. 2000 und erläutert die verschiedenen Analyseebenen sowie die Rolle von Sentiment Terms.
3. Methodische Grundlagen: Das Kapitel beschreibt Twitter als Datenquelle, diskutiert die Abgrenzung zu sozialen Netzwerken und führt in die verwendete Software (PyCharm, Tweepy, TextBlob) für die automatisierte Analyse ein.
4. Durchführung der Sentiment-Analyse: Dieser Teil dokumentiert die praktische Durchführung der Analyse mit variierenden Suchanfragen, stellt die Problematik irrelevanter Daten (z.B. YouTube-Verknüpfungen) dar und reflektiert die Zuverlässigkeit der Ergebnisse anhand von Praxisbeispielen.
5. Fazit: Das Fazit fasst die Ergebnisse zusammen, stellt fest, dass die vermutete negative Tendenz nicht in der erwarteten Deutlichkeit eintrat, und gibt einen Ausblick auf mögliche Verbesserungen der Methodik.
Schlüsselwörter
Sentiment Analysis, Opinion Mining, Twitter, The Sims 4, Python, Tweepy, TextBlob, Natural Language Processing, Soziale Medien, Microblogging, Datenanalyse, Automatisierung, Polarität, Subjektivität, Suchanfragen.
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundlegend?
Die Arbeit beschäftigt sich mit der automatisierten Analyse von Nutzerstimmungen (Sentiment Analysis) auf Twitter zu einem spezifischen Thema, dem Videospiel The Sims 4.
Was sind die zentralen Themenfelder der Untersuchung?
Die zentralen Themen sind die technische Anwendung von Natural Language Processing-Tools zur Meinungsanalyse, der Umgang mit Twitter-Daten sowie die kritische Überprüfung von deren Aussagekraft bei kontroversen Themen.
Welches primäre Ziel verfolgt die Forschungsarbeit?
Das Ziel ist es, ein Python-Skript zu entwickeln und anzuwenden, um zu prüfen, ob sich die vermutete negative Stimmung der Community gegenüber dem Spiel durch eine automatisierte Sentiment-Analyse belegen lässt.
Welche wissenschaftlichen Methoden kommen zum Einsatz?
Es wird eine korpuslinguistische Analyse bzw. ein Data-Mining-Ansatz verwendet, bei dem Twitter-Daten via API-Schnittstelle extrahiert und mit Hilfe der Bibliothek TextBlob auf ihre Polarität und Subjektivität hin untersucht werden.
Welche Aspekte werden im Hauptteil der Arbeit behandelt?
Im Hauptteil werden die theoretischen Grundlagen der Sentiment-Analyse erläutert, das technische Setup mit PyCharm und den Bibliotheken Tweepy und TextBlob beschrieben sowie die tatsächliche Durchführung und Auswertung der Analyse-Experimente dokumentiert.
Durch welche Schlüsselwörter lässt sich die Arbeit am besten charakterisieren?
Die Arbeit lässt sich am besten über Begriffe wie Sentiment Analysis, Twitter, The Sims 4, Python, Natural Language Processing und Opinion Mining beschreiben.
Warum spielt die Wahl der Suchanfrage eine so wichtige Rolle für das Ergebnis?
Wie im Kapitel zur Durchführung erläutert, kann eine unspezifische Suchanfrage zu einer Verzerrung führen, da beispielsweise YouTube-Beiträge oder Modding-Inhalte die Sentiment-Werte unvorhergesehen beeinflussen und falsch klassifizieren können.
Zu welcher Schlussfolgerung kommt die Autorin bezüglich der Hypothese?
Die Autorin stellt fest, dass sich die anfangs vermutete hohe Dichte an negativen Tweets zum Spiel The Sims 4 durch die durchgeführte automatisierte Analyse nicht in der erwarteten Weise bestätigen ließ.
- Quote paper
- Sarah Insacco (Author), 2018, Sentiment-Analyse von "The Sims 4" auf Twitter. Einsatz von Tweepy und TextBlob über ein Python-Skript zur Meinungsanalyse, Munich, GRIN Verlag, https://www.grin.com/document/539423