Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Miscellaneous

Sentimentanalyse. Entwicklung eines Modells zur Stimmungserkennung in Tweets

Title: Sentimentanalyse. Entwicklung eines Modells zur Stimmungserkennung in Tweets

Term Paper , 2020 , 21 Pages , Grade: 1,7

Autor:in: Julian Springer (Author)

Computer Science - Miscellaneous
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Ziel dieser Arbeit ist es, ein Modell zu entwickeln, welches die Stimmung von Tweets automatisch vorhersagt, ohne die manuelle Bewertung eines Menschen. Dieses Modell kann von Entscheidungsträgern in Unternehmen verwendet werden, um sie bei ihrer Entscheidung zu unterstützen.

Die Welt verändert sich rasant in einer noch nie dagewesenen Geschwindigkeit. Seien es die Themen E-Commerce, künstliche Intelligenz oder auch die digitale Interaktion und Kommunikation untereinander, die nicht zuletzt durch COVID-19 befeuert wurde. Es gibt immer mehr digitale Assistenten, die es ermöglichen, eine Kommunikation mit anderen Menschen aufzubauen. Solch einen Service, der sich dies zunutze macht, ist beispielsweise auch der Kurznachrichtendienst Twitter. Twitter sorgt dafür, dass Nutzer miteinander kommunizieren können, ganz egal wo sie sich gerade geografisch befinden. Diese Kommunikation, die auch Meinungen bzw. Stimmungen von Nutzern enthalten, werden für Unternehmen immer interessanter, da sie dadurch indirekt das Feedback der Kundschaft für ein Produkt bekommen. Das Problem besteht in der großen Anzahl an Daten, die allein durch einen Menschen nicht mehr zu verarbeiten bzw. auszuwerten sind. Das ist der Punkt, wo das Forschungsgebiet der natürlichen Sprache ins Spiel kommt, um es konkreter auszudrücken, die Sentimentanalyse.

Excerpt


Inhaltsverzeichnis

1 Einleitung

2 Grundlagen der Sentimentanalyse

2.1 Hintergrund

2.2 Datengrundlage

2.3 Charakteristiken der natürlichen Sprache

2.4 Verschiedene Ansätze

2.4.1 Lexika

2.4.2 Maschinelles Lernen

3 Datenvorverarbeitung

3.1 Datensatz

3.2 Methoden

4 Erstellung der Modelle

4.1 Naiver Bayes

4.2 Logistische Regression

4.3 Lineare Support Vector Maschine

5 Evaluation der Modelle

5.1 Ergebnis

5.2 Vergleich

6 Fazit

Zielsetzung & Themen

Das primäre Ziel dieser Arbeit ist die Entwicklung eines Modells zur automatischen Stimmungserkennung in Twitter-Nachrichten (Tweets), um Entscheidungsträgern in Unternehmen eine datengestützte Feedback-Analyse ohne manuelle Bewertung zu ermöglichen.

  • Grundlagen der Sentimentanalyse und Abgrenzung von Ansätzen
  • Methoden der Datenvorverarbeitung (NLP-Techniken)
  • Implementierung und Vergleich der Machine-Learning-Modelle (Naiver Bayes, Logistische Regression, SVM)
  • Evaluierung der Modellgüte mittels Precision, Recall und F1-Score

Auszug aus dem Buch

4.1 Naiver Bayes

Der NB-Algorithmus verwendet das Bayes’sche Theorem als Grundlage und kombiniert dieses mit einer sogenannten naiven Vermutung der bedingten Unabhängigkeit. Folglich kann der Ausgabewert durch ein oder mehrere Eingabewerte vorhergesagt werden. NB ist ein Klassifikator, der auf Wahrscheinlichkeiten basiert, was bedeutet, dass für ein Satz, die Klasse mit der höchsten Wahrscheinlichkeit aus allen anderen Klassen zurückgegeben wird. Jedoch ist es ohne vereinfachende Annahme schwierig die Wahrscheinlichkeit jeder möglichen Kombination von Worten bzw. Merkmalen zu berechnen, da dies eine große Menge von Parametern und große Datensätze zur Folge hätte. Demzufolge bedient sich der NB-Algorithmus zwei vereinfachten Annahmen, weshalb er auch als naiv bezeichnet wird. Die zwei Annahmen werden im Folgenden beschrieben:

- Die erste Annahme beruht auf der Worthülsen-Annahme, d. h. es wird angenommen, dass die Position von Worten in einem Satz keine Rolle spielt. Das hat zur Folge, dass beispielsweise das Wort Arbeit in einem Satz die gleiche Auswirkung hat, ganz egal ob es am Anfang, in der Mitte oder am Ende eines Satzes steht.

- Die zweite Annahme wird als NB-Annahme bezeichnet, da diese die bedingte Unabhängigkeitsannahme darstellt, d. h., dass die Wahrscheinlichkeiten angesichts der Klasse unabhängig sind und daher naiv multipliziert werden können.

Zusammenfassung der Kapitel

1 Einleitung: Vorstellung der Relevanz der Sentimentanalyse im Kontext sozialer Medien und Definition des Ziels, ein automatisches Klassifikationsmodell zu entwickeln.

2 Grundlagen der Sentimentanalyse: Theoretische Einführung in das Forschungsfeld, die Datengrundlage und die Abgrenzung lexikalischer Ansätze von maschinellem Lernen.

3 Datenvorverarbeitung: Detaillierte Beschreibung des Sentiment140-Datensatzes sowie der angewandten NLP-Methoden wie Tokenisierung, Stoppwort-Entfernung und Lemmatisierung.

4 Erstellung der Modelle: Technische Erläuterung der verwendeten Algorithmen Naive Bayes, Logistische Regression und Lineare Support Vector Maschine.

5 Evaluation der Modelle: Präsentation der Analyseergebnisse mittels Klassifikationsberichten und Confusion-Matrices sowie Vergleich der Modellgüte und Trainingszeit.

6 Fazit: Zusammenfassende Bewertung der Ergebnisse und Ausblick auf zukünftige Optimierungspotenziale durch komplexere Verfahren wie Deep Learning.

Schlüsselwörter

Sentimentanalyse, Opinion Mining, Twitter, Maschinelles Lernen, Naive Bayes, Logistische Regression, Support Vector Maschine, NLP, Datenvorverarbeitung, Klassifikation, Sentiment140, Feature Extraktion, F1-Score, Confusion Matrix, Textanalyse.

Häufig gestellte Fragen

Worum geht es in der Arbeit grundlegend?

Die Arbeit befasst sich mit der Entwicklung und Evaluation von Machine-Learning-Modellen zur automatischen Erkennung der Stimmung (Sentiment) in Tweets.

Was sind die zentralen Themenfelder?

Die zentralen Themen umfassen die Verarbeitung natürlicher Sprache (NLP), die Vorverarbeitung unstrukturierter Social-Media-Daten und den Vergleich verschiedener Klassifikationsalgorithmen.

Was ist das primäre Ziel der Untersuchung?

Ziel ist es, ein Modell zu schaffen, das die Stimmung von Tweets präzise klassifiziert, um Unternehmen eine effiziente, automatisierte Auswertung von Kundenfeedback zu ermöglichen.

Welche wissenschaftlichen Methoden kommen zum Einsatz?

Es werden drei spezifische Algorithmen eingesetzt: Naiver Bayes, Logistische Regression und Lineare Support Vector Maschine, unterstützt durch Scikit-Learn zur Evaluierung.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die theoretischen Grundlagen, die systematische Datenaufbereitung des Sentiment140-Datensatzes sowie die Modellbildung und deren detaillierte Leistungsbewertung.

Welche Begriffe charakterisieren die Arbeit?

Wichtige Begriffe sind Sentimentanalyse, Klassifikationsalgorithmen, Trainings- und Testdaten, Precision, Recall und die automatische Merkmalsextraktion.

Warum wird Twitter als Datenquelle genutzt?

Twitter dient als Beispiel für eine Plattform mit einer großen Menge unstrukturierter, meinungsbasierter Texte, die für Unternehmen hochgradig relevant für das Reputationsmanagement sind.

Welches Modell schnitt in den Tests am besten ab?

Die logistische Regression erzielte mit 79% den höchsten F1-Score, während das Naive-Bayes-Modell durch eine sehr schnelle Trainingszeit überzeugte.

Welche Rolle spielt die Datenvorverarbeitung?

Die Vorverarbeitung ist essenziell, um durch Methoden wie Lemmatisierung und das Entfernen von Links oder Benutzernamen eine vergleichbare Datenbasis für die Algorithmen zu schaffen.

Excerpt out of 21 pages  - scroll top

Details

Title
Sentimentanalyse. Entwicklung eines Modells zur Stimmungserkennung in Tweets
College
University of Applied Sciences Stuttgart
Grade
1,7
Author
Julian Springer (Author)
Publication Year
2020
Pages
21
Catalog Number
V946230
ISBN (eBook)
9783346285775
ISBN (Book)
9783346285782
Language
German
Tags
sentiment analyse entwicklung modells stimmungserkennung tweets
Product Safety
GRIN Publishing GmbH
Quote paper
Julian Springer (Author), 2020, Sentimentanalyse. Entwicklung eines Modells zur Stimmungserkennung in Tweets, Munich, GRIN Verlag, https://www.grin.com/document/946230
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  21  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint