Die vorliegende Arbeit beschäftigt sich mit der Auswertung drei wesentlicher Methoden zur Analyse von Textmaterial. Diese Methoden stammen allesamt von Wissenschaftlern mit dem Ziel, zukünftig valide Prognosen über den Einfluss einer Neuveröffentlichung zu treffen. Die erste Ausarbeitung mit dem Titel „When is a Liability not a Liability? Textual analysis, Dictionairies, and 10-Ks“ (Loughran,
McDonald 2009) befasst sich mit der Auswertung von Texten mittels
Wörterbüchern. Die zweite Arbeit namens “Using news articles to predict stock price movements” (Gidófalvi 2001) untersucht den Einfluss von Finanz- und Unternehmensnachrichten auf 12 Aktienkurse des NASDAQ-Index. Dabei wird als Algorithmus der naive Bayes-Textklassifikator verwendet, der aufgrund seiner einfachen und praktischen Anwendbarkeit häufig von Wissenschaftlern zur Klassifizierung von Nachrichten benutzt wird. Schließlich beschäftigt sich die dritte Ausarbeitung mit dem Titel „Kursrelevanzprognose von Ad-hoc-Meldungen“ (Schulz, Spilipoulou, Winkler 2003) mit dem Einfluss mitteilungspflichtiger
Unternehmensnachrichten auf deren Aktienkurse, um zukünftige Prognosen vorherzusagen.

Das Ziel dieser Ausarbeitung ist die Analyse der konzeptionellen Vorgehensweise der drei Veröffentlichungen. Es soll dargelegt werden, wie die Methodik der Modelle als auch die Metrik der Auswertung der Ergebnisse bei allen drei Arbeiten sind. Dabei soll anhand der Systematiken anderer Wissenschaftler eine Beurteilung und
gegebenenfalls Erweiterung der einzelnen Modelle erfolgen.

Excerpt

Inhaltsverzeichnis

1 Einleitung

1.1 Das Wesen des Text Minings
1.2 Aufbau und Zielsetzung der Arbeit
1.3 Bisherige Literatur

2 When is a Liability not a Liability? Textual analysis, Dictionairies, and 10-Ks

2.1 Einführung
2.2 Analyse des Datensatzes

2.2.1 Schriftlicher Datensatz
2.2.2 Zeitraum des Datensatzes

2.3 Analyse der Evaluation

2.3.1 Erstellung der Wörterbücher
2.3.2 Analyse der Termgewichtung
2.3.3 Leistungsvergleich Fin-Neg Liste und Harvard Dictionary

2.4 Kritik am Aufbau der Arbeit
2.5 Zusammenfassung

3 Using News Articles to Predict Stock Price Movements

3.1 Einführung
3.2 Datensatz

3.2.1 Datenaufbereitung
3.2.2 Indikator zur Bestimmung der Bewegungsklassen

3.3 Anwendung des naiven Bayes-Textklassifikators
3.4 Auswertungsmetrik

3.4.1 Auswertung des Indikators der Bewegungsklassen
3.4.2 Auswertung der Gruppenzuordnung von Nachrichten
3.4.3 Auswertung des Zeitintervalls des Nachrichteneinflusses

3.5 Zusammenfassung

4 Kursrelevanzprognose von Ad-hoc-Meldungen

4.1 Einführung
4.2 Datenbasis

4.2.1 Ermittlung der Datenbasis
4.2.2 Beschränkte Datenbasis und Sample Selection Bias
4.2.3 Eingeschränkte Einsetzbarkeit

4.3 Kursrelevanz von Ad-hoc Meldungen

4.3.1 Ermittlung der Kursrelevanz von Ad-hoc Meldungen
4.3.2 Problem der Schätzung der erwarteten Rendite
4.3.3 Branchenübergreifende Bewertung und die Arbitrage Pricing Theorie
4.3.4 Die Verwendung von Intraday-Kursen als bessere Indikatoren

4.4 Klassifikation und Evaluation von Ad-hoc Meldungen

4.4.1 Vorgehensweise und Ergebnisse
4.4.2 Klassifikationsfehler als einziges Maß für die Güte des Modells
4.4.3 Problematische Klassifizierung nach Wahrscheinlichkeiten
4.4.4 Das Handelsvolumen als weiterer Indikator für Kursrelevanz

4.5 Zusammenfassung

Zielsetzung und Themenschwerpunkte

Diese Seminararbeit befasst sich mit dem Bereich des Text Minings, einem Teilgebiet des Data Minings, das sich mit der Extraktion von Informationen aus Texten beschäftigt. Die Arbeit analysiert verschiedene Ansätze des Text Minings und untersucht deren Anwendung in der Finanzwirtschaft.

Einsatz von Text Mining Methoden in der Finanzwirtschaft
Analyse von Finanzberichten und Nachrichten zur Vorhersage von Aktienkursbewegungen
Entwicklung und Evaluation von Algorithmen zur Textklassifizierung und Sentimentanalyse
Bewertung der Kursrelevanz von Ad-hoc-Meldungen
Herausforderungen und Chancen des Text Minings in der Finanzwelt

Zusammenfassung der Kapitel

Das erste Kapitel führt in das Thema Text Mining ein und erläutert die grundlegenden Konzepte und Anwendungsgebiete. Das zweite Kapitel untersucht die Verwendung von Text Mining zur Analyse von Finanzberichten, wobei ein Schwerpunkt auf der Identifizierung von Risiken und Chancen im Kontext von Bilanzierungsentscheidungen liegt. Das dritte Kapitel befasst sich mit der Vorhersage von Aktienkursbewegungen anhand von Nachrichtenartikeln, wobei der naive Bayes-Klassifikator als Text Mining-Tool eingesetzt wird. Im vierten Kapitel wird die Kursrelevanz von Ad-hoc-Meldungen analysiert und es werden verschiedene Ansätze zur Klassifizierung und Evaluation dieser Meldungen vorgestellt.

Schlüsselwörter

Text Mining, Data Mining, Finanzwirtschaft, Aktienkursvorhersage, Sentimentanalyse, Finanzberichtsanalyse, Ad-hoc-Meldungen, Bayes-Klassifikator, Kursrelevanz, Algorithmen, Evaluation, Datenbasis, Risikoanalyse, Chancenidentifikation.

Excerpt out of 54 pages - scroll top

Details

Title: Text Mining - Drei Methoden zur Textanalyse
College: University of Frankfurt (Main)
Grade: 1,7
Authors: Nicole Tode (Author), Tarek Abuzarour (Author), Fabian Lang (Author)
Publication Year: 2010
Pages: 54
Catalog Number: V202971
ISBN (eBook): 9783656293873
ISBN (Book): 9783656294610
Language: German
Tags: Text Mining Textanalyse Prognose von Aktienkursen Bayes-Textklassifikator Kursrelevanz von Ad-hoc Meldungen Havard Dictionary
Product Safety: GRIN Publishing GmbH

Quote paper: Nicole Tode (Author), Tarek Abuzarour (Author), Fabian Lang (Author), 2010, Text Mining - Drei Methoden zur Textanalyse, Munich, GRIN Verlag, https://www.grin.com/document/202971

Text Mining - Drei Methoden zur Textanalyse