Diese Arbeit beschäftigt sich mit der Bearbeitung und der Auswertung von Tick-Daten. Es geht hauptsächlich darum, die Rohdaten mithilfe von Funktionen zu bearbeiten, die im Anschluss auch für vergleichbare Datensätze wieder verwendet werden können. Unter anderem werden die Datenreihen harmonisiert, Ausreißer gelöscht und zusätzliche Daten errechnet.
Anschließend werden die Daten ausgewertet, graphisch präsentiert, Besonderhei-ten hervorgehoben sowie sonstige Fragen beantwortet.
Inhaltsverzeichnis
- 1. Motivation und Themenstellung
- 2. Theorie
- 2.1 Theorie zu Tick-Daten
- 2.2 Theorie zu „time sampling“
- 2.2.1 Tick based time sampling
- 2.2.2 Calendar time sampling
- 2.2.3 Transaction based time sampling
- 3. Methodik
- 3.1 Vorgehensweise
- 3.2 Vorstellung der erstellten, generischen Funktionen
- 3.2.1 Funktionen zur Anpassung und Bereinigung des Datensatzes
- 3.2.2 Funktionen zur weiteren Bearbeitung und für zusätzliche Ergebnisse
- 4. Ergebnisse
- 5. Fazit und Zusammenfassung
Zielsetzung und Themenschwerpunkte
Diese Arbeit verfolgt das Ziel, Tick-Daten mithilfe von in R programmierten Funktionen zu bearbeiten und auszuwerten. Die entwickelten Funktionen sollen generisch sein und für zukünftige Analysen vergleichbarer Datensätze wiederverwendbar sein. Die Analyse umfasst die Harmonisierung der Datenreihen, das Entfernen von Ausreißern, die Berechnung zusätzlicher Daten und die anschließende Auswertung mit graphischer Darstellung.
- Bearbeitung und Auswertung von Tick-Daten
- Entwicklung generischer R-Funktionen zur Datenvorbereitung
- Harmonisierung und Bereinigung von Datenreihen
- Graphische Darstellung und deskriptive Statistik der Ergebnisse
- Anwendung verschiedener Time-Sampling-Methoden
Zusammenfassung der Kapitel
1. Motivation und Themenstellung: Dieses Kapitel beschreibt die Zielsetzung der Arbeit, die in der Bearbeitung und Auswertung von Tick-Daten besteht. Es wird betont, dass die entwickelten Funktionen für die spätere Wiederverwendung bei ähnlichen Datensätzen konzipiert sind. Die Datenverarbeitung umfasst die Harmonisierung der Reihen, die Beseitigung von Ausreißern und die Berechnung zusätzlicher Daten, gefolgt von der Auswertung und der graphischen Präsentation der Ergebnisse.
2. Theorie: Dieses Kapitel bietet einen kurzen Überblick über die relevanten Theorien zu Tick-Daten und Time Sampling Methoden. Aufgrund begrenzter Quellenlage ist der Einblick eher knapp gehalten. Es werden verschiedene Definitionen von Tick-Daten erläutert und die verschiedenen Time-Sampling-Methoden (Tick based, Calendar based und Transaction based) kurz vorgestellt und ihre Unterschiede skizziert. Der Fokus liegt auf der notwendigen theoretischen Grundlage für die folgenden methodischen Schritte.
3. Methodik: Dieses Kapitel beschreibt die Vorgehensweise bei der Datenbearbeitung. Zuerst wird die allgemeine Vorgehensweise erläutert, gefolgt von einer detaillierten Vorstellung der erstellten R-Funktionen. Die Funktionen dienen der Anpassung und Bereinigung des Datensatzes, um ihn für die weitere Analyse vorzubereiten. Es wird die Funktion `fit_nrow_fun` detailliert beschrieben, welche die Datenmengen anpasst und das `posix`-Format formatiert. Die Kapitel beschreibt wie Ausreißer behandelt und Mittelwerte sowie Spreads berechnet werden. Weiterhin wird die Vorgehensweise bei der Behandlung von mehreren Ticks pro Sekunde erklärt und die Berechnung von Returns und Duration sowie die Unterteilung des Datensatzes in Stundenschritte beschrieben.
4. Ergebnisse: Dieses Kapitel präsentiert die Ergebnisse der Datenanalyse und -auswertung, ohne jedoch die konkreten Ergebnisse detailliert darzustellen um Spoiler zu vermeiden. Es wird angedeutet, dass die Ergebnisse sowohl graphisch als auch mittels deskriptiver Statistik präsentiert werden.
Schlüsselwörter
Tick-Daten, Time Sampling, R, Datenanalyse, Datenbereinigung, generische Funktionen, Datenharmonisierung, Ausreißer, deskriptive Statistik, graphische Darstellung, Bid-Ask-Spread, Returns, Duration.
Häufig gestellte Fragen (FAQ) zu: Bearbeitung und Auswertung von Tick-Daten mit R
Was ist das Thema dieser Arbeit?
Diese Arbeit befasst sich mit der Bearbeitung und Auswertung von Tick-Daten mithilfe von in R programmierten, generischen Funktionen. Das Ziel ist die Entwicklung wiederverwendbarer Funktionen für zukünftige Analysen ähnlicher Datensätze. Die Analyse umfasst Datenharmonisierung, Ausreißerentfernung, Berechnung zusätzlicher Daten und die anschließende Auswertung mit graphischer Darstellung.
Welche Arten von Time-Sampling-Methoden werden behandelt?
Die Arbeit behandelt verschiedene Time-Sampling-Methoden, darunter Tick based, Calendar based und Transaction based Time Sampling. Es wird ein kurzer Überblick über die jeweiligen Methoden und deren Unterschiede gegeben.
Welche Funktionen wurden in R entwickelt?
Es wurden generische R-Funktionen entwickelt, die die Anpassung und Bereinigung des Datensatzes ermöglichen. Die Funktionen umfassen die Harmonisierung der Datenreihen, das Entfernen von Ausreißern, die Berechnung zusätzlicher Daten wie Mittelwerte, Spreads, Returns und Duration, sowie die Behandlung von mehreren Ticks pro Sekunde und die Unterteilung des Datensatzes in Stundenschritte. Die Funktion `fit_nrow_fun` zur Datenmengenanpassung und Formatierung im `posix`-Format wird detailliert beschrieben.
Wie ist die Arbeit strukturiert?
Die Arbeit gliedert sich in fünf Kapitel: 1. Motivation und Themenstellung, 2. Theorie (inkl. Theorie zu Tick-Daten und Time Sampling), 3. Methodik (inkl. Vorgehensweise und Beschreibung der entwickelten Funktionen), 4. Ergebnisse und 5. Fazit und Zusammenfassung. Ein Inhaltsverzeichnis bietet eine detaillierte Übersicht.
Welche konkreten Ergebnisse werden präsentiert?
Das Kapitel "Ergebnisse" präsentiert die Ergebnisse der Datenanalyse und -auswertung. Um Spoiler zu vermeiden, werden die konkreten Ergebnisse nicht detailliert dargestellt, es wird jedoch angedeutet, dass die Ergebnisse sowohl graphisch als auch mittels deskriptiver Statistik präsentiert werden.
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter sind: Tick-Daten, Time Sampling, R, Datenanalyse, Datenbereinigung, generische Funktionen, Datenharmonisierung, Ausreißer, deskriptive Statistik, graphische Darstellung, Bid-Ask-Spread, Returns, Duration.
Welche Zielsetzung verfolgt die Arbeit?
Die Arbeit zielt darauf ab, Tick-Daten effizient zu bearbeiten und auszuwerten, indem wiederverwendbare und generische R-Funktionen entwickelt werden. Die entwickelte Methodik soll für zukünftige Analysen vergleichbarer Datensätze anwendbar sein.
- Arbeit zitieren
- Jan Reichenberger (Autor:in), 2010, Bearbeitung und Auswertung von Tick-Daten, München, GRIN Verlag, https://www.grin.com/document/174164