Bearbeitung und Auswertung von Tick-Daten


Seminararbeit, 2010

21 Seiten, Note: 1,7


Leseprobe

Inhalt

1. Motivation und Themenstellung

2. Theorie
2.1 Theorie zu Tick-Daten
2.2 Theorie zu ,time sampling'
2.2.1 Tick based time sampling
2.2.2 Calendar time sampling
2.2.3 Transcation based time sampling

3. Methodik
3.1 Vorgehensweise
3.2 Vorstellung der erstellten, generischen Funktionen
3.2.1 Funktionen zur Anpassung und Bereinigung des Datensatzes
3.2.2 Funktionen zur weiteren Bearbeitung und für zusätzliche Ergebnisse

4. Ergebnisse

5. Fazit und Zusammenfassung

6. Anhang
6.1 Verwendeter R-Code

1. Motivation und Themenstellung

Diese Arbeit beschäftigt sich mit der Bearbeitung und der Auswertung von Tick­Daten. Es geht hauptsächlich darum, die Rohdaten mithilfe von Funktionen zu bearbeiten, die im Anschluss auch für vergleichbare Datensätze wieder verwendet werden können. Unter anderem werden die Datenreihen harmonisiert, Ausreißer gelöscht und zusätzliche Daten errechnet.

Anschließend werden die Daten ausgewertet, graphisch präsentiert, Besonderhei­ten hervorgehoben sowie sonstige Fragen beantwortet.

2. Theorie

Zu Beginn wird kurz auf die Theorie eingegangen. Dies wurde in der Themenstel­lung gewünscht, allerdings gibt es aufgrund weniger umfangreicher Quellen nur einen kurzen Einblick.

2.1 Theorie zu Tick-Daten

Für Tickdaten gibt es verschiedene Definitionen. Eine Möglichkeit lautet:

„Als Tickdaten bezeichnet man die vollständige, nicht-aggregierte Aufstellung aller Preise eines Wertpapiers, die innerhalb eines Handelstages zutande kom­men. Diese Preise werden entweder im vollelektronischen Handelssystem Xetra® automatisch gebildet oder im Präsenzhandel vom Skontroführer festge­stellt. "[1]

2.2 Theorie zu ,time sampling'

Zum ,time sampling' sollen nun kurze Beschreibungen gegeben werden, aller­dings ist es wegen dünner Quellenlage schwer hier umfangreiche, allgemeine De­finitionen zu finden.

2.2.1 Tick based time sampling

Tick Time Sampling (TTS): basiert auf Preisveränderungen (Angebot an der Bör­se), eine Aufteilung die äquidistant in Bezug auf die Ticks ist.

2.2.2 Calendar time sampling

Calendar Time Sampling [Abbildung in dieser Leseprobe nicht enthalten], eine Aufteilung, die zeitlich äquidistant ist.

2.2.3 Transcation based time sampling

Transaction Time Sampling (TTS) sammelt die Abfolge der Preise P unter Beach­tung der Transaktionen.

3. Methodik

Nach der Theorie folgt nun die Beschreibung der Methodik. Zuerst wird die all­gemeine Vorgehensweise der Datenbearbeitung beschrieben, im Anschluss wer­den die programmierten Funktionen vorgestellt; welchen Zweck erfüllen sie, wel­che Besonderheiten haben sie und was muss man beachten.

3.1 Vorgehensweise

Ausgangspunkt des Projektes sind zwei Datenreihen mit Datum/Zeit und Bid- bzw. Ask-preisen für jeden Tick über 6 Tage (175.964 bzw. 175.965 Beobachtun­gen) im .csv-Format. Damit kann man die später beschriebenen Funktionen für alle vergleichbaren Daten verwenden. Der erste Schritt muss folglich sein, die Daten in R einzulesen, die beiden Tabellen bezüglich ihrer Datumsspalte anzupas­sen (d.h. sicherstellen, dass in beiden Tabellen in jeder Zeile jeweils der gleiche Wert ist) und die gleiche Anzahl von Reihen in beiden Datensätzen zu erhalten. Hat man nun einen solchen Datensatz (3 Spalten: Datum, ask-price, bid-price) kann die weitere Verarbeitung folgen. Extreme Ausreißer sollen gelöscht, Mittel­werte sowie die Spreads zwischen Bid- und Ask-price eingefügt werden.

Ein weiteres Problem sind mehrere Zeilen mit genau derselben ,Sekunde'. Sollten mehrere Ticks pro Sekunde aufgetaucht sein, soll jeweils nur der letzte stehen bleiben. Nach der Theorie wird es dadurch begründet, dass nur der letzte Preis gültig ist, bis der nächste Tick eintritt.

Schließlich können in weiteren Schritten die Returns und die Duration berechnet werden sowie der Datensatz in Stundenschritte unterteilt, bevor dann am Ende die Ergebnisse präsentiert werden, graphisch und anhand deskriptiver Statistik.

3.2 Vorstellung der erstellten, generischen Funktionen

Im Zuge der Bearbeitung wurde eine Reihe von Funktionen erstellt, die soweit wie möglich generisch gehalten wurden. Dies bedeutet, dass sie selbstverständlich auch für zukünftige Bearbeitungen von vergleichbaren Datensätzen verwendet werden können (unverändert oder mit leichten Modifikationen).

3.2.1 Funktionen zur Anpassung und Bereinigung des Datensatzes

Hierunter fallen die Funktionen, die, wie oben beschrieben, die Datensätze berei­nigen und sie vorbereiten auf die folgende Bearbeitung. Im Einzelnen sind es die folgenden Funktionen.

- fit_nrow_fun (ds1, ds2)

Als ersten Schritt formatiert die Funktion (fit_nrow_fun) die Datumsspalten in das posix-Format und passt die Anzahl der Reihen der beiden Datensätze an. Hierzu ist zu sagen, dass folgende Theorie dahinter steht: Ist in einem der beiden Daten­sätze beispielsweise eine Zeile mehr als in dem anderen, so ist es wahrscheinlich, dass einfach irgendwo eine Zeile ,zu viel' ist (In diesem Fall wäre es fahrlässig, einfach alle Zeilen zu löschen, in denen die Zeitspalte nicht übereinstimmt, so würden vermutlich viel zu viele Zeilen gelöscht; und auch wenn dies nicht der Fall ist, so löscht man auf diese Weise auch nicht zu viel und kann immer noch später die ,delete_fun'-Funktion anwenden). Die erste Zeile mit fehlender Über­einstimmung wird gesucht und gelöscht. Die Prozedur wird solange wiederholt, bis die Anzahl der Zeilen übereinstimmt (sollten mehr als eine Zeile Unterschied bestehen). Umsetzung mithilfe einer while()-Funktion, solang nrow(ds1) ungleich nrow(ds2) ist und zwei if()-Funktionen, ob nrow (ds1) größer oder kleiner als nrow(ds2) ist.

Das Resultat der Funktion ist ein zusammengefügter Datensatz mit natürlich gleich viel Zeilen in den Bid- und den Ask-Preisen.

[...]


[1] Gefunden unter http://www.awd.de/awdde/de/home/service/finanzlexikon.html, aufgerufen am 13.07.2010

Ende der Leseprobe aus 21 Seiten

Details

Titel
Bearbeitung und Auswertung von Tick-Daten
Hochschule
Katholische Universität Eichstätt-Ingolstadt  (Wirtschaftswissenschaftliche Fakultät Ingolstadt - WFI)
Veranstaltung
Programmieren statistischer Algorithmen mit R
Note
1,7
Autor
Jahr
2010
Seiten
21
Katalognummer
V174164
ISBN (eBook)
9783640946525
ISBN (Buch)
9783640946327
Dateigröße
1201 KB
Sprache
Deutsch
Schlagworte
bearbeitung, auswertung, tick-daten, Programmieren mit R
Arbeit zitieren
Jan Reichenberger (Autor:in), 2010, Bearbeitung und Auswertung von Tick-Daten, München, GRIN Verlag, https://www.grin.com/document/174164

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Bearbeitung und Auswertung von Tick-Daten



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden