Im Rahmen dieser Arbeit zum Thema Big Data Analytics werden verschiedene Anwendungsbereiche des Machine Learnings aufgezeigt. Beginnend mit einer kurzen Darlegung der wesentlichen Konzepte von Big Data und des MachineLearnings werden anschließend Applikationen dessen in den Bereichen Handelsstrategien,
Kreditscoring sowie Betrugserkennung vorgestellt. Außerdem erfolgt eine Anwendung der logistischen Regression sowie eines Entscheidungsbaums um ein binäres Model zur Klassifikation betrügerischer Daten zu konstruieren. Es konnte festgestellt werden, dass bei großen Datenmengen Machine Learning Methoden zur Analyse derer essentiell sind und großen Nutzen hinsichtlich der Erkennung von Mustern in den Daten stiften.
Inhaltsverzeichnis
1 Einleitung
2 Big Data Analytics und Machine Learning
2.1 Funktionsweise der Big Data Analytics
2.2 Machine Learning - Methoden und Funktion
2.2.1 Supervised Learning
2.2.2 Unsupervised Learning
2.2.3 Dimensionalitätsreduktion
2.2.4 Reinforcement Learning
2.2.5 Deep Learning
2.3 Anwendungsgebiete im Bereich Finance
2.3.1 Handelsstrategien
2.3.2 Kreditscoring
2.3.3 Betrugserkennung
2.3.4 Machine Learning in der praktischen Anwendung
3 Empirische Anwendung von Machine Learning zur Betrugserkennung
3.1 Datensatz
3.2 Vorgehensweise
3.3 Ergebnisse und Interpretation
4 Schluss
A Anhang A
B Anhang B
Zielsetzung & Themen
Die Arbeit untersucht das Potenzial von Big Data Analytics und Machine Learning im Finanzsektor, mit besonderem Fokus auf die Identifikation betrügerischer Kreditkartentransaktionen durch empirische Modellierung.
- Grundlagen von Big Data und Machine Learning Methoden
- Anwendungsfelder wie Handelsstrategien und Kreditscoring
- Empirische Anwendung von logistischer Regression und Entscheidungsbäumen
- Vergleich und Interpretation von Klassifikationsergebnissen
- Herausforderungen durch unausgeglichene Datensätze und Fehlklassifikationskosten
Auszug aus dem Buch
2.2.1 Supervised Learning
Um aus generierten Daten, welche dem Input entsprechen, einen Output zu erzeugen bedarf es allgemein einen Algorithmus, der einer Anordnung von Anweisungen entspricht. Jedoch ist zu berücksichtigen, dass es für spezielle Fragestellungen, wie bspw. Formen des Kundenverhaltens, keinen allgemeingültigen Algorithmus zur Entscheidungsfindung gibt. Um sich der Lösung zu Fragestellungen dieser Art anzunähern, fungieren bereits zuvor generierte, strukturierte Daten, in welchen dem Input bereits konkrete Output-Werte zugeordnet sind als Trainingsdatensatz für den Computer (Alpaydın, 2014, S.1 f.,S.9). Im Prinzip des Supervised Learnings erlernt das System nun Muster in der Zuordnung zu erkennen, um zukünftig auf Basis neuer Input-Daten den korrekten Output zu ermitteln.
Dem dabei entwickelten Modell ist es nach Abschluss des Trainingsprozesses möglich, Prognosen für die Zukunft zu erstellen (Alpaydın, 2014, S.5,S.11). Stets zu berücksichtigen gilt hierbei das Thema Noise, das eine Anomalie im Trainingsset darstellt und somit komplexere Modelle erfordert oder bei einfachen Modellen vermeintlich zu Fehlern führen kann (Alpaydın, 2014, S.30). Noise entspricht Abweichungen in den Daten die sich bspw. durch falsch zugrundegelegte Werte ergeben können (Maes et al., 2002, S.2).
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Relevanz von KI und Machine Learning im Finanzbereich ein und erläutert die methodische Vorgehensweise der Arbeit.
2 Big Data Analytics und Machine Learning: Dieses Kapitel legt die theoretischen Grundlagen von Big Data sowie die verschiedenen Machine Learning Verfahren und deren Anwendung im Finanzwesen dar.
3 Empirische Anwendung von Machine Learning zur Betrugserkennung: Hier wird die praktische Umsetzung von logistischer Regression und Entscheidungsbäumen zur Klassifikation von Kreditkartentransaktionen anhand eines Datensatzes beschrieben.
4 Schluss: Das Kapitel fasst die zentralen Erkenntnisse der Arbeit zusammen und bewertet die Eignung der untersuchten Modelle für die Praxis.
Schlüsselwörter
Big Data, Machine Learning, Finance, Kreditscoring, Betrugserkennung, logistische Regression, Entscheidungsbaum, Klassifikation, Prognosegenauigkeit, Handelsstrategien, Datensatz, Algorithmus, Datenanalyse, Training, Validierung
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit analysiert, wie moderne Methoden des Machine Learning und Big Data in der Finanzbranche eingesetzt werden können, um Prozesse zu automatisieren und Entscheidungen zu verbessern.
Welche Themenfelder stehen im Mittelpunkt?
Zentrale Themen sind Handelsstrategien, Kreditscoring, Betrugserkennung sowie die theoretischen Grundlagen von Supervised und Unsupervised Learning.
Was ist das primäre Ziel der Untersuchung?
Ziel ist es, das Potenzial von Machine Learning aufzuzeigen und durch eine empirische Fallstudie zur Betrugserkennung bei Kreditkarten praktisch zu validieren.
Welche wissenschaftlichen Methoden kommen zum Einsatz?
Die Arbeit nutzt Literaturanalysen zu Machine Learning Algorithmen sowie eine empirische Anwendung der logistischen Regression und von Entscheidungsbäumen mittels der Statistiksoftware R.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine theoretische Einführung in ML-Methoden und eine empirische Analyse, in der verschiedene Klassifikationsmodelle zur Identifikation von Betrugsdaten getestet und verglichen werden.
Welche Schlüsselwörter charakterisieren die Publikation?
Die Arbeit lässt sich primär über Begriffe wie Big Data Analytics, Machine Learning, Kreditkartenbetrug, logistische Regression und Klassifikationsmodelle definieren.
Welche Bedeutung hat das Problem der unausgeglichenen Daten?
Da Betrugstransaktionen im Datensatz selten sind, führt eine hohe Prognosegenauigkeit oft zur fälschlichen Klassifizierung von Betrug als legitim, was für Banken hohe Kosten verursachen kann.
Warum wurde die logistische Regression und der Entscheidungsbaum verglichen?
Beide Verfahren eignen sich für binäre Klassifikationsprobleme, wobei der Vergleich aufzeigen sollte, welches Modell bei der Identifikation von betrügerischen Transaktionen effizienter arbeitet.
- Arbeit zitieren
- Miriam Wastl (Autor:in), 2018, Big Data Analytics and Machine Learning in Finance, München, GRIN Verlag, https://www.grin.com/document/491316