Cheerleading gehört zu den ästhetischen Teamsportarten, was bedeutet, dass auf Ausführung und Synchronität von Bewegungen besonders viel Wert gelegt wird. Während der Corona-Pandemie war es vielen Sportler:innen nicht möglich, gemeinsam mit ihrem Team zu trainieren. Die Idee ist es, eine Software zu entwickeln, die es den Athlet:innen ermöglicht, auch im Einzeltraining die gewünschte Synchronität zu erreichen.
Ziel dieser Arbeit ist es, einen Prototypen einer Software zu entwickeln, die es ermöglicht, vier Bewegungen (High-V, Low-V, T und Clean) in korrekter und inkorrekter Ausführung zu erkennen. Dazu muss zunächst auf die theoretischen Grundlagen des maschinellen Lernens eingegangen werden. Zudem werden die notwendigen Anforderungen an den Prototyp erhoben und ein Architekturbild erstellt. Für die Umsetzung des Prototyps werden die notwendigen Daten in Form von Videos gesammelt und für das Training des Modells aufbereitet. Anschließend wird das Vorhersagemodell in Form einer Convolutional Neuronal Networks trainiert. Nachdem die Trainingsergebnisse ausgewertet wurden, folgen Tests zu Validierung des Modells, mit dem Ziel herauszufinden, ob das Modell für eine Software zur Messung der Synchronität brauchbar ist.
Inhaltsverzeichnis
1. Einleitung
1.1. Ziel des Projekts
1.2. Abgrenzung
1.3. Was ist Cheersport
2. Grundlagen
2.1. Maschinelles Lernen
2.1.1. Supervised Learning
2.1.2. Unsupervised Learning
2.1.3. Reinforcement Learning
2.2. Neuronale Netze
2.3 Deep Learning
2.4 Faltende neuronale Netze
2.5 Object Detection, Pose Estimation und Action Recognition im Bereich der Computer Vision
3 Research
3.1 Analyse bestehender Technologien
3.1.1 Xbox Kinect
3.1.2 Datensätze
3.1.3 Bibliotheken
3.1.4 Evaluation
3.1.5 Herangehensweisen
4 Entwicklung des Prototyps
4.1 Anforderungen
4.2 Architektur
4.3 Sammeln der Daten
4.4 Feature-Extrahierung und Beschriftung
4.5 Erstellung des Modells
4.6 Ergebnis
4.7 Testen des Vorhersagemodells
4.7.1 Test 1 – korrekte Ausführung der Motions
4.7.2 Test 2 – Inkorrekte Ausführung der Motions
4.7.3 Test 3 – Ausführung mit offenen Handflächen
4.7.4 Test 4 – Langsame Ausführung
5 Fazit
5.1 Auswertung der Ergebnisse
5.2 Lessons Learned
5.3 Ausblick
Zielsetzung & Themen
Das Ziel der Arbeit ist die Entwicklung eines Prototyps für eine Software, die mittels KI-basierter Bewegungserkennung die Ausführung und Synchronität von spezifischen Bewegungsabläufen (Motions) im Cheerleading analysiert. Die Forschungsfrage untersucht dabei, ob ein entsprechendes Modell in der Lage ist, korrekte von inkorrekten Ausführungen sowie zeitliche Abweichungen im Einzeltraining zuverlässig zu erkennen.
- Grundlagen der künstlichen Intelligenz, des maschinellen Lernens und neuronaler Netze.
- Analyse bestehender Computer-Vision-Technologien und relevanter Datensätze.
- Konzeption und technologische Umsetzung eines Deep-Learning-Modells (CNN).
- Datenerhebung und Feature-Engineering von Video-Input zur Bewegungsklassifizierung.
- Validierung und Testung des Prototyps anhand verschiedener Ausführungsszenarien.
Auszug aus dem Buch
2.4 Faltende neuronale Netze
Neuronale Netze zeichnen sich darin aus, dass sie den Menschen bei der Erkennung von Bildern oder Objekten mittlerweile in der Vorhersagegenauigkeit sowie in der Geschwindigkeit übertreffen. Die dazu verwendeten Strukturen sind jedoch keine gewöhnlichen neuronale Netze, sondern so genannte „faltende“ neuronale Netze (Convolutional Neural Networks, kurz CNN), die ihren Namen der Faltungen (mathematische Funktionen) wegen besitzen. Hierbei sind die Neuronen des künstlichen neuronalen Netzes ähnlich wie die Frontallappen des menschlichen Gehirns angeordnet.
Die künstlichen Neuronen sind demzufolge so angeordnet, wie die Neuronen in dem Gebiet des Gehirns, das für die Verarbeitung visueller Reize zuständig ist. Diese Anordnungen werden Faltungsschichten genannt.
Die Eingabe einer Faltungsschicht (oder auch Convolutionslayer) besteht bei einem Bild aus einer zweidimensionalen Eingabe (Höhe x Breite), sowie einem Farbkanal (zum Beispiel RGB). Daraus ergibts sich ein Bild mit den Maßen m * m * r. Hierbei entspricht m der Höhe und Breite des Bildes und r der Anzahl der Kanäle, die es enthält. Bei einem RGB-Bild würde r = 3 Kanälen, nämlich Rot, Grün und Blau entsprechen.
Mit Hilfe von Features werden nun die Eingangsinformationen gefiltert, indem die Features auf einen Bildausschnitt ausgerichtet werden und jedes Bildpixel mit dem zugehörigen Feature-pixel multipliziert wird. Das daraus resultierende Produkt werden dann miteinander addiert und durch die Gesamtzahl der Pixel des Features dividiert.
Zusammenfassung der Kapitel
1. Einleitung: Beschreibt die Relevanz von Synchronität im Cheerleading und begründet die Entwicklung einer Software zur Unterstützung des Einzeltrainings während der Pandemie.
2. Grundlagen: Vermittelt theoretische Kenntnisse über KI, maschinelles Lernen, neuronale Netze sowie spezifische Methoden wie CNNs und Computer-Vision-Techniken.
3 Research: Analysiert technologische Alternativen wie die Xbox Kinect und verschiedene Open-Source-Bibliotheken zur Etablierung einer geeigneten Lösung.
4 Entwicklung des Prototyps: Dokumentiert den praktischen Aufbau, die Datenerhebung durch MediaPipe, das Training des CNN-Modells und die Durchführung verschiedener Validierungstests.
5 Fazit: Bewertet die erreichten Ergebnisse anhand der definierten Anforderungen und reflektiert über Optimierungsmöglichkeiten sowie zukünftige Entwicklungen.
Schlüsselwörter
Cheerleading, Motion Detection, Computer Vision, Maschinelles Lernen, Neuronale Netze, Convolutional Neural Networks, CNN, Pose Estimation, Action Recognition, MediaPipe, OpenCV, TensorFlow, Prototyp, Synchronität, Bewegungserkennung
Häufig gestellte Fragen
Worum geht es in dieser Masterarbeit?
Die Arbeit befasst sich mit der Entwicklung einer Software, die mithilfe von maschinellem Lernen ausgewählte Bewegungsabläufe im Cheersport analysiert.
Welche zentralen Themenfelder stehen im Fokus?
Die Arbeit verbindet Sportwissenschaft mit Informatik, insbesondere durch den Einsatz von Computer Vision und neuronalen Netzen zur automatisierten Bewegungskontrolle.
Was ist das primäre Ziel des Projekts?
Ein Prototyp zu entwickeln, der erkennt, ob Bewegungen wie „High-V“ oder „Clean“ korrekt oder inkorrekt ausgeführt werden, um Athleten im Einzeltraining zu unterstützen.
Welche wissenschaftlichen Methoden werden angewendet?
Es wird ein Deep-Learning-Ansatz verfolgt, bei dem ein Convolutional Neural Network (CNN) mit Videodaten trainiert, ausgewertet und validiert wird.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in eine theoretische fundierte Grundlagenanalyse, eine Marktrecherche für Technologien und die detaillierte Beschreibung der Software-Implementierung.
Durch welche Schlüsselwörter lässt sich die Arbeit zusammenfassen?
Die Arbeit lässt sich primär über Begriffe wie Motion Detection, Deep Learning, Cheerleading und Computer Vision definieren.
Warum wurde MediaPipe Holistic für die Datenerfassung gewählt?
MediaPipe erwies sich als effizient, da es sowohl Gelenkpunkte als auch Gesichts- und Handmerkmale in Echtzeit verarbeiten kann, was für die präzise Analyse der „Motions“ entscheidend ist.
Welche Herausforderungen identifiziert die Autorin nach den Tests?
Das Modell zeigt Fragilität bei der Unterscheidung ähnlicher Bewegungen und bei der Erkennung langsamer Ausführungen, was auf die Notwendigkeit größerer und qualitativ hochwertigerer Datensätze hindeutet.
- Quote paper
- Swantje Schwantes (Author), 2022, Motion Detection als Evaluationsmethode von Bewegungsabläufen im Cheersport. Entwicklung einer Software zur Beurteilung der Synchronität, Munich, GRIN Verlag, https://www.grin.com/document/1249542