Diplomarbeit, 2022
83 Seiten, Note: 1,7
1. Einleitung
1.1. Ziel des Projekts
1.2. Abgrenzung
1.3. Was ist Cheersport
2. Grundlagen
2.1. Maschinelles Lernen
2.1.1. Supervised Learning
2.1.2. Unsupervised Learning
2.1.3. Reinforcement Learning
2.2. Neuronale Netze
2.3 Deep Learning
2.4 Faltende neuronale Netze
2.5 Object Detection, Pose Estimation und Action Recognition im Bereich der Computer Vision
3 Research
3.1 Analyse bestehender Technologien
3.1.1 Xbox Kinect
3.1.2 Datensätze
3.1.3 Bibliotheken
3.1.4 Evaluation
3.1.5 Herangehensweisen
4 Entwicklung des Prototyps
4.1 Anforderungen
4.2 Architektur
4.3 Sammeln der Daten
4.4 Feature-Extrahierung und Beschriftung
4.5 Erstellung des Modells
4.6 Ergebnis
4.7 Testen des Vorhersagemodells
4.7.1 Test 1 – korrekte Ausführung der Motions
4.7.2 Test 2 – Inkorrekte Ausführung der Motions
4.7.3 Test 3 – Ausführung mit offenen Handflächen
4.7.4 Test 4 – Langsame Ausführung
5 Fazit
5.1 Auswertung der Ergebnisse
5.2 Lessons Learned
5.3 Ausblick
Das Ziel der Arbeit ist die Entwicklung eines Prototyps für eine Software, die mittels KI-basierter Bewegungserkennung die Ausführung und Synchronität von spezifischen Bewegungsabläufen (Motions) im Cheerleading analysiert. Die Forschungsfrage untersucht dabei, ob ein entsprechendes Modell in der Lage ist, korrekte von inkorrekten Ausführungen sowie zeitliche Abweichungen im Einzeltraining zuverlässig zu erkennen.
2.4 Faltende neuronale Netze
Neuronale Netze zeichnen sich darin aus, dass sie den Menschen bei der Erkennung von Bildern oder Objekten mittlerweile in der Vorhersagegenauigkeit sowie in der Geschwindigkeit übertreffen. Die dazu verwendeten Strukturen sind jedoch keine gewöhnlichen neuronale Netze, sondern so genannte „faltende“ neuronale Netze (Convolutional Neural Networks, kurz CNN), die ihren Namen der Faltungen (mathematische Funktionen) wegen besitzen. Hierbei sind die Neuronen des künstlichen neuronalen Netzes ähnlich wie die Frontallappen des menschlichen Gehirns angeordnet.
Die künstlichen Neuronen sind demzufolge so angeordnet, wie die Neuronen in dem Gebiet des Gehirns, das für die Verarbeitung visueller Reize zuständig ist. Diese Anordnungen werden Faltungsschichten genannt.
Die Eingabe einer Faltungsschicht (oder auch Convolutionslayer) besteht bei einem Bild aus einer zweidimensionalen Eingabe (Höhe x Breite), sowie einem Farbkanal (zum Beispiel RGB). Daraus ergibts sich ein Bild mit den Maßen m * m * r. Hierbei entspricht m der Höhe und Breite des Bildes und r der Anzahl der Kanäle, die es enthält. Bei einem RGB-Bild würde r = 3 Kanälen, nämlich Rot, Grün und Blau entsprechen.
Mit Hilfe von Features werden nun die Eingangsinformationen gefiltert, indem die Features auf einen Bildausschnitt ausgerichtet werden und jedes Bildpixel mit dem zugehörigen Feature-pixel multipliziert wird. Das daraus resultierende Produkt werden dann miteinander addiert und durch die Gesamtzahl der Pixel des Features dividiert.
1. Einleitung: Beschreibt die Relevanz von Synchronität im Cheerleading und begründet die Entwicklung einer Software zur Unterstützung des Einzeltrainings während der Pandemie.
2. Grundlagen: Vermittelt theoretische Kenntnisse über KI, maschinelles Lernen, neuronale Netze sowie spezifische Methoden wie CNNs und Computer-Vision-Techniken.
3 Research: Analysiert technologische Alternativen wie die Xbox Kinect und verschiedene Open-Source-Bibliotheken zur Etablierung einer geeigneten Lösung.
4 Entwicklung des Prototyps: Dokumentiert den praktischen Aufbau, die Datenerhebung durch MediaPipe, das Training des CNN-Modells und die Durchführung verschiedener Validierungstests.
5 Fazit: Bewertet die erreichten Ergebnisse anhand der definierten Anforderungen und reflektiert über Optimierungsmöglichkeiten sowie zukünftige Entwicklungen.
Cheerleading, Motion Detection, Computer Vision, Maschinelles Lernen, Neuronale Netze, Convolutional Neural Networks, CNN, Pose Estimation, Action Recognition, MediaPipe, OpenCV, TensorFlow, Prototyp, Synchronität, Bewegungserkennung
Die Arbeit befasst sich mit der Entwicklung einer Software, die mithilfe von maschinellem Lernen ausgewählte Bewegungsabläufe im Cheersport analysiert.
Die Arbeit verbindet Sportwissenschaft mit Informatik, insbesondere durch den Einsatz von Computer Vision und neuronalen Netzen zur automatisierten Bewegungskontrolle.
Ein Prototyp zu entwickeln, der erkennt, ob Bewegungen wie „High-V“ oder „Clean“ korrekt oder inkorrekt ausgeführt werden, um Athleten im Einzeltraining zu unterstützen.
Es wird ein Deep-Learning-Ansatz verfolgt, bei dem ein Convolutional Neural Network (CNN) mit Videodaten trainiert, ausgewertet und validiert wird.
Der Hauptteil gliedert sich in eine theoretische fundierte Grundlagenanalyse, eine Marktrecherche für Technologien und die detaillierte Beschreibung der Software-Implementierung.
Die Arbeit lässt sich primär über Begriffe wie Motion Detection, Deep Learning, Cheerleading und Computer Vision definieren.
MediaPipe erwies sich als effizient, da es sowohl Gelenkpunkte als auch Gesichts- und Handmerkmale in Echtzeit verarbeiten kann, was für die präzise Analyse der „Motions“ entscheidend ist.
Das Modell zeigt Fragilität bei der Unterscheidung ähnlicher Bewegungen und bei der Erkennung langsamer Ausführungen, was auf die Notwendigkeit größerer und qualitativ hochwertigerer Datensätze hindeutet.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

