Bachelorarbeit, 2023
73 Seiten, Note: 1,0
Die vorliegende Arbeit zielt darauf ab, einen Leistungsvergleich von pre-trained Deep Learning-Architekturen zur Echtzeit-Müdigkeitserkennung durchzuführen und dabei dasjenige Modell zu identifizieren, das sich am besten für diese Anwendung eignet.
2.2.1. Historischer Hintergrund
Die Entwicklungsgeschichte des Deep Learning lässt sich in drei Phasen gliedern. Der Zeitraum von etwa 1940 bis 1960 wird als Kybernetik bezeichnet, die Epoche von 1980 bis 1990 als Konnektionismus. Der erneute Aufschwung ab 2006 erhält die gebräuchliche Titulierung als Deep Learning (Goodfellow et al., 2016, S. 32). Im Folgenden soll die historische Darstellung näher erläutert werden.
Bereits in den 1830er Jahren, als der renommierte britische Mathematiker Charles Babbage das Konzept für seine mechanische Rechenmaschine Analytical Engine entwarf, wurden frühzeitige Überlegungen über eine mögliche Intelligenz von Maschinen angestellt (Lovelace, 1843, S. 21). In der Gegenwart stellt die Künstliche Intelligenz ein breites Forschungsgebiet dar. Maschinen sind in der Lage, kognitive Fähigkeiten zu demonstrieren. Hierzu zählen unter anderem die Fähigkeit zu Lernen, proaktive Interaktionen mit der Umgebung, Kompetenzen in Bezug auf Inferenz und Deduktion, visuelle Wahrnehmung, Spracherkennung sowie Problemlösungsfertigkeiten. Künstliche Intelligenz bezeichnet Aktivitäten, in denen intelligentes menschliches Verhalten von Maschinen simuliert wird (Gulli & Pal, 2017, S. 2). Alan Turing definierte eine Maschine dann als künstlich intelligent, wenn ein Mensch während seiner Interaktion mit eben dieser Maschine das Gefühl hätte, er würde mit einem anderen Menschen interagieren. Aus dieser Perspektive kann eine Maschine als intelligent bezeichnet werden, sodann sie menschliches Verhalten erfolgreich simuliert (Joshi, 2019, S. 4).
Der Begriff Maschine Learning (ML) wurde 1959 von Arthur Samuel im Kontext des Brettspiels Dame geprägt. Die Bezeichnung basiert auf einem Computerprogramm, das ein Verhalten ohne explizite Programmierung selbstständig erlernt. Ein derartiges System wurde erstmalig von Arthur Samuel entwickelt. Drei Faktoren gilt es bei der Programmierung einer künstlichen Intelligenz zu beachten: Das Programm benötigt genügend Daten für den Lernprozess. Des Weiteren ist eine Metrik notwendig, die die Differenz zwischen aktuellem Verhalten und gewünschtem Verhalten quantifiziert. Anschließend ist ein Feedbackmechanismus erforderlich, um den kalkulierten Fehler rückzuführen, damit das Programm im nächsten Durchlauf bessere Ergebnisse liefert. Die letztgenannten beiden Faktoren implizieren die Notwendigkeit tiefgreifender mathematischer Lösungen (Joshi, 2019, S. 4-5). Weiters ist die Performanz eines Maschine Learning Algorithmus wesentlich von der Repräsentation des Datensatzes abhängig. Im Datensatz enthaltene Informationen, die für die Lösung des Problems erforderlich sind, werden als Merkmale bezeichnet. In diesem Zusammenhang stellen Variationsfaktoren eine Schwierigkeit im maschinellen Lernen dar. Viele dieser Faktoren beeinflussen die zu observierenden Daten, weil der antrainierte Datensatz sich in Echtzeit-Applikationen oftmals von der Realität unterscheidet.
1 Einleitung: Die Einleitung führt in das Thema Müdigkeitserkennung ein, beleuchtet deren Relevanz im Kontext der Verkehrssicherheit und stellt die spezifische Problemstellung sowie die Forschungsfrage der Arbeit vor.
2 Theoretische Fundierung: Dieser Teil bietet eine umfassende Literaturübersicht zu Deep Learning, Machine Learning und neuronalen Netzen, insbesondere Convolutional Neural Networks (CNNs) und Transfer Learning, und bildet die Grundlage für das technische Verständnis der Arbeit.
3 Umsetzung des Experiments: Hier wird die experimentelle Durchführung detailliert beschrieben, einschließlich der Auswahl und des Trainings von Deep Learning-Modellen (VGG16, ResNet50, InceptionV3) auf dem MRL Eye Datensatz und deren Evaluierung zur Echtzeit-Müdigkeitserkennung.
4 Fazit: Das Fazit fasst die Ergebnisse des Leistungsvergleichs zusammen, bewertet die Erkenntnisse kritisch und gibt einen Ausblick auf zukünftige Forschungsrichtungen im Bereich der automatisierten Müdigkeitserkennung.
Deep Learning, Convolutional Neural Network (CNN), Transfer Learning, Müdigkeitserkennung, Echtzeiterkennung, Bildklassifikation, Neuronale Netze, VGG16, ResNet50, InceptionV3, Verkehrssicherheit, Maschinelles Lernen, Early Stopping, Konfusionsmatrix.
Diese Arbeit befasst sich grundsätzlich mit der Erforschung und dem Leistungsvergleich von vortrainierten Deep Learning-Architekturen zur automatisierten Erkennung von Müdigkeit in Echtzeit, um zur Reduzierung von ermüdungsbedingten Unfällen beizutragen.
Die zentralen Themenfelder umfassen Deep Learning, Convolutional Neural Networks (CNN) für die Bildklassifikation, Transfer Learning und die Identifizierung des Augenzustands (offen oder geschlossen) in Echtzeit.
Das primäre Ziel ist es, dasjenige pre-trained Deep Learning-Modell zu identifizieren, das sich am besten für die Müdigkeitserkennung in Echtzeit eignet. Die Forschungsfrage lautet: "Welche der analysierten pre-trained Deep Learning-Architekturen eignet sich am besten für eine Müdigkeitserkennung in Echtzeit?"
Es wird eine Kombination aus Literaturrecherche zur theoretischen Fundierung und einer experimentellen Untersuchung verwendet, bei der ausgewählte CNN-Modelle trainiert und evaluiert werden.
Der Hauptteil der Arbeit gliedert sich in eine theoretische Fundierung, die Deep Learning-Konzepte, neuronale Netze und Transfer Learning erläutert, sowie eine experimentelle Umsetzung, die das Training und die Evaluierung der Modelle zur Müdigkeitserkennung in Echtzeit umfasst.
Die Arbeit wird durch Schlüsselwörter wie Deep Learning, Convolutional Neural Network (CNN), Transfer Learning, Müdigkeitserkennung, Echtzeiterkennung, Bildklassifikation, Neuronale Netze, VGG16, ResNet50, InceptionV3, Verkehrssicherheit, Maschinelles Lernen, Early Stopping und Konfusionsmatrix charakterisiert.
InceptionV3 erbrachte im Test auf statische Abbildungen die beste Leistung mit einer Genauigkeit von 98 Prozent und zeigte auch in der Echtzeiterkennung, selbst unter schlechten Lichtverhältnissen, hervorragende Ergebnisse ohne merkliche Verzögerungen.
Für das Training der Modelle wurde der Media Research Lab (MRL) Eye Datensatz verwendet, welcher insgesamt 84.898 Bilder des menschlichen Auges von 37 unterschiedlichen Personen enthält.
Die Studie untersuchte die Leistung der Modelle unter verschiedenen Lichtverhältnissen; InceptionV3 zeigte in dieser Hinsicht die robusteste Leistung, während VGG16 bei sinkender Lichtqualität und ResNet50 generell unakkurat abschnitten.
Verglichen wurden VGG16, ResNet50 und InceptionV3, da diese als die bekanntesten und populärsten pre-trained Modelle im Bereich der Müdigkeitserkennung und Bildklassifikation gelten.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

