Masterarbeit, 2022
101 Seiten, Note: 1,3
Die vorliegende Arbeit befasst sich mit der Untersuchung der Datenqualität im Kontext von maschinellem Lernen. Ziel ist es, ein umfassendes Verständnis der Datenqualitätsdefekte im Bereich des maschinellen Lernens zu erlangen und die gängigen Methoden zur Behebung dieser Defekte zu analysieren. Die Arbeit widmet sich der systematischen Recherche und Analyse von relevanten wissenschaftlichen Publikationen zu diesem Thema.
Die Arbeit konzentriert sich auf die Analyse der Datenqualität im Kontext von maschinellem Lernen. Sie behandelt wichtige Themen wie Datenqualitätsdefekte, Datenqualitätsdimensionen, Adressierungsmethoden, maschinelle Lernverfahren und die Bewertung der Wirksamkeit verschiedener Methoden zur Verbesserung der Datenqualität.
Die vier am häufigsten untersuchten Dimensionen sind Genauigkeit (Accuracy), Vollständigkeit (Completeness), Konsistenz (Consistency) und Aktualität (Currency).
Defekte wie fehlende Werte oder Labels können zu verzerrten Modellen führen, die ungenaue oder falsche Vorhersagen treffen.
Ein Defekt der Dimension Accuracy, bei dem eine Klasse in den Trainingsdaten stark unterrepräsentiert ist, was die Erkennungsrate dieser Klasse verschlechtert.
Hier werden Adressierungsmethoden der Dimension Currency eingesetzt, um sicherzustellen, dass das Modell mit zeitnahen Informationen arbeitet oder regelmäßig aktualisiert wird.
Nur mit qualitativ hochwertigen Daten können Machine-Learning-Verfahren valide Erkenntnisse liefern, die effektive und faktenbasierte Entscheidungen ermöglichen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

