Bachelorarbeit, 2022
55 Seiten, Note: 1
Die vorliegende Bachelorarbeit befasst sich mit der Anwendung von Data Mining-Techniken zur Vorhersage von Brustkrebs. Das Ziel dieser Arbeit ist es, die Performance verschiedener Machine Learning-Algorithmen im Kontext der Brustkrebsvorhersage zu vergleichen. Die Arbeit analysiert das Wisconsin Breast Cancer Dataset und untersucht die Genauigkeit von KNN, Support Vector Machine und Entscheidungsbaum bei der Klassifizierung von Brustkrebstypen.
Die Arbeit beginnt mit einer Einleitung, die die Relevanz von Brustkrebsvorhersage und Data Mining im Gesundheitswesen hervorhebt. Der theoretische Hintergrund umfasst eine detaillierte Beschreibung von Brustkrebs, seinen Risikofaktoren und der Bedeutung von Früherkennung. Es wird ein Überblick über Data Mining-Methoden, insbesondere Klassifikationsalgorithmen, gegeben, und relevante Forschungsarbeiten im Bereich der Brustkrebsvorhersage werden zusammengefasst. Die Methodik beschreibt die verwendeten Daten, die Vorverarbeitungsschritte, die Feature Selection und das Hyperparameter-Tuning der Modelle. Die Ergebnisse der Analyse werden für jeden Algorithmus präsentiert und diskutiert. Schließlich wird die Arbeit mit einem Fazit abgeschlossen, das die wichtigsten Ergebnisse und Schlussfolgerungen zusammenfasst.
Brustkrebs, Data Mining, Machine Learning, Klassifikation, KNN, Support Vector Machine, Entscheidungsbaum, Wisconsin Breast Cancer Dataset, Feature Selection, Hyperparameter Tuning, Genauigkeit, Mortalitätsrate, Früherkennung, Gesundheitswesen.
Durch Algorithmen des maschinellen Lernens können große Mengen medizinischer Daten analysiert werden, um Muster zu erkennen, die auf bösartige Tumore hindeuten.
Die Arbeit vergleicht die Leistung von K-Nearest Neighbors (KNN), Support Vector Machine (SVM) und Entscheidungsbäumen.
Ein öffentlich verfügbares Datenset der UCI, das Merkmale von Zellkernen enthält, die aus Biopsien gewonnen wurden, und zur Klassifizierung von Tumoren dient.
Die Feature Selection wählt nur die relevantesten Merkmale für die Analyse aus, was die Genauigkeit (Accuracy) der Vorhersage oft verbessert und die Rechenlast senkt.
Es dient dazu, die Einstellungen der Algorithmen so zu optimieren, dass sie die bestmögliche Vorhersagegenauigkeit für das spezifische Datenset erreichen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

