Bachelorarbeit, 2019
73 Seiten, Note: 1,0
Diese Bachelor-Thesis befasst sich mit der E-Mail-Klassifizierung in einem CRM-System anhand von Text Mining Analyseverfahren. Ziel ist die Entwicklung eines Prototypen, der die automatische Kategorisierung von E-Mails ermöglicht.
Die Einleitung stellt die Motivation und Problembeschreibung der Arbeit dar und beschreibt die Zielsetzung und den Ansatz der Forschung. Kapitel 2 behandelt den Stand von Wissenschaft und Technik mit Fokus auf Text Mining, Natural Language Processing, Textklassifizierung und relevanten Frameworks und Bibliotheken. Kapitel 3 widmet sich der technischen Umsetzung des Prototypen, einschließlich der Anforderungen, des Konzepts und der Implementierung. Kapitel 4 beinhaltet die Evaluation des Prototypen, die Teststrategie und die Analyse der Ergebnisse.
E-Mail Klassifizierung, CRM-System, Text Mining, Natural Language Processing, Machine Learning, Klassifikatoren, Frameworks, Bibliotheken, Evaluation, Prototyp, Prototyping, Analyse, Datenvorverarbeitung, Datenanalyse, Konfusionsmatrizen, Lernkurven, Resultate, Diskussion.
Mithilfe von Text Mining und Machine Learning werden E-Mails analysiert und basierend auf gelernten Mustern automatisch Kategorien in einem CRM-System zugeordnet.
NLP umfasst Methoden zur Verarbeitung natürlicher Sprache, wie Tokenisierung, Stemming (Wortstammreduktion) und das Entfernen von Stoppwörtern, um Texte für Algorithmen lesbar zu machen.
In der Arbeit werden insbesondere der Naive Bayes-Klassifikator und die lineare Support Vector Machine (SVM) hinsichtlich ihrer Genauigkeit und Performance verglichen.
TF-IDF steht für Term Frequency-Inverse Document Frequency. Es ist ein statistisches Maß, das angibt, wie wichtig ein Wort für ein Dokument in einer Sammlung von Dokumenten ist.
Der implementierte Prototyp nutzt Python-Bibliotheken wie Scikit-Learn, NLTK (Natural Language Toolkit) und NumPy sowie Frameworks wie Flask für das Web-Backend.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

