Diplomarbeit, 2003
91 Seiten, Note: 1,3
1 Einleitung
1.1 Zielsetzung der Arbeit
1.2 Aufbau der Arbeit
2 Grundlagen des Data Mining
2.1 Data Mining
2.1.1 Einordnung des Begriffs Data Mining
2.1.2 Definition Data Mining
2.1.3 Data Mining als Prozess des Maschinellen Lernen
2.1.4 Beziehungsgefüge Data Mining und On-Line Analytical Processing
2.2 Text Mining
2.3 Web Mining
2.3.1 Informationen für das E-Business
2.3.2 Einsatzgebiete des Web Mining
3 Datenbasis
3.1 Informationsquellen
3.2 Datentypen
3.3 Data Warehouse
3.4 Betriebswirtschaftlicher Regelkreis
4 Funktionen und Ziele des Data Mining
4.1 Der Data Mining-Prozess
4.1.1 Vorverarbeitungsphase
4.1.2 Miningphase
4.1.3 Auswertungsphase
4.1.4 Text-/Web Mining-Prozess
4.2 Analysen und Aufgaben des Data Mining
4.2.1 Klassifizierung
4.2.2 Prognose
4.2.3 Assoziation
4.2.4 Segmentierung
4.2.5 Repräsentation
4.3 Methoden des Data Mining
4.3.1 Statistische Methoden
4.3.2 Entscheidungsbaumverfahren
4.3.3 Clusteranalyse
4.3.4 Künstliche Neuronale Netze (KNN)
4.3.5 Assoziationsmethoden
5 Einsatzgebiete von Data Mining
5.1 Data Mining im Customer Relationship Management
5.2 E-Commerce als Einsatzgebiet des Web Mining
5.3 Data Mining im Handel (Warenkorbanalyse)
6 Zusammenfassung und Fazit
Die vorliegende Diplomarbeit zielt darauf ab, den Prozess des Data Mining für den Leser transparent zu gestalten, dessen Anwendungspotenziale in innovativen Systemen zu erläutern und einen Ausblick auf zukünftige Anwendungsfelder zu geben.
2.1.1 Einordnung des Begriffs Data Mining
Im Begriff DM steckt das aus dem Bergbau stammende Wort „Mining“. Hierbei werden enorme Gesteinsmengen mit großem technologischem Aufwand maschinell abgebaut und aufbereitet, um Edelmetalle ans Tageslicht zu fördern. Ähnlich werden beim DM riesige Datenbestände mit speziellen Methoden/Tools durchforstet, um an neue Informationen oder Wissen zu gelangen. Die Ergebnisse, die durch das „Schürfen“ und „Graben“ der DM-Tools erzielt werden, werden in Anlehnung an frühere Goldgräberzeiten auch als „Knowledge Nuggets“ bzw. „Wissensbarren“ bezeichnet.
Die Tools entstammen Verfahren der Datenanalyse aus den Forschungsgebieten der Künstlichen Intelligenz, der Statistik, des Maschinellen Lernens und der Mustererkennung. Die Methoden aus diesen Gebieten haben die Aufgabe, aus riesigen Datenvolumina autonom aussagekräftige und nicht triviale Hypothesen zu generieren, ohne zuvor eine konkrete Fragestellung erhalten zu haben. Es wurde jedoch schnell klar, dass DM alleine noch kein Garant für ein solches Ergebnis ist. E. Thomsen schrieb in einem seiner Bücher: „… you need to know a lot about your data to mine successfully …“.
DM gilt daher als Intelligenzverstärker für die Mitarbeiter, die mit diesen Tools arbeiten. Daher wird in der Literatur von einem Wissensentdeckungsprozess gesprochen. Dieser Prozess des „Knowledge Discovery in Databases“ (KDD = Wissensentdeckung in Datenbanken) beinhaltet neben den DM-Methoden zunächst einmal die Aufgabendefinition und die Datenaufbereitung und nach der eigentlichen Anwendung der Analysetools die Ergebnisevaluation. DM ist somit im eigentlichen Sinne nur eine Maßnahme innerhalb des KDD-Prozesses, die bestimmte DM-Algorithmen/-Methoden beinhaltet, welche besondere Muster entdecken können. Die meisten Autoren – sowie auch der Verfasser dieser Arbeit – verwenden DM oder den DM-Prozess synonym zu KDD oder dem KDD-Prozess. Bei den Beschreibungen des Prozesses oder der Werkzeuge wird dabei vielfach auf die Literatur zu KDD zurückgegriffen.
1 Einleitung: Die Einleitung thematisiert den wachsenden Wettbewerbsdruck und die Notwendigkeit für Unternehmen, computergestützte Analysemethoden einzusetzen, um aus umfangreichen Kundendaten wertvolle Informationen zu generieren.
2 Grundlagen des Data Mining: Dieses Kapitel definiert Data Mining, Text Mining und Web Mining und bettet diese als Werkzeuge zur Wissensentdeckung (KDD) in betriebswirtschaftliche Kontexte ein.
3 Datenbasis: Hier werden die Quellen von unternehmensinternen und -externen Daten, verschiedene Datentypen sowie die Rolle des Data Warehouse und des betriebswirtschaftlichen Regelkreises beschrieben.
4 Funktionen und Ziele des Data Mining: Es erfolgt eine detaillierte Erläuterung des Data Mining-Prozesses, der Aufgabenbereiche wie Klassifizierung und Prognose sowie der mathematisch-technischen Methoden zur Mustererkennung.
5 Einsatzgebiete von Data Mining: Dieses Kapitel veranschaulicht den praktischen Nutzen von Data Mining in CRM-Systemen, E-Commerce-Umgebungen und durch Warenkorbanalysen im Handel.
6 Zusammenfassung und Fazit: Die Arbeit schließt mit einem Resümee über die Bedeutung von Data Mining als strategisches Instrument für Unternehmen zur Wissensgenerierung und kundenorientierten Prozessoptimierung.
Data Mining, Knowledge Discovery in Databases, KDD, Web Mining, Text Mining, Data Warehouse, Kundenbeziehungsmanagement, CRM, Customer Lifetime Value, Warenkorbanalyse, Klassifizierung, Prognose, Clusteranalyse, Künstliche Neuronale Netze, Entscheidungsbaumverfahren
Die Arbeit untersucht Data Mining als Komponente innovativer Systeme, wobei der Fokus auf der Wissensentdeckung aus großen Datenbeständen zur Unterstützung unternehmerischer Entscheidungen liegt.
Die zentralen Themen sind die theoretischen Grundlagen des Data Mining, der technische Datenaufbereitungsprozess, die methodische Analyse von Daten sowie die Anwendung dieser Verfahren in CRM, E-Commerce und Handel.
Das Ziel ist es, den Data Mining-Prozess transparent darzustellen und aufzuzeigen, wie Unternehmen durch den Einsatz dieser Methoden wettbewerbsfähig bleiben und Kundenbeziehungen personalisiert steuern können.
Es handelt sich um eine theoretische Arbeit, die sich auf die Literatur zu KDD, Data Mining-Algorithmen und betriebswirtschaftlichen Anwendungen stützt, um den Prozess von der Datenbasis bis zur Ergebnisimplementierung zu modellieren.
Der Hauptteil behandelt den Data Mining-Prozess (Vorverarbeitung, Miningphase, Auswertung), die verschiedenen Aufgabenkategorien sowie spezifische Methoden wie Entscheidungsbäume und Neuronale Netze.
Die Arbeit lässt sich durch Begriffe wie Data Mining, KDD, CRM, Web Mining, Warenkorbanalyse und statistische Methoden charakterisieren.
Das Data Warehouse dient als zentrale Datenbasis, die vereinheitlichte Daten historisiert vorhält, was eine konsistente Analyse über verschiedene Zeiträume hinweg erst ermöglicht.
Beim deduktiven Ansatz bestätigen Experten bestehende Hypothesen mit Tools, während der induktive Ansatz (Data Mining) aus einer Datenbasis autonom neue, bisher unbekannte Muster generiert.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

