Data Mining als Komponente innovativer Systeme

Diplomarbeit, 2003
91 Seiten, Note: 1,3

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

1 Einleitung

1.1 Zielsetzung der Arbeit

1.2 Aufbau der Arbeit

2 Grundlagen des Data Mining

2.1 Data Mining

2.1.1 Einordnung des Begriffs Data Mining

2.1.2 Definition Data Mining

2.1.3 Data Mining als Prozess des Maschinellen Lernen

2.1.4 Beziehungsgefüge Data Mining und On-Line Analytical Processing

2.2 Text Mining

2.3 Web Mining

2.3.1 Informationen für das E-Business

2.3.2 Einsatzgebiete des Web Mining

3 Datenbasis

3.1 Informationsquellen

3.2 Datentypen

3.3 Data Warehouse

3.4 Betriebswirtschaftlicher Regelkreis

4 Funktionen und Ziele des Data Mining

4.1 Der Data Mining-Prozess

4.1.1 Vorverarbeitungsphase

4.1.2 Miningphase

4.1.3 Auswertungsphase

4.1.4 Text-/Web Mining-Prozess

4.2 Analysen und Aufgaben des Data Mining

4.2.1 Klassifizierung

4.2.2 Prognose

4.2.3 Assoziation

4.2.4 Segmentierung

4.2.5 Repräsentation

4.3 Methoden des Data Mining

4.3.1 Statistische Methoden

4.3.2 Entscheidungsbaumverfahren

4.3.3 Clusteranalyse

4.3.4 Künstliche Neuronale Netze (KNN)

4.3.5 Assoziationsmethoden

5 Einsatzgebiete von Data Mining

5.1 Data Mining im Customer Relationship Management

5.2 E-Commerce als Einsatzgebiet des Web Mining

5.3 Data Mining im Handel (Warenkorbanalyse)

6 Zusammenfassung und Fazit

Zielsetzung & Themen

Die vorliegende Diplomarbeit zielt darauf ab, den Prozess des Data Mining für den Leser transparent zu gestalten, dessen Anwendungspotenziale in innovativen Systemen zu erläutern und einen Ausblick auf zukünftige Anwendungsfelder zu geben.

Grundlagen und Definitionen des Data Mining, Text Mining und Web Mining.
Analyse der notwendigen Datenbasis und des betriebswirtschaftlichen Regelkreises.
Detaillierte Darstellung des Data Mining-Prozesses und seiner verschiedenen Phasen.
Methodische Ansätze, einschließlich Klassifizierung, Prognose, Assoziation und Segmentierung.
Praktische Anwendungsgebiete im Customer Relationship Management (CRM), E-Commerce und Handel.

Auszug aus dem Buch

2.1.1 Einordnung des Begriffs Data Mining

Im Begriff DM steckt das aus dem Bergbau stammende Wort „Mining“. Hierbei werden enorme Gesteinsmengen mit großem technologischem Aufwand maschinell abgebaut und aufbereitet, um Edelmetalle ans Tageslicht zu fördern. Ähnlich werden beim DM riesige Datenbestände mit speziellen Methoden/Tools durchforstet, um an neue Informationen oder Wissen zu gelangen. Die Ergebnisse, die durch das „Schürfen“ und „Graben“ der DM-Tools erzielt werden, werden in Anlehnung an frühere Goldgräberzeiten auch als „Knowledge Nuggets“ bzw. „Wissensbarren“ bezeichnet.

Die Tools entstammen Verfahren der Datenanalyse aus den Forschungsgebieten der Künstlichen Intelligenz, der Statistik, des Maschinellen Lernens und der Mustererkennung. Die Methoden aus diesen Gebieten haben die Aufgabe, aus riesigen Datenvolumina autonom aussagekräftige und nicht triviale Hypothesen zu generieren, ohne zuvor eine konkrete Fragestellung erhalten zu haben. Es wurde jedoch schnell klar, dass DM alleine noch kein Garant für ein solches Ergebnis ist. E. Thomsen schrieb in einem seiner Bücher: „… you need to know a lot about your data to mine successfully …“.

DM gilt daher als Intelligenzverstärker für die Mitarbeiter, die mit diesen Tools arbeiten. Daher wird in der Literatur von einem Wissensentdeckungsprozess gesprochen. Dieser Prozess des „Knowledge Discovery in Databases“ (KDD = Wissensentdeckung in Datenbanken) beinhaltet neben den DM-Methoden zunächst einmal die Aufgabendefinition und die Datenaufbereitung und nach der eigentlichen Anwendung der Analysetools die Ergebnisevaluation. DM ist somit im eigentlichen Sinne nur eine Maßnahme innerhalb des KDD-Prozesses, die bestimmte DM-Algorithmen/-Methoden beinhaltet, welche besondere Muster entdecken können. Die meisten Autoren – sowie auch der Verfasser dieser Arbeit – verwenden DM oder den DM-Prozess synonym zu KDD oder dem KDD-Prozess. Bei den Beschreibungen des Prozesses oder der Werkzeuge wird dabei vielfach auf die Literatur zu KDD zurückgegriffen.

Zusammenfassung der Kapitel

1 Einleitung: Die Einleitung thematisiert den wachsenden Wettbewerbsdruck und die Notwendigkeit für Unternehmen, computergestützte Analysemethoden einzusetzen, um aus umfangreichen Kundendaten wertvolle Informationen zu generieren.

2 Grundlagen des Data Mining: Dieses Kapitel definiert Data Mining, Text Mining und Web Mining und bettet diese als Werkzeuge zur Wissensentdeckung (KDD) in betriebswirtschaftliche Kontexte ein.

3 Datenbasis: Hier werden die Quellen von unternehmensinternen und -externen Daten, verschiedene Datentypen sowie die Rolle des Data Warehouse und des betriebswirtschaftlichen Regelkreises beschrieben.

4 Funktionen und Ziele des Data Mining: Es erfolgt eine detaillierte Erläuterung des Data Mining-Prozesses, der Aufgabenbereiche wie Klassifizierung und Prognose sowie der mathematisch-technischen Methoden zur Mustererkennung.

5 Einsatzgebiete von Data Mining: Dieses Kapitel veranschaulicht den praktischen Nutzen von Data Mining in CRM-Systemen, E-Commerce-Umgebungen und durch Warenkorbanalysen im Handel.

6 Zusammenfassung und Fazit: Die Arbeit schließt mit einem Resümee über die Bedeutung von Data Mining als strategisches Instrument für Unternehmen zur Wissensgenerierung und kundenorientierten Prozessoptimierung.

Schlüsselwörter

Data Mining, Knowledge Discovery in Databases, KDD, Web Mining, Text Mining, Data Warehouse, Kundenbeziehungsmanagement, CRM, Customer Lifetime Value, Warenkorbanalyse, Klassifizierung, Prognose, Clusteranalyse, Künstliche Neuronale Netze, Entscheidungsbaumverfahren

Häufig gestellte Fragen

Worum geht es in dieser Diplomarbeit?

Die Arbeit untersucht Data Mining als Komponente innovativer Systeme, wobei der Fokus auf der Wissensentdeckung aus großen Datenbeständen zur Unterstützung unternehmerischer Entscheidungen liegt.

Welche zentralen Themenfelder behandelt die Arbeit?

Die zentralen Themen sind die theoretischen Grundlagen des Data Mining, der technische Datenaufbereitungsprozess, die methodische Analyse von Daten sowie die Anwendung dieser Verfahren in CRM, E-Commerce und Handel.

Was ist das primäre Ziel der Arbeit?

Das Ziel ist es, den Data Mining-Prozess transparent darzustellen und aufzuzeigen, wie Unternehmen durch den Einsatz dieser Methoden wettbewerbsfähig bleiben und Kundenbeziehungen personalisiert steuern können.

Welche wissenschaftliche Methode wird primär verwendet?

Es handelt sich um eine theoretische Arbeit, die sich auf die Literatur zu KDD, Data Mining-Algorithmen und betriebswirtschaftlichen Anwendungen stützt, um den Prozess von der Datenbasis bis zur Ergebnisimplementierung zu modellieren.

Was steht im Hauptteil der Arbeit im Mittelpunkt?

Der Hauptteil behandelt den Data Mining-Prozess (Vorverarbeitung, Miningphase, Auswertung), die verschiedenen Aufgabenkategorien sowie spezifische Methoden wie Entscheidungsbäume und Neuronale Netze.

Welche Schlüsselwörter charakterisieren die Arbeit am besten?

Die Arbeit lässt sich durch Begriffe wie Data Mining, KDD, CRM, Web Mining, Warenkorbanalyse und statistische Methoden charakterisieren.

Warum ist das Data Warehouse für den Data Mining-Prozess essenziell?

Das Data Warehouse dient als zentrale Datenbasis, die vereinheitlichte Daten historisiert vorhält, was eine konsistente Analyse über verschiedene Zeiträume hinweg erst ermöglicht.

Was ist der Unterschied zwischen dem deduktiven und dem induktiven Ansatz?

Beim deduktiven Ansatz bestätigen Experten bestehende Hypothesen mit Tools, während der induktive Ansatz (Data Mining) aus einer Datenbasis autonom neue, bisher unbekannte Muster generiert.

Ende der Leseprobe aus 91 Seiten - nach oben

Details

Titel: Data Mining als Komponente innovativer Systeme
Hochschule: Verwaltungs- und Wirtschaftsakademie Essen
Note: 1,3
Autor: Stefan Kempka (Autor:in)
Erscheinungsjahr: 2003
Seiten: 91
Katalognummer: V85571
ISBN (eBook): 9783638900430
ISBN (Buch): 9783638905831
Dateigröße: 1410 KB
Sprache: Deutsch
Schlagworte: Data Mining Komponente Systeme CRM Customer Relationship Management Business Warehouse BW
Produktsicherheit: GRIN Publishing GmbH
Preis (Ebook): US$ 41,99
Preis (Book): US$ 54,99

Arbeit zitieren: Stefan Kempka (Autor:in), 2003, Data Mining als Komponente innovativer Systeme, München, Page::Imprint:: GRINVerlagOHG, https://www.diplomarbeiten24.de/document/85571