Einführung in den Einsatz von Data Mining

Diplomarbeit, 2003
92 Seiten, Note: 1,3

Mathematik - Statistik

Leseprobe

Inhaltsverzeichnis

1. Zielstellung und Vorgehensweise

2. Grundlagen des Data Mining

2.1 Daten und Skalen

2.2 Die Entwicklung der Datensammlung und –Auswertung

2.2.1 Historische Entwicklung

2.2.2 Das Data Warehouse Konzept

2.2.3 Definition von Data Mining und KDD

3. Vorgehensweise beim Data Mining

3.1 Analyse des Anwendungsgebietes

3.2 Datenaufbereitung

3.3 Methoden der Datenanalyse

3.4 Datenpräsentation

3.5 Basismethoden des Data Mining

3.6 Software

3.6.1 Weka

3.6.2 SPSS 10 für Windows

3.6.3 Clementine 7.0

4. Solvay Soda Deutschland GmbH

4.1 Allgemeines

4.2 Die Störungsdatenbank

5. Durchführung des Data Mining

5.1 Vermutete Zusammenhänge

5.2 Auswahl der Analysemethoden und der Software

5.4 Übernahme der Daten

5.5 Die Attribute

5.6 Vorbereitung der Daten

5.7 Anwendung der Analysemethoden

5.7.1 Deskriptive Statistiken

5.7.2 Vergleich der Zeitdauer mit anderen Attributen

5.7.3 Kreuztabellen wichtiger Attribute

5.7.4 Diskriminanzanalyse

6. Fazit

Zielsetzung & Themen

Die Arbeit untersucht den praktischen Einsatz von Data-Mining-Methoden zur Optimierung der Störungsbeseitigung am Beispiel der Störungsdatenbank der SOLVAY Soda Deutschland GmbH, um die Eignung der Datenbasis zu prüfen und Erkenntnisse für das Instandhaltungsmanagement zu gewinnen.

Grundlagen des Data Mining und des KDD-Prozesses
Methodik zur Datenaufbereitung und -analyse
Vorstellung relevanter Data-Mining-Softwarelösungen
Analyse der Störungsdaten der Solvay Soda Deutschland GmbH
Bewertung der Möglichkeiten zur Störungsvorhersage und Prozessoptimierung

Auszug aus dem Buch

2.2.3 Definition von Data Mining und KDD

Der Begriff Data Mining kommt von dem englischen Wort mine, das Mine oder Bergwerk bedeutet. Mining steht für den Bergbau. Übertragen bedeutet Data Mining somit die Suche nach versteckten Informationen in einer Datenmasse. Dazu gehören u.a. Muster, Trends und Prognosen.

Der Data Mining Prozess wird in der englischen Literatur auch als KDD Prozess bezeichnet. Data Mining stellt darin nur den eigentlichen Teil der Suche nach Datenmustern dar (siehe Abb. 3).1

Da aber heutige Data Mining Tools auch für die anderen Phasen, wie z.B. Datenaufbereitung, konzipiert sind, sollte der Begriff Data Mining nicht nur auf die Suche nach unbekannten Datenzusammenhängen eingeschränkt werden. Data Mining wird deshalb in dieser Arbeit als gesamter Prozess von der Datenaufbereitung über die Datenanalyse bis hin zur Datenpräsentation angesehen. Eine anschließende ausführliche Phase der Informationsinterpretation, um schließlich zum sog. Wissen zu gelangen, kann als zusätzliche Phase im Anschluss an den Data Mining Prozess angesehen werden. In dieser Phase sind letztendlich auch menschliche Fähigkeiten, wie z.B. Intuition oder Kreativität, gefragt.

Zusammenfassung der Kapitel

1. Zielstellung und Vorgehensweise: Definition der Aufgabenstellung und Vorstellung des methodischen Vorgehens für die Einführung von Data Mining bei der Störungsbeseitigung.

2. Grundlagen des Data Mining: Erläuterung der theoretischen Basis, von der Datenskalierung über die historische Entwicklung bis hin zum Data Warehouse und KDD-Prozess.

3. Vorgehensweise beim Data Mining: Detaillierte Darstellung der Prozessschritte: Analyse, Vorbereitung, Analyse, Präsentation sowie Überblick über eingesetzte Software.

4. Solvay Soda Deutschland GmbH: Unternehmensvorstellung und detaillierte Beschreibung der genutzten Störungsdatenbank als Datengrundlage.

5. Durchführung des Data Mining: Dokumentation der angewandten Methoden, der Datenbereinigung und der anschließenden statistischen Analysen und Kreuztabellen zur Identifikation von Mustern.

6. Fazit: Zusammenfassende Bewertung der Ergebnisse, kritische Reflexion der Datengüte und Ausblick auf notwendige Anforderungen für zukünftige Prognosemodelle.

Schlüsselwörter

Data Mining, KDD-Prozess, Störungsbeseitigung, Störungsdatenbank, Data Warehouse, Statistik, Clusteranalyse, Klassifikation, Diskriminanzanalyse, Prozessoptimierung, Instandhaltung, Entscheidungsunterstützung, Datenaufbereitung, Software, Solvay Soda Deutschland GmbH.

Häufig gestellte Fragen

Worum geht es in der Arbeit primär?

Die Diplomarbeit untersucht die praktische Anwendbarkeit von Data-Mining-Techniken zur Analyse und Optimierung der Störungsbeseitigung bei der Solvay Soda Deutschland GmbH.

Welche zentralen Themenfelder werden bearbeitet?

Zentral sind die theoretischen Grundlagen des Data Mining, der KDD-Prozess, die Datenaufbereitung für industrielle Anwendungen sowie die konkrete Anwendung statistischer Analysemethoden auf Störungsdaten.

Was ist die primäre Forschungsfrage?

Es wird untersucht, ob die bestehende Störungsdatenbank die Voraussetzungen für Data-Mining-Analysen erfüllt und welche Erkenntnisse zur Verbesserung des Instandhaltungsprozesses daraus abgeleitet werden können.

Welche wissenschaftliche Methode kommt zum Einsatz?

Die Arbeit kombiniert deskriptive Statistik, Kreuztabellenanalysen und eine Diskriminanzanalyse, um Zusammenhänge zwischen Störungsursachen, Zeitaufwand, Produktion und Außentemperatur zu untersuchen.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die theoretische Fundierung, die Beschreibung der Datengrundlage, die Dokumentation der Datenaufbereitung und die Anwendung verschiedener Analysemethoden zur Validierung von Vermutungen über Störungszusammenhänge.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit fokussiert sich auf Begriffe wie Data Mining, Störungsanalyse, KDD-Prozess, Instandhaltungsdatenbank und Entscheidungsunterstützung.

Warum konnte die Diskriminanzanalyse keine besseren Ergebnisse liefern?

Die unzureichende Vorhersagegenauigkeit lag primär an der mangelnden Granularität der Daten, da nur Tages- anstatt ereignisbezogener Messdaten (Druck, Füllstand, Durchfluss) zur Verfügung standen.

Welche Empfehlungen gibt der Autor für die Zukunft?

Der Autor empfiehlt eine genauere Aufzeichnung ereignisbezogener Messdaten über einen längeren Zeitraum, um komplexe Zusammenhänge zwischen Betriebszuständen und Störungen vorhersagbar zu machen.

Ende der Leseprobe aus 92 Seiten - nach oben

Details

Titel: Einführung in den Einsatz von Data Mining
Hochschule: Hochschule Anhalt - Standort Bernburg
Note: 1,3
Autor: Diplom-Betriebswirt Andre Hiller (Autor:in)
Erscheinungsjahr: 2003
Seiten: 92
Katalognummer: V75722
ISBN (Buch): 9783638849159
ISBN (eBook): 9783638849760
Dateigröße: 1140 KB
Sprache: Deutsch
Schlagworte: Einführung Einsatz Data Mining
Produktsicherheit: GRIN Publishing GmbH
Preis (Ebook): US$ 41,99
Preis (Book): US$ 54,99

Arbeit zitieren: Diplom-Betriebswirt Andre Hiller (Autor:in), 2003, Einführung in den Einsatz von Data Mining, München, Page::Imprint:: GRINVerlagOHG, https://www.diplomarbeiten24.de/document/75722