Diplomarbeit, 2003
92 Seiten, Note: 1,3
1. Zielstellung und Vorgehensweise
2. Grundlagen des Data Mining
2.1 Daten und Skalen
2.2 Die Entwicklung der Datensammlung und –Auswertung
2.2.1 Historische Entwicklung
2.2.2 Das Data Warehouse Konzept
2.2.3 Definition von Data Mining und KDD
3. Vorgehensweise beim Data Mining
3.1 Analyse des Anwendungsgebietes
3.2 Datenaufbereitung
3.3 Methoden der Datenanalyse
3.4 Datenpräsentation
3.5 Basismethoden des Data Mining
3.6 Software
3.6.1 Weka
3.6.2 SPSS 10 für Windows
3.6.3 Clementine 7.0
4. Solvay Soda Deutschland GmbH
4.1 Allgemeines
4.2 Die Störungsdatenbank
5. Durchführung des Data Mining
5.1 Vermutete Zusammenhänge
5.2 Auswahl der Analysemethoden und der Software
5.4 Übernahme der Daten
5.5 Die Attribute
5.6 Vorbereitung der Daten
5.7 Anwendung der Analysemethoden
5.7.1 Deskriptive Statistiken
5.7.2 Vergleich der Zeitdauer mit anderen Attributen
5.7.3 Kreuztabellen wichtiger Attribute
5.7.4 Diskriminanzanalyse
6. Fazit
Die Arbeit untersucht den praktischen Einsatz von Data-Mining-Methoden zur Optimierung der Störungsbeseitigung am Beispiel der Störungsdatenbank der SOLVAY Soda Deutschland GmbH, um die Eignung der Datenbasis zu prüfen und Erkenntnisse für das Instandhaltungsmanagement zu gewinnen.
2.2.3 Definition von Data Mining und KDD
Der Begriff Data Mining kommt von dem englischen Wort mine, das Mine oder Bergwerk bedeutet. Mining steht für den Bergbau. Übertragen bedeutet Data Mining somit die Suche nach versteckten Informationen in einer Datenmasse. Dazu gehören u.a. Muster, Trends und Prognosen.
Der Data Mining Prozess wird in der englischen Literatur auch als KDD Prozess bezeichnet. Data Mining stellt darin nur den eigentlichen Teil der Suche nach Datenmustern dar (siehe Abb. 3).1
Da aber heutige Data Mining Tools auch für die anderen Phasen, wie z.B. Datenaufbereitung, konzipiert sind, sollte der Begriff Data Mining nicht nur auf die Suche nach unbekannten Datenzusammenhängen eingeschränkt werden. Data Mining wird deshalb in dieser Arbeit als gesamter Prozess von der Datenaufbereitung über die Datenanalyse bis hin zur Datenpräsentation angesehen. Eine anschließende ausführliche Phase der Informationsinterpretation, um schließlich zum sog. Wissen zu gelangen, kann als zusätzliche Phase im Anschluss an den Data Mining Prozess angesehen werden. In dieser Phase sind letztendlich auch menschliche Fähigkeiten, wie z.B. Intuition oder Kreativität, gefragt.
1. Zielstellung und Vorgehensweise: Definition der Aufgabenstellung und Vorstellung des methodischen Vorgehens für die Einführung von Data Mining bei der Störungsbeseitigung.
2. Grundlagen des Data Mining: Erläuterung der theoretischen Basis, von der Datenskalierung über die historische Entwicklung bis hin zum Data Warehouse und KDD-Prozess.
3. Vorgehensweise beim Data Mining: Detaillierte Darstellung der Prozessschritte: Analyse, Vorbereitung, Analyse, Präsentation sowie Überblick über eingesetzte Software.
4. Solvay Soda Deutschland GmbH: Unternehmensvorstellung und detaillierte Beschreibung der genutzten Störungsdatenbank als Datengrundlage.
5. Durchführung des Data Mining: Dokumentation der angewandten Methoden, der Datenbereinigung und der anschließenden statistischen Analysen und Kreuztabellen zur Identifikation von Mustern.
6. Fazit: Zusammenfassende Bewertung der Ergebnisse, kritische Reflexion der Datengüte und Ausblick auf notwendige Anforderungen für zukünftige Prognosemodelle.
Data Mining, KDD-Prozess, Störungsbeseitigung, Störungsdatenbank, Data Warehouse, Statistik, Clusteranalyse, Klassifikation, Diskriminanzanalyse, Prozessoptimierung, Instandhaltung, Entscheidungsunterstützung, Datenaufbereitung, Software, Solvay Soda Deutschland GmbH.
Die Diplomarbeit untersucht die praktische Anwendbarkeit von Data-Mining-Techniken zur Analyse und Optimierung der Störungsbeseitigung bei der Solvay Soda Deutschland GmbH.
Zentral sind die theoretischen Grundlagen des Data Mining, der KDD-Prozess, die Datenaufbereitung für industrielle Anwendungen sowie die konkrete Anwendung statistischer Analysemethoden auf Störungsdaten.
Es wird untersucht, ob die bestehende Störungsdatenbank die Voraussetzungen für Data-Mining-Analysen erfüllt und welche Erkenntnisse zur Verbesserung des Instandhaltungsprozesses daraus abgeleitet werden können.
Die Arbeit kombiniert deskriptive Statistik, Kreuztabellenanalysen und eine Diskriminanzanalyse, um Zusammenhänge zwischen Störungsursachen, Zeitaufwand, Produktion und Außentemperatur zu untersuchen.
Der Hauptteil gliedert sich in die theoretische Fundierung, die Beschreibung der Datengrundlage, die Dokumentation der Datenaufbereitung und die Anwendung verschiedener Analysemethoden zur Validierung von Vermutungen über Störungszusammenhänge.
Die Arbeit fokussiert sich auf Begriffe wie Data Mining, Störungsanalyse, KDD-Prozess, Instandhaltungsdatenbank und Entscheidungsunterstützung.
Die unzureichende Vorhersagegenauigkeit lag primär an der mangelnden Granularität der Daten, da nur Tages- anstatt ereignisbezogener Messdaten (Druck, Füllstand, Durchfluss) zur Verfügung standen.
Der Autor empfiehlt eine genauere Aufzeichnung ereignisbezogener Messdaten über einen längeren Zeitraum, um komplexe Zusammenhänge zwischen Betriebszuständen und Störungen vorhersagbar zu machen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

