Diplomarbeit, 2003
79 Seiten, Note: 2,0
1 EINLEITUNG
2 GRUNDLAGEN UND DEFINITIONEN
2.1 DATA WAREHOUSES
2.2 METADATEN
2.2.1 Definition Metadaten
2.2.2 Arten von Metadaten
2.2.3 Einsatzzwecke von Metadaten
2.2.4 Metadatenspeicherung
2.2.5 Metadatenaustausch
2.3 QUALITÄT UND DATENQUALITÄT
2.3.1 Definition Datenqualität
2.3.2 Kriterien für Datenqualität
2.3.3 Datenqualität von Informationssystemen
2.3.4 Allgemeine Methoden zur Verbesserung von Datenqualität
3 QUALITÄT VON DATA-WAREHOUSES
3.1 QUALITÄTSKRITERIEN VON DATA-WAREHOUSES
3.2 RISIKEN FÜR DIE QUALITÄT VON DATA-WAREHOUSES
3.3 BEDEUTUNG VON METADATEN FÜR DATA-WAREHOUSE QUALITÄT
3.3.1 Bedeutung von Metadaten im Data-Warehouse
3.3.2 Speicherung und Verarbeitung der Metadaten im Data-Warehouse
3.4 KONZEPTE ZUR STEIGERUNG VON DATA-WAREHOUSE QUALITÄT
3.4.1 Doppelte Entwicklung - Stockhammer und Kennel
3.4.2 Qualitätssteigerung als Optimierungsproblem - Ballou / Tayi
3.4.3 CLIQ – Der Ansatz von Hinrichs
3.4.4 Terminologiemanagement – Der Ansatz von Lehmann / Jaszewski
3.4.5 Alles in einem – Der Ansatz des DWQ
4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL
4.1 BESCHREIBUNG DER AUSGANGSSITUATION
4.2 BESCHREIBUNG DER UMSETZUNGSMAßNAHMEN
4.2.1 Metadata-Services – Das Repository
4.2.1.1 Aufbau der Metadata-Services
4.2.1.2 Füllen der Metadata-Services
4.2.2 Analysis Services – Der OLAP-Server
4.2.2.1 Metadaten in den Analysis Services
4.2.2.2 Analysis Manager als Anwendungsoberfläche
4.2.3 Arcplans inSight/dynaSight – Das Front-End
4.2.3.1 Zugriff auf das Data-Warehouse und die Metadaten
4.2.3.2 Implementierung von Metadaten
5 SCHLUSSBEURTEILUNG
5.1 BEURTEILUNG DER MAßNAHMEN
5.2 ZUKÜNFTIGER ENTWICKLUNGSBEDARF
Die Arbeit untersucht, wie die Datenqualität in Data-Warehouse-Systemen aus Benutzersicht durch den gezielten Einsatz und die Verwaltung von Metadaten gesteigert werden kann, um Anwendern ein besseres Verständnis und Vertrauen in die Daten zu ermöglichen.
3.4.1 Doppelte Entwicklung - Stockhammer und Kennel
Stockhammer und Kennel stellen einen Ansatz zur Aufdeckung von Fehlern in Data Warehouses dar. Ein solcher Ansatz trägt insofern zur Qualitätssteigerung bei, als das die Aufdeckung von Fehlern der erste und oftmals schwierigste Schritt ist, um Fehler zu beheben. Der Ansatz konzentriert sich in erster Linie auf den Entwicklungszeitraum, ist jedoch auch bei späteren Anpassungen und Wartungen einsetzbar.
Das Konzept sieht vor, dass für die Entwicklung des Data-Warehouse drei Teams gebildet werden; ein Team, das durch Entwickler besetzt wird, ein Team, das durch die Endanwender gebildet wird und ein Team, das sowohl durch fachliche als auch technische Experten besetzt wird. Die Aufgabe des dritten Teams ist die Vermittlung zwischen den beiden anderen Teams. Weiter ist dieses Team dafür verantwortlich Systemtest durchzuführen und zu organisieren. Als eigentliches Problem stellt sich nun die Frage, mit welchen Werten die Testergebnisse verglichen werden sollen. Eine individuelle Berechnung der einzelnen Ergebnisse ist oft zu komplex. Eine einfache Plausibilitätsprüfung deckt nur extreme Abweichungen auf; unauffällige Fehler bleiben unentdeckt. Als Lösung wird der Entwurf eines Testsystems vorgeschlagen. Ein solches System würde jedoch, wenn es durch die Entwickler des eigentlichen Data-Warehouse geschaffen würde, wahrscheinlich die gleichen Fehler wie das Data-Warehouse aufweisen.
Daher muss das Testsystem durch firmenexterne bzw. zumindest durch projektexterne Entwickler geschaffen werden. Da das Test-System als Prototyp entwickelt werden kann und auf viele aufwändige Aspekte, wie z. B. eine Benutzeroberfläche oder eine hohe Performance, verzichtet werden kann, ist es wesentlich einfacher und günstiger zu realisieren als das produktive Data-Warehouse-System. Die Ergebnisse des Testsystems können nun mit den Daten des produktiven Data-Warehouse verglichen werden. Wenn Abweichungen auftreten, ist zu klären, ob diese auf einem Fehler im Test-System, im produktiven System oder nur auf einem Rundungsfehler beruhen.
1 EINLEITUNG: Darstellung der Bedeutung von Datenqualität für die Benutzerakzeptanz und Einführung in die Thematik der Metadaten zur Qualitätssteigerung.
2 GRUNDLAGEN UND DEFINITIONEN: Erläuterung der Grundbegriffe Data-Warehouse, Metadaten und Datenqualität sowie ihrer Zusammenhänge.
3 QUALITÄT VON DATA-WAREHOUSES: Analyse der qualitätskritischen Aspekte in Data-Warehouses und Vorstellung verschiedener Konzepte zur Steigerung der Datenqualität.
4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL: Anwendung der theoretischen Ansätze zur Metadaten-Implementierung anhand eines Data-Warehouse der Philipps-Universität Marburg.
5 SCHLUSSBEURTEILUNG: Zusammenfassende Bewertung der durchgeführten Maßnahmen und Aufzeigen von weiterem Entwicklungsbedarf.
Data-Warehouse, Metadaten, Datenqualität, Informationsqualität, Datenherkunft, Repository, OLAP, ETL-Prozess, Qualitätsmanagement, Anwenderakzeptanz, Metadatenspeicherung, Metadatenaustausch, Unternehmensmodell, Datenmodellierung
Die Arbeit analysiert, wie die Qualität von Daten in Data-Warehouse-Systemen verbessert werden kann, indem Anwendern durch den Einsatz von Metadaten ein tieferes Verständnis für Herkunft und Bedeutung der Daten vermittelt wird.
Die zentralen Themen sind die Definition und Einordnung von Metadaten, die Messung und Sicherung der Datenqualität in Data-Warehouses sowie die praktische Implementierung dieser Ansätze.
Das Hauptziel ist es, Möglichkeiten aufzuzeigen, wie die Datenqualität speziell aus Sicht des Endbenutzers durch besseren Zugriff auf Metadaten gesteigert werden kann.
Es werden Literaturanalysen bestehender Modelle und Ansätze zur Datenqualität durchgeführt, ergänzt durch eine Fallstudie, in der die praktische Umsetzbarkeit an einem konkreten Data-Warehouse-Beispiel getestet wird.
Im Hauptteil werden zunächst theoretische Grundlagen gelegt, gefolgt von einer detaillierten Analyse verschiedener Forschungsansätze (z.B. Stockhammer/Kennel, DWQ, Hinrichs) zur Qualitätssteigerung und deren praktischer Erprobung.
Die Arbeit lässt sich durch Begriffe wie Data-Warehouse, Metadaten, Datenqualität, ETL-Prozess, Metadatenmanagement und Anwenderakzeptanz charakterisieren.
Das DWQ-Projekt verfolgt einen sehr umfassenden Ansatz, der den aus dem Software-Qualitätsmanagement bekannten Goal-Question-Metric-Ansatz direkt auf Data-Warehouses überträgt und Messgrößen für Qualitätsziele definiert.
Sie dient als reales Praxisbeispiel, um zu demonstrieren, wie bestehende Microsoft-Werkzeuge (SQL-Server, Analysis Services, dynaSight) zur Metadatenverwaltung genutzt werden können und auf welche technischen Hürden man dabei in der Realität stößt.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

