Bachelorarbeit, 2016
85 Seiten, Note: 1,6
1 Einleitung
2 Anforderungsanalyse
2.1 Grundlagen der Informationswissenschaft
2.2 Information & Wissen
2.2.1 Subjektives Wissen
2.2.2 Objektives Wissen
2.2.3 Informationsübermittlung
2.2.4 Informationsvermittlung
2.3 Information Retrieval
2.3.1 Informationsbedarf
2.3.2 Recall und Precision
2.3.3 Allgemeine Relevanz
2.3.4 Retrieval Modelle
2.4 Bereitstellung und Auswertung von Informationen im Web
2.4.1 Link-Topologie
2.4.2 Ranking
2.4.3 Multimedia Retrieval
3 Konzept
3.1 Modellbildung
3.2 HTML-Dokumenten-Analyse
3.3 Grafikformate
3.4 Grafikarten im Web
3.5 Bilderverarbeitungsbibliotheken
3.6 Zeitabschätzung und Verweildauer
4 Realisierung
4.1 Designumsetzung
4.2 Serverseitige Implementierung
4.3 Datenanalyse
5 Evaluierung / Test
6 Zusammenfassung und Ausblick
Die vorliegende Bachelorarbeit befasst sich mit der Konzeption und technischen Realisierung eines serverseitigen Dienstes zur automatisierten Analyse von HTML-Code. Das primäre Ziel besteht darin, durch eine detaillierte Auswertung der Bild- und Videoinhalte einer Webseite eine realistische Abschätzung über die Verweildauer eines Benutzers zu treffen, wobei die Ergebnisse sowohl grafisch als auch im JSON-Format zur weiteren Verarbeitung bereitgestellt werden.
2.2.1 Subjektives Wissen
Das erlangte Wissen einer Person, wird subjektives Wissen genannt. Subjektives Wissen ist nicht grundsätzlich richtig oder falsch. Allgemein betrachtet ist das Wissen für das jeweilige Subjekt gültig, sprich das Wissen hat einen grundsätzlichen Wahrheitsanspruch, der keinen objektiven Kriterien unterliegt. In vielen Bereichen kann nur subjektives Wissen erlangt werden. Zum Beispiel im Bereich der Physiologie. In diesem Erkenntnisbereich kann das Wissen nur auf Symptome und nicht objektivierbaren Phänomenen aufbauen. Daher ist subjektives Wissen immer beschränktes Wissen.
Des Weiteren wird zwischen subjektivem impliziten Wissen und subjektivem explizitem Wissen unterschieden.
Subjektives implizites Wissen: Es ist anzunehmen, dass jede Person über deutlich mehr Wissen verfügt als sie anderen direkt verständlich mitteilen kann. Das Wissen steckt implizit in dem Können selbst. Es entsteht durch intuitives, nicht zu verbalisierendes und nicht zu formalisierendes, erfahrungsgebundenes Handeln. Dieses Wissen weiterzugeben ist meist schwierig.
Subjektives explizites Wissen: Explizites Wissen ist im Vergleich zum impliziten Wissen „greifbares Wissen“. Es wird von eindeutig kodiertem Wissen gesprochen, das deshalb mittels Sprache und Schrift übermittelbar ist. Aber auch explizites Wissen kann implizite Anteile enthalten. Zum Beispiel diese Arbeit. Ich als Urheber habe bestimmte Begabungen, bin Kenner gewisser Themen und bringe durch persönliche Erfahrungen, persönliches Wissen und damit auch möglicherweise Fehler in diese schriftliche explizite Form der Ausarbeitung mit ein.
1 Einleitung: Das erste Kapitel erläutert die Motivation, Problemstellung und Zielsetzung der Arbeit im Kontext der Informationswissenschaft.
2 Anforderungsanalyse: Dieses Kapitel erarbeitet die inhaltlichen Grundlagen zur Wissensrepräsentation und den Methoden des Information Retrievals.
3 Konzept: Es wird eine technische Lösung zur Analyse von HTML-Dokumenten entwickelt, die Bild- und Videoinhalte kategorisiert und für eine Zeitabschätzung aufbereitet.
4 Realisierung: Dieses Kapitel beschreibt die technische Umsetzung des Dienstes mittels PHP und die Anwendung von Bibliotheken zur Bildanalyse.
5 Evaluierung / Test: Anhand von Use Cases wird der entwickelte Dienst getestet und die Ergebnisse der systemseitigen Analyse kritisch betrachtet.
6 Zusammenfassung und Ausblick: Eine abschließende Reflektion der Arbeit sowie ein Ausblick auf mögliche Erweiterungen, wie das Parsen von CSS und JavaScript, werden dargelegt.
Dienst zur Analyse, Information Retrieval, Webseite, Bilder, Videos, Hypertext-Dokumente, serverseitig, PHP, HTML-Code, Verweildauer, Bildsegmentierung, JSON, Wissensrepräsentation, Datenanalyse
Die Arbeit beschäftigt sich mit der Entwicklung eines serverseitigen IT-Dienstes, der HTML-Quellcode analysiert, um spezifische Medienelemente zu erkennen und daraus eine Verweildauer für Webseitenbesucher zu berechnen.
Zentral sind die Felder Information Retrieval, Bildverarbeitung, Webdesign-Analyse und die Modellierung von Benutzerverhaltensmustern.
Das primäre Ziel ist die automatische Klassifizierung von Bild- und Videoinhalten einer Webseite, um auf dieser Basis eine fundierte, realistische Schätzung der Verweildauer von Nutzern zu generieren.
Es wird ein theoretisches Modell zur Informationsklassifizierung aufgestellt, welches mittels mathematischer Berechnungsformeln für Relevanzgrade und dwell times operativ umgesetzt und in einer Testumgebung evaluiert wird.
Im Hauptteil liegt der Fokus auf der Anforderungsanalyse, der konzeptionellen Modellbildung, der Auswahl geeigneter Programmierbibliotheken und der detaillierten Beschreibung der Implementierung der Parser-Logik.
Die Arbeit lässt sich vor allem durch die Begriffe Information Retrieval, Bildsegmentierung, HTML-Analyse, Verweildauer-Abschätzung und PHP-basierte serverseitige Verarbeitung charakterisieren.
Die Bildkategorisierung ist essenziell, da unterschiedliche Bildarten (wie Produktbilder, Hintergrundbilder oder Icons) eine differenzierte Gewichtung und damit unterschiedliche Auswirkungen auf die berechnete Verweildauer haben.
Das System nutzt verschiedene Bildverarbeitungstechniken, wie den Sobel-Operator zur Kantenerkennung oder Farbhistogramme, um Metadaten über die Multimedia-Objekte zu gewinnen, auch wenn keine expliziten Text-Tags vorliegen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

