Examensarbeit, 2007
58 Seiten, Note: 1,0
Diese Arbeit befasst sich mit der automatischen Klassifizierung und Informationsextraktion von Angebotsbeschreibungen für Online-Einkaufsportale. Ziel ist es, linguistische Informationen aus den Angebotstexten zu nutzen, um die darin beschriebenen Produkte zu klassifizieren.
Die Arbeit ist in zwei Teile gegliedert: Im ersten Teil wird der theoretische Hintergrund der Untersuchung erläutert. Hier werden die Merkmale des Korpus, die relevanten Relatoren und deren Funktionen sowie die Typologie der Relata analysiert. Im zweiten Teil wird ein praktischer Ansatz vorgestellt, der die Erkenntnisse aus der linguistischen Untersuchung auf die Klassifizierung von Telekommunikationsprodukten anwendet.
Die Arbeit beschäftigt sich mit folgenden Themenbereichen: Computerlinguistik, Informationsextraktion, Angebotsbeschreibungen, Online-Einkaufsportale, Rekursive Transitionsnetzwerke, linguistische Analyse, automatische Klassifizierung, Produktinformationen, Telekommunikationsprodukte.
Sie nutzt computerlinguistische Methoden, um lexikalische Daten und syntaktische Strukturen in Angebotstexten zu analysieren und wiederkehrende Muster für die Informationsextraktion zu erkennen.
RTNs sind formale Werkzeuge zur Darstellung von Grammatiken, mit denen komplexe sprachliche Muster in Texten erkannt und für die automatische Verarbeitung formalisiert werden können.
Diese sogenannten Relatoren zeigen Beziehungen zwischen Objekten auf (z.B. „Handy mit Vertrag“), was entscheidend ist, um die Art und Zusammensetzung eines Verkaufsobjektes zu verstehen.
Sie ermöglicht es, große Mengen an unstrukturierten Produktdaten automatisch zu verarbeiten, was die Suchtechnologie verbessert und den manuellen Aufwand sowie die Kosten senkt.
Der Ansatz wurde konkret auf die Kategorie Telekommunikationsprodukte angewendet, um Set-Relationen (z.B. Bundles aus Hardware und Vertrag) automatisch zu identifizieren.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

