Bachelorarbeit, 2009
39 Seiten, Note: 2
1 Einleitung
2 Patentinformationen
2.1 Patentliteratur – ihre Vorteile und dessen Informationsumfang
2.2 Aufbau von Patentinformationen
2.2.1 Internationale Patentklassifikation (IPC)
2.2.2 Europäische Patentklassifikation (ECLA)
3 Recherchemethoden
3.1 Informationsrecherchen
3.2 Rechtsbezogene Recherchen
4 Geschützte Technologie abrufen
4.1 Der Weg zu den Patentinformationen
4.2 Analyse der wichtigsten Technologiepools
4.3 Technologiepool - Offline
4.4 Technologiepool und mehr - Online
5 Technologiefortschritte systematisch überwachen
5.1 Informationen digital aufbereiten
5.2 Künstliche Intelligenz antrainieren
5.3 Das Trainieren mit Vektoren
5.4 Technologiefortschritte systematisch im Auge behalten
6 Resümee
Das Hauptziel dieser Arbeit besteht darin, die Grundlagen der Patentrecherche und gängige Schutzrechtsdatenbanken zu beleuchten, um die „Time to market“-Phase von Unternehmen durch den Einsatz moderner Machine-Learning-Techniken zu optimieren und die Qualität sowie Effizienz der Rechercheprozesse zu steigern.
5.1 Informationen digital aufbereiten
Texte, die durch Kodierungen digital aufbereitet werden, können elektronisch analysiert werden. Die Darstellung von Wörtern in Vektoren unterstützt diese Analyse. Dabei enthält jedes Wort eine binäre Definition durch die Kombination von 0 und 1. Es werden mehrere Wörter in einem Vektor zusammengefasst. Diese Vektoren stehen jedoch in keiner Beziehung zu einander. Jedem Wort wird eine Komponente des Vektors zugewiesen wie in Abbildung 5-1 beispielhaft dargestellt. Bei einer großen Anzahl an Wörtern werden mehrere Vektoren parallel aufgebaut.
Bei diesem Ansatz ist jedoch zu berücksichtigen, dass ähnlich geschriebene Wörter einander semantisch nicht gleichen müssen. Die semantischen Zusammenhänge und die Qualität der Ergebnisse konnte bis jetzt nur manuell erkannt werden. Mit dem Ansatz den inhaltlichen Kontext in die Textkodierung zu integrieren, wird ein großer Schritt hin zur künstlichen Intelligenz gesetzt. Es werden hier die Informationen über den resultierenden Vektor aus Wort und dem Kontext in Beziehung gestellt. Der Kontextvektor wird aus dem Mittelwert des Vor- und Nachfolgewortes und des zu kodierenden Wortes gebildet.
Zur Dokumentkodierung ist es zusätzlich notwendig jene Textteile aus dem digitalen Text herauszufiltern, die im gesamten Text nur selten vorkommen oder allgemeine Wörter wie zum Beispiel „sehr“, „und“, „ist“ oder Artikel sind.
1 Einleitung: Beschreibt die Relevanz von Geschwindigkeit in der Technologieüberwachung und führt in das Ziel ein, Patentinformationen durch Machine-Learning effizienter zu nutzen.
2 Patentinformationen: Erläutert den Wert von Patenten als Informationsquelle, ihren Aufbau sowie die Bedeutung hierarchischer Klassifizierungssysteme wie IPC und ECLA.
3 Recherchemethoden: Unterscheidet zwischen technischen Informationsrecherchen und rechtsbezogenen Recherchen und zeigt auf, wie diese zur Innovationsbewertung beitragen.
4 Geschützte Technologie abrufen: Bietet einen Überblick über Datenbankkriterien sowie eine Analyse wichtiger Online- und Offline-Datenbanken und Schutzrechtsportale.
5 Technologiefortschritte systematisch überwachen: Detailliert die technische Optimierung der Recherche mittels Machine-Learning und die Funktionsweise von Support Vector Machines.
6 Resümee: Fasst die Vorteile der kombinierten Anwendung neuer Technologien zur Beschleunigung von Innovationszyklen zusammen.
Patentrecherche, Technologieüberwachung, Machine-Learning, Support Vector Machine, SVM, Schutzrechtsdatenbanken, Patentklassifikation, IPC, Patentinformationen, Innovationsmanagement, Datenanalyse, Textklassifizierung, Zeitersparnis, Wettbewerbsvorteile, Patentanmeldungen
Die Arbeit untersucht, wie moderne technologische Ansätze, insbesondere Machine-Learning-Methoden, dazu beitragen können, herkömmliche Prozesse der Patentrecherche effizienter und zielgerichteter zu gestalten.
Die Themen umfassen die Grundlagen des Patentwesens, die Methoden der Informationsrecherche, die Nutzung spezialisierter Datenbanken sowie die technische Implementierung von Algorithmen zur Textklassifizierung.
Das Hauptziel ist die Optimierung der „Time to market“-Phase durch den Einsatz der Support Vector Machine, um Rechercheergebnisse qualitativ zu verbessern und die Durchlaufzeiten zu reduzieren.
Die Arbeit basiert auf einer Literaturanalyse, dem Studium von Schutzrechtsdatenbanken sowie qualitativen Experteninterviews mit Vertretern der Branche.
Der Hauptteil analysiert, wie digitale Textdaten in Vektoren umgewandelt, bereinigt und durch die Support Vector Machine zur automatisierten Klassifizierung von Patenten trainiert werden.
Wesentliche Begriffe sind Patentrecherche, Technologieüberwachung, Machine-Learning, Support Vector Machine (SVM) und Patentklassifikation.
Der Lernprozess umfasst die zyklische Klassifizierung von Trainingsdokumenten, bei der eine Hyperebene zur optimalen Trennung zwischen positiven und negativen Suchergebnissen innerhalb eines Merkmalsraums definiert wird.
Durch das Herausfiltern irrelevanter Füllwörter und die Reduktion auf Stammwörter wird die Datenmenge halbiert, was die Effizienz und Genauigkeit des Klassifizierungsprozesses massiv steigert.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

