Die permanente Überwachung des Technologiefortschritts bedarf eines sehr hohen Zeitaufwandes und ausgeprägter Fachkenntnisse. Der enorme Anstieg an technologischem Wissen erfordert eine Verbesserung herkömmlicher Methoden zur Recherche bestehenden geistigen Eigentums. In der vorliegenden Arbeit werden die Grundlagen der Patentrecherche näher beleuchtet. Dabei werden die geschützten Patente und übliche Recherchemethoden näher erläutert. Den Schwer-punkt der Arbeit bildet die Darstellung der Optimierung bekannter Recherchemethoden durch die Machine-Learning-Technik mit Hilfe die Support Vector Machine (SVM). Die SVM ist ein Lernalgorithmus zur Ableitung von Gesetzmäßigkeiten aus digitalen Informationen wodurch einerseits die Qualität der Rechercheergebnisse erhöht und andererseits die Durchlaufzeit der Recherche deutlich reduziert wird. Das Material das die Grundlage dieser Arbeit bildet, wurde im Zeitraum von Dezember 2008 bis März 2009 gesammelt. Für die Erstellung dieser Arbeit wurden Werke der relevanten Literatur gesichtet und gesammelt sowie Experteninterviews geführt.
Inhaltsverzeichnis
1 Einleitung
2 Patentinformationen
2.1 Patentliteratur – ihre Vorteile und dessen Informationsumfang
2.2 Aufbau von Patentinformationen
2.2.1 Internationale Patentklassifikation (IPC)
2.2.2 Europäische Patentklassifikation (ECLA)
3 Recherchemethoden
3.1 Informationsrecherchen
3.2 Rechtsbezogene Recherchen
4 Geschützte Technologie abrufen
4.1 Der Weg zu den Patentinformationen
4.2 Analyse der wichtigsten Technologiepools
4.3 Technologiepool - Offline
4.4 Technologiepool und mehr - Online
5 Technologiefortschritte systematisch überwachen
5.1 Informationen digital aufbereiten
5.2 Künstliche Intelligenz antrainieren
5.3 Das Trainieren mit Vektoren
5.4 Technologiefortschritte systematisch im Auge behalten
6 Resümee
Zielsetzung & Themen der Arbeit
Das Hauptziel dieser Arbeit besteht darin, die Grundlagen der Patentrecherche und gängige Schutzrechtsdatenbanken zu beleuchten, um die „Time to market“-Phase von Unternehmen durch den Einsatz moderner Machine-Learning-Techniken zu optimieren und die Qualität sowie Effizienz der Rechercheprozesse zu steigern.
- Grundlagen und Bedeutung von Patentinformationen für Unternehmen
- Methodische Ansätze in der Informations- und rechtsbezogenen Patentrecherche
- Vergleich und Analyse relevanter Schutzrechtsdatenbanken (online und offline)
- Optimierungspotenziale durch die Anwendung der Support Vector Machine (SVM)
- Systematische Vorgehensweise bei der digitalen Aufbereitung und Klassifizierung von Patentdaten
Auszug aus dem Buch
5.1 Informationen digital aufbereiten
Texte, die durch Kodierungen digital aufbereitet werden, können elektronisch analysiert werden. Die Darstellung von Wörtern in Vektoren unterstützt diese Analyse. Dabei enthält jedes Wort eine binäre Definition durch die Kombination von 0 und 1. Es werden mehrere Wörter in einem Vektor zusammengefasst. Diese Vektoren stehen jedoch in keiner Beziehung zu einander. Jedem Wort wird eine Komponente des Vektors zugewiesen wie in Abbildung 5-1 beispielhaft dargestellt. Bei einer großen Anzahl an Wörtern werden mehrere Vektoren parallel aufgebaut.
Bei diesem Ansatz ist jedoch zu berücksichtigen, dass ähnlich geschriebene Wörter einander semantisch nicht gleichen müssen. Die semantischen Zusammenhänge und die Qualität der Ergebnisse konnte bis jetzt nur manuell erkannt werden. Mit dem Ansatz den inhaltlichen Kontext in die Textkodierung zu integrieren, wird ein großer Schritt hin zur künstlichen Intelligenz gesetzt. Es werden hier die Informationen über den resultierenden Vektor aus Wort und dem Kontext in Beziehung gestellt. Der Kontextvektor wird aus dem Mittelwert des Vor- und Nachfolgewortes und des zu kodierenden Wortes gebildet.
Zur Dokumentkodierung ist es zusätzlich notwendig jene Textteile aus dem digitalen Text herauszufiltern, die im gesamten Text nur selten vorkommen oder allgemeine Wörter wie zum Beispiel „sehr“, „und“, „ist“ oder Artikel sind.
Zusammenfassung der Kapitel
1 Einleitung: Beschreibt die Relevanz von Geschwindigkeit in der Technologieüberwachung und führt in das Ziel ein, Patentinformationen durch Machine-Learning effizienter zu nutzen.
2 Patentinformationen: Erläutert den Wert von Patenten als Informationsquelle, ihren Aufbau sowie die Bedeutung hierarchischer Klassifizierungssysteme wie IPC und ECLA.
3 Recherchemethoden: Unterscheidet zwischen technischen Informationsrecherchen und rechtsbezogenen Recherchen und zeigt auf, wie diese zur Innovationsbewertung beitragen.
4 Geschützte Technologie abrufen: Bietet einen Überblick über Datenbankkriterien sowie eine Analyse wichtiger Online- und Offline-Datenbanken und Schutzrechtsportale.
5 Technologiefortschritte systematisch überwachen: Detailliert die technische Optimierung der Recherche mittels Machine-Learning und die Funktionsweise von Support Vector Machines.
6 Resümee: Fasst die Vorteile der kombinierten Anwendung neuer Technologien zur Beschleunigung von Innovationszyklen zusammen.
Schlüsselwörter
Patentrecherche, Technologieüberwachung, Machine-Learning, Support Vector Machine, SVM, Schutzrechtsdatenbanken, Patentklassifikation, IPC, Patentinformationen, Innovationsmanagement, Datenanalyse, Textklassifizierung, Zeitersparnis, Wettbewerbsvorteile, Patentanmeldungen
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht, wie moderne technologische Ansätze, insbesondere Machine-Learning-Methoden, dazu beitragen können, herkömmliche Prozesse der Patentrecherche effizienter und zielgerichteter zu gestalten.
Welche zentralen Themenfelder werden behandelt?
Die Themen umfassen die Grundlagen des Patentwesens, die Methoden der Informationsrecherche, die Nutzung spezialisierter Datenbanken sowie die technische Implementierung von Algorithmen zur Textklassifizierung.
Was ist das primäre Ziel der Untersuchung?
Das Hauptziel ist die Optimierung der „Time to market“-Phase durch den Einsatz der Support Vector Machine, um Rechercheergebnisse qualitativ zu verbessern und die Durchlaufzeiten zu reduzieren.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer Literaturanalyse, dem Studium von Schutzrechtsdatenbanken sowie qualitativen Experteninterviews mit Vertretern der Branche.
Was wird im Hauptteil behandelt?
Der Hauptteil analysiert, wie digitale Textdaten in Vektoren umgewandelt, bereinigt und durch die Support Vector Machine zur automatisierten Klassifizierung von Patenten trainiert werden.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wesentliche Begriffe sind Patentrecherche, Technologieüberwachung, Machine-Learning, Support Vector Machine (SVM) und Patentklassifikation.
Wie funktioniert der Lernprozess der Support Vector Machine in diesem Kontext?
Der Lernprozess umfasst die zyklische Klassifizierung von Trainingsdokumenten, bei der eine Hyperebene zur optimalen Trennung zwischen positiven und negativen Suchergebnissen innerhalb eines Merkmalsraums definiert wird.
Warum ist die manuelle Vorverarbeitung von Texten für den Algorithmus so entscheidend?
Durch das Herausfiltern irrelevanter Füllwörter und die Reduktion auf Stammwörter wird die Datenmenge halbiert, was die Effizienz und Genauigkeit des Klassifizierungsprozesses massiv steigert.
- Quote paper
- Katharina Heil (Author), 2009, Patentrecherche - Technologieüberwachung durch künstliche Intelligenz, Munich, GRIN Verlag, https://www.grin.com/document/130893