Die Forschung wurde im Formalismus der lokalen Grammatiken durchgeführt und untersucht die Implementierung dieser Theorie für die Information Extraktion aus dem EBAY Content (auf dem Beispiel von Schmuck-Domäne des deutschen EBAY).
Der auf dem Formalismus von lokalen Grammatiken aufgebaute IE-Mechanismus zeigt sehr hohe Präzision und Recall. Außerdem analysieren die lokalen Grammatiken synonymische Konstruktionen und die verfügbaren Wörterbücher enthalten verschiedene morphologische und fehlerhafte Wortformen sowie große Anzahl an Komposita. Darüber hinaus verfügen die lokalen endlichen Automaten über eine sehr gute Portabilität. Das System ist auf den Modulen aufgebaut und sie können in den bestimmten Abschnitten durch andere Module ersetzt werden.
Auf solche Art und Weise aufgebaute semantische Spezialsuchmaschinen für jede EBAY-Domäne können ganz schnell die Queries analysieren und dazu die passenden Items auffinden. Das dargestellte Verfahren wird es ermöglichen, den Bedarf von EBAY Kunden zu analysieren, bessere Navigation durch die zahlreichen Angeboten zu schaffen und die gezielten Werbungsmöglichkeiten zu bieten.
Inhaltsverzeichnis
- 1 Einführung
- 2 Darstellung des Forschungsgebiets
- 2.1 Lokale Grammatiken
- 2.2 Spezialsuchmaschinen
- 2.3 Arbeitsziel
- 3 Übersicht der Spezialsuchmaschinen von Schmuck-Domäne
- 3.1 ICE
- 3.2 Stylight
- 4 Übersicht der EBAY Suche in Schmuck Domäne
- 4.1 Beschreibung der Schmuck Domäne
- 4.2 Items
- 4.3 Queries
- 4.4 Evaluierung der Suchqualität bei EBAY
- 5 Arbeitsverfahren
- 5.1 Preprocessing
- 5.2 Lexikonstruktur der Domäne
- 5.3 Flektion und Wortbildung
- 5.4 Graphenbeschreibung
- 6 Auswertung der Ergebnisse
- 7 Fazit
- 8 Literaturverzeichnis
- ANNEX A: Graphen und Konkordanzen
Zielsetzung und Themenschwerpunkte
Diese Arbeit untersucht die Informationsextraktion aus dem eBay-Content mithilfe von lokalen Grammatiken, speziell im Bereich der Schmuck-Domäne des deutschen eBay. Das Hauptziel besteht in der Evaluierung der bestehenden eBay-Suche und der Erstellung sowie Bewertung von lokalen Grammatiken, die auf einem Korpus von Artikeln und Suchanfragen basieren. Die Arbeit ist Teil eines größeren Projekts am CIS, welches die Entwicklung spezialisierter Suchmaschinen für verschiedene eBay-Domänen zum Ziel hat.
- Evaluierung der eBay-Suche in der Schmuck-Domäne
- Erstellung lokaler Grammatiken für die Schmuck-Domäne
- Bewertung der erstellten lokalen Grammatiken
- Analyse der Herausforderungen bei der Suche nach fehlerhaften oder informellen Eingaben im Web 2.0 Kontext
- Anwendung von Korpusbearbeitungstools (UNITEX) zur Grammatikentwicklung
Zusammenfassung der Kapitel
1 Einführung: Diese Einleitung beschreibt das Thema der Arbeit: die Informationsextraktion mithilfe lokaler Grammatiken für die deutsche eBay-Schmuck-Domäne. Sie hebt die Herausforderungen der klassischen String-basierten Suche bei informellen, fehlerhaften Webtexten hervor und betont den Vorteil lokaler Grammatiken zur Verbesserung der Suchergebnisse in Online-Shops. Die Arbeit wird als Teil eines größeren CIS-Projekts zur Entwicklung spezialisierter Suchmaschinen für eBay vorgestellt, mit dem konkreten Ziel der Evaluierung der eBay-Suche und der Erstellung und Bewertung von lokalen Grammatiken für die Schmuck-Domäne.
2 Darstellung des Forschungsgebiets: Dieses Kapitel definiert den Forschungsrahmen, indem es die Konzepte der lokalen Grammatiken und spezialisierter Suchmaschinen erläutert. Es skizziert den Stellenwert der Arbeit innerhalb des größeren interdisziplinären Projekts und legt das konkrete Arbeitsziel fest: die Evaluierung der eBay-Suche in der Schmuck-Domäne und die Entwicklung sowie Bewertung darauf basierender lokaler Grammatiken. Der Fokus liegt auf der Erklärung der theoretischen Grundlagen, die für die praktische Arbeit relevant sind.
3 Übersicht der Spezialsuchmaschinen von Schmuck-Domäne: Dieses Kapitel bietet einen Überblick über existierende spezialisierte Suchmaschinen im Bereich Schmuck, beispielsweise ICE und Stylight. Es analysiert deren Funktionalität und Suchmechanismen, um einen Vergleichsrahmen für die spätere Evaluierung der eBay-Suche zu schaffen. Die Analyse dient als Grundlage für die Bewertung der Effektivität der im Rahmen der Arbeit entwickelten lokalen Grammatiken.
4 Übersicht der EBAY Suche in Schmuck Domäne: Dieses Kapitel beschreibt detailliert die Schmuck-Domäne auf eBay. Es analysiert die Struktur der angebotenen Artikel (Items) und die Form der Suchanfragen (Queries). Ein zentraler Punkt ist die Evaluierung der Suchqualität der bestehenden eBay-Suche innerhalb dieser Domäne, um die Schwächen aufzuzeigen, die durch die Entwicklung der lokalen Grammatiken behoben werden sollen. Die detaillierte Beschreibung der Daten bildet die Grundlage für die Erstellung der Grammatiken.
5 Arbeitsverfahren: Dieses Kapitel beschreibt die Methodik der Arbeit, angefangen vom Preprocessing der Daten über die Erstellung der Lexikonstruktur der Domäne bis hin zur Berücksichtigung von Flexion und Wortbildung und der finalen Graphenbeschreibung. Es erläutert detailliert die einzelnen Schritte der Erstellung der lokalen Grammatiken und liefert Einblicke in die angewandten Techniken und Werkzeuge, wie z.B. UNITEX. Die genaue Beschreibung der Vorgehensweise dient der Reproduzierbarkeit der Ergebnisse.
6 Auswertung der Ergebnisse: Dieses Kapitel präsentiert die Ergebnisse der Arbeit, vermutlich die Evaluierung der entwickelten lokalen Grammatiken und einen Vergleich mit der Standard-eBay-Suche. Es wird erwartet, dass hier die Leistungsfähigkeit der neuen Grammatiken im Bezug auf Genauigkeit und Effizienz der Informationsextraktion aus den eBay-Daten gezeigt wird. Dieser Abschnitt stellt den Kern der Forschungsleistung dar.
Schlüsselwörter
Informationsextraktion, Lokale Grammatiken, Spezialsuchmaschinen, eBay, Schmuck-Domäne, Korpuslinguistik, UNITEX, Suchmaschinenoptimierung, Web 2.0, Information Retrieval.
Häufig gestellte Fragen (FAQ) zur Arbeit: Informationsextraktion aus eBay-Daten mittels lokaler Grammatiken
Was ist das Thema der Arbeit?
Die Arbeit befasst sich mit der Informationsextraktion aus dem eBay-Content, speziell in der Schmuck-Domäne, unter Verwendung lokaler Grammatiken. Ziel ist die Evaluierung der bestehenden eBay-Suche und die Entwicklung sowie Bewertung von verbesserten Suchmethoden.
Welche Methoden werden verwendet?
Die Arbeit nutzt lokale Grammatiken und Korpuslinguistik-Tools wie UNITEX zur Entwicklung und Bewertung von Suchmechanismen. Es werden existierende spezialisierte Suchmaschinen (z.B. ICE, Stylight) analysiert und als Vergleichsbasis herangezogen. Die Methodik umfasst Preprocessing, die Erstellung einer Lexikonstruktur der Domäne, die Berücksichtigung von Flexion und Wortbildung sowie die Graphenbeschreibung.
Was ist das Ziel der Arbeit?
Das Hauptziel ist die Evaluierung der bestehenden eBay-Suche in der Schmuck-Domäne und die Entwicklung von lokalen Grammatiken, die die Suchqualität verbessern. Es geht darum, die Herausforderungen der klassischen String-basierten Suche bei informellen und fehlerhaften Eingaben im Web 2.0 Kontext zu analysieren und zu lösen.
Welche Daten werden verwendet?
Die Arbeit basiert auf einem Korpus von Artikeln (Items) und Suchanfragen (Queries) aus der deutschen eBay-Schmuck-Domäne. Die Analyse der Struktur dieser Daten bildet die Grundlage für die Erstellung der lokalen Grammatiken.
Welche konkreten Schritte umfasst die Arbeit?
Die Arbeit gliedert sich in die folgenden Schritte: Darstellung des Forschungsgebiets (lokale Grammatiken, spezialisierte Suchmaschinen), Übersicht bestehender Suchmaschinen (z.B. ICE, Stylight), detaillierte Analyse der eBay-Suche in der Schmuck-Domäne (Items, Queries, Evaluierung der Suchqualität), Beschreibung des Arbeitsverfahrens (Preprocessing, Lexikonstruktur, Flexion, Wortbildung, Graphenbeschreibung), Auswertung der Ergebnisse und abschließendes Fazit.
Wie werden die Ergebnisse ausgewertet?
Die Auswertung der Ergebnisse umfasst vermutlich einen Vergleich der entwickelten lokalen Grammatiken mit der Standard-eBay-Suche. Es wird die Leistungsfähigkeit der neuen Grammatiken bezüglich Genauigkeit und Effizienz der Informationsextraktion bewertet.
Welche Schlüsselwörter beschreiben die Arbeit?
Informationsextraktion, Lokale Grammatiken, Spezialsuchmaschinen, eBay, Schmuck-Domäne, Korpuslinguistik, UNITEX, Suchmaschinenoptimierung, Web 2.0, Information Retrieval.
Wo findet man die detaillierten Ergebnisse?
Die detaillierten Ergebnisse, inklusive Graphen und Konkordanzen, befinden sich im Anhang A der Arbeit.
Welchen Beitrag leistet die Arbeit?
Die Arbeit leistet einen Beitrag zur Verbesserung der Informationsextraktion und Suchqualität in Online-Shops, insbesondere bei informellen und fehlerhaften Eingaben. Sie zeigt die Anwendung von lokalen Grammatiken und Korpuslinguistik-Methoden zur Lösung spezifischer Herausforderungen im Web 2.0 Kontext.
- Citation du texte
- Olga Morozova (Auteur), 2009, Information Extraktion aus dem EBAY-Content mithilfe von lokalen Grammatiken, Munich, GRIN Verlag, https://www.grin.com/document/140334