Wikipedia ist eines der größten im Internet zugänglichen enzyklopädischem Wissensarchive. Das stetige Wachstum hat jedoch eine so große Menge an Daten geschaffen, dass es immer schwerer wird Informationen zu finden. Die unterstützende Strukturierung durch den Computer ist dringend notwendig. Voraussetzung ist eine maschinell lesbare, semantische Kommentierung In dieser Arbeit sollen die Möglichkeiten einer semantischen Wikipedia ausgeleuchtet werden und die Entwicklungen praktischer Ansätze nachvollzogen werden.
Inhaltsverzeichnis
1 Motivation
2 Theoretischer Hintergrund
2.1 Grundbegriffe
2.2 Semantisches Wiki
3 Die Wikipedia als semantisches Wiki?
3.1 Aktuelle Umsetzung der Wikipedia
3.2 Nachteile der bestehenden Struktur
3.3 Vorteile einer semantischen Strukturierung der Wikipedia
3.4 Probleme, die durch Semantik in der Wikipedia entstehen
3.5 Überblick über den Entwicklungsstand praktischer Ansätze
3.6 Gründe für die Verzögerung einer Einführung von Semantik
4 Fazit
Zielsetzung & Themen
Die Arbeit untersucht das Potenzial und die Herausforderungen bei der Einführung semantischer Technologien in die Wikipedia, um die durch das enorme Datenwachstum entstandene Unübersichtlichkeit zu bewältigen und eine maschinelle Interpretierbarkeit der Inhalte zu ermöglichen.
- Grundlagen des Wissensmanagements und semantischer Wikis
- Analyse der bestehenden Wikipedia-Struktur und ihrer Limitationen
- Vorteile und Problemstellungen semantischer Anreicherung
- Chronologische Entwicklung praktischer Lösungsansätze, insbesondere Wikidata
- Diskussion über Akzeptanz und Komplexität bei ehrenamtlichen Beiträgen
Auszug aus dem Buch
3.2 Nachteile der bestehenden Struktur
Die beschriebene Struktur ist eine sinnvolle Unterstützung für die Recherche. Die formalen Ansprüche für die Interpretation durch einen Computer werden dabei jedoch nicht erfüllt. Sich daraus ergebende Nachteile sollen im Folgenden dargestellt werden.
Nachteilig sind synonyme Einträge, die trotz gleichen Inhaltes mehrfach bestehen, und homonyme Titel, die gleichzeitig auf vollständig unterschiedliche Inhalte verweisen. Es bestehen zwar redirects, Weiterleitungen von Synonymen zu einem Hauptartikel und disambiguation pages, Übersichtsseiten, die Homonyme auflösen. Das begegnet dem Problem jedoch nur auf maschinell nicht lesbarer Ebene. So kann es beispielsweise passieren, dass gleiche Inhalte voneinander unabhängig an verschiedenen Stellen entstehen, weil die Doppelung nicht bemerkt wird (Krötzsch et al., 2007, S. 253).
Neben der Fehleranfälligkeit menschlichen Handelns ist auch die verarbeitbare Menge an Informationen begrenzt und könnte durch den Computer unterstützt werden. Allerdings können in Wikipedia Informationen, die über mehrere Artikel verteilt sind, nicht automatisch zusammengeführt werden. Eine Suchanfrage kann nicht mehrere Artikel gleichzeitig einschließen und anhand gewünschter Parameter vergleichen (Krötzsch et al., 2007, S. 251). Sucht man zum Beispiel alle James Bond Filme aus den Sechzigern, in denen Sean Connery nicht mitspielt, wird kein sinnvolles Ergebnis ausgegeben, obwohl die Information in der Wikipedia gespeichert ist (Krötzsch, Vrandečić, & Völkel, 2005, S. 1-2).
Ebenso sind die Daten für Abfragen externer Dienste nur begrenzt brauchbar, weil ein Standard zum Austausch fehlt. Insbesondere bei Daten in Zahlenform ist die automatische Interpretation abhängig von Algorithmen, die durch Fehler die Qualität der extrahierten Daten herabsetzen (Krötzsch et al., 2007, S. 251).
Zusammenfassung der Kapitel
1 Motivation: Die Einführung erläutert die Notwendigkeit, Wikipedia-Inhalte für Computer interpretierbar zu machen, um die enorme Informationsmenge effizienter strukturieren und durchsuchbar gestalten zu können.
2 Theoretischer Hintergrund: Dieses Kapitel definiert die grundlegenden Begriffe Daten, Information und Wissen sowie das Konzept des semantischen Wikis als Werkzeug zur Wissensverwaltung.
3 Die Wikipedia als semantisches Wiki?: Dieser Hauptteil analysiert den aktuellen Aufbau der Wikipedia, diskutiert Vor- und Nachteile semantischer Ansätze und betrachtet die historische Entwicklung von Semantic MediaWiki bis hin zu Wikidata.
4 Fazit: Die Arbeit schließt mit der Erkenntnis, dass das Potenzial der Semantik groß ist, jedoch ein ausgewogenes Maß an Formalisierung erforderlich bleibt, um die ehrenamtliche Mitarbeit nicht zu gefährden.
Schlüsselwörter
Wikipedia, Wissensmanagement, semantische Wikis, Wikidata, Semantic MediaWiki, maschinelle Interpretierbarkeit, Ontologien, Datenstrukturierung, Informationsabfrage, Web 2.0, Datenqualität, Annotationen, Wissensmodellierung.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der Herausforderung, die Wikipedia durch den Einsatz semantischer Technologien für Computer maschinell interpretierbar zu machen, um die Informationsrecherche und Datenverwaltung zu verbessern.
Was sind die zentralen Themenfelder der Arbeit?
Die zentralen Themen umfassen Wissensmanagement, die Funktionsweise von semantischen Wikis, die aktuelle Architektur der Wikipedia sowie die technologische Entwicklung von Ansätzen wie Wikidata.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist es, die Möglichkeiten einer semantischen Wikipedia auszuloten, die Vorteile gegenüber der bestehenden Struktur aufzuzeigen und zu erörtern, warum eine solche Implementierung in der Praxis nur schleppend vorangeht.
Welche wissenschaftliche Methode wird verwendet?
Die Autorin/der Autor wendet eine Literaturanalyse und eine chronologische Untersuchung der technologischen Entwicklungsgeschichte praktischer Ansätze zur semantischen Wikipedia an.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil analysiert die Schwachstellen der aktuellen Wikipedia-Struktur, diskutiert die Anforderungen an semantische Annotationen und zeichnet den Weg von frühen Ideen wie Semantic MediaWiki bis zum aktuellen Projekt Wikidata nach.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit ist geprägt durch Begriffe wie semantische Wikis, Datenstrukturierung, Wikidata, Wissensmanagement, maschinelle Interpretierbarkeit und Annotationen.
Welche Rolle spielt die Komplexität bei der Einführung von Semantik?
Eine zu hohe Komplexität und der damit verbundene Zeitaufwand bei der formalen Eingabe von Daten drohen die ehrenamtlichen Mitarbeiter zu überfordern und die Beteiligung an der Wikipedia zu hemmen.
Wie unterscheidet sich der Ansatz von Wikidata von früheren Konzepten?
Während frühere Ansätze wie Semantic MediaWiki Annotationen direkt im Fließtext vorsahen, setzt Wikidata auf eine zentrale Sammlung von Daten, die über Infoboxen abgerufen werden, um die Formalisierung für Nutzer zu minimieren.
- Quote paper
- M L (Author), 2012, Semantic Wikis: die neue Faktendatenbank der Wikipedia, Munich, GRIN Verlag, https://www.grin.com/document/201382