Das Open Directory Project beschäftigt keine bezahlten Editoren. Die Indexierung erfolgt von freiwilligen Mitarbeitern. Die Idee und der Name ist von "Open Source" hergeleitet, dessen Idee von der Linux-Community abstammt. Der finnische Student Linus Torvalds hatte Anfang der 90er Jahre sein Betriebssystem im Internet freigegeben, das sich sobald als Alternative zum Betriebssystem Microsoft Windows entwickelte. Der Erfolg von Linux ist der freiwilligen Mitarbeit von Tausenden von Programmierern zu verdanken, die das Betriebssystem mit Programmen, Systemroutinen, Treibern und Softwareprojekten unentgeltlich und frei zur Verfügung stellen. Die Hauptentwickler von Linux arbeiten mit wissenschaftlichem Eifer an dem Projekt und protokollieren ihre Fortschritte. Dieser Grundidee hat auch das Open Directory Project seinen Erfolg zu bedanken, wonach auch Editoren durch freiwillige Teilnahme das ODP-Verzeichnis täglich mit mühseliger handarbeit aktualisieren und indexieren. Auch wird jede Änderung und Aktualisierung automatisch in einem für Editoren sichtbaren Backoffice protokolliert. Die Editoren erhalten somit die Möglichkeit die Gründe ihrer Änderungen für Inhalte zu verfolgen und nachzuvollziehen. Editor kann grundsätzlich jeder werden, der sich für eine bestimmte Kategorie im Verzeichnis bewirbt und sich an die ODP-Richtlinien hält.
[...]
Inhaltsverzeichnis
1. Open Directory Project (ODP)
1.1 Über ODP
1.2 Datenbasis
1.3 Partnerseiten
1.4 Benutzeroberfläche
1.4.1 Corporate Design
1.5 Retrieval
1.5.1 Retriavelbefehle
1.5.2 Ranking
1.5.3 Phrase Suche
1.5.4 Truncation
1.5.5 Metasuche
1.5.6 Filtersuche
1.5.7 Polyhierarchie
1.5.8 Advanced-Search
1.6 Patente
2. FAST (AllTheWeb.com)
2.1 Über FAST
2.2 Benutzeroberfläche
2.2.1 Corporate Design
2.2.2 Customize
2.3 Datenbasis
2.4 Retrieval
2.4. 1 Retrievalbefehle
2.4. 2 Ranking
2.4. 3 Webseiten Ergebnisseite
2.4. 4 Webseiten Advanced Search
2.4. 5 Pictures Ergebnisseite
2.4. 6 Pictures Advance Search
2.4. 7 Videos Ergebnisseite
2.4. 8 Videos Advance Search
2.4. 9 Musikdateien Ergebnisseite
2.4.10 FTP-Ergebnisseite
2.4.11 FTP Advance Search
Zielsetzung und Themen
Die vorliegende Arbeit untersucht und vergleicht die Funktionsweise zweier verschiedener Ansätze im Bereich der Internet-Suchmaschinen: das manuell indexierte Verzeichnis "Open Directory Project" (ODP) und die automatisch indexierende Suchmaschine FAST (AllTheWeb.com). Ziel ist die detaillierte Analyse der jeweiligen Datenbasis, des Retrievalsystems sowie der benutzerspezifischen Oberfläche.
- Strukturanalyse von manuellen Webverzeichnissen (ODP)
- Leistungsfähigkeit automatischer Suchmaschinen (FAST)
- Vergleich von Suchoperatoren und Retrieval-Funktionalitäten
- Benutzeroberflächen und Individualisierungsmöglichkeiten (Customize)
- Erweiterte Mediensuche (Bilder, Videos, FTP, Musik)
Auszug aus dem Buch
1.2 Datenbasis
Bei ODP handelt es sich um ein polyhierarchisches Kategorieverzeichnis. Inhalte von Webseiten werden nicht wie etwa bei Google als Volltext indexiert. Die Indexierung der Webseiten wird von freiwilligen Editoren ins Verzeichnis mit der Internetadresse (URL) und einer passenden Beschreibung zur Webseite vorgenommen. Somit bleibt gerade eine Suche nach speziellen Suchwörtern auf die im Verzeichnis dokumentierten Kurzbeschreibungen und den Namen der URLs beschränkt.
Derzeit sind 43 000 Editoren bei ODP aktiv beschäftigt, die insgesamt 2,2 Millionen Webseiten verwalten. Die Kategorien sind mit 440 000 an der Zahl sehr hoch und daher auch aufgrund der Polyhierarchie, die zudem noch in verschiedene Sprachen unterteilt ist, sehr komplex und unüberschaubar. Die Editoren haben meist in verschiedenen Bereichen freie Hand neue Klassen zu schaffen und Unterverzeichnisse mit neuen Klassen zu bereichern. Somit ist trotz vieler Regeln für Editoren ein willkürlich gestaltetes Verzeichnis unvermeidlich.
Zusammenfassung der Kapitel
1. Open Directory Project (ODP): Erläutert das Konzept der manuellen Indexierung durch freiwillige Editoren, den Aufbau des polyhierarchischen Verzeichnisses sowie die technischen Retrieval-Möglichkeiten.
2. FAST (AllTheWeb.com): Beschreibt die leistungsstarke, automatisch indexierende Suchmaschine, die sich durch Schnelligkeit und die Indizierung verschiedener Dateitypen wie Videos und FTP-Inhalte auszeichnet.
Schlüsselwörter
Internet, Suchmaschinen, ODP, Open Directory Project, FAST, AllTheWeb, Retrieval, Indexierung, Datenbank, Suchoperatoren, Benutzeroberfläche, Webverzeichnis, Volltextsuche, Polyhierarchie, Internetökonomie.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit bietet eine fundierte Analyse und einen Vergleich von zwei unterschiedlichen Typen von Internet-Suchmaschinen: dem auf redaktioneller Arbeit basierenden Open Directory Project (ODP) und der technischen Suchmaschine FAST.
Was sind die zentralen Themenfelder?
Die Schwerpunkte liegen in der Untersuchung der Datenbasis, der Suchlogik (Retrieval), der Gestaltung der Benutzeroberflächen sowie der Möglichkeiten zur Individualisierung durch den Endanwender.
Was ist das primäre Ziel der Untersuchung?
Ziel ist es, die Funktionsweisen und die jeweilige Architektur der Suchsysteme transparent zu machen, um die Vor- und Nachteile manueller gegenüber automatischer Indexierung aufzuzeigen.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer deskriptiven Analyse und dem Vergleich der tatsächlichen technischen Implementierungen sowie der Benutzeroberflächen der beiden untersuchten Systeme zum Zeitpunkt des Jahres 2002.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in eine detaillierte technische Beschreibung beider Systeme, unterteilt in die Abschnitte Über, Datenbasis, Benutzeroberfläche (inkl. Corporate Design und Customize) sowie eine eingehende Erläuterung der Retrieval-Befehle.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird durch Begriffe wie Suchmaschinen, Webverzeichnis, Retrieval, Volltextsuche, Indexierung und Open Source geprägt.
Wie unterscheidet sich die Indexierung bei ODP im Vergleich zu FAST?
ODP nutzt menschliche Editoren, die URLs manuell kategorisieren und beschreiben, während FAST vollautomatische Spider einsetzt, die das Web durchsuchen und Volltexte sowie spezifische Dateiformate indexieren.
Welche Bedeutung hat die "Polyhierarchie" im ODP-Kontext?
Die Polyhierarchie ermöglicht es, dass ein und dasselbe Webseiten-Eintrag in verschiedenen thematischen Kategorien gleichzeitig gelistet werden kann, was die Auffindbarkeit erhöht, aber auch eine komplexe Verzeichnisstruktur erzeugt.
- Quote paper
- Evrim Sen (Author), 2002, Internet Suchmaschinen ODP (DMOZ) und FAST (ALLTHEWEB), Munich, GRIN Verlag, https://www.grin.com/document/8190