Internet Suchmaschinen ODP (DMOZ) und FAST (ALLTHEWEB)


Hausarbeit, 2002

32 Seiten, Note: 1


Leseprobe

Inhalt

1. Open Directory Project (ODP)
1.1 Uber ODP
1.2 Datenbasis
1.3 Partnerseiten
1.4 Benutzeroberflache
1.4.1 Corporate Design
1.5 Retrieval
1.5.1 Retriavelbefehle
1.5.2 Ranking
1.5.3 Phrase Suche
1.5.4 Truncation
1.5.5 Metasuche
1.5.6 Filtersuche
1.5.7 Polyhierarchie
1.5.8 Advanced-Search
1.6 Patente

2. FAST (AllTheWeb.com)
2.1 Uber FAST
2.2 Benutzeroberflache
2.2.1 Corporate Design
2.2.2 Customize
2.3 Datenbasis
2.4 Retrieval
2.4.1 Retrievalbefehle
2.4.2 Ranking
2.4.3 Webseiten Ergebnisseite
2.4.4 Webseiten Advanced Search
2.4.5 Pictures Ergebnisseite
2.4.6 Pictures Advance Search
2.4.7 Videos Ergebnisseite
2.4.8 Videos Advance Search
2.4.9 Musikdateien Ergebnisseite
2.4.10 FTP-Ergebnisseite
2.4.11 FTP Advance Search

3. Quellenverzeichnis

Literatur

Links

1. Open Directory Project (ODP)

1.1 Uber ODP

Das Open Directory Project beschaftigt keine bezahlten Editoren. Die Indexierung erfolgt von freiwilligen Mitarbeitern. Die Idee und der Name ist von "Open Source" hergeleitet, dessen Idee von der Linux-Community abstammt. Der finnische Student Linus Torvalds hatte Anfang der 90er Jahre sein Betriebssystem im Internet freigegeben, das sich sobald als Alternative zum Betriebssystem Microsoft Windows entwickelte. Der Erfolg von Linux ist der freiwilligen Mitarbeit von Tausenden von Programmierern zu verdanken, die das Betriebssystem mit Programmen, Systemroutinen, Treibern und Softwareprojekten unentgeltlich und frei zur Verfugung stellen. Die Hauptentwickler von Linux arbeiten mit wissenschaftlichem Eifer an dem Projekt und protokollieren ihre Fortschritte.

Dieser Grundidee hat auch das Open Directory Project seinen Erfolg zu bedanken, wonach auch Editoren durch freiwillige Teilnahme das ODP-Verzeichnis taglich mit muhseliger handarbeit aktualisieren und indexieren. Auch wird jede Anderung und Aktualisierung automatisch in einem fur Editoren sichtbaren Backoffice protokolliert. Die Editoren erhalten somit die Moglichkeit die Grunde ihrer Anderungen fur Inhalte zu verfolgen und nachzuvollziehen. Editor kann grundsatzlich jeder werden, der sich fur eine bestimmte Kategorie im Verzeichnis bewirbt und sich an die ODP-Richtlinien halt.

1.2 Datenbasis

Bei ODP handelt es sich um ein polyhierarchisches Kategorieverzeichnis. Inhalte von Webseiten werden nicht wie etwa bei Google als Volltext indexiert. Die Indexierung der Webseiten wird von freiwilligen Editoren ins Verzeichnis mit der Internetadresse (URL) und einer passenden Beschreibung zur Webseite vorgenommen. Somit bleibt gerade eine Suche nach speziellen Suchwortern auf die im Verzeichnis dokumentierten Kurzbeschreibungen und den Namen der URLs beschrankt.

Derzeit sind 43 000 Editoren bei ODP aktiv beschaftigt, die insgesamt 2,2 Millionen Webseiten verwalten. Die Kategorien sind mit 440 000 an der Zahl sehr hoch und daher auch aufgrund der Polyhierarchie, die zudem noch in verschiedene Sprachen unterteilt ist, sehr komplex und unuberschaubar. Die Editoren haben meist in verschiedenen Bereichen freie Hand neue Klassen zu schaffen und Unterverzeichnisse mit neuen Klassen zu bereichern. Somit ist trotz vieler Regeln fur Editoren ein willkurlich gestaltetes Verzeichnis unvermeidlich (Abb. 1).

Abb. 1: BackOffice fur Editoren

Abbildung in dieser Leseprobe nicht enthalten

Die Software fur die Suchfunktion namens Isearch wurde in das ODP implementiert. Das Tool Isearch (ebenfalls Open Source, also frei) wird von dem Unternehmen Etymon ® entwickelt und angeboten. Weitere Veranderungen seitens ODP im Quelltext wurden nicht vorgenommen. Somit geht die Suche lediglich uber die dem ISO Standard angepassten Booleschen Operatoren nicht hinaus.

1.3 Partnerseiten

Gerade Suchmaschinen mit automatischer Indexierung bieten als Zusatz auch ein Verzeichnis an. Hier wird oft auf ODP zugegriffen, wie beispielsweise bei der bekannten Suchmaschine Google unter dem Menu "Verzeichnis".

Google nutzt hierbei eine Schnittstelle zu ODP. Inhalte werden von ODP auf eigener Google- Datenbank auf gewohnter Google-Oberflache angeboten (Abb. 2).

Abb. 2: Googles Verzeichnis bei Google.de

Abbildung in dieser Leseprobe nicht enthalten

Ahnlich machen es auch Partner wie AOL Search, AltaVista, HotBot, Lycos und Netscape Search. Aktualisierungen und Inhalte durch ODP werden jedoch durch den zeitverzogerten Datentransport erst nach zwei Wochen bis mehrere Monate bei diesen Partnern wirksam. Insgesamt hat ODP uber 350 Partner ansprechen konnen, die die ODP-Datenbank den Nutzern auf Webseiten prasentieren. Darunter sind auch franzosische, italienische, niederlandische, polnische, schwedische und spanische Anbieter, die Inhalte in eigener Landessprache anbieten.

Link: http://dmoz.org/World/Deutsch/Computer/Internet/Suchen/Verzeichnisse/Open_Directory_Project/Nutzer/

Die Ubernahme der ODP-Datenbank ist kostenfrei moglich, solange ein Hinweis auf das ODP erfolgt.

Link:

Deutsch: dmoz.de/Lizenz Englisch: dmoz.org/license.html

1.4 Benutzeroberflache

ODP geht bei der Anzeige von einer Breite von maximal 800 Pixel aus und ist somit auch fur Benutzer mit geringerer Bildschirmauflosung, also den einfachen Durchschnittsanwender, ansprechend. Auf der Hauptseite wird zunachst der Suchbegriff gezeigt, darunter die Topterms der ODP Datenbank (Abb. 3). ODP verzichtet insgesamt auf Werbung, Nachrichten und sonstige Features. Somit erubrigt sich eine Seitenaufteilung in verschiedene Kolumnen, wie man es aus kommerziellen Seiten kennt (z.B. Amazon.com, Yahoo.com, Web.de, NBC.com u. a.).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3: ODP Hauptseite auf www.dmoz.de

1.4.1 Corporate Design

Als Corporate Design verwendet ODP jeweils die grune Farbe, einen grunen Kreis , sowie als Maskottchen eine Eidechse zu verschiedenen Themen. Individuelle Einstellungsmoglichkeiten sind bei ODP nicht gegeben. ODP bietet keine Benutzerverwaltung an, wie beispielsweise Yahoo mit MyYahoo. Auch ist es nicht moglich Sicht-Einstellungen zu andern und zu speichern, wie beispielsweise Google dieses Feature auf der Hauptseite mit dem Link "Einstellungen" anbietet, oder FAST mit der Funktion customize.

1.5 Retrieval

1.5.1 Retrievalbefehle

ODP biete zwei Suchmoglichkeiten an. Die einfache Suche erfolgt direkt von der Hauptseite aus. Bei der Suchfunktion werden, unabhangig von der erweiterten oder einfachen Suche, jeweils die gleichen Retrievalbefehle angeboten. Bei der Eingabe von zwei Begriffen wie

Zeitschrift Fernsehen

wird ein Boolescher AND-Operator automatisch hinzugefugt. Dabei erfolgt die Suche nicht nach der Reihenfolge, sondern auch Treffer mit

Fernsehen Zeitschrift

werden angezeigt.

Weitere Boolesche Operatoren wie

and

or

andnot

werden ebenfalls unterstutzt. Die Kombination mehrerer Boolescher Operatoren und Suchphrasen sind hier gewahrleistet. Fur eine schnellere Suche konnen auch folgende Kurzel fur die Booleschen Operatoren benutzt werden:

Abbildung in dieser Leseprobe nicht enthalten

1.5.2 Ranking

Eine spezielle Ranking-Funktion besitzt ODP nicht. Hier wird nach dem Exact Match-Prinzip gesucht. Ein hoheres Ranking haben jedoch Seiten, die vom Editor als cool gekennzeichnet wurden. (Editoren haben die Moglichkeit pro Webseite ihrer eigenen Kategorie eine URL als die Haupt-URL zu kennzeichnen. Diese werden bei der Result-Seite jeweils immer ganz oben gezeigt)

1.5.3 Phrase Suche

Um eine definierte Reihenfolge zu erreichen, bietet die Suchphrase die Moglichkeit eine spezifizierte Reihenfolge einzuhalten:

"Fernsehen Zeitschrift"

1.5.4 Truncation

Bei der Suche konnen bestimmte Begriffe auch unausgeschrieben mit Hilfe von Wildcards (Jokerzeichen) rechtstrunkiert werden. Der Suchbegriff

Elektr* findet alle Worte in der Datenbank, die mit Elektroinstallation, Elektrotechnik, Elektrisch, Elektronik etc. anfangen. Eine weitere Fragmentierung, auBer der Rechtstrunkierung wird nicht unterstutzt.

[...]

Ende der Leseprobe aus 32 Seiten

Details

Titel
Internet Suchmaschinen ODP (DMOZ) und FAST (ALLTHEWEB)
Hochschule
Technische Hochschule Köln, ehem. Fachhochschule Köln  (Fakultät für Informations- und Kommunikationswesen)
Note
1
Autor
Jahr
2002
Seiten
32
Katalognummer
V8190
ISBN (eBook)
9783638152327
Dateigröße
2208 KB
Sprache
Deutsch
Anmerkungen
Datenbasis, Retrievalsystem, Benutzeroberfläche von OPEN DIRECTORY PROJECT (DMOZ) und FAST (ALLTHEWEB). 1,5 MB
Schlagworte
Open Directory Project (DMOZ), FAST (ALLTHEWEB)
Arbeit zitieren
Evrim Sen (Autor), 2002, Internet Suchmaschinen ODP (DMOZ) und FAST (ALLTHEWEB), München, GRIN Verlag, https://www.grin.com/document/8190

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Internet Suchmaschinen ODP (DMOZ) und FAST (ALLTHEWEB)



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden