Das Internet hat seit seiner "Entdeckung" durch die breite Masse stark an Popularität und damit an Größe zugenommen. Mittlerweile schätzt man die Größe des World Wide Web auf einige hundert Milliarden Webseiten bei ca. 500 Millionen Usern. Täglich kommen Millionen Seiten hinzu.
Um in dieser Menge an Informationen überhaupt etwas Gewünschtes finden zu können, sind Suchmaschinen immer wichtiger geworden. Zwar können selbst alle Suchmaschinen zusammen genommen nicht einmal annähernd das ganze Internet durchsuchen, trotzdem sind sie, richtig angewandt, unerlässlich für jeden Websurfer. Im Folgenden sollen zwei Suchmaschinen vorgestellt werden, die darum konkurrieren, über die größte Datenbasis aller Suchmaschinenanbieter zu verfügen. Diese sind zum einen Google und zum anderen die Suchmaschine AllTheWeb der Firma Fast Search + Transfer (FAST). Verglichen werden die Datenbasis, das Retrievalsystem und die Benutzeroberfläche dieser zwei Suchmaschinen. Es sollen ihre speziellen Stärken und Schwächen herausgestellt werden. Da vor allem Google viele verschiedene Suchmöglichkeiten anbietet, von denen manche nur für die USA verfügbar sind, wird hier nicht auf alle Funktionen eingegangen.
Inhaltsverzeichnis
1. Einleitung
2. Datenbasis
2.1 Google
2.2 AllTheWeb
2.3 Fazit
3. Retrievalsystem
3.1 Google
3.2 AllTheWeb
3.3 Fazit
4. Benutzeroberfläche
4.1 Google
4.2 AllTheWeb
4.3 Fazit
5. Zusammenfassung
Zielsetzung & Themen
Die vorliegende Arbeit vergleicht die beiden Suchmaschinen Google und AllTheWeb hinsichtlich ihrer technischen und funktionalen Ausgestaltung, um deren jeweilige Stärken und Schwächen in der Informationserschließung aufzuzeigen.
- Vergleich der Größe und Qualität der Datenbasen
- Analyse der Retrievalsysteme und Suchalgorithmen
- Untersuchung der Benutzeroberflächen und Bedienkonzepte
- Bewertung der Eignung für unterschiedliche Medientypen (Text, Bild, Video)
Auszug aus dem Buch
3.2 AllTheWeb
Auch bei AllTheWeb werden Suchterme automatisch mit dem UND-Operator verknüpft. Die Eingabe des "-"-Zeichens vor einem Wort schließt dieses von der Suche aus; eine Oder-Verknüpfung wird erreicht, indem man die Wörter in Klammern in das Suchfeld eingibt. Phrasen werden wie bei Google durch Anführungsstriche gekennzeichnet. Andere Abstandsoperatoren bietet auch AllTheWeb nicht.
Allerdings gibt es bei AllTheWeb keine Stoppwörter, so dass zum Beispiel auch einzelne Buchstaben gesucht werden können, was aber nur wenig sinnvoll ist. Zwischen Groß- und Kleinschreibung wird bei FAST ebenfalls nicht unterschieden, auch Trunkierungen sind nicht möglich. Klammersetzung hingegen wird unterstützt. Eine Stärke von AllTheWeb liegt dort, wo Google Schwächen aufweist.
Während man bei Google auf Grund linguistischer Schwächen des Retrievalsystems Wörter nur so findet, wie man sie auch eingegeben hat, sieht das bei AllTheWeb anders aus. Hier werden Wörter und Sätze im Index in Zeichenfolgen zerlegt. Gesucht werden Wörter und Wortfolgen. Innerhalb dieser liegen so genannte Strings und deren Zerlegung, die Substrings, vor. Wird beim Abgleich des Suchbegriffs mit dem jeweiligen Dokument keine direkte Übereinstimmung gefunden, kann AllTheWeb auf die Substrings zurückgreifen.
Zusammenfassung der Kapitel
1. Einleitung: Die Einleitung erläutert die wachsende Bedeutung von Suchmaschinen im World Wide Web und definiert das Ziel des Vergleichs zwischen Google und AllTheWeb.
2. Datenbasis: Dieses Kapitel vergleicht die Größe der indexierten Datenmengen beider Anbieter sowie die unterstützen Dateiformate und Aktualisierungsintervalle.
3. Retrievalsystem: Es wird untersucht, wie Anfragen verarbeitet werden, welche Operatoren zur Verfügung stehen und wie das Ranking der Suchergebnisse technisch umgesetzt ist.
4. Benutzeroberfläche: Dieses Kapitel bewertet die Benutzerfreundlichkeit der Suchportale, die Gestaltung der Ergebnisseiten und zusätzliche hilfreiche Werkzeuge wie Toolbars.
5. Zusammenfassung: Die Zusammenfassung führt die Ergebnisse zusammen und empfiehlt den ergänzenden Einsatz beider Suchmaschinen für spezifische Informationsbedürfnisse.
Schlüsselwörter
Suchmaschinen, Google, AllTheWeb, Retrievalsystem, Datenbasis, Benutzeroberfläche, PageRank, Web-Suche, Informationserschließung, Indexierung, Ranking, Crawler, Internet-Suche.
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundlegend?
Die Arbeit vergleicht die zwei Suchmaschinen Google und AllTheWeb anhand dreier zentraler Kriterien: der Datenbasis, dem Retrievalsystem und der Benutzeroberfläche.
Was sind die zentralen Themenfelder der Untersuchung?
Im Zentrum stehen die technische Leistungsfähigkeit bei der Indexierung, die Suchfunktionalität (Operatoren, Ranking) und die praktische Anwendbarkeit der Bedienoberflächen für Nutzer.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist die Herausarbeitung der jeweiligen Stärken und Schwächen beider Systeme, um Empfehlungen für den optimalen Einsatz im Rahmen der Informationssuche im Web zu geben.
Welche wissenschaftliche Methode wird zur Analyse verwendet?
Es handelt sich um einen vergleichenden Analysestil, der anhand technischer Parameter und Beobachtungen der Benutzeroberflächen die Differenzen zwischen den Suchmaschinen aufzeigt.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil ist in die Bereiche Datenbasis, Retrievalsystem und Benutzeroberfläche unterteilt, wobei für jeden Bereich beide Suchmaschinen gegenübergestellt und bewertet werden.
Welche Schlüsselwörter charakterisieren diese Arbeit?
Zu den wichtigsten Begriffen gehören Suchmaschinen, Retrievalsystem, Ranking-Algorithmen, PageRank, Indexierung und Usability der Suchoberflächen.
Warum ist die Substringzerlegung bei AllTheWeb ein wichtiger Vorteil?
Durch die Zerlegung von Begriffen in Substrings können Treffer auch dann gefunden werden, wenn der Suchbegriff nicht zeichengenau eingegeben wurde, was besonders bei Medien wie Bildern hilfreich ist.
Wie unterscheidet sich die Tippfehlerkorrektur bei Google?
Google ist in der Lage, Tippfehler bei der Eingabe automatisch zu erkennen und zu korrigieren oder den Benutzer auf alternative Schreibweisen hinzuweisen, was AllTheWeb in dieser Form nicht bietet.
- Citation du texte
- Jan Krömer (Auteur), 2002, Internet Suchmaschinen - Google und AllTheWeb (FAST) im Vergleich, Munich, GRIN Verlag, https://www.grin.com/document/8407