Die Suchmaschine ist ein wichtiges Mittel, um sich in dem stetig wachsenden
Angebot von Internetseiten zu orientieren. Ein besseres Verständnis auf Seiten des
Users kann dabei helfen, den Einsatz der Suchdienste zu optimieren und somit
bessere Resultate zu produzieren.
Diese Hausarbeit will dazu beitragen, indem sie in die frühe Entwicklungsgeschichte
der Suchmaschinen einführt, um anschließend die gängigsten modernen
Suchmaschinentypen vorzustellen. Weiterhin werden verschiedene Methoden des
Trefferrankings vorgestellt bevor abschließend die Abfragesyntax erläutert wird.
Dabei wurden sowohl unabhängige Quellen als auch die Informationsseiten einiger
Suchmaschinen genutzt. In diesem Abschnitt sollen die Suchmaschinen behandelt werden, die noch nicht von
kommerziellen Firmen sondern von Universitäten entwickelt wurden.
2.1 Archie
Archie wird allgemein als die erste Suchmaschine angesehen, sie wurde 1990 – also
zu einer Zeit, als das World Wide Web noch nicht in existierte – an der McGill-
University in Montreal von Alan Emtage programmiert. Die Hauptfunktion von
Archie war die Erstellung eines Indexes aller Dateien, die auf den an ein Netzwerk
angeschlossenen Computern lagerten. So konnten über eine Suchanfrage alle
Computer auf einmal durchsucht werden. Heute ist Archie praktisch bedeutungslos.
(vgl. http://www.deutsches-filminstitut.de/internet/dt2i03.htm)
Inhaltsverzeichnis
1 Einleitung
2 Die Vorläufer der modernen Suchmaschinen
2.1 Archie
2.2 Veronica
2.3 Wandex
2.4 Sonstige
3 Die verschiedenen Suchmaschinentypen
3.1 Kataloge
3.2 Robots
3.3 Meta-Suchmaschinen
3.4 Spezialsuchmaschinen
4 Die Methoden des Trefferrankings
4.1 Anzahl der übereinstimmenden Wörter
4.2 Häufigkeit des Vorkommens von Suchbegriffen
4.3 Position des Vorkommens
4.4 Grad der Verlinkung
4.5 Klickhäufigkeit
4.6 Kommerzielle Vergabe
5 Abfragesyntax
5.1 AND
5.2 OR
5.3 NOT
5.4 Phrasensuche („ “)
5.5 ADJ
5.6 BEFORE und FOLLOWED BY
5.7 NEAR und FAR
Zielsetzung und thematische Schwerpunkte
Die vorliegende Arbeit gibt einen Überblick über die Funktionsweise und Entwicklung von Suchmaschinen im Internet. Das Ziel besteht darin, dem Anwender ein tieferes Verständnis für die eingesetzten Techniken zu vermitteln, um Suchanfragen effizienter zu gestalten und präzisere Suchergebnisse zu erzielen.
- Historische Entwicklung von frühen Suchdiensten
- Differenzierung verschiedener Suchmaschinentypen
- Kriterien und Verfahren des Trefferrankings
- Anwendung effizienter Abfragesyntax
Auszug aus dem Buch
3.2 Robots
Der Index eines Robots wird im Gegensatz zum Katalog großteilig automatisch erstellt. Dazu scannt eine spezielle Suchsoftware die Seiten des Internet indem sie existierenden Links folgt und Informationen über die besuchten Seiten sammelt. Die erhaltenen Informationen werden anschließend an eine Indizierungssoftware weitergeleitet, die für die Strukturierung der Informationen sorgt und einen Index erstellt. Dieser Index wird bei einer Suchanfrage durch den Benutzer von einer weiteren Software durchsucht, welche anschließend die Trefferliste generiert.
Da eine automatische Indizierung sehr viel schneller durchgeführt werden kann als die manuelle Datenerfassung eines Kataloges, hat ein Robot gewöhnlich deutlich mehr Internetseiten erfasst als ein Katalog. Dadurch ergibt sich gewöhnlich eine höhere Trefferanzahl und eine bessere Chance mit ungewöhnlichen oder sehr speziellen Suchanfragen Erfolg zu haben. Dagegen werden jedoch bei allgemeineren Suchanfragen häufig auch Webseiten ausgegeben, die nicht die gesuchte Thematik behandeln, da die Indizierungssoftware nur das Vorkommen eines Suchbegriffes im Dokument erkennt, jedoch nicht dazu in der Lage ist, dieses Vorkommen thematisch einzuordnen. So ist es auch möglich, dass der Suchbegriff in einem anderen Zusammenhang – besonders häufig bei Begriffen mit mehreren Bedeutungen – als Treffer ausgegeben wird.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Bedeutung von Suchmaschinen als Orientierungshilfe im Internet ein und beschreibt den Aufbau der Hausarbeit.
2 Die Vorläufer der modernen Suchmaschinen: Dieses Kapitel erläutert die frühen, universitären Entwicklungen wie Archie, Veronica und Wandex, die die Basis für heutige Technologien bildeten.
3 Die verschiedenen Suchmaschinentypen: Hier werden die vier Hauptkategorien Kataloge, Robots, Meta-Suchmaschinen und Spezialsuchmaschinen voneinander abgegrenzt.
4 Die Methoden des Trefferrankings: Dieser Abschnitt analysiert die verschiedenen Ranking-Kriterien, von der Wortdichte und Positionierung bis hin zur Verlinkung und kommerziellen Einflüssen.
5 Abfragesyntax: Dieses Kapitel beschreibt die logischen Operatoren und Befehle, mit denen Nutzer ihre Suchanfragen präzisieren können.
Schlüsselwörter
Suchmaschinen, Internet, WWW, Web-Crawler, Suchindex, Trefferranking, Abfragesyntax, Kataloge, Metasuchmaschinen, boolesche Algebra, Internet-Technologien, Information Retrieval, Suchstrategien.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit bietet eine Einführung in die Internettechnologien und fokussiert sich dabei auf die Funktionsweise, Entwicklung und Anwendung von Suchmaschinen.
Was sind die zentralen Themenfelder?
Die zentralen Themen sind die historische Genese von Suchdiensten, die Klassifikation der verschiedenen Suchmaschinentypen sowie die technischen Details von Ranking-Algorithmen und Abfragesyntax.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, dem User ein besseres Verständnis für Suchdienste zu vermitteln, damit dieser den Einsatz der Suchmaschinen optimieren und genauere Ergebnisse erzielen kann.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer Literaturanalyse und dem Studium von Informationsseiten relevanter Suchmaschinendienste, um den aktuellen Stand der Technik sowie historische Entwicklungen aufzuarbeiten.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die Vorstellung der Vorläufermodelle, eine Typisierung der heute gängigen Suchsysteme, eine detaillierte Erläuterung der Ranking-Methoden sowie eine Anleitung zur Nutzung der Abfragesyntax.
Welche Schlüsselwörter charakterisieren die Arbeit?
Schlüsselbegriffe wie Suchmaschinen, Web-Crawler, Trefferranking, Indizierung und Abfragesyntax beschreiben das Profil dieser Publikation am besten.
Wie unterscheiden sich Kataloge von Robots?
Kataloge werden manuell redaktionell gepflegt, was zu hoher Qualität, aber geringer Quantität führt. Robots hingegen erfassen Seiten automatisch durch Crawler, was eine deutlich größere Datenbasis ermöglicht, aber oft unpräzisere Ergebnisse liefert.
Welchen Einfluss haben kommerzielle Faktoren auf das Ranking?
Suchmaschinenbetreiber bieten teilweise die Möglichkeit, gegen Zahlung eines Geldbetrages eine bessere Platzierung in den Trefferlisten zu garantieren, wobei diese meist als Sponsorenlinks gekennzeichnet sind.
Was bewirkt die Phrasensuche in der Abfragesyntax?
Das Setzen einer Phrase in Anführungszeichen stellt sicher, dass das Suchergebnis exakt diese Zeichenfolge enthält und nicht nur Dokumente, in denen die einzelnen Wörter verstreut vorkommen.
- Quote paper
- Bachelor of Arts Bernd Leiendecker (Author), 2003, Suchmaschinen, Munich, GRIN Verlag, https://www.grin.com/document/21893