Inhalt
Ei in nl le ei it tu un ng g E
Go oo og gl le e. . Ei in nf fü üh hr ru un ng g G E
Go oo og gl le e. .1 1. . G
Go oo og gl le e. .2 2. . G
Go oo og gl le e. .3 3. . G
Go oo og ge l l. .4 4. .
G
Go oo og gl le e. .5 5. . G
Fi ir re eb ba al ll l F
Fi ir re eb ba al ll l. .1 1. . F
Fi ir re eb ba al ll l. .2 2. . F
Fi ir re eb ba al ll l. .3 3. . F
Fi ir re eb ba al ll l. .4 4. . F
Fi ir re eb ba al ll l. .5 5. . F
Qu ue el ll le en nv ve er rz ze ei ic ch hn ni is s Q
2
Einleitung
Diese Arbeit setzt sich mit der genaueren Funktion von Suchmaschinen auseinander. Aus der großen Vielfalt von Suchmaschinen habe ich hier Google und Fireball ausgewählt. Meine Wahl der Suchmaschinen bezieht sich auf meine persönlich bevorzugte Nutzung von Websuchmaschinen. Google gefällt mir vor allem wegen der übersichtlichen Oberfläche und der überragenden Treffsicherheit der Suchergebnisse. Außerdem nutze ich intensiv die Suche nach pdf-Dokumenten in Google.
Die zweite Wahl, Fireball, finde ich recht komfortabel in Hinsicht auf deutschsprachige Webdokumente. Weiterhin gefällt mir auch die Suche mit Hilfe von Wildcards (Trunkierungszeichen) sehr gut.
Im Einzelnen werden die Suchmaschinen auf ihre Datenbasis, ihr Retrievalsystem und Suchoberfläche hin untersucht.
3
Der Name Google wurde von Milton Sirotta, dem Neffen des amerikanischen Mathematiker Edward Kasner geprägt. Er wurde abgeleitet von dem Wort "googol" das für eine Zahl steht die eine Eins gefolgt von 100 Nullen bedeutet. Dies soll wohl die Mächtigkeit dieser Suchmaschine andeuten.
Google ist die erste Suchmaschine, die an einer Universität entstanden ist. Ursprünglich sollte die von S.Brin und L.Page erstellte Suchmaschine nur ein „Proof of Concept“ darstellen. Doch bei einem schlichten Beweis blieb es nicht. Google mauserte sich vom Geheimtipp innerhalb weniger Monate zur populärsten und universellsten Suchmaschine. Im September 1999 wurde Google als offizielle Suchmaschine im Web gestartet. Zu diesem Zeitpunkt gab es laut Google schon etwas 3,5 Mill. Zugriffe pro Tag. Ende 2001 wurden auf allen zugehörigen Servern weltweit 150 Mill. Zugriffe registriert.
Google verwendet zur Zeit etwa 10000 Computer die in 4 Datencentern stehen. Als Betriebssystem wird Linux verwendet.
Google.1. Datenbasis von Google
Wenn man die URL www.google.de eintippt sieht man eine beeindruckende Zahl. Wie auf dem obigen Screenshot zu sehen ist gibt Google im Juli 2002 die Anzahl von 2,073,418,204 indexierten Webseiten an.
Kann man dieser Zahl glauben schenken? Chris Sherman, Webguide bei about.com teilt dazu folgende Informationen (die übrigens von Google's Team Mitglied David Cran stammen) mit:
Google verfügt über 602 Mill. im Volltext indexierter Webseiten. Doch wo bleibt die Differenz zur oben genannten Zahl? Ganz einfach. Die Differenz zu obiger Zahl ergibt sich durch die Erfassung von Links, die auf andere Seiten verweisen. Dies bedeutet aber nicht gleichzeitig, dass diese Seiten auch für Benutzer von Google zu erreichen sind. Der Grund dafür ist, dass diese Seiten auf die Links verweisen nicht durchgehend geprüft sind. So kann es vorkommen, dass man zu einer mit Passwort geschützten Seite geleitet wird.
1 www.google.de / 23.07.2002
4
Ähnlich ergeht es dem User von Google auch bei dynamischen Seiten die durch einen Link erfasst wurden, denn der Spider von Google erfasst diese Seite nicht im Volltext.
Fazit: Man sollte sich nicht zu schnell von solchen Zahlen beeindrucken lassen. Im Vordergrund steht immer noch die Qualität der Indexierung und des Retrievalsystems und nicht die Quantität.
Allerdings muss man sagen, dass Google es geschafft hat durch eine gute Suchtechnologie die große Masse in Klasse umzuwandeln.
Google.2. Retrievalsystem von Google
Googles Retrievalsystem beruht auf einem wichtigen Konzept:
Page Rank
Google hat eine spezielle Software namens „ Page Rank“ zum Patent angemeldet. Diese Software sorgt dafür, dass der User von Google möglichst in den ersten Dutzend Treffern die richtigen Informationen findet. Man spricht hier auch von einem „demokratischen Ranking“.
Man kann die Linkstruktur des Internets auch als einen gerichteten Graphen sehen. Dieser Graph enthält wertvolle, allgemein zugängliche und objektive Informationen. Der Page Rank verwandelt diese Informationen in eine Zahl um, die dann für die Sortierung der Suchergebnisse benutzt wird.
Die Idee des Page Rank basiert auf der Zitat-Analyse wissenschaftlicher Literatur. Hier wird beobachtet wie oft die Arbeit eines Wissenschaftlers von anderen zitiert wurde. Doch leider ist das Web viel komplexer und unstrukturierter, so dass eine Übertragung der Zitatanalyse ins Web nicht ohne weiteres machbar ist. Bei dem Page Rank Verfahren darf man nicht davon ausgehen, dass es den Rank von „Seiten“ ermittelt. Der Name Page führt auf seinen Erfinder L.Page zurück. Wichtigster Ansatzpunkt für das Konzept von Page ist die Anzahl externer Links die auf eine Webseite verweisen. Dabei wird auch überprüft ob die externe, verweisende Seite ebenfalls wichtig ist, indem wiederum überprüft wird wie viele externe Links auf diese Seite verweisen. Weiterhin wird geprüft, ob die verweisende Seite Content besitzt der relevant zur gesuchten Webseite ist.
Hierbei wird großes Augenmerk auf den Text im Verweis gelegt. Die verweisenden Links auf eine Website, die über einen Suchterm berichten, sollten auch im Linktext der verweisenden Seite den Suchterm enthalten. Dabei werden noch folgende Regeln von Google beachtet:
5
Je näher die Suchterme im Text beieinander liegen, desto höher werden Sie von Google eingestuft
Fettschrift wird höher bewertet als normale Schrift
Um den Algorithmus des Page Rank zu verdeutlichen, wird hier die Vorgehensweise in einfachen Schritten erläutert:
1. Jede Seite wird zuerst mit einem Startwert belegt. Der Startwert kann im
Prinzip beliebig gewählt werden, da der Algorithmus in jedem Fall zum Ziel führt. Allerdings hat der gewählte Startwert einen Einfluss darauf, wie schnell man zum Ziel kommt. Man sieht den Page Rank auch als Wahrscheinlichkeitsmaß und legt somit als Startwert für die Seiten folgendes fest: 1 / Anzahl der Seiten
2. Aus der Gewichtung der Seiten werden nun die Gewichte der ausgehenden
Links bestimmt: Gewicht der Seite / Anzahl der ausgehenden Links
3. Aus den Gewichten der eingehenden Links (Backlinks) werden nun die
Seitengewichte durch Summenbildung neu berechnet: Summe(Linkgewichte)
4. Dieser Ablauf ab dem Punkt 2 wird jetzt wiederholt, bis die Seiten- und
Linkgewichtungen eine hinreichende Annäherung erreicht haben.
6
Quote paper:
Marco Güldenring, 2002, Suchmaschinenvergleich: Google vs. Fireball, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Übersicht über eCommerce-Geschäftsmodelle
Computer Science - Commercial Information Technology
Termpaper, 31 Pages
Traditionelle und virtuelle Teams - theoretischer Vergleich und empiri...
Business economics - Personnel and Organisation
Diploma Thesis, 179 Pages
Strategiemodelle der Organisationsentwicklung
Business economics - Personnel and Organisation
Scholary Paper (Seminar), 31 Pages
Unternehmensorganisationen im Wandel - Neue Ansätze und Organisationss...
Business economics - Personnel and Organisation
Diploma Thesis, 67 Pages
Geschäftsmodelle erfolgreicher internetbasierter Unternehmen der 2. Ge...
Business economics - Business Management, Corporate Governance
Scholary Paper (Seminar), 42 Pages
Business economics - Marketing, Corporate Communication, CRM, Market Research
Scientific Study, 32 Pages
Geschäftsmodelle im E-Business
Business economics - Trade and Distribution
Scholary Paper (Seminar), 27 Pages
Welche Faktoren bestimmen die internationale Arbeitsteilung? Ist durch...
Economics - International Economic Relations
Scholarly Paper (Advanced Seminar), 12 Pages
Geschäftsmodelle virtueller Communities
Business economics - Marketing, Corporate Communication, CRM, Market Research
Scholarly Paper (Advanced Seminar), 26 Pages
Marco Güldenring has published the text Suchmaschinenvergleich: Google vs. Fireball
Marco Güldenring has uploaded a new text
Google AdWords - Punktgenau und zielgerichtet werben
So nutzen Sie das größte Werbe...
Sabrina Zebisch
Unidentified Flying Curiosities: Green Fireball UFO's of the 1940s
Bren Monteiro, Beatriz Scaglia
Tara Calishain, Rael Dornfest, Margarita Fernández-Villaverde del Valle
0 comments