Optimierung von Suchmaschinen. On the Page- und Off the Page-Optimization


Akademische Arbeit, 2008
35 Seiten, Note: 1,0

Leseprobe

Inhaltsverzeichnis

Abkürzungsverzeichnis

Einleitung

1. Abgrenzung und Erklärung der wichtigsten Begriffe
1.1. Backlink
1.2. Keyword
1.3. Linkpopularität
1.4. Domainpopularität
1.5. IP-Popularität
1.6. PageRank
1.7. BadRank
1.8. TrustRank

2. Aufbau des Suchmaschinen-Algorithmus

3. On the Page - Optimization
3.1. Keyword- Optimierung
3.2. HTML Optimierung
3.3. Inhalt-Optimierung
3.4. Interne Verlinkung

4. Off the Page - Optimization
4.1. Struktur und Bezeichnung der URL
4.2. Aktualität
4.3. Link- und Klickpopularität

5. Negative Einflussfaktoren
5.1. Spam
5.1.1. Hidden Text und Hidden Links
5.1.2. Kommentarspam
5.1.3. Doorway-Pages
5.1.4. Cloaking
5.2. Duplicate Content
5.3. Session-IDs und Login
5.4. Frames

6. Grenzen der Optimierung

7. Tools für SEO
7.1. Google Keyword-Tool
7.2. Google Webmaster-Tools
7.3. LinkVendor SEO Tools
7.4. Copyscape

Literaturverzeichnis (inklusive weiterführender Literatur)

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Einleitung

Bei der Suchmaschinen-Optimierung (engl. Search Engine Optimization, SEO) geht es darum, durch Optimierung eine bessere Position der eigenen Website bei den generischen Ergebnissen zu erzielen. Diese Optimierung wird auf der einzelnen Webseite (On the Page Optimization) und im Umfeld der Website (Off the Page Optimization) gemacht. Bei der Optimierung gibt es sowohl positive Einflussfaktoren als auch negative. Das Wissen über diese negativen Faktoren, hilft die Optimierung nicht umzukehren oder den Aufwand zu groß werden zu lassen. Die Optimierungsarbeit lässt sich mit Tools erleichtern. Im Folgenden werden zuerst die wichtigsten Begriffe definiert und erklärt. Auf diesem Wissen basierend werden anschließend verschiedene Methoden zur Optimierung einer Website erläutert. Dies wird durch eine Erklärung der negativen Faktoren und der Grenzen der Optimierung sowie einiger ausgesuchter Tools zur Unterstützung der Arbeit abgerundet.

1. Abgrenzung und Erklärung der wichtigsten Begriffe

Wie jedes Spezialgebiet hat auch die Suchmaschinen Optimierung ihre eigenen Fachbegriffe oder spezielle Begriffsdefinitionen. Wobei Begriff in diesem Fall weit gefasst ist und auch Konzepte und Methoden umfasst.

1.1. Backlink

Als Backlink oder Rückverweis wird ein Textlink, der von einer anderen Website auf die eigene Website verweist, bezeichnet. Die Anzahl und die Qualität der Backlinks werden von Suchmaschinen für die Linkpopularität einer Webseite herangezogen. Über die Linkpopularität wird von Suchmaschinen auf die Qualität einer Website geschlossen, denn sie gehen davon aus, dass nur auf eine Website mit qualitativ guten Inhalt verlinkt wird. Hierbei wird der verlinkte Text als Keyword für die Website verwendet. Wenn viele Links[1] für die gleiche Website als verlinkenden Text einen negativ assoziierten Begriff verwenden, wird die Website unter diesem Begriff gefunden. Diese Methode ist als Google-Bombe bekannt und trat erstmals 1999 auf. Anfang 2007 änderte Google die Funktionsweise von Backlinks im Google-Algorithmus und entschärfte diese Missbrauchsmöglichkeit.[2]

1.2. Keyword

Als Keyword wird der Suchbegriff einer Suchanfrage bezeichnet, dieser kann aus einem oder mehreren Worten (Zeichen) bestehen. Ebenso wird der Begriff bezeichnet, zu dem man im Suchmaschinen Marketing die Werbung einblendet. Hierzu zählen nicht die sogenannten Stoppwörter wie Artikel, Pronomen und dergleichen, welche von Suchmaschinen gefiltert werden.[3]

1.3. Linkpopularität

Die Anzahl der Links, welche auf eine Webseite zeigen, wird als Linkpopularität bezeichnet. Daraus folgt, je höher die Anzahl der Links, desto höher die Linkpopularität. Die Linkpopularität wurde früher oft missbraucht und deshalb verwendet heute keine Suchmaschine mehr die reine Linkpopularität, sondern abgewandelte Konzepte.[4]

1.4. Domainpopularität

Die Domainpopularität ist eines dieser abgewandelten Konzepte. Hierbei zählen nicht mehr alle Links, sondern die Links einer Domäne werden einfach gezählt. Früher wurden von einer Domäne oft tausende von Links zu einer Webseite gemacht, um diese im Ranking der Suchmaschine nach oben zu bringen, diese tausenden von Links haben beim Konzept der Domainpopularität die Wertigkeit lediglich eines Links.

1.5. IP-Popularität

Da auch die Domainpopularität missbraucht werden kann, in dem man viele Domains auf einem Webserver bereit stellt, wurde das Konzept der IP-Popularität entwickelt. Hierbei werden alle Links auf die Webseite von der gleichen IP-Adresse über die Anzahl gewichtet. Das Vorgehen ist ähnlich der Domainpopularität, nur dass hier nicht der Domainname betrachtet wird, sondern die IP-Adresse. Dieses Vorgehen ist problematisch, da viele große Hoster (z.B. Strato) Domains auf dem gleichen Server hosten. Bei Einsatz dieses Verfahrens werden unabhängige Websites bestraft werden, da sie auf dem gleichen Server gehostet werden.[5]

1.6. PageRank

Der Google PageRank (PR) ist eine Verfeinerung des Linkpopularitätskonzeptes. Die Entwickler Larry Page und Sergey Brin argumentieren gegen das Konzept der einfachen Linkpopularität, da nicht jedes verlinkende Dokument gleichwertig ist und somit jeder Link entsprechend seiner Wichtigkeit gewichtet werden sollte. Da der PageRank Algorithmus schon lange im Einsatz ist, geht man davon aus, dass er von Google im Laufe der Zeit modifiziert wurde. Am Grundprinzip wird sich aber grundlegend nicht viel verändert haben, da das PageRank-Verfahren ein wichtiger Faktor des Erfolges von Google ist. Der Algorithmus ist recht einfach wenn man die Komplexität und den Umfang des Internets betrachtet.

Abbildung in dieser Leseprobe nicht enthalten

Hierbei ist:

- PR(A) der PageRank der Seite A,
- PR(Ti) der PageRank der Seiten Ti, von denen ein Link auf die Seite A zeigt,
- C(Ti) die Summe aller Links der Seite Ti und
- d ein Dämpfungsfaktor (damping factor, mit 0 ≤ d ≤ 1).[6]

Das bedeutet, dass der PageRank einer Seite sich rekursiv aus dem PageRank der Seiten mit einem Link auf diese ergibt. Somit bewertet die PageRank-Methode die Beziehung einzelner Webseiten zueinander.

Die Gogglegründer gaben in „ The Anatomy of a Large-Scale Hypertextual Web Search Engine“[7] zwei intuitive Begründungen für den PageRank- Algorithmus:

1. In diesem Modell gibt es einen Zufallssurfer (engl. random surfer) welcher das Benutzerverhalten simuliert und sich zufällig Webseiten anschaut. Dabei folgt er den Links auf der Seite und geht niemals zurück. Auch interessieren ihn die Inhalte der Seite nicht. Der Dämpfungsfaktor gibt dabei die Wahrscheinlichkeit an, mit der es dem Surfer langweilig wird und er auf einer zufälligen Seite neu startet.

Aufgrund der Größe des Internets wird der PageRank iterativ berechnet, wobei jede Seite mit einem PageRank von 1 beginnt. In Abbildung 1 ist ein vereinfachtes Netz mit drei Seiten dargestellt. Die Seite A ist mit den Seiten B und C verlinkt. Die Seite B mit C und C mit der Seite A.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1 Beispiel Netz mit drei Seiten[8] [9]

In der Tabelle 1 sind die Berechnungen für 12 Iterationsschritte abgebildet, als Dämpfungsfaktor wird 0,5 gewählt, da die Berechnungen dann verständlicher sind. Es ist zu sehen, dass die Werte schnell konvergieren, so dass Google für das gesamte Internet mit ca. 100 Iterationen den PageRank berechnet.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1 Iteration des Beispielnetzes aus Abbildung 1[10]

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2 Google Toolbar[11]

Im Jahr 2000 erweitert Google seine Toolbar[12] für den Internet Explorer um eine Funktion zur Darstellung des PageRanks.[13] Wie in Abbildung 2 zu sehen ist, wird der PageRank als Balken dargestellt, dieser Balken hat 11 Abstufungen (0 bis 10). Somit gibt der PageRank der Google Toolbar nicht den regulären PageRank wieder.

Um den PageRank in den Abstufungen der Toolbar darzustellen, muss dieser skaliert werden. Google veröffentlicht die genaue Skalierung nicht. Wahrscheinlich ist eine logarithmische Skalierung mit der Basis 6 oder 7. In Tabelle 2 ist zur logarithmischen Basis 6 und dem Dämpfungsfaktor d=0,85 eine mögliche Skalierung dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2 PR-Darstellung in der Google Toolbar (logarithmische Basis 6 und d=0,85)[14]

Der maximale PageRank einer Seite lautet max(PR) = dN + (1-d) mit

- N als Anzahl aller Webseiten und
- d dem Dämpfungsfaktor.

Wenn man die Darstellung des PageRanks des Google Verzeichnisses[15] mit dem der Toolbar vergleicht (siehe Abbildung 3), sind Abschätzungen zum PageRank möglich, da das Google Verzeichnis den PageRank nur von 0 bis 7 abbildet.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3 Vergleich Google Toolbar (rot) mit Google Verzeichnis (blau)[16]

1.7. BadRank

BadRank ist eine Methode die parallel zum PageRank den negativen Einfluss einer Webseite misst. Es wird angenommen das Google diese oder ein ähnliche Methode benutzt, um den negativen Einfluss zu bewerten.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4 Konzept BadRank:[17]

Das Verlinken zu schlechten Nachbarwebsites (engl. bad neighborhood) ist die Grundlage des BadRank. Dieser ist ähnlich dem PageRank aufgebaut, nur gibt hier nicht die verlinkende Seite (Seite A) PageRank an die empfangende Seite (Seite B) ab, sondern das Konzept funktioniert in entgegengesetzter Richtung (siehe Abbildung 4).

So lässt sich der BadRank ähnlich des PageRanks in einer Formel wiedergeben:

Abbildung in dieser Leseprobe nicht enthalten

Hierbei ist:

- BR(A) der BadRank der Seite A,
- E(A) ein numerischer Faktor[18],
- BR(Ti) der BadRank der Seiten Ti, auf welche Seite A verlinkt,
- C(Ti) die Summe aller eingehender Links der Seite Ti und
- d ein Dämpfungsfaktor (damping factor, mit 0 ≤ d ≤ 1).

[...]


[1] Auch als Hyperlink bekannt.

[2] Vgl. Schüler (2007)

[3] Vgl. Fischer (2006) Seite 95

[4] Vgl. Münz (2008) Seite 1093

[5] Vgl. Winkler et al. (2007) Seite 47f.

[6] Vgl. Koch (2007) Seite 51f.

[7] Brin et al. (1998)

[8] Vgl. Brin et al. (1998)

[9] Eigene Darstellung

[10] Koch (2007) S. 52f.

[11] Eigene Darstellung

[12] toolbar.google.de

[13] Vgl. Pakalski (2000)

[14] Sobek (2002/2003b)

[15] directory.google.de

[16] In Anlehnung an: Raimondi (2002)

[17] In Anlehnung an: Sobek (2002/2003a)

[18] Der während des crawlens der Webseite, entsprechend des Spams der Seite, zugewiesen wird.

Ende der Leseprobe aus 35 Seiten

Details

Titel
Optimierung von Suchmaschinen. On the Page- und Off the Page-Optimization
Hochschule
FOM Essen, Hochschule für Oekonomie & Management gemeinnützige GmbH, Hochschulleitung Essen früher Fachhochschule  (Wirtschaftsinformatik)
Note
1,0
Autor
Jahr
2008
Seiten
35
Katalognummer
V284531
ISBN (eBook)
9783656841258
ISBN (Buch)
9783656864295
Dateigröße
919 KB
Sprache
Deutsch
Schlagworte
optimierung, suchmaschinen, page-, page-optimization
Arbeit zitieren
Holger Weber (Autor), 2008, Optimierung von Suchmaschinen. On the Page- und Off the Page-Optimization, München, GRIN Verlag, https://www.grin.com/document/284531

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Optimierung von Suchmaschinen. On the Page- und Off the Page-Optimization


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden