Automatisierte Keyword-Klassifikation von Suchmaschinen wie Google. Nutzerzufriedenheit durch Berücksichtigung der Intention im SEO


Fachbuch, 2019
118 Seiten

Leseprobe

Inhaltsverzeichnis

Zusammenfassung

Abstract

Abkürzungsverzeichnis

1 Einleitung
1.1 Hintergrund und Motivation
1.2 Zielsetzung
1.3 Aufbau und Methodik
1.4 Einschränkungen

2 Grundlagen der Keyword Klassifikation
2.1 Bedeutung der Keyword Klassifikation
2.2 Die Taxonomie Broders
2.3 Weiterentwicklung Broders Taxonomie
2.4 Die drei Ebenen der Klassifikation
2.5 Nutzerintentionen der multimedialen Suche
2.6 Alternative Taxonomien

3 Automatisierte Keyword Klassifikation
3.1 Methoden der Datenanalyse
3.2 Grenzen der Keyword Klassifikation

4 Analyse der Google Suchergebnisseiten
4.1 Erläuterungen zur Analyse der Suchergebnisse
4.2 Standard-Funktionen jeder Suchergebnisseite
4.3 Untersuchung der organischen Ergebnisse
4.4 Dynamische Funktionen
4.5 Bezahlte Ergebnisse
4.6 Lokale Suchergebnisse
4.7 Universal Search
4.8 Extended Search Integrationen
4.9 Entwicklungen im SERP-Layout

5 Resümee
5.1 Ergebnis

Abbildungsverzeichnis

Literaturverzeichnis

Bibliografische Information der Deutschen Nationalbibliothek:

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Impressum:

Copyright © Studylab 2019

Ein Imprint der Open Publishing GmbH, München

Druck und Bindung: Books on Demand GmbH, Norderstedt, Germany

Coverbild: Open Publishing GmbH | Freepik.com | Flaticon.com | ei8htz

Zusammenfassung

Die Suchmaschinenoptimierung hat sich längst von einer Szene, hin zu einer eigenen, professionellen Branche entwickelt und bildet eine der wesentlichen Säulen des Online-Marketings. Der SEO-Prozess ist jedoch mit der Entwicklung der Suchmaschinen vielfältig und komplex geworden. Die Grundlage jeder Maßnahme stellt die Auswahl der Suchbegriffe dar, die zur jeweiligen Webseite und dem Angebot des Betreibers passen. Außerdem ist es für die Priorisierung von Themen und die Optimierung der Inhalte von zentraler Bedeutung, die Bedürfnisse der Suchenden zu kennen und diese bei der Gestaltung der Webseite und deren Inhalte zu berücksichtigen. Wer also weiß was die Suchenden als relevantes Ergebnis von der Suchmaschine erwartet, kann sein Ranking zielgenauer verbessern.

Wie diese Arbeit zeigt, ist für Web-Suchmaschinen das Verständnis der latenten Intentionen der Nutzer hinter den Suchanfragen ebenso von entscheidender Bedeutung, wie für die Suchmaschinenoptimierung. Auf der Grundlage diverser Veröffentlichungen kann belegt werden, dass moderne Suchmaschinen je nach Bedürfnis die unterschiedlichsten Daten und Algorithmen für die Ergebnisgenerierung und -sortierung einsetzen, um eine hohe Nutzerzufriedenheit und damit Kundenbindung zu erreichen. Die dabei verwendeten Taxonomien für Suchanfragen der Suchmaschinenentwickler stellt sich bei genauer Betrachtung als hochentwickelt und sehr differenziert heraus.

Nach dieser Erkenntnis stellt sich dem Verfasser abschließend die Frage, ob aus dem Aufbau der Suchergebnisseite zu einem Suchbegriff bei der Suchmaschine Google auf die Taxonomie der Suchanfragen und damit potentielle Erkenntnisse für die Suchmaschinenoptimierung gefolgert werden kann.

Um die Machbarkeit theoretisch zu evaluieren, wurden diverse Arbeiten aus dem Gebiet des Information Retrievals, sowie Veröffentlichungen von Suchmaschinenentwicklern ausgewertet. Auf Basis dieser Erkenntnisse konnten algorithmische Anpassungen der Suchergebnisseiten, in Abhängigkeit von der vermuteten Suchintention in theoretischen Arbeiten belegt werden.

Die Frage nach der tatsächlichen Aussagekraft des Aufbaus von Suchergebnisseiten konnte im Rahmen dieser Arbeit nicht abschließend geklärt werden. Nach Bewertung des Verfassers liefert die Anatomie der Google Suchergebnisse vielversprechende Ansätze für mögliche Indikatoren und Diskriminatoren hinsichtlich der Nutzerintention. Diese könnten genutzt werden, um im Rahmen der Suchmaschinenoptimierung eine automatisierte Klassifizierung vorzunehmen.

Allerdings haben sich ebenfalls die Grenzen der Klassifizierbarkeit, sowie die Komplexität der korrekten Klassifizierung mittels menschlicher Bewertung gezeigt. Der Autor empfiehlt daher die theoretischen Ansätze in einer weiteren Forschungsarbeit zu untersuchen. Dabei sollten für die Generierung von Testdaten zur Entwicklung eines automatisierten Prozesses ausschließlich Klassifikationen durch Experten vorgenommen werden und diese auf statistische Zusammenhänge mit den unterschiedlichen Funktionen der Suchergebnisse untersucht werden.

Abstract

Search engine optimization (SEO) has evolved into much more than a game played by a few individuals trying to manipulate the search rankings. Today, SEO is one of the most important online marketing channels. The process is diverse and complex like modern search engines are. Selecting the right search terms that matches both, the websites’ offers and the searchers’ demand, is still one of the most important tasks and therefore crucial for the success of every search engine optimization effort. To know the real user intent for every keyword is also very important to correctly prioritize topics and optimize the websites’ content. Fortunately, understanding the latent user intent behind search queries is just as essential to search engines as it is to online marketers.

Making user satisfaction their number one priority, it could be hypothesized, that search engines use different data sources and algorithms for generating and sorting results according to the users’ needs. The taxonomies for keyword classification used by search engine developers optimizing search algorithms are highly sophisticated and very differentiated.

The research question of this publication, whether it is possible to deduce the taxonomy of the search query from the structure of the search results on Googles’ search engine or not, could theoretically be proven. In order to answer this question, several academic research papers and publications by experts and search engine developers have been evaluated and, based on their findings, conclusions have been drawn on possible algorithmic peculiarities.

It was possible to prove algorithmic adaptations of the search results, depending on the presumed search intention, in this theoretical thesis. Based on these conclusions, it could be a promising approach to analyze search result pages to generate insights and instructions for search engine optimization. It is recommended that this theoretical approach is transferred into practice through further scientific work.

The significance of the structural differences of search results could not be conclusively clarified within this work.

According to the author and his evaluation of the different functions, the anatomy of Google search results provides promising approaches for the generation of indicators and discriminators regarding the user's intention. These could potentially be used to automatically classify the search engine within the scope of search engine optimization.

However, the limits of classifiability and the complexity of correct classification by human evaluation have also been demonstrated. The author therefore recommends investigating the theoretical approaches in further research. Only classifications by experts should be used to generate test data for the development of an automated process and these should be examined for statistical correlations with the different functions of the search results.

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Dieses Kapitel dient dem Leser als Einführung und bietet einen Überblick über die Bedeutung der Suchmaschinen im Internet und verdeutlicht damit der Relevanz des Suchmaschinen-Traffics für wirtschaftlich agierende Unternehmen. Darauf aufbauend wird die Entwicklung der Suchmaschinenoptimierung dargestellt. Deren jüngste Veränderungen richtet sich an der Entwicklung der Suchmaschinen hin zu einer stärkeren Berücksichtigung von Nutzerfeedback und betont dadurch die Aktualität des Themas dieser Arbeit. Der Aufbau und die Grenzen dieser Arbeit, die verwendete Methodik und Herangehensweise, sowie die Ziele und Motivationen des Verfassers werden ebenfalls kurz skizziert.

1.1 Hintergrund und Motivation

Suchmaschinen wie Google und Bing sind die wichtigsten Werkzeuge geworden, um Informationen im Internet zu finden. Sie dienen vielen Menschen als Einstiegspunkt ins Web und liefern damit existentiell wichtigen Traffic für viele Webseiten. Insbesondere für kommerzielle Anbieter können Suchmaschinen relevante Besucher liefern, die etwas kaufen, sich registrieren, oder für Werbeeinnahmen und sogar gesteigerte Bekanntheit für das Unternehmen führen. Allerdings sind lediglich die vordersten Positionen der Suchmaschinen wirklich erfolgsstiftend, denn diverse Studien über das Verhalten von Suchmaschinennutzern haben gezeigt, dass die meisten Nutzer auf eine Webseite klicken, die auf der ersten Suchergebnisseite aufgeführt ist. Der Anteil der Nutzer, die noch über die dritte Seite hinaus noch Seiten besuchen, nimmt sehr schnell ab.1 Doch Suchmaschinen liefern nicht nur neue Besucher, sondern dienen vielen Nutzern auch als Navigationsinstrument für das World Wide Web. Somit liefern sie auch wiederkehrende Besucher.2

Eine zunehmende Zahl von Unternehmen erkennen die Möglichkeiten, ihre Dienstleistungen und Produkte online zu vermarkten und bauen daher ihre Präsenz im Web durch die Verbesserung ihres Internetauftritts aus. Immer mehr Umsätze werden online generiert und so wenden sich kleine wie große Unternehmen der Suchmaschinenoptimierung (auch SEO vom englischen Search Engine Optimization) zu, um über das Internet höhere Umsätze und damit letztlich höhere Gewinne zu erzielen.3

Doch für jede Suchanfrage ermitteln komplexe Algorithmen die Relevanz jeder indexierten Seite und liefern das sortierte Ergebnis in Sekundenbruchteilen aus. Daher ist es eine permanente Herausforderung sicher zu stellen, dass der Auftritt bei den richtigen Suchanfragen von potentiellen Interessenten gefunden wird.4

So werden von SEO-Fachkräften Webseiten und Links aufgebaut, die die Chancen verbessern sollen, auf den vordersten Seiten der Suchmaschinenergebnisse aufzutauchen.5 Denn eine noch so wohl gestaltete Webseite und deren Dienste kann nicht erfolgreich sein, solange potentielle Nutzer diese nicht entdecken.6

Der Einfluss der Suchmaschinenoptimierung reicht längst weit über die Optimierung von Seiten für Produkte und Dienstleistungen hinaus. Zu nennen ist hier vor allem der Nachrichtenbereich, der laut Lewandowski (2016) als Vorreiter in Bezug auf die Optimierung informativer Inhalte in Abhängigkeit von Ranking und Algorithmen der Suchmaschinen gelten kann.

SEO hat sich über die letzten zehn Jahre von einer Szene hin zu einer eigenen, professionellen Branche entwickelt und bildet eine der wesentlichen Säulen des Online-Marketings,7 mit stetig wachsenden Budgets (Abbildung 1). Im Jahr 2015 wurden in den Vereinigten Staaten etwa 60 Milliarden Dollar für Suchmaschinenoptimierung ausgegeben, für das Jahr 2020 werden für bereits Ausgaben von circa 80 Milliarden Dollar für Suchmaschinenoptimierung erwartet.8

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Entwicklung der Ausgaben für SEO in den USA zwischen den Jahren 2008 und 20209

Das Ziel der Suchmaschinenoptimierung ist, die Auffindbarkeit einer Webseite über Suchmaschinen im WWW für bestimmte Suchbegriffe, auch Keywords genannt, zu verbessern10 [Anmerkung des Verfassers: und langfristig zu erhalten]. Zu Beginn jeglicher Bemühungen steht daher die Auswahl der Suchbegriffe, auf welche die Seite optimiert werden soll.11 Laut Alpar et al. (2015, S. 133) besteht die Herausforderung bei der Keyword-Recherche nicht darin, möglichst viele Suchbegriffe zu finden. Die schwierigste Aufgabe wäre es demnach, die richtigen Prioritäten zu setzen und aufgrund steigender Opportunitätskosten nicht zu ausführliche Recherchen zu betreiben. Jedes ausgewählte Keyword verursacht schließlich zusätzlichen Aufwand, sowohl bei der Erstellung von Inhalten, als auch bei Analysen und der Verlinkungsstrategie.

Choudhari & Bhalla (2015) halten die Keyword-Analyse gar für den wichtigsten Teil der Optimierung und Al-Ananbeh et al. (2012) stellen passende Keywords als Fundament einer gut rankenden Webseite dar. Schließlich kann ohne Analyse und Auswahl der Suchbegriffe nicht zielgerichtet auf einen Erfolg hingearbeitet werden.

Dabei ist SEO als Prozess zu verstehen. Dieser umfasst, nach den Ranking-Regeln der Suchmaschine, die kontinuierliche Planung und Verbesserung der internen Strukturen, der Website-Texte und -Interaktionen, sowie der Verlinkungs-Strategie von externen Webseiten, um die Sichtbarkeit von Websites in der Suchmaschine zu verbessern. Diverse Quellen sind sich einig, dass der SEO-Prozess die Verbesserung der Webseite, aus Sicht der Suchmaschinen-Crawler, als auch der Gebrauchstauglichkeit und Benutzerfreundlichkeit der Webseite sowohl aus gestalterischer, struktureller, als auch inhaltlicher Sicht erfordert.12 Das Ziel ist es stets, bessere Rankings, Sichtbarkeit und Zugänglichkeit für Online-Nutzer zu ermöglichen. Als Sichtbarkeit kann die Position einer Webseite auf der Suchergebnisseite einer Suchmaschine zu einem Begriff verstanden werden. Je weiter oben auf der Liste der Eintrag steht, desto besser ist die Sichtbarkeit und umgekehrt.13 Dass die eigentlichen Vorzüge eines Webinhalts, also dessen inhaltlicher Qualität, selbst professioneller Autoren kaum eine Rolle für deren Sichtbarkeit spielt, konnte Killoran (2013) belegen. Demnach sei die Position der Website in den Suchergebnissen entscheidend für die Sichtbarkeit in der potentiellen Zielgruppe, was der Suchmaschine und damit auch der Suchmaschinenoptimierung einen enormen Stellenwert einräumt.

SEO ist allerdings kein plötzlich erschienenes Phänomen. Die Ansätze der Suchmaschinenoptimierung haben sich im Laufe der Jahre, gemeinsam mit den Suchmaschinen entwickelt. Mit jedem Fortschritt der Suchmaschinen, entwickelte sich so auch die Suchmaschinenoptimierung weiter.14 Suchmaschinen sind im Kern jedoch nach wie vor klassische Information-Retrieval-Systeme, deren Besonderheit, laut Lewandowski (2013) vor allem darin liegt, dass sie ihre Indizes aus den ungeordneten Dokumenten des World Wide Web aufbauen und sich außerdem hinsichtlich der Benutzerführung und Trefferdarstellung dem Zielpublikum, der Laiennutzer, anpassen. Mittlerweile habe sich jedoch das Verhältnis zwischen Suchmaschinen und konventionellem Information Retrieval (IR) umgekehrt. So waren frühe Suchmaschinen laut Lewandowski noch sehr stark an konventionellen Information-Retrieval-Systemen orientiert. Mittlerweile kommen allerdings viele der wesentlichen Entwicklungen des Information Retrieval entweder direkt von den bekannten Suchmaschinenanbietern oder entstanden in Kooperation mit ihnen. So sind die großen Suchmaschinenanbieter auch Vorreiter für Entwicklungen im Information Retrieval geworden.15

Gezielt ein höheres Ranking zu erreichen, gestaltet sich jedoch äußerst schwierig, da die Suchmaschinen-Anbieter ihre Ranking-Algorithmen nicht veröffentlichen und auch kaum Informationen über die verwendeten Rankingfaktoren preisgeben.16 Theoretische Auseinandersetzungen mit den Ranking-Algorithmen wie z.B. Meyer & Langville (2006) oder Manning et al. (2008) können dabei helfen, die Funktionsweise von Suchmaschinen zu verstehen, liefern jedoch selten praktischen Anleitungen wie Webseitenbetreiber oder Marketer vorgehen können, um Suchmaschinenoptimierung zu betreiben.17 Die Auswirkungen der Weiterentwicklungen der Suchmaschinentechnologien für die Methoden der Suchmaschinenoptimierung lassen sich daher am ehesten durch die offiziellen Informationen der Suchmaschinen, in SEO-Fachblogs und Magazinen, sowie nicht zuletzt den Büchern zum selben Thema verfolgen. Während der PageRank und die Stichwort-Dichte in vielen älteren Quellen18 noch als die dominanten Rankingfaktoren genannt werden, wird in den letzten Jahren der Fokus immer stärker auf die Befriedigung der Suchanfrage gelegt. Natürlich ist es auch heute noch ratsam das Keyword im Title-Tag zu verwenden19, allerdings gibt es bereits Beispiele, bei denen der Query-Prozessor oder die angelernten Algorithmen dafür sorgen, dass die eingegebenen Begriffe überhaupt nicht mehr auf den rankenden Webseiten vorkommen müssen. Beispielsweise bei einer Suche nach „ rice dishes “ in der englischsprachigen Suche unter google.com enthalten die ersten drei organischen Treffer den Begriff „ dish “ oder „ dishes “ nicht im Seitentitel, bei einem davon20 nicht einmal im Inhalt der Seite (Abbildung 2).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Die ersten fünf organischen Suchergebnisse für „ rice dishes “ bei google.com in Englisch, unterhalb des Entitäts-Karussells am 24.10.2017

Die Suchmaschine rankt also, was der Nutzer will und bedient sich dabei den unterschiedlichsten Datenquellen. Doch wer nicht weiß, wie sich die Ergebnisse zusammensetzen, kann auch nicht darauf optimieren und so ist das Verständnis darüber von zentraler Bedeutung für jeden SEO.21

Im Gegensatz zum Crawler und Indexierungs-Modul der Suchmaschine, reagiert das Suchanfragen-Verarbeitungs-Modul unmittelbar auf den Suchenden.22 Daher ist es wichtig, die Suchausdrücke zu verstehen, die Menschen aus den Suchmaschinen auf die eigenen Webseiten bringen. Bei entsprechender Analyse können diese Verweisschlüsselwörter aufschlussreiche Informationen über das Nutzerverhalten und die Intention der Nutzer liefern, aus denen Website-Besitzer mitunter sogar neue Geschäftsmodelle aufbauen oder den Besuchern immer relevantere Inhalte zur Verfügung stellen können.23 Effektives SEO ermöglicht es also dem Nutzer, relevante und korrekte Informationen schnell und einfach zu erhalten.24

Ausgehend von diesen Annahmen muss es das Ziel der Suchmaschinenoptimierung sein, nicht nur die oberste Position einer Suchmaschinenergebnisseite zu erreichen, sondern diese auch durch die Befriedigung der Bedürfnisse der Suchenden zu behalten. Wie auch Fishkin (2017), sehen auch Kofler et al. (2016) stets eine Aufgabe in der „echten Welt“ als Anlass für ein neues, noch ungestilltes Informationsbedürfnis, welches sich schließlich in einer Suchanfrage an die Suchmaschine ausdrückt (Siehe Abbildung 3).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Zusammenhang von Aufgabenerledigung, Informationsbedürfnis und Suchanfrage25

Das Verständnis über dieses Informationsbedürfnis und dessen Befriedigung rückt daher zunehmend in den Fokus der Suchmaschinenoptimierung. Für langfristig erfolgreiche, also nachhaltige Suchmaschinenoptimierung, muss die zugrundeliegende Intention und das entsprechende Verhalten des Nutzers für individuelle Suchbegriffe also verstanden und berücksichtigt werden.26 Laut Alpar et al. (2015, S. 73) ist eine professionelle Optimierung von Webseiten überhaupt nur dann zu bewerkstelligen, wenn neben den Techniken und Methoden der Suchmaschinenoptimierung auch der Nutzer nicht außer Acht gelassen wird. Dieser würde schließlich darüber entscheiden, ob ein Webangebot ansprechend ist und ob es sich lohnt, dieses weiterzuempfehlen und häufiger zu nutzen.

1.2 Zielsetzung

Bei der Keyword-Auswahl und Priorisierung von Themen im Rahmen der Suchmaschinenoptimierung ist die Analyse der Suchergebnisseite essentiell. Alpar et al. (2015, S. 134-135) sprechen sich explizit dafür aus, die Suchergebnisse zu überprüfen, die bei Google ausgegeben werden, bevor sich der Seitenbetreiber für ein Keyword entscheidet. Die Erkenntnis über die Intention liefert demnach einen tatsächlichen Wettbewerbsvorteil in der Bemühung, einen der vordersten Plätze der Suchmaschine bei bestimmten Begriffen einzunehmen.

Insbesondere ein automatisierter und datengetriebener Prozess könnte ein einzigartiges Werkzeug zur Verbesserung von sowohl Effizienz, als auch Effektivität von SEO-Maßnahmen darstellen. Als Grundlage für diesen vollkommen neuartigen Ansatz des toolgestützten Data-Driven SEO & Content-Marketing könnte ein automatisierte Keyword-Klassifikation, auf Basis der Suchergebnisse, dabei helfen, die aufgezeichneten Nutzersignale aus der Webseiten-Analyse besser zu verstehen, wirkende Rankingfaktoren der Suchmaschine zu erkennen und datengetriebene Vorschläge für die Optimierung von Inhalten zu liefern.

Beispielsweise wäre eine relativ kurze Aufenthaltsdauer und vergleichsweise hohe Absprungrate bei einer geschlossenen Frage als Suchanfrage nicht ungewöhnlich oder gar kritisch zu bewerten. Diese Art der Suchanfragen geben per Definition eine vorgegebene Anzahl an Antwortmöglichkeiten vor27 und können demnach mit einer einfachen, kurzen Antwort bereits vollständig beantwortet und das dahinterliegende Informationsbedürfnis gestillt werden.

Um weitere Daten des Nutzers wie das Surf-, Klick- und Scroll-Verhalten, automatisiert sinnvoll auswerten zu können, ist es unumgänglich die Erwartungshaltung des Besuchers zu kennen oder zumindest in eine Erwartungsklasse über die Klassifikation der Suchanfrage einzuteilen.

Dieser, bislang manuelle Prozess ist jedoch zeitintensiv und setzt eine gewisse Erfahrung desjenigen voraus, der die Suchergebnisseite beurteilt. Zudem sollte diese Aufgabe in regelmäßigen Abständen wiederholt werden, um Änderungen im Aufbau der Suchergebnisseite und darüber Änderungen in den Wünschen, Bedürfnissen bzw. Anforderungen der Suchenden in der Webseitenoptimierung berücksichtigen zu können.

Im Rahmen dieser Bachelorarbeit sollen daher mögliche Ansätze zur automatisierten Keyword-Klassifikation mittels Analyse der Google-Suchergebnisseiten auf Basis theoretischer Grundlagen erarbeitet und eine mögliche Herangehensweise evaluiert werden.

Ausgehend von der Grundannahme, dass die Suchergebnisse der Suchmaschine auf die bestmögliche Erfüllung der Nutzerbedürfnisse zu jeder Suchanfrage optimiert werden, könnten Ableitungen des latenten Bedarfs und gezielter Optimierungsansätze aus der Auswahl und Aufbereitung der Ergebnistreffer möglich sein.

Der Aufbau der Suchergebnisseite einer Web-Suchmaschine könnte demnach Rückschlüsse auf die Suchintention zulassen, wenn die Entwickler der Suchmaschine bestrebt sind die Intention des Nutzers zu erkennen, um mit angepassten Auswahl- und Sortieralgorithmen eine höhere Nutzerzufriedenheit zu erreichen.

Dabei stellt sich die Frage, ob es ausreichend wissenschaftliche Belege für eine algorithmische Anpassung in Abhängigkeit des Nutzerverhaltens gibt und wie Suchmaschinen generell eine Keyword Klassifikation vornehmen könnten, welche sich darin wiederspiegeln könnte.

Die zentrale Frage dieser Arbeit lautet demnach: „Ist die Analyse der Google Suchergebnisse theoretisch geeignet, um eine automatische Keyword-Klassifikation für einen definierten Suchbegriff vorzunehmen?“.

1.3 Aufbau und Methodik

Zu Beginn dieser Arbeit wird die Relevanz und Aktualität der Forschungsfrage im Hinblick auf die wirtschaftliche Bedeutung von Suchmaschinen-Traffic und Suchmaschinenoptimierung verdeutlicht. Die Entwicklung der Suchmaschinen und deren Algorithmen wird zum besseren Verständnis der Bedeutung der Nutzersignale grob skizziert. Der Fokus liegt dabei auf jenen Veränderungen, die zu einer veränderten Herangehensweise an die Optimierung von Webseiten unter stärkerer Berücksichtigung des Nutzers führten. Dies verdeutlicht der Bedeutung der Keyword-Klassifikation für die Suchmaschinenoptimierung.

Anschließend setzt sich diese Arbeit mit den Grundlagen der Keyword Klassifikation auseinander. Insbesondere der Forschungsstand hinsichtlich der Taxonomien von Suchanfragen wird betrachtet.

Anschließend werden konkrete technische Ansätze aus Sicht der Suchmaschinen als Beleg für die Machbarkeit und Herangehensweise an die Erkennung der latenten Nutzerintention herangezogen. Der Nachweis, dass Suchmaschinen unterschiedliche Rankingalgorithmen für unterschiedliche Klassen von Suchanfragen einsetzen, wird durch Veröffentlichungen erbracht und mit Beispielen belegt. Insbesondere durch die Analyse und Darstellung relevanter Forschungsarbeiten im Bereich automatisierter Keyword-Klassifikationen, soll im Anschluss mittels induktiver Methoden ein direkter Zusammenhang von Nutzerverhalten und Suchergebnissen belegt werden.

Schließlich nähert sich die Thesis ihrer eigentlichen Kernfrage: Ist es theoretisch möglich, durch Analyse der Suchergebnisseiten für die Suchanfrage eine Keyword-Klassifikation vorzunehmen?

Die unterschiedlichen Funktionen der Suchergebnisseite werden daher einzeln auf Hinweise für bestimmte Intentionen der Nutzer. Für einen erfolgreichen Ansatz müssten die Suchergebnisse und deren Funktionen ausreichend unterscheidbare Merkmale und Kennzeichnungen aufweisen, sowie begründbare bzw. belegbare Nachweise über die angenommene Nutzer-Intention der Suchmaschine für eine Darstellung der jeweiligen Funktion vorhanden sein.

1.4 Einschränkungen

Die Untersuchungen der Suchergebnisseiten (im Text auch SERP, vom englischen Search Engine Result Page) innerhalb dieser Arbeit zielen auf die Gewinnung von Erkenntnissen für die Optimierung der Sichtbarkeit deutschsprachiger Webseiten bei der Suchmaschine mit der größten Marketing-Relevanz ab. Demnach werden bei der Betrachtung möglicher SERP-Features (Einzelfunktionen der Suchergebnisseite) ausschließlich deutschsprachige Suchabfragen der Domain google.de betrachtet und analysiert. Die Suchmaschine des US-Konzerns Google ist nicht nur Marktführer in Deutschland, sondern hat laut EU-Kommission bereits eine marktbeherrschende Stellung erreicht.28 Wie bereits in der Einleitung dargelegt, haben diverse Studien über das Verhalten von Suchmaschinennutzern gezeigt, dass die meisten Nutzer auf eine Webseite klicken, die auf der ersten Suchergebnisseite aufgeführt ist und der Anteil der Nutzer, der Treffer darüber hinaus auswählt sehr schnell abnimmt.29 Daher bezieht sich diese Arbeit jeweils lediglich auf die erste Suchergebnisseite und die dort gelisteten Webseiten sowie die dargestellten Funktionen.

Grundsätzlich sollte eine Gruppe von Ergebnissen dem Interesse der gesamten Nutzerschaft entsprechen.30 Da Nutzer jedoch sehr unterschiedliche Kontexte in Sachen Vorwissen, Suchhistorie, besuchte Webseiten, Standort, Gerät, etc. haben, werden Suchergebnisse häufig personalisiert und lokalisiert. Die Suchergebnisse, die innerhalb dieser Arbeit analysiert werden, wurden daher im ausgeloggten Zustand über den Inkognito-Modus des Chrome Browsers abgerufen. Dabei wird der Browserverlauf, Cookies und Websitedaten oder in Formulare eingetragene Informationen laut offiziellen Angaben ( Google Inc., 2017) nicht von Chrome gespeichert. Der Zweck dieser Funktion ist jedoch nicht die Anonymisierung nach außen, sondern das private surfen. Hierbei können andere Personen, die das gleiche Gerät verwenden, die vorherigen Aktivitäten nicht sehen. Für die besuchten Websites, den Netzwerkanbieter und den Internetanbieter sind die Aktivitäten jedoch weiterhin sichtbar. Ebenso lässt sich für die Suchmaschine, anhand der IP-Adresse des Abrufs, ein ungefährer Aufenthaltsort zur ermitteln, sowie eine IP-basierte Suchhistorie aufbauen.

Die Suchergebnisse werden ausschließlich von stationären Computern abgerufen, lokalisierte Suchergebnisse werden nach Möglichkeit als solche gekennzeichnet. Es werden außerdem innerhalb dieser Arbeit keine Anpassungen der Suchergebnisse auf die Bedürfnisse mobiler Nutzer oder die mobilen Suchergebnisse der Suchmaschine betrachtet. Zwar unterscheiden sich die Bedürfnisse mobiler Nutzer, Studien zufolge, deutlich von denen der Nutzer an einem stationären Gerät, so spielen beispielsweise kontextsensitive Ergebnisse, also zeit-, ort- oder präferenz-spezifische Funktionen eine deutlich größere Rolle31, jedoch hat die Suchmaschine bislang nach eigenen Aussagen32 derzeit noch keinen eigenen mobilen Index, was eine Betrachtung zum jetzigen Zeitpunkt aus Sicht des Verfassers wenig sinnvoll erscheinen lässt.

Nicht ausgeschlossen werden können Suchergebnisse, die aufgrund eines aktiven Live-Traffic-Tests in der Google-Suche von Änderungen in der Reihenfolge oder Darstellungsform verändert worden sind. Laut Alpar et al. (2015, S. 418) testet Google permanent die Einblendung der Universal-Search-Integrationen, sodass sowohl deren Aufmachung als auch deren Anteile im Zeitverlauf variieren können. Nach eigenen Aussagen33 wurden im Jahr 2016 alleine 9.800 Live-Traffic-Tests durchgeführt. Damit möchte die Suchmaschine feststellen, wie reale Nutzer eine neue Funktion einsetzen, bevor diese Funktion veröffentlicht wird. Für diese Live-Tests stellt Google die neue Funktion nur einer kleinen Gruppe von Nutzern zur Verfügung, in der Regel sind es laut Google etwa 0,1 %.34

Die statistische Evaluierung konkreter Klassifikationsmethoden, sowie die Prüfung der Machbarkeit aus technischer Sicht übersteigt den Umfang dieser Arbeit und könnte in einer weiteren Forschungsarbeit zu einem späteren Zeitpunkt erfolgen.

2 Grundlagen der Keyword Klassifikation

Dieses Kapitel beschäftigt sich mit den Grundlagen der Keyword Klassifikation und legt die Basis für alle weiteren Betrachtungen dieser Arbeit. Neben einer Einführung in das Thema wird die Bedeutung der Klassifikation verdeutlicht und ein Überblick über die existierenden Taxonomien sowie deren Hintergründe und Entwicklungen gegeben.

2.1 Bedeutung der Keyword Klassifikation

Wir leben in einer hoch technologisierten Welt, in der das Internet die primäre Informationsquelle darstellt. Jedermann nutzt das Internet, um auf kleine oder große Informationseinheiten zuzugreifen, sei es als Schüler, Student, Unternehmer, Manager in einem multinationalen Konzern, Professor einer Universität oder Wissenschaftler bei der NASA. Für jeden Nutzer jeweils die relevantesten Webseiten anzuzeigen und dabei Milliarden von Dokumenten gleichzeitig, innerhalb weniger Millisekunden zu sortieren, ist eine gewaltige Herausforderung. Der Google Suchindex enthält bereits mehrere hundert Milliarden Dokumente mit einer Speichergröße von über 100.000.000 Gigabytes35 und das Web wächst unaufhaltsam exponentiell weiter.36 Da moderne Suchmaschinen mit allen Arten von Suchanfragen konfrontiert werden und jeder Typus mit sehr unterschiedlichen Ergebnissen zufriedenstellende Resultate liefert, ist ein Verständnis für die Taxonomie der Suchanfragen essentiell für die Entwicklung einer erfolgreichen Web-Suchmaschine.37 Zahlreiche Untersuchungen38 bestätigen, dass die Hürden für Nutzer ein webbasiertes System zu wechseln, relativ niedrig sind. Das heißt, Online-Nutzer können potentiell sehr schnell zu einer anderen Suchmaschine wechseln, die deren Erwartungen besser erfüllt. Auf der anderen Seite verursachen verlorene Nutzer Umsatzausfälle auf Seiten der Suchmaschinen.39 Somit kann angenommen werden, dass die Hauptbemühung bei der Entwicklung und Verbesserung von Online Suchmaschinen darauf liegt, sicher zu stellen, dass deren Nutzer die nützlichsten Informationen in geeigneter Form und kürzest möglicher Zeit erhalten. Auch Lorigo et al. haben bereits 2006 festgestellt, dass Suchmaschinen sich immer stärker dafür interessieren, welches Informationsbedürfnis der Nutzer über das von ihm eingegebene Suchwort hinaus haben könnte und sammeln dazu zusätzliches Feedback. Andere Studien belegen, dass diese Daten dazu verwendet werden, die Suchergebnisse an die Bedürfnisse des Nutzers anzupassen, auf Basis des jeweiligen Nutzerverhaltens:

“Adaptive search engines use implicit and explicit feedback indicators to model users (Joachims, 2002; Holland, Ester, & Kießling, 2003) or to model search tasks, such as those studies presented in the TREC competition (Kang & Kim, 2004; Baeza & Ribeiro, 1999). To create appropriate models, it is essential to understand users search behaviors.”

Lorigo et al. (2006)

Besonders klar wird die Komplexität der Aufgabe einer Suchmaschine, die die Erwartungshaltung der Nutzer stellt, wenn man sich vergegenwärtigt, dass diese ihr Bedürfnis lediglich in ein paar wenigen Schlüsselwörtern ausdrücken und dennoch die richtigen Ergebnisse erwarten.40

Versetzt man sich also in die Perspektive der Suchmaschine, wäre die Sicht auf das Nutzerverhalten ein Strom von Abfragen und die anschließende Interaktion mit den Ergebnissen. Suchmaschinen-Entwickler nehmen diese Perspektive oft an und untersuchen Abfrageströme mit der Absicht die Suchmaschinen zu optimieren.

„We discuss how search engines can use knowledge of user intent to provide more targeted and relevant results in Web searching. For the purpose of this research, we define user intent as the affective, cognitive, or situational goal as expressed in an interaction with a Web search engine. In order for Web search engines to continue to improve, they must leverage an increased knowledge of user behavior in order to identify the underlying intent of searchers.”41

2.2 Die Taxonomie Broders

Um die unterschiedlichen Anforderungen an eine Suchmaschine verstehen zu können, entwickelte der spätere IBM Research-Mitarbeiter Andrei Broder bei AltaVista eine Taxonomie für Suchbegriffe in Web-Suchen, die das Bedürfnis hinter einer Suchanfrage in drei Klassen teilt, die bis heute ihre Gültigkeit behalten haben.

Jede Suchanfrage, die ein Nutzer an die Suchmaschine richtet, impliziert demnach eine konkrete Frage und gibt mehr oder weniger Aufschluss über die Motivation und Erwartungen an die Suchergebnisse. Je nach Intention der Suchenden, lassen sich Suchanfragen unterscheiden und in folgende drei Anfragetypen unterteilen:

- Navigationsorientierte Suchanfragen (eng.: Navigational search queries)
- Informationsorientierte Suchanfragen (eng.: Informational search queries)
- Transaktionsorientierte Suchanfragen (eng.: Transactional search queries)

Broder führt diese wie folgt aus:42

“In the web context[sic!] the ‘need behind the query’ is often not informational in nature. We classify web queries according to their intent into 3 classes:

- Navigational. The immediate intent is to reach a particular site.
- Informational. The intent is to acquire some information assumed to be present on one or more web pages.
- Transactional. The intent is to perform some web-mediated activity.“

Broder, 2002

Festzuhalten sei an dieser Stelle, dass nicht immer ein relevantes Dokument zur Befriedigung des Informationsbedürfnisses notwendig ist, denn auch ein Wegweiser zur gesuchten Information kann bereits ein gutes Suchergebnis ausmachen, wie Broder ebenfalls feststellte:

„It is interesting to note, that in almost 15% of all searches the desired target is a good collection of links on the subject, rather than a good document. (A good hub, rather than a good authority, in the language of Kleinberg)”

Die von Broder aufgeführten Beispiele sollen als alternative Erklärung der Klassen dienen und werden hier zum besseren Verständnis aufgeführt. Er beginnt zunächst mit der Erläuterung der navigationsorientierten Suchanfragen:

Navigational queries. The purpose of such queries is to reach a particular site that the user has in mind, either because they visited it in the past or because they assume that such a site exists. Some examples are

Greyhound Bus. Probable target http://www.greyhound.com

compaq. Probable target http://www.compaq.com.

national car rental. Probable target http://www.nationalcar.com

american airlines home. Probable target http://www.aa.com

Don Knuth. Probable target http://www-cs-faculty.stanford.edu/~knuth/

This type of search is sometimes referred as ‘known item’ search in classical IR, but is mostly used in the evaluation of various systems. (...) These types of queries are essentially navigational queries.”

Die aus Sicht des Autors wichtigste Aussage über die sogenannten navigational queries trifft Broder mit dem Satz: “With respect to evaluation, navigational queries have usually only one ‚right‘ result.” (Ebenda) Dies legt, aus Sicht des Verfassers den Schluss nahe, dass eindeutig als navigationsorientiert identifizierte Suchanfragen kein sinnvolles Optimierungspotential aus Sicht der Suchmaschinenoptimierung darstellt.

Anschließend verdeutlicht Broder die Absicht hinter den informationsorientierten Suchen wie folgt:

“Informational queries. The purpose of such queries is to find information assumed to be available on the web in a static form. No further interaction is predicted, except reading. By static form we mean that the target document is not created in response to the user query.”

(Ebenda)

Außerdem verdeutlicht er die Bandbreite des potentiellen Informationsbedarfs:

“What is different on the web is that many informational queries are extremely wide, for instance cars or San Francisco, while some are narrow, for instance normocytic anemia, Scoville heat units.”

(Ebenda)

Die Klasse der aus Sicht der Suchmaschinenoptimierung interessantesten Suchanfragen, nämlich Suchanfragen mit klarer Kaufabsicht beschreibt Broder wie folgt:

“Transactional queries. The purpose of such queries is to reach a site where further interaction will happen. This interaction constitutes the transaction defining these queries.”

(Ebenda)

Neben den Kaufabsichten, schließt Broder jedoch auch die Suche nach Downloads, Webdiensten, Datenbankabfragen oder Servern für Onlinespiele explizit mit ein. Für die Betrachtung der Klasse aus Sicht der Suchmaschine macht Broder eine interessante Anmerkung hinsichtlich der Evaluierbarkeit derartiger Ergebnisse:

“The results of such queries are very hard to evaluate in terms of classic IR. Binary judgment might be all we have, say appropriate, non-appropriate. However most external factors important for users (e.g. price of goods, speed of service, quality of pictures, etc[sic!]) are usually unavailable to generic search engines.”

(Ebenda)

Diese Aussage zeigt, dass Broder das Ziel der transaktionsorientierten Suchanfrage in der Interaktion mit einer Entität außerhalb des Suchmaschinenindizes begreift.

Diese drei Klassen bilden also das Spektrum von der Eingabe einer komplexen Fragestellung über die Anfrage ein bestimmtes Produkt online zu kaufen, bis hin zu gezielten Suchen nach einer bestimmten Webseite ab, wofür sich jeweils unterschiedliche Ranking-Algorithmen besser bzw. schlechter zu eignen scheinen.43 In dieser Arbeit beschreibt Broder, dass bis 2002 drei Entwicklungsstufen von Web-Suchmaschinen identifiziert werden konnten. Jede dieser Suchmaschinen-Generationen war, nach seinen Aussagen, in der Lage eine weitere Klasse seiner Taxonomie sinnvoll zu beantworten:

1. Die erste Generation verwendete lediglich die on-Page-Daten, also den Text und dessen Auszeichnungen und ähnelt klassischen Information-Retrieval-Systemen sehr stark. Firmen wie AltaVista, Excite, WebCrawler und andere setzen diese Form der Websuche als State-Of-The-Art-Technologie etwa von 1995 bis 1997 ein. Dieser Ansatz funktionierte laut Broder lediglich für die Klasse sogenannter informational queries.
2. Die zweite Generation zog off-Page-Daten heran, beispielsweise Link-Analysen, Link-Texte und Click-Through-Daten. So verwendete Google zum Beispiel Link-Analysen als erste Suchmaschine überhaupt als primären Rankingfaktor. DirectHit setzte seinerzeit [Anmerkung des Verfassers: 1998-1999] stärker auf Click-Through-Daten und ging später in Ask Jeeves auf.44 Neben den informational queries sollte diese zweite Generation auch für die sogenannten navigational queries funktionieren. Mittlerweile verwenden laut Broder alle großen Suchmaschinen diese Daten für ihr Ranking. Insbesondere die Link-Analyse und die Link-Texte scheinen laut Broder unabdingbar für die Klasse der navigational queries zu sein.45
3. Als dritte Generation, die sich laut Broder gerade erst entwickeln [Hinweis des Autors: Dies war bereits 2002], scheinen Daten aus unterschiedlichsten Quellen zu vermischen, um damit das Bedürfnis hinter der Suchanfrage zu beantworten. Als Beispiel führt er die Suchanfrage „San Francisco“ an, für diese die Suchmaschine möglichweise Links zu einer Hotelreservierung in San Francisco, einem Kartendienst, dem Wetter und weiteren Funktionen anzeigen könnte. Derartige Suchergebnisse lassen sich laut Broder durch eine Loslösung von einem festen Korpus mittels semantischer Analyse, Kontext-Erkennung, dynamischer Auswahl der Datenbasis, etc. erreichen. Weiter postuliert Broder, dass diese dritte Generation sich insbesondere mit dem effizienten Umgang mit transaktionsorientierten Suchanfragen auseinandersetzen. Einerseits da die Nutzerbedürfnisse dies schlichtweg verlangen und andererseits, da sich transactional queries sich besonders gut monetarisieren lassen.46

2.3 Weiterentwicklung Broders Taxonomie

Der Taxonomie Broders haben sich diverse Wissenschaftler und Entwickler auf Seite der Suchmaschinen angeschlossen.47 Kofler et al. (2016) machten in ihren Studien vergleichbare Beobachtungen und konnten Broders Taxonomie bestätigen.48 Sie beschrieben ebenfalls den sogenannten Intent, als das zugrundeliegende Ziel einer Websuche. Auch Lorigo et al. stellten 2006 fest, dass Broders Taxonomie breite Anerkennung findet und auch von Kang & Kim (2004) bestätig werden konnte:

„Navigational tasks are tasks where the users[sic!] intent is to find a particular web page, such as a homepage; informational tasks arise when the intent is to find information about a topic that may reside on one or more web pages; and transactional search tasks reflect the desire of the user to perform an action, such as an online purchase.”49

Im Laufe der letzten zehn Jahre konnte diese Dreiteilung ergänzt, erweitert und stärker ausdifferenziert werden. Lewandowski et al. (2012) fügen den drei Klassen von Broder zwei weitere hinzu. Diese ergeben sich aus der Ausdifferenzierung der Suchmaschinen im Hinblick auf die Integration von Werbeanzeigen und lokalen Ergebnissen und wurden als kommerziell, sowie lokalisiert beschrieben:

„Commercial, where the query has “commercial potential” (i.e., the user might be interested in commercial offerings). This also can be an indicator whether to show advertisements on the search engine results page (SERP).” (Ebenda) “Local, where the user is searching for information near his or her current geographic position.”

(Ebenda).

Rose & Levinson verfeinerten Broders Ansatz und stellten 2004 in Ihrer ein eigenes Framework für Ziele der Suchenden vor (Abbildung 4). Dabei schufen sie innerhalb der Klasse Informational weitere Unterklassen, um den Informationsbedarf des Nutzers noch genauer spezifizieren zu können. So beschreibt 2.1.1 der Hierarchie beispielsweise eine geschlossene Frage, die laut Rose & Levinson nur eine einzige und eindeutige Antwort hat. Die Klasse der transaktionsorientierten Suchanfragen von Broder wird in diesem Framework durch die unkommerzielle Klasse der Resource abgebildet und erhält zusätzliche Subklassen für Interaktion, Download, Unterhaltung und Beschaffung.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: “The Search Goal Hierarchy” in Rose & Levinson (2004)

2.4 Die drei Ebenen der Klassifikation

Die aus Sicht des Verfassers zentrale Arbeit im Bereich der Keyword-Klassifikation, stellt die Studie von Jansen et al. (2008) dar. Die Forscher stellen darin ein detailliertes Klassifikationssystem für den User Intent von Websuchen vor, welches sie auf eigenen Analysen und vorhergegangen Arbeiten aufbauen. Diese Arbeit eine Synthese sämtlicher bisherigen Arbeiten zu diesem Thema dar und liefert in der folgenden Tabelle einen Überblick über die Hierarchien des eigenen Frameworks mit drei weiteren Betrachtungsebenen, sowie die Analogien und Abweichungen der vorherigen Arbeiten hierzu.

Im Gegensatz zu vorherigen Arbeiten, die meist nur Beispiele nennen, ohne Details über die Klassifikationsmethoden zu nennen, werden bei Jansen et al. die Kategorien auch operationalisiert. Die Software, welche von den Forschern entwickelt wurde, klassifiziert automatisch Keywords mittels Suchanfragen aus dem Logs von Web-Suchmaschinen.

Diese Ergebnisse wurden mittels 400 manuell klassifizierten Begriffen validiert und zeigten eine Genauigkeit von 74%.50 Bei den verbleibenden Suchanfragen ist die Suchintention laut Aussagen der Forscher entweder relativ vage, oder hat unterschiedliche Facetten51 Eine weitere Besonderheit dieser Studie sind, laut der Autoren, der Umfang und die Vielfältigkeit der verwendeten Daten. Diese nutzten über anderthalb Millionen Suchanfragen, frühere Arbeiten jeweils nur wenige Hundert bis einige Tausend.52 In deren Definition der informationsorientierten Suchanfragen, taucht außerdem erstmals der Begriff Multimedia auf. Neben reinen Texten und Dokumenten sollten auch Daten oder Audio- bzw. Videomaterial zur Befriedigung des Informationsbedürfnisses eine Rolle spielen:

“Informational searching: The intent of informational searching is to locate content concerning a particular topic in order to address an information need of the searcher. The content can be in a variety of forms, including data, text, documents, and multimedia. The need can be along a spectrum from very precise to very vague.“53

In der Definition der navigationsorientierten Suchanfragen findet sich ebenfalls eine nennenswerte Neuerung, nämlich die Erweiterung auf eine Suchanfrage, bei der der Suchende davon ausgeht, dass eine bestimmte Webseite existiert:

“Navigational searching: The intent of navigational searching is to locate a particular Website. The Website can be that of a person or organization. It can be a particular Web page, site or a hub site. The searcher may have a particular Website in mind, or the searcher may just ‘think’ a particular Website exists.“54

Bei der transaktionsorientierten Suche schließen sich die Forscher wieder den vorherigen Arbeiten an:

„Transactional searching: The intent of transactional searching is to locate a Website with the goal to obtain some other product, which may require executing some Web service on that Website. Examples include purchase of a product, execution of an online application, or downloading multimedia.“55

In der Taxonomie wird die Informationssuche in fünf Unterkomponenten unterteilt (directed, undirected, find, list, sowie advice). und die Navigationssuche in zwei Unterkategorien (Navigation zu einer Transaktionsseite oder Navigation zu einer Informationsseite). Laut Jansen et al. kann es aus Nutzersicht auch Folgeziele geben, sobald der Nutzer an seinem vermeintlichen Ziel angekommen ist. So kann die Navigationssuche als Ausdruck einer Zwischenabsicht betrachtet werden, die auf die Befriedigung eines größeren Suchziels abzielt.56 Die transaktionsorientierte Suche wird in der Arbeit mit vier Unterkategorien (Erhalten, Herunterladen, Interagieren sowie Suchmaschinen-Ergebnisse) ebenfalls differenziert dargestellt. Besonders interessant in diesem Zusammenhang ist die letzte Unterkategorie „Suchmaschinen-Ergebnisse“, da sie die Möglichkeiten direkter Antworten durch die Web-Suchmaschinen bereits inkludiert. Diese Klasse umfasst diejenigen Suchanfragen, bei denen die Ergebnisseite der Web-Suchmaschine das Endziel ist. Bei dieser Art der Suche erscheint die „Antwort“ direkt auf der Ergebnisseite der Suchmaschine, z. B. Vorschläge für die korrekte Schreibweise oder als Begriffe bereits im Titel, der URL oder dem Snippet des Ergebnisses.

Dem besseren Verständnis der von Jansen et al. verwendeten Klassifikationen dient folgende Tabelle. Diese enthält alle drei Spezifikationsebenen (Levels) und liefert für jede Klasse ein Beispiel (Abbildung 5). Alle Suchanfragen-Beispiele in der Tabelle aus Abbildung 5 stammen aus dem Dogpile Transaktionsprotokoll, dass in der Arbeit zur automatischen Klassifizierung von Jansen et al. verwendet wurde.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Definitionen der einzelnen Klassifikationen in der Taxonomie der Benutzerabsicht57

Diese Taxonomie für die Klassifikation von Suchanfragen an Web-Suchmaschinen stellt als Synthese vorheriger Arbeiten mit umfangreichen eigenen Studien eine detaillierte und ausdifferenzierte Kategorisierung dar und findet daher in den weiteren Kapiteln dieser Arbeit Anwendung.

2.5 Nutzerintentionen der multimedialen Suche

Die Untersuchungen von Rose & Levinson, als auch die vorgeschlagenen Abfrageklassen von Broder beziehen sich ausschließlich auf die textuelle Websuche, also der Suche nach textbasierten Ergebnissen. Durch die immer stärkere Einbindung multimedialer Elemente, wie Bilder oder Videos in die Suchergebnisseite der Web-Suchmaschinen, stellt sich die berechtigte Frage nach der Klassifikation von Suchanfragen in der multimedialen Suche. Dass die Intention bei der multimedialen Suche sehr wichtig ist, konnte Chang (2011) nachweisen. Da sich Multimedia-Inhalte von Text in verschiedenen Dimensionen unterscheidet58 haben sich Lux et al. (2010) mit der Intention im Bereich der Bildersuche auseinandergesetzt.

Das von ihnen vorgeschlagene Klassifizierungsschema für die Benutzer-Bildsuche setzt sich aus vier Kategorien zusammen:

1. Wissensorganisation: Die Benutzer streben danach, Erkenntnisse aus dem Bildinhalt zu gewinnen.
2. Mentales Bild: Die Benutzer haben bereits einen bestimmten Bildinhalt im Sinn.
3. Navigation: Die Benutzer wissen über die Existenz eines Bildes und suchen genau dieses.
4. Transaktion: Die Benutzer versuchen, das Bild zu kaufen oder herunterzuladen und als Objekt wiederzuverwenden.

Diese Klassen lassen sich mit dem ersten Level der von Jansen et al. vorgeschlagenen Taxonomie vereinigen: Wissensorganisation entspricht der klassischen informationsorientierten Suche, Navigation der navigationsorientierten Suche und Transaktion der transaktionsorientierten Suche. Einzig die Suche nach einem mentalen Bild ist so spezifisch, dass diese eher mit der geschlossenen Informationssuche aus der drittenen Ebene (Level 3 Informational, Directed, Closed) der von Jansen et al. vorgeschlagenen Taxonomie übereinstimmt.

Die Autoren betonen jedoch, dass diese Kategorien als überlappende Klassen charakterisiert werden sollten und sich nicht scharf voneinander abgrenzen lassen.59

Für die Untersuchung der Nutzerintention im Bereich der Videosuche haben Hanjalic et al. (2012) sehr detaillierte Intentionskategorien definiert, deren Subkategorien sich jedoch nicht sinnvoll mit der bestehenden Taxonomie für Web-Suchen vereinigen lässt und daher in dieser Arbeit keine Verwendung findet.

2.6 Alternative Taxonomien

Für Suchanfragen sind weitere Taxonomien denkbar. So werden im Bereich der Suchmaschinenoptimierung, besonders für die Keyword-Recherche und Keyword-Auswahl, die gesammelten Suchanfragen in Klassen nach Suchvolumen aufgeteilt.60 Die Suchhäufigkeit von Suchbegriffen lässt sich beispielsweise mittels Tools wie dem Google AdWords Keyword Planner relativ einfach bestimmen61 und ist daher kein Fokus der SERP-Analyse dieser Arbeit.

Eine ebenfalls gebräuchliche Betrachtung von Suchbegriffen innerhalb der SEO-Branche stellt die sogenannte Keyword-Difficulty dar. Hierbei wird versucht die Arbeit zu quantisieren, die notwendig wäre, um ein kompetitives Ranking zu dem betreffenden Begriff zu erreichen.62 Für diesen Zweck existieren bereits zahlreiche Ansätze auf Basis der Analyse der rankenden Seiten in kommerziellen Online-Tools.63 Eine Betrachtung dieses Aspekts von Suchanfragen findet in dieser Arbeit daher nicht statt.

[...]


1 Vgl. Lorigo et al., 2006; Spink, 2006; Ortiz-Cordova & Jansen, 2012; Enge et al., 2012, S. 18ff; Chuklin, 2013; Luh et al., 2016.

2 Vgl. Ortiz-Cordova & Jansen, 2012.

3 Vgl. Meyer & Langville, 2006.

4 Vgl. McIntyre, 2015.

5 Vgl. Meyer & Langville, 2006, S. 43.

6 Vgl. Weideman & Chambers, 2005.

7 Vgl. Alpar et al., 2015, S. 24; Lewandowski, 2016.

8 Vgl. Borrell Associates, zitiert nach Sterling, 2016.

9 Vgl. ebenda.

10 Vgl. Al-Ananbeh et al., 2012; Gandour & Regolini, 2011; Berman & Katona, 2013; Moreno & Martinez, 2013; Luh et al., 2016.

11 Vgl. Gandour & Regolini, 2011; Moreno & Martinez, 2013.

12 Vgl. Weideman & Visser, 2014; Lievonen, 2013; Jones, 2013; Cui & Hu, 2011; Zhang & Dimitroff, 2005.

13 Vgl. Zhang & Dimitroff, 2005.

14 Vgl. Cui & Hu, 2011.

15 Vgl. Lewandowski, 2013.

16 Vgl. Luh et al., 2016.

17 Vgl. ebenda.

18 Vgl. Evans, 2007; Andrieu, 2009 zitiert nach: Gandour & Regolini, 2011.

19 Vgl. Ochoa, 2012, S. 70.

20 Vgl. Scripps Networks, LLC, 2017.

21 Ochoa, 2012, S. 15.

22 Vgl. Meyer & Langville, 2006.

23 Vgl. Ortiz-Cordova & Jansen, 2012.

24 Vgl. Rehman & Khan, 2013.

25 Kofler et al., 2016.

26 Vgl. Ortiz-Cordova & Jansen, 2012.

27 Vgl. Wübbenhorst , n.d..

28 Vgl. Europäische Kommission, 2017.

29 Vgl. Lorigo et al., 2006; Spink, 2006; Ortiz-Cordova & Jansen, 2012; Enge et al., 2012, S. 18ff; Chuklin, 2013; Luh et al., 2016.

30 Vgl. Clarke et al., 2008.

31 Vgl. Church & Smyth, 2009.

32 Vgl. Weidemann, 2017.

33 Vgl. Google Inc., 2017.

34 Vgl. ebenda.

35 Vgl. Google Inc., „How Google Search Works“.

36 Vgl. Ochoa, 2012, S. 25.

37 Vgl. Broder, 2002.

38 Vgl. Ovidiu & Davison, 2016; Egri & Bayrak, 2014; Weideman & Visser, 2014; Al-Ananbeh et al., 2012; Gandour & Regolini, 2011; Dr. Samrat & Omprakash, 2011; White et al., 2010; Malaga, 2008; Zhang & Dimitroff, 2005.

39 Vgl. White & Dumais, 2009; White et al., 2008.

40 Vgl. Agrawal et al., 2009.

41 Rose & Levinson, 2004.

42 Vgl. Broder, 2002.

43 Vgl. Broder, 2002.

44 Vgl. CNET, o. V., 2002.

45 Vgl. Broder, 2002.

46 Vgl. Broder, 2002.

47 Vgl. Kang & Kim, 2004; Choudhari & Bhalla, 2015.

48 Vgl. Rose & Levinson, 2004; Jones & Klinkner, 2008 sowie Strohmaier & Kröll, 2012.

49 Kang & Kim, 2004.

50 Vgl. Jansen et al., 2008.

51 Vgl. ebenda.

52 Vgl. ebenda.

53 Ebenda.

54 Jansen et al., 2008.

55 Ebenda.

56 Vgl. Jansen et al., 2008

57 Jansen et al., 2008.

58 Vgl. Jansen et al., 2004.

59 Vgl. Lux et al., 2010.

60 Vgl. Fox, 2012; Enge et al., 2012, S. 180; Erlhofer, 2015, S. 140f; Alpar et al., 2015, S. 169.

61 Vgl. Google Inc., n.d..

62 Vgl. Enge et al., 2012, S. 170.

63 Vgl. Alexa Internet, Inc., n.d.; SEMRUSH CY LTD, n.d.; Moz, Inc., n.d..

Ende der Leseprobe aus 118 Seiten

Details

Titel
Automatisierte Keyword-Klassifikation von Suchmaschinen wie Google. Nutzerzufriedenheit durch Berücksichtigung der Intention im SEO
Autor
Jahr
2019
Seiten
118
Katalognummer
V468935
ISBN (eBook)
9783960956099
ISBN (Buch)
9783960956105
Sprache
Deutsch
Schlagworte
google, seo, suchmaschinen, suchmaschinenoptimierung, serp, analyse, automatisierung, keyword klassifikation, suchwort, suchwörter, online marketing, Search Engine Optimization, Search Engine Marketing, Search Engine Advertising, SEM, SEA
Arbeit zitieren
Kai Spriestersbach (Autor), 2019, Automatisierte Keyword-Klassifikation von Suchmaschinen wie Google. Nutzerzufriedenheit durch Berücksichtigung der Intention im SEO, München, GRIN Verlag, https://www.grin.com/document/468935

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Automatisierte Keyword-Klassifikation von Suchmaschinen wie Google. Nutzerzufriedenheit durch Berücksichtigung der Intention im SEO


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden