Im Laufe der letzten Jahre hat sich das World Wide Web von einem statischen zu einem Web dynamischer Inhalte gewandelt. Unterschiedliche, zur gleichen Zeit surfende Besucher der selben Webseite sehen nicht zwangsläufig die gleichen Inhalte. Der präsentierte Content ist in vielen Fällen „adaptiv“, das heißt er richtet sich danach, was die Webseite über den jeweiligen Besucher „weiß“. Als Basis für die so genannte Personalisierung von Webseiten dienen Benutzermodelle. Diese werden in der Regel langfristig aufgebaut und erfordern eine vorherige Registrierung des Besuchers. Der Besucher, dem personalisierte Inhalte präsentiert werden, ist dem System bekannt; für anonyme Besucher stehen personalisierte Inhalte gewöhnlich nicht zur Verfügung.
In dieser Diplomarbeit wird zunächst der aktuelle „state of the art“ im Bereich Personalisierung und Benutzermodellierung zusammengefasst und ein Überblick über die Gebiete Web Log Mining und Webseiten-Kategorisierung gegeben. Der zweite Teil der Arbeit beschreibt einen neuen Personalisierungsansatz, der auf den bestehenden Konzepten basiert und diese erweitert. Konkret erstellt das entworfene Konzept kurzfristige, implizite Benutzermodelle von unbekannten Besuchern auf Basis ihres Navigationsverhaltens und unter Einbeziehung von Webseiten-Metadaten („Annotationen“). Damit ist es möglich, Inhalt und Präsentation einer Webseite an die Interessen des Besuchers anzupassen - selbst wenn es sich bei ihm um einen anonymen, nicht registrierten Besucher handelt. Im Rahmen der Arbeit wurde ein Software-Tool implementiert, das den entworfenen Personalisierungsansatz umsetzt und zusätzlich über Analysefunktionalitäten für serverseitige Web Logs verfügt. Der Funktionsumfang des Tools und das entwickelte Personalisierungskonzept werden anhand konkreter und möglicher Anwendungsszenarien vorgestellt. Zusätzlich wird illustriert, wie die durch den neuen Ansatz implizit erstellten Benutzerprofile dafür genutzt werden können, die Benutzerfreundlichkeit wissensbasierter Recommendersysteme zu steigern.
Inhaltsverzeichnis
- Einleitung
- Theoretische Grundlagen
- Web Log Mining
- Data Mining
- Klassifikation
- Clustering
- Assoziationsregeln
- Sequentielle Muster
- Anwendungsgebiete
- Inhalt von Logfiles
- Preprocessing von Web Logs
- Säubern der Logdatei
- Identifikation von Usern
- Identifikation von Sessions
- Alternative: Sammeln von Logdaten auf Clientseite
- Repräsentation von Web Logs
- n-dimensionaler binärer Attributvektor
- n-dimensionaler Pageview-Referenz Vektor
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit befasst sich mit dem Thema der Webseiten-Personalisierung für anonyme Besucher. Ziel ist es, einen neuen Ansatz zur Erstellung von kurzfristigen, impliziten Benutzermodellen zu entwickeln, die auf dem Navigationsverhalten und Metadaten der besuchten Seiten basieren. Dieser Ansatz ermöglicht die Anpassung von Webseiten an die Interessen des Besuchers, selbst wenn es sich um einen anonymen, nicht registrierten Besucher handelt. Die Arbeit untersucht den aktuellen Stand der Technik in den Bereichen Personalisierung, Benutzermodellierung, Web Log Mining und Webseiten-Kategorisierung.
- Entwicklung eines neuen Personalisierungsansatzes für anonyme Besucher
- Erstellung von kurzfristigen, impliziten Benutzermodellen auf Basis des Navigationsverhaltens
- Einbeziehung von Webseiten-Metadaten zur Verbesserung der Benutzermodellierung
- Anpassung von Inhalten und Präsentationen an die Interessen des Besuchers
- Analyse des aktuellen Stands der Technik in den Bereichen Personalisierung und Web Log Mining
Zusammenfassung der Kapitel
Das erste Kapitel dient als Einleitung und führt in die Thematik der Webseiten-Personalisierung ein. Im zweiten Kapitel werden die theoretischen Grundlagen des Web Log Mining behandelt, wobei die verschiedenen Data Mining-Techniken wie Klassifikation, Clustering, Assoziationsregeln und sequentielle Muster vorgestellt werden. Des Weiteren wird auf die Inhalte von Logfiles, die Vorverarbeitung von Web Logs und die verschiedenen Repräsentationsformen von Web Logs eingegangen.
Schlüsselwörter
Webseiten-Personalisierung, Benutzermodellierung, Web Log Mining, Data Mining, anonyme Besucher, implizite Benutzermodelle, Navigationsverhalten, Webseiten-Metadaten, COHAVE-Projekt.
- Arbeit zitieren
- Dipl.-Ing. Thomas Brudermann (Autor:in), 2007, Webseiten-Personalisierung für anonyme Besucher, München, GRIN Verlag, https://www.grin.com/document/86014