Gegenstand dieser Arbeit ist ein serverseitiger Dienst zur Analyse von HTML-Code. Im Mittelpunkt steht der Bild- und Video-Content der jeweiligen Seite. Nach einer erfolgreichen Analyse wird zunächst jegliche Information kategorisiert und im Zuge dessen eine realistische Verweildauer eines Benutzers abgeschätzt. Das Ergebnis liegt dem Benutzer sowohl als grafische Oberfläche, sowie in einem zur weiteren Verarbeitung benötigen JSON-Format vor.
Durch das extrem wachsende Bedürfnis nach immer effizienteren und schnelleren Wegen des Datenaustauschs ist das World Wide Web eines der wichtigsten Bestandteile unseres modernen Lebens geworden. Nicht zuletzt durch das schier unvorstellbar große Feld an Informationen, welches das World Wide Web im Jahr 2015 mit 863.105.652 Internetpräsenzen bietet, ist das Thema „Information Retrieval“, das Suchen nach multimedialen Dokumenten (Texte, Bilder, Vi-deo, Audio, Hypertexte), ein grundlegender Baustein des World Wide Web.
Inhaltsverzeichnis
- Einleitung
- Anforderungsanalyse
- Grundlagen der Informationswissenschaft
- Subjektives Wissen
- Objektives Wissen
- Informationsübermittlung
- Informationsvermittlung
- Information Retrieval
- Informationsbedarf
- Recall und Precision
- Allgemeine Relevanz
- Retrieval Modelle
- Bereitstellung und Auswertung von Informationen im Web
- Link-Topologie
- Ranking
- Multimedia Retrieval
- Grundlagen der Informationswissenschaft
- Modellbildung
- Realisierung
- Evaluierung/Test
- Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Arbeit beschäftigt sich mit der Entwicklung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval. Das Ziel ist es, den Bild- und Video-Content von Webseiten zu kategorisieren und die geschätzte Verweildauer eines Benutzers auf der Seite zu berechnen.
- Analyse von HTML-Code
- Kategorisierung von Bild- und Video-Content
- Schätzung der Verweildauer
- Information Retrieval
- Serverseitige Implementierung
Zusammenfassung der Kapitel
- Einleitung: Dieses Kapitel führt in das Thema Information Retrieval ein und erläutert die Bedeutung des World Wide Web als Informationsquelle. Es stellt die Motivation und den Fokus der Arbeit vor.
- Anforderungsanalyse: Dieses Kapitel beleuchtet die Grundlagen der Informationswissenschaft, inklusive subjektiven und objektiven Wissens, Informationsübermittlung und -vermittlung. Es behandelt zentrale Konzepte des Information Retrieval wie Informationsbedarf, Recall, Precision und Relevanz sowie verschiedene Retrieval-Modelle. Abschließend werden die Bereitstellung und Auswertung von Informationen im Web, einschließlich Link-Topologie, Ranking und Multimedia Retrieval, betrachtet.
- Modellbildung: Dieses Kapitel präsentiert die Architektur und Funktionsweise des entwickelten Dienstes. Es beschreibt die HTML-Dokumenten-Analyse, die Verarbeitung von Grafikformaten und die Schätzung der Verweildauer auf Basis des Bild- und Video-Contents.
- Realisierung: Dieses Kapitel beschreibt die Umsetzung des Dienstes, einschließlich der serverseitigen Implementierung und Datenanalyse.
- Evaluierung/Test: Dieses Kapitel beleuchtet die Evaluierung und Testphase des Dienstes, einschließlich der verwendeten Methoden und Ergebnisse.
Schlüsselwörter
Die Arbeit konzentriert sich auf die Themen Information Retrieval, HTML-Code-Analyse, Bild- und Video-Content, Verweildauer, serverseitige Implementierung, PHP und JSON-Format. Sie befasst sich mit der Entwicklung und Evaluierung eines Dienstes, der eine automatische Analyse von Webseiten ermöglicht, um relevante Informationen für Nutzer zu extrahieren.
- Citar trabajo
- Sergio Staab (Autor), 2016, Umsetzung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval, Múnich, GRIN Verlag, https://www.grin.com/document/374648