Gegenstand dieser Arbeit ist ein serverseitiger Dienst zur Analyse von HTML-Code. Im Mittelpunkt steht der Bild- und Video-Content der jeweiligen Seite. Nach einer erfolgreichen Analyse wird zunächst jegliche Information kategorisiert und im Zuge dessen eine realistische Verweildauer eines Benutzers abgeschätzt. Das Ergebnis liegt dem Benutzer sowohl als grafische Oberfläche, sowie in einem zur weiteren Verarbeitung benötigen JSON-Format vor.

Durch das extrem wachsende Bedürfnis nach immer effizienteren und schnelleren Wegen des Datenaustauschs ist das World Wide Web eines der wichtigsten Bestandteile unseres modernen Lebens geworden. Nicht zuletzt durch das schier unvorstellbar große Feld an Informationen, welches das World Wide Web im Jahr 2015 mit 863.105.652 Internetpräsenzen bietet, ist das Thema „Information Retrieval“, das Suchen nach multimedialen Dokumenten (Texte, Bilder, Vi-deo, Audio, Hypertexte), ein grundlegender Baustein des World Wide Web.

Extracto

Inhaltsverzeichnis

Einleitung
Anforderungsanalyse
- Grundlagen der Informationswissenschaft
  - Subjektives Wissen
  - Objektives Wissen
  - Informationsübermittlung
  - Informationsvermittlung
- Information Retrieval
  - Informationsbedarf
  - Recall und Precision
  - Allgemeine Relevanz
  - Retrieval Modelle
- Bereitstellung und Auswertung von Informationen im Web
  - Link-Topologie
  - Ranking
  - Multimedia Retrieval
Modellbildung
Realisierung
Evaluierung/Test
Zusammenfassung und Ausblick

Zielsetzung und Themenschwerpunkte

Diese Arbeit beschäftigt sich mit der Entwicklung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval. Das Ziel ist es, den Bild- und Video-Content von Webseiten zu kategorisieren und die geschätzte Verweildauer eines Benutzers auf der Seite zu berechnen.

Analyse von HTML-Code
Kategorisierung von Bild- und Video-Content
Schätzung der Verweildauer
Information Retrieval
Serverseitige Implementierung

Zusammenfassung der Kapitel

Einleitung: Dieses Kapitel führt in das Thema Information Retrieval ein und erläutert die Bedeutung des World Wide Web als Informationsquelle. Es stellt die Motivation und den Fokus der Arbeit vor.
Anforderungsanalyse: Dieses Kapitel beleuchtet die Grundlagen der Informationswissenschaft, inklusive subjektiven und objektiven Wissens, Informationsübermittlung und -vermittlung. Es behandelt zentrale Konzepte des Information Retrieval wie Informationsbedarf, Recall, Precision und Relevanz sowie verschiedene Retrieval-Modelle. Abschließend werden die Bereitstellung und Auswertung von Informationen im Web, einschließlich Link-Topologie, Ranking und Multimedia Retrieval, betrachtet.
Modellbildung: Dieses Kapitel präsentiert die Architektur und Funktionsweise des entwickelten Dienstes. Es beschreibt die HTML-Dokumenten-Analyse, die Verarbeitung von Grafikformaten und die Schätzung der Verweildauer auf Basis des Bild- und Video-Contents.
Realisierung: Dieses Kapitel beschreibt die Umsetzung des Dienstes, einschließlich der serverseitigen Implementierung und Datenanalyse.
Evaluierung/Test: Dieses Kapitel beleuchtet die Evaluierung und Testphase des Dienstes, einschließlich der verwendeten Methoden und Ergebnisse.

Schlüsselwörter

Die Arbeit konzentriert sich auf die Themen Information Retrieval, HTML-Code-Analyse, Bild- und Video-Content, Verweildauer, serverseitige Implementierung, PHP und JSON-Format. Sie befasst sich mit der Entwicklung und Evaluierung eines Dienstes, der eine automatische Analyse von Webseiten ermöglicht, um relevante Informationen für Nutzer zu extrahieren.

Final del extracto de 85 páginas - subir

Detalles

Título: Umsetzung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval
Universidad: Wiesbaden University of Applied Sciences
Calificación: 1,6
Autor: Sergio Staab (Autor)
Año de publicación: 2016
Páginas: 85
No. de catálogo: V374648
ISBN (Ebook): 9783668522756
ISBN (Libro): 9783668522763
Idioma: Alemán
Etiqueta: Information Retrieval Analyse von HTML-Code Informationsbedarf Recall und Precision Retrieval Modelle
Seguridad del producto: GRIN Publishing Ltd.

Citar trabajo: Sergio Staab (Autor), 2016, Umsetzung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval, Múnich, GRIN Verlag, https://www.grin.com/document/374648

Umsetzung eines Dienstes zur Analyse von HTML-Code im Bereich Information Retrieval