Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Applied

Design, Test und Validierung von Machine Learning-basierten Empfehlungssystemen unter Anwendung der Programmiersprache Python

Title: Design, Test und Validierung von Machine Learning-basierten Empfehlungssystemen unter Anwendung der Programmiersprache Python

Project Report , 2019 , 43 Pages , Grade: 1,7

Autor:in: Michael Gehrmann (Author)

Computer Science - Applied
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

"Computers are able to see, hear and learn. Welcome to the future." (Dave Waters)
Ein Blick durch große Tageszeitungen zeigt, dass das Thema Machine Learning (ML) - häufig unter dem populären Schlagwort Künstliche Intelligenz“ - den Sprung von der Fachwelt in die Allgemeinsprache bewältigt hat. Dabei werden viele Anwendungen genannt, prominent das autonome Fahren oder die Gesichtserkennung. Mit ML ausgerüstete Lautsprecher werden als intelligente Assistenten zunehmend Teil des Alltags. Bei der Beschreibung spektakulärer Einsätze wird gern übersehen, dass an anderer Stelle Machine Learning unsere Aktivitäten im Alltag beeinflusst, vielleicht sogar steuert. Empfehlungssysteme, d.h. Algorithmen-gesteuerte technische Verfahrensweisen, die dem Nutzer nach verschiedenen Kriterien Vorschläge für seine Wahl von Produkten und Dienstleistungen unterbreiten, sind in viele Teile der Online-Wirtschaft vorgedrungen und werden mehr und mehr zur Basis der anschließenden (Kauf-)Entscheidung. Die große Bedeutung dieses Themas wird auch durch zahlreiche Konferenzen und Workshops belegt. Diese Arbeit untersucht die Grundlagen dieser Systeme und ihre Anwendungen.

Excerpt


Inhaltsverzeichnis

1. Einleitung

1.1 Problemstellung

1.2 Zielsystem

2. Machine Learning

2.1 Supervised Learning

2.2 Unsupervised Learning

2.3 Reinforcement Learning

2.4 Neuronale Netze

3. Python und seine Anwendung im Machine Learning

4. Empfehlungssysteme

4.1 Überblick

4.2 Die Daten-Pipeline

4.3 Kollaboratives Filtern

4.4 Content-basiertes Filtern

4.5 Wissensbasierte Systeme

4.6 Hybride Systeme

5. Die Realisierung in Python

5.1 Benutzerbasiertes kollaboratives Filtern

5.2 Modell-basiertes kollaboratives Filtern

5.3 Content-basiertes Filtern

6. Fazit und Ausblick

6.1 Neue Algorithmen

6.2 Manipulierte Bewertungen

6.3 Ethische und juristische Fragen

Zielsetzung & Themen

Die vorliegende Arbeit untersucht die grundlegenden Konzepte von Empfehlungssystemen und deren praktische Umsetzung mittels der Programmiersprache Python. Dabei wird der gesamte Prozess der Datenverarbeitung – von der Gewinnung über die Bereinigung bis hin zur Modellierung und Evaluation – aus der Perspektive eines Data Analyst beleuchtet, um aufzuzeigen, wie automatisierte Verfahren heute Kauf- und Auswahlentscheidungen in der Online-Wirtschaft maßgeblich beeinflussen.

  • Grundlagen des Machine Learning und Relevanz für Empfehlungssysteme.
  • Vergleich verschiedener Ansätze: Kollaboratives Filtern, Content-basiertes Filtern und hybride Systeme.
  • IT-technische Implementierung mit Python-Bibliotheken wie Pandas, Numpy und Sklearn.
  • Prozessmodellierung einer Data Acquisition Pipeline.
  • Herausforderungen wie das Kaltstartproblem, Daten-Spärlichkeit und Manipulationen.
  • Ethische Fragestellungen und Datenschutzaspekte im Kontext datengetriebener Entscheidungsmodelle.

Auszug aus dem Buch

4.2 Die Daten-Pipeline

Ein Data Analyst sieht sich bei der Lösung eines Problems einer Vielzahl von Methoden gegenüber. Für die Auswahl der richtigen Tools ist es daher wichtig, sich über die genaue Zielsetzung der Untersuchung im Klaren zu sein. In vielen Fällen wird auch das zur Verfügung stehende Datenmaterial eine wichtige Rolle spielen. Im geschäftlichen Umfeld spielt dabei der Faktor Zeit eine große Rolle.

Grundsätzlich ist hier zu unterscheiden zwischen der klassischen Datenanalyse, die nach Aussagen zu prinzipiell bekannten Sachverhalten sucht, und der explorativen Analyse, die bisher nicht bekannte Muster zu identifizieren sucht. Für diesen auch als Data Mining bezeichneten Prozess gibt es verschiedene Vorgehensmodelle; hier sei beispielhaft genannt: CRISP-DM /Cross Industry Standard Process for Data Mining.

Dieses Prozessmodell zeigt einen zentralen Punkt auf: bevor überhaupt Daten erhoben werden, muss die Fragestellung präzise definiert werden. Dies gilt umso mehr, wenn Unternehmen in Daten zu Ertrinken drohen („Big Data“). Hilfreich ist hier der von Marr vorgeschlagene Einsatz eines Strategy Boards, das den Informationsbedarf aus den unternehmerischen Strategien ableitet und fokussieren hilft. Erst danach empfiehlt sein SMART-Modell (Strategy, Metrics, Analyse, Report, Transform) die Phasen Datenerhebung und -Analyse anzuschließen.

Neben diesen High-Level Modellen gibt es Ansätze, die sich stärker mit den praktischen Problemen der Datenanalyse beschäftigen.

Zusammenfassung der Kapitel

1. Einleitung: Die Einleitung beleuchtet die zunehmende Bedeutung von Empfehlungssystemen in der Online-Wirtschaft und definiert die Zielsetzung der Arbeit, den Prozess der Implementierung aus Sicht eines Data Analyst zu betrachten.

2. Machine Learning: Dieses Kapitel bietet einen Überblick über die Methodenwelt des Machine Learning, unterteilt in Supervised Learning, Unsupervised Learning, Reinforcement Learning und Neuronale Netze.

3. Python und seine Anwendung im Machine Learning: Hier werden die Gründe für die Wahl der Programmiersprache Python dargelegt, insbesondere ihre mächtigen Bibliotheken für Data Science wie Pandas, Numpy und Sklearn.

4. Empfehlungssysteme: Das Kapitel diskutiert verschiedene Ansätze wie kollaboratives, Content-basiertes und wissensbasiertes Filtern sowie hybride Systeme und erläutert die Konzeption einer Daten-Pipeline.

5. Die Realisierung in Python: In diesem praktischen Teil werden ausgewählte Methoden wie kollaboratives und Content-basiertes Filtern konkret anhand von Film-Datensätzen in Python umgesetzt.

6. Fazit und Ausblick: Das abschließende Kapitel reflektiert über die Weiterentwicklung dieser Systeme, diskutiert Probleme wie Manipulationen und beleuchtet ethische sowie juristische Rahmenbedingungen.

Schlüsselwörter

Machine Learning, Empfehlungssysteme, Python, Data Science, Kollaboratives Filtern, Content-basiertes Filtern, Daten-Pipeline, CRISP-DM, Datenauswertung, Algorithmen, Neuronale Netze, Big Data, Datenschutz, Künstliche Intelligenz, Modellierung.

Häufig gestellte Fragen

Worum geht es in der Arbeit grundsätzlich?

Die Arbeit behandelt das Design, die Implementierung und die Validierung von Machine-Learning-basierten Empfehlungssystemen, wobei der Fokus auf der praktischen Umsetzung mit der Programmiersprache Python liegt.

Welche zentralen Themenfelder werden bearbeitet?

Die Schwerpunkte liegen auf den verschiedenen mathematischen und algorithmischen Ansätzen für Empfehlungssysteme (kollaborativ, content-basiert), der Datenverarbeitung mittels Pipelines sowie der kritischen Betrachtung ethischer und juristischer Implikationen.

Was ist das primäre Ziel der Arbeit?

Das Ziel ist die Entwicklung konkreter Ansätze zur Implementierung algorithmengestützter Empfehlungssysteme, inklusive der IT-technischen Umsetzung unter Berücksichtigung des Prozesses der Datengewinnung, Bereinigung, Visualisierung und Evaluation.

Welche wissenschaftliche Methode wird verwendet?

Es wird ein praxisorientierter Ansatz gewählt, der die Theorie des Machine Learning mit der technischen Modellierung in Python verknüpft, ergänzt durch die Analyse realer Datensätze wie dem MovieLens-Datensatz.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil gliedert sich in die methodischen Grundlagen (Machine Learning, Python-Bibliotheken), die theoretische Erläuterung der Empfehlungsmechanismen und die praktische Realisierung von Algorithmen wie dem kollaborativen Filtern in Python.

Welche Schlüsselwörter charakterisieren die Arbeit?

Zentrale Begriffe sind Machine Learning, Empfehlungssysteme, Python, Data Science, Algorithmen sowie ethische Fragestellungen im Umgang mit Nutzerdaten.

Welches spezifische Problem wird bei kollaborativen Systemen identifiziert?

Ein zentrales Problem ist die sogenannte "Sparsity" (Spärlichkeit), da die meisten Nutzer nur sehr wenige Produkte bewerten, was die Generierung valider Empfehlungen erschwert.

Wie unterscheidet sich Content-basiertes Filtern von kollaborativen Ansätzen?

Content-basiertes Filtern nutzt Merkmale der Items selbst (z. B. Genre bei Filmen), statt sich auf Benutzerprofile oder Vergleiche zwischen Nutzern zu stützen, wodurch das Kaltstartproblem für neue Produkte umgangen werden kann.

Excerpt out of 43 pages  - scroll top

Details

Title
Design, Test und Validierung von Machine Learning-basierten Empfehlungssystemen unter Anwendung der Programmiersprache Python
College
AKAD University of Applied Sciences Stuttgart
Grade
1,7
Author
Michael Gehrmann (Author)
Publication Year
2019
Pages
43
Catalog Number
V511500
ISBN (eBook)
9783346091987
ISBN (Book)
9783346091994
Language
German
Tags
Python Machine Learning
Product Safety
GRIN Publishing GmbH
Quote paper
Michael Gehrmann (Author), 2019, Design, Test und Validierung von Machine Learning-basierten Empfehlungssystemen unter Anwendung der Programmiersprache Python, Munich, GRIN Verlag, https://www.grin.com/document/511500
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  43  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint