Bildverarbeitende Systeme können aus einer Menge von Bildern selbstständig zusammenhängende Fotos einer bestimmten Urlaubsreise als Album zu gruppieren oder Gesichter von Personen darauf zu erkennen. Wie solche Programme grundsätzlich funktionieren und auf welche Technologien diese basieren, soll mit dieser Seminararbeit dargestellt werden. Exemplarisch soll hierzu eine Anwendung entstehen, die in der Lage ist, eine Sammlung von Hundebildern selbstständig in deren jeweiligen Hunderassen zu kategorisieren.
Zunächst wird anhand diverser Literatur das Themengebiet Neuronale Netze mit einem kurzen geschichtlichen Hintergrund deren Idee sowie deren Funktionsweisen erörtert. Daraufhin folgt die Definition und Unterscheidung von Vorgehensweisen im Themengebiet des Machine Learning. Aufbauend wird in Kapitel 4 der Begriff Deep Learning dargelegt sowie existierende Werkzeuge vorgestellt, mit denen künstlich Neuronale Netze erstellt und trainiert werden können. In Kapitel 5 wird schrittweise die Vorgehensweise dokumentiert, mit der das Programm erstellt wurde und welche Ergebnisse dabei erzielt wurden.
Inhaltsverzeichnis
1 Einleitung
2 Neuronale Netze
2.1 Biologische neuronale Netze
2.2 Künstliche neuronale Netze
2.3 Funktionsweise eines KNN
3 Deep Learning
3.1 Supervised Learning
3.2 Reinforcement Learning
3.3 Unsupervised Learning
3.4 Semi-supervised Learning
3.5 Active Learning
4 Werkzeuge für Deep Learning
4.1 TensorFlow
4.2 Caffe-Framework
4.3 Python
5 Docker Installation
5.1 Beispiel Bildklassifizierungsmodell mit Caffe
5.2 Implementierung eines Bildklassifikationsmodells für Hunderassen
5.3 Ergebnisse der Bildklassifizierung
6 Schlussbetrachtung
Zielsetzung & Themen der Seminararbeit
Das Hauptziel dieser Arbeit ist es, die Funktionsweise von Programmen im Bereich der künstlichen Intelligenz sowie die zugrunde liegenden Technologien darzustellen. Exemplarisch wird dazu eine Anwendung entwickelt, die in der Lage ist, eine Sammlung von Hundebildern selbstständig in deren jeweiligen Hunderassen zu kategorisieren.
- Grundlagen neuronaler Netze und ihre biologischen Vorbilder
- Definition und Differenzierung verschiedener Machine-Learning-Verfahren
- Einsatzmöglichkeiten von Deep-Learning-Frameworks wie TensorFlow und Caffe
- Praktische Umsetzung einer Bildklassifizierung mittels Docker und vortrainierten Modellen
Auszug aus dem Buch
2.1 Biologische Neuronale Netze
Ein Neuronales Netz ist ein Verbund von Nervenzellen wie es in einem Gehirn von Menschen und Tieren existiert. Dieses Netzwerk von winzigen und komplex verknüpften Nervenzellen befähigt Menschen unter anderem zu Wahrnehmungen, Assoziationen, Gedanken, Bewusstsein sowie zum Lernen. Ermöglicht wird dies durch rund 100 Milliarden Nervenzellen, die es in einem menschlichen Gehirn gibt. Sie übertragen und verarbeiten sowohl chemische als auch elektrische Signale. Bezeichnet werden diese als Neuronen. Sie bestehen aus einem Zellkern, Dendriten, einem Axon sowie Synapsen. Innerhalb der Nervenzellen findet eine bestimmte Abfolge von Handlugen statt. An den Dendriten werden Signale von benachbarten Neuronen empfangen und an den Zellkern weitergeleitet.
Der Zellkörper stellt eine Art Speicher dar, der sich durch die eingehenden Impulse elektrisch auflädt. Dabei baut sich eine Spannung im Zellkern auf, die beim Erreichen eines gewissen Schwellwertes in Form eines elektrischen Impulses an das Axon, das wie ein Datenkabel fungiert, geleitet wird. Der Spannungsimpuls teilt sich wiederum an den Synapsen auf, welche am Axon hängen. Deren Enden sind mit den Dendriten benachbarter Nervenzellen verknüpft, die die Impulse wiederum entgegennehmen. Fortfolgend wiederholt sich der Prozess in ähnlicher Weise. Stark vereinfacht stellt ein Neuron eine Funktion dar, in der Signale empfangen, gespeichert und ausgegeben werden. Die Speicherung von Informationen, die in Folge eines Lernprozesses entstehen, wird durch Modifikation der Enden an den Synapsen im Gehirn erreicht. Ähnlich wie bei einem Muskel werden die Stränge je nach Beanspruchung dicker und gewinnen damit an Gewicht.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einführung erläutert die zunehmende Relevanz digitaler Bildverarbeitung durch Smartphones und definiert das Ziel der Arbeit, ein System zur Hunderassen-Kategorisierung zu entwickeln.
2 Neuronale Netze: Dieses Kapitel vergleicht biologische neuronale Strukturen des Gehirns mit ihrer rechnerischen Nachahmung in Form künstlicher neuronaler Netze (KNN).
3 Deep Learning: Hier werden verschiedene Lernmethoden wie Supervised, Reinforcement und Unsupervised Learning definiert und in den Kontext des Maschinellen Lernens eingeordnet.
4 Werkzeuge für Deep Learning: Der Abschnitt stellt relevante Open-Source-Frameworks wie TensorFlow, Caffe und die Programmiersprache Python für die Entwicklung von Deep-Learning-Anwendungen vor.
5 Docker Installation: Dieses Kapitel dokumentiert die technische Einrichtung der Arbeitsumgebung mittels Docker und die schrittweise Implementierung des Bildklassifikationsmodells.
6 Schlussbetrachtung: Die Arbeit schließt mit einer kritischen Reflexion über die Komplexität der Modellentwicklung, die Herausforderungen bei der Installation von Frameworks und die Notwendigkeit zur Optimierung von Trainingsdaten.
Schlüsselwörter
Künstliche Intelligenz, Neuronale Netze, Deep Learning, Machine Learning, Bildklassifizierung, TensorFlow, Caffe-Framework, Python, Docker, Supervised Learning, Datenverarbeitung, Hunderassen, Algorithmen, Modelltraining, Informatik
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Funktionsweise und den technologischen Grundlagen von Systemen, die auf künstlicher Intelligenz basieren, und demonstriert deren Anwendung in der Praxis.
Welche zentralen Themenfelder werden behandelt?
Die zentralen Felder umfassen die Theorie neuronaler Netze, verschiedene Methoden des maschinellen Lernens, die Verwendung spezifischer Software-Frameworks und die praktische Umsetzung der Bildverarbeitung.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die theoretische Erarbeitung der Funktionsweise von KNNs und die praktische Entwicklung eines Programms, das automatisch Hunderassen auf Fotos klassifizieren kann.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit folgt einer literaturbasierten Analyse der Theorie und einem experimentellen, implementierungsorientierten Ansatz zur Erstellung eines Bildklassifizierungsmodells.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die theoretischen Grundlagen von KNN und Deep Learning, die Vorstellung der Werkzeuge sowie die detaillierte Dokumentation der Programmier- und Installationsschritte.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die wichtigsten Begriffe sind Künstliche Intelligenz, Neuronale Netze, Deep Learning, Bildklassifizierung und Programmiersprachen wie Python.
Warum wird Caffe für das Projekt verwendet?
Caffe wird aufgrund seiner Eignung für akademische Forschung und Industrie sowie der Bereitstellung vortrainierter Modelle für Bildklassifizierungsaufgaben eingesetzt.
Welche Herausforderungen traten bei der Implementierung auf?
Die Installation des Caffe-Frameworks erwies sich als komplex aufgrund zahlreicher Abhängigkeiten, zudem war die Rechenzeit für das Training mit größeren Datensätzen eine signifikante Hürde.
Was sind die Ergebnisse der Bildklassifizierung?
Die Ergebnisse blieben in den Testreihen mit den gewählten Parametern und Bildgrößen bisher nicht eindeutig genug, um eine hohe Trefferquote für eine verlässliche Hunderassen-Bestimmung zu bestätigen.
- Quote paper
- Luis Marques (Author), 2019, Modellbasierte Klassifikation von Hunderassen, Munich, GRIN Verlag, https://www.grin.com/document/468593