This paper addresses the research question of whether machine learning (Machine Learning (ML)) models can be used to categorize breast cancer stages reliably. For this purpose, the possibility of determining the stages of breast cancer with sufficient accuracy will be investigated. The use of artificial intelligence in healthcare offers a broad range of new opportunities. Various kinds of analytics are already being widely trialed and can help to reduce fault diagnostics.
The purpose of this paper is to develop a possible solution that can assist in the diagnosis of breast cancer. By that, the aim is not to replace doctors ltogether. Rather, this solution is intended to provide physicians with a means of assisting in the derivation of appropriate treatment methods. Today, especially in regard to the current Corona pandemic, it is more important than ever to reduce the burden on healthcare workers.
Inhaltsverzeichnis
1 Introduction
1.1 Objective
2 Fundamentals
2.1 Breast cancer detection
2.1.1 Breast exam
2.1.2 Mammogram
2.1.3 Breast ultrasound
2.2 Image recognition
2.3 TensorFlow & Keras
2.3.1 TensorFlow
2.3.2 Keras
3 Methodology
3.1 CRISP-DM
4 Technical realization
4.1 Architecture
4.2 Data understanding
4.3 Data preprocessing
4.4 Functions for creating and evaluating ML models
4.4.1 ModelMaker Class
4.4.2 ModelEvaluator class
4.5 Evaluation of the ML models
5 Critical view and Conclusion
Zielsetzung & Themen
Die vorliegende Arbeit untersucht das Potenzial von Machine Learning, um Brustkrebsstadien zuverlässig anhand von Ultraschallbildern zu klassifizieren und medizinisches Personal bei der Diagnose zu unterstützen.
- Klassifizierung von Brustkrebsstadien mittels Convolutional Neural Networks (CNN)
- Einsatz des CRISP-DM Prozessmodells zur methodischen Strukturierung
- Technische Implementierung mit TensorFlow und Keras
- Umgang mit unbalancierten Datensätzen durch Data-Preprocessing
- Evaluierung der Modellleistung mittels Genauigkeitsmetriken und Konfusionsmatrizen
Auszug aus dem Buch
Technical realization
The following chapter explains the general technical realization of the project. Therefore it will be explained how ML models are created and in the following how the authors proceeded with the technical implementation of the ML models.
4.1 Architecture
To help the understanding of the technical realization the following figure explains the chosen architecture for the realization of the project.
You can infer from the illustration that the chosen dataset was found on the website Kaggle. This dataset was then later imported to the personal computer, as well as stored. For the model training, the Gitlab Environment was chosen.
Zusammenfassung der Kapitel
1 Introduction: Einführung in die Relevanz der Brustkrebsfrüherkennung und Definition des Forschungsziels, eine KI-basierte Unterstützungslösung zur Diagnose zu entwickeln.
2 Fundamentals: Vermittlung der medizinischen Grundlagen der Brustkrebsdiagnostik sowie technischer Aspekte von Bilderkennung und den Open-Source-Frameworks TensorFlow und Keras.
3 Methodology: Erläuterung des standardisierten CRISP-DM Prozessmodells, das als struktureller Leitfaden für das Daten-Mining-Projekt dient.
4 Technical realization: Detaillierte Darstellung der Systemarchitektur, der Datenaufbereitung, der Implementierung der Machine-Learning-Modelle sowie deren Evaluierungsergebnisse.
5 Critical view and Conclusion: Kritische Reflexion der Ergebnisse, Bewertung der Leistung des entwickelten CNN-Modells und Ausblick auf zukünftige Optimierungsmöglichkeiten bei der Brustkrebsfrüherkennung.
Schlüsselwörter
Brustkrebs, Machine Learning, Künstliche Intelligenz, Convolutional Neural Networks, CNN, TensorFlow, Keras, CRISP-DM, Bilderkennung, medizinische Diagnostik, Ultraschallbilder, Datenaufbereitung, Klassifizierung, Modellierung, Gesundheitswesen.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit dem Einsatz von Machine Learning Modellen zur automatisierten Klassifizierung von Brustkrebsstadien auf Basis von Ultraschallbildern.
Was sind die zentralen Themenfelder der Publikation?
Die Kernthemen sind die medizinische Diagnoseunterstützung mittels KI, der Einsatz von Convolutional Neural Networks (CNN) und die Anwendung des CRISP-DM Prozessmodells.
Welches primäre Ziel verfolgt die Forschungsfrage?
Das Hauptziel ist die Untersuchung, ob Machine-Learning-Modelle in der Lage sind, Brustkrebsstadien mit ausreichender Genauigkeit zuverlässig zu bestimmen und Ärzte bei der Befundung zu entlasten.
Welche wissenschaftliche Methode wird zur Analyse verwendet?
Die Autoren verwenden das CRISP-DM Modell (Cross-Industry Standard Process for Data Mining), um den Prozess von der Geschäftsverständnis-Phase bis zur Evaluierung der ML-Modelle methodisch zu strukturieren.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil beschreibt die technische Umsetzung, angefangen bei der Architektur über die Auswahl und Aufbereitung der Datensätze bis hin zur Programmierung der Modellklassen ModelMaker und ModelEvaluator.
Welche Schlüsselwörter charakterisieren das Werk?
Zu den prägenden Begriffen zählen Brustkrebs, Convolutional Neural Networks, TensorFlow, Keras, CRISP-DM, Bilderkennung und medizinische Diagnostik.
Wie wurde das Problem unbalancierter Datensätze gelöst?
Es wurde die Funktion ImageDataGenerator aus der Keras-Bibliothek genutzt, um durch Transformationen wie Rotation, Schichtungen und Zoom zusätzliche Bilder zu erzeugen und den Datensatz von 780 auf 1310 Bilder auszugleichen.
Warum wurde für die Modellbildung ein vortrainiertes Netzwerk gewählt?
Durch die Nutzung des vortrainierten Modells DenseNet201 konnte die hohe top-5 Genauigkeit von ImageNet auf die spezifische Aufgabe der medizinischen Bildsegmentierung übertragen werden, besonders da nicht ausreichend öffentlich verfügbare Daten für ein Training von Grund auf existierten.
Wie ist die Leistung des Modells zu bewerten?
Das Modell erreicht eine Trainingsgenauigkeit von 97 %, jedoch weist die Validierungsgenauigkeit Diskrepanzen auf, was auf die Notwendigkeit größerer Datensätze und weiterer Trainings-Epochen hindeutet, um eine klinisch zuverlässige Genauigkeit zu erzielen.
- Arbeit zitieren
- Marlene Depper (Autor:in), 2020, Can machine learning models be used to categorize breast cancer stages reliably?, München, GRIN Verlag, https://www.grin.com/document/1254158