This thesis provides a model for diagnosing and classifying COPD based on phenotypes; General COPD, Chronic bronchitis, Emphysema, and the Asthmatic COPD using a Bayesian network (BN). A BN is a probabilistic modelling tool composed of random variables and the relationships of such variables is based on probabilities that maximize certain outcomes. We validated our BN model using a neural network model based on the Levenberg- Marquardt (LM) algorithm. Results show that the BN model achieved an overall classification of 98.75 % for our test cases. Furthermore, F1 score results also show that the BN is a better model for COPD classification in comparison to the LM algorithm.
The World Health Organization (WHO) lists COPD as the fourth leading cause of the death worldwide yet the disease is preventable. Smoking of tobacco products, alpha-1-antitrypsin (AAt), and air pollution are the major risk factors associated with the development and progression of this disease. COPD is usually either misdiagnosed or under-diagnosed due to a number of factors including the slow progression of the development of its symptoms. Besides, differential diagnosis is usually applied during diagnosis because differentiating COPD patients from those with say chronic Asthma may not be an easy task. Previous researchers have used pulmonary function test results to diagnose COPD.
Inhaltsverzeichnis
CHAPTER 1: INTRODUCTION
1.1 General Introduction
1.2 Problem Statement
1.3 Objectives of the Study
1.3.1 Specific Objectives
1.4 Motivation
1.5 Research Questions
1.6 Definition of Terms
1.7 Research Scope
1.8 Thesis Organization
CHAPTER 2: LITERATURE REVIEW
2.1 Introduction
2.2 Theories and Background
2.1 Asthma
2.2 COPD
2.2.1 Chronic Bronchitis
2.2.2 Emphysema
2.2.3 COPD Risk Factors
2.2.4 The GOLD
2.2.5 Key Indicators for Considering a Diagnosis of COPD
2.2.6 Spirometry Reference Standard
2.2.7 Differential Diagnosis of COPD
2.2.8 COPD under Diagnosis and Misdiagnosis
2.3 Probabilistic Graphical Model (PGM)
2.3.1 Introduction to Probabilistic Reasoning
2.3.2 Basic Probability Calculus
2.3.3 Bayesian Networks
2.4 Reliability Statistics
2.5 Relevant Literature to this Topic
2.5.1 Case-Based Reasoning (CBR)
2.5.2 Fuzzy Expert System
2.5.3 Neural Networks
2.5.4 Support Vector Machine
CHAPTER 3: METHODOLOGY
3.1 Type of Study
3.2 The Study Population
3.3 Sample Size and Sampling Method
3.4 Research Environment
3.5 Data Collection Instrument
3.5.1 Checklist Validity
3.5.2 Checklist Reliability
3.6 Data Collection Method
3.7 Data Analysis
3.8 Research Variables
3.8.1 Creating the Bayesian network
3.8.2 Network Instantiation
3.9 Exact Inference in Bayesian Networks
3.9.1 Inference through Factor Elimination
3.9.2 Inference through Conditioning
3.9.3 Model Evaluation
3.9.4 F1Score
3.10 cardDiag Application
3.11 Limitations
3.12 Ethical Issues
3.13 Chapter Summary
CHAPTER 4: RESULTS
4.1 Introduction
4.1.1 Description of Our Data Set
4.2 Bayesian Network Accuracy
4.3 Results from the Test Data Set
4.3.1 Results Using the Bayesian Network
4.3.2 Results Using Levenberg-Marquardt (LM) Algorithm
4.3.3 Summary of the Classification Results for both Models
4.3.4 Evaluation of our Bayesian Network Model
4.3.5 cardDiag Application
4.4 Reliability Analysis Results
4.4.1 A Summary of COPD and Allergy Variable
4.4.2 Age Ranges for COPD Patients
CHAPTER 5: DISCUSSION, CONCLUSIONS, AND SUGGESTIONS
5.1 Discussion
5.1.1 Comparison of the Result from the BN and LM Algorithm
5.1.2 cardDiag Results
5.1.3 Essential Variables in COPD Diagnosis
5.2 Conclusion
5.3 Suggestions based on Research Results
5.3.1 Targeted Case Finding
5.3.2 Awareness Campaigns
5.4 Recommendations for Future Research
5.4.1 Large Equal Sample for each Phenotype
5.4.2 More Diagnosis and Screening Devices
Zielsetzung & Themen
Diese Arbeit zielt darauf ab, ein Bayesian-Network-Modell zur Diagnose und Klassifizierung von chronisch obstruktiver Lungenerkrankung (COPD) zu entwickeln, welches Patienten anhand ihrer spezifischen Phänotypen (Allgemeine COPD, chronische Bronchitis, Emphysem oder asthmatische COPD) kategorisieren kann, um die diagnostische Genauigkeit zu verbessern und die oft unterdiagnostizierte COPD-Last in Ländern mit geringerem Einkommen adressierbar zu machen.
- Entwicklung und Validierung eines probabilistischen Modells mittels Bayesian Networks zur COPD-Klassifizierung.
- Differenzialdiagnose zwischen COPD und Asthma zur korrekten Patientenidentifikation.
- Einsatz von Knowledge-Engineering-Techniken zur Auswahl essenzieller klinischer Variablen für ein Decision Support System (CDSS).
- Vergleichende Analyse des Bayesian-Network-Modells gegenüber einem neuronalen Netz basierend auf dem Levenberg-Marquardt-Algorithmus.
- Implementierung der Softwareanwendung „cardDiag“ zur praktischen Anwendbarkeit und Visualisierung der Phänotyp-Zugehörigkeit.
Auszug aus dem Buch
2.3.3.4 Network Granularity
One of the questions that constantly ring in the minds of BN developers is how fine-grained should a BN network be? The answers to this question would obviously differ based on the application for which a solution is developed.
Consider a case where a variable is neither a query variable nor an evidence variable. That is, we can neither observe the value of this variable nor can we make any inference about it. Then the question remains: why do we need to include it in the network? Under certain situations that we are about to discuss, an intermediary variable can be bypassed and therefore eliminated from a network if it has a single child and its absence will not as well compromise the network accuracy. The term bypass refers to the process of removing a variable, redirecting its parents to its children, and updating the CPTs to the children to reflect the new status of the network.
Zusammenfassung der Kapitel
CHAPTER 1: INTRODUCTION: Dieses Kapitel führt in die Rolle von Künstlicher Intelligenz und Machine Learning in der medizinischen Diagnostik ein und begründet die Relevanz einer verbesserten COPD-Diagnose durch probabilistische Modelle.
CHAPTER 2: LITERATURE REVIEW: Dieser Abschnitt behandelt die theoretischen Grundlagen von COPD und Asthma, erläutert die Funktionsweise von Bayesian Networks und analysiert bestehende Forschungsansätze mittels verschiedener Computational-Intelligence-Methoden.
CHAPTER 3: METHODOLOGY: Hier wird der methodische Forschungsansatz beschrieben, angefangen bei der Datenerhebung durch strukturierte Patienteninterviews bis hin zum Design und der Granularität des Bayesian-Network-Modells und der Entwicklung von cardDiag.
CHAPTER 4: RESULTS: Dieses Kapitel präsentiert die Ergebnisse des Bayesian-Network-Modells und validiert diese durch den Vergleich mit einem Levenberg-Marquardt-basierten neuronalen Netzwerk sowie der grafischen Auswertung mittels cardDiag.
CHAPTER 5: DISCUSSION, CONCLUSIONS, AND SUGGESTIONS: Der letzte Teil diskutiert die erzielten Genauigkeiten, fasst die Bedeutung der identifizierten Variablen zusammen und gibt Empfehlungen für künftige Forschungsarbeiten und klinische Screening-Strategien.
Schlüsselwörter
COPD, Bayesian Networks, Medizininformatik, klinisches Entscheidungsunterstützungssystem, Phänotypisierung, Asthma, chronische Bronchitis, Emphysem, diagnostische Genauigkeit, Wahrscheinlichkeitstheorie, Levenberg-Marquardt-Algorithmus, cardDiag, medizinische Diagnostik, Risikofaktoren, Gesundheitswesen.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Es geht um die Entwicklung eines probabilistischen Diagnosemodells auf Basis von Bayesian Networks, um COPD zu erkennen und Patienten präzise ihren jeweiligen Phänotypen zuzuordnen.
Was sind die zentralen Themenfelder?
Die Arbeit umfasst die Themenbereiche medizinische Informatik, probabilistische grafische Modelle, klinische Differenzialdiagnostik zwischen COPD und Asthma sowie die Anwendung von Machine-Learning-Algorithmen.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Erstellung eines automatisierten Modells zur Klassifizierung von COPD-Phänotypen, um Fehl- oder Unterdiagnosen zu minimieren und die diagnostische Verlässlichkeit zu erhöhen.
Welche wissenschaftliche Methode wird verwendet?
Die primäre Methode ist der Aufbau eines Bayesian Networks, ergänzt durch eine validierende Vergleichsstudie mittels neuronaler Netze, die den Levenberg-Marquardt-Algorithmus zur Optimierung nutzen.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in eine fundierte Literaturrecherche, die detaillierte Beschreibung der methodischen Modellentwicklung inklusive der Variablenbestimmung sowie die Ergebnispräsentation und Diskussion der Modellperformance.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen gehören Bayesian Networks, COPD, Phänotypisierung, klinisches Entscheidungsunterstützungssystem, Differenzialdiagnose, Machine Learning und Spirometrie-Referenzstandards.
Was ist der Zweck der "cardDiag" Softwareanwendung?
Die Anwendung dient als grafisches Werkzeug, das auf Basis des entwickelten Bayesian-Network-Modells die Wahrscheinlichkeit für spezifische Patientenfälle berechnet und die Verteilung der Phänotypen visualisiert.
Warum spielt die Differenzialdiagnose zwischen Asthma und COPD eine so große Rolle?
Da Asthma und COPD in ihrem klinischen Erscheinungsbild viele Überschneidungen aufweisen, ist eine exakte Differenzierung entscheidend, um die korrekte Therapie einzuleiten und Fehlbehandlungen zu vermeiden.
- Quote paper
- Amos Olwendo (Author), 2014, Bayesian networks. A probabilistic model for chronic obstructive pulmonary disease diagnosis and phenotyping, Munich, GRIN Verlag, https://www.grin.com/document/505955