Technische Anwendungsgebiete des Clustering


Bachelorarbeit, 2017

43 Seiten, Note: 1,7


Leseprobe

Inhaltsverzeichnis

1 Motivation

2 Abgrenzung
2.1 Definition und Abgrenzung Segmentierung
2.2 k-means Algorithmus
2.3 Fuzzy c-means Algorithmus
2.4 Medizinische Bilder
2.4.1 Magnetresonanztomographie
2.4.2 Computertomographie
2.4.3 Ultraschall
2.4.4 Bildbearbeitung

3 Methodisches Vorgehen

4 Literaturanalyse und Diskussion
4.1 Analyse der Literatur
4.1.1 Magnetresonanztomographie
4.1.2 Computertomographie
4.1.3 Ultraschall
4.2 Diskussion
4.2.1 Modifikationen des Fuzzy c-means bei Magnetresonanztomographien
4.2.2 Schwere Vergleichbarkeit von Computertomographien
4.2.3 Fehlen aktueller Beiträge bei Ultraschallbildern

5 Schlussfolgerung

Literaturverzeichnis

Tabellenverzeichnis

Tabelle 1: Auswahl der Publikationen aus den verschiedenen Quellen

Tabelle 2: Ergebnismatrix

Zusammenfassung

Durch den technischen Fortschritt in der medizinischen Bildgebung und der täglich steigenden Zahl an Untersuchungsbildern ist eine Entlastung des medizinischen Fachpersonals hinsichtlich der Bildanalyse dringend notwendig. Hierbei ist die Bildsegmentierung ein wesentlicher Bestandteil. Anhand von Clusteringmethoden können Muster in den Bildern aufgedeckt und diese in verschiedene Regionen unterteilt werden. Anhand einer State-of-the-Art Analyse soll in der vorliegenden Arbeit untersucht werden, ob die Anwendung von harten, wie die des k-means Algorithmus, oder unscharfen Clusteringmethoden, wie die des Fuzzy c-means Algorithmus, bevorzugt werden soll. Dies wird an den wichtigsten drei medizinischen Bildarten, nämlich der Magnetresonanztomographie, der Computertomographie sowie anhand von Ultraschallbildern untersucht. Festzustellen ist hierbei eine generelle Tendenz zur Verwendung unscharfer Clusteringverfahren sowie ein Mangel an Vergleichbarkeit durch quantitative Maße. Teilweise erreichen die Segmentierungsergebnisse die qualitativen Resultate manuell vorgehender Radiologen.

1 Motivation

Clustering, zu Deutsch Segmentierung, ist ein Verfahren des Data Mining, welches Muster in Daten aufdecken soll. Dieses Verfahren kommt in einer Vielzahl von Wissenschaftsgebieten zur Anwendung: In der Klimaforschung beispielsweise werden Muster innerhalb der erhobenen Daten zum Luftdruck in klimarelevanten Polar- und Meeresgebieten gesucht (Tan et al. 2006, S. 488). Im Einzelhandel werden mit den Methoden der Datensegmentierung Muster im Kaufverhalten der Kunden aufgedeckt, um gezieltere Marketingmaßnahmen durchzuführen (Tan et al. 2006, S. 488). Internetsuchmaschinen nutzen Clusteringverfahren zur Kategorisierung ihrer Suchergebnisse (Tan et al. 2006, S. 488). Das soziale Netzwerk Facebook möchte Computer dazu befähigen, Fotographien so zu begreifen, wie Menschen es tun. Hierzu ist eine Segmentierung dieser Fotographien erforderlich (Dollar 2016).

Viele der beschriebenen technischen Anwendungsgebiete, in denen Clustering zum Einsatz kommt, stecken jedoch noch in ihren sprichwörtlichen Kinderschuhen. Nur zu wenigen Bereichen liegt bereits eine hinreichende Anzahl von Forschungspublikationen vor. Ein technisches Anwendungsgebiet jedoch, das im Mittelpunkt der aktuellen Forschung steht und daher in besonderer Art und Weise für das Thema dieser Arbeit geeignet ist, ist die Segmentierung von Bildern im Rahmen der medizinischen Diagnostik.

Durch den technischen Fortschritt in der medizinischen Bildgebung und die damit verbundene stetig steigende Zahl an Untersuchungsbildern, deren Analyse und Interpretation manuell nur noch schwer zu realisieren ist, ist es dringend nötig, dass das medizinische Fachpersonal entlastet und die Aufgabe der Bildanalyse durch einen Computer erledigt wird (Hassan et al. 2013, S. 34). Ein wichtiger Teil der medizinischen Bildanalyse stellt die Segmentierung dar. Die Bildsegmentierung erkennt die Teile eines Bildes, wodurch es in seine einzelnen Bestandteile zerlegt wird (Elmasry et al. 2012, S. 109). Alle Pixel die sich nach der Segmentierung aufgrund der Intensität oder der Farbe in einem Cluster befinden, sind sich ähnlich und gehören zum selben Teil (Elmasry et al. 2012, S. 109). Das medizinische Bild kann unmittelbar nach der Segmentierung entweder zu einer Diagnose durch den Arzt genutzt werden – beispielsweise kann durch die Segmentierung von Gehirnbildern eine Volumenveränderung festgestellt und ggf. eine Diagnose auf Alzheimer gestellt werden (Ng et al. 2015, S. 52) – oder es wird zunächst für eine weitere Analyse verwendet, etwa zur Untersuchung des Gewebes, der anatomischen Struktur oder zur Vorbereitung einer computerassistieren Operation (Hassan et al. 2013, S. 34).

Hierbei wird das Problem relevant, dass zwar eine Vielzahl von Segmentierungsmethoden erforscht und getestet wurden, jedoch keine Tendenz erkennbar ist, welche Methode für die Segmentierung einer bestimmten Bildart bevorzugt werden sollte. Die Entwickler einer Softwarelösung für die computergestützte medizinische Bildverarbeitung müssen aus einer Vielzahl an Clusteringmethoden ein spezifisches Verfahren auswählen, um dieses zu implementieren. Für Entscheidungsträger in Kliniken, forschenden Pharmaunternehmen sowie Herstellungsunternehmen von technischen Diagnosegeräten und nicht zuletzt für Ärzte ist die Wahl des geeignetsten Algorithmus daher elementar.

Ziel der Arbeit ist es herauszufinden, bei welcher medizinischen Bildart harte oder unscharfe Clusteralgorithmen bevorzugt angewendet werden sollen. Dies soll anhand der medizinischen Bildgebungsverfahren der Magnetresonanztomographie, der Computertomographie sowie des Ultraschalls untersucht werden. Diese drei Techniken sind in Kliniken täglich im Einsatz (Dössel 2016, S. 3) und zählen zu den am häufigsten verwendeten Bildgebungsverfahren (Sajith und Hariharan 2015, S. 414). Der Bedarf einer automatischen Analyse der Bilder ist daher besonders hoch. Für die harten Clusteringmethoden wird exemplarisch der k-means Algorithmus angeführt, für die unscharfen Clusteringmethoden, welche es einem Bildpunkt gestatten zu mehreren Clustern gleichzeitig zu gehören, wird der Fuzzy c-means Algorithmus herangezogen. Die Frage soll anhand ausgewählter Literatur diskutiert werden.

2 Abgrenzung

Zunächst soll eine Definition für Segmentierung gegeben werden, um diese dann vom Verfahren der Klassifikation abzugrenzen. Anschließend werden die beiden Algorithmen k-means und Fuzzy c-means sowie die medizinischen Bildgebungsarten erläutert.

2.1 Definition und Abgrenzung Segmentierung

Segmentierung, im Englischen als „Clustering“ bezeichnet, ist eine Methode aus dem Bereich des Data Minings (Berkhin 2006, S. 25). Die Begriffe der Segmentierung und des Clusterings werden also synonym verwendet. Berkhin (2006, S. 25) definiert Clustering als „division of data into groups of similar objects“, das heißt, als Einteilung von Daten in Gruppen gleichartiger Objekte. Tan et al. (2006, S. 490) wiederum fasst das Prinzip der Segmentierung dahingehend zusammen, dass hierdurch Datenobjekte einzig allein aufgrund von Informationen gruppiert werden, die innerhalb der Daten gefunden wurden und die Objekte und ihre Beziehung zueinander beschreiben.

Die Aufgabe der Segmentierung ist es mithin, aus einer Fülle an Daten diejenigen Objekte in einem Cluster zusammenzufassen, welche gleichartig sind. Die Objekte in einem Cluster sollen sich hierbei möglichst ähnlich sein, während die Objekte aus verschiedenen Clustern sich größtmöglich unterscheiden sollen (Berkhin 2006, S. 25). Je ähnlicher sich Objekte innerhalb einer Gruppe und je größer die Unterschiede der Gruppe zueinander sind, desto besser ist das Clusteringergebnis (Tan et al. 2006, S. 490). Um ein solches Muster innerhalb der Daten zu finden, werden Distanz- oder Ähnlichkeitsmaße verwendet, welche angeben, wie unterschiedlich oder wie ähnlich sich die Objekte sind (Larose und Larose 2015, S. 524).

Oft wird Clustering mit dem Wort Classification, zu Deutsch Klassifikation, in Verbindung gebracht. Es gilt jedoch zu beachten, dass das Ziel der Segmentierung das Einteilen von Objekten in bisher unbekannte Gruppen ist, während bei der Klassifikation die Gruppen bereits bestehen und die neuen Objekte aufgrund bekannter Merkmale in diese bestehenden Gruppen eingeteilt werden (Larose und Larose 2015, S. 523–524). Das Verfahren der Segmentierung ist häufig ein vorbereitender Schritt zum Auffinden von Mustern in Daten, wobei die Methode der Klassifikation die herausgefundenen Gruppen nutzt, um neue Daten in die existierenden Gruppen einzuteilen (Larose und Larose 2015, S. 524).

2.2 k-means Algorithmus

Der k-means Algorithmus wurde voneinander unabhängig durch mehrere Forscher in unterschiedlichen Wissenschaftsdisziplinen publiziert (Jain 2010, S. 3). MacQueen veröffentlichte die Methode im Jahr 1967 und stellte fest, dass das Hauptanwendungsgebiet des Algorithmus vermutlich die Gruppierung gleicher Daten sei, also das Clustering (MacQueen 1967, S. 288). Das heute standardmäßig als k-means Algorithmus bezeichnete Verfahren wurde von Forgy (1965) entwickelt und wird in der Literatur unter diversen Bezeichnungen geführt (Bacher et al. 2010, S. 300–301). Im folgenden Verlauf der Arbeit wird unter dem Begriff des k-means Algorithmus immer das nachstehend beschriebene Verfahren subsumiert.

Der k-means Algorithmus gehört zu den partitionierenden Clusteringverfahren (Jain 2010, S. 3). Er teilt Datenpunkte in Cluster ein (Bacher et al. 2010, S. 299). Anschließend wird jeder Datenpunkt einem Clusterzentrum zugeteilt (Bacher et al. 2010, S. 299), wobei man die Clusterzentren samt zugeordneter Datenpunkte als Cluster bezeichnet (Tan et al. 2006, S. 497). Nachdem alle Datenpunkte einem Clusterzentrum zugeteilt wurden, wird dieses aufgrund der zugeordneten Datenpunkte neu berechnet (Bacher et al. 2010, S. 299). Der Algorithmus determiniert, sobald die Clusterzentren sich nicht mehr ändern, also eine Neuberechnung zu denselben Clusterzentren führt (Bacher et al. 2010, S. 300).

Formal ausgedrückt bedeutet dies, dass die Streuungsquadratsumme in den einzelnen Clustern ein Minimum annimmt, wenn alle Clusterzentren optimal berechnet wurden (Bacher et al. 2010, S. 299). Die Distanz zwischen den Datenpunkten und den Clusterzentren (mit ; und ; wobei ; ) wird durch das euklidische Distanzmaß berechnet (Bacher et al. 2010, S. 299).

Daher kann die Minimierung der Streuungsquadratsumme dargestellt werden (Bacher et al. 2010, S. 299)

Nachstehend ist der algorithmische Ablauf des k-means Algorithmus dargestellt (Bacher et al. 2010, S. 300):

Schritt 1: Cluster festlegen und die Datenpunkte zufällig zuordnen.
Schritt 2: Neuberechnung der Clusterzentren durch wobei die Zahl der Objekte im Cluster in der Variable ist.
Schritt 3: Die Datenpunkte werden dem Clusterzentrum neu zugordnet, zu welchem die quadrierte euklidische Distanz minimal ist.
Schritt 4: Falls sich die Zuordnung der Datenpunkte zu den Clusterzentren in Schritt 3 ändert, werden die Schritte 2 und 3 wiederholt. Ist dies nicht der Fall, determiniert der Algorithmus.

2.3 Fuzzy c-means Algorithmus

Der Fuzzy c-means Algorithmus stellt eine Weiterentwicklung des k-means Algorithmus dar, welcher von Dunn (1973) vorgestellt und von Bezdek (1987, c1981) zu der heute bekannten Methode weiterentwickelt wurde (Jain 2010, S. 4). Wie das englische Wort „fuzzy“, zu Deutsch unscharf, andeutet, handelt es sich hierbei um eine Clusteringmethode, bei welcher die Datenpunkte zu mehreren Clustern gehören können, da jeder Datenpunkt einen Zugehörigkeitswert erhält (Jain 2010, S. 4).

Formal bedeutet dies, dass das Minimierungsproblem des k-means Algorithmus um den jeweiligen Zugehörigkeitswert (mit ; ) erweitert wird, sodass sich die zu minimierende Zielfunktion

ergibt (Runkler 2010, S. 112–113). Hierbei bezeichnet den Grad der Unschärfe, welcher mit zunehmendem steigt (Runkler 2010, S. 113). Um die Funktion zur Neuberechnung der Clusterzentren sowie die Funktion zur Berechnung der Zugehörigkeitswerte zu erhalten, muss der oben genannte Ansatz mit zur Lagrange-Funktion erweitert werden, um anschließend nach , (hier für die Clusterzentren und in der Distanz enthalten) und abzuleiten (Runkler 2010, S. 113). Die Funktion zur Neuberechnung der Clusterzentren

sowie die Funktion zur Berechnung des Zugehörigkeitswerts ergeben sich aus der Ableitung der Lagrange-Funktion (Runkler 2010, S. 113). Der Ablauf des FCM Algorithmus ist dem des k-means Algorithmus ähnlich, wobei im ersten Schritt die Zugehörigkeitswerte mit Werten zwischen 0 und 1 festgelegt werden (Runkler 2010, S. 112–113). Hierbei muss sichergestellt werden, dass die Normalisierungsbedingung erfüllt ist, damit die Zugehörigkeitswerte, welche aussagen, wie hoch die Zugehörigkeit eines Datenpunktes zu einem Cluster ist, in der Summe identisch sind (Runkler 2010, S. 112–113). Nur so sind sämtliche Zugehörigkeitswerte vergleichbar (Runkler 2010, S. 112–113).

2.4 Medizinische Bilder

Nachstehend sollen die verwendeten Bildgebungsverfahren näher erläutert werden. Bei allen drei Bildgebungsverfahren resultieren Bilder in Graustufen.

2.4.1 Magnetresonanztomographie

Die Magnetresonanztomographie (MRT) ist ein Verfahren zur Erstellung von Bildern vom Innern des Menschen (Dössel 2016, S. 285). Hierbei senden die Zellkerne im menschlichen Körper durch die Einstrahlung elektromagnetischer Wellen für kurze Zeit selbst Radiowellen ab, welche dann anschließend gemessen und von einem Computer ausgewertet werden (Dössel 2016, S. 285). Mit diesen ausgewerteten Daten werden sogenannte Schnittbilder des Körpers erzeugt (Dössel 2016, S. 322). Eines der bedeutendsten Einsatzgebiete ist das menschliche Gehirn (Dössel 2016, S. 387). Die Vorteile von MRT Bildern liegen in der hohen räumlichen Auflösung und in der Detailerkennbarkeit bei weichem Gewebe (Wells et al. 1996, S. 429). Ein großer Nachteil stellt das hohe Bildrauschen dar, welches bei der Untersuchung durch Bewegungen des Patienten auftreten kann (Dössel 2016, S. 503–504).

2.4.2 Computertomographie

Die Computertomographie (CT) erzeugt Schnittbilder des menschlichen Körpers, wodurch es möglich wird, die Lage der Organe im Körper räumlich genau einzuordnen (Dössel 2016, S. 131). Um aus den gemessenen Signalen ein Bild herzustellen, benötigt man einen mathematischen Algorithmus sowie einen Computer, woraus die englische Bezeichnung „computed tomography“ resultiert (Dössel 2016, S. 131). Ein großer Nachteil der CT liegt einerseits in einem starken Bildrauschen, welches durch technische Einstellungen allenfalls reduziert werden kann (Dössel 2016, S. 159–164). Andererseits sind Bildartefakte (z.B. das Verwackeln von Bildern, Striche über dem Bild oder eine gröbere Körnung) ein weit verbreitetes Problem (Dössel 2016, S. 164–168).

2.4.3 Ultraschall

Die Bildgebung mittels Ultraschall erzeugt durch Schallwellen ein Bild der Organe (Dössel 2016, S. 239–240). Auch bei dieser Bildgebungstechnik kann es zu Bildartefakten wie beispielsweise dem Ausbleichen stark reflektierender Kanten oder der Verschiebung von Objekten kommen (Dössel 2016, S. 265). Bei Schwangeren dient die Ultraschalluntersuchung der Feststellung der körperlichen Entwicklung des Fötus, sowie der Frage, ob sich die Glieder bewegen oder auch das frühzeitige Erkennen etwaiger Krankheiten (Zayed et al. 2001, S. 501). Weitere Anwendungsgebiete – etwa die Untersuchung der Herzklappen, der Ventrikel des Herzens oder die Untersuchung von Blutgefäßen – sind weit verbreitet (Dössel 2016, S. 281–284).

2.4.4 Bildbearbeitung

Aufgrund der vorgenannten Bildartefakte werden häufig Filter oder andere mathematische Methoden eingesetzt, um das Bild vor der eigentlichen Segmentierung zu bearbeiten. Da eine ausführliche Darstellung der Verfahren sowie deren Auswirkungen den Rahmen der Arbeit übersteigen würde, wird zur Vereinfachung im Folgenden verallgemeinernd von Filtern oder der Vorbearbeitung der Bilder gesprochen.

3 Methodisches Vorgehen

Um die Zielsetzung der Arbeit durch einen nahezu vollständigen Literaturüberblick beantworten zu können, wurden als Ausgangspunkt zwei Literaturdatenbanken sowie eine wissenschaftliche Zeitschrift durchsucht. Die gefundenen Konferenzbeiträge und Zeitschriftenaufsätze wurden anschließend manuell anhand ihrer Keywords, des Abstracts sowie der Conclusion weiter aussortiert. Anschließend wurden die übrigen Dokumente auf ihre inhaltliche Relevanz und deren wissenschaftliche Eignung überprüft. Eine Untersuchung des jeweiligen Literaturverzeichnisses der erhaltenen Stichprobe wurde nachgestellt.

Für die Literatursuche wurde zum einen die elektronische Literaturdatenbank „IEEE Xplorer“ verwendet, da hiermit zahlreiche Konferenzbeiträge und Zeitschriftenaufsätze durchsucht werden konnten, welche einen überwiegend technischen und medizinischen Hintergrund aufweisen. Darüber hinaus wurde die Datenbank „ScienceDirect“ für die Literaturrecherche genutzt. Hierdurch konnten wissenschaftliche Beiträge mit medizinischem und technischem Schwerpunkt erfasst werden, die in der Datenbank des „IEEE Xplorer“ nicht enthalten sind.

Das in die Literatursuche einbezogene „Journal of medical systems“ erscheint einmal monatlich mit Beiträgen zu Medizin und Technik. In der vom Springer Verlag herausgegebenen Fachzeitschrift werden regelmäßig Beiträge zum Gebiet der Bildbearbeitung im medizinischen Bereich publiziert.

Für die Datenbank IEEE Xplorer wurde ein Suchstring konstruiert, welcher im Titel der Publikationen nach den Worten „Image*“ und „Segmentation“ sucht. Der Abstract wurde wahlweise nach einem der beiden Clusteringalgorithmen k-means beziehungsweise Fuzzy c-means sowie einem der medizinischen Bilder durchsucht. Da die Datenbank keine logische Klammerung zulässt, wurde für jede medizinische Bildart ein eigener Suchstring konstruiert. Hierfür wurden die Schlagworte „MRI“ und „CT“ als gängige Abkürzungen für die englischen Fachtermini „magnetic resonance image“ und „computertomography“ sowie „ultras*“ für die beiden englischen Begriffe „ultrasound“ und „ultrasonics“ verwendet. Deutschsprachige Suchbegriffe wurden im Suchstring bewusst nicht mit einbezogen, da bei vorherigen Recherchen festgestellt wurde, dass es zum Thema der Bildsegmentierung keine deutschsprachigen Veröffentlichungen zu geben scheint.

Nachstehend der Suchstring für die Suche nach Magnetresonanzbildern:

"Document Title":"Segmentation" AND "Document Title":"Image*" AND "Abstract":"k-means" AND "Abstract":"MRI"

OR "Document Title":"Segmentation" AND "Document Title":"Image*" AND "Abstract":"Fuzzy c-means" AND "Abstract":"MRI"

In der Datenbank „ScienceDirect“ wurden dieselben Suchparameter verwendet. Hier war eine logische Klammerung jedoch möglich, weshalb der Suchstring für alle Bildarten benutzt werden konnte. Ein Suchvorgang nur im Abstract war hingegen nicht möglich, da nur im Abstract und zugleich im Dokumententitel sowie in den Keywords gesucht werden konnte. Der Suchstring ist nachstehend dargestellt:

title ("Image*" AND "Segmentation") AND title-abstr-key ("k-means" OR "Fuzzy c-means") AND title-abstr-key("MRI" OR "CT" OR "Ultras*")

Im „Journal of medical systems“ wurde innerhalb der Fachzeitschrift mit ähnlichen Suchparametern gearbeitet, allerdings wurden die einzelnen Bildarten nicht in den Suchstring aufgenommen, da eine direkte Suche in den einzelnen Teilen der Artikel, wie beispielsweise im Dokumententitel, dem Abstract oder anderen Teilen, nicht möglich war. Da es bei zu vielen Suchbegriffen, welche nicht auf einen konkreten Teil des Dokuments bezogen werden konnten keine Treffer gab, wurde innerhalb der Zeitschrift lediglich mit dem folgenden Suchstring gesucht:

(Image* Segmentation) AND (Fuzzy c-means OR k-means)

Die insgesamt gefundenen 221 Dokumente aus den Literaturdatenbanken sowie der wissenschaftlichen Fachzeitschrift wurden zunächst anhand der Keywords (soweit vorhanden) und des Abstracts weiter aussortiert. Ein Dokument wurde nur dann weiterverwendet, wenn in den Keywords einer der beiden Algorithmen k-means oder Fuzzy c-means und im Abstract sowohl eine der medizinischen Bildarten als auch einer der beiden Clusteringalgorithmen enthalten waren.

In einem weiteren Schritt wurde der verbliebene Pool von 68 Dokumenten anhand des gesamten Abstracts und der Conclusion auf inhaltliche Relevanz geprüft. Hierzu wurde in Frage gestellt, ob sich die Publikationen grundsätzlich mit dem Thema Clustering von medizinischen Bildern beschäftigen oder ob diese fälschlicherweise allein aufgrund der Keywords als relevant identifiziert wurden. Ebenfalls wurden Publikationen, welche ihren Schwerpunkt nicht auf medizinisches Bildmaterial setzen, sondern sich darüber hinaus auf andere Bildarten beziehen, beispielsweise synthetische Bilder und Landschaftsbilder, nicht in die Stichprobe aufgenommen. Artikel, deren Abstract zwar auf Englisch vorlag, im Übrigen jedoch in einer anderen Fremdsprache verfasst war, fand in der Stichprobe keine Berücksichtigung. Dies führte zu einer Stichprobengröße von 30 Publikationen. Deren Literaturverzeichnisse wurden anschließend auf thematisch relevante Sekundärquellen untersucht. Dies führte zu einer Erhöhung der Stichprobe auf 32 Publikationen.

In der nachfolgenden Tabelle wird dargestellt, wie viele Artikel in welcher Quelle gefunden und welche hiervon zur weiteren Verwendung behalten wurden.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Auswahl der Publikationen aus den verschiedenen Quellen

Es liegt nun eine Stichprobe von 32 Publikationen vor, hiervon sechs Zeitschriftenaufsätze und 26 Konferenzbeiträge.

4 Literaturanalyse und Diskussion

Alle in der Stichprobe enthaltenen Artikel und Konferenzbeiträge wurden in der Ergebnismatrix klassifiziert. An der vertikalen Achse wurden die drei untersuchten medizinischen Bildarten Magnetresonanztomographie, die Computertomographie und Ultraschallbilder abgetragen. Wie eingangs erläutert, soll untersucht werden, welcher Clusteringalgorithmus für welche Bildart geeigneter ist. Hierfür wurden der k-means Algorithmus sowie der Fuzzy c-means Algorithmus an der horizontalen Achse abgetragen. Diese wurden weiter unterteilt in die jeweilige konventionelle Version der Algorithmen sowie einer jeweiligen Modifikation hiervon. In die Spalte der modifizierten Algorithmen wurde der Beitrag eingestuft, sofern der ursprüngliche Algorithmus in seinem originären Wesen verändert wurde, also methodisch anders vorgeht als in der Abgrenzung beschrieben. Dies kann beispielsweise durch das Ändern des Distanzmaßes oder der Funktion zur Neuberechnung der Clusterzentren der Fall sein. Diese Unterscheidung zwischen der konventionellen und einer modifizierten Version wurde getroffen, um genauer analysieren zu können, wie die in den Beiträgen erarbeiteten Ergebnisse zu bewerten sind.

[...]

Ende der Leseprobe aus 43 Seiten

Details

Titel
Technische Anwendungsgebiete des Clustering
Hochschule
Universität Augsburg
Note
1,7
Autor
Jahr
2017
Seiten
43
Katalognummer
V388549
ISBN (eBook)
9783668635302
ISBN (Buch)
9783668635319
Dateigröße
618 KB
Sprache
Deutsch
Schlagworte
Clustering, k-means, Fuzzy c-means, medizinische Bilder, Segmentierung, Data Mining
Arbeit zitieren
Daniel Nusser (Autor), 2017, Technische Anwendungsgebiete des Clustering, München, GRIN Verlag, https://www.grin.com/document/388549

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Technische Anwendungsgebiete des Clustering



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden