Danksagung
Diese Dissertation entstand ¨ uberwiegend an der Strahlenklinik der
Charit´ e, Campus Virchow-Klinikum. Sie wurde gef¨ ordert von der Deutschen Forschungsgemeinschaft (DFG) mit einem Stipendium des Graduiertenkollegs 331 ” Temperaturabh¨ angige Effekte f¨ ur Therapie und Diagnostik“. Weitere Teile der zugrundeliegenden Arbeit wurden durchgef¨ uhrt w¨ ahrend Aufenthalten bei Computational Imaging Sciences Group, Division of Radiological Sciences, Guy’s, King’s and St. Thomas’ Medical Schools, King’s College, London, UK, sowie am Department of Neurosurgery, University of Rochester Medical Center, Rochester, NY, USA. Dank gilt allen, die zum Gelingen dieser Arbeit beigetragen haben, insbesondere Herrn Dr. J¨ urgen Beier und meinem Doktorvater Herrn Profes-sor Dr. Heinz U. Lemke. Ferner danke ich Herrn Professor Dr. Tim L¨ uth f¨ ur die ¨ Ubernahme des Koreferates. F¨ ur die hervorragenden Arbeitsbedingungen danke ich Herrn Professor Dr. Dr. h.c. Roland Felix, Direktor der Strahlenklinik und Sprecher des Graduiertenkollegs, Herrn Professor Dr. Norbert Hosten, Wissenschaftlicher Koordinator des Graduiertenkollegs, sowie Herrn Privatdozent Dr. Peter Wust, Koordinierender Wissenschaftler des Sonderforschungsbereichs 273.
Besonderer Dank f¨ ur ihre Gastfreundschaft und viele wertvolle Diskussionen geht an Herrn Professor Dr. David J. Hawkes, Herrn Dr. Daniel R¨ uckert, Herrn Professor Dr. Calvin R. Maurer, Jr., Herrn Dr. Derek L. G. Hill, Herrn Mark Holden und Herrn Professor Dr. Robert J. Maciunas. Wesentliche Teile dieser Dissertation w¨ aren ohne ihre zahlreichen Anregungen nicht m¨ oglich gewesen.
Weiterhin danke ich all jenen, die beispielsweise im Rahmen von Diplomarbeiten oder durch praxisbezogene Hinweise zum Umfeld dieser Arbeit beigetragen haben. Insbesondere sind zu nennen Herr Carsten Domnauer, Herr Andreas Karlic, Herr Dirk Schmitz und Herr Dirk Strah-lendorf. Stellvertretend f¨ ur alle beteiligten Mediziner sei Herrn Ulrich-Wilhelm Thomale, Herrn Dr. Thomas Liebig, Herrn Christian A. Taschner, Herrn Dr. Andr´ e M¨ uller-York sowie Herrn Dr. Reinhold Graf gedankt. Besonderer Dank gilt dar¨ uber hinaus Herrn Professor Dr. Wolfgang Lanksch, Direktor der Klinik f¨ ur Neurochirurgie des Virchow-Klinikums, f¨ ur die Unterst¨ utzung und Zusammenarbeit bei der klinischen Umsetzung der Resultate der vorliegenden Dissertation. Abschließend m¨ ochte ich meinen Eltern danken, die sich - ¨ uber Ihren
offensichtlichen Beitrag zur Entstehung dieser Arbeit hinaus - ein weiteres Mal als engagierte Korrekturleser bew¨ ahrt haben.
Inhaltsverzeichnis
1 Motivation und Gliederung 1
2 Stand der Forschung 9
2.1 Registrierung 9
2.1.1 Geometriebasierte Verfahren 9
2.1.2 Voxelbasierte Verfahren 11
2.2 Patientenmodelle und Transformationen 13
2.3 Validierung 15
2.3.1 Synthetische Bilddaten 15
2.3.2 Konsistenz wiederholter Registrierung 16
2.3.3 Konsistenz serieller Registrierung 16
2.3.4 Stereotaktischer Gold-Standard 17
2.4 Bildfusion 18
2.5 Software-Pakete 19
2.5.1 AIR 19
2.5.2 UMDS Geomcal / Rview 19
2.5.3 SPM 20
2.6 Positionierung dieser Arbeit 20
3 Bilder, Koordinaten und Transformationen 23
3.1 Begriffe 23
3.2 Transformationen 24
3.3 Starre und affine Transformationen 24
3.3.1 Parameterdarstellungen und Anzahl der Freiheitsgrade 25
3.3.2 Matrixdarstellung 26
3.3.3 Dekomposition der Transformationsmatrix 26
3.3.4 Wahl des Transformationszentrums 29
3.3.5 Scherungen und Gantry-Neigung 30
3.4 Elastische Transformationen 33
3.4.1 Lokal lineare Deformation 34
3.4.2 B-Spline Deformation 35
3.4.3 R uckw artstransformationen 35
3.4.4 Initiale affine Registrierung 37
i
3.4.5 Einflußvolumen 38
3.4.6 Gitterverfeinerung 39
4 Voxelmetriken 43
4.1 Notation 43
4.2 Eigenschaften voxelbasierter Metriken 44
4.2.1 Inkrementelle Metriken 44
4.2.2 Reversible Metriken 45
4.2.3 Differenzierbarkeit 46
4.3 Korrelations- und Varianzmetriken 50
4.3.1 Mittleres Abstandsquadrat 50
4.3.2 Quotientenbild-Uniformit at 50
4.4 Entropiebasierte Metriken 53
4.4.1 Bilder als Zufallsverteilung 53
4.4.2 Entropie 54
4.4.3 Mutual Information 55
4.4.4 Normalised Mutual Information 55
4.4.5 Correlation Ratio 55
4.4.6 Diskrete Implementierung von Grauwert-Histogrammen 56
4.4.7 Entropieberechnung 57
4.4.8 Wahl der Beh alterzahl 58
4.4.9 Rekonstruktion von Randverteilungen 59
4.5 Bewertung 60
4.6 Gitterenergie 61
4.7 Rauschunterdr uckung 62
4.7.1 Coincidence Thresholding 63
4.7.2 Validierung 64
5 Optimierungsverfahren 67
5.1 Konvergenz der Registrierung 68
5.2 Gradientenbasierte Verfahren 68
5.2.1 Gradientenaufstieg 69
5.2.2 Resilient Backpropagation 70
5.2.3 Quickprop 70
5.2.4 Bewertung gradientenbasierter Verfahren 71
5.3 Bester-Nachbar Suche 71
5.4 Suche mit adaptiven Gitterrichtungen 73
5.4.1 Alternative Skalarprodukte 74
5.4.2 Verwandte Verfahren 75
5.5 Beste-Richtung Suche 75
5.5.1 Richtungsoptimierung 76
5.5.2 Ausd unnen von Gradienten 77
5.5.3 Ber ucksichtigung von Einzelparametern 78
ii
5.5.4 Varianten 78
5.6 Multiresolution-Strategien 79
6 Registrierungsfunktionale 81
6.1 Kapselung 81
6.2 Affine Registrierung 83
6.2.1 Direkter Gitterzugriff 83
6.2.2 Volumen-Beschneidung 86
6.3 Elastische Registrierung 90
6.3.1 Partielle Metrikberechnung 90
6.3.2 Partielle Berechnung mit blockweisem Zur ucksetzen 91
6.3.3 Parameteranordnung 93
6.3.4 Angek undigte Parameter anderungen 94
6.3.5 Effiziente Gradientenberechnung 95
7
Uberblick zur erstellten Software 97
7.1 Grundfunktionen 99
7.2 Registrierung 99
7.2.1 Manuelle Parameterwahl 100
7.2.2 Voxelbasierte Registrierung 100
7.3 Export fusionierter Bilddaten 102
7.3.1 Reformatierung korrespondierender Schichten 102
7.3.2 Overlay-basiertes Reformatieren 104
7.4 Klassenbibliothek 107
8 Stellvertreter-Registrierung 111
8.1 Funktionelle MRT-Bildgebung 112
8.1.1 Registrierung 113
8.1.2 Validierung: Methodik 116
8.1.3 Validierung: Resultate und Folgerungen 117
8.1.4 Rechenzeit 119
8.2 Weitere Anwendungsm oglichkeiten 120
9 Klinische Anwendungen 123
9.1 Navigierte Neurochirurgie 124
9.1.1 Vorbereitende Maßnahmen 125
9.1.2 Fallbeispiel: Resektion eines Akustikusneurinoms 128
9.1.3 Fallbeispiel: Zystisches Gliom am motorischen Sprachzentrum 130
9.1.4 Visualisierung der Navigationsgenauigkeit 131
9.2 Strahlentherapieplanung 134
9.3 Digitale Subtraktionsangiographie 136
10 Ausblick 143
iii
Anhang 145
A Validierung starrer Registrierungsverfahren 147
A 1 Validierte Algorithmen 147
A 2 Resultate CT/MRT-Registrierung 148
A 3 Resultate PET/MRT-Registrierung 149
A 4 Resultate MRT/MRT-Registrierung 150
B Rechenzeiten 153
B 1 Starre Registrierung 153
B 2 Elastische Registrierung 153
B 3 Volumen-Beschneidung 154
B 3 1 Systemumgebung 154
B 3 2 Bilddaten 155
B 3 3 Resultate 158
B 3 4 Folgerungen 160
C Algorithmen und Datenstrukturen 163
C 1 Adaptives Resampling 163
C 1 1 Gittergenerierung 163
C 1 2 Datentransformation 164
C 1 3 Knoten- und Zellendaten 166
C 1 4 Eigenschaften 167
C 2 Virtuell aquidistante Gitter 167
Notation 171
Literaturverzeichnis 173
Index 185
Summary 185
iv
Kapitel 1
Motivation und Gliederung
Seit Einf¨ uhrung der Computertomographie (CT) [39] haben Schnittbildverfahren nicht nur die radiologische Diagnostik , sondern auch die Behandlung vieler Krankheiten stark beeinflußt. Die Entwicklung der bildgesteuerten Therapie w¨ are ohne solche Techniken nicht denkbar. Erst ihre pr¨ azise r¨ aumliche Zuordnung von Strukturen und Prozessen erm¨ oglicht die exakte Planung und Kontrolle interventioneller Maßnahmen. Diese Zuordnung ist etwa bei der Projektionsdarstellung der klassischen R¨ ontgenaufnahme nicht gegeben.
Verschiedene bildgebende Verfahren (Modalit¨ aten) unterscheiden sich wesentlich in der Art der dargestellten Information. Einige Beispiele hierzu sind in den Abbildungen 1.1 und 1.2 gezeigt. Grunds¨ atzlich unterscheidet man zwischen Verfahren zur Abbildung anatomischer Strukturen (Morphologie, vgl. Abb. 1.1) und solchen, die funktionelle Vorg¨ ange darstellen (Abb. 1.2). Bei letzteren kann es sich beispielsweise um Stoffwechselaktivit¨ at oder den Grad der Durchblutung (Perfusion) handeln. Das preiswerteste und nach wie vor am h¨ aufigsten eingesetzte anatomische Schnittbildverfahren ist die auf R¨ ontgenstrahlen basierende CT (Abb. 1.1a). Sie besitzt allerdings aufgrund der geringen Unterschiede im Absorptionsverhalten verschiedener K¨ orpergewebe nur einen sehr geringen Weichteilkontrast. Kn¨ ocherne Strukturen dagegen vermag sie mit hoher r¨ aumlicher Aufl¨ osung in einem physikalisch wohldefinierten Wertebereich darzustellen.
Im Vergleich hierzu ist die Kernspin- oder Magnetresonanztomographie (MRT, Abb. 1.1b-d) in der Lage, Weichteile differenziert abzubilden. F¨ ur Knochen wiederum ist sie aufgrund von deren geringem Wassergehalt gewissermaßen ” blind“. Andererseits lassen sich ¨ uber die Wahl der Meßparameter mit diesem Verfahren v¨ ollig verschiedene Aspekte des untersuchten Objekts abbilden. Unter den funktionellen Verfahren sind die sogenannte Positronenemissionstomographie (PET, Abb. 1.2a) und die Single-Photon-Emissionscomputertomographie (SPECT) die verbreitetsten. Bei beiden wird dem Patienten zun¨ achst ein Radiopharmakon injiziert. Dessen r¨ aumliche Verteilung im K¨ orper wird dann anhand der emittierten Strahlung berechnet. Dabei kommen im wesentlichen dieselben mathematischen Verfahren bei der Bildrekonstruktion zum Einsatz wie bei der CT.
1
2
(c) Magnetresonanztomographie (d) Magnetresonanztomographie (T 2 -gewichtet) (Protonendichte-gewichtet)
Abbildung 1.1: Bildgebende Modalit¨ aten: Anatomische Schnittbildverfahren. Alle Bilder zeigen denselben Patienten in identischer Schichtlage (Bildausschnitt 177 mm× 191 mm). Die Originalaufl¨ osung betrug 0,70 mm Pixelgr¨ oße f¨ ur die CT (512×512 Pixel) bzw. 0,98 mm f¨ ur jede der MRT-Aufnahmen (256×256 Pixel).
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
Abbildung 1.2: Bildgebende Modalit¨ aten: Funktionelle Schnittbildverfahren. Links: 18 F-FDG-Positronenemissionstomographie (Sch¨ adelbasis, 64×64 Bildpunkte). Rechts: Funktionelle MRT. Abgebildet ist das motorische Sprachzentrum (Broca, Pfeil); die Umrisse des Sch¨ adels wurden zur besseren Orientierung aus der zugeh¨ origen anatomischen Aufnahme extrahiert und sind nicht Teil der funktionellen Bildgebung.
Im Falle der PET handelt es sich bei der verwendeten Substanz in der ¨ uberwiegenden Mehrzahl der F¨ alle um einen radioaktiv markierten Zucker, die sogenannte
18 F -Fluordesoxyglukose (FDG). Dieses Molek¨ ul enth¨ alt ein Atom des Fluor-Isotops
18 F , eines sogenannten Positronenstrahlers. Es setzt also spontan das positiv geladene Antiteilchen des Elektrons frei. Dieses zerstrahlt mit Elektronen des umgebenden Gewebes.
Die dabei entstehenden und in entgegengesetzten Richtungen emittierten Gammaquanten werden registriert und erlauben R¨ uckschl¨ usse auf den Ort der Positronenemission. Hinreichend viele derartige Ereignisse ergeben dann eine r¨ aumliche Verteilung der markierten Glukose. Diese Verteilung schließlich zeigt die lokale Stoffwechselaktivit¨ at im K¨ orper des Patienten. Da aggressiv wachsende Tumore h¨ aufig einen erh¨ ohten Zellstoffwechsel aufweisen, erlaubt die PET somit eine Lokalisierung verd¨ achtiger Areale und sogar eine Quantifizierung ihrer Aktivit¨ at. Als Erg¨ anzung zu den nuklearmedizinischen funktionellen Bildgebungsverfahren PET und SPECT gewinnt in den letzten Jahren zunehmend die sogenannte funktionelle Magnetresonanztomographie (fMRT, Abb. 1.2b) an Bedeutung. Diese bildet selektiv die Funktion gesunder Hirnareale ab und eignet sich so insbesondere zur Festlegung von Risikostrukturen vor operativen Eingriffen. Zwar ist der Einsatzbereich des Verfahrens auf die Abbildung des Hirnstoffwechsels beschr¨ ankt, daf¨ ur jedoch kommt es ohne Strahlenbelastung des Patienten aus. Zudem ist eine fMRT durch die vereinfachte Prozedur (keine kurzlebigen Radiopharmaka, keine Strahlenschutzmaßnahmen) preiswerter und schneller durchzuf¨ uhren als etwa eine PET.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
4
Abbildung 1.3: Unregistrierte Bildda-
ten: 50%/50% ¨ und T 1 -gewichteter MRT. Die relative Lage der Daten entspricht den von beiden Scannern gelieferten urspr¨ unglichen Bildausschnitten.
auch von Untersuchung zu Untersuchung. Dar¨ uber hinaus ist auch das abgebildete Objekt, also der Patient, bei jeder Untersuchung anders positioniert. Aus diesen Gr¨ unden sind verschiedene Bilddatens¨ atze im allgemeinen nicht in Deckung mitein-ander, wie Abbildung 1.3 illustriert.
Bilddaten des betreffenden Patienten in ein
gemeinsames Bezugssystem zu ¨ Dazu wird zumeist ein Datensatz fest als Referenzbild (engl. “reference image”) gew¨ ahlt. Die Koordinatensysteme aller ¨ tens¨ atze werden dann mit dessen Koordinaten abgeglichen. Dieser Vorgang wird als
Registrierung
(engl. “registration”) bezeichnet, und die transformierten Datens¨ atze heißen Modellbilder (engl. “model images”). Stammen die zu registrierenden Daten aus verschiedenen Modalit¨ aten, so wird speziell von
Abbildung 1.4:
Registrierung zwischen
multimodaler Registrierung
gesprochen, bei
mehreren Modellbildern. Nach separa-
identischenQuellen analog von
unimodaler Registrierung.
Bei zus¨ atzlichen Bildern gen¨ ugt es offensichtlich, die Registrierung mit nur einem einzigen Referenzbild durchzuf¨ uhren. Die not-
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
5
wendigen Transformationen zwischen den verschiedenen Modellen ergeben sich dann durch Verkettung und Invertierung derjenigen zwischen Referenz und Modellen (Abb. 1.4). Inwieweit die Inversenbildung dabei problemlos m¨ oglich ist, h¨ angt allerdings im Einzelfall von den zugelassenen Transformationen ab. Nicht nur der r¨ aumliche Abgleich von Bilddaten verschiedener bildgebender Verfahren wird als Registrierung bezeichnet. Die Bearbeitung einer Reihe mathematisch eng verwandter Probleme wird ebenfalls unter diesem Begriff subsummiert:
Unimodale Registrierung: Der Vergleich von Daten desselben Patienten und derselben Modalit¨ at, jedoch beispielsweise von verschiedenen Zeitpunkten (serielle Registrierung, Bewegungskorrektur bei Subtraktionsbildern).
Atlas-Registrierung: Das Abbilden eines anatomischen Atlas auf Daten eines realen Patienten.
Patienten-Modell-Registrierung: Der Abgleich zwischen Bilddaten und dem Patienten selbst, etwa zur Lagekontrolle vor und w¨ ahrend eines chirurgischen Eingriffs.
Allen genannten F¨ allen ist gemeinsam, daß ein Mensch niemals in der Lage sein wird, die Mehrzahl der gestellten Aufgaben zufriedenstellend zu bew¨ altigen. Einleuchtende Gr¨ unde hierf¨ ur stellen die hohe Anzahl sich gegenseitig beeinflussender Einstellungen (Verschieben und Drehen der Daten) sowie der fehlende ¨ Uberblick ¨ uber die r¨ aumlichen Verh¨ altnisse dar.
Zwar sind erfahrene Radiologen darauf trainiert, beim Betrachten von Bilddaten aus mehreren Quellen diese quasi ” mental“ zu registrieren und zu einem gemeinsa-
men Ganzen zu verbinden. Dieser Vorgang ist allerdings nicht objektiv reproduzierbar und mit großen Ungenauigkeiten verbunden. Letzteres gilt insbesondere dann, wenn die verschiedenen Bilddaten stark unterschiedliche Ausrichtungen aufweisen, wenn also beispielsweise einerseits Bilder senkrecht zur K¨ orperachse vorliegen (axiale Schichtf¨ uhrung, vgl. Abb. 1.5), andererseits solche entlang der K¨ orperachse (sagittal oder koronar).
Diese Problematik sowie der Nutzen der Kombination verschiedener Arten von Bildern motivieren gemeinsam die Entwicklung automatischer Verfahren f¨ ur die Registrierung. Mit solchen Techniken befaßt sich die vorliegende Arbeit und legt dabei besonderen Wert auf ihre effiziente Realisierung und ihre Integration in die klinische Routine.
Bei den verwendeten Algorithmen handelt es sich speziell um solche aus dem Bereich der sogenannten voxelbasierten Registrierung. Zun¨ achst faßt Kapitel 2 den derzeitigen Stand der Forschung auf diesem Gebiet zusammen. In diesem Kontext erfolgt zudem die Positionierung der vorliegenden Dissertation im wissenschaftlichen Umfeld, und es werden die durch sie erzielten wesentlichen Fortschritte dargestellt. Die nachfolgenden drei Kapitel stellen detailliert die mathematischen Konzepte und Verfahren dar, welche der voxelbasierten Registrierung zugrundeliegen. Speziell befaßt sich Kapitel 3 mit den in diesem Zusammenhang relevanten fundamentalen
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
6
(c) Koronare Schichtf¨ uhrung; Blick (d) 3D-Anordnung der orthogonalen von ventral (bauchseitig) nach dor- Schichtenaus (a), (b) und (c). sal (r¨ uckseitig).
Abbildung 1.5: Schichtf¨ uhrung medizinischer Bilddaten: MRT (MP-RAGE-Technik, 256×256×224 Voxel, 0,98 mm×0,98 mm×1,0 mm Voxelgr¨ oße).
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
7
Begriffen der Bildverarbeitung, n¨ amlich Bildern und Koordinaten sowie Koordinaten-transformationen. Kapitel 4 f¨ uhrt den Begriff der ” voxelbasierten Metrik“ als ein Maß f¨ ur die ¨ Ahnlichkeit von Bilddaten ein. Verschiedene gebr¨ auchliche Metriken werden vorgestellt und wesentliche mathematische Eigenschaften hergeleitet. Mit Verfahren zur Optimierung von Metriken befaßt sich Kapitel 5. Das nachfolgende Kapitel 6 schließlich f¨ uhrt die bisher eingef¨ uhrten Konzepte zusammen und rundet somit den theoretischen Teil ab. Besonderer Wert wird hierbei darauf gelegt, daß alle Komponenten effizient zusammenarbeiten, ohne jedoch die konzeptionelle Trennung der resultierenden Verfahren und somit ihre Universalit¨ at aufzuheben. Die auf der Basis der vorgestellten Algorithmen realisierte Software wird in Kapitel 7 beschrieben. Dabei wird sowohl auf die vorhandene graphische Benutzeroberfl¨ ache als auch auf die zugrundeliegende, systemunabh¨ angige Klassenbibliothek eingegangen. Ein spezielles Konzept f¨ ur die Registrierung fundamental unterschiedlicher Bilddaten wird in Kapitel 8 eingef¨ uhrt. Dieses verwendet komplement¨ are Eigenschaften ein- und derselben Modalit¨ at, um die Registrierung mit Daten einer anderen Modalit¨ at zu erm¨ oglichen. In diesem Zusammenhang wird eine spezielle Prozedur f¨ ur die Akquisition funktioneller MRT-Daten beschrieben und die mit ihr erreichbare Registrierungsgenauigkeit anhand eines Gold-Standards validiert. Das abschließende Kapitel 9 dokumentiert die klinische Anwendung der in dieser Arbeit entwickelten Verfahren und Software in der bildgesteuerten Therapie. Dabei handelt es sich insbesondere um die Durchf¨ uhrung von Interventionen in den Bereichen navigierte Neurochirurgie und Strahlentherapie unter Verwendung multimodaler Bilddaten. Diese Prozeduren konnten im Rahmen der vorliegenden Dissertation in enger Zusammenarbeit mit den beteiligten Medizinern bis zur Routinef¨ ahigkeit weiterentwickelt werden.
Im Anhang schließlich finden sich detaillierte quantitative Angaben zur Genauigkeit der verwendeten Registrierungsverfahren (Anhang A). Weitere Anh¨ ange geben Auskunft ¨ uber die ben¨ otigten Rechenzeiten (Anhang B) und zu speziell f¨ ur diese Arbeit entwickelten, grundlegenden Algorithmen (Anhang C).
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
8 Kapitel 1. Motivation und Gliederung
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
Kapitel 2
Stand der Forschung
2.1 Registrierung
Die m¨ oglichen Anwendungen der Registrierung medizinischer Bilddaten sind ausgesprochen vielf¨ altig. Dasselbe gilt entsprechend auch f¨ ur die automatischen Verfahren, welche zur L¨ osung dieser Aufgabe bereits entwickelt wurden. Einen recht vollst¨ andigen ¨ Uberblick ¨ uber Registrierungsalgorithmen bis etwa 1998 geben Maintz et al. [58]. Die Autoren behandeln dar¨ uber hinaus auch alle wesentlichen Anwendungsgebiete f¨ ur die Registrierung.
2.1.1 Geometriebasierte Verfahren
Die Registrierung von Bilddaten vereinfacht sich teilweise erheblich, wenn die in ihnen enthaltene Information in geeigneter Weise reduziert bzw. zusammengefaßt wird. Das Resultat einer solchen Reduktion sind meist geometrische Objekte (Achsen, Punktmengen, Oberfl¨ achen). Diese repr¨ asentieren bestimmte charakteristische Eigenschaften der urspr¨ unglichen Daten bzw. der in ihnen abgebildeten Objekte. Verfahren, welche derartige Darstellungen zur Registrierung verwenden, k¨ onnen daher unter dem Oberbegriff ” geometriebasiert“ eingeordnet werden.
Hauptachsenregistrierung. Dieses unter anderem von Faber und Stokely [20] verwendete Verfahren basiert darauf, daß jedes dreidimensionale r¨ aumliche Objekt einen eindeutigen Schwerpunkt sowie drei eindeutig bestimmte Hauptachsen besitzt. Der Schwerpunkt ist dabei mit dem Massezentrum des Objekts identisch. Die Hauptachsen sind die paarweise orthogonalen Rotationsachsen mit extremalen (d.h. minimalen oder maximalen) Massentr¨ agheitsdrehmomenten. Zwei Abbildungen desselben Objekts lassen sich daher registrieren, indem zun¨ achst die Schwerpunkte beider Darstellungen durch eine Translation ineinander ¨ uberf¨ uhrt werden. Die Richtungen
der Hauptachsen definieren dann die notwendigen Rotationen. Schließlich kann eine eventuell erforderliche Skalierung durch die L¨ angen der Hauptachsenvektoren be-
9
10 Kapitel 2. Stand der Forschung
stimmt werden.
Eine Registrierung mittels Schwerpunkt und Hauptachsen ist offensichtlich nur anwendbar, wenn das untersuchte Objekt in beiden Datens¨ atzen vollst¨ andig und allein abgebildet ist. Dies ist in der medizinischen Bildgebung allerdings so gut wie nie der Fall, denn das fragliche Objekt w¨ are stets der gesamte Patient und nur dieser. Im Falle des Sch¨ adels allerdings kann das Verfahren zumindest einigermaßen befriedigende Resultate liefern, wie von Arata et al. [2] gezeigt wurde.
F¨ ur unvollst¨ andig abgebildete Objekte haben Dhawan et al. [16] zudem ein iteratives Hauptachsenverfahren vorgestellt. Dabei werden die verf¨ ugbaren Daten zun¨ achst k¨ unstlich auf wenige zentrale Schichtbilder beschr¨ ankt und registriert. Durch sukzessives Hinzuf¨ ugen von Schichten mit anschließender eingeschr¨ ankter Neuregistrierung sollen sich auch Daten mit leicht unterschiedlichen Bildausschnitten registrieren lassen.
Landmarkenbasierte Registrierung. Unter Landmarken versteht man ausgezeichnete Punkte in der Abbildung eines Objekts (Patient). F¨ ur die Registrierung werden die Koordinaten korrespondierender Landmarken in beiden Datens¨ atzen ben¨ otigt. Daraus kann mittels algebraischer Verfahren (Singul¨ arwertzerlegung) eine Transformation bestimmt werden, welche die Landmarken des einen Bildes mit minimalem Fehler auf die des anderen Bildes ¨ uberf¨ uhrt.
Landmarken k¨ onnen in der Praxis zum einen Strukturen im K¨ orper des Patienten selbst sein. Man spricht dann speziell von anatomischen Landmarken. Andererseits sind auch k¨ unstlich angebrachte Markierungen ¨ ublich. Bei anatomischen Landmarken
besteht das Problem, diese m¨ oglichst exakt automatisch zu detektieren. Verschiedene Verfahren hierzu betrachten etwa Beil et al. [7].
Die manuelle Definition korrespondierender Punkte ist ebenfalls m¨ oglich und wird unter anderem von Wahl et al. [100] verwendet. Dies erfordert allerdings einen ge¨ ubten Bediener mit medizinischer Ausbildung. Zur geringen Genauigkeit und schlechten Reproduzierbarkeit kommt in diesem Fall somit noch ein gesteigerter Zeitaufwand. Einfacher und schneller als anatomische Strukturen sind speziell gefertigte Markierungen zu detektieren, die vor der Bildgebung am Patienten befestigt werden. Solche “fiducial markers” k¨ onnen beispielsweise in den Sch¨ adel des Patienten implantiert werden (Maurer et al. [61]) und unterliegen dann im Gegensatz zu aufgeklebten Markierungen insbesondere keinen Bewegungen durch die unvermeidliche Verformung der Haut. Zudem k¨ onnen sie so entworfen werden, daß sie sich - auch f¨ ur unterschiedliche Modalit¨ aten - in den Bilddaten vom Patienten deutlich abheben. Dies erlaubt eine effiziente und sehr exakte automatische Lagebestimmung (Wang et al. [101]).
Punktmengenbasierte Registrierung. Der Iterative Closest Point Algorithmus (ICP) nach Besl et al. [8] registriert wahlweise Punktmengen, Oberfl¨ achenmodelle oder Konturen. Das Verfahren bestimmt hierzu zun¨ achst f¨ ur jeden Punkt des einen Datensatzes den n¨ achstgelegenen Punkt im anderen. Anschließend wird die bisherige
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.1. Registrierung 11
Transformation so modifiziert, daß der quadratische Abstand aller Punktepaare minimiert wird. Dieser Vorgang wird - nach Neubestimmung der nun n¨ achstliegenden Punkte - so lange wiederholt, bis keine wesentlichen ¨ Anderungen mehr erfolgen.
Declerck et al. [15] und Feldman et al. [22] verwenden einen auf affine Trans-formationen erweiterten ICP-Algorithmus f¨ ur die Registrierung mittels anatomischer Landmarken. Tarel [89] f¨ uhrt zus¨ atzlich eine unscharfe Datenclusterung ein und erweitert das Verfahren so f¨ ur die Registrierung beliebigdimensionaler Bilddaten.
Oberfl¨ achenbasierte Registrierung. Eines der ersten automatischen Registrierungsverfahren ¨ uberhaupt war das “Head-in-Hat”-Verfahren von Pelizzari et al. [65]. Der Name erkl¨ art sich dadurch, daß w¨ ahrend der Berechnung die aus CT und MRT stammenden Oberfl¨ achen eines Sch¨ adels sich wie Kopf und Hut ineinander bewegen. In einer leicht modifizierten Anwendung des Verfahrens benutzen Hill und Hawkes [33] zur Registrierung nicht zwei aus verschiedenen Datens¨ atzen extrahierte Darstellungen derselben Objektoberfl¨ ache. Stattdessen greifen sie auf Oberfl¨ achen zur¨ uck, die anatomisch aneinandergrenzen wie etwa Dura und Sch¨ adelkalotte.
Hybridverfahren. In einer Erweiterung des ICP-Algorithmus kombinieren Maurer et al. [59, 63] Punktmengen mit Oberfl¨ achen und verwenden eine gewichtete Kombination beider Kriterien. Hierdurch ergeben sich bessere Ergebnisse, das heißt exaktere Registrierungen, als bei Verwendung jedes einzelnen Kriteriums. Eine m¨ ogliche Anwendung f¨ ur dieses Verfahren ist die intraoperative Registrierung von Daten und Patient. Die ben¨ otigten Oberfl¨ achendaten des realen Patienten k¨ onnen dabei durch ¨ Uberstreichen des freigelegten Sch¨ adelknochens mit einem optisch verfolgten Kontaktstift ermittelt werden.
2.1.2 Voxelbasierte Verfahren
Verfahren, welche die den Voxeln medizinischer Bilddaten zugeordneten Grauwerte verwenden, werden als voxelbasierte Registrierung bezeichnet. Derartige Methoden haben gegen¨ uber den oben genannten Techniken den Vorteil, daß sie keinerlei (manuelle) Vorverarbeitung wie die Segmentierung der Oberfl¨ achen von anatomischen Objekten erfordern. Dar¨ uber hinaus erlaubt die r¨ aumlich dichte Anordnung der Voxel die Anwendung lokaler Deformationen (siehe Abschnitt 2.2). Gemeinsame Basis aller voxelbasierten Registrierungsverfahren ist ein geeignetes ¨ Ahnlichkeitsmaß (engl. “similarity measure”), h¨ aufig auch als Metrik bezeichnet. Es handelt sich dabei um eine Funktion, welche zwei Bildern den Grad ihrer ¨ Ahnlichkeit
in Bezug auf eine bestimmte gegenseitige geometrische Beziehung zuordnet. Einfache Beispiele f¨ ur voxelbasierte ¨ Ahnlichkeitsmaße sind etwa Kreuzkorrelation
und mittleres Abstandsquadrat. Diese sind allerdings nur dann sinnvoll einzusetzen, wenn die Grauwerte der zu registrierenden Modalit¨ aten in enger funktionaler Beziehung zueinander stehen. Kreuzkorrelation erfordert speziell eine affine Abh¨ angigkeit,
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
12 Kapitel 2. Stand der Forschung
w¨ ahrend beim minimalen Abstandsquadrat sogar identische Grauwertbereiche notwendig sind (vgl. [73]). Beides ist allerdings nur bei unimodaler Registrierung der Fall, also bei Registrierung von zwei Datens¨ atzen desselben Bildgebungsverfahrens. Die m¨ oglichen Anwendungen beider Metriken sind dadurch entsprechend eingeschr¨ ankt. Um dies zu umgehen, f¨ uhren Van den Elsen et al. [19] Grauwerttransformation auf den zu registrierenden Bilddaten durch. Diese Umwandlung soll speziell die Bildintensit¨ aten einer CT auf die erwarteten Grauwerte einer MRT abbilden und damit die Anwendung der einfachen Kreuzkorrelation als ¨ Ahnlichkeitsmaß erm¨ oglichen.
2.1.2.1 Merkmalsfilter
Als ein weiterer Ansatz, multimodale Registrierung mit den oben genannten unimodalen ¨ Ahnlichkeitsmaßen durchzuf¨ uhren, werden gelegentlich auch Operatoren zur Merkmalsextraktion angewendet. Bei der Registrierung gleichen diese die unterschiedlichen Abbildungseigenschaften auf semantischer Ebene aus. Gewissermaßen werden beide Datens¨ atze in eine zus¨ atzliche, virtuelle Modalit¨ at ¨ uberf¨ uhrt, in der beide dasselbe Aussehen besitzen. Die derart vorverarbeiteten Bilddaten k¨ onnen dann mit einfachen Korrelationsmaßen verglichen werden.
Maintz et al. [57] testen zu diesem Zweck verschiedene sogenannte Ridge-Operatoren 1 . ¨ Ahnlich wie Kantenoperatoren extrahieren diese Filter Bildbereiche mit verallgemeinerten Intensit¨ atsmaxima. F¨ ur die Registrierung kommt anschließend eine Maximierung der Kreuzkorrelation der gefilterten Daten zum Einsatz. Der Ansatz von Fritsch et al. [29] verwendet stattdessen eine der Wavelet-Transformation verwandte Bildvorverarbeitung. Die dazu eingef¨ uhrten, “Core” genannten Strukturen beschreiben simultan die Lage, Form und Ausdehnung von Objekten (Pizer et al. [67]). Sie ¨ ahneln damit insbesondere einem als ” Skelett“ bezeichneten
Konzept der Bildverarbeitung (vgl. [48, S.233ff]). Die eigentliche Registrierung erfolgt durch gegenseitige Zuordnung dieser Objekte in mehreren Datens¨ atzen (Fritsch et al. [28]).
2.1.2.2 Multimodale Metriken
Spezielle Metriken f¨ ur multimodale Registrierung erfordern keine zus¨ atzliche Vorverarbeitung der Bilddaten. Zwei von Woods et al. eingef¨ uhrte derartige ¨ Ahnlichkeitsmaße sind Regionen-Uniformit¨ at (engl. “region uniformity”) [107, 110] und Quotienten-bild-Uniformit¨ at (engl. “ratio image uniformity”, RIU) [108, 109]. Beide basieren auf der Minimierung geeignet definierter Grauwertvarianzen. Sie finden haupts¨ achlich Verwendung in der Registrierung von PET und MRT (Alpert et al. [1]) sowie MRT und MRT (Freeborough et al. [26]). Das ebenfalls weit verbreitete ¨ Ahnlichkeitsmaß Mutual Information baut auf dem
Begriff der Entropie aus der Informationstheorie auf. Diese Metrik wurde unabh¨ angig
1 “Ridge” = ” Grat“ bezeichnet ein verallgemeinertes Maximum einer mehrdimensionalen Funktion ¨ ahnlich einem Bergr¨ ucken.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.2. Patientenmodelle und Transformationen 13
voneinander durch Viola [97] und Maes et al. [14, 55] eingef¨ uhrt. Hintergrund ist die Beobachtung, daß bei registrierten Bilddaten durch den zweiten Datensatz weniger Information zus¨ atzlich zum ersten geliefert wird als bei unregistrierten Daten. Fortgeschrittene M¨ oglichkeiten der konkreten Implementierung (Gradientenberechnung mit Partial-Volume-Integration) sowie verschiedene Optimierungsverfahren diskutieren Maes et al. in [56].
Einen vollst¨ andigen Algorithmus zur Registrierung mit Mutual Information auf mehreren Aufl¨ osungsstufen (eine sogenannte Multiresolution-Strategie) beschreiben Studholme et al. [87]. Dieselbe Arbeitsgruppe f¨ uhrt zudem in [88] eine weitere Metrik ein: Normalised Mutual Information ist, anders als Mutual Information, weitgehend unabh¨ angig vom Grad der ¨ Uberlappung der registrierten Datens¨ atze. Es ist daher
insbesondere bei stark unterschiedlichen Bildausschnitten (Field-of-View, FOV) zuverl¨ assiger. Ein weiteres entropiebasiertes ¨ Ahnlichkeitsmaß verwenden Roche et al. [74] unter
dem Namen Correlation Ratio. Dieses soll Mutual Information hinsichtlich der erreichbaren Genauigkeit der Registrierung ¨ uberlegen sein und weniger unerw¨ unschte
Nebenmaxima besitzen. Demonstriert wird dies allerdings lediglich anhand synthetischer und zudem v¨ ollig unrealistischer Beispieldaten.
2.2 Patientenmodelle und Transformationen
Die Einschr¨ ankung der zul¨ assigen Koordinatentransformationen stellt w¨ ahrend der Registrierung sicher, daß nur medizinisch sinnvolle L¨ osungen gefunden werden. W¨ aren alle denkbaren Transformationen zugelassen, so ließe sich prinzipiell jeder beliebige Datensatz exakt in jeden anderen umwandeln. Diese sogenannte Interpolation w¨ are jedoch nur von geringem Nutzen, es sei denn, die Transformation selbst anstelle der transformierten Bilddaten w¨ are Gegenstand des Interesses. Starre Transformationen stellen eine grundlegende und die am h¨ aufigsten eingesetzte Klasse von Registrierungen dar. Sie modellieren genau diejenigen Situationen, in denen dasselbe starre Objekt ohne Verformung in eine gr¨ oßentreue Abbildung uberf¨ uhrt wird. Praktisch jedes existierende Registrierungsverfahren deckt dies als ¨
wesentlichsten Fall ab. Dasselbe gilt f¨ ur affine Transformationen, die zus¨ atzlich noch Skalierungen und Scherungen zulassen.
Sehr verschiedene Ans¨ atze gibt es dagegen f¨ ur deformierende Registrierung, die auch als nicht-lineare oder elastische Registrierung, lokale Deformation oder Warping bezeichnet wird. Das Ziel der Verwendung verformender Transformation in der Registrierung ist das Modellieren und Nachvollziehen von Verformungen des Patienten. Solche k¨ onnen etwa durch Atmung, Herzschlag und Organbewegungen, aber auch durch Tumorwachstum oder chirurgische Eingriffe verursacht werden. Einen teilweisen ¨ Uberblick ¨ uber nicht-affine Registrierung geben Lester und Ar-
ridge in [50]. Die Autoren beschr¨ anken sich dabei allerdings hinsichtlich von Beispieldaten weitgehend auf die von ihnen favorisierten Fluid-Deformationen. Diese basieren
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
14 Kapitel 2. Stand der Forschung
auf den Navier-Stokes-Differentialgleichungen und werden beispielsweise von Christensen et al. [13] auf anatomische Deformationen ¨ ubertragen. M¨ oglichkeiten einer
effizienten Realisierung dieser Registrierung zeigen Bro-Nielsen et al. [11]. Weite Verbreitung fanden zun¨ achst auch die von Bookstein [9] entwickelten Thin-Plate-Splines. Diese beschreiben an sich die Biegung d¨ unner Metallbleche bei Einwirken ¨ außerer Kr¨ afte. Dar¨ uber hinaus liefern sie aber eine stetige und sogar differenzierbare Interpolation mehrdimensionaler Funktionen zwischen beliebigen St¨ utzstellen. Eigenschaften von K¨ orpergewebe wie Elastizit¨ at oder Kompressibilit¨ at werden dabei allerdings nicht modelliert. Die Aussagen ¨ uber interpolierte Deformationen von biologischen Objekten sind daher zweifelhaft. ¨ Ahnliches gilt f¨ ur die von Friston et al. [27] verwendeten Basisfunktionen der diskreten Cosinus-Transformation (DCT). Es handelt sich dabei um skalierte und verschobene Cosinusfunktionen, aus denen sich nach dem Prinzip der Fourieranalyse beliebige Funktionen linear kombinieren lassen. Die gew¨ unschten dreidimensionalen Deformationen entstehen als Tensorprodukte der eindimensionalen Basisfunktionen. Woods et al. [107, 110] erweitern die lineare affine Registrierung um polynomiale Transformationen h¨ oherer Ordnung. Dies ist so zu verstehen, daß die Komponenten der Ortsvektoren durch Potenzbildung sowie Multiplikation miteinander und mit geeigneten Koeffizienten transformiert werden.
Lee et al. [46, 47] demonstrieren f¨ ur verschiedene Anwendungen, darunter die Interpolation von Deformationen, den Gebrauch von hierarchischen B-Splines. Gegen¨ uber den zuvor genannten Transformationen besitzen die Basisfunktionen der De-formation hier den Vorteil eines kompakten Tr¨ agers. Es handelt sich daher bei ihnen um echt lokale Transformationen, und ihre Auswirkungen sind aus diesem Grund wesentlich effizienter zu berechnen. Diese Transformationen werden beispielsweise von R¨ uckert et al. [84] in der kontrastmittelgest¨ utzten MR-Mammographie sowie von Hill et al. [34] bzw. Maurer et al. [62] zur Untersuchung intraoperativer Hirndeformation verwendet.
Der Ansatz von Little et al. [54] sieht zus¨ atzlich zu elastisch deformierten Bereichen auch starre Strukturen, beispielsweise Knochen, vor. Nach Segmentierung und separater Registrierung dieser starren Teilbereiche wird deren Umgebung stetig deformiert. Anwendung hat dies beispielsweise beim Ausgleich der relativen Bewegungen von Wirbelk¨ orpern gefunden (Penney et al. [66]).
Edwards et al. [18] definieren mit Blick auf die Situation im Sch¨ adelbereich drei verschiedene Arten von Materialeigenschaften: Starr (Knochen), fl¨ ussig (cerebrospinale Fl¨ ussigkeit, CSF) sowie elastisch (Hirngewebe). Motivation des Verfahrens ist der Wunsch, die Deformation des Gehirns w¨ ahrend chirurgischer Eingriffe in Echtzeit zu modellieren. Aufgrund der aufwendigen Segmentierung und der großen Anforderungen an die verf¨ ugbare Rechenzeit beschr¨ anken sich die Autoren allerdings bislang auf zweidimensionale, also schichtbildweise Registrierung. Weitere Transformationsmodelle verwenden Finite-Elemente-Techniken, etwa Gee et al. [30]. Auch hier werden jedem finiten Element Materialeigenschaften wie Elastizit¨ at etc. zugewiesen, wodurch seine Deformation kontrolliert wird. Zus¨ atzlich zu den
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.3. Validierung 15
oben beschriebenen ¨ Ahnlichkeitsmaßen wird auch eine Komponente ber¨ ucksichtigt, welche die Energie bzw. Verformung eines Gitters modelliert. Solche “priors” (vgl. Ashburner et al. [3]) sorgen grunds¨ atzlich f¨ ur die Erhaltung der Topologie, indem sie ein Umfalten des transformierten Gitters ” bestrafen“.
2.3 Validierung
Eine zentrale Bedingung f¨ ur die klinische Verwendung fusionierter Bilddaten ist die Sicherung der Genauigkeit der gefundenen Registrierung. Das gilt sowohl in der allgemeinen radiologischen Diagnostik als auch und besonders in der bildgesteuerten Therapie.
Idealerweise sollte die Qualit¨ at einer durch ein automatisches Verfahren gefundenen Registrierung durch Vergleich mit der korrekten Transformation bestimmt werden. Dies ist f¨ ur reale Patientendaten allerdings so gut wie nie m¨ oglich, denn w¨ are die korrekte Transformation bekannt, so m¨ ußte ¨ uberhaupt nicht registriert werden. Es
existieren jedoch verschiedene Verfahren zur n¨ aherungsweisen Bewertung der Registrierungsgenauigkeit auch ohne bekannte Referenztransformation. Zwei Aspekte sind hier von besonderem Interesse:
1. Genauigkeit (engl. “accuracy”): Dies ist die F¨ ahigkeit eines Verfahrens, die korrekte Registrierungstransformation exakt zu bestimmen.
2. Stabilit¨ at (engl. “robustness”, “reliability”): Hiermit wird die Unempfindlichkeit eines Verfahrens gegen¨ uber Ausgangsbedingungen bezeichnet. Dies k¨ onnen etwa Gr¨ oße und Qualit¨ at der Bilddaten oder die anf¨ angliche Abweichung von der korrekten Registrierung sein.
2.3.1 Synthetische Bilddaten
Eine M¨ oglichkeit der Validierung multimodaler Registrierungsverfahren besteht in der Verwendung simulierter Bilddaten. Dabei wird, etwa durch Grauwerttransformationen, aus einem Bild einer Modalit¨ at ein simuliertes korrespondierendes Bild einer anderen Modalit¨ at berechnet. Auf dieses synthetische Bild wird dann eine beliebige aber bekannte Transformation angewendet. Anschließend wird es mit dem Ausgangsbild registriert. Die resultierende Transformation kann dann mit der bekannten Transformation verglichen werden.
Kiebel et al. [43] verwenden beispielsweise simulierte PET-Daten, die aus MRT-Bildern berechnet werden. Mit deren Hilfe wird eine vergleichende Genauigkeitsbewertung zweier Softwarepakete durchgef¨ uhrt (SPM [27], siehe Abschnitt 2.5.3 und AIR [110], Abschnitt 2.5.1).
Hierzu ist zweierlei zu bemerken: Zun¨ achst ist grunds¨ atzlich fraglich, inwieweit simulierte Bilddaten reale Modalit¨ aten wiedergeben k¨ onnen. W¨ are eine exakte Simulation etwa funktioneller Daten aus MRT m¨ oglich, so k¨ onnte letztlich auf die
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
16 Kapitel 2. Stand der Forschung
funktionelle Bildgebung verzichtet werden. Physikalische Effekte wie Rauschen und Partialvolumenartefakte m¨ ussen dar¨ uber hinaus ebenfalls ber¨ ucksichtigt werden. M¨ oglicherweise entscheidender ist zudem, daß auch Registrierungsverfahren selbst simulierte Bilddaten verwenden k¨ onnen. Das SPM-Paket nutzt beispielsweise simulierte PET-Bilder um MRT mit realen PET-Daten zu registrieren. Validiert man ein solches Verfahren ebenfalls mit Hilfe von - im Extremfall nach derselben Techniksimulierten Daten, so kann das Resultat davon nicht unbeeinflußt sein. Aus beiden genannten Gr¨ unden ist die Validierung mit k¨ unstlich erzeugten Daten eher kritisch zu sehen. Ihre Anwendung sollte auf Ausnahmef¨ alle beschr¨ ankt sein, in denen keine andere Evaluierung der Registrierungsgenauigkeit m¨ oglich ist.
2.3.2 Konsistenz wiederholter Registrierung
Eine weitere M¨ oglichkeit zur Bewertung eines Registrierungsverfahrens besteht in Konsistenzpr¨ ufung bei wiederholter Anwendung. Dazu werden dieselben Datens¨ atze viele Male mit zuf¨ allig bestimmten Ausgangsparametern registriert. Die Streuung aller so erzielten Registrierungen wird dann als Indikator f¨ ur die Stabilit¨ at der Registrierung verwendet [41].
Diese Methode liefert jedoch keinerlei Anhaltspunkt ¨ uber die tats¨ achlich erreichte
Genauigkeit. Stattdessen wird analysiert, mit welcher Zuverl¨ assigkeit das verwendete Optimierungsverfahren das Maximum der verwendeten ¨ Ahnlichkeitsfunktion findet.
Inwieweit dieses Maximum einer brauchbaren Registrierung entspricht bleibt v¨ ollig unber¨ ucksichtigt. So spricht eine schlechte Konsistenz zwar zweifelsfrei f¨ ur eine im mittel ungenaue Registrierung, eine hohe Konsistenz jedoch ist kein Indiz f¨ ur eine hohe Genauigkeit.
Daher ist dieses Kriterium f¨ ur die Validierung der Genauigkeit von Registrierungsverfahren allein nur beschr¨ ankt aussagef¨ ahig. Grunds¨ atzlich bedarf es vielmehr der Erg¨ anzung durch zumindest ein weiteres Verfahren, welches zus¨ atzlich zur Konsistenz die ” Korrektheit“ der gefundenen Transformationen sichert.
2.3.3 Konsistenz serieller Registrierung
Unter serieller Registrierung versteht man die Aufgabe, eine Kette von mehreren Datens¨ atzen durch die jeweils geeigneten Transformationen zu verbinden. F¨ ur drei Datens¨ atze A, B und C kann dies beispielsweise wie folgt aussehen:
T AB T BC T CA A −−→ B −−→ C −−→ A. (2.1)
Nach Durchlaufen der kompletten Kette muß das Koordinatensystem von A wieder auf sich selbst abgebildet werden. Somit sollte im Idealfall die Verkettung aller Trans-formationen die Identit¨ atstransformation Id ergeben:
! T AB ◦ T BC ◦ T CA = Id. (2.2)
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.3. Validierung 17
Tats¨ achlich jedoch wird sich eine gewisse Abweichung ergeben, die sogenannte Inkonsistenz der seriellen Registrierung. Integriert man das Quadrat dieser Abweichung f¨ ur alle Vektoren eines Gebietes D, so ist der resultierende Wert gewissermaßen der quadratische Fehler E ¨ uber dieses Gebiet:
Diese Methode wird beispielsweise von Woods et al. [108] verwendet, um das von ihnen entwickelte Registrierungsverfahren zu validieren.
Holden et al. [36] vergleichen zus¨ atzlich anhand der internen Konsistenz die Eignung verschiedener voxelbasierter Registrierungsverfahren. Die zugrundeliegende Anwendung ist die ¨ Uberwachung von Hirnver¨ anderungen unter Gabe von Wachstums-hormonen mittels serieller MRT. Hierbei ist von Vorteil, daß in dieser Situation sich in nat¨ urlicher Weise die f¨ ur die Konsistenzpr¨ ufung ben¨ otigte Serie von MRT-Daten ergibt. ¨ Ahnlich wie beim zuvor genannten Verfahren der Konsistenzpr¨ ufung bei wiederholter Registrierung bedarf auch die serielle Registrierung einer zus¨ atzlichen Validierung. Die serielle Konsistenz sichert n¨ amlich ebensowenig wie die Konsistenz wiederholter Registrierung die Korrektheit der gefundenen Transformationen. Sind alle Teiltransformationen beispielsweise selbst Identit¨ atstransformationen, so ergibt sich die optimale Konsistenz E = 0, auch wenn die korrekten Transformationen v¨ ollig andere sind.
2.3.4 Stereotaktischer Gold-Standard
Das zuverl¨ assigste Verfahren zur Registrierung medizinischer Bilddaten ist die prospektive Registrierung mit stereotaktischen Rahmen oder implantierbaren Knochenmarkern. Solche k¨ unstlichen Landmarken lassen sich etwa nach dem Verfahren von Wang et al. [101] mit hoher Genauigkeit (Fehler kleiner als die Seitenl¨ ange eines Voxels) automatisch detektieren.
Die Anwendung solcher Hilfsmittel ist f¨ ur den Patienten allerdings sehr belastend, weswegen sie in der klinischen Praxis nach M¨ oglichkeit vermieden wird. Mit ihrer Hilfe lassen sich jedoch außerordentlich exakte Referenztransformationen bestimmen, die dann als Vergleichsmaßstab f¨ ur andere Registrierungsverfahren dienen k¨ onnen. Dies wird beispielsweise von Woods et al. [110] oder Turkington et al. [95] durchgef¨ uhrt. Zwar werden auch anatomische Landmarken zur Validierung herangezogen (z.B. Grachev et al. [31]); die mit ihrer Hilfe gefundenen Transformation unterliegen jedoch der zus¨ atzlichen Unsicherheit der exakten Lokalisierung der Landmarken [7]. Auf der stereotaktischen Registrierung basierend wurde schließlich von J. M. Fitzpatrick das “Retrospective Registration Evaluation Project” ( ” Vanderbilt-Projekt“) ins Leben gerufen. Mit dem Ziel, einen ¨ Uberblick ¨ uber die erreichbare Genauigkeit
automatischer Registrierungsverfahren zu gewinnen, stellt dieses Projekt den zur Zeit einzigen allgemein verf¨ ugbaren Benchmark f¨ ur die starre Registrierung dar.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
18 Kapitel 2. Stand der Forschung
Aus dem Sch¨ adelbereich von zun¨ achst 9 Tumorpatienten wurden Daten einer Reihe von Modalit¨ aten (CT, PET, T 1 -gewichtete MRT, T 2 -gewichtete MRT, Protonendichte-MRT) generiert. Die MRT wurden dabei zus¨ atzlich unter Anwendung einer Distorsionskorrektur auf Bildgebungsebene durchgef¨ uhrt [60], um Bildverzerrungen durch Inhomogenit¨ aten des Scanner-Magnetfeldes zu minimieren. Sp¨ ater wurden noch Daten von 9 weiteren Tumorpatienten mit zus¨ atzlichen hochaufl¨ osenden MRT in MP-RAGE-Technik hinzugef¨ ugt.
Bei allen Aufnahmen waren jeweils mit stereotaktischen Rahmen und implantierten Knochenmarkern [61] automatisch detektierbare Landmarken am Patienten fixiert. Rahmen und Landmarken wurden dann manuell aus den Bilddaten entfernt, um eine echt retrospektive Registrierung durch die validierten Verfahren zu erzwingen.
Das resultierende Bildmaterial steht nun interessierten Arbeitsgruppen f¨ ur die Anwendung ihrer jeweiligen Registrierungsalgorithmen zur Verf¨ ugung. Die von den Projektteilnehmern zur¨ uckgemeldeten Transformationsresultate werden mit den mittels stereotaktischer Rahmen ermittelten Transformationen verglichen. Hierzu werden die Abweichungen beider Registrierungen f¨ ur jedes Modalit¨ atenpaar innerhalb von zehn Volumes-of-Interest (VOIs) berechnet.
Die Resultate der urspr¨ unglichen Teilnehmer der Studie sind in [103] und [104] ver¨ offentlicht. Diese sowie sp¨ ater hinzugekommene Ergebnisse sind dar¨ uber hinaus auf der Website des Projekts unter http://cswww.vuse.vanderbilt.edu/~jayw/ results.html elektronisch verf¨ ugbar. Auch die Resultate unserer Arbeitsgruppe unter Verwendung der in dieser Dissertation beschriebenen Verfahren k¨ onnen unter der oben angegebenen Adresse abgerufen werden. Zudem sind sie in Anhang A der vorliegenden Arbeit noch einmal zusammengefaßt dargestellt. Als eine wesentliche Schlußfolgerung aus dem Vanderbilt-Projekt ergibt sich eine ¨ Uberlegenheit voxelbasierter im Vergleich zu oberfl¨ achenbasierten Registrierungsverfahren [105]. Diese ¨ Uberlegenheit ist besonders deutlich f¨ ur CT-MRT-Registrierung und zumindest erkennbar f¨ ur die PET-MRT-Registrierung. Bereits die urspr¨ ungliche Ver¨ offentlichung der Vanderbilt-Studie [104] hat gezeigt, daß speziell die auf Mutual Information basierenden Verfahren den ¨ ubrigen Algorithmen teilweise deutlich ¨ uberlegen sind. Lediglich Quotientenbild-Uniformit¨ at nach Woods et al. [108] kann im Bereich PET-MRT-Registrierung bessere Ergebnisse erzielen.
2.4 Bildfusion
Im Unterschied zur Registrierung befaßt sich die Bildfusion mit der gemeinsamen Visualisierung zuvor registrierter Daten. Hierzu sind bisher allerdings nur eine geringe Anzahl von Arbeiten erschienen. Diese behandeln das Thema zudem lediglich am Rande und bei speziellen Anwendungen.
Eine f¨ ur die vorliegende Arbeit in diesem Zusammenhang bedeutende Quelle sind Hill et al. [35]. Die Autoren demonstrieren die Anwendung einer schwellenwertbasier-
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.5. Software-Pakete 19
ten ¨ Uberlagerung von CT- und MRT-Daten beim Akustikusneurinom, einem Tumor des H¨ ornervs. In einer Erweiterung der genannten Arbeit befassen sich Wong et al. [106] mit der Bildfusion von CT und MRT sowie CT und PET. Der Schwerpunkt liegt dabei weiterhin auf Erkrankungen im Kopf- und Halsbereich. Wahl et al. [100] betrachten ebenfalls die Fusion von PET und anatomischen Bilddaten. Sie verwenden dazu PET-Information, welche mittels einer Regenbogentabelle farbkodiert und dann der ¨ ublichen Graustufendarstellung anatomischer Daten
uberlagert wird. Viergever et al. [96] erweitern dies nach einem Vergleich verschiede¨
ner Registrierungsverfahren um mehrere Techniken zur zwei- und dreidimensionalen Bildfusion.
2.5 Software-Pakete
2.5.1 AIR
Die gr¨ oßte Verbreitung besitzt derzeit wohl das AIR-Paket (Automated Image Registration, aktuelle Version 3.08) von R. Woods [107]. Es ist in Form von C-Quelltextdateien verf¨ ugbar und l¨ aßt sich somit auf einer Vielzahl von Rechnerplattformen ¨ ubersetzen.
Das System unterst¨ utzt affine sowie nicht-lineare Registrierung und Reformatierung. F¨ ur die Registrierung wird mittels eines modifizierten Newton-Verfahrens eines der ¨ Ahnlichkeitsmaße Regionen-Uniformit¨ at [110] oder Quotientenbild-Uniformit¨ at [108] optimiert.
Die Registrierung von MRT und PET erfolgt sehr zuverl¨ assig und mit hoher Genauigkeit, erfordert jedoch eine Segmentierung der Bilddaten. Registrierung von seriellen MRT-Daten [26] ist eine weitere ausdr¨ ucklich unterst¨ utzte Anwendung. Allerdings sind andere Verfahren hier deutlich ¨ uberlegen [36] und kommen zudem ohne Segmentierung aus.
Bilddaten k¨ onnen im Analyze-Dateiformat (Biomedical Imaging Ressource, Mayo-Foundation, Rochester, MN, USA, http://www.mayo.edu/bir/analyze/ANALYZE_ Main.html) importiert und geschrieben werden. Registrierungstransformationen werden in einem propriet¨ aren Bin¨ arformat gespeichert. Der Datenaustausch mit anderen Systemen ist daher nur mit Einschr¨ ankungen m¨ oglich.
2.5.2 UMDS Geomcal / Rview
Die Pakete Geomcal (Registrierung) und Rview (Bildbetrachter) wurden von C. Studholme am Guy’s Hospital in London entwickelt [86]. Beide stehen als Bin¨ ardistribution ausschließlich f¨ ur SUN Solaris in der mittlerweile veralteten Version 2.5 zur Verf¨ ugung. Zur Registrierung (starr oder affin) verwendet das Paket eine Multiresolution-Suchstrategie [87] zur Optimierung von Normalised Mutual Information [88].
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
20 Kapitel 2. Stand der Forschung
F¨ ur den Import und Export von Bilddaten stehen verschiedene wissenschaftliche Dateiformate zur Verf¨ ugung. Direkte Ein- oder Ausgabe spezieller medizinischer Bild-formate (DICOM oder ACR-NEMA) wird nicht unterst¨ utzt. Das Paket wird zudem nicht kontinuierlich weiterentwickelt.
2.5.3 SPM
Das SPM-Paket (Statistical Parametric Mapping) von K. Friston [27] ist besonders im Bereich der Neurologie verbreitet. Seine Hauptanwendungsgebiete sind die Registrierung und Fusion funktioneller (PET, SPECT) und anatomischer Bilddaten (MRT) sowie die Erzeugung funktioneller MRT.
Das System basiert auf Matlab (The MathWorks, Natick, MA, USA) mit einigen in Standard-C implementierten Erweiterungen. Es ist somit auf allen Plattformen einsetzbar, die auch von Matlab unterst¨ utzt werden. Allerdings ist die Software folglich nicht vollst¨ andig frei sondern erfordert zwingend den kommerziellen Unterbau. Als einziges Bildformat wird das Analyze-Dateiformat unterst¨ utzt. Die Registrierung erfolgt voxelbasiert, wobei durch spezielle Bildtransformationen das Registrierungsproblem auf das L¨ osen eines umfangreichen linearen Gleichungssystems reduziert wird. Unterst¨ utzt werden affine Transformationen sowie lokale Deformationen. Letztere werden durch Linearkombination der Basisfunktionen der diskreten Cosinus-Transformation (DCT) dargestellt.
2.6 Positionierung dieser Arbeit
Algorithmen f¨ ur die starre und affine Registrierung multimodaler Bilddaten sind bereits allgemein verf¨ ugbar. Geschwindigkeit und Zuverl¨ assigkeit sind allerdings noch zu verbessern. Dasselbe gilt f¨ ur die Entwicklung nicht-affiner, also lokal-elastischer Registrierungsverfahren.
Die Anwendung von Registrierung und Bildfusion ist bisher nur mit Spezialwissen m¨ oglich. Verf¨ ugbare Programmpakete m¨ ussen teilweise erst ¨ ubersetzt werden. Die
meisten stellen ihre Funktionen lediglich per Kommandozeile zur Verf¨ ugung. Selbst Pakete mit graphischer Benutzeroberfl¨ ache (SPM) sind h¨ aufig nur schwer zu bedienen und somit nicht routinef¨ ahig.
Dar¨ uberhinaus ist keines der existierenden Registrierungs- und Fusionspakete in der Lage, Bilddateien im Standardformat DICOM zu lesen oder gar zu exportieren. Gerade dies allerdings ist eine wesentliche Voraussetzung f¨ ur die weitere Verwendung fusionierter Daten in bildgesteuerten Therapieger¨ aten. Diese Arbeit beschreibt die Entwicklung und Realisierung eines Systems zur automatischen Registrierung und Bildfusion. Die verwendeten Algorithmen werden detailliert beschrieben. Besonderes Augenmerk gilt dabei Verbesserungen existierender Verfahren hinsichtlich Effizienz und Genauigkeit der Registrierung. Speziell die Genauigkeit wurde durch Teilnahme an der Vanderbilt-Studie unter Beweis gestellt.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
2.6. Positionierung dieser Arbeit 21
Die resultierende Software stellt s¨ amtliche Funktionen f¨ ur automatische Registrierung und Fusion unter einer intuitiven graphischen Benutzerschnittstelle zur Verf¨ ugung. Bisher mehr als 18-monatige t¨ agliche klinische Verwendung des Systems durch Mediziner, MTAs und Studenten demonstrieren klar seine Routinef¨ ahigkeit. Durch konsequente Trennung von Algorithmen und Schnittstellen steht dar¨ uberhinaus die gesamte Registrierung als optimierte, in C++ implementierte Klassenbibliothek zur Verf¨ ugung. Mit deren Hilfe konnten ohne nennenswerten zus¨ atzlichen Entwicklungsaufwand Kommandozeilenprogramme implementiert werden, die einen automatisierten Stapelbetrieb erlauben. Weiterhin konnte die Registrierung in ein am Konrad-Zuse-Zentrum f¨ ur Informationstechnik in Berlin entwickeltes System zur Hyperthermieplanung (HyperPlan) integriert werden.
Als klinisch entscheidenden Unterschied zu allen verf¨ ugbaren Systemen zur Bildfusion ist die hier beschriebene Software in der Lage, Bilddaten in den Dateiformaten DICOM und ACR-NEMA zu lesen und zu exportieren. So ist es m¨ oglich, fusionierte Schichtbilder insbesondere in Therapieger¨ ate zu importieren. In zwei Anwendungsgebieten, der navigierten Neurochirurgie und der Strahlentherapieplanung, wurde somit die routinem¨ aßige Verwendung der Bildfusion erm¨ oglicht. Auch scheinbar unwesentliche Details der Implementierung sind in diesem Zusammenhang von Bedeutung und heben die vorliegende Arbeit von existierenden Systemen ab. So erm¨ oglicht beispielsweise erst ein neuentwickeltes Verfahren zum schnellen Zugriff auf Voxel in nicht-¨ aquidistanten Gittern (Anhang C.2) die direkte Registrierung von CT-Daten mit nicht-konstantem Schichtabstand. Entsprechendes gilt f¨ ur die Ber¨ ucksichtigung der nicht zuletzt aus Strahlenschutzgr¨ unden wichtigen Gantry-Neigung bei CT-Scannern (siehe Abschnitt 3.3.5).
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
22 Kapitel 2. Stand der Forschung
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
Kapitel 3
Bilder, Koordinaten und
Transformationen
Dieses Kapitel f¨ uhrt die wesentlichen nachfolgend verwendeten Grundlagen der Bildverarbeitung ein. Besonderer Wert wird dabei auf die speziellen Anforderungen der medizinischen Bildverarbeitung und insbesondere der Registrierung gelegt. So wird hier beispielsweise erstmals detailliert auf die Behandlung der Gantry-Neigung bei CT-Scannern eingegangen. Im Zusammenhang mit lokalen Deformationen werden dar¨ uber hinaus einige praktische Fragestellungen gekl¨ art, wie die Vermeidung von R¨ uckw¨ artstransformationen sowie die effiziente Einbeziehung affiner Vorregistrierungen.
3.1 Begriffe
Bekanntermaßen besteht ein Bild im Sinne der digitalen Bildverarbeitung aus einzelnen Bildelementen, den sogenannten Pixeln (engl. “picture elements”). Aus Gr¨ unden der Universalit¨ at verwendet man in der Praxis den Begriff ” Bild“ gleichermaßen f¨ ur
zweidimensionale wie auch f¨ ur drei- oder mehrdimensionale Anordnungen solcher Elemente. Auch f¨ ur h¨ ohere Dimensionen werden diese daher konsequenterweise als Pixel bezeichnet. Insbesondere im Zusammenhang mit r¨ aumlichen, also dreidimensionalen Bildern wird allerdings h¨ aufig auch von Volumenelementen oder Voxeln (engl. volume elements) gesprochen.
In beiden F¨ allen ist jedem Pixel (oder Voxel) ein diskreter Wert aus einem festen Bereich zwischen einer unteren Grenze g min und einer oberen Grenze g max zugeordnet. Im allgemeinen k¨ onnen jedem Pixel auch mehrere Werte zugeordnet sein, etwa bei Farbbildern die Komponenten f¨ ur Rot, Gr¨ un und Blau. Im Rahmen dieser Arbeit sind jedoch nur Grauwertbilder von Interesse. Besitzt ein solches Bild speziell n x × n y × n z Voxel, kann man es als einfache Funktion der folgenden Form schreiben:
{0, . . . , n x − 1} × {0, . . . , n y − 1} × {0, . . . , n z − 1} → {g min , . . . , g max }. (3.1)
23
24 Kapitel 3. Bilder, Koordinaten und Transformationen
Eine Besonderheit, welche die meisten medizinischen Bilddaten etwa von Fotographien unterscheidet, liegt in der Existenz einer Beziehung zwischen der Anordnung ihrer Voxel und sogenannten Weltkoordinaten:
{0, . . . , n x − 1} × {0, . . . , n y − 1} × {0, . . . , n z − 1} ↔ R 3 . (3.2)
Dies bedeutet, daß jedem Voxel eines medizinischen Bildes ein Ort (d.h. eine Ko-ordinate) im realen physikalischen Raum entspricht. Das gilt zumindest f¨ ur die im Rahmen der vorliegenden Arbeit betrachteten tomographischen Bildgebungsverfahren sowie bei der dreidimensionalen Ultraschallbildgebung.
3.2 Transformationen
Eine Koordinatentransformation (kurz: Transformation) bildet jeden Ort im Raum der Weltkoordinaten auf einen Ort im selben Raum ab. Sie ist im Fall der Registrierung dreidimensionaler Bilddaten also eine Abbildung des R 3 in sich selbst. Eine g¨ ultige Registrierungstransformation muß aus anatomischen Gr¨ unden zudem invertierbar sein und die Topologie des Koordinatenraums erhalten. Die Darstellung der Transformationen einer konkreten Klasse Θ erfolgt zweckm¨ aßigerweise ¨ uber eine Parametrisierung durch einen Vektor reeller Parameter:
Θ = (3.3)
Hierbei ist N die Zahl der Freiheitsgrade der Transformationsklasse Θ. Im folgenden werden die Vektoren p als die Parameterdarstellung der jeweiligen Transformation bezeichnet. Komplement¨ ar dazu kann es je nach Transformationsklasse andere, implizite Darstellungen geben, etwa in Form einer Matrix f¨ ur affine Transformationen.
3.3 Starre und affine Transformationen
Eine einfache, zugleich aber außerordentlich wichtige Klasse von Koordinatentrans-formationen sind die sogenannten Starre-K¨ orper-Transformationen, auch starre oder rigide Transformationen (engl. “rigid transformations”) genannt. Diese Klasse umfaßt genau diejenigen Bewegungen im Raum, die ein starrer, also nicht verformbarer K¨ orper auszuf¨ uhren imstande ist.
Die große Bedeutung starrer Transformationen bei der Registrierung medizinischer Daten begr¨ undet sich dadurch, daß die meisten bildgebenden Ger¨ ate kalibrierte Bilddaten liefern. Durch die Kalibrierung sind die genauen Abst¨ ande zwischen den einzelnen Bildpunkten nicht nur relativ zueinander, sondern auch als absolute Werte, etwa in mm, bekannt. Solche Bilder verhalten sich daher bei der Registrierung tats¨ achlich wie starre K¨ orper, sofern das abgebildete Objekt ebenfalls starr ist.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
3.3. Starre und affine Transformationen 25
3.3.1 Parameterdarstellungen und Anzahl der Freiheitsgrade
Eine dreidimensionale starre Transformation besitzt neben drei Freiheitsgraden t x , t y und t z f¨ ur Translationen in Richtung der Koordinaten x, y und z noch drei Freiheitsgrade α, β und γ f¨ ur Rotationen um die Koordinatenachsen. Eine Obermenge der starren bilden die affinen Transformationen. Diese sind allgemein definiert als diejenigen Transformationen, welche die Parallelit¨ at von Geraden erhalten. Zus¨ atzlich zu Translationen und Rotationen besitzen affine Transformationen je weitere drei Freiheitsgrade f¨ ur Skalierungen und Scherungen. Zusammen mit den oben genannten Translations- und Rotationsparametern bilden diese Freiheitsgrade die Parameterdarstellung affiner Transformationen. Die Klasse der affinen Transformationen besitzt mehrere Unterklassen, die unter Komposition und Invertierung abgeschlossen sind. Speziell handelt es sich bei diesen aufgrund der Gruppeneigenschaft der affinen Transformationen sogar um Untergruppen. Unter ihnen sind insbesondere folgende von praktischer Bedeutung:
1. Translationen T ,
2. rigide Transformationen R,
3. rigide Transformationen mit globaler Skalierung S,
4. rigide Transformationen mit komponentenweiser Skalierung S ,
5. allgemeine affine Transformationen A.
In dieser Reihenfolge bilden sie eine aufsteigende Untergruppenkette
T < R < S < S < A. (3.4)
Eine ¨ ahnliche Hierarchie gilt auch f¨ ur die Parameterdarstellung. Ordnet man die einzelnen Parameter der allgemeinen affinen Transformation als Vektor
p = [t x , t y , t z , α, β, γ, c, c x , c y , q xy , q yz , q zx ], (3.5)
so parametrisieren Pr¨ afixvektoren verschiedener L¨ ange verschiedene Untergruppen der affinen Transformationen. Die Festlegung, wieviele der f¨ uhrenden Koeffizienten Freiheitsgrade und wieviele Konstanten darstellen, erlaubt die Auswahl der jeweils gew¨ unschten Klasse. Die Korrespondenz ist wie folgt:
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
26 Kapitel 3. Bilder, Koordinaten und Transformationen
Es ist hierbei zu beachten, daß die obige Darstellung f¨ ur die Skalierungskoeffizienten von der Standardinterpretation dieser Parameter abweicht. ¨ Ublicherweise werden
komponentenweise Skalierungen nicht als globaler Faktor c und Aspektfaktoren c x und c y parametrisiert.
W¨ ahlt man jedoch vollst¨ andig unabh¨ angige Skalierungen c x , c y und c z , so repr¨ asentiert keiner dieser Faktoren eine globale Skalierung. In der Vektordarstellung (3.5) wechselt die Komponente mit Index 6 also ihre Bedeutung je nachdem, ob die Anzahl der Freiheitsgrade 7 (globale Skalierung) oder 9 bzw. 12 (Skalierung in x-Richtung) betr¨ agt.
3.3.2 Matrixdarstellung
Die effizienteste Art der Berechnung affin transformierter Vektoren ist die Multiplikation mit einer Transformationsmatrix. Wie in der Computergraphik ¨ ublich [24, 94],
werden die Vektoren dabei geschickterweise mittels homogener Koordinaten beschrieben. Dazu wird jedem 3D-Koordinatenvektor eine zus¨ atzliche vierte Komponente W hinzugef¨ ugt: x y z W → . x y z (3.6)
Weiterhin wird definiert, daß zwei Vektoren genau dann denselben Punkt im Raum bezeichnen, wenn sie Vielfache voneinander sind. Es gilt somit die ¨ Aquivalenz ≡ x . y z x y z W 1 (3.7) W W W Aus Gr¨ unden der ¨ Ubersichtlichkeit werden alle auftretenden Vektoren zumeist auf W = 1 normiert. Die Transformation selbst kann dann als (Rechts-)Multiplikation eines homogenen Koordinatenvektors x mit einer 4 × 4 Matrix geschrieben werden:
Im Folgenden wird diese Matrixdarstellung einer affinen Transformation mit A bezeichnet werden. Ihre Koeffizienten a ij beschreiben die Rotations-, Skalierungs- und Scherungskomponenten. Die Translationskomponente wird durch den Vektor t = t 0 t 1 t 2 definiert. Die Konstante 1 an der Position 1 (3, 3) dient lediglich der Er-
haltung der Homogenit¨ at der transformierten Vektoren.
3.3.3 Dekomposition der Transformationsmatrix
Gelegentlich ist es w¨ unschenswert, aus einer gegebenen affinen Transformationsmatrix die Parameterdarstellung zur¨ uckzugewinnen. Beispielsweise erfolgt die Invertierung einer affinen Transformation ¨ ublicherweise als Matrixinversion der zugeh¨ origen
1 Die Indizierung von Matrixeintr¨ agen beginnt mit (0, 0) in der oberen linken Ecke.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
3.3. Starre und affine Transformationen 27
Transformationsmatrix. ¨ Ahnliches gilt f¨ ur die Verkettung zweier affiner Transformationen, die durch eine Matrixmultiplikation erreicht werden kann. In beiden F¨ allen ist anschließend die resultierende inverse bzw. durch Multiplikation erhaltene Matrix wieder in eine ¨ aquivalente Parameterdarstellung umzuwandeln. Diese Dekomposition kann wie folgt vorgenommen werden: Sei zun¨ achst eine homogene affine Transformationsmatrix A gegeben. Diese soll geschrieben werden als
A = QSRX, (3.9)
wobei X eine Translationsmatrix, R eine Rotation, S eine Skalierung und Q eine Scherung bezeichnet. Aus diesen elementaren Transformationsmatrizen k¨ onnen die zugrundeliegenden Parameter dann leicht zur¨ uckgewonnen werden. Die Zerlegung von A in Q, S, R und X ist anhand der Invarianten in Tabelle 3.1 wie folgt durchzuf¨ uhren:
1. Bestimme Q aus den Winkelver¨ anderungen.
2. Bestimme aus Q −1 A die Skalierungsfaktoren anhand der L¨ angenver¨ anderungen.
3. Bestimme aus S −1 Q −1 A die Rotationswinkel anhand der Richtungsver¨ anderungen.
4. Dann ist X = R −1 S −1 Q −1 A eine reine Translation.
Scherungen. Die allgemeine Form einer xy-Scherungsmatrix ist
Die ¨ ubrigen elementaren Scherungsmatrizen Q yz , Q zx k¨ onnen durch Koeffizienten q = 0 an den entsprechenden Positionen der Nebendiagonalen gebildet werden. Explizite Scherungen Q yx , Q zy und Q xz werden nicht ben¨ otigt, da sich diese durch die komplement¨ are Scherung, eine Rotation um die verbleibende Koordinatenachse
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
28 Kapitel 3. Bilder, Koordinaten und Transformationen
sowie eine Skalierung ausdr¨ ucken lassen. Speziell ist etwa
Q
yx
(q) zu schreiben als
1 0 0 0
q
1 0 0
=
0 0 1 0 0 0 0 1 = S x ((1 + q 2 ) −1 )Q xy (q)R z (− arcsin q) (3.11)
Die inverse Matrix zu Q xy ist ebenfalls eine Scherung, und zwar wie sich leicht ¨ uberpr¨ ufen l¨ aßt
Q −1
Die Bestimmung von q xy aus A basiert auf der Beobachtung, daß alle affinen Transformationskomponenten mit Ausnahme von Q xy die Orthogonalit¨ at der Einheitsvektoren e x und e y erhalten. Somit gilt
! e x Q −1 xy A, e y Q −1 xy A = 0. (3.13)
Mit den Bezeichnungen aus (3.8) f¨ ur die Koeffizienten von A folgt hieraus
mit den Zeilenvektoren a 0 und a 1 . Analog k¨ onnen sukzessive die Koeffizienten q yz und q zx bestimmt werden. Zu beachten ist, daß die elementaren Scherungen nicht kommutieren. Die vorstehende Gleichung gilt daher nur, wenn Q xy die zuletzt angewandte Scherung ist. Es gilt insbesondere
Q
−1
= (Q
xy
Q
yz
Q
zx
)
−1
=
Q
−1
Die Dekomposition der Scherungen muß deshalb in der Reihenfolge ihrer Anwendung auf die zu transformierenden Vektoren erfolgen.
Skalierungen. Komponentenweise Skalierung in x-, y- und z-Richtung entspricht einer Multiplikation mit folgender Matrix:
S =
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
3.3. Starre und affine Transformationen 29
Die inverse Matrix zu S ist die Skalierungsmatrix mit den inversen Skalierungsfaktoren:
S −1 =
Rotation und Translation. Die verbleibende Matrix ist das Produkt RX von Rotation und Translation und hat die Form
wobei M eine reine Rotation bezeichnet. Die Rotationswinkel lassen sich hieraus
t x t y t z
durch trigonometrische Umformungen berechnen. Abschließend ist t = der Translationsvektor der urspr¨ unglichen Transformation.
3.3.4 Wahl des Transformationszentrums
Rotation, Skalierung und Scherung erfolgen immer relativ zu einem festen Bezugspunkt. Dieser ist identisch mit dem Fixpunkt der affinen Transformation ohne Translation. Aufgrund der Linearit¨ at der Matrixmultiplikation ist dies zwangsl¨ aufig der Ursprung (0, 0, 0) des Koordinatensystems.
Aus praktischen Erw¨ agungen ist es allerdings h¨ aufig w¨ unschenswert, stattdessen einen anderen Punkt im Raum zu verwenden. Beispielsweise ist es vorteilhaft, zu registrierende Objekte relativ zu ihrem ” Mittelpunkt“ zu transformieren. Dies gilt sowohl
f¨ ur die manuelle Registrierung, als auch f¨ ur die meisten automatischen Verfahren. Die Translationskomponente einer allgemeinen affinen Transformation ist von diesen ¨ Uberlegungen nicht betroffen, denn sie besitzt im allgemeinen keinen Fixpunkt. Aus diesem Grund ist die einheitliche Betrachtung mittels homogener Koordinaten in diesem Kontext ungeeignet.
Stattdessen sei die Transformation nun durch eine Transformationsmatrix M der Gr¨ oße 3 × 3 und einen gesonderten Translationsvektor t beschrieben:
(3.19) x → xM + t.
Soll ein beliebiger Ortsvektor c Fixpunkt der Transformation sein, so kann dies wie folgt erreicht werden: Zun¨ achst wird durch eine Translation −c der gew¨ unschte Fixpunkt in den Ursprung verschoben. Anschließend erfolgt Transformation mit M, gefolgt von einer R¨ uckverschiebung um c und der eigentlichen Translation t. Somit ergibt sich (3.20) x → (x − c) M + c + t.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
30
Von besonderer praktischer Bedeutung ist der ¨
mit Fixpunkt c 0 zu einer ¨ aquivalenten Transformation mit Fixpunkt c 1 . Dazu muß f¨ ur alle zu transformierenden Vektoren x die Bedingung
erf¨ ullt sein. Daraus folgt, daß die neue Transformation eine Translationskomponente
mit ∆c = c 1 − c 0 enthalten muß.
3.3.5 Scherungen und Gantry-Neigung
Computertomographen (CT-Scanner) erlauben das Kippen der gesamten Meßeinrichtung aus R¨ ontgenquellen und Detektoren (Gantry). Diese in Abbildung 3.1 dargestellte sogenannte Gantry-Neigung (engl. “gantry tilt”) kann je nach Scannertyp bis etwa 30 Grad betragen.
Zusammen mit dem Tischvorschub in Richtung der z-Koordinate wird aus der urspr¨ unglich rechtwinkligen Anordnung der axialen Bilddaten (Abb. 3.2a) eine nicht-orthogonale Anordnung (Abb. 3.2b). Dies ist ein fundamentaler Unterschied beispielsweise zur Akquisition nicht-axialer MRT-Daten (Abb. 3.2c), bei denen der gesamte Datenquader einschließlich der z-Achse gekippt wird. In sich bleibt das Koordinatensystem der Bilddaten dabei - anders als bei der CT - jedoch rechtwinklig.
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
3.3. Starre und affine Transformationen
(b) Neigung 20 ◦ (a) Keine Neigung (c) MRT, Schichtwinkel 20 ◦
Abbildung 3.2: Schichtlage ohne (a) und mit (b) Gantry-Neigung sowie bei nicht-axialen MRT (c). Die z-Achse gibt die Aufeinanderfolge der Schichten in aufsteigender Numerierung an.
Aus medizinischer Sicht sprechen zwei Punkte f¨ ur die Akquisition von CT mit gekippter Gantry. Diese werden in Abbildung 3.3 illustriert. Zum einen erlaubt eine schr¨ age Schichtlage bei Untersuchungen des Gehirns, insbesondere im Bereich des Kleinhirns und des Hirnstamms, ein Aussparen der Augen des Patienten. Dadurch sinkt die Strahlenbelastung in diesem Bereich erheblich, was das Risiko einer Eintr¨ ubung der Linse reduziert. Zus¨ atzlich durchlaufen die R¨ ontgenstrahlen w¨ ahrend der Messung weniger kn¨ ocherne Strukturen im Bereich der Sch¨ adelbasis. Dies reduziert Aufh¨ artungsartefakte und steigert so die Bildqualit¨ at. Abbildung 3.4 zeigt den ¨ Ubergang von Bild- zu Volumenkoordinaten bei Neigung
der Scanner-Gantry. Durch die resultierende Scherung bestimmt die y -Koordinate innerhalb der Schicht nicht mehr ausschließlich die y-, sondern auch die z-Raumkoor- dinate.Die genauen Abh¨ angigkeiten bei einem Neigungswinkel α lassen sich leicht aus Abbildung 3.4 ablesen und sind wie folgt:
Hierbei ist z 0 die Basiskoordinate der entsprechenden Aufnahme in Richtung des Tischvorschubs. Die x-Bildkoordinate wird durch die Neigung nicht beeinflußt und geht daher direkt in die x-Volumenkoordinate ¨ uber. Es ergibt sich so die Neigungs-transformation als Matrixmultiplikation
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
32
Abbildung 3.3: Bildlage relativ zum Patienten bei CT-Scannern mit Gantry-Neigung. Gezeigt sind die Positionen axialer (bzw. ann¨ ahernd axialer) Schichten in Relation zu einem sagittalen Schnittbild des Sch¨ adels (Patient in R¨ uckenlage). Links: Schichtf¨ uhrung ohne Neigung, rechts: Schichtf¨ uhrung mit Neigung um α = 15 ◦ .
Diese Matrix stellt offensichtlich keine reine yz-Scherung dar, sondern enth¨ alt einen zus¨ atzlichen Skalierungsfaktor cos α in y-Richtung. Dies erkl¨ art sich dadurch, daß die Neigung keine das Volumen erhaltende Transformation ist. Im Grenzfall zum Tisch paralleler Schichten (α = 90 ◦ ) beispielsweise schrumpft das Volumen der resultierenden Daten auf 0.
Bei ansonsten starrer Registrierung (ggf. mit Skalierungskomponenten) setzt sich nun die gesamte Registrierungstransformation T aus einer starren Komponente und der oben angegebenen Neigungstransformation zusammen:
T = T starr ◦ T tiltα . (3.26)
Entsprechend ist T f¨ ur α = 0 keine starre Transformation mehr, d.h.
α = 0 =⇒ T ∈ R. (3.27)
T. Rohlfing: Multimodale Datenfusion f¨ ur die bildgesteuerte Neurochirurgie und Strahlentherapie TU Berlin, 2000
Quote paper:
Dr.-Ing. Torsten Rohlfing, 2000, Multimodale Datenfusion fuer die bildgesteuerte Neurochirurgie und Strahlentherapie, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Presentations, Models, Tutorials, Instructions
Elaboration, 25 Pages
Betriebskosten in Kindertagesstätten - Effizienzanalyse zur öffentlich...
Organisation and Administration
Diploma Thesis, 107 Pages
Torsten Rohlfing has published the text Multimodale Datenfusion fuer die bildgesteuerte Neurochirurgie und Strahlentherapie
Torsten Rohlfing has uploaded a new text
El enfoque multimodal : una psicoterapia breve pero completa
Arnold A. Lazarus, Jasone Aldekoa Arana
Leitfaden "Interoperable semantische Datenfusion zur automatisierten B...
Miriam Schleipen, Klaus Schick, Thomas Hövelmeyer, Michael Okon, Jiaqiu Wei
Neurochirurgie assistée par l'image, l'information et la connaissance
De la neurochirurgie guidée pa...
Pierre Jannin
Elektrotherapie, Licht- und Strahlentherapie
Grundlagen für Physiotherapeut...
Frank-P. Bossert, Klaus Vogedes
0 comments