In dieser Arbeit wurde das Softwareprojekt AUREMOL zur automatischen Auswertung
von multidimensionalen NMR-Spektren entwickelt. Es wurde zum einen die grasche Benutzeroberfläche erstellt, um ein möglichst komfortables
Arbeiten bei der Auswertung zu gewährleisten, zum anderen wurden neue
Methoden zur automatischen Auswertung entwickelt. In AUREMOL wurde ein neuer
molekülorientierter Ansatz implementiert, der darauf basiert, dass unter Verwendung von a priori Wissen und einer möglichst guten Vorhersage der Molekülstruktur NMRParameter vorhergesagt werden, die als Leitfaden bei der Auswertung der experimentellen NMR-Spektren dienen. Dazu wurde die Simulation von NOESY-Spektren verbessert, die in diesem Zusammenhang eine wichtige Rolle spielt. Die Berechnung der Linienbreiten der NOE-Signale und der Ein
uss der Anisotropie der chemischen Verschiebung und der
skalaren Kopplung wurden implementiert. Zwei neue Methoden zur automatischen NOE-Zuordnung bzw. zur Bestimmung fehlender Zuordnungen wurden entwickelt. Der Algorithmus KNOWNOE ermittelt automatisch Proteinstrukturen, falls die sequentielle Zuordnung der Resonanzen bekannt ist. Dabei werden mit Hilfe eines statistischen Verfahrens die Signale der experimentellen 2D- und 3D-NOESY-Spektren automatisch zugeordnet. Die Struktur des Kälteschock-Proteins
TmCsp wurde von KNOWNOE ermittelt. Die Qualität der automatisch bestimmten
Struktur ist von vergleichbarer Qualität wie die manuell bestimmte Struktur, wie die berechneten R-Faktoren zeigen, die in allen Fällen bei etwa 0; 35 liegen. Das zweite Verfahren ermittelt anhand der partiellen sequentiellen Zuordnung und der Strukturinformation fehlende chemische Verschiebungen in den NOESY-Spektren. Dabei wird ein 2-Stufen Optimierungsalgorithmus eingesetzt, der auf einem Vergleich von simulierten und experimentellen NOESY-Spektren beruht. Anders als bei KNOWNOE werden keine Kreuzsignale zugeordnet, sondern fehlende chemische Verschiebungen (Resonanzlinien) bestimmt. Der Algorithmus benötigt im Falle künstlicher Datensätze eine 30%-ige partielle Zuordnung, um mehr als 90% aller chemischen Resonanzlinien zuzuordnen. Die Methode ist robust gegen Rauschen, Artefaktsignale und fehlende Kreuzsignale in den NOESY-Spektren. Ergebnisse mit einem experimentellen 2D-NOESY-Spektrum der HPr Mutante H15A zeigen, dass auch bei realen Datensätzen fehlende chemische Verschiebungen korrekt bestimmt werden können.
Inhaltsverzeichnis
1 Einleitung
1.1 Proteine
1.2 NMR-Spektroskopie
1.3 Automatische Auswertung von NMR-Spektren
1.4 Überblick über die vorliegende Arbeit
2 Theoretische Grundlagen
2.1 Das Konzept von AUREMOL
2.2 Verbesserte Simulation von NOESY-Spektren
2.2.1 NOESY-Spektren
2.2.2 Longitudinale Relaxation mit J-Kopplung und CSA
2.2.3 Transversale Relaxation mit J-Kopplung und CSA
2.2.4 Bewegungsmodelle
2.2.5 Signalaufspaltung aufgrund der J-Kopplung
2.3 NOE-Zuordnungsmethoden
2.3.1 Zuordnung mit Bayes (KNOWNOE)
2.3.1.1 Die allgemeine Strategie von KNOWNOE
2.3.1.2 Der Algorithmus von KNOWNOE
2.3.1.3 Berechnung der wahrscheinlichsten Zuordnung
2.3.1.4 Wahrscheinlichkeitstabellen
2.3.2 Zuordnung durch Vergleich von simulierten und experimentellen Spektren (2-Stufen Algorithmus)
2.3.2.1 Threshold Accepting
2.3.2.2 Der Kernalgorithmus
2.3.2.3 Vorverarbeitung der experimentellen Spektren
2.3.2.4 Variation der Zuordnungen
2.4 R-Werte zur Qualitätsbeurteilung von NMR-Strukturen
2.4.1 Algorithmus von RFAC
2.4.2 R-Faktoren
3 Ergebnisse
3.1 AUREMOL
3.1.1 Allgemeine Vorbemerkungen
3.1.2 Grafik von AUREMOL
3.1.3 Methoden zur Auswertung von NMR-Spektren
3.1.4 Homologie Modelling mit Permol
3.1.5 Automatische Artefaktentfernung in NMR-Spektren
3.2 Datenbank und Datenstruktur von AUREMOL
3.2.1 Globale Datenbank
3.2.2 Interne Datenstruktur
3.2.2.1 Compounddatei
3.2.2.2 Masterliste
3.2.2.3 MasterMasterdatei
3.2.2.4 Metadatei
3.3 Verbesserte Simulation von NOESY-Spektren
3.3.1 Implementierung in AUREMOL
3.3.2 Beispiele für die verbesserte Simulation
3.4 NOE-Zuordnungsmethoden
3.4.1 KNOWNOE
3.4.1.1 Implementierung in AUREMOL
3.4.1.2 Automatische Strukturberechnung von TmCsp
3.4.2 2-Stufen Algorithmus
3.4.2.1 Implementierung in AUREMOL
3.4.2.2 Beispiele mit künstlichen Datensätzen
3.4.2.3 Beispiele mit experimentellen Datensätzen
3.5 Qualitätsbeurteilung von NMR-Strukturen mit R-Werten
3.5.1 Implementierung in AUREMOL
3.5.2 R-Wert Berechnung am Beispiel des HPr
4 Diskussion
4.1 Konzept von AUREMOL
4.2 Automatische NOE-Zuordnung mit KNOWNOE
4.3 Automatische Zuordnung mit 2-Stufen Algorithmus
4.3.1 Zuordnung der künstlich erzeugten 2D- und 3D-NOESY-Spektren
4.3.1.1 Zuordnung im 2D-NOESY-Spektrum
4.3.1.2 Zuordnung im 3D-NOESY-Spektrum
4.3.2 Zuordnung des experimentellen 2D-NOESY-Spektrums
4.3.3 Vergleich mit anderen Verfahren zur automatischen Zuordnung
A Relaxationstheorie
B Kommandos von AUREMOL
Zielsetzung & Themen
Ziel dieser Arbeit ist die Entwicklung des Softwareprojekts AUREMOL, welches den zeitaufwändigen und fehleranfälligen Prozess der automatischen Auswertung multidimensionaler NMR-Spektren für Proteinstrukturbestimmungen automatisieren soll.
- Automatisierung der NMR-Spektrenauswertung
- Entwicklung molekülorientierter "Top-Down"-Strategien zur Strukturvorhersage
- Verbesserte Simulation von NOESY-Spektren unter Berücksichtigung physikalischer Effekte
- Implementierung neuer Algorithmen zur automatischen NOE-Zuordnung (KNOWNOE und 2-Stufen-Optimierung)
- Qualitätsbeurteilung von NMR-Strukturen mittels R-Faktoren
Auszug aus dem Buch
1.1 Proteine
Proteine spielen in biologischen Systemen eine wichtige Rolle. Die Funktion von Proteinen reicht von enzymatischer Katalyse chemischer Reaktionen über Immunabwehr bis hin zur Signaltransduktion [64], [44]. Ähnlich wie die DNA sind Proteine lineare Polymere, aufgebaut aus aneinandergereihten Untereinheiten, den Aminosäuren. Die Sequenz der Aminosäuren, die spezifisch für jedes Protein ist, ist in den Genen codiert.
Das Humangenomprojekt (HGP) ist ein internationales Wissenschaftsprojekt mit dem Ziel, die gesamte menschliche Erbinformation zu entziffern. Zur Zeit sind mehr als 90% des menschlichen Genoms entschlüsselt und es hat sich gezeigt, dass statt der erwarteten 100.000 Gene, das menschliche Genom nur über etwa 30.000 Gene verfügt [6]. Das wären nur doppelt so viele Gene wie bei der Fliege. Allerdings produziert das menschliche Gen im Schnitt drei verschiedene Proteine, während das Fliege nur ein Eiweiß pro Gen produziert. Die vom menschlichen Genom kodierte Gesamtheit der Proteine (Proteom) ist also komplexer als bei einfacheren Organismen. Die Erforschung des Proteoms ist erklärtes Ziel der Human Proteome Organization (HUPO) [51], die bis zum Ende des Jahres 2005 alle menschlichen Proteine und deren Interaktionen bestimmen will. Ein fundamentaler Grundsatz der Molekularbiologie besagt, dass man die räumliche Struktur von Molekülen kennen muss, um deren Funktionen und Wechselwirkungen miteinander verstehen zu können. Die Bestimmung der 3D-Struktur von Proteinen liefert also wichtige Erkenntnisse über deren Funktionen und möglichen Wechselwirkungen.
Zusammenfassung der Kapitel
1 Einleitung: Beschreibt die biologische Relevanz von Proteinen, die Notwendigkeit der 3D-Strukturbestimmung und die Limitationen aktueller experimenteller Methoden.
2 Theoretische Grundlagen: Erläutert das top-down Konzept von AUREMOL, physikalische Modelle zur NOESY-Simulation und mathematische Algorithmen zur automatischen Zuordnung.
3 Ergebnisse: Präsentiert die Software-Implementierung, die Datenstrukturen, Validierungsergebnisse der Algorithmen KNOWNOE und 2-Stufen-Optimierung sowie die R-Wert-Analyse.
4 Diskussion: Bewertet die Leistungsfähigkeit des molekülorientierten Ansatzes im Vergleich zu konventionellen Methoden und identifiziert zukünftige Optimierungspotenziale.
A Relaxationstheorie: Mathematische Herleitung der theoretischen Grundlagen für die Relaxationsraten in NMR-Systemen.
B Kommandos von AUREMOL: Detaillierte Auflistung der verfügbaren Steuerungsbefehle innerhalb der grafischen Benutzeroberfläche.
Schlüsselwörter
AUREMOL, NMR-Spektroskopie, Proteinstrukturbestimmung, NOESY-Spektren, NOE-Zuordnung, KNOWNOE, 2-Stufen-Optimierung, R-Faktoren, Top-Down-Strategie, Relaxationstheorie, Datenstruktur, Automatisierung, Peak-Picking, Molekülorientierter Ansatz, Bio-Physik
Häufig gestellte Fragen
Worum geht es in der Arbeit grundlegend?
Es geht um die Entwicklung des Softwareprojekts AUREMOL, das die manuelle Auswertung von NMR-Spektren bei der Bestimmung von Proteinstrukturen durch automatisierte Prozesse ersetzt.
Welche zentralen Themenfelder werden behandelt?
Die Themen umfassen die physikalische Simulation von NMR-Spektren, verschiedene algorithmische Ansätze zur NOE-Zuordnung sowie die Implementierung einer spezialisierten Datenstruktur für NMR-Daten.
Was ist das primäre Ziel der Forschung?
Das Ziel ist die Automatisierung der NMR-Strukturbestimmung durch einen neuen, molekülorientierten "Top-Down"-Ansatz, um den Zeitaufwand und die Fehleranfälligkeit bei der Datenanalyse zu reduzieren.
Welche wissenschaftlichen Methoden kommen zum Einsatz?
Eingesetzt werden statistische Verfahren wie der Bayes-Algorithmus, Optimierungsverfahren wie "Threshold Accepting" sowie physikalische Relaxationsmatrix-Formalismen.
Was ist der inhaltliche Schwerpunkt im Hauptteil?
Der Hauptteil gliedert sich in die theoretische Konzepterstellung von AUREMOL, die detaillierte Beschreibung der Zuordnungsalgorithmen und die anschließende Ergebnisevaluation durch künstliche und experimentelle Datensätze.
Welche Schlagworte charakterisieren die Arbeit?
Schlüsselbegriffe sind AUREMOL, NMR, NOESY, Automatisierung, KNOWNOE, R-Faktoren und Proteinstruktur.
Was ist das Besondere an dem "Top-Down"-Ansatz von AUREMOL?
Im Gegensatz zu herkömmlichen "Bottom-Up"-Methoden, die nur auf Peaklisten basieren, nutzt AUREMOL a priori Wissen über die Proteinstruktur und molekulare Eigenschaften als Leitfaden für die Auswertung.
Wie verifiziert AUREMOL die Qualität der erzielten Proteinstrukturen?
Dies geschieht durch die Implementierung von R-Faktoren (ähnlich wie in der Röntgenstrukturanalyse), welche die Übereinstimmung zwischen experimentellen Daten und simulierten Modellen quantifizierbar machen.
- Quote paper
- Dr Bernhard Ganslmeier (Author), 2002, AUREMOL - Softwareprojekt zur automatischen Auswertung von multidimensionalen NMR-Spektren, Munich, GRIN Verlag, https://www.grin.com/document/112505