Die automatisierten Vergleiche von Proteinbindestellen haben sich zu einem wichtigen Element des computergestützten Drug design entwickelt, um etwa mögliche Nebenwirkungen schon in einer frühen Entwicklungsphase detektieren zu können. Das Ziel dieser Arbeit ist es, Bindetaschenvergleiche der Datenbank "Relibase" zu optimieren. Die Repräsentationen der Bindestellen, die als Eingaben für die Vergleichsalgorithmen dienen, werden dafür in Bezug auf ihre physikochemischen Eigenschaften unschärfer erfasst. Dadurch sollen abstrakte Taschenvergleiche gelingen, die weitreichendere Strukturähnlichkeiten zwischen Bindetaschen erkennen können, als es bisher möglich war. Außerdem wird die räumliche Struktur (Konvexität bzw. Konkavität) einzelner Oberflächenbereiche in die Vergleiche miteinbezogen. Die dreidimensionale Form von Bindetaschenregionen wurde bislang noch nicht von den Vergleichsalgorithmen bewertet, sondern nur durch eine nachträgliche Filterung der Ergebnisse berücksichtigt. Es soll deshalb untersucht werden, ob sich die Ergebnisse durch diese Erweiterungen der Vergleichsalgorithmen verbessern lassen.
Inhaltsverzeichnis
1 Einleitung
1.1 Pharmazeutische Wirkstoffentwicklung
1.1.1 Physiologische Funktion der Wirkstoffe
1.1.2 Rezeptor- und ligandenbasierte Wirkstoffentwicklung
1.2 Grenzen der Berechenbarkeit
1.3 Biomolekulare Datenbanken
1.4 Ziel dieser Arbeit
2 Relibase und Cavbase
2.1 Relibase
2.2 Mangelnde Selektivität und Nebenwirkungen
2.2.1 Früherkennung mangelnder Selektivitäten
2.3 Funktionsweise von Cavbase
2.3.1 Algorithmisches Vorgehen
2.3.2 Modellierung der Bindetaschen durch Pseudozentren
3 Vergleichsstrategien
3.1 Vergleichsalgorithmen für putative Proteinbindestellen
3.2 Graph-Alignment via GreedyMatch
4 Erweiterungen der Bindestellenrepräsentation
4.1 Der „Patch“-Begriff
4.2 Multiple Eigenschaften
4.2.1 Berechnung eines Patchvektors
4.3 Oberflächenschwerpunkt
4.4 Oberflächenbeschaffenheit
4.4.1 Bestimmung der Oberflächenbeschaffenheit durch das Pseudozentrum und den Patch-Schwerpunkt
4.4.2 Hauptkomponentenanalyse
4.4.3 Durchführung einer wPCA
4.4.3.1 Kovarianzmatrix
4.4.3.2 Transformation der Ausgangsdaten
4.4.4 Bestimmung der Oberflächencharakteristik
4.5 Zusammenfassung
5 Ergebnisse
5.1 Auswertung der heuristischen Methode
5.2 Gewichtete Hauptkomponentenanalyse (wPCA)
5.2.1 Testdatensatz
5.2.2 Leave-One-Out-Kreuzvalidierung
5.2.3 Durchführung der Validierung
5.2.4 Ergebnisse
5.2.4.1 Alternative Bindestellenrepräsentation und neue Parametrisierung der Patchvergleiche
5.2.4.2 Berücksichtigung der Krümmungsintensität
5.2.4.3 Alternative Scoringfunktion und neuer Vektorvergleich
6 Diskussion
6.1 Patchvektoren
6.2 Scoringfunktion und Vergleich der Patchvektoren
6.3 Oberflächenschwerpunkt
6.4 Oberflächenform
7 Ausblick
7.1 Revalidierung der Bindetaschenatome
7.2 Patchvektoren
7.3 Oberflächenform
7.3.1 Lokale Konvexitäts- und Konkavitätsscores
7.3.2 Anpassung des Parameters δ
7.4 Implementierung in anderen Vergleichsverfahren
A
A.1 Parser für Cavbase-Dateien
A.1.1 Pseudozentren
A.1.2 Oberflächenpunkte
A.2 Anpassungen von Java-Klassen
A.2.1 Coords.java
A.2.2 ProductGraph.java
A.2.3 ClassicEvaluation.java
Zielsetzung und Themen der Arbeit
Das Hauptziel dieser Arbeit besteht in der algorithmischen Optimierung der Bindetaschenvergleiche des Cavbase-Moduls. Hierbei sollen die Repräsentationen der Bindestellen, die als Eingabe für die Vergleichsalgorithmen dienen, durch eine unschärfere Erfassung ihrer physikochemischen Eigenschaften verbessert werden, um weitreichendere Strukturähnlichkeiten zwischen Bindetaschen zu identifizieren.
- Erweiterung der Bindestellenrepräsentation durch 6-dimensionale Patchvektoren.
- Einbeziehung der räumlichen Oberflächenstruktur (Konvexität/Konkavität) in den Vergleich.
- Nutzung der gewichteten Hauptkomponentenanalyse (wPCA) zur Bestimmung der Oberflächenbeschaffenheit.
- Algorithmische Implementierung und Validierung mittels Leave-One-Out-Kreuzvalidierung auf einem Testdatensatz.
- Analyse des Einflusses der Krümmungsintensität auf die Klassifizierungsgüte.
Auszug aus dem Buch
1.4 Ziel dieser Arbeit
Neben weiteren biomolekularen Datenbanken wurde auch ein System namens Relibase (Hendlich et al., 2003) geschaffen. Relibase wurde speziell für die Analyse von Protein-Ligand-Komplexen entwickelt. Mit diesem System können sowohl Sequenzmuster in Proteinen gesucht als auch Konnektivitäten der gebundenen niedermolekularen Liganden verglichen werden. Die Datenbank nimmt automatisch eine Überlagerung von Proteinen vor, wobei sie sich um eine optimale Überlagerung der Bindetaschen bemüht. So ausgerichtete Strukturen lassen sich systematisch dahingehend auswerten, welche Aminosäuren in die Wechselwirkungen mit Liganden einbezogen sind, welche funktionellen Gruppen die Liganden verwenden, um mit den Aminosäuren des Proteins zu interagieren, welche Reste in der Bindetasche immer wieder in identischer Geometrie vorliegen und vieles mehr (Klebe, 2009).
Ein in die Datenbank Relibase implementiertes Suchprogramm namens Cavbase ermöglicht darüber hinaus Vergleiche von putativen Bindetaschen der enthaltenen Proteine. Auf diese Weise sollen mögliche Kreuzreaktivitäten von neuen Wirkstoffen erkannt werden und Vorschläge für einen denkbaren isosteren Ersatz bei der strukturbasierten Optimierung erster Leitstrukturen vermittelt werden können. Darüber hinaus kann durch diese Vergleiche eine Klassifikation von Rezeptorstrukturen erreicht werden.
Ziel der vorliegenden Arbeit ist es, diese Bindetaschenvergleiche des Cavbase-Moduls zu optimieren. Die Repräsentationen der Bindestellen, die als Eingaben für die Vergleichsalgorithmen dienen, werden dafür in Bezug auf ihre physikochemischen Eigenschaften unschärfer erfasst. Dadurch sollen abstrakte Taschenvergleiche gelingen, die weitreichendere Strukturähnlichkeiten zwischen Bindetaschen erkennen können, als es bisher möglich war.
Zusammenfassung der Kapitel
1 Einleitung: Beschreibt die Grundlagen der pharmazeutischen Wirkstoffentwicklung, die Herausforderungen der Berechenbarkeit molekularer Systeme und definiert das Ziel der Arbeit, Bindetaschenvergleiche durch unschärfere Repräsentationen zu optimieren.
2 Relibase und Cavbase: Führt in das Datenbanksystem Relibase und dessen Modul Cavbase ein, welches der Detektion von putativen Bindetaschen mittels des LIGSITE-Algorithmus dient.
3 Vergleichsstrategien: Erläutert die Transformation von Proteinbindestellen in Graphen und die Anwendung von Algorithmen wie GreedyMatch für das paarweise Graph-Alignment.
4 Erweiterungen der Bindestellenrepräsentation: Beschreibt die zentrale methodische Weiterentwicklung durch Einführung von Patchvektoren, Oberflächenschwerpunkten und der Bestimmung der Oberflächenbeschaffenheit mittels gewichteter Hauptkomponentenanalyse (wPCA).
5 Ergebnisse: Dokumentiert die Validierung der neuen Methoden anhand eines Testdatensatzes, analysiert verschiedene Parametereinstellungen und bewertet die Auswirkungen der Erweiterungen auf die Klassifikationsgenauigkeit.
6 Diskussion: Reflektiert die erzielten Ergebnisse, diskutiert den Nutzen der verschiedenen Ansätze und interpretiert, warum bestimmte Parametrisierungen erfolgreich waren oder sich als weniger vorteilhaft erwiesen.
7 Ausblick: Identifiziert potenzielle zukünftige Forschungsansätze, wie die Revalidierung von Bindetaschenatomen und die Verfeinerung der Parameter zur Bestimmung der Oberflächenform.
A: Liefert technische Details zur Implementierung, insbesondere zur Parser-Entwicklung und den notwendigen Anpassungen an Java-Klassen für das Graph-Alignment.
Schlüsselwörter
Wirkstoffdesign, Proteinbindestellen, Cavbase, Relibase, Graph-Alignment, GreedyMatch, Patchvektor, Hauptkomponentenanalyse, wPCA, Oberflächenbeschaffenheit, Konvexität, Konkavität, Kreuzvalidierung, Bioinformatics, Ligand.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der computergestützten Optimierung von Methoden zum strukturellen Vergleich von Proteinbindestellen, um effizientere Ansätze für das Wirkstoffdesign zu entwickeln.
Was sind die zentralen Themenfelder der Arbeit?
Die zentralen Felder sind Bioinformatik, Wirkstoffdesign, Graphentheorie und Statistik, speziell angewendet auf die Repräsentation und den Vergleich von 3D-Strukturen in biologischen Datenbanken.
Was ist das primäre Ziel der Untersuchung?
Das primäre Ziel ist die Verbesserung der Vergleichsalgorithmen von Bindetaschen innerhalb des Cavbase-Moduls durch eine präzisere und gleichzeitig "unschärfere" Repräsentation physikochemischer Eigenschaften sowie die Einbeziehung der Oberflächenform.
Welche wissenschaftlichen Methoden wurden verwendet?
Es wurden gitterbasierte Detektionsalgorithmen (LIGSITE), graphbasierte Vergleichsstrategien (GreedyMatch), die gewichtete Hauptkomponentenanalyse (wPCA) und statistische Validierungsverfahren (Leave-One-Out) eingesetzt.
Was wird im Hauptteil behandelt?
Der Hauptteil behandelt die Erweiterung der Bindestellenrepräsentation durch mehrdimensionale Patchvektoren und die mathematische Modellierung der Oberflächenkrümmung, gefolgt von einer detaillierten Auswertung der verschiedenen experimentellen Konfigurationen.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit lässt sich durch Begriffe wie Wirkstoffdesign, Proteinbindestellen, Graph-Alignment, wPCA und Patch-Repräsentation charakterisieren.
Warum ist die Unterscheidung von Konvexität und Konkavität bei Bindetaschen wichtig?
Die dreidimensionale Form einer Bindetasche bestimmt maßgeblich, welche Liganden interagieren können; eine präzise Klassifizierung der Oberflächenstruktur ermöglicht daher eine bessere Vorhersage der Bindungseigenschaften.
Warum wurden für die Validierung "unschärfere" Kriterien in den Vergleich integriert?
Da der "flexible fit" dazu führt, dass sich Moleküle bei der Bindung anpassen, erzwingt ein zu starrer Vergleich oft keine optimalen Ergebnisse. Unschärfere Methoden erlauben es, trotz unterschiedlicher Konformationen funktionell ähnliche Bindetaschen zu erkennen.
Welche Rolle spielt die wPCA in der Arbeit?
Die gewichtete Hauptkomponentenanalyse (wPCA) dient dazu, die Oberflächenpunkte einer Bindetasche in ein lokales Koordinatensystem zu überführen, um basierend darauf ein robustes Maß für die lokale Oberflächenkrümmung zu gewinnen.
- Citar trabajo
- Timo Krotzky (Autor), 2010, Analyse und algorithmische Erweiterung von Methoden zum strukturellen Vergleich von Proteinbindestellen, Múnich, GRIN Verlag, https://www.grin.com/document/174236