Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
Proteinstrukturalignment - Berechnung von Alignments close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

Proteinstrukturalignment - Berechnung von Alignments

Scholary Paper (Seminar), 2005, 13 Pages
Author: Karsten Patzwaldt
Subject: Computer Science - Applied

Details

Event: Proseminar Klassische Algorithmen der Bioinformatik
Institution/College: Humboldt-University of Berlin (Informatik)
Tags: Proteinstrukturalignment, Berechnung, Alignments, Proseminar, Klassische, Algorithmen, Bioinformatik
Category: Scholary Paper (Seminar)
Year: 2005
Pages: 13
Grade: ohne Bewertung
Bibliography: ~ 14  Entries
Language: German
Archive No.: V51445
ISBN (E-book): 978-3-638-47417-7
ISBN (Book): 978-3-638-75155-1
File size: 784 KB
Notes :
lala


Abstract

Als Proteinstrukturalignment bezeichnet man das Finden von Teilketten in 2 oder mehreren Proteinsträngen, deren Tertiärstruktur eine möglichst hohe Übereinstimmung aufweist. Es werden mehrere Algorithmen vorgestellt, um sowohl paarweise als auch multiple Alignments zu berechnen.


Excerpt (computer-generated)

Proteinstrukturalignment

von: Karsten Patzwaldt

 


Inhaltsverzeichnis

1 Einführung 2

2 DALI 3

2.1 Distanzmatrizen 3
2.2 Scorefunktion 4
2.3 Monte-Carlo-Optimierung 4
2.4 Anwendung bei DALI  5

2.4.1 Phase 1 5
2.4.2 Phase 2 6
2.4.3 Phase 3 6

2.5 Fehlerabschätzung 6

3 Proteinstrukturalignment durch inkrementelle kombinatorische Erweiterung des optimalen Pfades 7

3.1 Bestimmung der Seeds 7
3.2 Erweiterung des Alignments 8
3.3 Optimierung der Ergebnisse 8
3.4 Bewertung 8

4 Sekundärstrukturmatching 9

4.1 Graphentheoretischer Ansatz  9
4.2 Verbesserung des Alignments 9
4.3 Bewertung  10

5 Multiples Strukturalignment 10

5.1 Taylor, Flores, Orengo[14] 11
5.2 Haraldsson, Ohlsson[4]  12

6 Auswertung 12

 


 

1 Einführung

Proteine, das heißt Aminosäureketten, sind ein elementarer Grundbaustein aller Zellen. Sie haben im Körper verschiedenste Aufgaben und sind unter anderem in Form von Sturkturproteinen für den Aufbau von Gewebe, in Form von Enzymen für katalytische Funktionen, in Form von Hormonen für Steueraufgaben im Körper oder als Transportprotein wie zum Beispiel beim Hämoglobin für den Transport verschiedenster Substanzen im Körper zuständig. Bei der Untersuchung von Proteinen unterscheidet man zwischen 3 Abstraktionsebenen: der Primärstruktur, der Sekundärstruktur sowie der Tertiärstruktur. Die Primärstruktur ist die einfachste Form, hier wird lediglich die Proteinsequenz betrachtet, die aus der DNA-Sequenz abgeleitet werden kann. Als Sekundärstruktur bezeichnet man die Anordnung der Aminosäuren zu Sekundärstrukturelementen wie der -Helix oder dem -Faltblat. Sie gibt Aufschluss über die die chemische Zusammensetzung eines Proteins, ignoriert allerdings die Anordnung der Aminosäuren im Raum. Als Tertiärstruktur bezeichnet man die räumliche Anordnung, sie gibt also Aufschluss über die tatsächliche Gestalt des Proteins, ist aber naturgemäß auch die komplexeste Darstellungsform. Gelegentlich ist zusätzlich noch von der Quartärstruktur die Rede, dabei betrachtet man Proteinkomplexe, die aus mehreren Proteinen zusammengesetzt sind. Diese werden hier aber nicht weiter behandelt. Abbildung 1 zeigt beispielhaft zwei Tertiärstrukturen in einer 3D-Ansicht.

Abbildung 1: Das Enzym Alkoholdehydrogenase bei einem Menschen (links) und einem Pferd (rechts) [Abbildung in der Downloaddatei vorhanden]

Um die Funktionsweise von Proteinen zu untersuchen ist es oft hilfreich, Gemeinsamkeiten zwischen Proteinen herauszufinden. Nun gibt es zwar eine Vielzahl von effizienten Algorithmen, um Primärstrukturen zu vergleichen, unter anderem BLAST[8] sowie verschiedene Weiterentwicklungen (PSI-BLAST und Gapped BLAST[2], BLAST 2[8] u.a.), allerdings stellte sich heraus, daß die Tertiärstruktur einen weitaus größeren Einfluß auf die Funktion des Proteins hat als die Primärstruktur. Zudem haben Proteine mit ähnlicher Primärstruktur auch ähnliche Tertiärstrukturen, allerdings gilt der Umkehrschluss nicht zwangsläufig, so daß ein Tertiärstrukturvergleich auch Ähnlichkeiten finden kann, die aus der Primärstruktur nicht sofort ersichtlich sind. Abbildung 2 zeigt beispielhaft ein vollständiges Alignment zweier Proteine.

Ziel ist es daher Algorithmen zu finden, die zwei oder mehr Tertiärstrukturen verarbeiten und gemeinsame Teilstrukturen erkennen können. Ich werde im folgenden fünf Algorithmen vorstellen, die dazu verschiedene Strategien verfolgen. Die Beschreibungen der Algorithmen erheben keinen Anspruch auf Vollständigkeit, sondern sollen lediglich einen Überblick über die Funktionsweise und der Effizienz der verschiedenen Algorithmen geben. Für eine ausführliche Beschreibung mit sämtlichen Details sei der interessierte Leser auf die jeweiligen Papers verwiesen.

Abbildung 2: Ein Alignment zwischen zwei Immunoglobulinen[1] [Abbildung in der Downloaddatei vorhanden]

2 DALI

2.1 Distanzmatrizen

DALI[5] ist ein Akronym für Distance matrix ALIgnment. Wie der Name bereits andeutet, basiert der Algorithmus auf dem Vergleich von Distanzmatrizen. Definition 1 Sei P ein Protein, bestehend aus n Aminosäuren mit den Koordinaten (a1, · · · , an). Dann ist D die Distanzmatrix von P, wenn [Formel in der Downloaddatei vorhanden] gilt. Wir betrachten nur eine Koordinate pro Aminosäure, da bei sämtlichen Algorithmen lediglich die C -Atome betrachtet werden. Das sind die Kohlenstoffatome, die das Rückgrat der Aminosäurekette bilden. Eventuelle Nebenäste der Kette können für gewöhnlich ignoriert werden, da sie nur minimalen Einfluss auf die Funktion des Proteins haben.

Die Vorteile bei der Verwendung von Distanzmatrizen liegen auf der Hand. Sie verlegen das Problem auf elegante Weise aus dem dreidimensionalen in den zweidimensionalen Raum, sie erledigen automatisch das Problem, die Strukturen gegeneinander rotieren oder verschieben zu müssen, da sie nur mit relativen Koordinaten arbeiten, enthalten aber trotzdem genügend Informationen, um die dreidimensionale Struktur wieder zu berechnen. Allerdings enthalten sie mehr Informationen als nötig, so daß bei einem Vergleich zweier vollständiger Matrizen viele unnötige Operationen durchgeführt werden würden. Zu Beginn des Algorithmus wird für beide zu vergleichende Proteine jeweils die Distanzmatrix berechnet.

2.2 Scorefunktion

[...]


Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:


This text can be quoted and accessed from this url:

http://www.grin.com/e-book/51445/proteinstrukturalignment-berechnung-von-alignments
please wait Please wait