Please wait
Please install the Adobe Flash Player if no e-book is displayed.
Scholary Paper (Seminar), 2005, 13 Pages
Author: Karsten Patzwaldt
Subject: Computer Science - Applied
Details
Institution/College: Humboldt-University of Berlin (Informatik)
Tags: Proteinstrukturalignment, Berechnung, Alignments, Proseminar, Klassische, Algorithmen, Bioinformatik
Year: 2005
Pages: 13
Grade: ohne Bewertung
Bibliography: ~ 14 Entries
Language: German
ISBN (E-book): 978-3-638-47417-7
ISBN (Book): 978-3-638-75155-1
File size: 784 KB
lala
Other users also were interested in the following titles:
Abstract
Als Proteinstrukturalignment bezeichnet man das Finden von Teilketten in 2 oder mehreren Proteinsträngen, deren Tertiärstruktur eine möglichst hohe Übereinstimmung aufweist. Es werden mehrere Algorithmen vorgestellt, um sowohl paarweise als auch multiple Alignments zu berechnen.
Excerpt (computer-generated)
Proteinstrukturalignment
von: Karsten Patzwaldt
Inhaltsverzeichnis
1 Einführung 2
2 DALI 3
2.1 Distanzmatrizen 3
2.2 Scorefunktion 4
2.3 Monte-Carlo-Optimierung 4
2.4 Anwendung bei DALI 5
2.4.1 Phase 1 5
2.4.2 Phase 2 6
2.4.3 Phase 3 6
2.5 Fehlerabschätzung 6
3 Proteinstrukturalignment durch inkrementelle kombinatorische Erweiterung des optimalen Pfades 7
3.1 Bestimmung der Seeds 7
3.2 Erweiterung des Alignments 8
3.3 Optimierung der Ergebnisse 8
3.4 Bewertung 8
4 Sekundärstrukturmatching 9
4.1 Graphentheoretischer Ansatz 9
4.2 Verbesserung des Alignments 9
4.3 Bewertung 10
5 Multiples Strukturalignment 10
5.1 Taylor, Flores, Orengo[14] 11
5.2 Haraldsson, Ohlsson[4] 12
6 Auswertung 12
1 Einführung
Proteine, das heißt Aminosäureketten, sind ein elementarer Grundbaustein aller Zellen. Sie haben im Körper verschiedenste Aufgaben und sind unter anderem in Form von Sturkturproteinen für den Aufbau von Gewebe, in Form von Enzymen für katalytische Funktionen, in Form von Hormonen für Steueraufgaben im Körper oder als Transportprotein wie zum Beispiel beim Hämoglobin für den Transport verschiedenster Substanzen im Körper zuständig. Bei der Untersuchung von Proteinen unterscheidet man zwischen 3 Abstraktionsebenen: der Primärstruktur, der Sekundärstruktur sowie der Tertiärstruktur. Die Primärstruktur ist die einfachste Form, hier wird lediglich die Proteinsequenz betrachtet, die aus der DNA-Sequenz abgeleitet werden kann. Als Sekundärstruktur bezeichnet man die Anordnung der Aminosäuren zu Sekundärstrukturelementen wie der -Helix oder dem -Faltblat. Sie gibt Aufschluss über die die chemische Zusammensetzung eines Proteins, ignoriert allerdings die Anordnung der Aminosäuren im Raum. Als Tertiärstruktur bezeichnet man die räumliche Anordnung, sie gibt also Aufschluss über die tatsächliche Gestalt des Proteins, ist aber naturgemäß auch die komplexeste Darstellungsform. Gelegentlich ist zusätzlich noch von der Quartärstruktur die Rede, dabei betrachtet man Proteinkomplexe, die aus mehreren Proteinen zusammengesetzt sind. Diese werden hier aber nicht weiter behandelt. Abbildung 1 zeigt beispielhaft zwei Tertiärstrukturen in einer 3D-Ansicht.
Abbildung 1: Das Enzym Alkoholdehydrogenase bei einem Menschen (links) und einem Pferd (rechts) [Abbildung in der Downloaddatei vorhanden]
Um die Funktionsweise von Proteinen zu untersuchen ist es oft hilfreich, Gemeinsamkeiten zwischen Proteinen herauszufinden. Nun gibt es zwar eine Vielzahl von effizienten Algorithmen, um Primärstrukturen zu vergleichen, unter anderem BLAST[8] sowie verschiedene Weiterentwicklungen (PSI-BLAST und Gapped BLAST[2], BLAST 2[8] u.a.), allerdings stellte sich heraus, daß die Tertiärstruktur einen weitaus größeren Einfluß auf die Funktion des Proteins hat als die Primärstruktur. Zudem haben Proteine mit ähnlicher Primärstruktur auch ähnliche Tertiärstrukturen, allerdings gilt der Umkehrschluss nicht zwangsläufig, so daß ein Tertiärstrukturvergleich auch Ähnlichkeiten finden kann, die aus der Primärstruktur nicht sofort ersichtlich sind. Abbildung 2 zeigt beispielhaft ein vollständiges Alignment zweier Proteine.
Ziel ist es daher Algorithmen zu finden, die zwei oder mehr Tertiärstrukturen verarbeiten und gemeinsame Teilstrukturen erkennen können. Ich werde im folgenden fünf Algorithmen vorstellen, die dazu verschiedene Strategien verfolgen. Die Beschreibungen der Algorithmen erheben keinen Anspruch auf Vollständigkeit, sondern sollen lediglich einen Überblick über die Funktionsweise und der Effizienz der verschiedenen Algorithmen geben. Für eine ausführliche Beschreibung mit sämtlichen Details sei der interessierte Leser auf die jeweiligen Papers verwiesen.
Abbildung 2: Ein Alignment zwischen zwei Immunoglobulinen[1] [Abbildung in der Downloaddatei vorhanden]
2 DALI
2.1 Distanzmatrizen
DALI[5] ist ein Akronym für Distance matrix ALIgnment. Wie der Name bereits andeutet, basiert der Algorithmus auf dem Vergleich von Distanzmatrizen. Definition 1 Sei P ein Protein, bestehend aus n Aminosäuren mit den Koordinaten (a1, · · · , an). Dann ist D die Distanzmatrix von P, wenn [Formel in der Downloaddatei vorhanden] gilt. Wir betrachten nur eine Koordinate pro Aminosäure, da bei sämtlichen Algorithmen lediglich die C -Atome betrachtet werden. Das sind die Kohlenstoffatome, die das Rückgrat der Aminosäurekette bilden. Eventuelle Nebenäste der Kette können für gewöhnlich ignoriert werden, da sie nur minimalen Einfluss auf die Funktion des Proteins haben.
Die Vorteile bei der Verwendung von Distanzmatrizen liegen auf der Hand. Sie verlegen das Problem auf elegante Weise aus dem dreidimensionalen in den zweidimensionalen Raum, sie erledigen automatisch das Problem, die Strukturen gegeneinander rotieren oder verschieben zu müssen, da sie nur mit relativen Koordinaten arbeiten, enthalten aber trotzdem genügend Informationen, um die dreidimensionale Struktur wieder zu berechnen. Allerdings enthalten sie mehr Informationen als nötig, so daß bei einem Vergleich zweier vollständiger Matrizen viele unnötige Operationen durchgeführt werden würden. Zu Beginn des Algorithmus wird für beide zu vergleichende Proteine jeweils die Distanzmatrix berechnet.
2.2 Scorefunktion
[...]
Comments
No comments yet
Other users also were interested in the following titles:
Jugendliche und Internet-Communities / Chats
Author: M.A. Patrick HammerCommunications: Multimedia, Internet, New Technologies, 2001 Download as PDF-file for 17,99 EUR
Massenmedien und Gewalt
Author: Patrick HammerCommunications: Mass Media, 1997 Download as PDF-file for 4,99 EUR
Finanzierung von Online-Zeitschriften - Wege zu einem erfolgreichen Web-Engagement für Tageszeitungen
Author: Patrick HammerCommunications: Public Relations, Advertising, Marketing, 2000 Download as PDF-file for 4,99 EUR
Der Kinder-Angst-Test KAT II - Testerläuterungen und Auswertung einer Befragung
Author: Matthias EndlichPedagogy - Pedagogic Psychology, 2003 Download as PDF-file for 7,99 EUR
The test of Sir Gawain's chivalry
Author: Gayane PiliposyanEnglish Language and Literature Studies - Literature, 2007 Download as PDF-file for 1,99 EUR
Entwicklung und Erprobung eines lernzielorientierten Leistungstests 'Grundwissen Energie'
Author: Cornelia MüellerPsychology - Learning Psychology, Intelligence Research, 2004
Berichterstattung nach den Terroranschlägen vom 11. September - Ethik und Funktionen des Journalismus auf dem Prüfstand
Author: Patrick HammerCommunications: Ethics in the Media, 2001 Download as PDF-file for 4,99 EUR
Relationship Marketing im Internet
Author: Steffen BusseEconomics / Business: Marketing, Corporate Communication, CRM, Market Research, 1999 Download as PDF-file for 29,90 EUR
This text can be quoted and accessed from this url: