Vorhersage von RNA-Sekudärstrukturen


Exposé Écrit pour un Séminaire / Cours, 2004

14 Pages, Note: 2.0


Extrait


Inhalt

Abbildungsverzeichnis

1. Einleitung

2. RNA – Sekundärstruktur
2.1 Grundlegende Eigenschaften
2.2 Schleifenstrukturen

3. genetische Algorithmen
3.1 Allgemeine Charakteristika genetischer Algorithmen
3.2 Suchmethoden
3.3 Funktionsweise eines genetischen Algorithmus

4. Vorhersage der RNA-Sekundärstruktur durch Energieminimierung
4.1 Grundkonzept
4.2 Stacking Interaktionen

5. Zusammenfassung

Literaturverzeichnis

WWW Ressourcen

Abbildungsverzeichnis

Abbildung 1: Definition von RNA-Sequenzen

Abbildung 2: Kleeblattstruktur der tRNA

Abbildung 3: Definition von Sekundärstruktur

Abbildung 4: Definition einer Schleife

Abbildung 5: Beispiel zugängliche Base

Abbildung 6: Beispiel genetischer Algorithmus

Abbildung 7: Graycode

Abbildung 8: Definition der freien Energie

Abbildung 9: Beispiel der freien Energie

1. Einleitung

Diese Seminararbeit befasst sich mit dem Thema „Vorhersage von RNA – Sekundärstrukturen“. Wie aus dem Titel der Arbeit zu entnehmen ist, liegt der Schwerpunkt auf der Vorhersage der räumlichen Struktur von RNA. Für die Vorhersage bietet die Primärstruktur der RNA unzureichende Informationen, da Moleküle stets das Bestreben aufweisen energetisch günstige Positionen einnehmen zu wollen, welches maßgeblich von der Sekundärstruktur bestimmt wird. Die räumliche Anordnung der RNA, die auf Wechselwirkungen zwischen den Bindungen beruht, wird als Sekundärstruktur bezeichnet.

Im ersten Kapitel wird die RNA-Sekundärstruktur erörtert und dient als Einführung in das Thema. Im Rahmen dieses Kapitels werden alle relevanten Begriffe wie beispielsweise komplementäre Basen, Kleeblattform, Wasserstoffbrückenbindungen und sämtliche Schleifenstrukturen vorgestellt. Anhand eines kleinen Beispieles werden die eingeführten Definitionen verdeutlicht. Zusätzlich wird noch kurz das Thema der Pseudoknoten angeführt. Zwar existieren Pseudoknoten real, jedoch spielen sie für die Sekundärstruktur keine Rolle und sind im Konzept der Energieminimierung nicht darstellbar.

Anschließend wird das Themengebiet der genetischen Algorithmen betrachtet. Nach Einführung wichtiger Grundbegriffe, Eigenschaften und Definitionen wird dargelegt, warum genetische Algorithmen sich als Suchmethoden besser eignen als Methoden der dynamischen Programmierung bzw. analytische Lösungsstrategien. Dazu bedarf es einer prägnanten Gegenüberstellung der drei verschiedenen Suchmethoden, wobei besonders Wert auf die Vor- und Nachteile gelegt wird. Besonders der Aspekt der Robustheit, welcher ein wichtiges Kriterium für die Qualität einer Suchmethode ist, wird bei jedem Verfahren betrachtet.

Im letzten Abschnitt der Seminararbeit wird ein konkretes Modell zur Vorhersage der RNA-Sekundärstruktur untersucht. Es handelt sich um das Konzept der Energieminimierung, dessen Grundidee auf dynamischer Programmierung beruht. Hierbei wird angenommen, dass die freie Energie der Sekundärstruktur ausschließlich von den Energiebeträgen der Basenpaarungen abhängt, so dass ein iterativer Algorithmus aus Strukturen kürzerer Sequenzen als Gesamtlösung eine Sekundärstruktur minimaler Energie bestimmt. Das Konzept wird in der notwendigen Tiefe vorgestellt, so dass alle Vor– und Nachteile ersichtlich werden.

2. RNA – Sekundärstruktur

In diesem Kapitel sollen alle wesentlichen Eigenschaften der RNA erarbeitet werden. Dazu gehören der grundsätzliche Aufbau der RNA, wann sie entsteht, welches ihre Funktionen sind und ihre Unterschiede hinsichtlich Funktion und Aufbau zur DNA. Es ist weiterhin von Bedeutung auf die Schleifenstrukturen einzugehen, da die Fähigkeit der RNA Schleifen bilden zu können erhebliche strukturelle und genetische Konsequenzen hat.

2.1 Grundlegende Eigenschaften

Die natürlich vorkommenden RNA-Arten einer Zelle können als unterschiedlich lange, unverzweigte und einzelsträngige Ketten von Ribonukleotiden angesehen werden, jedoch neigen sie zur Ausbildung von Doppelstrangformen, wenn innerhalb der RNA-Kette komplementäre Abschnitte zu finden sind [Kni01].

Ein Ribonukleotid besteht aus dem Zucker Ribose, den vier Basen Adenin (A), Guanin (G), Cytosin (C) und Uracil (U) und Phosphorsäure. Eine Kette von Ribonukleotiden ergibt eine Polynukleotidkette und damit eine RNA-Sequenz [Les03]. Die zueinander komplementären Basen Cytosin und Guanin bzw. Adenin und Uracil bilden durch Wasserstoffbrückenbindungen (im ersten Fall 2 im zweiten Fall 3 Bindungen) miteinander die Watson-Crick Basenpaare [1].

Für die Notation von RNA-Sequenzen bedarf es folgender formaler Definition aus der hervorgeht, dass eine RNA-Sequenz aus vier verschiedenen Basen (A,C,G,U) bestehen kann und diese auch als Teilsequenzen vorkommen können [Kni01]:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Definition von RNA-Sequenzen

DNA und RNA weisen untereinander Struktur- und Funktionsunterschiede auf [2]. Ein erster Unterschied besteht im enthaltenen Zucker. In der DNS (Desoxyribonukleinsäure) wird Desoxyribose verwendet, in der RNS (Ribonukleinsäure) hingegen Ribose. Ein zweiter Unterschied in der Struktur ist, dass in der DNA die Basen Adenin, Cytosin, Guanin und Thymin verwendet werden. Die RNA stimmt mit der DNA in den ersten drei Basen überein, jedoch enthält es als vierte Base Uracil. Der dritte Strukturunterschied ist der, dass DNA aus zwei komplementären Strängen besteht, die sich umeinander winden (Doppelhelix). Die natürlich vorkommenden RNA-Arten einer Zelle können als unterschiedlich lange, unverzweigte und einzelsträngige Ketten von Ribonukleotiden angesehen werden. Darüber hinaus kann RNA als Doppelstrang vorkommen, sofern innerhalb der RNA-Kette komplementäre Abschnitte vorhanden sind [Kni01].

Hinsichtlich der Funktionsunterschiede ist festzustellen, dass DNA die Erbinformationen trägt. Die Funktion der RNA ergibt sich aus der Form in der sie gerade vorkommt. Tritt sie als mRNA (messenger RNA) auf, so hat sie die Aufgabe, die abgelesenen DNA-Informationen zu den Ribosomen zu tragen. Im Zellkern wird mRNA immer dann hergestellt, wenn die Informationen der Gene zur Herstellung von Enzymen oder Proteinen benötigt werden. Dagegen hat die tRNA (transfer-RNA) die Aufgabe den Transport der Aminosäuren zum Proteinsyntheseapparat zu gewährleisten. Die rRNA (ribosomale RNA) stellt Struktur- und Funktionselemente von Ribosomen dar.

Realistisch betrachtet bestimmt die Primärstruktur nicht allein die räumliche Anordnung der RNA. Die Anordnung wird maßgeblich durch die Wechselwirkungen der Bindungen bestimmt. Daraus ergibt sich die charakteristische Sekundärstruktur [MW03].

Bei der tRNA bildet sich eine typische Kleeblattform, die im Folgenden näher betrachtet werden soll und in Abbildung 2 dargestellt ist [7].

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: Kleeblattstruktur der tRNA

Charakteristisch an der Kleeblattstruktur ist, dass am 3‘-Ende stets die Folge CCA zu finden ist, die als Akzeptor für die Aminosäure fungiert. Die linksgelegene D-Schleife enthält das Dihydrouracil. Sowohl der Stamm als auch die Schleife sind von variabler Länge. Die rechtsgelegene T-Schleife enthält immer die Sequenz Thymin, Pseudouracil und Cytosin, wobei der Stamm immer 5 Basenpaare aufweist und die Schleife 7 Nukleotide. Das Anticodon tritt mit dem Codon (den komplementären Teil der mRNA) in Verbindung. Zwischen der Anticodon-Schleife und der T-Schleife befindet sich eine weitere Schleife, deren Größe variabel ist [Kni01].

Es ist weiterhin eine formale Definition der Sekundärstruktur notwendig [Kni01]:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3: Definition von Sekundärstruktur

Aus dieser Definition geht hervor, dass stets zwei Basen ein Paar bilden. Eine Menge S von diesen Paaren bildet die Sekundärstruktur. Durch die Bedingung i < j ist ausgeschlossen, dass eine Base zu sich selbst eine Bindung eingeht. Da i gleich 1 und j gleich n sein kann, ist es nicht ausgeschlossen, dass die erste und letzte Base einer Sequenz gemeinsam ein Paar bilden können. Eine Einschränkung ist durch die Bedingung j – i > 4 gegeben, wodurch keine zu starken Verbiegungen innerhalb der Sekundärstruktur auftreten dürfen.

Die Definition verlangt weiterhin, dass in der Sekundärstruktur Pseudoknoten ausgeschlossen sind. Pseudoknoten sind real existierende Knoten, jedoch spielen sie für die Sekundärstruktur keine Rolle. Dagegen sind sie für die Tertiärstruktur bedeutsame Knoten. Hinsichtlich des Konzeptes der Energieminimierung ist es eine notwendige Bedingung Pseudoknoten auszuschließen. Das Konzept der Energieminimierung beruht auf dynamischer Programmierung und diese kann Pseudoknoten in ihrem Algorithmus nicht integrieren [MW03].

2.2 Schleifenstrukturen

Hinsichtlich der Sekundärstruktur spielen neben helikalen Strukturen vier Schleifenarten eine zentrale Rolle [4].

1. Hairpin Loops sind Schleifen, die von ungepaarten Basen geprägt sind, so dass eine Haarnadelform entsteht.
2. Bulges entsprechen Ausbuchtungen, bei denen sich die RNA-Helix auf einer Seite öffnet. Entsprechend hat ein Bulge ungepaarter Basen in der Sequenz, an dessen beiden Rändern sich Basen befinden, die mit zueinander benachbarten Basen gepaart sind.
3. Internal Loops entsprechen internen Schleifen, bei denen sich die Helix auf beiden Seiten öffnet.
4. Multiple Loops sind als Verzweigungsstellen in der RNA-Sekundärstruktur zu betrachten.

Eine Helix besteht aus beliebig vielen aufeinander folgenden Nukleotiden. Betrachtet man die RNA-Sekundärstruktur als eine Menge von Schleifen, so sind folgende Definitionen notwendig [Kni01].

Abbildung in dieser Leseprobe nicht enthalten

Abb. 4: Definition einer Schleife

Aus der Definition geht hervor, dass die Größe einer Schleife sich aus der Anzahl der beteiligten Paare ergibt. Daraus ergibt sich, dass hintereinander liegende Basenpaare eine helikale Region bilden. Schleifen der Größe 0 wirken destabilisierend, da sie unzugängliche Basen enthalten, die als freie Basen bezeichnet werden. Um den Begriff der Zugänglichkeit zu klären, soll die folgende Abbildung weiterhelfen. Es handelt sich um einen Ausschnitt aus der oben vorgestellten tRNA. Zu sehen ist die D-Schleife, wobei die Basen durchnummeriert sind, wobei die ersten beiden und letzten beiden Basen mit einem Index versehen sind.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 5: Beispiel zugängliche Base

Angenommen die Basen 1 und 10 bilden im linken Bild ein Basenpaar. Es gilt (r1 , r10) Î S. Ferner soll die Base r5 betrachtet werden. Da kein anderes Basenpaar existiert, dass die Bedingung 1 < u < 5 < w <10 erfüllt, so gilt r5 als zugänglich für (r1 , r10). Im rechten Bild herrscht die umgekehrte Situation. Angenommen die Basen 1 und 12 bilden ein Basenpaar, so gilt (r1 , r12) Î S. Betrachtungsgegenstand bleibt weiterhin r5. In diesem Fall existiert ein Paar (r2 , r11), dass die Bedingung 1 < 2 < 5 < 11 <12 erfüllt. Somit gilt die Base r5 für das Basenpaar (r1 , r12) als nicht zugänglich.

3. genetische Algorithmen

In diesem Kapitel wird es eine kurze Einführung über die wesentlichen Eigenschaften genetischer Algorithmen geben. Danach wird dargestellt, inwiefern genetische Algorithmen sich als Suchmethoden besonders gut eignen und was ihre Robustheit ausmacht. Abschließend wird die Funktionsweise genetischer Algorithmen detailliert erörtert.

[...]

Fin de l'extrait de 14 pages

Résumé des informations

Titre
Vorhersage von RNA-Sekudärstrukturen
Université
Technical University of Braunschweig  (Institut für Software, Abteilung Informationssysteme)
Cours
Seminar Bioinformatik
Note
2.0
Auteur
Année
2004
Pages
14
N° de catalogue
V38412
ISBN (ebook)
9783638374828
Taille d'un fichier
757 KB
Langue
allemand
Annotations
Dichter Text - kleine Schrift
Mots clés
Vorhersage, RNA-Sekudärstrukturen, Seminar, Bioinformatik
Citation du texte
Mohammed Mosavi (Auteur), 2004, Vorhersage von RNA-Sekudärstrukturen, Munich, GRIN Verlag, https://www.grin.com/document/38412

Commentaires

  • Pas encore de commentaires.
Lire l'ebook
Titre: Vorhersage von RNA-Sekudärstrukturen



Télécharger textes

Votre devoir / mémoire:

- Publication en tant qu'eBook et livre
- Honoraires élevés sur les ventes
- Pour vous complètement gratuit - avec ISBN
- Cela dure que 5 minutes
- Chaque œuvre trouve des lecteurs

Devenir un auteur