Bei GRIN registrieren oder einloggen

Jetzt registrieren
Für neue Autoren: kostenlos, einfach und schnell
Dies wird Ihr Benutzername, bitte geben Sie eine gültige E-Mail-Adresse an

Passwort vergessen


Neues Passwort anfordern
Proteinstrukturalignment - Berechnung von Alignments close

Bitte warten

Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.

Proteinstrukturalignment - Berechnung von Alignments

Seminararbeit, 2005, 13 Seiten
Autor: Karsten Patzwaldt
Fach: Informatik - Angewandte Informatik

Details

Veranstaltung: Proseminar Klassische Algorithmen der Bioinformatik
Institution/Hochschule: Humboldt-Universität zu Berlin (Informatik)
Tags: Proteinstrukturalignment, Berechnung, Alignments, Proseminar, Klassische, Algorithmen, Bioinformatik
Kategorie: Seminararbeit
Jahr: 2005
Seiten: 13
Note: ohne Bewertung
Literaturverzeichnis: ~ 14  Einträge
Sprache: Deutsch

Archivnummer: V51445
ISBN (E-Book): 978-3-638-47417-7
ISBN (Buch): 978-3-638-75155-1
Dateigröße: 784 KB
Anmerkungen :
lala


Zusammenfassung / Abstract

Als Proteinstrukturalignment bezeichnet man das Finden von Teilketten in 2 oder mehreren Proteinsträngen, deren Tertiärstruktur eine möglichst hohe Übereinstimmung aufweist. Es werden mehrere Algorithmen vorgestellt, um sowohl paarweise als auch multiple Alignments zu berechnen.


Textauszug (computergeneriert)

Proteinstrukturalignment

von: Karsten Patzwaldt

 


Inhaltsverzeichnis

1 Einführung 2

2 DALI 3

2.1 Distanzmatrizen 3
2.2 Scorefunktion 4
2.3 Monte-Carlo-Optimierung 4
2.4 Anwendung bei DALI  5

2.4.1 Phase 1 5
2.4.2 Phase 2 6
2.4.3 Phase 3 6

2.5 Fehlerabschätzung 6

3 Proteinstrukturalignment durch inkrementelle kombinatorische Erweiterung des optimalen Pfades 7

3.1 Bestimmung der Seeds 7
3.2 Erweiterung des Alignments 8
3.3 Optimierung der Ergebnisse 8
3.4 Bewertung 8

4 Sekundärstrukturmatching 9

4.1 Graphentheoretischer Ansatz  9
4.2 Verbesserung des Alignments 9
4.3 Bewertung  10

5 Multiples Strukturalignment 10

5.1 Taylor, Flores, Orengo[14] 11
5.2 Haraldsson, Ohlsson[4]  12

6 Auswertung 12

 


 

1 Einführung

Proteine, das heißt Aminosäureketten, sind ein elementarer Grundbaustein aller Zellen. Sie haben im Körper verschiedenste Aufgaben und sind unter anderem in Form von Sturkturproteinen für den Aufbau von Gewebe, in Form von Enzymen für katalytische Funktionen, in Form von Hormonen für Steueraufgaben im Körper oder als Transportprotein wie zum Beispiel beim Hämoglobin für den Transport verschiedenster Substanzen im Körper zuständig. Bei der Untersuchung von Proteinen unterscheidet man zwischen 3 Abstraktionsebenen: der Primärstruktur, der Sekundärstruktur sowie der Tertiärstruktur. Die Primärstruktur ist die einfachste Form, hier wird lediglich die Proteinsequenz betrachtet, die aus der DNA-Sequenz abgeleitet werden kann. Als Sekundärstruktur bezeichnet man die Anordnung der Aminosäuren zu Sekundärstrukturelementen wie der -Helix oder dem -Faltblat. Sie gibt Aufschluss über die die chemische Zusammensetzung eines Proteins, ignoriert allerdings die Anordnung der Aminosäuren im Raum. Als Tertiärstruktur bezeichnet man die räumliche Anordnung, sie gibt also Aufschluss über die tatsächliche Gestalt des Proteins, ist aber naturgemäß auch die komplexeste Darstellungsform. Gelegentlich ist zusätzlich noch von der Quartärstruktur die Rede, dabei betrachtet man Proteinkomplexe, die aus mehreren Proteinen zusammengesetzt sind. Diese werden hier aber nicht weiter behandelt. Abbildung 1 zeigt beispielhaft zwei Tertiärstrukturen in einer 3D-Ansicht.

Abbildung 1: Das Enzym Alkoholdehydrogenase bei einem Menschen (links) und einem Pferd (rechts) [Abbildung in der Downloaddatei vorhanden]

Um die Funktionsweise von Proteinen zu untersuchen ist es oft hilfreich, Gemeinsamkeiten zwischen Proteinen herauszufinden. Nun gibt es zwar eine Vielzahl von effizienten Algorithmen, um Primärstrukturen zu vergleichen, unter anderem BLAST[8] sowie verschiedene Weiterentwicklungen (PSI-BLAST und Gapped BLAST[2], BLAST 2[8] u.a.), allerdings stellte sich heraus, daß die Tertiärstruktur einen weitaus größeren Einfluß auf die Funktion des Proteins hat als die Primärstruktur. Zudem haben Proteine mit ähnlicher Primärstruktur auch ähnliche Tertiärstrukturen, allerdings gilt der Umkehrschluss nicht zwangsläufig, so daß ein Tertiärstrukturvergleich auch Ähnlichkeiten finden kann, die aus der Primärstruktur nicht sofort ersichtlich sind. Abbildung 2 zeigt beispielhaft ein vollständiges Alignment zweier Proteine.

Ziel ist es daher Algorithmen zu finden, die zwei oder mehr Tertiärstrukturen verarbeiten und gemeinsame Teilstrukturen erkennen können. Ich werde im folgenden fünf Algorithmen vorstellen, die dazu verschiedene Strategien verfolgen. Die Beschreibungen der Algorithmen erheben keinen Anspruch auf Vollständigkeit, sondern sollen lediglich einen Überblick über die Funktionsweise und der Effizienz der verschiedenen Algorithmen geben. Für eine ausführliche Beschreibung mit sämtlichen Details sei der interessierte Leser auf die jeweiligen Papers verwiesen.

Abbildung 2: Ein Alignment zwischen zwei Immunoglobulinen[1] [Abbildung in der Downloaddatei vorhanden]

2 DALI

2.1 Distanzmatrizen

DALI[5] ist ein Akronym für Distance matrix ALIgnment. Wie der Name bereits andeutet, basiert der Algorithmus auf dem Vergleich von Distanzmatrizen. Definition 1 Sei P ein Protein, bestehend aus n Aminosäuren mit den Koordinaten (a1, · · · , an). Dann ist D die Distanzmatrix von P, wenn [Formel in der Downloaddatei vorhanden] gilt. Wir betrachten nur eine Koordinate pro Aminosäure, da bei sämtlichen Algorithmen lediglich die C -Atome betrachtet werden. Das sind die Kohlenstoffatome, die das Rückgrat der Aminosäurekette bilden. Eventuelle Nebenäste der Kette können für gewöhnlich ignoriert werden, da sie nur minimalen Einfluss auf die Funktion des Proteins haben.

Die Vorteile bei der Verwendung von Distanzmatrizen liegen auf der Hand. Sie verlegen das Problem auf elegante Weise aus dem dreidimensionalen in den zweidimensionalen Raum, sie erledigen automatisch das Problem, die Strukturen gegeneinander rotieren oder verschieben zu müssen, da sie nur mit relativen Koordinaten arbeiten, enthalten aber trotzdem genügend Informationen, um die dreidimensionale Struktur wieder zu berechnen. Allerdings enthalten sie mehr Informationen als nötig, so daß bei einem Vergleich zweier vollständiger Matrizen viele unnötige Operationen durchgeführt werden würden. Zu Beginn des Algorithmus wird für beide zu vergleichende Proteine jeweils die Distanzmatrix berechnet.

2.2 Scorefunktion

[...]


Kommentare

Bisher keine Kommentare

Kommentar hinzufügen

Andere Nutzer haben sich auch für folgende Titel interessiert:


Dieser Text kann über folgende URL aufgerufen und zitiert werden:

http://www.hausarbeiten.de/e-book/51445/proteinstrukturalignment-berechnung-von-alignments
please wait Bitte warten