SciDok

Eingang zum Volltext in SciDok

Lizenz

Dissertation zugänglich unter
URN: urn:nbn:de:bsz:291-scidok-58884
URL: http://scidok.sulb.uni-saarland.de/volltexte/2014/5888/


Evolutionary epigenomics - identifying functional genome elements by epigenetic footprints in the DNA

Evolutionäre Epigenomik - Identifizierung von funktionalen Genome Elementen durch epigenetische Footprints in der DNS

Feuerbach, Lars

pdf-Format:
Dokument 1.pdf (2.945 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Epigenetik , Methylierung , Bioinformatik
Freie Schlagwörter (Deutsch): Deaminierung , Evolution , CpG Inseln
Freie Schlagwörter (Englisch): evolution , epigenetics , methylation , CpG island
Institut: Fachrichtung 6.2 - Informatik
Fakultät: Fakultät 6 - Naturwissenschaftlich-Technische Fakultät I
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Lengauer, Thomas (Prof. Dr. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 16.01.2014
Erstellungsjahr: 2014
Publikationsdatum: 11.09.2014
Kurzfassung auf Englisch: Over the last decade, advances in genome sequencing have substantially increased the amount of genomic DNA sequences available. While these rich resources have improved our understanding of genome function, research of the epigenome as a transient but heritable memory system of the cell has only profited from this development indirectly. Although epigenetic information in the form of DNA methylation is not directly encoded in the genomic nucleotide sequence, it increases the mutation rate of cytosine-guanine dinucleotides by the CpG decay effect, and thus leaves epigenetic footprints in the DNA. This thesis proposes four approaches to facilitate this information for research. For largely uncharacterized genomes, CgiHunter presents an exhaustive algorithm for an unbiased DNA sequence-based annotation of CpG islands as regions that are protected from CpG decay. For species with well characterized point mutation frequencies, EqiScore identifies regions that evolve under distinct DNA methylation levels. Furthermore, the derived equilibrium distributions for methylated and unmethylated genome regions predict the evolutionary robustness of transcription factor binding site motifs against the CpG decay effect. The AluJudge annotation and underlying L-score provide a method to identify putative active copies of CpG-rich transposable elements within genomes. Additionally, epigenetic footprints in these sequences are applied to predict the germline epigenome of their loci. Moreover, AluJudge provides support for the targeted removal of epigenetically silenced repeat copies from CpG island annotations, which are subjected to a methylation-induced erosion process. Finally, the FFK approach enables the prediction of the germline methylome for homologous genome loci.
In a number of case studies on the human genome, I demonstrate how this evolutionary epigenomics toolkit can be applied to enhance the epigenomic characterization of the large quantity of currently sequenced vertebrate genomes. Furthermore, these studies show how to improve the identification of novel epigenetic functional genome regions in already well characterized species. Finally, the toolkit opens new avenues for computer-based research of the evolution of genome-wide DNA methylation.
Kurzfassung auf Deutsch: In den letzten Jahrzehnten haben Fortschritte in der Genom-Sequenzierung zu einem substanziellen Zuwachs an verfügbaren DNS-Sequenzen geführt. Während diese Ressourcen zu einem verbesserten Verständnis der Funktionsweise von Genomen führten, konnte die Erforschung des Epigenoms als veränderlichem und doch vererbbarem zellulärem Informationsspeicher nur indirekt von dieser Entwicklung profitieren. Obwohl epigenetische Information nicht direkt in Form von genomischen Nukleotid-Sequenzen kodiert wird, sind beide Systeme derart miteinander verflochten, dass gemeinsame evolutionäre Abhängigkeiten einen epigenetischen Fußabdruck in der genomischen DNS erzeugen. In dieser Arbeit werden vier Ansätze vorgestellt, um diese bisher weitgehend unerforschte Informationsquelle zu erschließen. Gleichsam einem Werkzeugkasten für Probleme der Evolutionären Epigenomik, bieten sie für eine Vielzahl verschiedener Szenarien eine Auswahl von einsetzbaren Methoden an. Für weitgehend uncharakterisierte Genome ermöglicht CgiHunter, als kombinatorisch präziser Algorithmus, die auf der DNS-Sequenz basierende Identifikation von CpG Inseln, welche als Zentren von epigenetischer Regulation in Wirbeltier-Genomen bekannt sind. Für Spezies in denen bereits Modelle der Punktmutationshäufigkeit existieren, können Dinukleotid-Gleichgewichtsverteilungen eingesetzt werden. Sie bieten über den EqiScore-Ansatz die Möglichkeit, Genomregionen zu identifizieren, die unter einem erhöhten DNS methylierungs Nieveau evolvieren. Des Weiteren ermöglichen sie eine Vorhersage der evolutionären Robustheit von Transkriptionsfaktor-Bindestellen gegenüber dieser epigenetischen Einflüsse. Komplementär dazu bietet die AluJudge Annotation und der ihr zugrundeliegende L-Score für Genome mit CpG-reichen transponierenden Elementen einen Weg, unter ihnen potentiell aktive Kopien zu identifizieren. Darüber hinaus können diese Sequenzen als positions-spezifische Sonden des Keimbahn-Epigenoms eingesetzt werden. Auch unterstützt der L-Score die gezielte Entfernung von jenen mehrheitlich epigenetisch inaktiven Regionen aus CpG-Insel-Annotationen, welche einem methylierungs-induziertem Erosions-Prozess unterworfen sind. Zuletzt wird der FFK-Algorithmus, als ein phylogenetischer Ansatz beschrieben, der für nahe verwandte Spezies, wie jene des Primaten-Stammbaums, eine Vorhersage des Keimbahnmethyloms für beliebige Genomregionen ermöglicht. In einer Reihe von Fallstudien an Hand des menschlichen Genoms, demonstriere ich im Anschluss, die Funktionalität dieser bioinformatischen Werkzeuge. Zum Einen ermöglichen sie die Identifizierung von neuen epigenetisch kontrollierten Regionen im menschlichen Genom. Zum Anderen dienen sie als Beispiel für die epigenomische in-silico Charakterisierung der Vielzahl von bald verfügbaren Vertebraten-Genomen. Zuletzt wird das Potential dieser neuen Ansätze für die computerbasierte Erforschung der evolutionären Entwicklung von genomeweiter DNS-Methylierung thematisiert.
Lizenz: Veröffentlichungsvertrag für Dissertationen und Habilitationen

Home | Impressum | Über SciDok | Policy | Kontakt | Datenschutzerklärung | English