SciDok

Eingang zum Volltext in SciDok

Lizenz

Dissertation zugänglich unter
URN: urn:nbn:de:bsz:291-scidok-69432
URL: http://scidok.sulb.uni-saarland.de/volltexte/2017/6943/


Analyzing DNA methylation signatures of cell identity

Analyse von DNS Methylierungsmustern zellulärer Identität

Müller, Fabian

pdf-Format:
Dokument 1.pdf (24.839 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Epigenetik , Bioinformatik , Methylierung , Maschinelles Lernen , Software , Genregulation
Freie Schlagwörter (Deutsch): Computergestützte Epigenetik , DNS Methylierung
Freie Schlagwörter (Englisch): Computational epigenetics , DNA methylation , bioinformatics , machine learning , software
Institut 1: Fachrichtung 6.2 - Informatik
Institut 2: Max-Planck-Institut für Informatik
Fakultät: Fakultät 6 - Naturwissenschaftlich-Technische Fakultät I
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Lengauer, Thomas (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 31.05.2017
Erstellungsjahr: 2016
Publikationsdatum: 01.09.2017
Kurzfassung auf Englisch: Although virtually all cells in an organism share the same genome, regulatory mechanisms give rise to hundreds of different, highly specialized cell types. Understanding these mechanisms has been in the limelight of epigenomic research. It is now evident that cellular identity is inscribed in the epigenome of each individual cell. Nonetheless, the precise mechanisms by which different epigenomic marks are involved in regulating gene expression are just beginning to be unraveled. Furthermore, epigenomic patterns are highly dynamic and subject to environmental influences. Any given cell type is defined by cell populations exhibiting epigenetic heterogeneity at different levels. Characterizing this heterogeneity is paramount in understanding the regulatory role of the epigenome. Different epigenomic marks can be profiled using high-throughput sequencing, and global initiatives have started to provide a comprehensive picture of the human epigenome by assaying a multitude of marks across a broad panel of cell types and conditions. In particular, DNA methylation has been extensively studied for its gene-regulatory role in health and disease. This thesis describes computational methods and pipelines for the analysis of DNA methylation data. It provides concepts for addressing bioinformatic challenges such as the processing of large, epigenome-wide datasets and integrating multiple levels of information in an interpretable manner. We developed RnBeads, an R package that facilitates comprehensive, interpretable analysis of large-scale DNA methylation datasets at the level of single CpGs or genomic regions of interest. With the epiRepeatR pipeline, we introduced additional tools for studying global patterns of epigenomic marks in transposons and other repetitive regions of the genome. Blood-cell differentiation represents a useful model for studying trajectories of cellular differentiation. We developed and applied bioinformatic methods to dissect the DNA methylation landscape of the hematopoietic system. Here, we provide a broad outline of cell-type-specific DNA methylation signatures and phenotypic diversity reflected in the epigenomes of human mature blood cells. We also describe the DNA methylation dynamics in the process of immune memory formation in T helper cells. Moreover, we portrayed epigenetic fingerprints of defined progenitor cell types and derived computational models that were capable of accurately inferring cell identity. We used these models in order to characterize heterogeneity in progenitor cell populations, to identify DNA methylation signatures of hematopoietic differentiation and to infer the epigenomic similarities of blood cell types. Finally, by interpreting DNA methylation patterns in leukemia and derived pluripotent cells, we started to discern how epigenomic patterns are altered in disease and explored how reprogramming of these patterns could potentially be used to restore a non-malignant state. In summary, this work showcases novel methods and computational tools for the identification and interpretation of epigenetic signatures of cell identity. It provides a detailed view on the epigenomic landscape spanned by DNA methylation patterns in hematopoietic cells that enhances our understanding of epigenetic regulation in cell differentiation and disease.
Kurzfassung auf Deutsch: Obwohl praktisch alle Zellen eines Organismus dieselbe Genomsequenz besitzen, führen diverse regulatorische Mechanismen dazu, dass sich hunderte verschiedene, hochspezialisierte Zelltypen entwickeln können. Diese Mechanismen zu verstehen ist Kernziel der Epigenomforschung. Das Epigenom einer Zelle spiegelt ihren Phänotyp und somit ihre Identität wider. Die genauen Mechanismen, die durch die verschiedenen epigenomischen Merkmale einer Zelle gesteuert werden, sind jedoch bisher weitestgehend unbekannt. Außerdem sind die zugrundeliegenden epigenomischen Muster dynamisch und können sich abhängig von ihrer Umgebung verändern. Verschiedene Zelltypen bestehen zudem aus heterogenen Populationen einzelner Zellen. Um die regulatorische Rolle des Epigenoms zu verstehen ist daher eine genaue Charakterisierung dieser Heterogenität unabdingbar. Epigenomische Profile können mithilfe moderner Technologien, wie etwa der Hochdurchsatzsequenzierung der DNS, erzeugt werden. Globale Initiativen untersuchen inzwischen eine Vielzahl epigenomischer Modifikationen in einer breiten Spanne verschiedener Zelltypen und legen damit den Grundstein für ein umfassendes Bild des dynamischen humanen Epigenoms. Insbesondere stellt die Methylierung der DNS, welche mit der Genregulation in gesunden sowie erkrankten Zellen assoziiert ist, eines der am besten beschriebenen epigenomischen Merkmale dar. Diese Arbeit beschreibt computergestützte Verfahren und Software-Pipelines für die Analyse von DNS-Methylierungsdaten. Herangehensweisen für bioinformatische Herausforderungen, wie etwa dem Umgang mit großen, heterogenen, epigenomweiten Datensätzen und der Datenintegration aus verschiedenen Informationsebenen, werden vorgestellt. Unsere RnBeads Software ermöglicht eine umfassende Analyse großer DNS-Methylierungsdatensätze auf Basis einzelner CpGs oder genomischer Regionen und stellt die Resultate in interpretierbarer Form dar. Des Weiteren stellt die epiRepeatR Pipeline Werkzeuge für die Untersuchung globaler epigenomischer Muster in Transposons und anderen repetitiven Abschnitten des Genoms bereit. Das blutbildende System stellt ein nützliches Modell für die Beschreibung und Erforschung von Zelldifferenzierungsprozessen dar. Hier beschreiben wir die epigenomische Landschaft, die durch DNS-Methylierungsmuster in hämatopoetischen Zellen aufgespannt wird. Bioinformatische Methoden zur Analyse epigenomischer Muster in den Differenzierungsprozessen wurden erarbeitet und angewandt. Mithilfe dieser Methoden wurden zelltypspezifische Methylierungsprofile ausdifferenzierter Blutzellen identifiziert, welche die phänotypische Diversität der Zellen widerspiegeln. In einer vertiefenden Analyse wurde die Methylierungsdynamik während der Ausbildung des Immungedächtnisses in menschlichen T-Zellen offengelegt. Darüber hinaus konnten epigenetische Fingerabdrücke von Blutvorläuferzellen identifiziert und statistische Verfahren entwickelt werden, mit deren Hilfe Zellidentität abgeleitet werden kann. Diese Verfahren ermöglichen die Charakterisierung von Zellheterogenität in Populationen von Vorläuferzellen, die Herausstellung von Methylierungssignaturen der Zelldifferenzierung und die Quantifizierung der epigenomischen Ähnlichkeit zwischen Zelltypen. Schließlich beschäftigt sich diese Arbeit mit der Beschreibung epigenomischer Muster, die in Krebszellen abnormal verändert sind und die sich durch Zellreprogrammierung einen pluripotenten, potenziell gutartigen Zustand zurückversetzen lassen. Zu diesem Zweck wurden die Methylierungsprofile leukämischer Zellen und deren reprogrammierter Gegenstücken mit den entwickelten bioinformatischen Methoden ausgewertet. Zusammenfassend beschreibt diese Dissertation neuartige Methoden und Softwarewerkzeuge zur Identifizierung und Interpretation epigenetischer Signaturen der Zellidentität. Sie zeichnet ein Bild der DNS-Methylierungslandschaft in menschlichen Blutzellen, welches zum Verständnis von epigenetischen Regulationsprozessen während Zelldifferenzierung und Krankheitsbildung beitragen kann.
Lizenz: Veröffentlichungsvertrag für Dissertationen und Habilitationen

Home | Impressum | Über SciDok | Policy | Kontakt | Datenschutzerklärung | English