SciDok

Eingang zum Volltext in SciDok

Lizenz

Dissertation zugänglich unter
URN: urn:nbn:de:bsz:291-scidok-48554
URL: http://scidok.sulb.uni-saarland.de/volltexte/2012/4855/


Novel approaches to the integration and analysis of systems biology data

Neue Methoden zur Integration und Analyse von Systembiologie-Daten

Ramírez, Fidel

pdf-Format:
Dokument 1.pdf (15.939 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Systembiologie, Bioinformatik , Wissensextraktion, Proteine , High throughput screening
Freie Schlagwörter (Deutsch): Proteininteraktionen , BioSim-Methode , Hochdurchsatz-Methoden
Freie Schlagwörter (Englisch): systems biology , functional similarity , protein-protein interaction , data mining , bioinformatics
Institut: Fachrichtung 8.3 - Biowissenschaften
Fakultät: Fakultät 8 - Naturwissenschaftlich-Technische Fakultät III
DDC-Sachgruppe: Biowissenschaften, Biologie
Dokumentart: Dissertation
Hauptberichter: Lengauer, Thomas (Prof. Dr. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 19.04.2012
Erstellungsjahr: 2011
Publikationsdatum: 11.05.2012
Kurzfassung auf Englisch: The opportunity to investigate whole cellular systems using experimental and computational high-throughput methods leads to the generation of unprecedented amounts of data. Processing of these data often results in large lists of genes or proteins that need to be analyzed and interpreted in the context of all other biological information that is already available. To support such analyses, repositories aggregating and merging the biological information contained in different databases are required.

To address this need, we created an integrative data warehouse containing millions of up-to-date annotations related to human genes and proteins from over thirty major molecular biology databases. In particular, this data warehouse was instrumental in assessing the data quality of human protein interactions and in predicting an important, but largely unidentified, group of proteins that function as molecular scaffolds in the formation of signaling cascades. Additionally, the data warehouse enabled us to devise the novel computational method BioSim for the discovery of biological relationships based on the functional similarity of gene and protein annotations. Furthermore, we showed how this method allows identifying disease-associated genes.

To facilitate the analysis and interpretation of large lists of genes or proteins derived from high-throughput methods, we built the new web portal BioMyn. It provides a powerful search engine with public access to the data warehouse and the BioSim method. BioMyn also offers a number of useful tools for own functional enrichment analysis and the visualization of the results.
Kurzfassung auf Deutsch: Die Möglichkeit, ganze zelluläre Systeme mit experimentellen und computerbasierten Hochdurchsatz-Methoden zu erforschen, führt zur Generierung beispielloser Datenmengen. Die Verarbeitung dieser Daten ergibt oft große Listen von Genen oder Proteinen, die im Kontext all der anderen bereits vorhandenen, biologischen Informationen analysiert und interpretiert werden müssen. Um solche Analysen zu unterstützen, werden Datensammlungen benötigt, die die in verschiedenen Datenbanken enthaltenen biologischen Informationen zusammenführen und verknüpfen.

Um diesem Bedarf Rechnung zu tragen, wurde ein integratives Data-Warehouse angelegt, das Millionen aktueller Annotationen bezüglich humaner Gene und Proteine aus über dreißig wichtigen Datenbanken der Molekularbiologie beinhaltet. Insbesondere war dieses Data-Warehouse nützlich bei der Bewertung der Datenqualität humaner Proteininteraktionen und bei der Vorhersage einer bedeutenden, jedoch größtenteils unidentifizierten Gruppe von Proteinen, die als molekulares Gerüst der Bildung von Signalkaskaden dienen. Zudem ermöglichte es das Data-Warehouse, die neuartige Computermethode BioSim zur Aufdeckung biologischer Ähnlichkeiten, basierend auf funktionellen Ähnlichkeiten von Gen- und Proteinannotationen, zu entwickeln. Des Weiteren wurde gezeigt, wie diese Methode die Identifizierung krankheitsassoziierter Gene erlaubt.

Um die Analyse und Interpretation großer Listen von Genen oder Proteinen, die aus Hochdurchsatz-Methoden stammen, zu erleichtern, wurde das neue Webportal BioMyn geschaffen. Es bietet eine starke Suchmaschine, die das Data-Warehouse und die BioSim-Methode öffentlich zugänglich macht. Auch stellt BioMyn eine Reihe praktischer Tools für eigene Funktionsanalysen und die Visualisierung der Ergebnisse zur Verfügung.
Lizenz: Veröffentlichungsvertrag für Dissertationen und Habilitationen der Fakultät 8

Home | Impressum | Über SciDok | Policy | Kontakt | Datenschutzerklärung | English