Bioinformatics

Die CECAD Bioinformatics Facility arbeitet an der Analyse von molekularen Hochdurchsatzdaten in Modellsystemen und klinischen Fällen altersassoziierter Erkrankungen. Zu diesem Zweck verwenden wir einen integrierten Datenanalyseansatz, in welchem wir multiple OMICS-Datentypen mit phänotypischen und klinischen Daten verknüpfen. Unsere wissenschaftlichen Informationssysteme für die Hochdurchsatz-Datenanalyse und -integration haben die technischen Barrieren bei der Verwendung von Hochdurchsatzmethoden der neuesten Generation wesentlich reduziert und erleichtern somit Wissenschaftlern und Ärzten den Zugriff auf solche Technologien. Die Bioinformatics Facility verwendet eine IT-Infrastruktur bestehend aus Hochleistungsrechnern, Datenbanken und Web-Ressourcen, welche in Zusammenarbeit mit dem Regionalen Rechenzentrum der Universität zu Köln (RRZK) betrieben werden.

Service-Angebot: Die Bioinformatics Facility bietet Analysen von Next-Generation Sequencing (NGS)-Daten mit aktuellen Methoden an und verbindet dies mit der Zusage,  innerhalb einiger Tage publikationsreife Ergebnisse zu liefern. Unsere Analysen basieren auf QuickNGS, einem hochskalierbaren NGS-Analysesystem, welches von der Gruppe selbst entwickelt wurde (Wagle et al., 2015). Es umfasst derzeit Pipelines für Analysen des Transkriptoms (RNA-Seq), des Epigenoms (ChIP-Seq), für die Vollgenom-Sequenzierung (WGS) sowie für WGS- und Exom-Analysen (WXS) von Tumorproben. Integrierte Analysen des Transkriptoms und Epigenoms können erstellt werden, wenn beide erforderlichen Datentypen verfügbar sind. Weiter gehende Analysen und Unterstützung bei der Publikation der Ergebnisse werden in individueller Absprache angeboten.

Wissenschaftliche Meilensteine: Die von der Bioinformatics Facility entwickelten hochskalierbaren QuickNGS-Analysepipelines wurden verwendet, um Daten aus bereits etwa 4000 Genom-, Transkriptom- und Epigenomanalysen auszuwerten. Durch diese Analysen konnte die Gruppe signifikante Beiträge zu vielen international beachteten Forschungsergebnissen leisten (siehe Publikationen). QuickNGS wurde von Wissenschaftlern in mehr als 15 Ländern heruntergeladen, um lokale NGS-Analyseinfrastrukturen aufzubauen. Aktuell durchläuft das System eine grundlegende Transformation in Richtung einer integrierten Multi-OMICS-Analyseplattform, welche geeignet ist, innerhalb kurzer Zeit umfassende Analysen mehrerer orthogonaler NGS-Datentypen des gleichen Ursprungsgewebes durchzuführen.

Zukunftspläne: Die Bioinformatics Facility wird ihre Arbeit in Richtung integrativer NGS- Analysen vertiefen, um einen Multi-OMICS-Sequenzieransatz bereits in der näheren Zukunft Realität werden zu lassen. Zusätzlich werden wir unsere Anstrengungen verstärken, komplexe mathematische Modelle auf die Analyse von regulatorischen Schaltkreisen bei altersassoziierten Erkrankungen anzuwenden. Schließlich planen wir, Methoden der Big Data-Analytik und künstlichen Intelligenz auf große in unserer Plattform prozessierte NGS-Datenvolumina anzuwenden. Dies wird die Wissenschaft von CECAD einen Schritt weiter in das digitale Zeitalter bringen und signifikante Strahlkraft zum Nutzen für Forschung und Gesundheit auch über das Cluster hinaus entfalten.

Figures

Figure 1: The QuickNGS framework developed by the facility combines a broad collection of widely adopted Next-Generation Sequencing (NGS) data analysis softwares into a professional high-end analysis system enabling rapid in-depth analysis of tens or hundreds of samples from NGS experiments with extremely low hands-on time. The sample information simply needs to be fed into a MySQL database by the lab operators and all the rest is running fully automated, ending up in a convenient web interface for easy user access.

Figure 2: The lab operates an in-house software package which trains models of molecular regulatory networks by taking advantage of the large and ever increasing RNA-Seq/ChIP-Seq databases behind the QuickNGS framework. Integration of these networks with additional a-priori knowledge from public databases has established a very powerful tool for downstream analysis of RNA-Seq data from the labs within CECAD.
The figure shows a sub-network of a trained miRNA regulatory network in Caenorhabditis elegans enriched for genes involved in lifespan regulation and aging.

Publications
  • Steculorum SM, Ruud J, Karakasilioti I, Backes H, Engström Ruud L, Timper K, Hess ME, Tsaousidou E, Mauer J, Vogt MC, Paeger L, Bremser S, Klein AC, Morgan DA, Frommolt P, Brinkkötter PT, Hammerschmidt P, Benzing T, Rahmouni K, Wunderlich FT, Kloppenburg P, Brüning JC (2016):AgRP Neurons Control Systemic Insulin Sensitivity via Myostatin Expression in Brown Adipose Tissue. Cell; 165(1): 125-38 [...] 
  • Oliverio M, Schmidt E, Mauer J, Baitzel C, Hansmeier N, Khani S, Konieczka S, Pradas-Juni M, Brodesser S, Van TM, Bartsch D, Brönneke HS, Heine M, Hilpert H, Tarcitano E, Garinis GA, Frommolt P, Heeren J, Mori MA, Brüning JC, Kornfeld JW (2016): Dicer1-miR-328-Bace1 signalling controls brown adipose tissue differentiation and function. Nat Cell Biol; 18(3): 328-36 [...]
  • Respuela P, Nikolic M, Tan M, Frommolt P, Zhao Y, Wysocka J, Rada-Iglesias A (2016): Foxd3 promotes exit from naive pluripotency through enhancer decommissioning and inhibits germline specification.Cell Stem Cell; 18(1): 118-33 [...]
  • Abdallah AT, Fischer M, Nürnberg P, Nothnagel M, Frommolt P (2015): CoNCoS: Copy number estimation in cancer with controlled support. J Bioinf Comp Biol; 13(5): 1550027 [...]
  • Wagle P, Nikolic M, Frommolt P (2015): QuickNGS elevates Next-Generation Sequencing data analysis to a new level of automation. BMC Genomics; 16: 487[...]
  • Frommolt P, Schumacher B (2015): Wormpath: Searching for molecular interaction networks in Caenorhabditis elegans. Source Code Biol Med; 10: 5[...]
  • Müller MM, Castells-Roca L, Babu V, Ermolaeva MA, Müller RU, Frommolt P, Williams AB, Greiss S, Schneider JI, Benzing T, Schermer B, Schumacher B (2014): DAF-16/FoxO and EGL-27/GATA promote developmental growth in response to persistent somatic DNA damage. Nat Cell Biol; 16(12): 1168-79[...]
  • Rosewich H, Thiele H, Ohlenbusch A, Maschke U, Altmüller J, Frommolt P, Zirn B, Ebinger F, Siemes H, Nürnberg P, Brockmann K, Gärtner J (2012):Heterozygous de-novo mutations in ATP1A3 in patients with alternative hemiplegia of childhood: a whole-exome sequencing gene-identification study. Lancet Neurol, 11(9): 764-73 [...]
  • Meimaridou E, Kowalczyk J, Guasti L, Hughes CR, Wagner F, Frommolt P, Nürnberg P, Mann NP, Banerjee R, Saka HN, Chapple JP, King PJ, Clark AJL, Metherell LA (2012): Mutations in NNT encoding nicotinamide nucleotide transhydrogenase cause familial glucocorticoid deficiency. Nat Genet, 44(7): 740-2 [...]
  • Frommolt P, Abdallah AT, Altmüller J, Motameny S, Thiele H, Becker C, Stemshorn K, Fischer M, Freilinger T, Nürnberg P (2012): Assessing the enrichment performance in targeted resequencing experiments. Hum Mutat; 33(4):635-41 [...]