"Atlanten" sind derzeit in der Bioinformatik wichtige Projekte grösserer Projektkonsortien. Unter einem Atlas versteht man dabei die Zusammenstellung neuer und schon publizierter (Hochdurchsatz-)Datensätze verschiedener Typen inklusiver möglichst vollständiger Annotation und Metainformation zu einem bestimmten Thema, z.B. der HLCA [HLCA]. Ein Atlas wird oft von vielen Projektpartnern die Daten produzieren (Biologen/Mediziner) und/oder analysieren (Bioinformatiker) zusammengestellt. Durch die Revolution der Sequenziertechniken sowohl auf genomischer, transcriptomischer und epigenomischer Ebene stehen eine grosse Zahl von (heterogenen) Datensätzen zur Verfügung. Ergänzt wird das noch durch posttranlationale Datensätze (meist Massenspektrometrie basiert). Zu einer Anwendungsfragestellung (z.B. einer Krankheit) oder zu einem Zelltyp oder Gewebe/Organ sthen meist zusätzlich zu den humanen Daten auch Daten von Modellorganismen (oft sogar noch mehr) zur Verfügung.
“Atlases” are currently important projects of larger project consortia in bioinformatics. An atlas is the compilation of new and already published (high-throughput) datasets of various types, including the most complete annotation and meta-information possible on a specific topic, e.g. the HLCA [HLCA]. An atlas is often compiled by many project partners who produce (biologists/medical scientists) and/or analyze (bioinformaticians) the data. Due to the revolution in sequencing techniques at the genomic, transcriptomic and epigenomic level, a large number of (heterogeneous) data sets are available. This is supplemented by post-translational data sets (mostly based on mass spectrometry). For an application question (e.g. a disease) or for a cell type or tissue/organ, data from model organisms (often even more) are usually available in addition to the human data.
Gerade wurde die erste Version des Human Cell Atlas (HCA) in einer Serie von veröffentlichungen im Fachjournal Nature publiziert:
"Cell nav: The Human Cell Atlas (HCA)", Nature, Vol 635, No. 8039.
Damit zusammenhängend wurden auch eine Reihe
bioinformatischer Analysemethoden entwickelt und publiziert (für einen Überblick und Referenzen siehe inbesondere das
technology feature "Computational technologies of the Human Cell Atlas" vom 20.11.2024, Nature, Vol 635, No. 8039).
Im Praktikum werden diese Methoden analysiert, angewendet und ggfs. angepasst. Für bestimmte Fragestellungen werden auch
neue Methoden entwickelt und getestet.
The first version of the Human Cell Atlas (HCA) has just been published in a series of papers in the journal Nature:
“Cell nav: The Human Cell Atlas (HCA)”, Nature, Vol 635, No. 8039.
Bioinformatic analysis methods have also been developed and published (for an overview and references, see in particular the technology feature “Computational technologies of the Human Cell Atlas” from 20.11.2024, Nature, Vol 635, No. 8039).
In the practical course, these methods are analyzed, applied and, if necessary, adapted. New methods are also developed and
new methods are developed and tested.
Die Anzahl verschiedener Hochdurchsatztechniken ist inzwischen riesig mit entsprechend vielen Anwendungsmöglichkeiten für die verschiedensten Forschungsfragestellungen. Dementsprechend werden auch geeignete Analysemethoden (sog. Bioinformatik-Pipelines) gebraucht, die es erlauben, die Daten bestmöglich zu analysieren und zu vergleichen. Für die einzelnen Datentypen stehen viele Methoden und auch Pipelines zur Verfügung. Das gilt nicht nur für bulk NGS Daten sondern auch und v.A. für die neuesten Datentypen zur single-cell Messungen und räumlich aufgelöste Daten (fast ebenfalls auf Einzelzellebene).
The number of different high-throughput techniques is now huge, with a correspondingly large number of possible applications for a wide variety of research questions. Accordingly, suitable analysis methods (so-called bioinformatics pipelines) are needed that allow the data to be analyzed and compared in the best possible way. Many methods and pipelines are available for the individual data types. This applies not only to bulk NGS data but also and above all to the latest data types for single-cell measurements and spatially resolved data (almost also at single-cell level).
Ziel des Praktikums ist es, geeignete Datensätze für definierte Fragestellungen zu identifizieren, die Daten mit geeigneten Methoden zu analysieren (diese dabei zu lernen bzw. anwenden zu lernen, ggfs zu erweitern/ergänzen), die Daten und (differentiellen) Ergebnisse zu integrieren, und sie geeignet zu annotieren und zusammen mit den relevanten Metainformationen in den Atlas zu integrieren. Die definition der Fragestellung und die Metainformationen um die Fragestellung bzw. die Ergebnisse dazu für andere Analysen und andere Fragestellungen nutzbar zu machen stehen dabei im Vordergrund. Insbesondere steht auch die Natzbarbeit bzw. Übertragbarkeit von Daten und Ergebnissen von Modellorganismen für den Menschen und menschliche Krankeiten (CVD, Herzinfrakt, Schlaganfall, Atherosklerose) im Fokus. Besonders interessant ist natürlich die Einbindung aktueller single-cell, spatial und multimodal Daten.
Ggfs werden auch eigene Daten zu Kalibrierung der neuen Techniken generiert und eingesetzt.
The aim of the internship is to identify suitable data sets for defined questions, to analyze the data with suitable methods (to learn or learn to apply them, if necessary to extend/supplement them), to integrate the data and (differential) results, and to annotate them appropriately and integrate them into the atlas together with the relevant meta-information. The definition of the research question and the meta-information to make the research question or the results usable for other analyses and other questions are the main focus. In particular, the focus is also on the usability and transferability of data and results from model organisms for humans and human diseases (CVD, heart attack, stroke, atherosclerosis). Of particular interest is of course the integration of current single-cell, spatial and multimodal data.
If necessary, we will also generate and use our own data to calibrate the new techniques.
Konkret werden auch Sequenzierungen für Praktikums-spezifische Perturbations-Experimente
geplant und durchgeführt (Kosten werden von pro-lehre@LMU übernommen).
Eigene Daten von Immunzellen des Bluts werden mit diesen Methoden analysiert. Diese Experimente
sind Grundlage für Anwendungen im Bereich Cardio-vascular Diseases (CVDs) wie Atherosclerose und
für Auswirkungen von Ernährung auf molekulare Blutbiilder (Lebensmittel Systembiologie).
Specifically, sequencing for internship-specific perturbation experiments will also be
are planned and carried out (costs are covered by pro-lehre@LMU).
Own data of immune cells of the blood are analyzed with these methods. These experiments
are the basis for applications in the field of cardio-vascular diseases (CVDs) such as atherosclerosis and
for the effects of nutrition on molecular blood biology (food systems biology).
Zirkulierende, infiltrierende und residente Makrophagen und andere Immunzell-Populationen sind wichtige Zelltypen, die an einer Vielzahl von CVDs beteiligt sind. Immer mehr Datensätze und Analysen von Einzelzell-Makrophagen werden verfügbar [2].
Im Rahmen des Praktikums werden Sequenzierungs- und insbesondere Einzelzellsequenzierungsdaten (scSeq) zur Durchführung modernster Differentialanalysen und Biomarker-Identifizierungstechniken (SCANPY [3], Seurat [4], Signac [5]) verwendet. Biomarker werden charakterisiert und mit bekannten Biomarkern aus öffentlichen Repositories, z. B. MSigDB [6], verglichen. Es werden Pipelines für die Analyse von scSeq-Daten verwendet und implementiert. Wir werden versuchen, eine Datenbank mit Biomarkern für krankheitsspezifische Subtypen von Makrophagen und weiteren relevanten Zelltypen zusammenzustellen, die als Werkzeug für die Analyse von scSeq-Daten und die Klassifizierung und Subtypisierung von Krankheiten bereitgestellt wird.
Sequencing and in particular single cell sequencing data (scSeq) will be used in the lab to perform state-of-the-art differential analysis and biomarker identification techniques (SCANPY [3], Seurat [4], Signac [5]). Biomarkers are characterized and compared to known biomarkers from public repositories, e.g. MSigDB [6]. Pipelines for analysis of scSeq data will be used and implemented. We will seek to assemble a database of biomarkers for disease-specific subtypes of macrophages and other relevant cell types that will be provided as a tool for scSeq data analysis and disease classification and subtyping.
Unser Hauptanwendungsgebiet sind Cardio-Vascular Diseases (CVDs) v.a die Atherosklerose.
Dabei interessieren uns auch die Rolle wichtiger Zelltypen in diesen Krankheiten, insbesondere die Rolle von Makrophagen und anderen Immunzellen z.B. in den frühen Phasen der CVD z.B. bei der Entstehung atherosklerotischer Plaques [5-11].
Our main field of application is atherosclerosis, in particular the role of macrophages and other immune cells in the development of atherosclerotic plaques [5-11].
Ziele und Lernziele:
Die Pipeline wird auf verfügbaren hochmodernen Tools für eine effiziente Analyse und komfortable Visualisierung der Ergebnisse unter Verwendung moderner Python und R Programmierumgebungen und -pakete aufbauen. Die Visualisierung erfolgt durch benutzerfreundliche Shiny oder Dash Apps. Die Robustheit und Reproduzierbarkeit der Ergebnisse ist eine wichtige Voraussetzung für alle Implementierungen.
Aims and Learning Goals:
The pipeline will build on available state-of-the-art tools for efficient analysis and comfortable visualization of results using modern python and R programming environments and packages. Visualization will be done by user-friendly Shiny or Dash Apps and Notebooks. Robustness and reproducibility of results is an important requirement for all implementations.
The work will be summarized in presentation and a scientific paper (to be submitted to a journal for peer review)
Voraussetzungen:
Bachelor Bioinformatik, insbesondere erfolgreicher Abschluss des GoBi Praktikums. Gute Programmierkenntnisse (Java, Python, Dash, R, Shiny). Interesse an Datenvisualisierung und komplexen menschlichen Krankheiten.
Prerequisites:
Bachelor Bioinformatics, in particular successful completion of the GoBi practical course. Good programming skills (java and/or python). Interest in data visualization and complex human diseases.