• Understanding biological complexity, from genotype to phenotype, with interdisciplinary approaches.
  • Understanding biological complexity, from genotype to phenotype, with interdisciplinary approaches.
  • Understanding biological complexity, from genotype to phenotype, with interdisciplinary approaches.

Bioinformatics and genomics of molecular networks

This research axis aims at deciphering the functional organization of the genome, defining the functional role of non coding transcripts, analyzing the molecular interactions at the DNA, RNA or protein level, developing new strategies to integrate heterogeneous information.

 

Genetics and genomics of multifactorial diseases

This research axis aims at identifying genes and mechanisms underlying the complex phenotypes in multifactorial diseases such as haematological malignancies, sepsis, malaria, and cardiomyopathies.

Education

TAGC Members are actively involved in education and propose various theoretical and practical courses related to molecular biology, genetics, genomics, bioinformatics, statistics and informatics.

Attendees range from BSc, MSc, and PhD students to postdoctoral fellows and researchers.

Next Generation Sequencing Facility - TGML

The Transcriptomic and Genomic Marseille-Luminy (TGML) platform is involved in transcriptomic and genomic data production and analysis since 2001.

Bioinformatics Core Facility Calanques - BCF-C

The Bioinformatic Core Facility offers bioinformatic support on data analysis and software development.

Bioinformatics Resources and Biological Platforms

The TAGC members develop and deploy bioinformatics tools, databases and workflows ranging from next generations sequencing data analysis to network analysis.

The TAGC also own platforms for molecular biology, cell culture imaging and animals breeding.

Our goal

Understanding biological complexity, from genotype to phenotype, with interdisciplinary approaches.

Events

14 Dec 2018

Internal Seminar - Christophe Chevillard

19 Dec 2018

PhD Thesis defense - Michel Sanka - Comprehension des mécanismes moléculaires et des facteurs génétiques impliqués dans le paludisme sévère : analyse des profils transciptomiques et processus biologiques caractéristiques du neuropaludisme...

Comprehension des mécanismes moléculaires et des facteurs génétiques impliqués dans le paludisme sévère : analyse des profils transciptomiques et processus biologiques caractéristiques du neuropaludisme et meta-analyse sur des genes associés à la résistance au paludisme.

Mercredi 19 décembre - 14h Amphithéatre 12, Batiment B

Le paludisme est l'une des maladies infectieuses les plus dévastatrices qui a affecté environ 214 millions de personnes dans le monde et provoqué la mort de près de 600000 en 2015. Elle est causée par l'infection par le parasite plasmodium, dont P. falciparum et P. vivax sont les plus représentés. Le développement asexué du parasite dans le sang provoque la physiopathologie de la maladie dont l'évolution passe du paludisme simple au paludisme grave, notamment le neuropaludisme. Nos travaux ont d'abord porté sur l'analyse du transcriptome, par la technologie des microarrays, des cellules sanguines d'une cohorte constituée au Sénégal. L'analyse des résultats a permis d'identifier un ensemble de gènes dont l'expression permettait de distinguer le profil transcriptomique du neuropaludisme de ceux du paludisme simple et des autres formes de paludisme grave. Ces gènes sont enrichis en voies biologiques impliquées dans l'activation des récepteurs des lymphocytes B et T mais aussi des TLR et des récepteurs Fcgamma. On trouve aussi parmi ces gènes plusieurs gènes candidats qui ont déjà été testés pour leur résistance au paludisme, dont RNASE3 et IL18R. Nous avons aussi réalisé, avec une partie de cette même cohorte sénégalaise, une étude d’association cas-contrôles qui n’a pas permis de détecter d’association entre le polymorphisme NCR3-412 et le paludisme sévère. Enfin l’approche basée sur une métaanalyse a permis de confirmer son implication dans le paludisme simple, ainsi que celle du polymorphisme LTA+252 dans le paludisme sévère, contrairement au LTA+80, au TNF-238 et au TNF-308. L’ensemble des travaux contribuent à une meilleure compréhension des facteurs génétiques et génomiques impliqués dans la résistance de l’hôte au paludisme.

20 Dec 2018

PhD Thesis defense - Mustafa Abuelqumsan - Assessment of Supervised Classification Methods for the Analysis of RNA-seq Data

Decembre 20th, 2018 -

In recent years, the advent of next-generation sequencing (NGS) technology has been revolutionizing how genomic studies are processed. An important and widely used application of NGS technology is the study of transcriptome through sequencing of cDNA obtained from RNA (RNA-seq). Compared with previous technologies like microarrays, RNA-seq data have many advantages, such as dynamic and wider ranges of measurements, increased precision, higher throughput, discovery of novel RNA species and splice forms, etc. Thence, RNA-seq has been became suitable alternative for the microarray approach as the main platform to transcriptome studies. NGS technologies produce huge amounts of data, which urges the development of effective multivariate analysis methods adapted to the particular nature of the data (discrete counts, huge dynamic range, outliers, …). In this dissertation, we focus on the use of machine learning methods to perform supervised classification to assign samples to groups based on their RNA-seq gene expression profiles.

First, we briefly revise the state-of-art for the genomics and the statistical methods to treat NGS data, in order to draw lessons from the latest developments in analysis the NGS data and to evaluate what our research will provide to the latest scientific developments in the scope of multivariate analysis for the NGS data.

We perform a comparative assessment of supervised classification methods, based on published data downloaded from the recount2 warehouse, which contains around 2000 RNA-seq experiments. From this database, we selected seven study cases that are representative for typical of RNA-seq studies with different type of categories (classes): disease states (cancer types, leukemia, psoriasis), or cell types (nervous cells). We assessed the impact of pre-processing on classifiers: filtering procedures (discarding unsuited genes and/or samples), normalization, PCA transformation. We also studied the impact of the feature selection, to circumvent the problem of over-dimensionality of the feature space, and find out the subset of genes or components that optimizes the accuracy of classifiers. The feature selection relied on variable ordering based on either differential expression analysis, or on variable importance returned by a Random Forest classifier.

We pay a particular attention to the metadata and we explore the structure of the datasets, in order to interpret the behavior of each tested classifier (Support Vector Machines, Random Forest, and K Nearest Neighbouts), in light of the specificities of each study case (number of samples, number of classes, distribution of the count values, bulk or single-cell RNA-seq, …).

News

  1. La fondation Bettencourt Schueller distingue Salvatore Spicuglia

    La Fondation Bettencourt Schueller a remis le 10 décembre 2018 ses prix scientifiques annuels à 19 chercheurs dont les travaux contribuent au progrès des connaissances scientifiques sur des problématiques majeures de santé et d’environnement. La dotation totale de ces prix s’élève à près de 2 millions d’euros. Pour la première fois, la cérémonie de remise des prix a eu lieu à l’auditorium André et Liliane Bettencourt de l’Institut de France, en présence de Françoise Bettencourt Meyers, Présidente de la Fondation Bettencourt Schueller, Xavier Darcos, Chancelier de l’Institut de France et Hugues de Thé, Président du conseil scientifique de la Fondation Bettencourt Schueller.

  2. PhD Thesis defense - Mustafa Abuelqumsan

     

    Assessment of Supervised Classification Methods for the Analysis of RNA-seq Data

    December 20th, 2018

  3. PhD Thesis defense - Michel Sanka

     

    Comprehension des mécanismes moléculaires et des facteurs génétiques impliqués dans le paludisme sévère : analyse des profils transciptomiques et processus biologiques caractéristiques du neuropaludisme et meta-analyse sur des genes associés à la résistance au paludisme.

    Mercredi 19 décembre - 14h Amphithéatre 12, Batiment B

  4. ANR project Epromoters
  5. MoonDB v2 is live and cross-referenced by Uniprot

    MoonDB, the Database of Extreme Multifunctional and Moonlighting Proteins built in the TAGC (Nature Communications 6, 7412 (2015)) is now in its second version, with an updated content, and is cross-referenced by Uniprot.

     

  6. Image of the "Ligue contre le cancer"
    Label "Ligue Contre Le Cancer"

Latest publications