Décryptage de dynamiques épigénomiques au cours de la thymopoïèse et de la spermatogénèse en appliquant une méthodologie de recherche reproductible à des données de séquençage à haut débit

auteurs

  • Charbonnier Guillaume

mots-clés

  • Bioinformatics
  • Reproducible research
  • Epigenomics
  • Thymopoiesis
  • Spermatogenesis
  • -Seq
  • Snakemake
  • Python
  • R
  • Conda
  • Linux
  • Bioinformatique
  • Recherche reproductible
  • Épigénomique
  • Thymopoïèse
  • Spermatogénèse
  • -seq
  • Snakemake
  • Python
  • R
  • Conda
  • Linux

type de document

THESE

résumé

Cette dernière décennie, le développement de nombreuses méthodes expérimentales basées sur les technologies de séquençage à haut débit ont élargi les possibilités d’exploration du fonctionnement du génome des organismes. Le niveau d’expression de l’ensemble des gènes, l’accessibilité et les modifications locales de la chromatine, ainsi que les sites de fixations de protéines sur l’ADN sont des informations accessibles par des approches largement démocratisées. Les données produites par ces approches sont caractérisées par leur taille importante, leur complexité et leur réemployabilité pour des applications scientifiques au delà de celle pour laquelle elles ont été initialement générées. Ces caractéristiques ont favorisé la création de projets internationaux fructueux pour la génération et le partage de ces données à la communauté scientifique. Les traitements informatiques qu’il est possible de leur appliquer sont d’une grande diversité en termes de principes, outils, algorithmes, paramètres et tests statististiques. Des choix différents peuvent parfois mener à des résultats divergents débattus par des scientifiques. Il est alors primordial de disposer d’une méthodologie pour le traitement de ces données qui permette d’assurer une reproductibilité complète des résultats tout en accordant une flexibilité de développement permettant l’application de différents traitements en parallèle. Une implémentation d’une telle méthodologie est présentée dans cette thèse, complé- mentée de trois outils utiles pour le traitement de certains types de données issues du sé- quençage. Cette implémentation a été réalisée grâce à, mais aussi pour des projets d’études de mécanismes épigénétiques, principalement centrés autour de la thymopoïèse humaine et de la spermatogénèse murine. Pour autant, les principes à suivre dans la méthodologie sont pensés pour être les plus généraux possibles et peuvent être appliqués pour produire tous types d’analyses basées sur un enchaînement d’outils en ligne de commande. Les analyses de données ChIP-Seq, ATAC-Seq, WGBS et RNA-Seq du premier projet ont permis premièrement de replacer de manière cohérente et ordonnée les paysages épigéné- tiques des sous-populations thymiques par rapport à ceux de toutes les populations issues de lignées hématopoïétiques. Deuxièmement, ces analyses ont montré qu’une majorité des éléments régulateurs distaux sont déméthylées de manière constitutive au cours de la différentiation des lymphocytes T, et ce indépendamment de leur état d’activation. L’un d’eux, l’amplificateur du gène du TCRA, Ea, est dans un état ouvert et déméthylé dès les étapes les plus précoces de la thymopoïèse alors qu’il ne s’active que tardivement. Les données transcriptomiques ont révélé que le niveau d’expression des facteurs de transcription HOXA5-9 diminuent au moment où Ea s’active. Finalement, ces analyses ont permis de guider la découverte par d’autres approches biologiques du rôle d’HOXA9 dans le blocage du mécanisme de réarrangements du TCRA. Concernant l’étude de la spermatogénèse murine, l’analyse de données ChIP-Seq à différents stades de différentation a permis de caractériser l’acétylation et la butyrylation des lysines 5 et 8 de l’histone 4 comme étant quatre modifications post-traductionnelles fortement corrélées et marquant les gènes hautement transcrits. L’analyse de données MNase-Seq a permis de lever le voile sur la dynamique d’éviction, de remplacement par des protamines, et de repositionnement des nucléosomes au cours de la spermiogénèse. D’autres analyses MNase-Seq ont permis de caractériser l’impact de l’incorporation d’un variant d’histone, H2AL2, et de l’expression d’un facteur de transcription spécifique de la spermiogénèse, Nut, sur la structure de la chromatine.

article PDF

plus d'information