Etude des éléments cis-régulateurs : identification et caractérisation

auteurs

  • Chèneby Jeanne

mots-clés

  • Cis-regulatory elements
  • Éléments cis-régulateurs
  • ChIPseq
  • ChIP-exo
  • DAP-seq
  • Homo sapiens
  • Arabidopsis Thaliana

type de document

THESE

résumé

Le processus de régulation de la transcription des gènes repose très largement sur l’existence de séquences d’ADN non codantes dans le génome. Ces séquences d’ADN, appelées “éléments cis-régulateurs”, ont la particularité de recruter de nombreuses protéines capables de réguler le niveau de transcription des gènes. Parmi ces protéines, les facteurs de transcription sont capables de se fixer directement sur l’ADN. Les facteurs de transcription coopèrent avec d’autres protéines régulatrices, les cofacteurs, afin de réguler la transcription. Les protéines régulatrices de la transcription permettent la fixation et la régulation de l’enzyme d’ARN polymérase II qui transcrit les gènes en ARN messager. Leurs fixations sur les éléments cis-régulateurs permettent une régulation des gènes dans l’espace et dans le temps. Pour mieux comprendre la régulation de l’expression des gènes, il est nécessaire d’identifier les éléments cis-régulateurs dans le génome afin de caractériser et d’identifier les mécanismes d’action des éléments régulateurs et des protéines qui leur sont liés. Le développement rapide des méthodes de séquençage à haut débit a permis l’identification des interactions ADN/protéines à grande échelle. L'accumulation massive des données de séquençage dans les banques de données publiques permet l'intégration de nombreuses expériences capturant les interactions entre les facteurs de transcription et l’ADN par des moyens bioinformatiques. Le but de mon doctorat a été d’annoter et traiter de façon uniforme les données brutes issues d’expériences de séquençage ayant pour objectif d’identifier les régions de fixation des protéines régulatrices pour l’Homme puis chez Arabidopsis Thaliana. Nous avons traité des données de ChIP-seq, ChIP-exo et DAP-seq afin d'élaborer plusieurs catalogues de régions régulatrices chez l’homme et chez Arabidopsis Thaliana. Toutes ces données sont disponibles au sein du projet ReMap. Pour Arabidopsis Thaliana, nous avons complété ces données par une analyse de toutes les marques d’histones. Pour effectuer ces analyses, nous avons développé des workflows reproductibles, scalables et portables sur des architectures différentes. Cette analyse intégrative à haut débit nous a permis d’identifier de nombreux nouveaux éléments cis-régulateurs. Ces données ont également été utilisées pour identifier les sites de fixations reconnus par les facteurs de transcription et pour consolider la base de données JASPAR pour l’Homme et pour Arabidopsis Thaliana. Enfin, ce catalogue a été utilisé dans le développement d’une nouvelle méthode appliquant un algorithme basé sur l’entropie. Cet algorithme permet de différencier les événements de fixations directes et indirectes par les protéines dans les résultats de ChIPseq.

article PDF

plus d'information