Étude des éléments cis-régulateurs à différentes échelles
auteurs
mots-clés
- Non-coding DNA
- Regulation
- Cis-regulatory elements
- Transcription factors
- ChIP-seq
- ReMap
- Transposable elements
- TFBS
- Evolution
- ALDH
- AML
- ADN non codant
- Régulation
- Éléments cis-régulateurs
- Facteurs de transcription
- ChIP-seq
- ReMap
- Éléments transposables
- TFBS
- Évolution
- ALDH
- AML
type de document
THESErésumé
L’ADN non-codant a longtemps été considéré comme inutile. Cependant, grâce aux avancées technologiques dans le domaine de la génomique, les chercheurs ont réalisé l’importance de ces régions dans la régulation des gènes. Les acteurs de la régulation sont les éléments cis-régulateurs (CRE) tels que les promoteurs et enhancers. Ces éléments sont fxés par des protéines appelées facteurs de la transcription (TF), qui se fxent à des sites de fxation spécifque. Les TF agissent seuls ou sous forme de complexes pour recruter l’ARN polymérase II et initier la transcription. Avec l’avénement des techniques de séquençage à haut débit, une technique permettant de détecter la fxation des protéines à l’ADN a vu le jour, le ChIP-seq. Les données résultantes sont stockées dans des entrepôts de données tels que GEO. Cependant, il existe une grande diversité dans la manière dont les expériences ChIP-seq sont conçues. Le projet ReMap, lancé en 2012, vise à identifer les régions régulatrices en annotant et intégrant ces données uniformormément. En 2022, j’ai ajouté deux nouvelles espèces au catalogue : Mus musculus et Drosophila melanogaster et la mise à jour pour l’Homme et Arabidopsis thaliana. Le catalogue chez l’Homme comprend 1210 TF et 182 millions de pics ChIP-seq. L’augmentation continue des données intégrées a nécessité de nouveaux fltres qualités. Ces données sont visualisables sur le navigateur de génomes de UCSC et peuvent être fltrés en fonction des TF et biotypes. Enfn, nous avons tenté de déterminer une spécifcité tissulaire des modules de régulations ReMap à l’aide de la méthode ChromHMM. Les résultats préliminaires permettent de distinguer 11 tissus avec un modèle à 25 états. La deuxième partie de ma thèse se concentre sur l’impact des éléments transposables (TE) sur l’insertion de site de fxation au TF dans les génomes au cours de l’évolution. Il y a plus de 50 ans, Barbara McClintock a découvert pour la première fois les éléments transposables dans le maïs (Zea mays) et les a appelés "éléments de contrôle". Depuis, les chercheurs s’éfforcent de classer et caractériser ces TE. Des travaux en génomiques décrivent les TE comme une source abondante de matériaux pour l’assemblage et la modifcation des systèmes régulateurs des gènes eucaryotes au cours de l’évolution. Nous avons donc réalisé une analyse à grande échelle afn de déterminer l’étendue de ce phénomène. Pour ce faire, nous avons réalisé une analyse d’enrichissement des 1210 pics TF de ReMap sur les TE avec l’outil LOLA. On identife donc 15,441 paires de TE/TF signifcativement associés. A l’aide de l’outil FIMO nous avons détecté la présence des motifs de fxation des TF dans la séquence des TE associés pour 7,757 paires. Nous avons observé une spécifcité de l’association TE/TF aux groupes de TF et aux familles de TE. Après avoir visualisé l’alignement des séquences de TE nous observons que les motifs sont alignés, témoignant de leur conservation au cours de l’évolution. Nous avons également observé que l’âge d’insertion des TE associés est différent pour chaque groupe de TF. Enfn, nous avons réalisé un projet en collaboration avec Advanced BioDesign (ABD) qui porte sur la régulation des ALDH. En effet, la surexpression des ALDH est associée à un mauvais pronostic chez les patients atteints d’AML. ABD a donc développé un traitement inhibiteur des ALDH, le DIMMATE. Dans ce contexte, nous cherchons à mieux comprendre les mécanismes de la régulation de l’ALDH1A1. J’ai donc cartographié les éléments régulateurs autour de ce gène à l’aide de données multi-omiques. Au cours de notre analyse, nous avons identifé 14 régions régulatrices autour du gène ALDH1A1. Nos résultats ont ensuite été communiqués à nos collaborateurs afn de procéder aux validation expérimentales qui sont encore en cours. Ces travaux se sont portés à trois niveaux de recherche 1) à très grande échelle, 2) à l’échelle génomique "évolutive" et 3) focalisés sur un locus précis.