Thèse Activité Transcriptionnelle des Éléments Mobiles dans les Cancers et Maladies Inflammatoires H/F - Doctorat.Gouv.Fr
- Montpellier - 34
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Montpellier
École doctorale : Sciences Chimiques et Biologiques pour la Santé
Laboratoire de recherche : IRMB - Cellule souches, plasticité cellulaire, régénération tissulaire et immunothérapie des maladies inflammatoires
Direction de la thèse : Nicolas GILBERT ORCID 0000000333117494
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-11T23:59:59
Il est clair que les éléments mobiles ont, et continuent de contribuer à la structure, la variabilité et la stabilité des génomes. Les éléments transposables, et en particulier les rétrotransposons, sont abondants dans le génome humain (50 % du génome). LINE-1 (L1) est le seul élément actif autonome connu et plusieurs copies sont encore capables de mobilité à travers un intermédiaire ARN. De plus en plus de travaux mettent en évidence l'activation des éléments transposable dans les cancers, les maladies chroniques ou encore au cours du vieillissement (Rodriguez-Martin et al. 2020; Gorbunova et al. 2021).
Le projet actuel est d'identifier et de caractériser l'activité transcriptionnelle des rétrotransposons (LINE - SINE - hERV) dans les cancers et les maladies inflammatoires à l'aide de données de séquençage à haut débit. À cette fin, le groupe a développé de nouvelles méthodes bioinformatiques. Les objectifs étant (1) de réduire les rétrotransposons à une combinaison de k-mers uniques (courte séquence nucléotidique), (2) caractériser le profil d'expression des rétrotransposons dans les cancers ou maladies chroniques liées au vieillissement à partir de données déjà disponibles, (3) et d'évaluer et de définir la capacité prédictive de ces nouveaux marqueurs pour le pronostique, le diagnostic et la réponse au traitement.
L'analyse du transcriptome par la méthode de RNA-Seq, permet non seulement de quantifier l'expression des gènes, mais permet également de caractériser les mutations et de découvrir de nouveaux transcrits, parmi lesquelles de nouveaux variants d'épissage, des ARN chimériques (chARN) (Ruffle et al. 2017; Bouge et al. 2018) et de nouveaux ARNs non codants (ncRNAs et lncRNAs, (Philippe et al. 2014; Riquier et al. 2021a; Riquier et al. 2021b)). D'autres ARNs, encore moins exploités aujourd'hui, sont ceux issus des séquences répétées. Parmi eux se trouvent les transcrits des rétrotransposons de type LINE-1 et hERV, qui sont connus pour être dérégulés dans les cancers (Kong et al. 2019). La méthode d'analyse bio-informatique par k-mers (Bessière et al. 2024, Silva et al. 2025) offre une perspective prometteuse pour déchiffrer l'activité des rétrotransposons du génome qui pourraient contribuer à la dérégulation de l'expression des gènes.
Le directeur de thèse est expert dans le domaine des éléments mobiles humains et dirige un groupe spécialisé dans l'étude transcriptomique des Leucémies Aigües Myéloïdes (LAM). Notre groupe multidisciplinaire, biologie moléculaire et bioinformatique, possède une solide expérience dans l'analyse des NGS et le développement d'outils de séquençage des ARN. Il est spécialisé dans l'exploration de données sur les ARN chimériques (ARN de fusion), sur les ARN longs non codants et dans la bio-informatique intégrative dans le domaine du cancer. Le groupe a développé une structure de données d'indexation, le logiciel CRAC (http://crac.gforge.inria.fr/) et l'approche DE-Kupl https://doi.org/10.1186/s13059-017-1372-2). Un atout supplémentaire de l'équipe consiste en un logiciel et des pipelines développés pour détecter, avec une très grande spécificité, différents types de mutations indépendamment de l'annotation (substitutions, indels, changements dans les jonctions d'épissage, ARN chimériques potentiels). Plus récemment, l'équipe a développé de nouveaux programmes bio-informatiques pour l'identification de novo des lncRNAs (Riquier et al. 2021 BMC genomics).
Pour le développement de nos outils, nous coopérerons étroitement avec plusieurs équipes localisées à Paris, Lille, Toulouse possédant des expertises en informatique, bioinformatique et biologie moléculaire (Bessiere et al. 2024).
1- Création d'un répertoire de k-mers uniques représentatif des rétrotransposons du génome humain
2- Indexation de RNAseq provenant de profils choisis en fonction du type de cancer et maladies inflammatoires.
3- Etablissement du profil d'expression des rétrotransposons dans les index
4- Evaluer les capacités prédictives pour les profils choisis
5- Interroger le rôle fonctionnel potentiel des rétrotransposons dans les cancers et les maladies inflammatoires
Bioinformatique, Biologie moléculaire, méthodes de séquençage haut débit, NGS, long-read RNAseq
Le profil recherché
Les candidat(e)s à ce projet pourront aussi bien être des biologistes que des informaticiens/bioinformaticiens, intéressés par l'analyse de données haut-débit. Le groupe dans lequel se fera la thèse possède la double expertise ce qui permettra donc un accompagnement de qualité dans les deux domaines.