Recrutement Université Paris-Saclay GS Life Sciences and Health

Thèse Méthodologies pour l'Étude Conjointe des Altérations Transcriptome - Traductome au Cours du Vieillissement H/F - Université Paris-Saclay GS Life Sciences and Health

  • Paris - 75
  • CDD
  • Université Paris-Saclay GS Life Sciences and Health
Publié le 17 mars 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Life Sciences and Health
École doctorale : Structure et Dynamique des Systèmes Vivants
Laboratoire de recherche : I2BC - Institut de Biologie Intégrative de la Cellule
Direction de la thèse : Daniel GAUTHERET ORCID 0000000215088469
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-03-23T23:59:59

Le vieillissement est associé à des dysfonctionnements progressifs de la régulation transcriptionnelle et traductionnelle, notamment des altérations des programmes d'expression génique et une diminution de la fidélité de la traduction. Les études transcriptomiques et traductomiques actuelles reposent majoritairement sur des analyses à l'échelle du gène et basées sur des génomes de référence, qui ne permettent pas de capturer une grande partie de la variabilité biologiquement pertinente, telle que l'épissage alternatif, la dérépression des transposons, les transcrits de fusion, les frameshifts, les sites d'initiation alternatifs de la traduction ou encore les évènements de readthrough traductionnel. Nous faisons l'hypothèse que de nombreuses dérégulations liées au vieillissement trouvent leur origine dans des variations de séquence à l'échelle infra-génique plutôt que dans des changements d'expression à l'échelle du gène entier.

Ce projet de thèse vise à caractériser conjointement les altérations du transcriptome et du traductome associées au vieillissement à l'aide d'approches sans référence, basées sur les k-mers, couplées à une modélisation stochastique rigoureuse. Des séries temporelles de données RNA-seq et Ribo-seq issues de Caenorhabditis elegans et de Saccharomyces cerevisiae seront analysées afin de détecter des évènements de transcription et de traduction corrélés au vieillissement, y compris des signaux non annotés et de faible abondance.

Afin de garantir la robustesse méthodologique, des jeux de données RNA-seq et Ribo-seq synthétiques seront générés à l'aide de cadres de simulation probabilistes. Ces données simulées permettront une comparaison systématique des stratégies d'analyse et l'optimisation du contrôle du taux de fausses découvertes (FDR). Les méthodes les plus performantes seront ensuite appliquées aux jeux de données réels afin d'obtenir des résultats biologiques fiables. Dans une dernière étape, l'approche sera étendue à des bases de données transcriptomiques et traductomiques à grande échelle provenant d'autres espèces, notamment l'humain, à l'aide d'outils développés en interne pour l'exploration de la base Sequence Read Archive.

Dans l'ensemble, ce travail devrait aboutir à la production d'un atlas complet des altérations transcriptomiques et traductomiques associées au vieillissement, avec un accent particulier sur les évènements de transcription et de traduction non codants, mal annotés ou cryptiques, qui s'accumulent au cours du temps.

Les dysfonctionnements des mécanismes moléculaires au niveau de la transcription et de la traduction, tels que le déclin de la fidélité de la traduction ou les dérèglements des programmes d'expression géniques sont des facteurs clé du vieillissement [5,7]. Actuellement, les variations au niveau du transcriptome et du traductome sont surtout étudiées à l'échelle du gène, à l'aide de méthodes basés sur des génomes de référence qui ne capturent pas toute la variabilité du signal disponible au niveau du transcriptome (tels que les épissages alternatifs, dérepression de transposons, transcrits de fusion) ou du traductome (frameshift, translecture, start alternatif, readthrough). Notre hypothèse est que ce sont les variations à l'intérieur d'un segment génique qui vont expliquer une grande part de ces mécanismes de dérégulations responsables du vieillissement.

Dans cette thèse, on s'attachera à détecter les dysfonctionnements du transcriptome et du traductome liés au vieillissement à l'aide d'approches k-mers sans génome de référence [1], couplée à une modélisation stochastique fine du phénomène étudié [3,4]. Pour cela, on disposera de séries temporelles d'expériences RNA-seq et Ribo-seq chez Caenorhabditis elegans et chez Saccharomyces cerevisiae [6].
Pour garantir la fiabilité de l'approche proposée, nous développerons une méthode de simulation de données synthétiques basée sur des modèles probabilistes [2]. Ces données simulées permettront de comparer différentes stratégies d'analyse et de choisir l'approche la moins bruitée et qui contrôle le mieux le nombre de fausses découvertes (FDR) parmi les évènements intéressants détectés. Ainsi, les résultats trouvés sur les données réelles à l'aide du protocole le plus performant sur les données synthétiques seront les plus robustes.
Une dernière partie de la thèse sera consacré à l'exploration de bases de données transcriptomique et traductomique chez d'autres espèces, notamment chez l'humain à l'aide d'outils d'exploration de la base SRA développés en interne [5].

Contrairement aux approches de transcriptomique classiques et traductomique classiques, nous étudions le transcriptome et le traductome avec des méthodes sans référence. C'est à dire que nous pouvons identifier non seulement les variations d'expression de gènes connus, mais également les variations non référencées, visibles à l'échelle du codon, comme les mutations dans l'ARN, les variations d'épissage, les nouveaux transcrits intergéniques, l'expression d'éléments transposables et la détection d'évènements de traduction de nouveaux transcrits non-référencés. A cette fin nous avons développé une panoplie d'outils [1] pour indexer et parcourir de grandes bases de données RNA-seq et Ribo-seq à l'aide de k-mers, une structure de donnée particulièrement efficace et économe en ressources informatiques. Ces méthodes sont les seules à permettre d'analyser simultanément tous les types de variation d'ARN existant dans les tissus, pour identifier les variations corrélées au vieillissement.
La détection de ces évènements corrélés au vieillissement sera basée sur une modélisation statistique rigoureuse des données afin de pouvoir détecter des signaux de transcriptions et de traduction parfois faibles et non référencés. On pourra notamment utiliser des modèles probabilistes basées sur des lois de comptage pour prendre en compte la nature discrète des données transcriptomiques et traductomiques [4], et des modélisations stochastiques pour prendre en compte la dynamique temporelle du vieillissement au cours du temps [6]. On payera une attention particulière au contrôle du taux de fausses découvertes (FDR) de ces méthodes, notamment en s'appuyant sur des études de comparaisons de stratégies d'analyses basées des données simulées.

Le profil recherché

Le candidat disposera d'une solide expérience en bioinformatique et biostatistique ainsi que des connaissances en biologie moléculaire. Il devrait démontrer un intérêt prononcé pour la modélisation probabiliste de données omics, ainsi qu'une bonne connaissance des données RNA-seq.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.