Recrutement Doctorat.Gouv.Fr

Thèse Modélisation Physique et Intelligence Artificielle pour l'Imagerie de la Transcription et de la Traduction au Niveau de la Cellule Unique H/F - Doctorat.Gouv.Fr

  • Montpellier - 34
  • CDD
  • Doctorat.Gouv.Fr
Publié le 9 avril 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université de Montpellier
École doctorale : Sciences Chimiques et Biologiques pour la Santé
Laboratoire de recherche : IGMM - Institut de Génétique Moléculaire de Montpellier
Direction de la thèse : Mounia LAGHA ORCID 0000000270821950
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-11T23:59:59

La régulation de la transcription et de la traduction est au coeur de la biologie du développement, car ces processus orchestrent les programmes d'expression génique qui déterminent le devenir cellulaire et la formation des tissus.
L'analyse quantitative de la dynamique transcriptionnelle et traductionnelle au niveau de la cellule unique fournit des informations
cruciales sur le contrôle des gènes lors des premières étapes du développement. Dans des travaux antérieurs, des modèles physiques de
transcription et de traduction ont été utilisés pour déconvoluer les signaux de microscopie et en déduire les mécanismes sous-jacents.
Ces modèles permettent d'estimer les paramètres cinétiques et d'identifier les régulateurs clés à partir des données expérimentales.

Cependant, ces modèles présentent des incertitudes, telles que des formes fonctionnelles inconnues ou une hétérogénéité dans la dynamique
de production des transcrits et des protéines. Cette variabilité, liée à des différences dans la cinétique moléculaire ou les interactions
régulatrices, influence les signaux observés d'ARN et de protéines et n'est pas directement mesurable. Pour surmonter ces limites, cette thèse
propose de combiner intelligence artificielle (IA) et modélisation physique. En intégrant l'IA avec des contraintes mécanistiques, il sera possible
d'apprendre les aspects inconnus ou hétérogènes de la dynamique transcriptionnelle et traductionnelle à partir des données d'imagerie, tout en
garantissant la cohérence biologique et l'interprétabilité des modèles.

Le cadre développé sera appliqué à des données d'imagerie en temps réel de la transcription et de la traduction chez l'embryon de Drosophile,
en se concentrant sur des gènes essentiels au développement précoce. Cette approche permettra d'inférer des paramètres cinétiques spécifiques
à chaque gène, de prendre en compte l'hétérogénéité dans la production moléculaire et de révéler les mécanismes régulateurs contrôlant l'expression
génique au cours des premières étapes du développement. En combinant IA et modélisation physique, ce projet vise à construire des modèles prédictifs
capables d'expliquer les observations expérimentales et de générer des hypothèses testables.

Finalement, ce travail contribuera à une meilleure compréhension de la régulation de la transcription et de la traduction au cours du développement,
offrira un cadre computationnel robuste pour l'analyse des données d'imagerie cellulaire unique et établira une méthodologie polyvalente
applicable à d'autres gènes, stades du développement ou organismes modèles.

La régulation de la transcription et de la traduction est un élément central de la biologie du développement.
Ces processus orchestrent les programmes d'expression génique qui déterminent le destin cellulaire, la différenciation et l'organisation des tissus.
Une compréhension quantitative de ces dynamiques est essentielle pour élucider comment les cellules coordonnent l'activation des gènes dans l'espace et le temps,
et comment des perturbations peuvent conduire à des anomalies développementales.

Les approches expérimentales récentes utilisent l'imagerie en temps réel à l'échelle de la cellule unique pour suivre la production de transcrits et de protéines.
Cependant, les signaux obtenus par microscopie sont souvent bruyants et convolués, rendant l'extraction des paramètres cinétiques complexes. Pour répondre à ce problème,
des modèles physiques de transcription et de traduction ont été développés pour déconvoluer les signaux
et identifier les mécanismes moléculaires sous-jacents. Ces modèles permettent d'estimer des paramètres tels que la vitesse d'initiation transcriptionnelle,
la durée des bursts, la vitesse d'élongation ou la traduction, et d'identifier des régulateurs clés.

Parmi ces méthodes, BurstDeconv constitue un outil particulièrement puissant pour l'analyse de la transcription en bursts. Cette approche décompose les signaux de
fluorescence en épisodes discrets d'activité transcriptionnelle, permettant de mesurer la fréquence, la durée et l'amplitude des bursts.
BurstDeconv fournit ainsi une vision détaillée de l'hétérogénéité transcriptionnelle, révélant la variabilité entre gènes et entre cellules et permettant
de relier les événements moléculaires aux phénomènes biologiques observés.

Malgré ces avancées, plusieurs incertitudes persistent dans les modèles physiques : certaines fonctions régulatrices restent inconnues, et la production de transcrits
et de protéines présente une hétérogénéité qui n'est pas directement observable. L'intégration de méthodes d'intelligence artificielle (IA) avec ces modèles physiques
constitue une approche prometteuse pour surmonter ces limites.
En combinant apprentissage automatique et contraintes mécanistiques, il est possible d'inférer les aspects inconnus ou hétérogènes de la dynamique transcriptionnelle
et traductionnelle, tout en assurant la cohérence biologique et la prédictibilité des modèles.

ouvelles méthodes de déconvolution du signal en imagérie de la transcription et de la traduction

Nouvelles méthodes d'identification de modèle combinant IA et modélisation mécanistique.

Nous proposons une approche hybride pour identifier et affiner des modèles de transcription et traduction à partir de données en cellule unique.
Les signaux d'imagerie sont d'abord segmentées, tracés et calibrés, puis déconvolués avec BurstDeconv pour extraire les épisodes discrets
(initiation). Cette étape comporte des incertitudes, par exemple une connaissance incomplète de la contribution individuelle
des polymérases ou des ribosomes au signal observé. Ces incertitudes sont prises en compte dans la modélisation en considérant
des distributions de paramètres et en laissant les réseaux de neurones apprendre ces contributions.

Ces informations alimentent un modèle physique de base, décrivant la cinétique transcriptionnelle et traductionnelle.
Les fonctions de régulation inconnues ou dependentes du temps sont représentées par des réseaux de neurones,
entraînés sur les données tout en respectant les contraintes physiques, ce qui permet de modéliser à la fois
les dynamiques observables et les mécanismes régulateurs non directement accessibles,
tout en intégrant l'incertitude issue de la déconvolution.

L'optimisation de la structure du modèle, discrète et combinatoire, est guidée par
l'apprentissage par renforcement (RL). La politique RL propose séquentiellement des modifications
de structure (ajout, suppression ou transformation de termes) et évolue au fur et à mesure de l'exploration,
apprenant à privilégier les configurations les plus prometteuses selon un reward combinant qualité du fit,
simplicité, cohérence physique et gestion de l'incertitude. Les paramètres continus de chaque modèle
candidat sont optimisés classiquement, tandis que les réseaux de neurones ajustent les fonctions régulatrices
inconnues et prennent en compte l'incertitude dans la contribution des machineries transcriptionnelles et traductionnelles.

Lorsque de nouvelles données sont disponibles, le modèle peut être raffiné progressivement : les paramètres
sont recalibrés et des mécanismes supplémentaires (états promoteurs, interactions non linéaires et dependentes du temps)
sont ajoutés uniquement si les données le justifient. Cette approche hybride permet de combiner rigueur physique,
flexibilité des réseaux de neurones et exploration efficace de l'espace combinatoire grâce à la politique RL adaptative,
produisant des modèles mécanistiques précis, interprétables et robustes face aux incertitudes expérimentales.

Le profil recherché

Master en biophysique, biologie quantitative, biologie mathématique ou domaine connexe

Bonne maîtrise de la modélisation dynamique : EDO, modèles probabilistes

Solide expérience en calcul scientifique

Compétences en programmation (Python, Julia ou Matlab)

Intérêt pour l'intelligence artificielle et l'analyse de données

Bon niveau d'anglais écrit et oral

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.