Recrutement Doctorat.Gouv.Fr

Thèse Metatron - un Assistant IA Piloté par des Experts pour la Prise de Décision Multidisciplinaire dans les Métastases Hépatiques Colorectales H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 2 juillet 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Life Sciences and Health École doctorale : Cancérologie : Biologie - Médecine - Santé Laboratoire de recherche : Physiopathogenèse et traitement des maladies du foie Direction de la thèse : Eric VIBERT ORCID 0000000332971947 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-07-16T23:59:59 Le projet METATRON vise à développer un algorithme décisionnel basé sur l'IA pour guider le traitement des métastases hépatiques d'origine colorectale (MHCR), qui affectent 25 à 50 % des patients atteints de cancer colorectal. L'objectif est de créer un agent basé sur un grand modèle de langage (LLM) capable d'intégrer données cliniques, recommandations et données de recherche via un système RAG, pour représenter l'expertise des chirurgiens hépato-biliaires en réunion de concertation pluridisciplinaire.

Pour la phase initiale, l'équipe a utilisé 100 cas cliniques simulés. Le LLM (gpt-oss-120B) a d'abord été testé en simple analyse de cas. Face aux limitations observées, un flux de travail structuré a été développé, organisé en trois étapes : évaluation de la tumeur primitive, des métastases hépatiques, et d'une éventuelle maladie extrahépatique. Cette structure encodée en JSON permet une interrogation itérative du modèle.

Quatre approches ont été comparées : LLM de base, version augmentée par RAG (293 études), workflow seul, et hybride workflow+RAG. Pour la recommandation finale, le modèle doit fournir une évaluation de résécabilité (résécable d'emblée, potentiellement résécable, non résécable), une stratégie oncologique détaillée, et la liste des données manquantes.

L'évaluation a utilisé un cadre LLM-as-a-jury avec trois modèles juges experts, selon quatre critères : exhaustivité, concordance étape par étape, adaptation au cas, et concordance des données manquantes.

Les résultats montrent que l'approche workflow seul améliore l'alignement avec le jugement expert, particulièrement pour la concordance étape par étape. Le RAG seul n'a pas amélioré significativement les performances, et l'hybride a montré une diminution d'alignement. Le critère le plus faible était la concordance des données manquantes.

Concernant la résécabilité, le LLM de base surestimait les cas résécables d'emblée, tandis que les approches workflow et RAG surestimaient la catégorie potentiellement résécable.

Une évaluation humaine est prévue avec 10 chirurgiens HPB évaluant chacun 10 cas en aveugle sur une échelle de Likert.

En conclusion, METATRON démontre qu'un flux de travail structuré améliore l'alignement clinique des recommandations, mais que la gestion des données manquantes et l'équilibre de la complexité d'incitation restent des défis majeurs. Les métastases hépatiques d'origine colorectale (MHCR) constituent un défi clinique majeur, affectant 25 à 50 % des patients atteints de cancer colorectal. Le pronostic est extrêmement hétérogène, et il existe un manque d'approches thérapeutiques véritablement personnalisées. Les réunions de concertation pluridisciplinaire sont la clé de voûte de la décision, mais elles reposent sur une expertise humaine parfois inégalement répartie. Les grands modèles de langage offrent une opportunité nouvelle d'assister les cliniciens en synthétisant des données complexes et en proposant des stratégies alignées sur les recommandations. Cependant, leur application en cancérologie chirurgicale reste expérimentale et soulève des questions de fiabilité, de structuration du raisonnement et de gestion des données manquantes. L'objectif principal du projet METATRON est de développer un agent conversationnel basé sur un LLM capable d'intégrer les données cliniques des patients, les recommandations en vigueur et les résultats de recherche récents via un système RAG (Retrieval-Augmented Generation). Cet agent vise à représenter l'expertise d'un chirurgien hépato-biliaire dans les discussions en réunion de concertation pluridisciplinaire pour la prise en charge des métastases hépatiques d'origine colorectale.

Les objectifs secondaires sont :

Comparer différentes approches d'incitation (zero-shot, few-shot, workflow structuré, RAG, hybride).
Évaluer l'alignement des recommandations générées par LLM avec celles d'experts humains.
Identifier les limites actuelles des LLM (gestion des données manquantes, complexité d'incitation). Le projet utilise 100 cas cliniques simulés créés par des chirurgiens hépato-biliaires. Le LLM retenu est gpt-oss-120B, déployé localement. Quatre approches sont comparées :

LLM de base (incitation simple)
LLM augmenté par RAG (293 études, base vectorielle Milvus, embedding Qwen3-0.6B)
Workflow structuré seul (arbre JSON en trois étapes : tumeur primitive, métastases hépatiques, maladie extrahépatique)
Approche hybride (workflow + RAG)
L'évaluation est réalisée par un cadre automatisé LLM-as-a-jury avec trois modèles juges experts selon quatre critères : exhaustivité, concordance étape par étape, concordance d'adaptation au cas, et concordance des données manquantes. Une évaluation humaine est également prévue avec 10 chirurgiens évaluant 10 cas chacun en aveugle sur une échelle de Likert.

Le profil recherché

Compétences cliniques et chirurgicales :
Le doctorant devait posséder une solide formation en chirurgie générale et digestive, avec une spécialisation avérée en chirurgie hépato-biliaire et pancréatique. Une expérience internationale dans des centres de référence était un atout majeur, de même qu'une connaissance approfondie des recommandations en vigueur pour la prise en charge des métastases hépatiques d'origine colorectale.

Compétences en recherche et méthodologie :
Une expérience avérée en publication scientifique internationale était indispensable, avec une capacité à rédiger et à faire accepter des articles dans des revues indexées. Le doctorant devait maîtriser les méthodes de recherche clinique (analyses par score de propension, études multicentriques, revues systématiques) et être familier avec les concepts d'évaluation des modèles prédictifs.

Compétences technologiques et en IA :
Une appétence marquée pour l'intelligence artificielle et les grands modèles de langage était nécessaire, sans nécessairement être un informaticien de formation. Le doctorant devait comprendre les principes du RAG (Retrieval-Augmented Generation), du prompting structuré, des bases vectorielles (Milvus) et des plongements sémantiques (embeddings). Une capacité à collaborer avec des data scientists et des ingénieurs en IA était essentielle.

Qualités personnelles :
Le projet exigeait une forte autonomie, une rigueur méthodologique, et une capacité à travailler au sein d'une équipe multidisciplinaire mêlant chirurgiens, hépatologues, oncologues, radiologues et spécialistes en IA. La maîtrise de l'anglais scientifique (fluent, publications et communications internationales) et du français (courant pour l'environnement clinique en France) était impérative.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi