Recrutement Doctorat.Gouv.Fr

Thèse Compréhension de la Lecture dans le Domaine Clinique et Biomédical H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 30 juin 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire Interdisciplinaire des Sciences du Numérique Direction de la thèse : Sarah COHEN-BOULAKIA Début de la thèse : 2026-09-01 Date limite de candidature : 2026-07-06T23:59:59 Ce projet de doctorat vise à améliorer la fiabilité, la transparence et la vérifiabilité des systèmes de question-réponse (QA) biomédicaux, en développant des méthodes de génération fidèle et contrainte par les preuves, ancrées dans la littérature scientifique. Les récents progrès des grands modèles de langage (LLM), tels que BioBERT (Lee et al., 2020) et PubMedBERT (Gu et al., 2021), ont permis des avancées significatives dans les tâches de compréhension du langage naturel en biomédecine. En parallèle, les approches de génération augmentée par récupération (retrieval-augmented generation, RAG) (Lewis et al., 2020) ont permis aux modèles de langage d'accéder à de vastes sources de connaissances externes, telles que PubMed et PubMed Central, les rendant particulièrement adaptés aux applications biomédicales à forte intensité en connaissances.
Malgré ces avancées, garantir que les réponses générées soient entièrement appuyées par des preuves scientifiques vérifiables demeure un défi majeur. Les systèmes de question-réponse biomédicaux sont de plus en plus attendus non seulement pour produire des réponses exactes, mais aussi pour les justifier à l'aide de preuves explicites et traçables issues de la littérature scientifique. Cependant, les systèmes actuels de génération augmentée par récupération peuvent identifier des documents pertinents tout en produisant des réponses qui ne reflètent qu'en partie, voire dépassent, les informations contenues dans les sources récupérées. Cet écart soulève des questions importantes en matière de fidélité, de transparence et de confiance, en particulier dans des domaines critiques tels que la médecine fondée sur les preuves et l'aide à la décision clinique.
Le question answering biomédical est intrinsèquement plus complexe que celui du domaine général, car il nécessite souvent de synthétiser des informations issues de multiples études scientifiques, essais cliniques et bases de données biomédicales. Les ensembles de données existants tels que PubMedQA (Jin et al., 2019) et BioASQ (Nentidis et al., 2020) fournissent des références utiles pour évaluer la pertinence des réponses et les performances de récupération. Cependant, ils offrent un soutien limité pour analyser la manière dont les différentes affirmations d'une réponse générée sont ancrées dans les preuves récupérées, laissant ouverte la question de l'attribution et de la vérification fine des preuves.
La question centrale de cette thèse est donc la suivante : comment les systèmes de question-réponse biomédicaux peuvent-ils générer des réponses à la fois exactes et démontrablement fondées sur des preuves scientifiques ?
Pour y répondre, ce projet vise à développer un cadre de question-réponse biomédical fidèle, reposant sur une récupération contrainte par les preuves et un ancrage vérifiable dans la littérature scientifique. Les objectifs de recherche incluent l'amélioration des stratégies de récupération sur de vastes corpus biomédicaux, le développement de méthodes de génération garantissant l'utilisation fidèle des preuves récupérées, ainsi que la conception de mécanismes d'attribution et de vérification des preuves au niveau des affirmations individuelles. En outre, le projet explorera des méthodologies d'évaluation allant au-delà des métriques classiques de question-réponse, en mesurant explicitement la fidélité, l'alignement avec les preuves et la fiabilité des systèmes.
Biomedical natural language processing has advanced significantly in recent years with the development of large language models (LLMs) and transformer-based architectures. Models such as BioBERT and PubMedBERT, as well as retrieval-augmented generation (RAG) approaches using sources like PubMed, have improved performance on biomedical language understanding and question answering tasks.
However, ensuring the reliability and verifiability of generated answers remains a key challenge. Although current systems can retrieve relevant documents, they do not always guarantee that generated responses are fully grounded in the retrieved evidence, raising concerns about faithfulness and trustworthiness in high-stakes biomedical settings.
Existing benchmarks such as PubMedQA and BioASQ support evaluation of biomedical QA systems, but provide limited support for fine-grained evidence attribution at the claim level.
These limitations motivate research on more faithful and evidence-grounded biomedical question answering systems. - To investigate retrieval strategies capable of identifying high-quality biomedical evidence from large scientific corpora.
- To develop generation methods that encourage faithful utilization of retrieved evidence.
- To design mechanisms for claim-level evidence attribution and answer verification.
- To establish evaluation protocols for measuring faithfulness and evidence-grounding quality in biomedical QA systems.

Le profil recherché

Le ou la candidat(e) devra être titulaire d'un Master (ou diplôme équivalent) en informatique, intelligence artificielle, science des données ou linguistique computationnelle.
Le profil recherché présente un fort intérêt pour le traitement automatique des langues (TAL), l'apprentissage automatique (machine learning) et l'intelligence artificielle de confiance (trustworthy AI). Une expérience préalable en informatique biomédicale, en recherche d'information ou en analyse de documents scientifiques constituerait un atout, sans être toutefois indispensable.
Le ou la candidat(e) devra démontrer :
- de solides capacités d'analyse et de résolution de problèmes ;
- une aptitude à mener des travaux de recherche de manière autonome ;
- un intérêt pour la recherche interdisciplinaire à l'interface entre l'intelligence artificielle et la biomédecine ;
- une motivation à publier dans les principales conférences et revues en TAL, intelligence artificielle et informatique biomédicale.
Compétences requises :
- Excellentes compétences en programmation Python ;
- Connaissances en apprentissage automatique et en apprentissage profond (deep learning) ;
- Expérience avec des bibliothèques et frameworks de TAL (par exemple PyTorch et Hugging Face) ;
- Bonne compréhension des architectures de type Transformer et des grands modèles de langage (LLM) ;
- Familiarité avec la conception d'expériences et les méthodes d'évaluation statistique ;
- Bonnes capacités de communication écrite et orale en anglais.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi