Thèse Graphes de Patients et Représentations Latentes pour l'Aide au Raisonnement Clinique H/F - Doctorat.Gouv.Fr
- Reims - 51
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Reims Champagne - Ardenne École doctorale : MPSNI - Mathématiques Physique Sciences du Numérique et de l'Ingénieur Laboratoire de recherche : Centre de Recherches en STIC Direction de la thèse : Bart LAMIROY Début de la thèse : 2026-10-01 Date limite de candidature : 2026-04-30T23:59:59 L'intégration des systèmes d'intelligence artificielle dans la pratique médicale se heurte à des obstacles bien documentés. Au-delà des questions de performance, les praticiens semblent régulièrement manifester un manque de confiance envers des outils dont les décisions sont difficiles à interpréter et dont la logique interne est rarement alignée avec leur mode de raisonnement. Ce raisonnement clinique repose en effet sur de nombreux mécanismes cognitifs entremêlés : comparaison de cas similaires, raisonnement par analogie, identification de profils typiques ou de situations inhabituelles. Les modèles actuels, qu'il s'agisse de classifieurs classiques ou de grands modèles de langage, produisent des prédictions souvent performantes mais peu lisibles, ce qui freine leur adoption dans les environnements médicaux.
Ce projet propose d'exploiter les représentations vectorielles denses produites par les modèles d'apprentissage, les embeddings, pour construire des graphes de patients (à partir de données potentiellement multimodales) : des structures dans lesquelles chaque noeud correspond à un individu et chaque lien traduit une relation de proximité ou d'analogie apprise automatiquement. Ces graphes sont enrichis d'indicateurs de représentativité, identifiant les patients prototypiques, et d'atypicité, signalant les situations rares ou singulières. L'approche s'inspire de travaux et résultats issus de la psychologie cognitive (théorie des prototypes, raisonnement par analogie, mémoire relationnelle).
Sur le plan méthodologique, il s'agira de formaliser des métriques de représentativité et d'atypicité à partir des embeddings produits par différents types de modèles (classifieurs, auto-encodeurs, grands modèles de langage, modèles multimodaux), et d'étudier la robustesse et la stabilité des graphes construits. Sur le plan expérimental, les méthodes seront d'abord évaluées sur données simulées puis appliquées à des données médicales réelles textes, images, données tabulaires.
Le profil recherché
Le projet s'adresse à des candidat·e·s rigoureux·ses, à l'aise avec les fondements de l'apprentissage automatique et du traitement de données, et capables de mener un travail de recherche complet, de la formalisation à l'implémentation de prototype fonctionnel.
Au-delà des compétences techniques, le projet requiert un intérêt marqué pour la dimension « utilisateur ». Une sensibilité aux questions d'acceptabilité des systèmes d'IA, constitue un atout sérieux.