Thèse de la Quantité à la Fonction Développement d'Un Cadre Prédictif Dynamique Intégrant la Fonction Primaire du Greffon et des Biomarqueurs Numériques pour Guider la Transplantation d'Îlots Panc H/F - Université de Lille
- Lille - 59
- CDD
- Université de Lille
Les missions du poste
Établissement : Université de Lille
École doctorale : Biologie Santé de Lille
Laboratoire de recherche : Recherche translationnelle sur le diabète
Direction de la thèse : Francois PATTOU ORCID 0000000183883766
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-28T23:59:59
La greffe d'îlots pancréatiques est une thérapie cellulaire validée pour les patients atteints de diabète de type 1 instable. Cependant, les décisions cliniques relatives à l'acceptation des greffons et à la stratégie de transplantation reposent encore majoritairement sur des critères quantitatifs simples, en particulier la masse d'îlots transplantée. Cette approche ne permet pas de prédire de manière fiable le bénéfice clinique individuel, alors que des greffons de masse comparable peuvent produire des performances métaboliques très différentes.
Nous avons récemment démontré, dans la cohorte internationale du Collaborative Islet Transplant Registry, que la fonction primaire du greffon (PGF), mesurée un mois après transplantation, est fortement associée aux résultats métaboliques à long terme. Cette observation fournit une base scientifique solide pour un changement de paradigme vers une stratégie de greffe guidée par le bénéfice fonctionnel attendu.
L'objectif de cette thèse est de transformer ce biomarqueur clinique validé en un cadre prédictif dynamique et, à terme, en un biomarqueur numérique non invasif. L'hypothèse centrale est que la PGF constitue un état biologique latent résultant d'interactions complexes entre donneur, produit, procédure et micro-environnement métabolique du receveur, et que cet état peut être estimé de manière robuste par des modèles prédictifs séquentiels et par des signaux numériques issus du monitoring glycémique continu.
Le projet est structuré en trois phases. La première phase, déjà réalisée, a établi la valeur pronostique de la PGF. La deuxième phase constitue le coeur du travail doctoral et vise à développer, à partir des données multicentriques du registre CITR, des modèles prédictifs permettant d'estimer la probabilité individuelle d'obtenir une PGF satisfaisante à chaque étape du parcours de greffe. Cette phase inclut la formalisation des fenêtres décisionnelles, l'intégration séquentielle des informations receveur, donneur et procédure, ainsi que l'étude des interactions dynamiques entre ces dimensions. Les modèles seront construits à l'aide de méthodes pénalisées, validés par approches croisées et évalués en termes de discrimination, calibration et utilité clinique.
La troisième phase vise à développer un biomarqueur numérique non invasif, le Digital Islet Score, à partir des données de monitoring glycémique continu de la cohorte de Lille. Ce biomarqueur permettra de reconstruire la PGF à partir de signaux numériques haute fréquence, de remplacer les évaluations invasives actuelles et d'assurer un suivi longitudinal de la fonction du greffon. Cette phase constitue une innovation méthodologique majeure à l'interface entre transplantation, médecine numérique et intelligence artificielle clinique.
Ce projet permettra d'améliorer la personnalisation des stratégies de greffe, de structurer un cadre fonctionnel de référence pour la transplantation d'îlots et de contribuer au développement d'une médecine de transplantation cellulaire de précision.
1. Contexte et justification scientifique
La greffe d'îlots pancréatiques constitue aujourd'hui une thérapie cellulaire validée chez les patients atteints de diabète de type 1 instable. Malgré les progrès techniques, les décisions cliniques relatives à l'acceptation des greffons, au déclenchement des procédures d'isolement et à la libération des produits cellulaires reposent encore majoritairement sur des critères quantitatifs simples, en particulier la masse d'îlots transplantée exprimée en îlots équivalents.
Cette approche suppose qu'une quantité suffisante d'îlots garantit une restauration fonctionnelle adéquate. Or, de nombreuses données cliniques montrent que des greffons contenant des masses cellulaires comparables peuvent produire des performances métaboliques très différentes. Cette variabilité reflète l'influence conjointe de la biologie du donneur, de la qualité du produit, des paramètres techniques de greffe et du micro-environnement métabolique du receveur.
Dans d'autres domaines de la transplantation, l'introduction de scores fonctionnels prédictifs tels que le MELD en transplantation hépatique ou le KDPI en transplantation rénale a profondément modifié les stratégies d'allocation et de prise de décision clinique. En transplantation d'îlots, un tel cadre fonctionnel standardisé fait encore défaut.
Nous avons récemment démontré, dans la cohorte internationale du Collaborative Islet Transplant Registry, que la fonction primaire du greffon mesurée précocement à un mois après transplantation est fortement associée aux résultats métaboliques à long terme. Cette observation fournit une base scientifique solide pour un changement de paradigme, passant d'une logique de seuil quantitatif à une stratégie guidée par le bénéfice fonctionnel attendu.
Ce projet s'inscrit dans cette transition conceptuelle et vise à transformer un biomarqueur clinique validé en un système prédictif dynamique et, à terme, en un biomarqueur numérique non invasif.
2. Hypothèse centrale et structure scientifique du projet
L'hypothèse centrale du projet est que la fonction primaire du greffon constitue un état biologique latent résultant d'interactions non linéaires entre le donneur, le produit cellulaire, la procédure de greffe et le micro-environnement métabolique du receveur, et que cet état peut être estimé de manière robuste par différentes modalités de mesure, cliniques ou numériques.
Nous postulons en particulier que certaines dimensions, notamment le profil métabolique du receveur, modulent l'effet fonctionnel du greffon indépendamment de la masse cellulaire transplantée, et que la fonction primaire peut être formalisée comme une variable pivot dynamique guidant les décisions thérapeutiques successives.
Sur le plan scientifique, la thèse ne porte pas sur la validation biologique de la fonction primaire du greffon en tant que biomarqueur, qui a déjà été établie , mais sur :
- la formalisation méthodologique d'un cadre prédictif dynamique,
- l'étude des interactions structurelles entre donneur, procédure et receveur,
- la transposition numérique d'un biomarqueur biologique vers un biomarqueur digital continu.
Le projet est structuré en trois phases complémentaires. La phase 1, déjà réalisée, a permis d'établir la valeur pronostique de la fonction primaire. La phase 2 constitue le coeur du travail doctoral et vise à développer un système prédictif dynamique à partir des données CITR. La phase 3 porte sur la construction et la validation d'un biomarqueur numérique dérivé du CGM au sein de la cohorte de Lille.
Work Package 1 (réalisé)
Ce work package a permis de démontrer dans la plus grande cohorte internationale disponible l'association linéaire et indépendante entre la fonction primaire du greffon mesurée à un mois et les résultats métaboliques à cinq ans, indépendamment de la masse d'îlots greffée. Cette phase constitue la base conceptuelle du projet doctoral.
Work Package 2 (coeur de la thèse)
L'objectif est de développer et valider un cadre prédictif dynamique permettant d'estimer, pour un patient donné, la probabilité d'obtenir une fonction primaire satisfaisante à chaque étape du parcours de greffe. Ce travail inclut la formalisation des fenêtres décisionnelles, l'intégration séquentielle des informations cliniques et biologiques, et l'étude des interactions entre variables receveur, donneur et procédure .
Work Package 3 (innovation méthodologique)
L'objectif est de développer un biomarqueur numérique non invasif, le Digital Islet Score, capable de reconstruire la fonction primaire du greffon à partir de données CGM haute fréquence. Ce work package vise à étudier comment une fonction biologique latente peut être estimée à partir de signaux numériques continus et à valider la concordance clinique de ce biomarqueur.
Les applications futures aux thérapies dérivées de cellules souches ou à la xénotransplantation constituent une perspective à long terme de l'équipe mais ne font pas partie du périmètre direct du travail doctoral.
- Méthodes
La phase 2 du projet s'appuiera sur les données multicentriques du registre international CITR incluant des receveurs atteints de diabète de type 1 ayant bénéficié de greffes d'îlots issues de donneurs uniques.
L'analyse portera initialement sur la première injection puis sera étendue aux deuxième et troisième injection selon une architecture méthodologique identique.
La phase 3 reposera sur la cohorte longitudinale de Lille, permettant l'exploitation de données CGM standardisées et de données brutes haute fréquence.
La fonction primaire du greffon sera évaluée à un mois après chaque injection à l'aide du BETA-2 score. Afin de tenir compte de l'augmentation progressive de la masse bêta fonctionnelle au cours des greffes successives, des seuils spécifiques seront définis pour chaque étape sur la base de la distribution observée dans la cohorte CITR.
La fonction primaire sera classée comme satisfaisante ou insuffisante selon ces seuils.
Les données manquantes seront imputées par des méthodes non paramétriques basées sur les forêts aléatoires afin de préserver les relations non linéaires et les interactions complexes entre variables.
Les variables seront classées selon leur « modifiabilité » au moment de la décision clinique. Les caractéristiques du receveur non modifiables dans la fenêtre décisionnelle, car celui-ci est connu au moment de la proposition d'organe seront considérées comme figées et systématiquement intégrées dans les modèles. Les paramètres liés à l'isolement et à la procédure de greffe seront analysés comme leviers modifiables. Après chaque transplantation, la fonction primaire observée à un mois deviendra une variable pivot définissant le nouvel état biologique du receveur pour les décisions ultérieures.
La stratégie de modélisation reposera sur une approche séquentielle. Pour chaque injection, un modèle pré-isolement intégrera les caractéristiques du receveur et du donneur au moment de l'offre de greffon.
Un second modèle post-isolement intégrera les caractéristiques réelles du produit et les paramètres de la procédure afin d'actualiser la probabilité prédite.
La sélection des variables sera réalisée par régression pénalisée de type LASSO avec validation croisée. Les variables sélectionnées seront intégrées dans des modèles multivariés finaux interprétables. Les modèles post-isolement seront ajustés sur la masse d'îlots transplantée.
Les effets centre et les effets temporels liés à l'évolution des pratiques seront pris en compte par des ajustements dédiés et des analyses stratifiées par période. Des validations croisées inter-centres seront réalisées afin d'évaluer la robustesse des performances.
Les performances des modèles seront évaluées en termes de discrimination, de calibration et d'utilité clinique, notamment par des analyses de bénéfice décisionnel comparant la stratégie PGF-guidée à l'approche actuelle reposant sur les seuils IEQ.
Les coefficients des modèles finaux seront utilisés pour construire un score clinique fournissant une probabilité individuelle de fonction primaire satisfaisante utilisable au moment de l'offre de greffon, après isolement et pour guider les décisions de re-greffe.
Dans la phase 3, le Digital Islet Score sera développé à partir des données CGM haute fréquence. Des approches de modélisation supervisée seront utilisées en prenant comme cibles le BETA-2 score, les mesures de C-peptide et les trajectoires métaboliques longitudinales. Les performances du biomarqueur numérique seront évaluées par des analyses de concordance, de discrimination et de capacité à détecter précocement les altérations fonctionnelles.
- Risques méthodologiques et stratégies d'atténuation
Les principaux risques concernent la dépendance aux données existantes, l'hétérogénéité inter-centres, le sur-apprentissage et les biais temporels. Ces risques seront limités par des analyses de sensibilité, des validations croisées, des jeux de variables restreints, et des approches alternatives de modélisation.
Une attention particulière sera portée à l'autonomie scientifique du doctorant par la réalisation d'analyses exploratoires indépendantes, la comparaison de stratégies de modélisation et la validation critique des hypothèses.
- Timeline, milestones et indicateurs go/no-go
Mois 1 à 6 : harmonisation des données CITR et pipelines analytiques. Go/no-go basé sur la constitution d'une base analytique reproductible.
Mois 7 à 15 : développement des modèles prédictifs pour la première injection. Go/no-go basé sur performances discriminantes et calibration.
Mois 16 à 24 : extension dynamique aux greffes répétées. Go/no-go basé sur la stabilité inter-centres.
Mois 25 à 36 : développement et validation du Digital Islet Score. Go/no-go basé sur la concordance avec les biomarqueurs biologiques et l'utilité clinique démontrée.
Le profil recherché
Le projet de thèse requiert un profil pluridisciplinaire à l'interface entre sciences biomédicales, biostatistique et analyse de données cliniques.
Le ou la candidat(e) devra être titulaire d'un master ou d'un diplôme équivalent en biostatistique, sciences des données, bioinformatique, ingénierie biomédicale, épidémiologie ou sciences de la vie avec une forte composante quantitative.
Des compétences en analyse statistique appliquée aux données de santé sont attendues, incluant la maîtrise des modèles de régression, des méthodes de validation croisée et des principes de modélisation prédictive. Une expérience préalable en programmation scientifique (R, Python ou équivalent) et en gestion de bases de données cliniques constituera un atout important.
Un intérêt marqué pour la recherche translationnelle, la transplantation, la diabétologie ou la médecine numérique est souhaité. La capacité à comprendre des problématiques cliniques complexes et à les traduire en questions méthodologiques rigoureuses est essentielle pour la réussite du projet.
Le projet impliquant des collaborations multicentriques et internationales, des compétences en communication scientifique en anglais, à l'écrit comme à l'oral, sont requises.
Enfin, une forte motivation pour le travail de recherche, une autonomie progressive, un esprit critique, ainsi qu'une capacité à travailler en équipe pluridisciplinaire (cliniciens, biostatisticiens, ingénieurs) seront des qualités déterminantes.