Recrutement Doctorat.Gouv.Fr

Thèse 'Scientific Machine Learning' Multi-Fidélité avec Entrées Hétérogènes H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 30 mars 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Institut Polytechnique de Paris École polytechnique
École doctorale : Mathématiques Hadamard
Laboratoire de recherche : CMAP - Centre de Mathématiques appliquées
Direction de la thèse : Pietro Marco CONGEDO ORCID 0000000332663549
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-08-31T23:59:59

De nombreux problèmes d'ingénierie et de sciences reposent sur des phénomènes physiques complexes, difficiles à reproduire expérimentalement, et pour lesquels les campagnes de mesure sont coûteuses. La simulation numérique est donc essentielle pour la prédiction, la conception et l'aide à la décision. Dans des applications multi-physiques, fortement couplées et paramétrées, une simulation haute fidélité du système complet est souvent trop coûteuse pour être répétée (optimisation, quantification d'incertitudes, calibration, contrôle). Un exemple illustratif est l'hémodynamique computationnelle : les simulations 3D instationnaires sur géométries artérielles patient-spécifiques nécessitent la résolution des équations de Navier-Stokes, couplées à l'élasticité des parois et à des conditions aux limites issues de données cliniques ; elles sont précises mais trop coûteuses pour des études paramétriques systématiques, d'où l'usage de modèles simplifiés (1D), réduits ou surrogats.

L'enjeu scientifique central est de combiner, de manière rigoureuse, l'information issue de modèles de fidélité différente pour obtenir la précision du modèle haute fidélité à coût réduit : c'est l'objectif des méthodes multi-fidélité. Toutefois, une limite importante reste insuffisamment traitée : la présence d'entrées et/ou de sorties hétérogènes entre modèles (paramétrisations différentes, discrétisations distinctes, variables d'état non partagées), qui empêche l'application directe des cadres multi-fidélité standards supposant un espace d'entrée commun et une correspondance point à point des sorties.

Cette thèse, financée par le projet MediTwin (jumeaux numériques patient-spécifiques en santé), vise à développer des méthodes multi-fidélité scalables capables de fusionner des modèles aux paramétrisations non concordantes et des structures de données hétérogènes. Le travail abordera : (i) la définition de représentations latentes communes reliant des espaces d'entrée hétérogènes ; (ii) la construction de surrogats multi-fidélité cohérents malgré ces hétérogénéités ; (iii) la quantification et la propagation des incertitudes dues au faible volume de données haute fidélité et aux erreurs d'alignement/embedding ; (iv) la conception de stratégies d'échantillonnage adaptatif (active learning) pour sélectionner efficacement les simulations haute fidélité. La méthodologie s'appuiera sur l'apprentissage de représentations (autoencodeurs/VAEs, Deep CCA), l'apprentissage d'opérateurs (DeepONet, Fourier Neural Operator), des approches probabilistes (co-krigeage en espace latent, modèles hybrides deep-probabilistes) et des techniques d'optimisation bayésienne pour le plan d'expériences.

Le sujet s'inscrit dans la littérature de multi-fidélité (co-krigeage Kennedy-O'Hagan, fusion non linéaire, inférence bayésienne multi-fidélité, surrogats probabilistes profonds) et plus largement dans le champ du Scientific Machine Learning (PINNs, apprentissage d'opérateurs via DeepONet/FNO).
Le défi ciblé est celui des entrées/sorties hétérogènes : différences de paramétrisation, de discrétisation ou de variables d'état entre modèles, qui rompent les hypothèses classiques d'espace d'entrée partagé et de correspondance point à point des sorties.
Le plan scientifique est structuré en quatre axes : (1) benchmarks contrôlés et formalisation mathématique des hétérogénéités ; (2) apprentissage de représentations et alignement (AE/VAE, CCA/Deep CCA, operator learning) ; (3) construction de surrogats multi-fidélité (co-krigeage latent, réseaux hiérarchiques, hybrides probabilistes) ; (4) active learning / design adaptatif pour choisir les évaluations haute fidélité.

Conformément à l'offre, les objectifs scientifiques sont :

- Définir des représentations latentes communes reliant des espaces d'entrée hétérogènes entre niveaux de fidélité.
- Construire des surrogats multi-fidélité robustes et cohérents malgré les hétérogénéités (paramétrisations, discrétisations, variables).
- Quantifier et propager l'incertitude induite par (i) la rareté des données haute fidélité et (ii) les erreurs d'alignement/embedding.
- Concevoir des stratégies d'échantillonnage adaptatif pour décider où lancer des simulations haute fidélité coûteuses afin de maximiser le gain d'information.

Le profil recherché

Candidat inscrit (ou issu) d'un Master en ingénierie, mathématiques appliquées ou discipline proche.
Spécialisation souhaitée en machine learning, quantification d'incertitudes, optimisation ou domaines connexes.
Intérêt/compétences en modélisation numérique, surrogats, méthodes probabilistes, et/ou apprentissage d'opérateurs (DeepONet/FNO) constituent un atout.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.