Recrutement Doctorat.Gouv.Fr

Thèse Modélisation et Estimation Robustes de Systèmes Dynamiques Non Linéaires Sous Incertitudes Application aux Bioprocédés Durables H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 18 avril 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire des Signaux et Systèmes Direction de la thèse : Sihem TEBBANI ORCID 0000000303882902 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-07T23:59:59 L'étude des systèmes dynamiques non-linéaires est présente dans de nombreux domaines scientifiques et de nombreuses applications (climat, robotique, biologie, etc.). Cependant, identifier leurs lois d'évolution à partir de données empiriques reste un défi majeur en raison de deux sources d'incertitudes : (i) les données peuvent être bruitées, peu nombreuses, voire partiellement observées (ii) dans le contexte d'une modélisation paramétrique de la dynamique, le modèle des équations différentielles peut être imprécis (on parle alors d'erreurs structurelles).

Une multitude de travaux proposent une modélisation non-paramétrique de la dynamique afin de répondre au point (ii). Citons à titre d'exemples les réseaux de neurones, la logique floue, les processus gaussiens.
Ce sujet de thèse s'inscrit dans cette approche avec l'objectif d'améliorer la robustesse du modèle vis-à-vis des erreurs de mesure et des erreurs structurelles. Pour cela, il est envisagé de construire un modèle non-paramétrique pour représenter à la fois la dynamique du système, mais également l'erreur structurelle. Plusieurs modèles seront étudiés mais en raison de leur souplesse d'utilisation issue des nombreuses propriétés qu'ils possèdent, les processus gaussiens constitueront une piste privilégiée.

En effet, la modélisation par processus gaussiens permet d'envisager :
- Une utilisation simple de modèles de type modèles de mélange. Cette modélisation constitue une piste à explorer pour s'affranchir des observations aberrantes.
La possibilité d'estimer des dérivées y compris en présence de bruit (l'usage d'estimateurs fondés sur des calculs de différences finies étant particulièrement hasardeux lorsque les observations sont bruitées).
- Une planification des expériences permettant, lorsque le nombre d'observations possibles est faible, de soit (i) avant toute expérience, de décider des signaux de commande à appliquer au système, soit (ii) de les programmer séquentiellement, dans ce cas, la commande à appliquer étant recalculée régulièrement pour tenir compte des données déjà mesurées. Cet aspect est d'autant plus important que les expériences sont très coûteuses en temps et en budget (comme c'est le cas par exemple dans le domaine des bioprocédés).
- La modélisation des erreurs structurelles afin de fournir des indicateurs quantifiant leur impact sur la qualité de la modélisation. Des indicateurs fondés sur des calculs de quantiles, particulièrement pertinents lorsque la robustesse est un enjeu, seront étudiés.
- L'estimation des fonctions de covariance est l'une des étapes cruciales lors de la modélisation par processus gaussiens. Un soin tout particulier y sera accordé. Plusieurs pistes seront abordées, allant de l'inférence bayésienne à la restriction à des contextes où l'hypothèse de stationnarité est valide (cadre favorable car les fonctions de covariance dépendent dans ce cas d'une fonction dépendant d'une seule variable).

Le modèle développé ainsi que les informations statistiques associées, issues de la modélisation par processus gaussiens, seront, dans un deuxième temps, exploités pour la mise en place d'estimateurs robustes, pour reconstruire les variables d'état du système non mesurées en ligne.

Les développements théoriques seront illustrés, en simulation, dans le cas de bioprocédés benchmark pour des applications en lien avec le développement durable. La modélisation des systèmes dynamiques non-linéaires constitue parfois un frein à la mise en oeuvre des estimateurs ou d'une loi de commande, notamment lorsque les lois de la physique ou de la biologie sont trop complexes pour être fidèlement modélisées. Ce sujet de thèse tentera d'apporter des réponses à de telles situations. Plusieurs contributions sont attendues, que ce soit pour exploiter au mieux des données existantes, pour planifier de nouvelles expériences, ou pour mettre en place des estimateurs robustes pour les variables non mesurées en ligne.

Des résultats préliminaires sur l'approche proposée ont été obtenus par l'équipe encadrante, par exemple pour la modélisation par processus gaussiens [10,11], pour l'estimation et la commande robustes de systèmes non-linéaires [12, 13].

Les bioprocédés promettent de belles opportunités d'application, à la fois parce que les mesures, souvent difficiles à acquérir sont en nombre limité, entachées d'erreurs, parfois manquantes ou partielles, et en raison de la nécessité de prendre en compte un grand nombre de variables, induisant des erreurs de modèles non négligeables. De plus, ces procédés sont complexes, de dynamiques fortement non-linéaires et incertaines, pouvant varier dans le temps. Aussi, la modélisation et estimation de ce type de procédé est un enjeu majeur pour leur automatisation et optimisation. Il existe des bases de données et des modèles de référence pour l'étude de l'identification et modélisation de ce type de procédés (par exemple [14]). Ils seront utilisés dans ce projet doctoral pour illustrer les développements théoriques, notamment pour des applications en lien avec le développement durable. De nombreux travaux concernent la modélisation non-paramétrique de systèmes dynamiques non-linéaires [1-7]. Il s'agira dans cette thèse d'identifier les modèles les plus pertinents pour améliorer leur robustesse vis-à-vis du bruit inhérent aux données mesurées ainsi qu'aux erreurs de modélisation. Même si les processus gaussiens semblent prometteurs, d'autres modélisations, en particulier les réseaux de neurones, seront également étudiées, ne serait-ce qu'à des fins de comparaison. On veillera notamment à intégrer dans cette comparaison les récents modèles neuronaux fondés sur les équations physiques [8]. Un autre objectif concerne la mise en place d'algorithmes d'estimation robuste pour la reconstruction des variables non mesurées en ligne à partir des données disponibles. Cette estimation peut être délicate dans le cas de systèmes non-linéaires. Ainsi, l'objectif est de proposer de nouvelles approches avec le modèle par processus gaussiens développé et de le comparer à d'autres stratégies proposées dans l'état de l'art [9].
Un autre objectif est de proposer des modèles pour les systèmes biologiques, et notamment les bioprocédés, qui sont complexes, difficiles à modéliser. Les bioprocédés avec application dans le développement durable (consommation et production durables) seront plus spécifiquement étudiés. L'apprentissage statistique, ainsi que la statistique inférentielle offrent de nombreuses modélisations permettant des estimations robustes (utilisation de quantile, prise en compte des outliers, modèles de mélange, etc). Il s'agira d'exploiter ces techniques en les adaptant aux particularités des systèmes dynamiques, et des bioprocédés plus spécifiquement.

Le profil recherché

- Master 2 Recherche et/ou Ingénieur(e) en Mathématiques appliquées ou en Automatique.
- De bonnes compétences en statistiques, en apprentissage statistique et en estimation.
- De bonnes compétences en programmation (Matlab ou Python).
- Des connaissances en optimisation seront appréciées mais ne sont pas obligatoires.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.