Thèse Telco Cloud Résilient Grâce à la Vérification Continue Face aux Comportements Conflictuels H/F - Doctorat.Gouv.Fr
- Lille - 59
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Lille École doctorale : MADIS Mathématiques, sciences du numérique et de leurs interactions Laboratoire de recherche : CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille Direction de la thèse : Philippe MERLE ORCID 0000000184238806 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-30T23:59:59 Les industries de télécom connaissent un écosystème mouvant et des transformations technologiques majeures. Elles doivent fiabiliser leurs infrastructures, leurs applications Telco Cloud et anticiper les évolutions rapides des usages et du trafic sur le réseau. Face à des risques de pannes d'envergure, l'exigence de résilience est forte. Elle requiert des mises à jour logicielles fréquentes et la maîtrise de la complexité inhérente de ces systèmes distribués et dynamiques. Les opérateurs Kubernetes sont devenus des contrôleurs logiciels clés pour la gestion du cycle de vie du Telco Cloud. Malgré l'existence de kits de conception et de guides de bonnes pratiques, la diversité des implémentations et les spécificités métiers de ces opérateurs laissent place à des bugs internes, reconnus difficiles à détecter [1]. Les causes sont multiples : configurations incorrectes des ressources manipulées par ces opérateurs, défauts d'ordonnancement des étapes nécessaires au cycle de vie, concurrence entre opérateurs sur une même ressource. Les conséquences prennent différentes formes : panne, blocage, faille de sécurité, perte de données, consommation inutile de ressources [1]. Dans un contexte GitOps et CI/CD, elles concernent toutes les phases du cycle de vie des ressources déployées dans le Cloud. Le fonctionnement des opérateurs Kubernetes, stable, reproductible et sécurisé est donc crucial.
Des travaux académiques récents proposent de générer automatiquement des plans de test [2, 4] ou de la vérification formelle [3] du comportement d'un opérateur avant déploiement. Ces approches se limitent à l'analyse d'un unique opérateur Kubernetes. Elles ne couvrent pas les interactions complexes entre opérateurs, qui provoquent des situations de conflits ou de dépendances critiques, difficiles à déceler lors des phases de réconciliation. Le déploiement de ressources par un opérateur est compromis s'il reste en attente de ressources supprimées ou bloquées par un autre opérateur.
L'objectif de la thèse est de développer des techniques de vérification continue du comportement des opérateurs, fondées sur de l'analyse statique automatisée de leur code en intégrant leurs interactions et l'état réel des ressources déployées. Il s'agit par exemple de vérifier le risque de concurrence entre opérateurs sur une même ressource. L'approche doit répondre aux exigences de déploiement multi-clusters, à grande échelle, d'expressivité des propriétés à garantir et conduire au développement d'outillages intégrables dans des processus CI/CD. Les industries de télécom connaissent un écosystème mouvant et des transformations technologiques majeures. Elles doivent fiabiliser leurs infrastructures, leurs applications Telco Cloud et anticiper les évolutions rapides des usages et du trafic sur le réseau. Face à des risques de pannes d'envergure, l'exigence de résilience est forte. Elle requiert des mises à jour logicielles fréquentes et la maîtrise de la complexité inhérente de ces systèmes distribués et dynamiques. Les opérateurs Kubernetes sont devenus des contrôleurs logiciels clés pour la gestion du cycle de vie du Telco Cloud. Malgré l'existence de kits de conception et de guides de bonnes pratiques, la diversité des implémentations et les spécificités métiers de ces opérateurs laissent place à des bugs internes, reconnus difficiles à détecter [1]. Les causes sont multiples : configurations incorrectes des ressources manipulées par ces opérateurs, défauts d'ordonnancement des étapes nécessaires au cycle de vie, concurrence entre opérateurs sur une même ressource. Les conséquences prennent différentes formes : panne, blocage, faille de sécurité, perte de données, consommation inutile de ressources [1]. Dans un contexte GitOps et CI/CD, elles concernent toutes les phases du cycle de vie des ressources déployées dans le Cloud. Le fonctionnement des opérateurs Kubernetes, stable, reproductible et sécurisé est donc crucial.
Le profil recherché
Vous êtes diplômé.e d'une école d'ingénieur ou universitaire et titulaire d'un Master Recherche dans le domaine des théories des langages en informatique, des mathématiques appliquées à l'informatique, des sciences et technologies du logiciel, des applications réparties ou des systèmes distribués.
Des compétences en langages de programmation, sémantique, modélisation et vérification formelles sont recherchées pour le poste. En outre, vous présentez une appétence pour le développement d'outils, la validation expérimentale sur plate-forme. Des compétences en Golang, Rust et/ou Python, Linux seront utiles.
Vous disposez également d'une aisance tant à l'oral qu'à l'écrit en français et en anglais, êtes curieux.se, méthodique, autonome, motivé.e par la recherche en milieu industriel, avez un esprit de synthèse, êtes capable de vous intégrer à une équipe de recherche et de travailler en mode collaboratif.
Une première expérience en modélisation d'architecture logicielle répartie, en virtualisation d'infrastructure réseau ou avec les opérateurs Kubernetes serait un plus. Une contribution à la soumission d'un article scientifique serait également fortement appréciée.