Thèse Apprentissage Continu Fédéré pour l'Orchestration de Missions Critiques Assistées par Drones sur des Réseaux Hétérogènes H/F - Doctorat.Gouv.Fr
- Paris - 75
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire Interdisciplinaire des Sciences du Numérique Direction de la thèse : Tara YAHIYA Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-12T23:59:59 L'Internet Tactile (IT) exige une latence de bout en bout inférieure à la milliseconde, une fiabilité ultra-élevée et une coordination en temps réel de dispositifs hétérogènes. Cette thèse aborde ces exigences dans le contexte d'essaims de drones (UAV) conduisant des missions critiques, réponse d'urgence, recherche et sauvetage, inspection d'infrastructures, sur des infrastructures de communication hybrides LoRa/5G, où le contrôle centralisé est structurellement impraticable et les politiques statiques sont inadéquates.
Le problème de recherche central est le suivant : comment une flotte de drones peut-elle apprendre collectivement et mettre à jour en continu ses politiques d'orchestration réseau, couvrant l'allocation des ressources, le routage et l'ordonnancement, en réponse à l'évolution des conditions de canal, de la topologie et des phases de mission, tout en satisfaisant les contraintes de QoS de niveau IT et sans recourir à une synchronisation globale ni à une connectivité persistante ?
L'Apprentissage Continu Fédéré (ACF) est étudié comme cadre méthodologique pour répondre à ce problème. L'ACF combine la nature respectueuse de la vie privée et efficiente en communication de l'Apprentissage Fédéré avec la capacité de l'Apprentissage Continu à suivre des environnements non stationnaires sans oubli catastrophique. Le réseau et ses contraintes d'orchestration sont placés au coeur des contributions théoriques et algorithmiques. L'IT étend Internet à la transmission en temps réel de données de contrôle, d'actuation et de conscience situationnelle, avec des temps d'aller-retour inférieurs à une milliseconde, des taux de perte de paquets inférieurs à 10-5 et des garanties de QoS déterministes sur des infrastructures hétérogènes et mobiles. Les essaims de drones opérant dans des scénarios de missions critiques constituent une instanciation exigeante et représentative de ces contraintes : les drones doivent coordonner des boucles d'actuation, relayer les données de capteurs IoT au sol et adapter leur stratégie de communication au fil de la mission, le tout dans des budgets d'énergie et de bande passante serrés.
Dans de tels déploiements, le reporting longue portée à faible consommation repose sur LoRa, tandis que l'actuation en temps réel et la coordination inter-drones s'appuient sur la 5G ou des liaisons RF directes. Chaque technologie présente des profils distincts en termes de capacité, latence, fiabilité et énergie que la couche d'orchestration doit exploiter et gérer conjointement. Hétérogénéité et non-stationnarité du réseau
L'infrastructure est intrinsèquement non stationnaire : les positions des drones et les distances inter-noeuds évoluent en permanence, la qualité des liaisons LoRa se dégrade avec les interférences et la portée, et l'ensemble des chemins de communication actifs change avec les phases de mission. Les approches classiques de gestion de réseau, qu'elles soient fondées sur des règles ou entraînées hors ligne, se dégradent face à cette dérive. La thèse étudie comment l'apprentissage distribué intégré au plan de contrôle des drones peut suivre et s'adapter à la non-stationnarité tout en maintenant les garanties de niveau IT. L'Apprentissage Continu Fédéré comme paradigme de contrôle réseau
L'Apprentissage Fédéré standard suppose des distributions de données stationnaires et une communication fiable, hypothèses qui échouent systématiquement dans les déploiements de drones. L'Apprentissage Continu traite la dérive de distribution et l'évolution des tâches, mais son comportement dans des contextes fédérés et contraints par le réseau soulève des questions théoriques ouvertes. L'ACF est traité ici non comme une fin en soi, mais comme un outil de contrôle réseau : une classe d'algorithmes distribués permettant aux drones et aux noeuds de bord d'apprendre collectivement des politiques d'orchestration en réponse aux conditions changeantes, sans synchronisation globale et sans oublier les connaissances précédemment acquises sur les états du réseau. Formaliser le problème d'orchestration réseau des drones comme un problème de décision multi-agents coopératif, avec un espace d'états explicite (qualité de canal, charge des noeuds, topologie locale), un espace d'actions (allocation des ressources radio, routage, ordonnancement des tâches) et une fonction objectif (latence, fiabilité, énergie), soumis aux contraintes de QoS de niveau IT.
Concevoir des algorithmes d'orchestration distribuée basés sur l'ACF opérant dans les budgets de ressources IT : protocoles d'agrégation suffisamment légers pour les contraintes d'énergie et de bande passante de classe LoRa, et mécanismes de coordination compatibles avec des boucles d'actuation inférieures à la milliseconde.
Analyser la convergence des algorithmes ACF proposés dans des conditions idéalisées puis dans des conditions réseau réalistes (topologies lentement variables dans le temps, liaisons LoRa intermittentes), en établissant des bornes formelles et en caractérisant le compromis fondamental entre performance d'apprentissage et surcoût de communication.
Caractériser et atténuer l'oubli catastrophique dans le contexte du contrôle réseau distribué, en développant des mécanismes adaptatifs, rétention sélective des connaissances, agrégation guidée par la topologie, avec des garanties pertinentes pour la continuité de mission.
Valider le cadre proposé par simulation et par des essais expérimentaux sur des plateformes drones disponibles dans le cadre de projets collaboratifs en cours, en comparant les algorithmes proposés aux approches de référence en orchestration et en apprentissage fédéré. La recherche se déroule en quatre phases. La première établit la formalisation du problème : les déploiements de drones sont modélisés comme des graphes multi-technologies dynamiques aux capacités de noeuds, capacités de liens et topologies évolutives. Les exigences de QoS sont formalisées comme des contraintes dures et souples, et le problème d'orchestration est formulé comme une famille de problèmes d'optimisation stochastique couvrant l'allocation des ressources, l'ordonnancement et le routage. Une analyse de complexité identifie les sous-structures traitables et oriente la conception algorithmique.
La deuxième phase développe les algorithmes d'orchestration basés sur l'ACF. Les protocoles d'agrégation et de synchronisation sont conçus pour être légers sous les contraintes d'énergie et de bande passante LoRa. Les stratégies adaptatives d'atténuation de l'oubli, rejeu sélectif et régularisation dynamique, sont adaptées au contexte du contrôle réseau, où la rétention des connaissances sur les états réseau précédemment observés est opérationnellement critique.
La troisième phase fournit les fondements théoriques. Des bornes de vitesse de convergence sont dérivées d'abord en conditions stationnaires puis sous des topologies lentement variables dans le temps ; le compromis fondamental entre performance d'apprentissage et surcoût de communication est caractérisé afin de dégager des principes de conception pratiques. L'analyse de stabilité face aux défaillances de liens et à la volatilité des noeuds est délimitée au contexte des missions de drones.
La quatrième phase valide le cadre expérimentalement. Les simulations couvrent des scénarios à grande échelle et haute mobilité. Les essais expérimentaux sont conduits sur des plateformes drones et des infrastructures LoRa disponibles dans le cadre de projets collaboratifs actifs avec des groupes de recherche partenaires. Des scénarios pertinents pour l'IT, contrôle de formation de drones sous connectivité partielle, actuation à distance avec des exigences de latence de niveau haptique, sont émulés à l'aide de modèles de mobilité et de canal établis. Les résultats sont interprétés à la lumière des garanties formelles établies lors de la phase théorique.
Le profil recherché
Le ou la candidat(e) idéal(e) est titulaire d'un Master (ou équivalent) en informatique, en télécommunications, en mathématiques appliquées, ou dans un domaine étroitement connexe, et possède :
De solides bases en réseaux informatiques et en systèmes de communication (architecture réseau, accès sans fil, mécanismes de QoS, conception de protocoles)
Une bonne maîtrise de l'optimisation (optimisation combinatoire, programmation stochastique, analyse convexe)
Une familiarité avec les principes de l'apprentissage automatique ; une expérience en apprentissage fédéré ou distribué constitue un atout
Une bonne maîtrise de la programmation en Python ; une expérience des outils de simulation ou d'émulation réseau (ns-3, OMNET++, Mininet, ou équivalents) serait appréciée
Une capacité de raisonnement mathématique rigoureux et de rédaction scientifique en anglais