Recrutement Service Public

Post-Doctorante ou Post-Doctorant en Contrôle Agentique pour la Gestion de Clusters - CDD H/F - Service Public

  • Palaiseau - 91
  • Fonctionnaire
  • Service Public
Publié le 17 juin 2026
Postuler sur le site du recruteur

Les missions du poste


Nous recherchonsPost-doctorante ou Post-doctorant en contrôle agentique pour la gestion de clusterspour rejoindre le département INFRES à Telecom Paris.
Kubernetes est devenu une plateforme centrale pour le déploiement et la gestion des systèmes cloud-native, et il est de plus en plus utilisé pour héberger des charges de travail IA en production. Malgré sa maturité en tant que plateforme d'orchestration dotée d'une automatisation intégrée, les opérations quotidiennes sur Kubernetes nécessitent encore souvent une intervention humaine importante. Les opérateurs de clusters doivent inspecter l'état du cluster, interpréter les métriques, les journaux, les traces et les événements, diagnostiquer les défaillances, choisir les actions correctives, exécuter des commandes ou des opérations API, puis vérifier que le système est revenu à un état sain. Les outils et prototypes de recherche récents basés sur des LLM (modèles de langage) pour Kubernetes montrent le potentiel des modèles de langage pour soutenir ces tâches grâce à des interactions en langage naturel, des interactions en ligne de commande et via API, ainsi qu'à un raisonnement conscient du cluster. Ces avancées laissent entrevoir des opérations Kubernetes et d'ingénierie de la fiabilité des sites (SRE) plus autonomes. Le degré d'autonomie varie selon les solutions existantes, allant de l'assistance interactive avec un humain dans la boucle à une exécution plus autonome.

Dans le même temps, l'utilisation croissante de Kubernetes dans les environnements d'edge computing fait de la gestion autonome des clusters un problème de recherche de plus en plus important. Bien que la plupart des études existantes se concentrent sur les environnements cloud ou la gestion générale de Kubernetes, les déploiements en edge peuvent impliquer plusieurs clusters Kubernetes gérés de manière indépendante et fonctionnant dans des conditions très différentes. Ces clusters peuvent être déployés sur des sites hétérogènes, aux ressources limitées ou difficiles d'accès physiquement, y compris des déploiements distants pour des applications telles que la surveillance environnementale. Ils peuvent également faire face à une disponibilité changeante des ressources, des conditions réseau instables et une connectivité limitée. Dans de tels environnements, les pannes sont plus difficiles et plus coûteuses à résoudre par une intervention manuelle, ce qui accroît l'importance d'une gestion zero-touch et d'une récupération autonome au niveau de chaque cluster individuel. Ces contraintes rendent également les modèles open-weight déployables localement une option pratique pour soutenir le raisonnement, le contrôle et la récupération sur site. Leur utilité peut être renforcée par la génération augmentée par récupération (RAG, Retrieval-Augmented Generation), qui permet de prendre des décisions fondées sur des documents locaux pertinents et des données opérationnelles, sans dépendre en continu de services tiers distants.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi