Recrutement Télécom SudParis

Post-Doctorant·e en Qualité des Jeux de Données pour Ids Réseau Fondés sur l'Apprentissage Automatique - CDD H/F - Télécom SudParis

  • Évry-Courcouronnes - 91
  • CDD
  • Télécom SudParis
Publié le 17 février 2026
Postuler sur le site du recruteur

Les missions du poste

Présentation de Télécom SudParis :

Télécom SudParis est une grande école publique d'ingénieurs reconnue au meilleur niveau des sciences et technologies du numérique. La qualité de ses formations est basée sur l'excellence scientifique de son corps professoral et une pédagogie mettant l'accent sur les projets d'équipes, l'innovation de rupture et l'entreprenariat. Télécom SudParis compte 1 000 étudiantes et étudiants dont 700 élèves ingénieurs et environ de 150 doctorantes et doctorants. Télécom SudParis fait partie de l'Institut Mines-Télécom, premier groupe d'école d'ingénieurs en France, et partage son campus avec Institut Mines-Télécom Business School. Télécom SudParis est co- fondatrice de l'Institut Polytechnique de Paris (IP Paris), Institut de Sciences et Technologies à vocation mondiale avec l'École polytechnique, l'ENSTA Paris, l'ENSAE Paris, l'ENPC et Télécom Paris. Vidéo présentation de Télécom SudParis

À propos de l'Institut Mines-Télécom :

L'Institut Mines-Télécom (IMT) est un établissement public dédié à l'enseignement supérieur et la recherche pour l'innovation dans les domaines de l'ingénierie et du numérique. À l'écoute permanente du monde économique, l'IMT conjugue une forte légitimité académique et scientifique, une proximité avec les entreprises et un positionnement unique sur les transformations majeures au XXIe siècle : numériques, énergétiques, industrielles et éducatives siècle. Ses activités se déploient au sein des grandes écoles Mines et Télécom sous tutelle du ministre en charge de l'Industrie et des communications électroniques, de deux filiales et de partenaires associés ou sous convention. L'IMT est membre fondateur de l'Alliance Industrie du Futur. Il est doublement labellisé Carnot pour la qualité de sa recherche partenariale. Vidéo de présentation de l'Institut Mines-TélécomMissions

La cybersécurité constitue un enjeu majeur pour les infrastructures numériques modernes, au sein desquelles les systèmes de détection d'intrusion réseau (NIDS) jouent un rôle central dans la détection des activités malveillantes et la protection des systèmes d'information. Ces dernières années, les techniques d'apprentissage automatique (Machine Learning, ML) et d'intelligence artificielle (IA) ont été largement adoptées pour les NIDS, permettant la détection automatique d'attaques complexes et évolutives. Un nombre important de travaux académiques a rapporté des performances de détection très élevées sur des jeux de données de benchmark publics en utilisant ces techniques.

Cependant, malgré ces résultats affichant des performances élevées, le déploiement des NIDS basés sur le ML dans des environnements opérationnels réels demeure limité. Un consensus croissant au sein de la communauté scientifique souligne que cet écart est en grande partie dû aux limitations des jeux de données utilisés pour l'entraînement et l'évaluation. De nombreux benchmarks présentent des biais structurels, une diversité limitée, des imprécisions d'étiquetage et des hypothèses expérimentales peu réalistes. Par conséquent, les protocoles d'évaluation mesurent souvent la capacité des modèles à reconnaître des artefacts propres aux jeux de données plutôt que leur véritable capacité de généralisation, donnant ainsi un faux sentiment de sécurité.

Cette situation met en évidence la nécessité d'un changement de paradigme vers des approches centrées sur les données en cybersécurité, où l'accent n'est plus mis uniquement sur une optimisation centrée sur le modèle, mais sur une caractérisation systématique de la qualité des jeux de données. Bien que des frameworks génériques de qualité des données existent, il n'existe actuellement aucun framework opérationnel spécifique aux NIDS permettant aux chercheurs et aux praticiens d'évaluer, de comparer et d'exploiter la qualité des jeux de données de manière structurée et exploitable, au-delà du concept drift. Relever ces défis est essentiel pour améliorer la fiabilité, l'interprétabilité et la pertinence des évaluations des NIDS fondés sur le ML.

Dans ce contexte, ce projet postdoctoral vise à concevoir, instancier et opérationnaliser un framework d'évaluation de la qualité des jeux de données adapté aux NIDS fondés sur le ML, en mettant l'accent sur les propriétés intrinsèques des données (diversité, exactitude de l'étiquetage, réalisme, etc.) qui influencent directement les performances de détection et la généralisation. Au-delà d'une simple caractérisation, le projet ambitionne de s'appuyer sur ce framework afin de soutenir des méthodologies d'évaluation plus fiables et de formuler des recommandations opérationnelles à destination des créateurs et des utilisateurs de jeux de données NIDS.

Activités

Les principales activités du projet incluent :

· Poursuivre le développement d'un framework spécifique aux NIDS pour un nombre sélectionné de dimensions de qualité au-delà de la diversité

· Opérationnaliser un framework spécifique aux NIDS en formalisant les dimensions de diversité validées et en intégrant l'exactitude de l'étiquetage comme dimension intrinsèque de la qualité, aboutissant à des rapports de qualité structurés et reproductibles

· Instancier et valider le framework sur plusieurs jeux de données NIDS existants (jeux de données publics ainsi que ceux générés dans le cadre du projet SuperviZ), en analysant la manière dont les profils de qualité diffèrent d'un jeu de données à l'autre et comment ces différences se relient aux performances des modèles et aux comportements de généralisation observés

· Concevoir des mécanismes de recommandations fondés sur les données, basés sur les résultats du framework, à destination (i) des créateurs de jeux de données, afin de guider des stratégies de génération ou de collecte sensibles à la diversité et orientées par la qualité, et (ii) des évaluateurs de NIDS, afin de permettre des protocoles d'évaluation plus informatifs et plus fiables pour les IDS/NIDS fondés sur le ML

Le profil recherché

Formation

- Doctorat ou PhD depuis moins de 3 ans

Compétences, connaissances et expériences indispensables

- Expérience avec le développement en apprentissage machine/profond
- Connaissances en Data-Centric AI
- Des notions en cybersécurité et en réseaux sont optionnelles
- Anglais parlé et écrit

Compétences, connaissances et expériences souhaitables

- Expérience préalable en apprentissage automatique (ML) et manipulation de netflows

Capacités et aptitudes

- Rigueur, méthode de gestion de projets
- Autonomie
- Capacité à travailler en équipe

Indications de rémunération:

- Fourchette indicative de rémunération (hors bonus annuel variable): 35 400 - 37 000 euros bruts annuels, selon le profil et l'expérience (charges salariales réduites en secteur public).

Informations complémentaires et candidature

- Date limite de candidature : 31 mai 2026
- Nature du contrat : CDD de 12 mois
- Catégorie et métier du poste (usage interne): II - P, Post-doctorant ou A (fonction publique)
- Localisation du poste: Evry-Courcouronnes (91)
- Les postes offerts au recrutement sont ouverts à toutes et tous avec, sur demande, des aménagements pour les candidats en situation de handicap
- Emploi ouvert aux titulaires de la fonction publique et/ou aux contractuels
- Conditions de travail : 44 jours de congés, télétravail possible, restaurant et cafétéria sur site, accessibilité en transport en commun (avec participation de l'employeur) ou proche des axes routiers, association du personnel et association sportive sur le campus
- Contact : Gregory Blanc - ****@****.** - Benoit Nougnanke - ****@****.**

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.