Post-Doctorant·e en Détection d'Anomalies Collaboratives H/F - Sces Communs Imt Business School Telecom
- Palaiseau - 91
- CDD
- Sces Communs Imt Business School Telecom
Les missions du poste
Les applicatifs sont de plus en plus exposées via des applications Web pour les utilisateurs humains ou via des API dans les communications machine à machine. Si elles sont mal conçues, elles peuvent devenir une cible privilégiée pour les attaquants et entraîner des pertes économiques sévères. Il est donc nécessaire de développer des solutions de gestion d'API intégrant la sécurité dès la conception. Cependant, quand bien même les utilisateurs seraient authentifiés au travers d'une méthode sûre, cela ne pourrait empêcher des actions frauduleuses de la part d'utilisateurs compromis. Nous nous proposons donc de détecter des comportements d'attaque de la part d'utilisateurs d'API ou de portails Web. En particulier, la détection d'anomalies pour la sécurisation des APIs est un domaine de recherche émergent. Nous disposons de peu de données concrètes d'attaques permettant de caractériser ces attaques. Une approche raisonnable est donc de s'appuyer sur ce qui est connu, c'est-à-dire, les requêtes d'usagers légitimes. Cependant, ces données sont sensibles car souvent générées par des humains et pouvant contenir des secrets. Par ailleurs, quand bien même nous disposerions de telles données, nous ne pouvons garantir l'absence de données d'attaques qui polluerait l'apprentissage d'un modèle de détection d'anomalies. Il est alors crucial de bien comprendre ce que l'on cherche à représenter et distinguer dans les comportements légitimes en concevant une représentation robuste, qu'un attaquant ne puisse facilement reproduire. Finalement, l'apprentissage sur un jeu de données a tendance à souffrir de surapprentissage, occultant l'occurrence d'attaques contradictoires (adversarial attacks) ou l'émergence de nouveaux comportements, qui peuvent occasionner de nombreux faux positifs. Plusieurs approches peuvent nous permettre de réduire ces faux positifs tels que l'apprentissage incrémental, l'apprentissage distribué et préservant la vie privée (comme l'apprentissage fédéré), l'apprentissage contrastif et d'autres modalités exploitant le problème de l'Open Set Recognition, et plus généralement Open World Machine Learning.
Afin de renforcer le respect de la vie privée des usagers, nous pourrons exploiter une approche d'apprentissage fédérée et déléguer la collecte et la détection locale aux clients de la solution API. Nous souhaitons également que notre approche soit robuste afin de minimiser le nombre de faux positifs qui peut exploser dans un environnement où les requêtes sont très nombreuses. Nous envisageons l'usage d'apprentissage contradictoire (adversarial ML) et de méthodes d'IA explicative (XAI), mais aussi d'Open Set Learning, pour réduire le taux de faux positifs.
Ces méthodes peuvent être plus ou moins coûteuses et induire des délais pouvant perturber un apprentissage fédéré.
- Dans un premier temps, nous étudierons l'étude d'une ou plusieurs pipelines de détection collaborative hybride (classes d'attaques, anomalies)
- Dans un second temps, nous nous concentrerons sur l'optimisation de la performance de la pipeline (coûts additionnels des communications, synchronicité de l'apprentissage/convergence, sélection et confiance dans les clients).
La validation de la pertinence et de la faisabilité de l'approche fédérée (voire contrastive) se fera non seulement vis à vis de métriques habituelles de performance en matière de détection, mais également à l'aune des coûts induits par le déploiement distribué (passage à l'échelle), ainsi que par rapport aux clients finaux de la solution (préservation de la vie privée).
Le profil recherché
Experience: Débutant accepté
Compétences: Algorithmique,Analyser, exploiter, structurer des données,Collaborer avec une équipe projet,Rédiger un cahier des charges, des spécifications techniques,Respecter la confidentialité des informations
Langues: Anglais exigé
Qualification: Cadre
Secteur d'activité: Enseignement supérieur