Data Scientist - Bordeaux H/F - Caisse des Dépôts et Consignations (CDC)
- Bordeaux - 33
- Fonctionnaire
- Caisse des Dépôts et Consignations (CDC)
Les missions du poste
Vous participerez et impulserez la Transformation de la Direction des politiques sociales par l'usage de nouvelles technologies et de l'intelligence artificielle apportant des innovations à nos services,
incrémentales ou disruptives, faisant évoluer les façons de faire des collaborateurs, et in fine le service rendu à nos clients. Plus spécifiquement, vous valoriserez et amplifierez l'usage de l'ensemble des leviers numériques, Data & IA pour répondre aux enjeux de la Direction des Politiques sociales (DPS).
Vous serez rattaché(e) au Service Numérique DATA et IA de la Direction de l'innovation et de la prospective, et réaliserez vos missions sous la supervision du Lead data scientist de la DPS, lui-même rattaché au Responsable du Service.
Vous participerez activement à la mise en oeuvre des cas d'usage IA priorisés dans la feuille de route IA de la DPS. Vous travaillerez notamment sur plusieurs projets internes d'IA Générative sous la supervision du lead data scientist de l'équipe pour répondre aux cas
d'usage des métiers de la DPS.
Vos missions pourront être les suivantes
Définir et implémenter le preprocessing des données non structurées (textes, catalogue de formations, référentiel de compétences et métiers) pour modéliser leur extraction et retraitement algorithmique dans la plateforme data
Optimiser tous les traitements en termes de performance machine et de performance (métrique) statistique
Sélection, intégration et optimisation de modèles LLM open source
Conception et mise en oeuvre de solutions basées sur RAG (Retrieval-
Augmented Generation)
Développement d'agents autonomes (boucles perception/action, agents multitâches)
Déploiement via DataikuUtilisation des services IA de Microsoft Azure (OpenAI, Azure ML, Copilot Studio)
Industrialisation : CI/CD, monitoring, documentation, MLOps
Sélectionner et documenter les techniques adéquates et construire les
solutions nécessaires au traitement des données non structurées afin de répondre aux besoins soulevés
Définir une stratégie qui permette de trouver les meilleurs modèles et de répondre à la problématique métier adressée
Présenter de façon pédagogique les approches proposées et documenter les résultats à travers une documentation technique et un mode opératoire
Le profil recherché
Diplôme et spécialité éventuelle:
Titulaire d'un doctorat en IA ou d'un diplôme d'une grande école d'ingénieur ou d'un troisième cycle universitaire spécialisé en data science, intelligence artificielle, mathématiques appliquées ou en
statistiques avec au moins une première expérience réussie en data science
· Maîtrise des langages de programmation Python, SQL et PySpark
· Maîtrise technique et théorique en Machine learning Deep learning
· Connaissances techniques spécifiques de textmining, speechtotext, OCR
· Expérience en IA Générative, connaissances techniques spécifiques des modèles LLM
· Connaissances des outils informatiques de gestion des données (SQL et NoSQL) et des architectures Big Data (Hadoop, Spark, Hive, Mongo DB, Pig ...), des logiciels et plateforme data et IA de place (Dataiku,..).
· Connaissances en MLOps et industrialisation de modèles
Qualités personnelles
· Fort engagement et capacité à travailler au sein d'une équipe de façon autonome ;
· Capacité à s'adapter à une grande variété d'enjeux, de situations et d'interlocuteurs ;
· Capacité à traiter plusieurs sujets en parallèle dans un mode gestion de projet ;
· Respecter la confidentialité des informations fournies ;
· Capacité à collaborer avec des équipes SI, sécurité, et métier
· Excellent niveau de communication et de vulgarisation technique
· Esprit d'initiative, force de conviction et de proposition ;
· Grand respect des délais et des priorités