Recrutement Ministère de l'Education nationale, de l'enseignement supérieur et de la recherche

Data Scientist H/F - Ministère de l'Education nationale, de l'enseignement supérieur et de la recherche

  • Toulouse - 31
  • Fonctionnaire
  • Ministère de l'Education nationale, de l'enseignement supérieur et de la recherche
Publié le 6 juin 2025
Postuler sur le site du recruteur

Les missions du poste

Vous vous épanouissez dans des missions autour des données et les technologies d'IA et d'IA générative? Vous avez le goût du service et souhaitez contribuer à moderniser l'éducation nationale ? Rejoignez les équipes de la DSI², en tant qu'Ingénieur(e) Data.

Au sein de l'incubateur d'IA souveraine de la DSI², vous jouerez un rôle majeur dans la gestion de l'infrastructure de données spécifique à l'IA et le traitement automatique du texte. Vous contribuerez à la conception et au déploiement de solutions d'Intelligence Artificielle pour améliorer l'efficacité et la qualité des services administratifs de l'éducation nationale. Organisé en équipe agile, vous travaillerez en étroite collaboration avec les directions métiers et les départements de la DSI² pour concevoir et déployer des solutions d'Intelligence Artificielle et pour transformer des données brutes en démonstrateurs techniques et en solutions technologiques avancées.

En proximité avec les usagers et consommateurs de vos produits, vous animerez des ateliers pour retranscrire les besoins des agents en démonstrateurs techniques. Vous serez en charge de la collecte, du stockage et de la gestion des données, de la réalisation des démonstrateurs. Vous travaillerez dans un environnement technique avancé incluant une plateforme infrastructure cloud souveraine. En partenariat avec les autres incubateurs, de région académique et national, vous participerez à la mise à l'échelle de ces outils d'IA.

Vos principales missions :

· Collecter, nettoyer et analyser des ensembles de données complexes pour alimenter les démonstrateurs.

· Choisir et évaluer des modèles de machine learning et de deep learning en utilisant des outils et des frameworks tels que Python, Scikit-learn, TensorFlow, PyTorch, etc.

· Développer des prototypes de solutions IA et les tester dans des environnements réels et souverains.

· Travailler en étroite collaboration avec les équipes de data engineering, de développement logiciel locales et nationales pour intégrer les modèles dans des produits finis.

· Documenter les processus, les modèles et les résultats de manière claire et concise pour assurer la reproductibilité et la compréhension par les autres membres de l'équipe.

· Rester à jour avec les dernières avancées en IA et en machine learning, et proposer des innovations pour améliorer les projets en cours.

· Présenter les résultats et les recommandations aux parties prenantes, décideurs et les équipes internes.

Le profil recherché

Titulaire d'un diplôme d'ingénieur ou Master technique, science des données ou domaine connexe, vous disposez d'une expérience dans l'ingénierie des données, l'architecture des données ou un domaine connexe.

Compétences Techniques :

· Maîtrise du langage Linux (shell), de Python et de bibliothèques de data science. ex : Pandas, NumPy, Scikit-learn

· Expérience avec des frameworks de deep learningde type TensorFlow, PyTorch...
Afficher la suite
· Environnement de développementex : FastAPI, Jupyter, Anaconda, Streamlit, LangChain, pytest, LlamaIndex...

· Connaissance des outils de visualisation de donnéesde type Matplotlib, Seaborn, Plotly.

· Expérience avec des bases de données SQL et NoSQL et vectorielle.

· Expertise en NLP : plongements de documents, recherche d'information, extraction de données structurées, approche hybride texte/graphes

· Expérience avec les modèles de langage avancés, tels que Llama, GPT, Falcon, Albert, OpenAI

· Expérience en scrapping web et en crawling

Connaissances Techniques :

· Techniques de conduite du changement et d'animation de réunion.

· Connaissance des méthodes de traitement du langage naturel (NLP) serait un plus.

· Connaissance des plateformes cloud souveraines et des environnements de conteneurisation et des outils d'orchestration de workflows (Airflow, Kubernetes, Docker).

· Expérience avec des outils de versioning de code (Git).

· Familiarité avec les technologies souveraines et libres dans le domaine de l'IA, comme l'environnement Albert.

· Connaissance des bonnes pratiques en matière de gestion des données, de SSI et du RGPD.

· Connaissance de l'environnement professionnel et du SI de l'éducation nationale serait un plus.

Savoir-Être :

· Capacité à travailler de manière autonome, en équipe et à communiquer efficacement.

· Excellentes capacités analytiques et de résolution de problèmes.

· Bonne communication écrite et orale et capacité à la vulgarisation de documentations techniques complexes.

· Capacité à gérer plusieurs projets simultanément et à respecter les délais.

· Esprit d'initiative et sens du service.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi