
Ingénieur Data H/F - Ministère de l'Education nationale, de l'enseignement supérieur et de la recherche
- Toulouse - 31
- Fonctionnaire
- Ministère de l'Education nationale, de l'enseignement supérieur et de la recherche
Les missions du poste
Vous vous épanouissez dans des missions autour des données et les technologies d'IA et d'IA générative? Vous avez le goût du service et souhaitez contribuer à moderniser l'éducation nationale ? Rejoignez les équipes de la DSI², en tant qu'Ingénieur(e) Data.
Au sein de l'incubateur d'IA souveraine de la DSI², vous jouerez un rôle majeur dans la gestion de l'infrastructure de données spécifique à l'IA et le traitement automatique du texte. Vous contribuerez à la conception et au déploiement de solutions d'Intelligence Artificielle pour améliorer l'efficacité et la qualité des services administratifs de l'éducation nationale. Organisé en équipe agile, vous travaillerez en étroite collaboration avec les directions métiers et les départements de la DSI² pour concevoir et déployer des solutions d'Intelligence Artificielle et pour transformer des données brutes en démonstrateurs techniques et en solutions technologiques avancées.
Vos missions
Vous serez responsable de la collecte, du stockage et de la gestion des données dans un environnement technique avancé incluant une plateforme infrastructure cloud souveraine. Dans ce rôle, vous intégrerez une équipe agile dynamique et contribuerez à la conception et à la mise en oeuvre de pipelines de données à haute performance.
Vos principales missions :
· Collecter, stocker et gérer les données dans un environnement technique avancé incluant une plateforme infrastructure cloud souveraine.
· Analyser les besoins liés à l'intégration et au traitement des données issues de sources diverses (API, bases de données, fichiers).
· Concevoir et développer des pipelines robustes pour l'automatisation des processus : Ingestion et validation des données.
· Développer et maintenir des démonstrateurs et outils de traitement de texte génératif et des modèles de données associés pour soutenir les analyses et les projets d'IA.
· Assurer la qualité, l'intégrité et la sécurité des données en mettant en place des processus de gouvernance et de validation des données.
· Automatiser les tests fonctionnels pour garantir la qualité des livrables.
Documenter les développementsde manière claire et concise.
Le profil recherché
Titulaire d'un diplôme d'ingénieur ou Master technique, science des données ou domaine connexe, vous disposez d'une expérience dans l'ingénierie des données, l'architecture des données ou un domaine connexe.
Compétences Techniques :
· Compétences en modélisation de données et en ETL.
· Maîtrise du langage Linux (shell) et de programmation tels que Python, SQL de versionning.
· Excellente maîtrise de Python et des outils associés en développement d'API et web application, visualisation, manipulation et analyse de données, analyse de réseaux et visualisation de graphes
Afficher la suite
· Expérience avec des outils de gestion de bases de données (SQL, NoSQL) et vectorielle
· Environnement de développement ex : FastAPI, Jupyter, Anaconda, streamlit, LangChain, pytest, LlamaIndex
· Connaissance des technologies de traitement de données en temps réel : Spark, Kafka, Scala
· Orchestration de workflow : Airflow, Composer
· Expérience avec les modèles de langage avancés, tels que Llama, GPT, Falcon, Albert, OpenAI
· Expertise en NLP : plongements de documents, recherche d'information, extraction de données structurées, approche hybride texte/graphes.
Connaissances Techniques :
· Familiarité avec les technologies souveraines et libres dans le domaine de l'IA, comme l'environnement Albert.
· Connaissance des plateformes cloud souveraines et des environnements de conteneurisation (Kubernetes, Docker)
· Connaissance des bonnes pratiques en matière de gestion des données, de SSI et du RGPD.
· Connaissances dans le domaine de l'intelligence artificielle (Deep Learning, Machine Learning) et de l'environnement professionnel et du SI de l'éducation nationale serait un plus.
Savoir-Être :
· Capacité à travailler de manière autonome, en équipe et à communiquer efficacement.
· Excellentes capacités analytiques et de résolution de problèmes.
· Bonne communication écrite et orale et capacité à la vulgarisation de documentations techniques complexes.
· Capacité à gérer plusieurs projets simultanément et à respecter les délais.
· Esprit d'initiative et sens du service.