Ingénieur Lead Data H/F - Direction Interministérielle du Numérique (DINUM)
- Paris 7e - 75
- Fonctionnaire
- Direction Interministérielle du Numérique (DINUM)
Les missions du poste
Nous avons des compétences, profils et centres d'intérêt variés, mais nous sommes réunis par des objectifs communs : mettre la technologie au service de l'intérêt général, moderniser l'administration grâce au numérique, rendre les données publiques plus accessibles et plus utiles, expliquer simplement des sujets complexes, continuer à apprendre dans nos métiers et partager nos connaissances avec les communautés qui nous entourent. Le principal produit que nous développons est data.gouv.fr, la plateforme des données publiques françaises. La démarche d'ouverture des données contribue à renforcer la transparence de l'action publique, améliorer les politiques publiques, favoriser l'innovation et créer de la valeur économique et sociale. Administrations centrales, collectivités territoriales, opérateurs publics et acteurs de la société civile publient quotidiennement des données sur data.gouv.fr. Aujourd'hui, la plateforme héberge directement ou référence indirectement plusieurs dizaines de milliers de jeux de données et des centaines de milliers de ressources. Au-delà de data.gouv.fr, le pôle Data opère également des infrastructures et services de circulation de données utilisés quotidiennement par de nombreuses administrations pour mettre en oeuvre le Dites-le-nous-une-fois. Dans ce contexte, nous recherchons un·e Data Engineer pour renforcer nos capacités autour des pipelines de données, de l'exploitation de données publiques à grande échelle et des infrastructures de diffusion
Nous recherchons un(e) Expert(e) sur les données pour assurer le traitement, la cohérence et la valorisation des données que nous manipulons au sein du pôle data de la DINUM. Ce rôle associe expertise métier et technique, accompagnement des produits interministériels, et animation de l'écosystème autour des jeux de données ouverts et confidentiel sur les entreprises ou les particuliers.
L'expert(e) sera un référent transverse entre plusieurs produits stratégiques. Il apportera conseil et vision pour garantir leur complémentarité et leur alignement avec les besoins des administrations et des usagers. Il devra être le contact privilégié avec les nouveaux fournisseurs de données irrigant les différents produits.
Au sein du pôle Data, il/elle contribuera au développement et à l'exploitation des pipelines de données et des infrastructures utilisées par les produits du pôle.
Il/elle interviendra notamment sur les sujets suivants :
- conception et maintenance des pipelines de traitement et de diffusion de données ouvertes (INSEE, Météo-France, DGFIP, ARCEP, etc.) ;
- amélioration des services autour des données sur data.gouv.fr (apification, transformations de formats, enrichissement de données) ;
- travail autour de la qualité des données et des schémas de données, notamment via schema.data.gouv.fr ;
- mise en place et exploitation des infrastructures de métriques et d'observabilité des produits et APIs du pôle Data ;
- accompagnement des équipes sur les problématiques d'infrastructure, de performance et d'industrialisation des traitements de données.
Les technos
Nous utilisons principalement Python pour nos traitements de données et le développement de services.
Notre stack technique comprend notamment : Python ; Airflow ; PostgreSQL ; MongoDB ; Elasticsearch ; MinIO / stockage objet compatible S3 ; Docker ;
Nous manipulons des volumes de données variés ainsi que des formats multiples, structurés ou non structurés.
Une expérience autour des données géographiques et des outils géo (PostGIS, GDAL, geopandas, etc.) est un plus.
Le profil recherché
Vous avez un profil technique solide et êtes capable de concevoir, maintenir et faire évoluer des pipelines de données en production.
Vous êtes à l'aise avec :
- le traitement et l'analyse de données ;
- les problématiques d'industrialisation et de qualité des données ;
- les sujets d'infrastructure et d'exploitation ;
- le travail collaboratif avec des équipes produit, développement et data science.
Vous avez également :
- une appétence pour les outils open source ;
- de l'autonomie sur les sujets d'infrastructure et de conteneurisation (Docker notamment) ;
- un intérêt pour les enjeux d'ouverture et de circulation des données publiques.
Une connaissance de l'écosystème open data et des standards de données publiques est un vrai plus.
Comment nous travaillons :
Nous attachons une grande importance au collectif tout en travaillant en petites équipes autonomes.
Nous sommes nos premiers utilisateurs et nous nous fixons des exigences élevées sur la qualité, la simplicité d'usage et la robustesse des produits que nous opérons.
Nous cherchons à démontrer que l'État sait concevoir et opérer des services numériques utiles, fiables et simples.
Au sein de la DINUM, du pôle data, et de l'écosystème numérique de l'État, vous pourrez échanger facilement avec une communauté active de développeuses, développeurs, data engineers, designers et product managers partageant des problématiques similaires et une forte culture du logiciel libre et de l'intérêt général.