Data Engineer H/F - Service Public
- Paris 15e - 75
- Fonctionnaire
- Service Public
Les missions du poste
La sous-direction de l'Observation de la santé et de l'assurance maladie (OSAM) réalise les opérations statistiques et conduit les études concernant les politiques sanitaires et le système de santé. Elle assure également la gouvernance des données de santé. Elle rassemble les travaux concernant les populations, leurs besoins, les structures de prises en charge et les professionnels de santé ainsi que les masses financières en jeu.
Le Lab innovation et évaluation en santé (Lab Santé) a pour mission de favoriser la diffusion de l'innovation sur les données de santé. Structure transversale de la sous-direction de la Drees responsable de l'observation de la santé et de l'assurance maladie, il appuie notamment les bureaux thématiques de la sous-direction. L'équipe traite et analyse les données de santé, en premier lieu le Système National des Données de Santé (SNDS) et son appariement avec d'autres sources, pour répondre à des problématiques diversifiées d'intérêt pour la Drees. L'équipe, pluridisciplinaire, réunit data scientists, data engineers, statisticiens, administrateur système, post-doctorant, médecins ainsi qu'une équipe dédiée à l'évaluation des politiques publiques.Au sein du Lab Santé, le/la titulaire est en charge de faciliter les travaux autour des données de santé et notamment du système national des données de santé (SNDS), base médico-administrative regroupant remboursements et hospitalisations de l'ensemble de la population.
Le/la titulaire travaillera principalement sur une plateforme hors ligne sur laquelle les données de santé sont hébergées. Il s'agit d'une infrastructure moderne de calcul (basée sur kubernetes/docker pour les sessions, Spark/pytorch pour les calculs eux-mêmes, et VSphere/AD Windows/Wazu/Pacemaker pour l'infrastructure et la gestion des ressources), équipée de deux serveurs de calculs comptant 160 cores et 3 TB de RAM au total, en plus des serveurs de support pour la virtualisation, le backup des données, et l'Active Directory. L'infrastructure comporte également des éléments de sécurités comme un firewall physique.
Sur cette plateforme, pour les besoins du Lab Santé et d'autres équipes de la Drees :
- Le/la titulaire est en charge, à l'aide de prestataires spécialisés, de mettre à jour les composants logiciels de l'infrastructure, d'intégrer les nouveaux composants physiques ;
- Il/elle optimise le cycle de vie des projets sur les données de santé et des études innovantes qui y sont associées. Il/elle intervient lors des incidents d'exploitation afin d'accélérer leur résolution et participe au maintien en condition opérationnelle (MCO) des socles techniques ;
- Il/elle participe à la mise en place puis au suivi des pipelines d'analyse de données de santé et vérifie la disponibilité et la performance des systèmes ;
- Il/elle assure la qualité des flux de données et participe à l'amélioration continue de la qualité des codes produits par les équipes du Lab Santé. Il/elle sert de support aux autres utilisateurs en cas de difficultés sur la plateforme de données de santé hors ligne ;
- Il/elle contribue à l'élaboration de rapports bimestriels des activités data du Lab Santé et contribue aux reportings et comités ;
- Il/elle participe à l'élaboration des propositions d'études innovantes sur les données de santé et réponses aux appels à projet qui incluent un volet data ;
- Il/elle participe à la veille technologique et à la diffusion des connaissances dans son domaine
- Il/elle participe à la mise à jour du référentiel de sécurité du SNDS et son guide d'accompagnement ainsi que du référentiel d'audit et de son guide d'accompagnement. Il/elle assure également le secrétariat du comité d'audit.
Le profil recherché
E : Savoir agir dans un contexte complexe, faire preuve de créativité, trouver de nouvelles
solutions, former d'autres agents, être référent dans le domaine.
M : Mettre en oeuvre la compétence de manière régulière, corriger et améliorer le processus,
conseiller les autres agents, optimiser le résultat.
A : Savoir effectuer, de manière occasionnelle ou régulière, correctement les activités, sous
le contrôle d'un autre agent, savoir repérer les dysfonctionnements.
N : Disposer de notions de base, de repères généraux sur l'activité ou le processus
(vocabulaire de base, principales tâches, connaissance du processus, global...)
Connaissances :
- Intégration et administration système Linux, déploiement des solutions : E
- Sécurité informatique et réseau : M
- Script bash/shell : E
- Docker, kubernetes, virtualisation : M
- Administration système Windows (active directory, gestion de certificats) : M
- Langage de développement, en particulier Python : M
- Support aux changements : M
Savoir-être : Indiquez au moyen de *** en fonction des attentes
- Autonomie ***
- Force de proposition ***
- Capacité d'adaptation et réactivité ***
- Etre organisé et rigoureux ***
- Sens de la pédagogie **
- Réactivité **
Savoir-faire :
- Conduire le changement***
- Conduire un projet, une démarche***
- Interagir avec de nombreux partenaires ***
- Rendre compte ***
- Communication orale et écrite **
- Analyse de manière systématique l'environnement pour identifier et définir les failles et les menace ***
- Identifie les composants défaillants et établit la cause principale de la défaillance au sein du système **
- Audite les processus et l'environnement informatique et analyse de manière systématique les données de performance et communique ses résultats **