Lead Data Engineer H/F - Kent
- Paris 13e - 75
- CDI
- Kent
Les missions du poste
KENT est un employeur engagé en faveur de la diversité et de l'égalité des chances. Tous nos postes sont ouverts à toutes et à tous, sans distinction ni discrimination. Nos décisions de recrutement reposent exclusivement sur les compétences, les aptitudes et la motivation.Notre client, acteur majeur et innovant de la e-santé, développe des dispositifs médicaux connectés, des solutions de coordination de soins et des algorithmes avancés de traitement de données à fort impact médical. Ses projets se situent à l'intersection de la technologie, de la data et des enjeux cliniques de pointe, notamment en neurologie et dans le domaine du sommeil.
Au sein du pôle Data Science (environ 15 personnes), vous intervenez en tant que Lead Technique Data / Data Platform, en collaboration étroite avec un Data Engineer, une équipe de Data Scientists, ainsi que les équipes DevOps, Infra, IoT et Hardware.
Votre objectif principal est de concevoir, maintenir et faire évoluer une plateforme data (datalake) au coeur des projets IA, en mettant l'accent sur la robustesse logicielle, l'automatisation et l'industrialisation, plutôt que sur des usages BI ou analytiques.
Vos missions:
- Pilotage et amélioration continue du datalake : performance, sécurité, scalabilité et maîtrise des coûts.
- Conception et évolution d'architectures data orientées engineering, adaptées à des volumes importants et à des usages IA.
- Standardisation et structuration des données : homogénéisation des formats, définition d'une ontologie et mise en place de bonnes pratiques de qualité des données.
- Mise en oeuvre du versionnement des jeux de données (traçabilité, reproductibilité, auditabilité).
- Mise en place d'outils de monitoring et de supervision des flux data (métadonnées, alerting, logs).
- Conception, déploiement et maintenance de pipelines ETL automatisés (ingestion, transformation, nettoyage), notamment via Airflow, Spark et services AWS.
- Optimisation des transferts et traitements de grands volumes de données avec des enjeux forts de performance et de résilience.
- Garantie du respect strict des exigences RGPD : anonymisation, pseudonymisation et documentation des traitements.
- Collaboration étroite avec les équipes Data Science pour fournir un environnement adapté à l'expérimentation, au training et au déploiement de modèles ML.
- Automatisation des scripts, industrialisation des pipelines et intégration dans des chaînes CI/CD data et code.
- Déploiement de solutions de monitoring, logging et alerting pour garantir la stabilité des plateformes.
- Participation aux choix d'architecture cloud et data, avec une veille technologique active.
- Encadrement technique et accompagnement des profils plus juniors.
- Le poste est clairement orienté Data Engineering / Software, et non Data Analyst ou BI.
Environnement technique:
Python
AWS : EC2, Lambda, S3, Glue, Athena, API Gateway, Cognito, ECS, ECR, SageMaker
Databricks
Spark, Pandas
Airflow
MongoDB
Terraform
Git / GitLab CI
Linux
Le profil recherché
- Minimum 5 ans d'expérience sur des fonctions similaires (Data Engineer, Data Platform Engineer, Lead Data).
- Forte appétence pour le développement logiciel et l'industrialisation des systèmes data.
- Excellente maîtrise de Python et des outils de versionnement (Git).
- Expérience solide sur le cloud AWS, notamment EC2, Lambda, et services data managés.
- Très bonne compréhension des pipelines de données, architectures Big Data et systèmes distribués.
- À l'aise avec l'automatisation, le scripting et les bonnes pratiques de développement (tests, CI/CD).
- Capacité à travailler en environnement pluridisciplinaire (data science, infra, IoT, hardware).
- Anglais technique opérationnel.
- Expérience dans des environnements réglementés (CE, FDA) appréciée.
- Manipulation de données de santé.
- Notions en cybersécurité.
- La connaissance des signaux électrophysiologiques (ECG, EEG, EMG...) est un plus.