
Data Engineer H/F - Adexcel Consulting
- Paris - 75
- CDI
- Adexcel Consulting
Les missions du poste
La Direction Technique du Numérique de notre client mène des projets transverses en étroite collaboration avec les autres directions, notamment la direction Data. La Direction Data, au sein de la Direction du Numérique, a été créée avec la volonté de faire de la Data un levier de croissance des offres numériques.
La stack technique est principalement constituée de Python, Spark, SQL pour les traitements de données en batch, Apache Beam pour les traitements en streaming et Airflow pour l'orchestration.
La stack inclut aussi les services BigQuery, Dataproc et PubSub de la Google Cloud Platform et Terraform pour la gestion de l'infrastructure.
Prestations attendues :
Au sein de l'équipe Data et au coeur de la plateforme data, la mission se déroulera en collaboration avec les experts métier de la donnée, les product owners, les data scientists ou encore les data managers.
Cette plateforme repose sur une architecture Lakehouse construite sur la Google Cloud Plateform.
En travaillant avec les autres Data Engineers de l'équipe, la mission consistera à participer à :
- La collecte et l'ingestion de différentes sources de données non homogènes
- La mise en place de pipelines de traitement de données
- Le développement des modèles de données
- L'extraction et l'exposition des données du Lakehouse vers d'autres services
- L'industrialisation des projets sur la GCP
- La mise en place et la maintenance des infrastructures scalables capables de répondre aux besoins et à
l'accroissement rapide du volume de données
- La participation aux initiatives de gouvernance des données en assurant la qualité, la fiabilité et l'intégrité
des données
- La participation active aux différentes phases de grooming, cadrage et planification des tâches avec
l'équipe
Le profil recherché
- Compétences solides en data : structures de données, code, architecture
- Connaissance de l'un des Cloud Provider Public : de préférence GCP
- Expériences professionnelles avec les langages SQL et Python
- Références professionnelles sur des projets Big Data : de préférence Pyspark, BigQuery et Airflow
- Expertises dans la mise en place de pipeline ETL / ELT
- Bonnes connaissances de Gitlab et Gitlab CI/CD
- Forte capacité à vulgariser et à communiquer sur des aspects purement techniques
- Pratique des méthodes Agile (Scrum, Kanban)
Minimum 3 ans d'expérience en tant que Data Engineer