Architecte Data Platform H/F - Seenovate
- Lyon - 69
- CDI
- Seenovate
Les missions du poste
Spécialisée dans la Data Intelligence, Seenovate accompagne ses clients dans la valorisation de leurs données. Pour accompagner les grands comptes et les PME, nous nous appuyons sur nos 8 agences et sur 200 collaborateurs basés dans toute la France.
Intégrateurs de solutions Business Intelligence et experts en Data Science, nous sommes un important partenaire de SAP sur le monde des solutions analytiques de l'éditeur. De plus, notre écosystème varié de partenaires stratégiques nous permet de garantir le plus haut niveau d'expertise à nos clients.
Éditeurs de solutions basées sur l'IA frugale et souveraine, nous concevons et déployons nos propres solutions de logicielles, via notre marque SeensIO.
Nous segmentons également notre expertise à travers 3 autres marques :
- SeeSports, la valorisation de la donnée dans le monde du sport,
- SeeAcademy, le centre de formations Data Intelligence, certifié Qualiopi,
- SeeGreen, la data au service du numérique responsable.
Intégré(e) à nos équipes Delivery, vous interviendrez sur plusieurs projets internes et clients.
Votre rôle en qualité d'Architecte Data Platform sera de mener à bien les missions suivantes :
Architecture & Conception technique
- Définir les architectures Data, IA et applicatives cibles répondant aux enjeux métiers et techniques des clients (cadrage, choix technologiques, dossiers d'architecture, urbanisation)
- Concevoir des plateformes Data & MLOps cloud-native robustes, sécurisées et évolutives
- Participer aux choix d'architecture autour des environnements distribués, microservices et Kubernetes
- Définir les standards d'industrialisation, de sécurité et d'exploitation des plateformes
Développement, Data & MLOps
- Développer et maintenir des applications backend et des services distribués en Python
- Concevoir des API et microservices conteneurisés avec Docker et Kubernetes
- Concevoir et industrialiser les pipelines MLOps de bout en bout
- Garantir la robustesse, la sécurité et la fiabilité des pipelines de données (Spark, Dask, Python)
- Optimiser les performances des traitements distribués et des architectures Data
- Produire une documentation technique claire et exploitable
Infrastructure & Fiabilité
- Déployer et administrer des infrastructures cloud via Infrastructure as Code (Terraform, Ansible)
- Industrialiser les chaînes CI/CD avec GitLab CI/CD et les pratiques GitOps (ArgoCD)
- Automatiser les déploiements applicatifs et infrastructures
- Participer à la stratégie de tests, validation et qualité logicielle
- Mettre en oeuvre des mécanismes OIDC, SSO, Keycloak, RBAC
- Déployer des solutions d'observabilité et monitoring (Prometheus, Grafana, Elasticsearch, OpenTelemetry, Loki)
- Participer à la gestion des incidents et à l'amélioration continue de la fiabilité des systèmes
Le profil recherché
Titulaire d'un Bac +5 dans le domaine des Statistiques ou Sciences des données, vous justifiez d'une première expérience probante d'au moins cinq ans sur un poste similaire.
- Vous maîtrisez le langage d'une ou plusieurs bases de données (PostgreSQL, InfluxDB) : optimisation de requêtes, bonnes pratiques...
- Vous possédez une bonne connaissance d'un ou plusieurs outils ETL et de stockage objet (S3/MinIO),
- Vous justifiez d'une expérience :
- Sur GCP et/ou sur Kubernetes (déploiement, orchestration),
- En Python et sur des frameworks de traitement de données comme Spark, Pandas, Polars ou Dask,
- Sur Git et GitLab (gestion de versions, revue de code, workflows collaboratifs).
Vos compétences relationnelles sont primordiales à votre bonne réussite sur ce poste puisque vous serez amené(e) à vous exprimer devant une assemblée (dans le cadre de restitutions clients, d'avant-ventes, d'animation d'ateliers ou encore de formations clients).
Vous possédez une bonne capacité d'écoute vous permettant de rebondir sur des problématiques Client.