Sre H/F - Astek
- Lille - 59
- CDI
- Astek
Les missions du poste
Créé en France en 1988, Astek est un acteur mondial de l'ingénierie et du conseil en technologies. Fort de son expertise dans de nombreux secteurs industriels et tertiaires, Astek accompagne ses clients internationaux dans le déploiement intelligent de leurs produits et de leurs services, et dans la mise en oeuvre de leur transformation digitale.Depuis sa création, le Groupe a fondé son développement sur une forte culture d'entrepreneuriat et d'innovation, et sur l'accompagnement et la montée en compétence de ses 10 000 collaborateurs qui s'engagent chaque jour à promouvoir la complémentarité entre les technologies numériques et l'ingénierie des systèmes complexes.Rejoignez un Groupe en fort développement en France et à travers le monde avec un chiffre d'affaires de 730M€ en 2025.Tous les détails sur le Groupe sur le site https://astek.net. Et vous pouvez aussi nous suivre sur notre blog : https://blog.groupeastek.com.Astek est engagée en faveur de l'emploi de personnes en situation de handicap.
Rejoindre Astek, c'est choisir :un accélérateur d'expérience, où chaque mission est une opportunité de progresserun accès à une multitude de projets techniquement passionnants pour nos clients comme en interneun accompagnement de proximité individualisé pour un parcours professionnel sur mesureun apprentissage continu, grâce à notre Académie de formation interneun environnement de travail convivial et inclusif, soutenu par des pratiques RH certifiées #TopEmployer2026Let's move forward.L'agence d'Astek Lille recherche son nouveau Site Reliability Engineer (SRE) afin de rejoindre nos équipes !
Ce que nous allons accomplir ensemble :
Rejoignez nos équipes et intervenez chez un acteur majeur du retail, dans un contexte de transformation digitale et de développement de ses plateformes e-commerce. En qualité de SRE (Site Reliability Engineer) vous garantirez la fiabilité, la disponibilité et la performance de ses systèmes dans un environnement à fort trafic et à forte exigence métier.
Votre mission (...si vous l'acceptez !) :
- Garantir la disponibilité, la fiabilité et la performance des plateformes digitales (e-commerce, applicatifs métiers)
- Définir et suivre des SLO / SLA / SLI afin de piloter la qualité de service
- Mettre en place des solutions de monitoring, logging et alerting (ex : Prometheus, Grafana, Cloud Monitoring, CloudWatch)
- Automatiser les opérations et fiabiliser les systèmes via des scripts et outils (Python, Bash, Terraform)
- Participer à la gestion des incidents de production (diagnostic, résolution, post-mortem, amélioration continue)
- Optimiser la résilience et la scalabilité des architectures (multi-zones, haute disponibilité, auto-scaling)
- Collaborer avec les équipes Dev, Cloud et Sécurité pour améliorer la robustesse des applications
- Contribuer à la mise en place et à l'amélioration des pipelines CI/CD
- Réduire la dette technique et améliorer la maintenabilité des systèmes
- Mettre en oeuvre les bonnes pratiques SRE (gestion des error budgets, réduction du toil, culture d'automatisation)
Le profil recherché
Vous :
- Vous justifiez d'une expérience significative (5 ans minimum) en tant que SRE, DevOps ou Ingénieur Production dans des environnements critiques
- Vous maîtrisez les environnements cloud AWS et/ou GCP ainsi que leurs services principaux
- Vous avez une solide expérience en monitoring et observabilité (Prometheus, Grafana, CloudWatch, Cloud Monitoring)
- Vous possédez de bonnes compétences en automatisation et scripting (Python, Bash, Terraform)
- Vous êtes à l'aise avec les architectures conteneurs et Kubernetes (EKS / GKE)
- Vous avez une bonne connaissance des concepts SRE (SLO, SLA, SLI, error budgets)
- Vous comprenez les enjeux de haute disponibilité, performance et résilience dans des environnements à fort trafic
- Vous avez déjà participé à la gestion d'incidents en production et à l'amélioration continue (post-mortem, fiabilisation)
- Vous êtes autonome, rigoureux(se) et orienté(e) résolution de problèmes
- Vous appréciez le travail en équipe et la collaboration avec les équipes développement, cloud et sécurité
- Une ou plusieurs certifications cloud (AWS / GCP) sont un plus