Site Reliability Engineer Sre Gcp H/F - Devoteam
- Toulouse - 31
- CDI
- Devoteam
Les missions du poste
Présentation de l'équipe
Devoteam Toulouse, avec ses 200 collaborateurs, est un acteur incontournable de la transformation digitale sur le bassin toulousain. Au sein de l'agence, A Cloud, accompagne ses clients à devenir des entreprises centrées sur la donnée en tirant profit de la puissance des Cloud Platform. Notre objectif est d'élargir le champ des possibles pour les organisations à la recherche de réponses aux défis technologiques modernes, en utilisant des plateformes cloud qui permettent d'expérimenter rapidement et d'innover à moindre coût.
Pour contribuer à ces évolutions, nous sommes à la recherche d'un(e) consultant(e) SRE GCP souhaitant rejoindre un collectif d'une vingtaines de consultant(e)s spécialisé(e)s en cloud engineering à Toulouse.
Missions
En tant que Site Reliability Engineer (SRE) GCP, vous êtes garant de la fiabilité, de la scalabilité et de la performance des plateformes cloud opérées sur Google Cloud.
Au coeur des environnements de production, vous contribuez à l'automatisation et à l'amélioration continue de la fiabilité des systèmes.
Vos responsabilités :
- Définir et mettre en oeuvre les pratiques SRE : SLI, SLO, SLA
- Garantir la haute disponibilité et la résilience des plateformes cloud
- Automatiser l'infrastructure et les opérations pour réduire le travail manuel
- Développer des outils et scripts pour améliorer l'exploitation des systèmes
- Mettre en place des stratégies de monitoring, alerting et observabilité
- Participer à la gestion des incidents critiques (incident response, post-mortem, RCA)
- Optimiser la scalabilité et la performance des infrastructures cloud
- Contribuer à l'amélioration des pipelines CI/CD et des pratiques DevOps
- Travailler en étroite collaboration avec les équipes Software Engineering, Cloud et Platform
- Participer aux revues d'architecture et aux décisions techniques
Le profil recherché
Vos atouts pour nous rejoindre :
- Cloud : GCP (Google Kubernetes Engine (GKE), Compute Engine, Cloud Run, Cloud Storage, Cloud IAM, Cloud Monitoring ...)
- Connaissance d'autre cloud provider serait un plus : AWS, Azure
- Scripting : Python, Bash, Shell, Powershell
- Programmation : Python, JavaScript, Java
- Infrastructure As Code : Terraform, Packer, Ansible
- CICD : Gitlab, Jenkins
- Observabilité etmonitoring : Prometheus, Grafana, Cloud Monitoring
- Container : Docker, Kubernetes
- Versionning : Git