Site Reliability Engineer - Transverse H/F - OVHCloud
- Roubaix - 59
- CDI
- OVHCloud
Les missions du poste
Au sein de votre équipe #OneTeam
- Vous rejoindrez la Corp Business Applications Unit, qui conçoit et opère les outils internes stratégiques d'OVHcloud pour divers département (IT, Finance, Legal, Industrie...).
- En tant que Site Reliabiltiy Engineer vous interviendrez auprès de l'ensemble des équipes de l'Unité CBA dans l'appropriation et l'implémentation de l'IA et contribuer directement à la mise en oeuvre de solutions techniques : automatisation, infrastructure as code, supervision, CI/CD.
Vos principales responsabilités
- Collaborer avec les équipes techniques transverses et les autres unités pour améliorer en continu nos services et produits.
- Exploiter les services disponibles dans le SI afin de répondre aux besoins fonctionnels, et contribuer à leur évolution pour mieux y répondre.
- Améliorer les outils et infrastructures existantes afin d'optimiser la disponibilité, la scalabilité et la performance des services.
- Participer aux choix technologiques, à l'évaluation des outils et à la définition des standards architecturaux.
- Promouvoir la culture SRE (ownership des services, amélioration continue, fiabilité élevée des systèmes).
- Contribuer aux analyses de causes racines et assurer le suivi des incidents critiques afin de renforcer la résilience des systèmes.
- Participer à la définition des SLOs.
Votre futur impact
Dans 6 mois vous
- Connaîtrez les services critiques, les flux CI/CD et les principaux enjeux de fiabilité. Vous serez devenu un interlocuteur naturel pour les équipes techniques, capable d'apporter des réponses rapides et structurées.
Et dans 1 an vous
- Serez pleinement identifié comme un pilier technique de la Unit. Votre expertise vous permettra d'orienter les choix technologiques et de contribuer à la définition des standards SRE.
\_
C
Le profil recherché
Compétences requises:
- Vous avez une précédent expérience en administration ou ingénierie système.
- Vous maitrisez les outils comme : Kubernetes / Docker et la philosophie Cloud Native.
- Vous avez une expérience sur des sujets de CI/CD.
- Vous connaissez au moins un de ces outils de déploiements: Ansible, Terraform, Puppet, Chef...
- Vous maitrisez un ou plusieurs langages de scripting (Python, Golang...).
- Vous avez de solides connaissances des outils de supervision et d'observabilité (Prometheus / Grafana).
C'est un +
- Appétence pour l'IA.
Site Reliability Engineer - Transverse H/F/N