Recrutement OVHCloud

Site Reliability Engineer - Network Observability H/F - OVHCloud

  • Cesson-Sévigné - 35
  • CDI
  • OVHCloud
Publié le 31 octobre 2025
Postuler sur le site du recruteur

Les missions du poste

Au sein de votre équipe #OneTeam

- Vous rejoindrez l'équipe Network Observability, en charge de la conception des produits d'observability pour une infrastructure composée de plus de 500 000 serveurs, 5 millions d'adresses IP publiques et 40 000 équipements réseau ; le maintien en condition opérationnel et l'amélioration continue de ces produits est central.
- En tant queSite Reliability Engineer chez Network Observability, votre rôle est de maintenir, améliorer et concevoir les solutions logicielles qui permettent de suivre et d'analyser les performances de l'infrastructure réseau OVHcloud. Vous serez moteur dans lamodernisation des outils internes de monitoring et la création de nouveaux produits innovants répondant aux besoins des équipes réseau.

Vos principales responsabilités

- Moderniser les outils internes de supervision et de monitoring.
- Participer aux rotations d'astreintes.
- Assurer la haute disponibilité, la fiabilité et la sécurité de nos outils d'observabilité réseaux.
- Contribuer à la culture DevOps au sein de l'équipe et partager les bonnes pratiques.
- Gérer les projets LEAN (amélioration continue) pour améliorer la qualité de service et l'efficacité/résilience de l'infrastructure.

Votre futur impact

Participé à l'amélioration de la qualité de service (QoS) des infrastructures réseau OVHcloud.
- Découvert et maitrisé les outils internes et les différentes stacks techniques utilisés dans le périmètre de l'équipe
- Participé à des améliorations concrètes sur la résilience et la haute disponibilité des produits

Dans 1 ans vous aurez :
- Une maitrise totale du périmètre Network Observability
- Contribué à définir la feuille de route de l'amélioration continue des années futures
- Amélioré concrètement la qualité de service et l'automatisation des produits

\_

C

Le profil recherché

Compétences requises:
- Vous avez une précédent expérience en administration ou ingénierie système.
- Vous maitrisez les outils comme : Kubernetes / Docker et la philosophie Cloud Native.
- Vous avez une expérience sur des sujets de CI/CD.
- Vous connaissez au moins un de ces outils de déploiements: Ansible, Terraform, Puppet, Chef...
- Vous maitrisez un ou plusieurs langages de scripting (Python, Golang...).
- Vous avez de solides connaissances des outils de supervision et d'observabilité (Prometheus / Grafana).

C'est un +

- Vous avez déjà occupé un rôle d'ingénieur réseaux.
- Appétence pour l'IA.

Site Reliability Engineer - Network Observability H/F/N

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.