
Sre Network Baremetal H/F - OVHCloud
- Paris - 75
- CDI
- OVHCloud
Les missions du poste
Au sein de votre équipe #OneTeam
- Au sein du groupe Infrastructure, rejoindre l'équipe en charge de soutenir l'ambition et la croissance d'OVHcloud en mettant à l'échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.
- En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l'excellence des services.
Vos principales responsabilités
- Évaluer et prioriser les incidents affectant l'infrastructure et les plateformes logicielles d'OVHcloud
- Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
- Proposer et mettre en oeuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
- Participer aux rotations d'astreinte pour assurer la continuité des services
- Collaborer avec les équipes de développement et d'infrastructure pour éliminer les goulots d'étranglement, améliorer les performances et réduire les coûts opérationnels
- Contribuer aux revues post-incidents et aux post-mortems
- Fournir un support technique aux propriétaires d'applications et aux parties prenantes des pipelines CI/CD
- Travailler dans un environnement d'infrastructure IT fortement orienté réseau
Votre futur impact
Dans 6 mois
- Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
- Vous aurez identifié et commencé à résoudre des points faibles précis de l'infrastructure, notamment via des automatisations en Python ou GO.
- Vous serez un membre essentiel de l'équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.
Et dans 1 an
- Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
- Vos contributions auront un impact direct sur la stratégie d'infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d'excellence au sein d'OVHcloud.
- Vous maîtriserez en profondeur l'écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.
C
Le profil recherché
ompétences requises :
- Vous maîtrisez l'anglais et le français, tant à l'écrit qu'à l'oral
- Vous avez une solide connaissance des systèmes internes Unix/Linux
- Vous êtes compétent en développement logiciel (Python, GO, Perl)
- Vous avez de l'expérience dans l'exploitation de systèmes distribués
- Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
- Vous avez une bonne compréhension des outils, plateformes et processus liés au CI/CD/CA
- Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie/pub-sub (RabbitMQ, Redis, Kafka)
- Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
- Vous faites preuve d'un solide esprit d'analyse et d'une capacité à résoudre des problèmes complexes.
- Vous possédez d'excellentes compétences en communication et en collaboration d'équipe
- Vous êtes enthousiaste à l'idée de travailler sur des infrastructures à grande échelle et à haute disponibilité
C'est un +
- Vous êtes à l'aise avec les réseaux (la connaissance de VXLAN est un atout)
SRE Network BareMetal H/F/N