Sre H/F - NEWAY SOLUTION DIGITALE
- Courbevoie - 92
- Indépendant
- NEWAY SOLUTION DIGITALE
Les missions du poste
Depuis plus de 15 ans, notre société d'ingénierie et de conseils met son expertise au service des entreprises (PME/ETI/Grands groupes)
Nous regroupons aujourd'hui plus 60 collaborateurs, aux profils variés, qui portent au quotidien de multiples projets Informatique. Notre Expertise va de l'exploitation des systèmes jusqu'a la transformation Digitale en passant par l'analyse de la Data, l 'IA et la cybersécurité.- Définir la stratégie SRE et la roadmap de transformation, prioriser les chantiers fiabilité/performance/exploitation plateforme et animer la gouvernance associée.
- Mettre en place et piloter SLI/SLO et budgets d'erreur par service, et arbitrer la cadence de mise en production vs la fiabilité utilisateur.
- Industrialiser l'automatisation et réduire le toil via IaC, CI/CD et runbooks, en standardisant les pratiques d'exploitation.
- Structurer l'observabilité, l'alerte et la gestion des incidents, réduire MTTD/MTTR et instaurer des postmortems sans blâme pour l'amélioration continue.
- Concevoir et faire évoluer une plateforme fiable (cloud/Kubernetes), définir patterns de résilience, guardrails et capacités multirégions/DR.
- Conduire le changement organisationnel, former et coacher les équipes, aligner Produit/Dev/Ops et synchroniser les chantiers transverses.
- Orchestrer l'astreinte et les opérations 24/7, standardiser les rituels d'exploitation et les niveaux d'escalade.
- Optimiser coûts et performances (FinOps), instrumenter la visibilité budgétaire et piloter les arbitrages usage/coûts.
- Intégrer sécurité et conformité dans les pratiques SRE et la chaîne de livraison continue.
- Piloter le portefeuille projets fiabilité, la gestion des risques, le planning/charges et le reporting exécutif
- Accompagner la transition de services (release, Early Life Support), en minimisant l'impact client lors des changements majeurs.
Compétences requises :
Techniques: SRE/DevOps, cloud (ex. Azure), Kubernetes/AKS, observabilité, CI/CD, réseau, sécurité, et maîtrise de l'IaC (ex. Terraform).
Méthodologie: gouvernance SLI/SLO, gestion des incidents, postmortems sans blâme, amélioration continue et gestion de la dette opérationnelle.
Leadership: conduite du changement, animation de communautés SRE/plateforme, coaching, communication claire avec métiers et direction
Stratégie et roadmap SRE: construire la vision cible, prioriser les chantiers (fiabilité, performance, exploitation cloud, plateforme), cadrer la gouvernance et animer la trajectoire de transformation.
Gouvernance SLI/SLO
Incident & observabilité: structurer la détection, l'alerte et la réponse aux incidents, réduire le MTTR, instaurer des postmortems sans blâme et améliorer en continu
Conduite du changement: diffuser la culture SRE/DevOps, former/coacher les équipes, aligner Produit/Dev/Ops, et organiser la montée en maturité par palier
Pilotage et parties prenantes: cadrer projets/streams, assurer reporting, risques, planning/charges et synchronisation multi-équipes
Le profil recherché
8-12 ans d'expérience IT dont 3-5 ans en SRE/DevOps/plateforme avec encadrement d'équipes techniques, idéalement dans des environnements à forte criticité.
Une expérience de direction/management SRE ou de transition/manoeuvre de transformation à l'échelle est un plus, souvent attendue sur des postes seniors.