
Ingénieur d'Exploitation - Incident Manager H/F - Propulse It
- Paris - 75
- Indépendant
- Propulse It
Les missions du poste
PROPULSE IT recherche un ingénieur d'explotation et Incident Manager Senior (+10 ans d'experience)
Ce poste est un renfort dans une équipe de Supervision et Gestion des Incidents qui a pour mission :
- Gestion des incidents : analyse et diagnostic, traitement et résolution des incidents
- Pilotage de la supervision
- Pilotage de la cellule de crise
- Supervision des SI
Supervision :
Centrée sur les activités temps réel, la surveillance et le traitement des incidents et des demandes sur l'ensemble des services et systèmes exploités
Analyse d'Exploitation :
Centrée sur l'analyse à froid des incidents d'exploitation, les activités de support métier à la supervision, le traitement des problèmes et l'accompagnement du changement en production.
La Mission :
L'objectif principal consistera à poursuivre l'alignement avec l'infogérance Supervision de niveau N0-N1 telle que souscrite depuis le début d'année.
Au coté de la pilote du marché d'infogérance, la prestation aura pour mission de consolider la description des processus, les consignes, modes opératoires et les dossiers d'exploitations confiés à l' infogérant.
Les résultats seront les suivants :
- Faire progresser la QoS en améliorant la qualité du diagnostic, en identifiant puis en appliquant la procédure correspondant au problème rencontré
- Améliorer la qualité de la communication durant les Incidents Majeurs
- Soulager les équipes internes qui sont aujourd'hui beaucoup sollicitées par notre infogérant, leur permettant ainsi de continuer à améliorer le processus cellule de crise et améliorer l'écosystème de surveillance (suppression des faux positifs)
En parallèle, la prestation soulagera les Incidents Manager et Analystes d'Exploitation de E247.
Le profil recherché est de type « Incident Manager / Analyste d'exploitation » ayant opéré en proximité d'une supervision de niveau N0/N1.
Gestion de Cellule de Crise (C.Crise) :
- Proposition d'amélioration du processus actuellement en place
- Gestion de C.Crise sur des véritables incidents en production (rôle d'Incident Manager)
- Pilote des éventuels C.Crise lors de gros changements
Exploitant :
- Amélioration de la Surveillance, des consignes, en relation avec la Supervision N0-N1.
- Dépollution des alarmes récurrentes
- Les différents projets impacts l'équipe
Participe aux bilans de fin de Garantie (VSR)
Profil :
Les compétences techniques attendues sont les suivantes :
- Expérience d'exploitation
- Expérience en administration OS Linux RHEL6 et +, et Windows 2018 et +.
- Outils de Surveillance : Hyperviseur trueSight BMC (et Centréon, DataDog)
- Outil de Ticketing : ServiceNow.
- Briques techniques à maîtriser : Linux Red Hat 6.x ou supérieur, Windows 2k19, Scripting (Shell/Powershell), Logiciel d'automatisation (Automator), Logiciel de sauvegarde (CommVault), Logiciels de Virtualisation VMWare & Nutanix.
Les compétences fonctionnelles attendues sont les suivantes :
- Avoir des connaissances sur la gestion de Cellule de Crise (afin d'apporter des expériences passées pour améliorer l'organisation actuelle).
- Avoir une expérience d'Incident Manager.
- Animer des ateliers techniques avec différents contributeurs, notamment l'équipe de Supervision
- Travailler en mode projet (respect d'un planning, capacité à remonter des alertes en cas de difficultés, compréhension du rôle des acteurs projet à qui il a à faire).