Incident Manager Habilitation Secret Defense H/F - Nyou
- Bruyères-le-Châtel - 91
- Freelance
- Nyou
Les missions du poste
Nyou c'est voir les choses autrement
Changeons de point de vue, traçons une nouvelle route.
Performants
Évoluer dans le bon sens
Nos consultants sont la clé de voûte de notre organisation.
Avec l'aide de nos clients, ils engagent sur la voie de l'excellence.
Résilients
Se remettre en question continuellement
Le secteur des hautes technologies est en mutation constante.
Apprenons à suivre et prédire les évolutions du marché.
Responsables
Rester fidèles à nos valeurs
Le Conseil doit se réinventer.
Écrivons une nouvelle histoire, empreinte de respect des aspirations de chacun.
Prenez part aux challenges de demain en intervenant sur les projets les plus ambitieux.
Développez vos compétences, imaginez un avenir plus GRAND avec nos plans de carrière personnalisés.
Intégrez une entreprise à taille humaine, à la hauteur de vos ambitions.
We are Nyou, and you ?Prestation incident manager
Mission principale
Assurer la gestion de bout en bout des incidents affectant les services du centre de calcul, avec pour objectif de restaurer le service dans les meilleurs délais et de limiter l'impact pour les utilisateurs (chercheurs, ingénieurs, applications critiques).
Le consultant agira en coordination avec les différentes équipes techniques (assistance utilisateur, exploitation, systèmes, réseaux, stockage, sécurité, support N1/N2) tout en assurant une communication claire auprès des utilisateurs.
Responsabilités clés
1. Pilotage des incidents
- Qualifier et prioriser les incidents (selon impact / urgence).
- Déclencher et coordonner les actions de résolution.
- Assurer le suivi en temps réel jusqu'au rétablissement du service.
- Gérer les incidents majeurs (Major Incidents).
2. Interface avec les utilisateurs
- Être le point de contact central pour les incidents à fort impact.
- Informer les utilisateurs de manière claire, régulière et transparente.
- Expliquer les causes, les impacts et les délais de rétablissement.
- Gérer les situations de tension ou de crise.
3. Coordination technique
- Mobiliser les équipes appropriées (systèmes, réseaux, stockage, applications, sécurité).
- Faciliter la collaboration inter-équipes.
- S'assurer que les diagnostics avancent efficacement.
- Arbitrer les priorités en cas de ressources limitées.
Connaissances appréciées - Environnement centre de calcul
- Environnements complexes : clusters HPC, planificateurs (Slurm), réseaux haute performance, systèmes de fichiers distribués (Lustre).
- Utilisateurs experts mais très dépendants des ressources (jobs longs, campagnes de calcul, échéances scientifiques).
- Incidents à fort impact indirect : perte de données, recalculs coûteux, délais de publication.
- Fenêtres de maintenance et SLA spécifiques au monde académique ou industriel.
Gestion post-incident
- Animer ou contribuer aux revues post-incident (post-mortem).
- Identifier les causes racines (RCA).
- Proposer et suivre des actions correctives et préventives.
- Capitaliser les retours d'expérience (procédures, base de connaissances).
Reporting et amélioration continue
- Contribuer à l'amélioration des processus de support et d'exploitation (souvent alignés ITIL)
Informations pratiques
- Lieu : Bruyères-le-Châtel
- Télétravail : Non
- Démarrage : ASAP
- Nationalité française requise
Le profil recherché
Compétences requises
Techniques
- Bonne compréhension des centres de services ou assistance utilisateurs
- Capacité à dialoguer avec des experts techniques.
- Compréhension des outils de supervision et de ticketing.
Organisationnelles et humaines
- Gestion de crise et prise de décision rapide.
- Communication claire et structurée.
- Leadership transversal (sans lien hiérarchique).
- Résistance au stress.