Recrutement Alliance Services Plus

Ingénieur Système Hpc - Sysops H/F - Alliance Services Plus

  • Paris 1er - 75
  • CDI
  • Alliance Services Plus
Publié le 28 janvier 2026
Postuler sur le site du recruteur

Les missions du poste

Contexte de la Mission

Alliance Services Plus (AS+) recherche un(e) Ingénieur(e) Système HPC senior pour assurer l'infogérance de l'infrastructure de calcul haute performance d'une autorité publique indépendante française du secteur nucléaire, dans le cadre d'un marché public stratégique.

Notre client est chargé de missions critiques en matière de sûreté nucléaire et de radioprotection, incluant la recherche, l'expertise technique, la réglementation et le contrôle des activités nucléaires civiles en France.

La mission se déroule dans un environnement hautement régulé et sensible pour la sûreté nationale, exigeant un très haut niveau d'expertise technique, une rigueur absolue et le respect strict des normes de sécurité.

Exigences Critiques

- Habilitation de sécurité obligatoire
- Citoyenneté française ou UE obligatoire
- Disponibilité 24/7 pour une infrastructure critique
- Conformité stricte aux normes de sécurité et réglementations nucléaires

Missions Principales

1. Phase de Prise en Charge

- Audit complet de l'infrastructure HPC existante
(architecture, performances, sécurité, conformité réglementaire)
- Production d'une documentation exhaustive conforme aux standards nucléaires
- Mise en place des processus d'infogérance haute disponibilité
- Déploiement des outils de supervision et de traçabilité
- Transition sécurisée et transfert de compétences avec les équipes sortantes

2. Phase de Production - Administration Système

- Administration des clusters HPC dédiés aux calculs de sûreté nucléaire et de radioprotection
- Gestion des ordonnanceurs de jobs en environnement critique
(Slurm, PBS Pro)
- Supervision et monitoring 24/7 avec alerting temps réel
(Nagios, Prometheus, Grafana)
- Gestion des incidents critiques selon les processus ITIL et procédures d'urgence
- Maintenance préventive et corrective avec fenêtres d'intervention planifiées
- Gestion sécurisée des mises à jour système
(validation, tests, procédures de rollback)
- Optimisation des performances pour codes de calcul scientifiques
(modélisation et simulations de sûreté)
- Traçabilité complète des actions et reporting de conformité réglementaire

3. Phase de Production - Expertise Technique

- Support aux chercheurs et experts sur les applications scientifiques HPC
- Installation, configuration et optimisation de codes de calcul complexes
- Expertise en parallélisation
(MPI, OpenMP)
- Optimisation GPU pour simulations intensives
- Conteneurisation sécurisée des applications scientifiques
(Singularity)
- Veille technologique HPC et recommandations d'évolution compatibles avec les exigences de sûreté

Activités Complémentaires - Projets Stratégiques

- Participation aux projets de modernisation et d'extension des infrastructures HPC
- Intégration de nouvelles architectures matérielles
(CPU, GPU, accélérateurs)
- Migration et transformation des infrastructures en garantissant la continuité de service
- Support aux opérations d'intégration de codes de calcul scientifiques très complexes

Compétences Techniques Recherchés

- Administration Linux en environnement HPC de production
(RHEL, CentOS, Rocky Linux, Ubuntu Server)
- Gestion de clusters HPC : architecture, stockage parallèle, réseaux haute performance
- Ordonnanceurs de jobs : Slurm (obligatoire), PBS Pro, Torque
- Systèmes de fichiers parallèles : Lustre (prioritaire), GPFS / Spectrum Scale, BeeGFS
- Réseaux HPC : InfiniBand, RoCE (configuration, optimisation, troubleshooting)
- Automatisation et scripting avancé : Bash, Python
- Supervision & monitoring : Nagios, Prometheus, Grafana, Zabbix, collectd
- Gestion de configuration : Ansible (obligatoire), Puppet, Chef, Salt
- Sécurité système : hardening, audits, conformité réglementaire, gestion d'incidents

Compétences Techniques Appréciées

- Calcul GPU : NVIDIA CUDA, AMD ROCm (optimisation de codes, etc)
- Bibliothèques et outils HPC : OpenMPI, MPICH, Intel MKL, BLAS/LAPACK
- Conteneurisation HPC : Singularity / Apptainer (prioritaire), Docker
- Gestion des environnements logiciels : Lmod, environment-modules
- Debugging & profiling : gdb, valgrind, outils HPC (Intel VTune, ARM MAP)
- Codes de calcul scientifiques : CFD, simulation physique, modélisation
- Virtualisation & cloud HPC : OpenStack, Kubernetes (K8s pour HPC)

Formation & Expérience

- Diplôme : Bac +5 (Master ou Ingénieur) en informatique, calcul scientifique ou équivalent
- Expérience : Profil expérimenté avec un minimum 5 années en administration système HPC ou infrastructures critiques
- Atout majeur : expérience en environnement hautement régulé
(nucléaire, défense, santé, recherche publique)

Qualités Professionnelles

- Rigueur et sens des responsabilités en environnement critique
- Capable de gérer et prendre des décisions en cas d'urgence
- Autonomie, proactivité et esprit d'équipe
- Excellente communication, maîtrise du français (obligatoire) et de l'anglais technique, dans le respect strict des procédures de sécurité

Depuis 2010, Alliance Services Plus (AS+) s'adresse à tous les acteurs du Calcul Intensif, de la Data Analytics et de l'IA : Utilisateurs industriels et académiques, opérateurs et hébergeurs de centres de calcul, éditeurs et développeurs de solutions digitales.

Notre offre de services couvre les trois grands domaines de compétences suivants :

1- Le développement et la simulation numérique en environnement HPC/HPDA - Développement & portage de codes sur architectures parallèles

- Tierce maintenance applicative (TMA) de codes de calcul
- Audit et optimisation de performances

2- Le support aux infrastructures HPC/HPDA sur site, cloud ou hybrides :

- Support applicatif HPC
- Infogérance de systèmes HPC (MCO/MCS)

3- L'accompagnement des projets HPC/HPDA :

- Audit et choix d'architectures (systèmes, stockage, réseaux, ...)
- Outils et méthodes - Formations

Ce que nous offrons

- Mission au coeur d'un environnement industriel de pointe

- Diversité des domaines scientifiques et des problématiques

- Travail en équipe avec des ingénieurs calcul expérimentés

- Formation continue sur les outils et méthodes de simulation

- Intégration à une équipe AS+ reconnue pour son expertise HPC

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi