Administrateur Système Hpc H/F - Eolen
- Montpellier - 34
- CDI
- Eolen
Les missions du poste
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l'Industrie et des Services.
CDI Confirmé Centre de calcul - Environnement scientifique
Démarrage : À définir
Contexte du poste
Alliance Services Plus (AS+) recherche un(e) Administrateur(trice) Systèmes Linux HPC pour le compte d'un client opérant des infrastructures de calcul intensif à grande échelle, au service d'activités scientifiques et techniques exigeantes.
Intégré(e) au sein des équipes d'exploitation, vous contribuerez au maintien en condition opérationnelle d'une plateforme HPC critique, utilisée par une communauté importante d'utilisateurs pour des travaux de simulation, de modélisation et de calcul scientifique à grande échelle.
Missions principales
Dans un cadre d'exploitation et d'évolution des infrastructures HPC, les missions pourront inclure :
- L'administration, le maintien en condition opérationnelle et l'optimisation d'environnements Linux à grande échelle
- La gestion et l'exploitation d'infrastructures de calcul intensif (clusters HPC)
- Le support technique de niveau 2/3 auprès des utilisateurs scientifiques
- L'administration des ordonnanceurs de jobs et des systèmes de fichiers parallèles
- Le déploiement, la mise à jour et l'optimisation des environnements logiciels scientifiques
- L'automatisation des tâches d'administration et d'exploitation
- La gestion des incidents, le diagnostic et la résolution de problèmes complexes
- La participation aux opérations de maintenance et aux évolutions d'architecture
- La rédaction et la mise à jour de la documentation technique et des procédures
- La participation à la veille technologique et à l'amélioration continue des plateformes
Environnement technique
Les projets s'appuient principalement sur les technologies suivantes :
- Systèmes d'exploitation : Linux (RHEL, CentOS, Rocky Linux, Ubuntu)
- Clusters HPC : infrastructures de calcul intensif multi-noeuds
- Ordonnanceurs : Slurm (principal), PBS Pro (selon environnements)
- Stockage : systèmes de fichiers distribués (Lustre, GPFS)
- Réseaux haute performance : InfiniBand
- Automatisation & scripting : Bash, Python, Ansible
- Gestion d'environnements logiciels : modules (Lmod / module-tcl), Spack
- Supervision & exploitation : outils de monitoring HPC et systèmes
- Architectures matérielles : CPU x86\_64 / ARM, GPU (NVIDIA - selon périmètre)
Profil recherché
- Formation Bac +5 (École d'ingénieur, Master) ou expérience équivalente
- Expérience confirmée en administration systèmes Linux dans un environnement complexe
- Connaissance des environnements HPC et des contraintes associées (performance, scalabilité, disponibilité)
- Maîtrise des outils d'exploitation Linux et des mécanismes d'automatisation
- Capacité à intervenir sur des infrastructures critiques en production
Qualités attendues :
- Rigueur et sens de l'analyse
- Autonomie et capacité à prioriser
- Bon relationnel et aptitude à travailler avec des utilisateurs experts
- Capacité à documenter et à formaliser les procédures
- Esprit d'équipe et sens du service