Administrateur Systèmes Linux - Hpc H/F - Havana IT & Apps
- Grenoble - 38
- Freelance
- Havana IT & Apps
Les missions du poste
Groupe Havana: Créé en 2011, nous incarnons la transformation digitale en misant sur l'innovation, la performance et le bien-être au travail.
Notre identité :
- 150 experts déployés à travers la France.
- Acteurs clés dans les domaines de la DATA, du Cloud et de l'intelligence artificielle.
- Nous accompagnons nos clients dans la transformation digitale de leur SI
Rejoignez le Groupe Havana en tant qu'administrateur systèmes Linux - HPC (F/H).
Contexte
Dans le cadre du renforcement d'une équipe infrastructure au sein d'un acteur reconnu dans le domaine de la recherche et de l'innovation en intelligence artificielle et calcul scientifique, nous recherchons un Ingénieur Système Linux senior.
Vous interviendrez sur un environnement hybride combinant infrastructure IT classique et plateformes de calcul haute performance (HPC).
L'infrastructure supporte des activités critiques nécessitant un haut niveau de disponibilité, performance et sécurité, dans un contexte technique exigeant et innovant.
Missions
Vous interviendrez sur l'ensemble du cycle d'exploitation et d'évolution de l'infrastructure :
Exploitation & MCO
- Assurer la disponibilité et la performance des systèmes (serveurs, stockage, clusters)
- Gérer les incidents complexes (diagnostic multicouche, résolution, RCA)
- Participer aux opérations de maintenance (patching, upgrades)
Infrastructure & HPC
- Administrer et optimiser des environnements Linux (serveurs et clusters)
- Intervenir sur des plateformes de calcul (HPC / clusters GPU)
- Contribuer à l'évolution de l'architecture infrastructure
Automatisation & fiabilité
- Automatiser les opérations (déploiement, configuration, patch management)
- Améliorer la fiabilité et réduire les actions manuelles
- Participer à la standardisation des pratiques
Supervision & performance
- Mettre en place et améliorer le monitoring (alerting, dashboards)
- Analyser les performances et proposer des optimisations
- Anticiper les incidents (capacity planning, tuning)
Collaboration & support
- Travailler en étroite collaboration avec les équipes techniques
- Fournir un support de niveau avancé aux utilisateurs internes
- Participer à la documentation et au partage de connaissances
Environnement technique :
Systèmes & Infra
- Linux (RedHat / Rocky / Debian)
- Virtualisation / conteneurisation (VMware, Docker, Kubernetes)
HPC / Stockage
- Environnements cluster (HPC)
- Outils de scheduling (type Slurm - apprécié)
- Stockage distribué (Ceph, NFS...)
Automatisation & DevOps
- Ansible, Terraform
- Scripting (Bash, Python)
Monitoring & Observabilité
- Prometheus, Grafana, Centreon
Réseau & Sécurité
- TCP/IP, VLAN, firewalling
- Gestion des accès (AD / LDAP / Kerberos)
Le profil recherché
Expérience
- Diplôme d'ingénieur ou Bac +5 en informatique
- 5 ans minimum en environnement Linux / systèmes
- Expérience en exploitation d'infrastructures complexes
Compétences clés
- Très bonne maîtrise Linux (administration avancée)
- Solide capacité de diagnostic et résolution d'incidents
- Expérience en automatisation et scripting
Atouts
- Expérience HPC ou environnements distribués
- Connaissance du stockage ou du cloud
- Sensibilité aux problématiques de performance
Soft skills
- Esprit d'équipe
- Rigueur et sens des responsabilités
- Autonomie et capacité d'adaptation
- Bon relationnel technique
Langues
- Anglais technique requis
Ce poste n'est pas ouvert à l'alternance ou aux stages !
Poste ouvert aux personnes en situation d'handicap !