Ingénieur Infrastructure IA H/F - Adam Partners
- Saint-Cloud - 92
- CDI
- Télétravail accepté
- Adam Partners
Les missions du poste
Entreprise technologique française, adossée à un grand groupe industriel
international, elle est spécialisée dans les services d'infrastructure cloud à
haute valeur ajoutée. Elle accompagne des organisations publiques et privées
dans l'hébergement, la sécurisation et l'exploitation de leurs environnements
numériques critiques, avec un fort niveau d'exigence en matière de performance,
de fiabilité et de conformité réglementaire.
Positionnée sur des projets stratégiques et sensibles, cette société se
distingue par son expertise en cloud souverain, sa culture d'ingénierie et son
engagement sur la protection des données. Elle intervient auprès de grands
comptes, d'acteurs institutionnels et d'industriels, sur des environnements
complexes et à forts enjeux.Nous recherchons pour notre client un pur player cloud un Administrateur
Systèmes et réseaux H/F avec une expérience significative (4 ans minimum) pour
être en charge de l'architecture, de l'optimisation et de l'évolution des
infrastructures réseaux, stockage, systèmes et GPU fabrics alimentant des
charges IA critiques (training, fine-tuning, inference).
Missions
* Architecturer et optimiser les infrastructures réseau, stockage et GPU
* Concevoir des réseaux haut débit/faible latence et des topologies
leaf-spine/fat-tree pour le scale-out.
* Piloter les communications RDMA et optimiser les transferts GPU
* Optimiser le stockage et les I/O data
* Intégrer Kubernetes avec les clusters GPU
* Monitorer et résoudre les incidents (Prometheus, Grafana, NetQ)
* Documenter et veiller sur les évolutions technologiques (NVIDIA...)
Le profil recherché
Profil recherché
Formation : Ingénieur (Bac +5) ou équivalent.
Expérience : 4 ans minimum en RDMA dans des environnements HPC/IA.
Compétences clés
* Maîtrise des architectures GPU scale-up/scale-out
* Expérience en Kubernetes et Linux bas niveau
* Capacité à diagnostiquer des problèmes de performance distribuée.
Environnement
AI Factory distribuée (Europe, Amérique du Nord, Asie).
Enjeux : Performance extrême, faible latence, scalabilité horizontale.
Principaux avantages et bénéfices de l'entreprise
Il s'agit d'une entreprise scientifique au coeur de l'innovation technologique,
portée par une forte croissance depuis plus de 40 ans
* Environnement multiculturel
* Cadre de travail convivial axé sur le bien-être et la santé
* Engagement en faveur de la diversité et de l'inclusion
* Politique dynamique de développement de carrière : plan de formation,
mobilités internes, etc.