Ingénieur DevOps Gpu H/F - REDSUP
- Guyancourt - 78
- CDI
- REDSUP
Les missions du poste
Qui sommes-nous ?
REDOPUS est une société de conseil créée en 2017. Nous offrons à nos clients des services et solutions afin de répondre à leur problématique d'infrastructures. L'expertise en sécurité et réseau informatique est le fondement même de REDOPUS.Nous recherchons un·e Ingénieur·e DevOps GPU & Observabilité pour intervenir au sein d'une plateforme IA / ML, dans un environnement bancaire à forte exigence technique.
Missions
- Conception, déploiement et exploitation de plateformes GPU mutualisées
- Mise en oeuvre de solutions d'orchestration GPU pour workloads IA/ML
- Administration et évolution des environnements Kubernetes / OpenShift
- Activités de production sur des environnements complexes
- Analyse et troubleshooting d'incidents Niveau 3
- Support et accompagnement de l'exploitation Niveau 2
- Gestion du MCO / MCS des plateformes en production
- Automatisation des déploiements et workflows CI/CD
- Mise en place et maintien de l'observabilité (monitoring, logs, alerting)
- Accompagnement des utilisateurs métiers (data scientists, équipes IA)
- Rédaction de livrables techniques (procédures, documentation, bonnes pratiques
Le profil recherché
- Orchestration GPU : Run.ai, ClearML, Volcano, KAI Scheduler
- Containerisation & orchestration : Docker, Kubernetes, OpenShift (5+ ans)
- Infrastructure : OpenShift, environnements on-premise, notions AWS/GCP
- CI/CD & automatisation : GitLab CI/CD, Jenkins, Kestra (un +)
- Observabilité : Prometheus, Grafana, ELK Stack
- Scripting : Python, Bash, Go (un +)
- Connaissance des architectures IA / ML (TensorFlow, PyTorch, Transformers)
- Maîtrise des outils Atlassian (Jira, Confluence)
- Expérience en environnement bancaire ou secteur régulé appréciée
- Autonomie, rigueur, esprit d'équipe et excellente posture client