Data Scientist - Ml Engineer Stage H/F - AXA en France
- Nanterre - 92
- Stage
- AXA en France
Les missions du poste
Notre raison d'être chez AXA ? Chaque jour, nous agissons ensemble pour le progrès humain en protégeant ce qui compte dans + de 50 pays. Accompagner près de 95 millions de clients à chaque étape de leur vie, une mission qui donne le sourire et envie de se lever le matin à nos employés et agents (+ de 145 000 dans le monde !)Chez AXA, nous sommes riches de nos singularités et accueillons tous les profils dans leur diversité. Au-delà de mener une politique inclusive engagée, nous agissons au quotidien en tant qu'employeur citoyen et responsable pour des causes sociétales & environnementales. Ces ambitions vous parlent ? Alors rejoignez un des leaders de l'assurance et venez changer le monde avec nous !
Présente sur l'ensemble du territoire, AXA France se distingue comme la filiale la plus importante du Groupe en termes de chiffre d'affaires et d'effectifs. Leader sur les marchés de l'assurance, de la santé et de la prévoyance, l'entreprise offre à ses équipes un cadre de travail moderne et agréable en 'smartworking'.Vous hésitez encore ? Sachez que nous avons conçu un dispositif d'intégration baptisé 'Welcome@AXA' pour accompagner vos premiers pas parmi nous avec attention. En lien avec nos engagements, nous célébrons chaque arrivée en agissant en faveur de la reforestation mondiale : depuis 2020, nous plantons un arbre pour chaque recrutement. Alors, prêt à postuler ?L'équipe AI / GenAI for Opex de l'IA Factory d'AXA France conçoit et déploie des solutions d'intelligence artificielle à fort impact opérationnel pour l'ensemble des directions métiers (Assurance, Sinistres, Finance, Juridique, Opérations, etc.). Elle intervient sur des projets de Document Understanding à grande échelle, avec un objectif clair : automatiser, fiabiliser et accélérer le traitement des documents métiers, tout en garantissant robustesse, sécurité et passage à l'échelle industrielle. Vous intégrerez une équipe de 12 personnes, composée de : Machine Learning Engineers, Data Scientists, Leads Data Scientist & Lead ML Engineer (encadrement technique). En tant que stagiaire Data Scientist / Machine Learning Engineer, vous contribuerez à l'ensemble du cycle de vie d'applications IA, depuis les données jusqu'au déploiement en production. Les missions pourront être ajustées selon votre dominante (Data Science ou ML Engineering), tout en conservant une vision end-to-end.
Vos missions seront les suivantes :
1. Acquisition & prétraitement des données
- Collecte et nettoyage de documents scannés (PDF, images)
- Extraction du texte et de la structure via des modèles OCR
- Enrichissement sémantique via NER
- Constitution de corpus annotés de haute qualité
- Technos : LayoutLMv3, TrOCR, Tesseract OCR 5, VLMs, spaCy
2. Modélisation & fine-tuning
- Fine-tuning de LLMs via LoRA / QLoRA
- Adaptation de SLMs / TLMs pour des tâches NLP ciblées
- Évaluation des performances (BLEU, ROUGE, F1, OCR accuracy)
- Spécialisation de modèles sur des cas métiers AXA
- Technos : Hugging Face Transformers, PEFT, LoRA
3. Pipelines & orchestration
- Construction de pipelines ETL & Feature Engineering
- Intégration des modèles dans des APIs REST
- Garantie de la reproductibilité et de la traçabilité
- Technos : Kedro, FastAPI, Docker
4. Entraînement & optimisation
- Entraînement des modèles sur Azure ML / OpenShift AI
- Hyperparameter tuning (Optuna, Ray Tune)
- Arbitrage performance / coûts
5. Déploiement & MLOps
- Containerisation des modèles
- Déploiement sur Kubernetes via Helm / Kustomize
- Mise en place de pipelines CI/CD
- Sécurisation, scalabilité et robustesse des services
- Technos : Docker, Kubernetes, Azure DevOps
6. Monitoring & maintenance
- Suivi de la performance en production
- Détection de dérives (concept drift, latence, erreurs)
- Automatisation du retraining
- Technos : OpenTelemetry, Dynatrace, Azure ML Pipelines
7. Collaboration & documentation
- Code reviews, pair programming
- Documentation technique et MLOps
- Outils : Markdown, MkDocs, Confluence
Le profil recherché
Vous êtes étudiant en Master 2 ou dernière année de cycle d'ingénieur spécialisé en Data Science, Statistiques, Mathématiques appliquées, Informatique, IA. Vous recherchez un stage de fin d'études (PFE) de 6 mois à partir de février / avril 2026.
Compétences techniques :
Programmation
- Python (pandas, numpy, PyTorch)
Machine Learning & NLP
- Classification, régression, clustering
- Transformers & LLMs (BERT, GPT, LLaMA, T5)
- OCR & Document AI (spaCy, Tesseract, LayoutLM, TrOCR)
MLOps & Cloud
- Git & bonnes pratiques de code
- Pipelines ML
- Microservices
- Docker, Kubernetes, Helm, Kustomize
- Expérience Cloud (Azure apprécié)
Soft skills :
- Autonomie et curiosité intellectuelle
- Esprit d'équipe et collaboration
- Capacité de vulgarisation technique
- Communication claire (écrit / oral)
La motivation, la capacité d'apprentissage et la rigueur sont essentielles.
Rejoignez-nous et contribuez à améliorer les processus de demain grâce à l'intelligence artificielle !