Stage Data Scientist H/F - Socotec
- Palaiseau - 91
- Stage
- Socotec
Les missions du poste
Let's SOCOTEC !
SOCOTEC est dans le Top 10 des Best Workplaces® 2025 en France (catégorie >2500 salariés) !
Rejoindre SOCOTEC, c'est rejoindre une communauté d'experts soudés, une entreprise en croissance qui va de l'avant et qui valorise l'humain et le développement de ses équipes, c'est aussi rejoindre une dynamique collective qui fait la différence sur ses marchés : construction, immobilier, infrastructures, industrie, environnement.
Leader de la durabilité du bâti et des infrastructures, SOCOTEC c'est une communauté de plus de 14 500 experts basés dans 26 pays, tous prêts à relever les challenges dans le domaine du Testing, de l'Inspection et de la Certification (TIC) dans la construction, les infrastructures et l'industrie.
Cette année, SOCOTEC recrute 1500 nouveaux collaborateurs.
Rejoignez-nous et partagez un métier qui a du sens, au service d'une vision positive : inventer ensemble la ville de demain, plus sûre, durable et inclusive.
Au sein du groupe, vous rejoindrez le Data & IA Hub : le centre de compétences en Data & IA pour les 26 pays du groupe SOCOTEC. Le Hub suit une croissance forte des effectifs avec des projets en interne mais aussi auprès des clients du groupe.Au sein du groupe, vous rejoindrez le Data & IA Hub : le centre de compétences en Data & IA pour les 26 pays du groupe SOCOTEC. Le Hub suit une croissance forte des effectifs avec des projets en interne mais aussi auprès des clients du groupe.
Intégré à l'équipe du Data & IA Hub, vous rejoindrez une jeune équipe composée de Data Scientists, Data Engineers et ML Engineers.
Vous travaillerez sur deux missions principales :
- En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez au développement des 4 axes principaux du groupe :
- Inspection 4.0 : développements d'algorithmes de computer vision et NLP en soutien aux experts métiers sur le terrain
- Assistants SOCOTEC : développement d'agents personnalisés pour les services du groupe (RAG, text-to-SQL, ...)
- IA+X pour des nouveaux services : développement de technique d'hybridation entre physique et IA (jumeau numérique, PINN)
- Extraction d'information à partir de documents et de plans
- Vous choisirez un sujet de R&D pour vous confronter à l'état de l'art du domaine avec des possibilités de publication scientifique. Les sujets sont présentés et détaillés ci-après:
- Inspection 4.0 : Machine learning appliqué à l'inspection des ouvrages d'art
- Auto-completion de contenu technique pour la rédaction de rapports
- Agents de Knowledge Management avec techniques RAG avancées
- Smart speech-to-text avec extraction intelligente d'informations
- Computer Vision: détection et classification de composants électriques
Le travail sera fait en collaboration avec une équipe de développeurs pour développer les modèles et héberger les livrables sur une plateforme web AWS.
Vous ferez preuve d'autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code.
Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d'une équipe (lead data), etc.
Vous aurez la possibilité d'interagir à l'international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.
Le stage pourra être basé à Palaiseau ou à Lyon
Le profil recherché
- Étudiant(e) en dernière année de Master en Data Science / Machine Learning ou école d'ingénieur avec spécialisation en data et intelligence artificielle.
- Bonnes connaissances en statistiques, modélisation et analyse de données (analyse factorielle, régressions, clustering, etc.).
- Bonne maîtrise du langage Python et de ses principales bibliothèques pour la data science (pandas, NumPy, scikit-learn, matplotlib).
- Familiarité avec les bases de données relationnelles (SQL) et les environnements de développement collaboratif (Git, GitLab, Jupyter Notebooks).
- Connaissances de base en algorithmes de machine learning et de deep learning, avec une première expérience sur un framework comme TensorFlow, Keras ou PyTorch.
- Intérêt marqué pour les modèles de langage (LLMs) et l'IA générative : compréhension des principes de transformers, fine-tuning, embeddings et prompt engineering.
- Une première expérience avec des outils ou bibliothèques comme LangChain serait un plus.
- Connaissance des environnements cloud (notamment AWS : Lambda, S3, Timescale) appréciée.
- Goût affirmé pour les technologies innovantes et l'expérimentation.
- Curiosité scientifique et capacité à apprendre rapidement de nouveaux concepts.
- Polyvalence, rigueur et autonomie dans la conduite des analyses.
- Esprit d'équipe et aisance dans un environnement collaboratif.
- Anglais courant et technique