Data Scientist H/F - Michael Page
- Paris - 75
- CDI
- Michael Page
Les missions du poste
Structure de santé qui regroupe plusieurs milliers de collaborateurs, des centaines de médecins et un large éventail de spécialités reconnues : pathologies pulmonaires, urologie, néphrologie, neurosciences, pôle mèreenfant, etc.
La structure mène une stratégie ambitieuse en intelligence artificielle et a été l'un des premiers établissements à se doter d'un Entrepôt de Données de Santé. Il collabore avec des partenaires technologiques majeurs pour développer des solutions innovantes : aide au diagnostic, transcription automatique, optimisation des parcours, data challenges internationaux, projets multicentriques, etc.Vos missions principales :* Identifier et consolider les besoins en traitement automatique du langage avec les équipes de recherche et de pilotage.
* Développer, valider et maintenir des bibliothèques logicielles scientifiques en Python.
* Concevoir et déployer des modèles de machine learning et deep learning pour le prétraitement et la structuration des données textuelles.
* Participer au développement et à l'adaptation de modèles de langage (LLM) pour des cas d'usage cliniques.
* Rédiger la documentation technique et utilisateur.
* Contribuer à des collaborations académiques et à la rédaction d'articles scientifiques.
Missions ponctuelles :
* Assurer un support utilisateur et former les équipes au NLP.
* Accompagner les projets de recherche utilisant les données textuelles.
* Promouvoir les outils et bonnes pratiques de l'équipe Data Science auprès des équipes cliniques.
* Participer aux Data Challenges et initiatives d'innovation.
1J/S de télétravail.
Projet stimulant.
Le profil recherché
* Diplôme d'ingénieur ou équivalent (Bac +5 minimum/ Master 2) en data science.
* Quelques années d'expérience démontrant une bonne maîtrise de Python, des bonnes pratiques de revue de code et de l'intégration continue.
Compétences techniques recherchées :
* Expertise en NLP et en modèles de langage (LLM).
* Compétences solides en statistiques.
* Maîtrise de SQL et de l'analyse de bases de données.
* Expérience en machine learning et deep learning (HuggingFace, PyTorch...).
* Connaissance du calcul distribué et du data management.
* Très bonne maîtrise de Python.
* Compétences en déploiement de modèles IA.
* Maîtrise de Linux et Git.