
Data Scientist H/F - Assistance Publique Hopitaux de Paris
- Paris - 75
- CDD
- Assistance Publique Hopitaux de Paris
Les missions du poste
Nous recrutons un ou une Data Scientist pour travailler sur un projet médico-scientifique financé par un European Research Counsil (ERC) Starting Grant dans le domaine des maladies inflammatoires chroniques intestinales (MICI). Le Projet FORECAST repose sur le chaînage de 3 sources de données de vie réelle : une base de données médico-administratives (le Système National des Données de Santé, SNDS), une base de données issues de dossiers cliniques informatisés (l'entrepôt de données de santé de l'Assistance Publique-Hôpitaux de Paris, EDS AP-HP), et SUVIMIC, une cohorte prospective de patients atteints de MICI suivis dans les centres de l'AP-HP inclus dans le groupe Paris IBD University Centers (Paris IBD-U).
La cohorte SUVIMIC est une cohorte prospective de plus de 10 000 patients atteints de MICI suivis à l'AP-HP avec des données structurés sur leur prise en charge thérapeutique.
L'EDS AP-HP est une base de données hébergeant les dossiers médicaux de millions de patients suivis dans les 38 hôpitaux de l'AP-HP. Ces données peuvent être structurées (traitements, procédures, biologies, etc) ou non structurées (comptes-rendus d'hospitalisation, prescriptions, etc). Plus de 35 000 patients atteints de MICI ont été identifiés dans l'EDS AP-HP.
Le SNDS regroupe les données de consommation de soins pour l'ensemble de la population française et inclut plus de 250 000 patients atteints de MICI.
- Le projet FORECAST vise à ouvrir la voie à un nouveau cadre de surveillance des médicaments après leur mise sur le marché, applicable aussi bien aux futurs traitements des MICI qu'à d'autres maladies chroniques (https://cordis.europa.eu/project/id/101163425) C'est une opportunité de travailler sur un projet ambitieux en collaboration avec une équipe de chercheurs intégrant des experts cliniques, en pharmaco-épidémiologie et en intelligence artificielle.
Le ou la Data Scientist sera amené-e à travailler sur tous les aspects de la data science. Nous utilisons principalement R et Python.
Le candidat retenu travaillera au sein d'une équipe de recherche dirigée par le Dr Julien Kirchgesner (https://orcid.org/0000-0002-2314-928) au Centre de Recherche Saint-Antoine au coeur de Paris et en étroite collaboration avec le Sorbonne Center for Artificial Intelligence (SCAI). Il sera rattaché administrativement au Centre de pharmacoépidémiologie de l'AP-HP (CEPHEPI).
Missions principales
- Extraction et visualisation de données structurées ou textuelles
- Réalisation d'études de faisabilité et de projets de recherche sur les MICI
- Utilisation d'algorithmes de NLP pour extraire de l'information depuis les comptes rendus médicaux
- Utilisation de modèles de machine learning pour étudier l'efficacité et la tolérance des traitements
- Participer à la rédaction des plans d'analyse statistique d'études pharmaco-épidémiologiques
- Conduire des analyses statistiques sur les bases de données du projet dont le SNDS
- Aider à la valorisation des résultats sous forme d'articles scientifiques (co-auteur) et de présentations en congrès
Le ou la candidat-e idéal-e aurait
- Une 1ère expérience en data science / machine learning
- Un Bac +5 en mathématiques, informatique, biostatistique, épidémiologie et/ou data science : Master, doctorat, diplôme d'ingénieur ou équivalent
- Une expertise en statistiques et machine learning
- Une expertise en manipulations de données (R, pandas)
- Une expertise en R et connaissance des meilleures pratiques de développement de code
- Une expertise en Python et connaissance des meilleures pratiques de développement de code
- Une excellente capacité à collaborer entre plusieurs équipes, et à vulgariser des concepts à des non-experts
Bonus
- Expérience en santé publique ou en épidémiologie
- Expérience avec les données de santé de vie réelle, notamment le SNDS
- Expérience en NLP
Le profil recherché
Experience : 6 Mois
Compétences : Adapter les outils de traitement statistique de données, Définir et faire évoluer des procédés de traitement de l'information
Langues : Anglais souhaité, Français souhaité
Qualification : Employé qualifié
Secteur d'activité : Activités hospitalières
Liste des qualités professionnelles :
Avoir l'esprit d'équipe : Capacité à travailler et à se coordonner avec les autres au sein de l'entreprise pour réaliser les objectifs fixés.
Etre force de proposition : Capacité à initier, imaginer des propositions nouvelles pour résoudre les problèmes identifiés ou améliorer une situation. Être proactif.
Faire preuve de rigueur et de précision : Capacité à réaliser des tâches en suivant avec exactitude les règles, les procédures, les instructions qui ont été fournies, sans réaliser d'erreur et à transmettre clairement des informations. Se montrer ponctuel et respectueux des règles de savoir-vivre usuelles.