
Analyste Qualité des Données H/F - Bioptimus
- Paris 9e - 75
- CDI
- Bioptimus
Les missions du poste
En tant qu'Ingénieur(e) en Qualité des Données Biologiques, vous serez responsable des tâches suivantes :
- Développement de pipelines de validation des données : Développer et mettre en oeuvre des protocoles complets de validation des données pour divers ensembles de données biologiques (histologie, omiques, cliniques). Assurer l'intégrité, la cohérence et l'exactitude des données grâce à des contrôles de qualité rigoureux. Concevoir et implémenter des pipelines automatisés de qualité des données pour rationaliser la validation et identifier les problèmes potentiels en amont du processus de traitement.
- Curation et standardisation des données : Établir et appliquer des pratiques de standardisation des données pour faciliter l'intégration et l'analyse fluides entre différents types de données. Curer les jeux de données pour améliorer leur exploitabilité pour l'apprentissage automatique.
- Documentation et reporting : Maintenir une documentation détaillée des procédures d'évaluation de la qualité des données, des résultats de validation et des spécifications des données. Générer des rapports réguliers sur les métriques et les tendances de la qualité des données.
- Évaluation des sources de données : Évaluer et valider les sources de données publiques externes, en s'assurant qu'elles respectent nos normes de qualité et qu'elles sont adaptées pour être incluses dans l'entraînement de notre modèle de fondation.
Votre profil
Le/La candidat(e) idéal(e) aura un esprit d'équipe, sera autonome, curieux(se) et rigoureux(se). Vous vous épanouissez dans un environnement dynamique et rapide, et vous êtes une personne avec qui il est agréable de travailler. Nous valorisons les personnes qui possèdent une solide expertise du domaine de la biologie ainsi que de solides compétences informatiques et pratiques.
- Expertise des données omiques et/ou histolologique : Compréhension approfondie des types de données morphologique (H&E, IHC, etc.), transcriptomiques (bulk, single-cell, spatiale), ou connaissance des données génomiques et protéomiques.
- Gestion de la qualité des données : Expérience avérée dans la mise en oeuvre de procédures et de pipelines de contrôle de la qualité des données. Familiarité avec les outils et techniques de validation des données.
- Compétences analytiques : Solides compétences analytiques et de résolution de problèmes pour identifier et résoudre les problèmes de qualité des données.
- Programmation et analyse de données : Maîtrise de Python, bonne connaissance des bibliothèques de visualisation de données (par ex. matplotlib).
- Compétences en communication : Excellentes compétences en communication écrite et orale pour transmettre efficacement les résultats et les recommandations concernant la qualité des données.
- Expertise en pathologie computationnelle : Expérience dans l'analyse par machine learning d'images histologiques.
- Expertise Cloud : Expérience de travail avec AWS, en particulier Sagemaker.
- Expérience en annotation de données : Expérience dans le développement et la mise en oeuvre de directives et de processus d'annotation de données. Expérience avec les ontologies de données.
- Alignement spatial de jeux de données multimodaux (par ex. alignement entre différentes modalités d'imagerie).
- Formation : Master 2 (MSc) en Biologie, Biologie Computationnelle, Bio-informatique, Machine Learning.
- Langues : La maîtrise de l'anglais est obligatoire - l'anglais est la langue de travail principale de Bioptimus.
Le profil recherché
Experience: 18 Mois
Compétences: Analyser, exploiter, structurer des données
Langues: Anglais exigé
Qualification: Cadre
Secteur d'activité: Programmation informatique