
Ingénieur Analyse de Qualité des Données H/F - Bioptimus
- Paris 3e - 75
- CDI
- Bioptimus
Les missions du poste
- Développement de pipelines de validation des données : pour divers ensembles de données biologiques (histologie, omiques, cliniques). Assurer l'intégrité, la cohérence et l'exactitude des données grâce à des contrôles de qualité rigoureux.
- Curation et standardisation des données : Curer les jeux de données pour améliorer leur exploitabilité pour l'apprentissage automatique.
- Documentation et reporting : Maintenir une documentation détaillée des procédures d'évaluation de la qualité des données, des résultats de validation et des spécifications des données. Générer des rapports réguliers sur les métriques et les tendances de la qualité des données.
- Évaluation des sources de données : Évaluer et valider les sources de données publiques externes, en s'assurant qu'elles respectent nos normes de qualité et qu'elles sont adaptées pour être incluses dans l'entraînement de notre modèle de fondation.
Le/La candidat(e) idéal(e) aura un esprit d'équipe, sera autonome, curieux(se) et rigoureux(se). Vous vous épanouissez dans un environnement dynamique et rapide, et vous êtes une personne avec qui il est agréable de travailler. Nous valorisons les personnes qui possèdent une solide expertise du domaine de la biologie ainsi que de solides compétences informatiques et pratiques.
- Expertise des données omiques et/ou histolologique : Compréhension approfondie des types de données morphologique (H&E, IHC, etc.), transcriptomiques (bulk, single-cell, spatiale), ou connaissance des données génomiques et protéomiques.
- Gestion de la qualité des données : Expérience avérée dans la mise en oeuvre de procédures et de pipelines de contrôle de la qualité des données. Familiarité avec les outils et techniques de validation des données.
- Compétences analytiques : Solides compétences analytiques et de résolution de problèmes pour identifier et résoudre les problèmes de qualité des données.
- Programmation et analyse de données : Maîtrise de Python, bonne connaissance des bibliothèques de visualisation de données (par ex. matplotlib).
- Compétences en communication : Excellentes compétences en communication écrite et orale pour transmettre efficacement les résultats et les recommandations concernant la qualité des données.
- Expertise en pathologie computationnelle : Expérience dans l'analyse par machine learning d'images histologiques.
- Expertise Cloud : Expérience de travail avec AWS, en particulier Sagemaker.
- Expérience en annotation de données : Expérience dans le développement et la mise en oeuvre de directives et de processus d'annotation de données. Expérience avec les ontologies de données.
- Alignement spatial de jeux de données multimodaux (par ex. alignement entre différentes modalités d'imagerie).
- Formation : Master 2 (MSc) en Biologie, Biologie Computationnelle, Bio-informatique, Machine Learning.
- Langues : La maîtrise de l'anglais est obligatoire. L'anglais est la langue de travail principale de Bioptimus.
Bioptimus développe le premier modèle de fondation d'IA universel pour la biologie afin de catalyser des découvertes révolutionnaires et d'accélérer l'innovation en biomédecine. Avec un financement de plus de 75 millions de dollars, Bioptimus est une start-up en forte croissance basée à Paris, fondée en octobre 2023. Soutenue par des investisseurs en capital-risque internationaux de premier plan, notre équipe de scientifiques et d'ingénieurs de renommée mondiale redéfinit les frontières de l'IA et des sciences de la vie.