
Data Scientist H/F - Inrae Bourgogne-Fc Dijon Sully
- Dijon - 21
- CDD
- Inrae Bourgogne-Fc Dijon Sully
Les missions du poste
Centre de Recherche INRA composé de 5 unités de recherche, 1 unité expérimentale, et une unité Service Déconcentré d'Appui à la Recherche (SDAR)L'Institut national de recherche pour l'agriculture, l'alimentation et l'environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec plus de 270 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l'animal, et en écologie-environnement. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.
Environnement de travail, missions et activités
Vous exercerez votre activité au sein de du pôle "Ingénierie logicielle, statistiques et sciences des données" de la plateforme ChemoSens, rattachée au Centre des Sciences du Goût et d'Alimentation (CSGA).
Le pôle, à taille humaine, est actuellement composé de trois membres aux profils complémentaires, alliant expertise en statistique, data science et ingénierie logicielle.
Vous évoluerez dans un environnement stimulant, à l'interface entre la recherche académique et les applications concrètes en sciences des données, avec un fort ancrage dans le domaine de l'alimentation.
Votre mission consistera à développer des solutions basées sur des systèmes experts et/ou des algorithmes de machine learning et de deep learning visant à extraire des informations sur des aliments (désignation commerciale / nom de l'aliment) à partir de différents supports (scan ou fichiers PDF de factures, photos d'aliments), puis à les apparier avec des référentiels d'aliments (Ciqual, OpenFoodFacts, FoodEx, etc.), afin d'automatiser (par exemple) le calcul d'indicateurs de qualité nutritionnelle et environnementale.
Ces modèles seront intégrés dans des pipelines ETL afin d'automatiser le workflow de traitement.
L'inférence et l'exploitation des résultats se feront via des interfaces développées en interne ; une contribution à ces aspects pourra être envisagée si le profil du candidat le permet.
Vous serez plus particulièrement en charge de :
1. Mettre en oeuvre des modèles d'extraction d'information à partir de documents (OCR, NLP, LLM, etc.)
2. Intégrer et consommer des API pour l'échange de données (récupération, envoi, mise à jour)
3. Concevoir et déployer des pipelines ETL pour automatiser les flux de données
4. Déployer les modèles/algorithmes sous forme d'API sécurisées
5. Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes
6. Développer des interfaces front-end (Streamlit, Shiny, Angular ou autre) pour l'inférence et la visualisation des résultats
7. Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles
Compétences indispensables :
- Maîtrise de Python, R.
- Une première expérience avec Docker, Git et Github.
- Une première expérience avec les SGBD (SQL, No SQL).
Compétences appréciées :
- Connaissances JavaScript (Angular).
- Initiation à Kubernetes
Expérience appréciée :
- Participation à un projet de traitement de données non structurées (ex : documents PDF, images, textes bruts, audio).
- Mise en oeuvre de modèles d'OCR, NLP, ou LLM pour l'extraction d'information.
- Intégration de modèles ML/DL dans des pipelines de traitement (ETL, data pipelines).
- Déploiement de modèles sous forme d'API, idéalement dans des environnements conteneurisés (Docker, Kubernetes).
- Développement d'interfaces web (Angular, ou technologies équivalentes) permettant l'inférence ou la visualisation des résultats.
- Sensibilité aux problématiques de monitoring, versioning et dérive des modèles.
Aptitudes recherchées :
- Travail en équipe.
- Rigueur.
- Adaptabilité.
Aptitude appréciée :
- Curiosité pour les recherches sur les comportements alimentaires.
Le profil recherché
Experience : Débutant accepté
Qualification : Employé qualifié
Secteur d'activité : Recherche-développement en autres sciences physiques et naturelles
Liste des qualités professionnelles :
Avoir l'esprit d'équipe : Capacité à travailler et à se coordonner avec les autres au sein de l'entreprise pour réaliser les objectifs fixés.
Faire preuve de curiosité, d'ouverture d'esprit : Capacité à aller chercher au-delà de ce qui est donné à voir, à s'ouvrir sur la nouveauté et à investiguer pour comprendre et agir de façon appropriée.
Faire preuve de rigueur et de précision : Capacité à réaliser des tâches en suivant avec exactitude les règles, les procédures, les instructions qui ont été fournies, sans réaliser d'erreur et à transmettre clairement des informations. Se montrer ponctuel et respectueux des règles de savoir-vivre usuelles.