Ingénieur d'Étude en Science des Données et Intelligence Artificielle Programme Européen Llms4eu Cnrs H/F - CNRS
- Aubervilliers - 93
- CDD
- CNRS
Les missions du poste
- Contribuer au développement de modèles d'IA et d'IA générative (LLM, MLM, RAG) appliqués aux données SHS du programme LLMs4EU.
- Participer à la structuration, l'enrichissement et l'exploitation des données issues des infrastructures de recherche (ISIDORE, NAKALA, ISTEX).
- Participer à la mise en oeuvre technique des services numériques innovants reposant sur l'IA générative dans le cadre du HN Lab et à destination du programme LLMs4EU.
- Contribuer au suivi scientifique et technique du WP4, en lien avec les chercheurs, ingénieurs et partenaires européens.
Activités
- Développer et tester des modèles de traitement automatique du langage et d'apprentissage profond (transformers, LLM, MLM).
- Réaliser des analyses de données massives, incluant le prétraitement, la vectorisation et l'évaluation des performances des modèles.
- Participer à la création de ressources terminologiques et ontologiques alignées sur les standards internationaux.
- Produire des rapports techniques, livrables et jeux de données documentés.
- Assurer une veille scientifique et technologique sur les approches émergentes en IA générative.
Compétences
Savoirs techniques :
- Maîtrise des outils de science des données et d'apprentissage automatique : Python, Pandas, scikit-learn, PyTorch, Hugging Face, LangChain.
- Connaissance du traitement du langage naturel (NLP) et des modèles génératifs.
- Notions en ingénierie des connaissances : ontologies, graphes sémantiques, terminologies.
- Expérience dans des projets de recherche appliquée ou collaboratifs européens.
Savoir-faire :
- Conception et documentation de pipelines IA et de prototypes expérimentaux.
- Capacité à travailler sur des données complexes et interdisciplinaires.
- Bon niveau d'anglais scientifique.
Savoir-être :
- Rigueur, curiosité scientifique, autonomie.
- Esprit d'équipe et aptitude à travailler en contexte international et pluridisciplinaire.
Profil recherché
- Diplôme de niveau Master 2 en IA, en Digital humanities ou science des données ou informatique.
- Intérêt marqué pour la recherche interdisciplinaire et l'application de l'IA et de l'IA Générative en SHS.
Contexte de travail
Dans le cadre du programme européen LLMs4EU, l'UAR 3598 Huma-Num recrute un ou une ingénieure de recherche en science des données et intelligence artificielle. Le poste s'inscrit dans le Work Package 4 (WP4) dédié à l'intelligence artificielle, à l'IA générative et à l'ingénierie des connaissances pour les données, en soutien aux activités de recherche et de développement du HN Lab.
La personne sera affectée à l'Infrastructure de Recherche - IR* Huma-Num, portée par l'unité d'appui et de recherche (UAR) 3598, ayant pour tutelles principales le CNRS et le Campus Condorcet, et pour tutelle secondaire l'Université d'Aix Marseille. Pour en savoir plus sur les missions de l'IR* Huma-Num : https://www.huma-num.fr/quest-ce-que-l-ir-huma-num/
La personne sera affectée au sein du HN Lab, composé de 5 personnes, sous la responsabilité du responsable du HN Lab. Il ou elle collaborera de manière transverse avec les différents pôles d'Huma-Num au sein d'une unité composée actuellement de 28 personnes réparties sur Paris et Lyon.
La personne recrutée sera affectée à l'antenne parisienne de l'unité (Campus Condorcet à Aubervilliers 93).
Ce poste permet de bénéficier d'une à deux journées de télétravail par semaine dans le cadre de la réglementation en vigueur au CNRS.
Des déplacements réguliers (au moins 1 fois par mois en moyenne) sur les différents sites de l'unité et dans toute la France sont à prévoir.
Dans le cadre du programme européen LLMs4EU, l'UAR 3598 Huma-Num recrute un ou une ingénieure de recherche en science des données et intelligence artificielle. Le poste s'inscrit dans le Work Package 4 (WP4) dédié à l'intelligence artificielle, à l'IA générative et à l'ingénierie des connaissances pour les données, en soutien aux activités de recherche et de développement du HN Lab.
La personne sera affectée à l'Infrastructure de Recherche - IR* Huma-Num, portée par l'unité d'appui et de recherche (UAR) 3598, ayant pour tutelles principales le CNRS et le Campus Condorcet, et pour tutelle secondaire l'Université d'Aix Marseille. Pour en savoir plus sur les missions de l'IR* Huma-Num : https://www.huma-num.fr/quest-ce-que-l-ir-huma-num/
La personne sera affectée au sein du HN Lab, composé de 5 personnes, sous la responsabilité du responsable du HN Lab. Il ou elle collaborera de manière transverse avec les différents pôles d'Huma-Num au sein d'une unité composée actuellement de 28 personnes réparties sur Paris et Lyon.
La personne recrutée sera affectée à l'antenne parisienne de l'unité (Campus Condorcet à Aubervilliers 93).
Ce poste permet de bénéficier d'une à deux journées de télétravail par semaine dans le cadre de la réglementation en vigueur au CNRS.
Des déplacements réguliers (au moins 1 fois par mois en moyenne) sur les différents sites de l'unité et dans toute la France sont à prévoir.