Recrutement CNRS

Offre d'Ingénieur d'Études - Recherches en Informatique - Techniques de Fouilles et Représentations de Données H/F - CNRS

  • Pau - 64
  • CDD
  • CNRS
Publié le 31 juillet 2025
Postuler sur le site du recruteur

Les missions du poste

Les missions associées à ce poste concernent l'évaluation de l'intérêt et l'adaptation des techniques de fouilles de données médias pour les travaux développés dans la chaire REASONS (chaire ANR cofinancée par l'ANR et TotalEnergies) et permettant de résumer, d'organiser et d'annoter efficacement un nouveau corpus de données. Ces techniques incluent l'analyse de graphes avec par exemple, la détection de communautés, la détection de concepts via les techniques de traitement automatique de la langue, en prenant en compte les développements récents de ce domaine dues aux grands modèles de langue, ainsi que les techniques de visualisation de données. Plutôt que le développement de nouvelles techniques, c'est la mise à disposition d'outils déjà disponibles sur étagère qui est attendue. Des collaborations avec d'autres équipes sur des projets existants afin développer de nouvelles fonctionnalités sont envisageables, cette mise à disposition pouvant entraîner des modifications afin de réduire le temps nécessaire à la mise en place des modèles et de proposer un formalisme compatible avec la formalisation utilisée par les chercheurs du laboratoire. La collecte de données web sera également évaluée en termes de coût et de qualité, soit à partir d'API fournies par les plateformes, soit à partir de robots, ou bien de collaborations avec d'autres instituts de recherche.
Activités
Le travail s'organisera de la manière suivante :
- Catégorisation de commentaires significatifs de positionnements dans les réseaux sociaux dans le contexte de leur conversation : type d'arguments, ton du discours, caractérisation de mélanges de type d'arguments dans une même conversation. Ce type de méta-données peuvent-être extraites au moyen de modèles génériques de l'état de l'art.
- Analyse de graphes : Bien que nous n'ayons pas accès à l'identité des auteurs des commentaires, des liens peuvent être établis entre les contenues en fonction du type de discours qu'ils portent, des entités nommées ou des influenceurs qu'ils citent, ou des liens qu'ils donnent vers d'autres contenus.
- Recherche de liens inter-plateformes. Par exemple : trouver quels types de discours ou d'arguments sur Facebook va citer quels types de vidéos sur youtube. Cet appariement permettra d'établir une cartographie des données en fonction d'influenceurs, de contenus, ou de thématiques identifiés.
Compétences
Un diplôme d'ingénieur ou doctorat en informatique ou mathématiques appliquées,
Les candidats devront justifier des compétences suivantes :
- Programmation python et outils de machine learning : tensorflow et pytorch
- Développement logiciel et outil de visualisation (react, vuejs)
- Traitement automatique de la langue, plongements lexicaux, analyse de graphe et détection de communautés
- Qualité rédactionnelles, capacité à présenter et à vulgariser
- Un fort intérêt pour travailler avec les sciences sociales est indispensable, une expérience en sociologie computationnelle est fortement souhaitée.

Contexte de travail

Le travail se déroule dans le cadre d'une chaire industrielle ANR, la chaire REASONS (co financement ANR / TotalEnergie)
Contraintes et risques

Résidence sur Pau. Aucun risque spécifique

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.