Doctorant·e Indexation et Recherche à Grande Échelle dans les Contenus Multimédias et Géospatiaux H/F - Institut national de l'information géographique et forestière (IGN)
- Champs-sur-Marne - 77
- Fonctionnaire
- Institut national de l'information géographique et forestière (IGN)
Les missions du poste
Le laboratoire LASTIG (Laboratoire en Sciences et Technologies de l'Information Géographique pour la ville intelligente et les territoires durables) est une unité mixte de recherche rattachée à l'Université Gustave Eiffel, à l'IGN (Institut national de l'information géographique et forestière) et à l'EIVP (École des Ingénieurs de la Ville de Paris). Il constitue une structure de recherche unique en France et même en Europe, réunissant environ 80 chercheurs couvrant l'ensemble du cycle de vie des données géographiques ou spatiales, depuis leur acquisition jusqu'à leur visualisation, en passant par leur modélisation, intégration et analyse. Parmi eux, environ 30 chercheurs travaillent en analyse d'images, vision par ordinateur, apprentissage automatique et télédétection.Le doctorant contribuera à la conception et à l'évaluation de stratégies d'indexation et de recherche multimodale évolutives dans le cadre de DALEAS. En particulier, il soutiendra le cas d'usage sur la lutte contre la désinformation par géolocalisation de flux de données, via l'analyse de contenus, leur fusion et alignement, reposant sur la recherche de documents caractérisant le même lieu que celui de la requête, en exploitant les modalités disponibles - textes, images et nuages de points 3D (LiDAR) dans notre cas.
- Concevoir et évaluer des méthodes d'indexation et de recherche multimodale (images, textes, données 3D, etc.) à grande échelle.
- Développer des stratégies de fusion et d'alignement entre modalités (images, vidéos, textes, 3D, etc), pour la recherche de similarités géospatiales.
- Exploiter les modèles multimodaux de grande taille (MLLMs) pour unifier les représentations entre modalités.
- Intégrer et évaluer les méthodes développées dans l'infrastructure DALEAS, fondée sur Apache Spark, pour le traitement distribué de jeux de données multimédias et géospatiaux à grande échelle (images, textes, nuages de points LiDAR issues des aquisitions de l'IGN, médias sociaux, etc.).
- Appliquer les résultats à la géolocalisation automatique de contenus multimédias, utilisée comme base pour des applications de fact-checking et de mise à jour de jumeaux numériques.
Le profil recherché
Diplôme Bac +5 en informatique, mathématiques appliquées ou géomatique (master ou école d'ingénieur). Une solide formation en apprentissage automatique est souhaitée, des connaissances ainsi qu'une expérience en recherche d'information, indexation et recherche d'images, ou vision par ordinateur seront fortement appréciées. Le candidat retenu devra posséder de bonnes compétences en
programmation (Python, C/C++). La connaissance des outils et pratiques d'ingénierie logicielle, tels que Docker, Apache Spark, etc., sera particulièrement appréciée.
Une excellente maîtrise de l'anglais est nécessaire ; la maîtrise du français est souhaitée. La curiosité, l'ouverture d'esprit, la créativité, la persévérance et la capacité à travailler au sein d'une équipe pluridisciplinaire sont également des qualités personnelles essentielles