Ingénieur CDD en Apprentissage Profond sur Nuages de Points H/F - INRIA
- Palaiseau - 91
- CDD
- INRIA
Les missions du poste
A propos d'Inria
Inria est l'institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l'interface d'autres disciplines. L'institut fait appel à de nombreux talents dans plus d'une quarantaine de métiers différents. 900 personnels d'appui à la recherche et à l'innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'eorce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.Ingénieur CDD en apprentissage profond sur nuages de points
Type de contrat : CDD
Contrat renouvelable : Oui
Niveau de diplôme exigé : Bac +5 ou équivalent
Fonction : Ingénieur scientifique contractuel
Niveau d'expérience souhaité : Jusqu'à 3 ans
A propos du centre ou de la direction fonctionnelle
Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s'inscrit dans le développement du plateau de Saclay, en partenariat étroit d'une part avec le pôle de l'Université Paris-Saclay et d'autre part avec le pôle de l'Institut Polytechnique de Paris . Afin de construire une politique de site ambitieuse, le centre Inria de Saclaya signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.
Le centre compte , dont 27 sont communes avec l'Université Paris-Saclay ou l'Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d'appui à la recherche et à l'innovation, issues de 54 nationalités.
Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l'originalité d'Inria dans le paysage de la recherche : l'excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l'impact scientifique, économique et sociétal d'Inria.
Contexte et atouts du poste
Nous recherchons un ingénieur de recherche en CDD pour venir optimiser les travaux de thèse(débutée en septembre 2024) en traitement automatique de données bathymétriques par des méthodes d'apprentissage profond.
Le Shom (Service hydrographique et océanographique de la Marine) est l'opérateur public pour l'information géographique maritime et littorale de référence (www.shom.fr). Dans le cadre de ses missions, il réalise des campagnes à la mer afin d'acquérir le maximum d'informations précises de la bathymétrie (profondeurs d'eau) sur les zones d'intérêt qui lui sont assignées. Ces données, sous forme de nuages de points geospatiaux, sont actuellement traitées manuellement afin d'extraire le signal utile avant d'être intégrées en base de données et de vernir renseigner les produits cartographiques utiliser afin d'assurer la sécurité de la navigation en mer. Les étapes de traitement et de contrôle de l'information bathymétrique, du nettoyage des mesures aberrantes et d'intégration en base de données, dure en moyenne un an et demi.
La présente collaboration de recherche entre Shom, INRIA et IMT a pour objectif de mettre en place une chaîne de traitement automatique ou semi-automatique d'extraction de l'information utile au sein de nuages de points bathymétriques (acquis par Lidar ou sondeur multifaisceaux). Les gains de temps attendus ne devront pas occulter les besoins d'explicabilité et de fiabilité.
La démarche scientifique entamée consiste à tirer parti des méthodes d'IA par apprentissage profond appliquées aux nuages de données géospatiales de bathymétrie. La thèse en cours élabore l'approche méthodologique et propose des preuves de concepts. L'ingénieur de recherche participera à leur passage à l'échelle, à leur évaluation, et le cas échéant à leur opérationnalisation (mise à disposition vers les opérateurs), en prenant soin de de fournir un protocole détaillé et chiffré, en matière de complexité algorithmique, volume, stockage, architecture, des différentes opérations nécessaires tout au long du cycle de vie du système IA proposé, depuis le recueil de la donnée jusqu'à l'affichage des résultats à l'opérateur.
Mission confiée
Le programme de travail de la thèse se divise en 3 axes :
- Elaboration d'un ensemble de descripteurs à partir de données SMF et LIDAR ;
- Conception d'architectures d'apprentissage automatique par régression pour la prévision du fond marin à partir des descripteurs ;
- Approche portfolio et explicable pour une aide à la décision de l'hydrographe.
Comme indiqué précédemment, l'ingénieur viendra en appui de cette thèse. Son rôle sera :
- d'affiner les modèles et les descripteurs conçus par le doctorant ;
- de gérer le passage à l'échelle dans la structuration de la donnée et dans l'entraînement des modèles ;
- de transformer le code en un prototype fonctionnant dans son environnement de destination et intégré aux outils du Shom :
- de mettre en place l'évaluation du prototype par les opérateurs du Shom et de prendre en compte les retours utilisateur.
Principales activités
Dans l'axe 1, l'ingénieur aidera à:
- Affiner la définition et le calcul des descripteurs pertinents et explicables caractérisant les données géospatiales LIDAR. Plusieurs classes de descripteurs seront considérées : des quantités statistiques ou fonctionnelles, des dictionnaires à base de partitionnement, enfin des méthodes neuronales.
- Favoriser un passage à l'échelle (structuration de la donnée / parallélisation) dans le calcul de ces descripteurs sur des larges volumes de données (plusieurs millions voire des dizaines de millions de points), puis sur des ensembles de zones.
Dans l'axe 2, le but sera d'optimiser les preuves de concepts des modèles prédictifs proposées dans le cadre de la thèse. Dans ce cadreL'ingénieur devra:
- Industrialiser ces architectures, optimiser les réglages fins des hyperparamètres, structurer les protocoles d'expérimentation/validation.
Dans l'axe 3, alors que les travaux de thèse viseront à sélectionner le meilleur modèle prédictif à utiliser en fonction des caractéristiques intrinsèques des données et l'exploitation attendue de l'information bathymétrique générée et des capacités explicatives du modèle, les travaux de l'ingénieur viseront à:
- Intégrer les développements et permettre une validation en aval par les opérateurs en conditions réelles de traitement.
- Prendre l'initiative dans l'élaboration et la mise en place de protocoles d'évaluation des outils par les opérateurs, ainsi qu'au dépouillement et à l'analyse des résultats obtenus et des retours d'expérience.
Compétences
Compétences techniques et niveau requis :
- de solides bases en apprentissage automatique et en apprentissage profond ;
- une bonne maîtrise du langage Python et des bibliothèques Sklearn, PyTorch et TensorFlow ;
- une expérience réelle de mise en place de chaînes MLOps ;
- des connaissances en traitement de données géospatiales (notamment nuages de points) seraient un plus ;
- optionnel : une maîtrise des bibliothèques de traitement de données volumineuses comme Dask, Xarray ou Zarr.
Langues : francais ou anglais
Compétences relationnelles : être capable de discuter à la fois avec les experts en apprentissage profond et avec les opérateurs sur le terrain ; être capable de collaborer étroitement avec le doctorant tout au long du projet, avec un partage clair des tâches.
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Rémunération
Selon grille de rémunération des agents contractuels de la fonction publique