Thèse Apprentissage Performatif et Sciences Citoyennes H/F - Doctorat.Gouv.Fr
- Montpellier - 34
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Montpellier
École doctorale : I2S - Information, Structures, Systèmes
Laboratoire de recherche : IMAG - Institut Montpelliérain Alexander Grothendieck
Direction de la thèse : Joseph SALMON ORCID 0000000231810634
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-04T23:59:59
Les plateformes de science citoyenne dédiées à la surveillance de la biodiversité créent une boucle de rétroaction
entre les modèles d'apprentissage automatique déployés et les données soumises par les utilisateurs : les
prédictions de la plateforme influencent le comportement des utilisateurs, qui à son tour influence la distribution d'apprentissage des futurs modèles.
Ce phénomène, connu sous le nom de *prédiction performative*, pose des défis fondamentaux à la théorie de l'apprentissage statistique. Les cadres existants traitent principalement de la régression et de la classification binaire sous des hypothèses structurelles restrictives, laissant largement de côté les régimes multi-classes, à déséquilibre de classes et à longue traîne qui caractérisent les ensembles de données réels sur la biodiversité.
Ce projet propose d'étendre la théorie et les algorithmes d'apprentissage performatif à ces contextes, en mettant particulièrement l'accent sur la modélisation du mécanisme de rétroaction de la science citoyenne et sur le développement de méthodes basées sur les gradients, qui restent pratiques dans le cadre de contraintes de déploiement réalistes.
Pl@ntNet est une plateforme d'identification des plantes par reconnaissance d'images, combinant science participative et apprentissage performatif. Soutenue par des institutions comme l'Inria ou le Cirad, elle s'appuie sur une communauté d'utilisateurs pour enrichir et valider une base de données botaniques. Chaque contribution (identification, correction, validation) améliore à la fois la recherche et les algorithmes, créant une dynamique collaborative.
Cette approche permet une collecte massive de données floristiques, cruciale pour cartographier la biodiversité et étudier ses évolutions, notamment face au changement climatique. L'apprentissage performatif affine en continu la précision des modèles, intégrant nouvelles espèces et variations environnementales.
Le profil recherché
M2 ou ingénieur,
thème: statistiques, apprentissage automatique.