Recrutement Doctorat.Gouv.Fr

Thèse Hybridation de Llm et de la Théorie du Comportement Planifié pour la Simulation Sociale H/F - Doctorat.Gouv.Fr

  • Toulouse - 31
  • CDD
  • Doctorat.Gouv.Fr
Publié le 27 mai 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université de Toulouse
École doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse
Laboratoire de recherche : MIAT - Mathématiques et Informatique Appliquées Toulouse
Direction de la thèse : Patrick TAILLANDIER ORCID 0000000329394827
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-06-05T23:59:59

Ce projet de thèse vise à hybrider les Grands Modèles de Langage (LLM) avec la Théorie du Comportement Planifié (TPB) au sein de simulations sociales à base d'agents, afin d'étudier les trajectoires de transition agroécologique. La modélisation des comportements humains est un pilier de l'aide à la décision privée et publique. Toutefois, les approches classiques par agents manquent de flexibilité face aux informations qualitatives, tandis que l'usage brut des LLM génère des modèles 'boîtes noires' aux raisonnements opaques et difficilement justifiables. Le projet propose une architecture décisionnelle 'Neuro-Symbolique' novatrice où la puissance générative du LLM est contrainte par le cadre structurant de la TPB. Cette théorie psychologique postule que l'intention d'agir d'un individu repose sur trois déterminants fondamentaux : l'attitude, qui correspond à l'évaluation personnelle (positive ou négative) de l'action ; la norme subjective (ou sociale), qui représente la pression sociale perçue via l'influence des pairs ou de la société ; et le contrôle perçu, qui définit la perception qu'a l'individu de sa propre capacité à réaliser l'action en fonction des ressources disponibles et des obstacles à surmonter. En structurant le LLM autour de ces trois piliers, le projet garantit une modélisation explicable, auditable et comportementalement fidèle. Appliqué à l'adoption et à la diffusion de pratiques agroécologiques sur la Zone Atelier Plaine & Val de Sèvre (suivie depuis 1994), le modèle, développé sur la plateforme open source GAMA, permettra de simuler l'impact des leviers non-monétaires (information, conseil, influence sociale) sur cette adoption et diffusion. Il fournira un laboratoire virtuel opérationnel pour tester des politiques publiques ex ante.

L'intégration des LLMs dans la modélisation à base d'agents marque une rupture technologique permettant aux agents virtuels de traiter des informations sémantiques qualitatives (conseils, normes sociales). Cependant, ces modèles génératifs purement connexionnistes se heurtent à un verrou scientifique majeur : en l'absence de structure cognitive explicite, ils produisent des 'hallucinations comportementales' inexploitables pour l'aide à la décision publique. À l'inverse, les modèles symboliques classiques sont limités par la rigidité de leurs règles prédéfinies. Ce projet se positionne à l'intersection pour combiner la flexibilité sémantique des LLM et la rigueur des architectures cognitives symboliques.

L'objectif central est de concevoir et d'évaluer une architecture décisionnelle hybride « Neuro-Symbolique » couplant les LLM et la Théorie du Comportement Planifié (TPB). Il s'agit de dépasser l'effet 'boîte noire' des LLMs en rendant le raisonnement des agents virtuels transparent et explicable étape par étape. Les objectifs pratiques incluent le développement d'un framework générique sous la plateforme GAMA et la création d'un démonstrateur appliqué à la transition agroécologique. Ce démonstrateur servira de laboratoire virtuel pour évaluer ex ante l'impact des politiques publiques et des leviers d'intervention non-monétaires sur l'adoption d'innovations agricoles.

La thèse adoptera une approche 'Data-Driven' neuro-symbolique intégrée à la plateforme open-source GAMA. Techniquement, nous utiliserons des modèles 'open-weights' (Mistral, Llama 3) et des techniques de prompt engineering structuré (Chain-of-Thought) pour contraindre les décisions du LLM par la TPB, forçant l'agent à expliciter sa logique. Concernant le recueil de données, des enquêtes de terrain seront menées au travers d'échanges directs avec les agriculteurs ; ces interactions seront orientées par les principes de l'économie expérimentale afin de capturer, en plus des informations explicitables, les dynamiques implicites propres à leurs profils psycho-socio-économiques. Le modèle sera ensuite initialisé et calibré à partir de ces données de terrain et des données longitudinales exceptionnelles de la Zone Atelier Plaine & Val de Sèvre. Enfin, la validation sera mixte : quantitative (reproduction des courbes d'adoption historiques) et qualitative (via un 'Test de Turing expert' comparant les raisonnements simulés aux verbatim d'agriculteurs).

Le profil recherché

Nous recherchons un(e) candidat(e) diplômé(e) d'un Master 2 ou d'une École d'Ingénieurs en Informatique, Intelligence Artificielle, Systèmes Multi-Agents (SMA) ou Data Science. Des compétences solides en ingénierie logicielle et une maîtrise de l'IA (LLMs, Prompt Engineering avancé) sont indispensables. Une expérience ou un fort intérêt pour la modélisation à base d'agents (idéalement sous GAMA) est attendue. Une forte appétence pour le travail interdisciplinaire (sciences sociales, économie comportementale, agronomie) et la capacité à dialoguer avec différentes communautés scientifiques sont primordiales pour la réussite du projet.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.