Recrutement Doctorat.Gouv.Fr

Thèse Exploration par Simulation des Stratégies de Sélection Optimales dans des Contextes d'Incertitude H/F - Doctorat.Gouv.Fr

  • Montpellier - 34
  • CDD
  • Doctorat.Gouv.Fr
Publié le 1 avril 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université de Montpellier
École doctorale : GAIA - Biodiversité, Agriculture, Alimentation, Environnement, Terre, Eau
Laboratoire de recherche : AGAP Institut, Amélioration Génétique et Adaptation des Plantes
Direction de la thèse : David POT ORCID 0000000161448448
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-07T23:59:59

Les programmes de sélection végétale ont été historiquement développés dans des environnements relativement stables, ayant favorisé des gains génétiques soutenus. L'augmentation des contraintes environnementales associées au changement climatique couplées aux évolutions attendues liées à la transition agroécologique modifient les environnements dans lesquels seront développées, évaluées et positionnés les variétés sélectionnées. Des travaux récents montrent que les essais multi-environnements actuels représentent mal la variabilité climatique future, cette dernière réduisant à la fois la stabilité des performances variétales et l'efficacité de la sélection.
Parallèlement, les stratégies disponibles pour développer et caractériser les variétés ainsi que pour prédire leurs valeurs génétiques évoluent rapidement : phénotypage haut débit, sélection génomique, intégration d'informations biologiques dans les prédictions et nouvelles techniques génomiques (NGT). Ces innovations offrent des opportunités majeures, mais doivent être combinées et intégrées aux programmes de sélection pour répondre aux défis futurs. Il devient donc indispensable de repenser les stratégies de sélection en tenant compte à la fois des fluctuations environnementales et de l'évolution des technologies, afin de maximiser les gains génétiques par unité d'investissement.
Cette thèse vise à explorer, par simulation, les stratégies de sélection optimales pour des espèces annuelles à reproduction sexuée dans des contextes environnementaux incertains et évolutifs. Elle analysera des situations où les environnements d'évaluation des candidats à la sélection et ceux de mise en production des variétés diffèreront potentiellement, en intégrant explicitement les interactions génotype × environnement ainsi que la dimension économique des décisions. Ces analyses seront menées dans un premier temps en se basant sur les schémas de sélection mis en oeuvre sur le riz pour la sélection de lignées pures visant l'Amérique latine et sur le sorgho pour la sélection d'hybrides visant le marché européen. Elles seront ensuite étendues aux programmes de sélection de riz hybride en Amérique latine et au programme de sélection de lignées pures de coton au niveau du Cameroun. Ces différents cadres d'analyses permettront de tester la généricité des résultats obtenus en fonction des propriétés des programmes et de leurs contextes environnementaux.
Trois objectifs principaux seront poursuivis. Le premier consistera à identifier les stratégies permettant de maximiser le gain génétique pour le rendement, conjointement à deux traits adaptatifs de réponse au stress, dans des environnements soumis soit à une évolution progressive des contraintes, soit à cette même évolution combinée à l'occurrence d'événements extrêmes.
Le deuxième objectif portera sur la gestion des corrélations négatives entre caractères cibles, notamment lorsque ces corrélations varient selon l'environnement.
Le troisième objectif visera à analyser les effets de la réorientation des programmes de sélection au cours du temps, en évaluant l'impact de ces changements dynamiques liés aux innovations technologiques, à l'évolution des contraintes environnementales ou économiques, ou à l'introduction de nouveaux critères de sélection.
Les résultats attendus sont le développement de cadres de simulation intégrant explicitement la dynamique climatique et stratégique, ainsi que la production de clés de décision permettant d'optimiser les programmes de sélection dans des environnements incertains et changeants. Ce travail contribuera à définir des stratégies robustes face au triple défi de l'évolution progressive des contraintes moyennes, de l'augmentation de la fréquence des événements extrêmes et de la nécessité d'adaptation des variétés à la transition agroécologique qui induira une hétérogénéité plus importante des conditions de culture.

Le changement climatique se traduit par i) une augmentation des températures et des teneurs en CO2 de l'atmosphère, ii) des combinaisons de plus en plus fréquentes de différents stress 1 et iii) des occurrences de plus en plus rapprochées d'évènements extrêmes 2,3. Ces évolutions n'étant pas linéaires dans le temps, les pressions de sélection qui sont appliquées sur les organismes vivants peuvent donc apparaître et disparaître rapidement et les valeurs adaptatives de certains traits changent dans des pas de temps très courts. En complément, la transition agroécologique des systèmes agricoles va aussi s'accompagner d'une augmentation de l'hétérogénéité des systèmes de cultures au sein des bassins de production.
Dans un contexte où la sélection de variétés d'espèce annuelles prend généralement entre 7 et 10 ans, le défi est aujourd'hui de sélectionner des variétés qui auront probablement été peu exposées aux conditions qu'elles rencontreront quand elles seront mises en production. Il a notamment déjà été mis en évidence que i) les programmes de sélection actuels supposent à tort que les essais multi-environnements (MET) capturent déjà la variabilité climatique auxquels les variétés seront exposées dans le futur et que ii) le changement climatique réduit simultanément la stabilité des performances des variétés au sein d'un environnement cible (Target Population of Environment) ainsi que la capacité de sélection de ces variétés 4.
Simultanément aux évolutions des contraintes environnementales, les stratégies mobilisables pour évaluer les réponses des plantes aux aléas environnementaux et prédire leurs valeurs génétiques dans des contextes spécifiques s'améliorent rapidement. En effet, des plateformes de phénotypage haut débit en conditions contrôlées, semi-contrôlées et au champ ont été mises en oeuvre et elles sont en évolution permanentes 5. En complément, la mobilisation généralisée des informations moléculaires au travers des approches de prédiction génomique ont permis de repenser les schémas de sélection et d'améliorer les gains génétiques par unité de temps 6,7. Les possibilités d'intégration de connaissances biologiques fines à ces approches initialement basées sur des marqueurs anonymes laissent entrevoir des augmentations significatives de ces gains 8-10. Enfin, les évolutions réglementaires actuelles au niveau européen concernant les nouvelles techniques génomiques (NGT) ouvrent de nouveaux horizons en permettant de manipuler plus aisément la diversité génétique naturellement disponible mais aussi de générer de nouvelles diversités 11,12.
Il est en outre important de souligner que les gains génétiques obtenus durant la révolution verte l'ont été dans un contexte atypique de très grande stabilité environnementale 13. Il est d'ores et déjà observé une réduction importante des gains génétiques qui vont probablement continuer à décroitre dans un contexte d'augmentation des variations des conditions environnementales et de restriction des accès aux intrants (eau, engrais minéraux, pesticides). Dans ce contexte, il est impératif de faire évoluer les stratégies de sélection en prenant mieux en compte les évolutions environnementales prévues, l'augmentation des hétérogénéités spatiales temporelles et l'augmentation des probabilités d'évènements extrêmes. Les évolutions des pratiques des programmes de sélection concernent d'une part les types de plans de croisements et de populations à développer (incluant la sélection des parents), les réseaux de caractérisations (incluant les essais en champs mais aussi en plateformes haut débit), ainsi que la mobilisation de stratégies d'amélioration des capacités prédictives des valeurs génétiques. Il est illusoire de tester empiriquement l'ensemble des combinaisons de pratiques et de stratégies de sélection possibles, qui plus est dans un contexte où les coûts associés aux différentes pratiques vont évoluer dans le temps (et que ces évolutions ne sont prévisibles qu'avec une précision modérée). En revanche, une approche par simulation devrait permettre d'identifier les stratégies pertinentes à mettre en oeuvre dans le futur 14,15. En effet comme souligné par Fritsche-Neto et al. (2025) la simulation des programmes de sélection devrait permettre aux sélectionneurs d'optimiser les gains génétiques en ne se contentant pas d'affiner les stratégies mais de les redéfinir en profondeur pour s'adapter aux challenges imposés par le changement climatique et la transition agroécologique.

Suite à une période de stabilité environnementale importante qui a permis le développement de variétés qui ont contribué à la réussite de la révolution verte, le changement climatique et les impératifs de la transition agroécologique imposent une remise à jour des stratégies de sélection des plantes. Dans le cadre de cette thèse trois objectifs majeurs seront poursuivis en mobilisant des approches de simulation des programmes de sélection. En premier lieu, les stratégies optimales de sélection pour le développement de variétés adaptées à des augmentations progressives des contraintes environnementales et à l'occurrence d'événements extrêmes seront explorées. Le second objectif de la thèse sera de définir précisément les ajustements à mettre en oeuvre au niveau des programmes de sélection pour gérer au mieux des corrélations négatives entre des caractères cibles de la sélection notamment dans un contexte où ces corrélations varient en fonction des environnements rencontrés. Enfin le troisième objectif sera d'évaluer l'impact de l'intégration de décision en séquence dans les programmes de sélection durant leur mise en oeuvre afin d'anticiper au mieux l'effet de l'émergence de nouvelles méthodes de prédiction des valeurs génétiques ou de nouveaux impératifs de sélection. Ces trois objectifs prendront en compte la maximisation des gains génétiques obtenus mais aussi la pertinence économique des stratégies proposées. Les cas d'études considérés concerneront 3 espèces (riz, sorgho et coton), deux types de structures variétales (lignées pures et hybrides) et 3 zones géographiques (l'Amérique latine, l'Europe et le Cameroun)

Cette thèse aura pour objectif d'évaluer par simulation les évolutions possibles des stratégies de sélection pour les espèces annuelles à reproduction sexuée en considérant des lignées pures et des hybrides F1 comme cibles de sélection. L'étude prendra en compte des contextes où les environnements d'évaluation des candidats à la sélection et de mises en production des variétés développées peuvent être distincts.
Au niveau des cibles de la sélection, quatre caractères seront considérés : i) le rendement, qui est le caractère intégratif par excellence, et qui présente un fort niveau d'interaction Génotype x Environnement (GxE) ; ii) deux caractères adaptatifs de réponse au stress (tolérance au déficit hydrique et aux températures élevées par exemple) dont les intérêts et les corrélations avec le rendement seront variables en fonction des conditions environnementales rencontrées ; et iii) un caractère dont la corrélation avec le rendement sera majoritairement négative (comme c'est souvent le cas pour la qualité du grain chez les céréales). Les estimations des valeurs génétiques des candidats à la sélection seront basées sur 2 approches, la première dépendant principalement des informations phénotypiques acquises sur des réseaux d'essais (au champ ou en conditions contrôlées ou semi-contrôlées) et la seconde tirant en complément parti d'informations de génotypage (Sélection Génomique [SG], introgression d'allèles favorables au travers de la sélection assistée par marqueurs , NGT) ; d'accès à des endophénotypes (Sélection Phénomique [SP]) ; ou des sorties de modèles écophysiologiques. Le point commun des différentes informations mobilisées dans la seconde approche étant de fournir des capacités de prédiction des valeurs génétiques (variables en fonction des approches proposées et des niveaux de GxE rencontrés) en réduisant les efforts de phénotypage.
Au niveau des environnements d'évaluation des candidats à la sélection et de mise en production des variétés sélectionnées, deux contextes seront considérés. En premier lieu, un scénario d'évolution progressive des niveaux de stress moyens au cours du temps, en ne considérant pas la possibilité de stress extrêmes. Dans un second scénario, des expositions à des stress extrêmes lors de la sélection et/ou de la diffusion des variétés, en complément de l'évolution progressive des niveaux de stress moyens. La définition précise d'un stress extrême étant sujette à discussion au sein de la littérature, nous considérerons, dans le contexte de cette étude, comme extrêmes des conditions induisant une perte de production supérieure ou égale à 50 % au niveau d'un essai. Ces conditions amèneront donc certains candidats à la sélection à ne pas produire du tout dans certaines conditions. La capacité de sélection pour des stress extrêmes dépendra de la fréquence de ces types de stress au sein des réseaux d'essais, qu'ils soient réalisés en champ ou dans des conditions (semi-)contrôlées permettant d'imposer ces stress. Il faudra également considérer que l'héritabilité des caractères diminue sous stress extrême, entraînant une précision de sélection plus faible pour les générations concernées par ces pressions.
En se basant sur ce cadre de simulation, la thèse s'articulera autour de 3 axes.
Dans le premier axe, les capacités de sélection pour le rendement, conjointement aux deux traits adaptatifs de réponse au stress, dans différents types d'évolutions des conditions environnementales seront évaluées. Pour différentes combinaisons de variances génétiques, de variances d'interaction GxE et de corrélations entre les trois caractères ; différentes structures de réseaux d'évaluation (champs, conditions contrôlées et semi-contrôlées), de schémas de sélection et de capacités de prédiction des valeurs génétiques seront testées. Les simulations seront effectuées avec des outils déjà disponibles (MOBPS 15, AlphaSimR 14) et des améliorations des composantes permettant les simulations du GxE seront mises en oeuvre notamment au travers de la mobilisation de modèles multiplicatifs 16. Une évaluation économique de la mise en oeuvre des différentes approches sera effectuée en prenant en compte les coûts des différentes actions (évaluation au champ, en plateforme, coûts du génotypage et de calibration des modèles de prédiction génomique, phénomique ou écophysiologique). Ces analyses seront menées dans un premier temps en se basant sur les schémas de sélection mis en oeuvre sur le riz pour la sélection de lignées pures visant l'Amérique latine et sur le sorgho pour la sélection d'hybrides visant le marché européen. Sur la base des développement méthodologiques réalisés, elles seront ensuite étendues aux programmes de sélection de riz hybride en Amérique latine et au programme de sélection de lignées pures de coton au niveau du Cameroun. Ces différents cadres d'analyses couvriront une large gamme de situations qui permettra de tester la généricité des résultats obtenus en fonction des propriétés des programmes et de leurs contextes environnementaux.
Dans le second axe, des stratégies alternatives permettant la sélection conjointe de caractères corrélés négativement seront testées. Dans un premier temps, seul le caractère corrélé négativement au rendement sera considéré et différents mécanismes sous-jacents à cette corrélation seront appréhendés (pléiotropie partielle, déséquilibre de liaison, trade-off physiologiques...). Les différentes stratégies permettant de gérer la sélection de ces deux caractères négativement corrélés seront simulées (choix des parents, plans de croisements ciblant des recombinaisons favorables, développement de structures de populations adaptées, indices de sélection multitraits... 17,18). Dans un second temps, ce cadre conceptuel sera étendu à la gestion de caractères dont les corrélations varient en fonction des environnements rencontrés (effets GxE sur les corrélations), ce qui est souvent le cas de caractères de tolérance aux stress qui présentent des coûts pour le développement des organismes dans le cas de conditions optimales de croissance 19-21.
Au sein du troisième axe, les impacts de la réorientation des objectifs de sélection, de la modification des critères de sélection ou de la mobilisation de nouvelles stratégies de sélection seront évalués. En effet, la majorité des approches de simulation mises en oeuvre jusqu'à présent considèrent des objectifs et des stratégies de sélection fixes sur des pas de temps très longs. Cette approche ne permet donc pas d'explorer les réalités opérationnelles des programmes de sélection qui sont souvent confrontés à des ajustements de leurs objectifs en fonction des évolutions des marchés, des émergences de nouvelles technologies, des apparitions de contraintes budgétaires, des modifications d'environnements cibles, ou encore des émergences de pathogènes non anticipée. Cette nécessité de prise en compte du caractère évolutif des critères de sélection est un des défis majeurs des simulations des programmes de sélection 7. Deux approches seront mises en oeuvre à ce niveau. D'une part un cadre conceptuel sera mis en place en se basant sur les arbres de décision pour modéliser les changements possibles d'orientations (évolution des cibles de sélection), de structure des programmes (évolution des réseaux d'évaluation multi-environnement), et d'outils de prédiction des valeurs des candidats (NGT, capacité de prédiction). En complément, AlphaSimR et MOBPS qui permettent maintenant de définir des objectifs et des critères de décisions qui évoluent au fil des cycles de sélection seront aussi testés dans ce contexte. Si des limites aux formalisations proposées dans ces deux outils par rapport au cadre conceptuel sont identifiées, des modules complémentaires permettant de mieux gérer ces aspects évolutifs seront potentiellement développés.

Le profil recherché

- Master 2 ou diplôme équivalent en génétique quantitative / amélioration végétale ou animale
- Solides connaissances en statistiques appliquées à la génétique et à la sélection végétale et animale
- Compétences conséquentes en programmation (R, Python...)
- Compétences fortes en bioinformatique notamment en termes de gestion et analyses des données de large dimension
- Attrait pour la modélisation et la simulation des processus
- Compétences de travail dans des cadres multidisciplinaires incluant sélectionneurs, généticiens, statisticiens, économistes, modélisateurs tant des secteurs publics que privés
- Un bon niveau en anglais sera essentiel pour permettre les interactions internationales nécessaires à la mise en oeuvre du projet et la valorisation des résultats au travers d'articles et de présentations dans des conférences internationales.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.