Thèse de l'Adne à la Démographie Développer des Approches Quantitatives et Génétiques pour Estimer l'Abondance Suivre la Reproduction et Appuyer la Restauration des Poissons Migrateurs H/F - Doctorat.Gouv.Fr
- Toulouse - 31
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Toulouse École doctorale : SEVAB - Sciences Ecologiques, Vétérinaires, Agronomiques et Bioingenieries Laboratoire de recherche : CRBE - Centre de Recherche sur la Biodiversité et l'Environnement Direction de la thèse : Géraldine LOOT Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-01T23:59:59 Cette thèse vise à faire progresser l'ADN environnemental (ADNe) au-delà de la simple détection présence/absence, afin d'en faire un outil quantitatif et génétique utile à la gestion des poissons migrateurs. Le projet s'organise en trois chapitres complémentaires. Le premier développera, en conditions contrôlées, un cadre expérimental permettant de relier le signal ADNe au nombre réel d'individus, à la composition familiale et à la phénologie de reproduction, avec une attention particulière portée aux marqueurs nucléaires courts et au potentiel du close-kin mark-recapture (CKMR). Le deuxième transférera et validera ces développements sur la Nivelle, un cours d'eau restauré bénéficiant d'un suivi halieutique indépendant de long terme et pour lequel nous disposons déjà d'échantillons ADNe acquis avant, pendant et après l'arasement du barrage de Darguy. Le troisième chapitre développera des marqueurs nucléaires compatibles avec l'ADNe dégradé - en priorité des loci courts informatifs - pour accéder à la diversité intra-spécifique, à la structure génétique et à des unités de gestion pertinentes chez l'anguille, le saumon, la truite, l'alose et la lamproie. Le projet produira ainsi un continuum allant du contrôle expérimental à la validation en rivière puis à la génétique de la conservation, avec des retombées directes pour l'évaluation de la restauration de continuité écologique, l'identification de périodes de reproduction, et l'amélioration des outils d'aide à la décision pour les gestionnaires. L'ADN environnemental a profondément renouvelé le suivi de la biodiversité aquatique en permettant la détection non invasive d'espèces à partir de simples prélèvements d'eau ou de sédiment. Cependant, en rivière, l'enjeu scientifique n'est plus seulement de savoir si une espèce est détectée, mais de déterminer ce que signifie quantitativement et biologiquement le signal détecté. En système lotique, la concentration d'ADNe est influencée à la fois par le nombre d'individus contributeurs, leur biomasse, leur état physiologique, leur activité, leur reproduction, mais aussi par des paramètres environnementaux comme la température, le débit, le transport, la turbidité, le pH ou encore la persistance de l'ADN dans l'eau (Barnes et al., 2014 ; Jo et al., 2019 ; Rourke et al., 2022). Cette complexité explique pourquoi les usages réellement quantitatifs de l'ADNe restent encore limités, alors même que les gestionnaires ont besoin d'outils robustes pour suivre l'état des populations et mesurer l'effet des actions de restauration.
Dans ce contexte, la Nivelle constitue un système particulièrement stratégique. L'arasement récent du barrage de Darguy offre une opportunité rare de documenter la réponse de l'ichtyofaune à la restauration de la continuité écologique à haute résolution temporelle. Surtout, ce site dispose déjà d'un jeu d'échantillons ADNe unique, collectés mensuellement en amont et en aval, avant, pendant et après l'arasement, ainsi que d'un suivi halieutique et écologique indépendant de long terme dans le cadre de l'ORE DiaPFC et du réseau international des Index Rivers. Ce suivi comprend notamment le dénombrement des adultes, des suivis de saumons par pêche électrique, des suivis de frayères ainsi que des séries de température et de débit. Le retour de saumons adultes à Urdax en décembre 2023 a par ailleurs déjà été observé. Ce socle de données rend possible une validation particulièrement forte des approches développées dans la thèse.
La thèse s'inscrira aussi dans une évolution récente de l'ADNe vers des questions plus fines de phénologie de reproduction, de quantification d'abondance et de variation intra-spécifique. Plusieurs travaux ont montré que les pics d'ADNe peuvent refléter des épisodes de reproduction chez des poissons ou d'autres organismes aquatiques, et que le ratio ADN nucléaire / mitochondrial peut enrichir cette lecture (Bylemans et al., 2017 ; Collins et al., 2022 ; Wu et al., 2023). D'autres travaux soulignent que l'ADNe pourrait, à terme, permettre d'accéder à des informations de diversité génétique, de structure de populations et même d'abondance minimale d'individus contributeurs si l'on parvient à exploiter correctement l'information nucléaire, beaucoup plus riche que le signal mitochondrial mais aussi plus difficile à capter en raison de sa faible abondance et de sa dégradation (Andres et al., 2023).
C'est précisément là que réside l'originalité scientifique du projet. La thèse ne se limitera pas à appliquer des méthodes ADNe existantes : elle cherchera à construire un pont entre écologie quantitative, génétique des populations et modélisation de la parenté. Le volet expérimental envisagé avec la station SETE-CNRS de Moulis permettra de travailler dans des conditions où la vérité terrain est connue : nombre d'individus, composition des familles, période de reproduction, contexte hydrologique. Ce contrôle est indispensable pour tester des hypothèses ambitieuses sur l'abondance et la parenté à partir d'ADNe. Il est également nécessaire pour évaluer la faisabilité d'un futur usage du CKMR à partir de données nucléaires environnementales, car les approches CKMR publiées reposent actuellement sur des génotypes individuels et requièrent une bonne maîtrise de la structure des échantillons, de l'âge des individus potentiellement apparentés et parfois du sexe des parents. La transposition vers des mélanges de séquences environnementales constitue donc un changement d'échelle méthodologique, mais un changement scientifiquement justifié et potentiellement transformant. Cette thèse vise à franchir un verrou scientifique majeur de l'ADN environnemental : passer d'une information essentiellement qualitative de présence/absence à des indicateurs quantitatifs et génétiquement informatifs, directement utiles au suivi des populations, à l'évaluation des restaurations écologiques et à la conservation. Plus précisément, la thèse poursuivra cinq objectifs complémentaires.
Le premier objectif sera de développer un cadre expérimental contrôlé permettant de relier la quantité d'ADNe au nombre réel d'individus présents. Si plusieurs travaux ont montré que la concentration d'ADNe peut covarier avec l'abondance ou la biomasse, ils soulignent également que cette relation dépend fortement de facteurs biologiques et abiotiques, notamment la température, l'hydrodynamique, la taille des organismes, le comportement et la dégradation de l'ADN (Lacoursière-Roussel et al., 2016 ; Jo et al., 2019 ; Rourke et al., 2022). L'ambition ici n'est donc pas de supposer une relation simple et universelle, mais de la calibrer expérimentalement, dans des conditions où l'abondance réelle est connue, afin d'identifier les variables expliquant la variance du signal et de proposer des modèles transposables à des situations de terrain.
Le deuxième objectif consistera à tester la valeur du ratio ADNe nucléaire / mitochondrial comme indicateur de phénologie de reproduction. Des travaux récents ont montré que la reproduction peut modifier fortement la dynamique temporelle du signal ADNe, et que le rapport entre ADN nucléaire et mitochondrial peut constituer un signal utile pour détecter des périodes de ponte ou d'activité reproductive (Bylemans et al., 2017 ; Wu et al., 2023). Toutefois, ces approches ont surtout été étudiées en milieux lacustres ou dans des contextes encore peu comparables aux cours d'eau lotiques. Cette thèse cherchera donc à déterminer si ce signal reste détectable en rivière malgré les effets du débit, du transport et des conditions physico-chimiques, avec l'objectif appliqué d'identifier des fenêtres temporelles de reproduction et, à terme, des secteurs potentiels de frayère.
Le troisième objectif sera de transférer et valider ces approches sur la Nivelle, en s'appuyant sur un jeu d'échantillons déjà acquis avant, pendant et après l'arasement du barrage de Darguy. Ce transfert est un point fort majeur du projet : il ne s'agit pas seulement de démontrer une preuve de concept en système expérimental, mais d'évaluer si les relations calibrées en conditions contrôlées restent informatives dans un cours d'eau réel soumis à des variations hydrologiques, à la connectivité retrouvée et à des trajectoires de recolonisation. La confrontation avec les suivis indépendants disponibles sur la Nivelle - comptages, pêches électriques, frayères, débits, températures - permettra d'évaluer la robustesse, les biais et les limites d'utilisation des métriques ADNe en contexte de gestion.
Le quatrième objectif sera de développer des marqueurs nucléaires courts, compatibles avec l'ADNe dégradé, afin d'accéder à l'information intra-spécifique. La littérature récente montre que l'ADNe peut dépasser la simple détection spécifique et permettre l'étude de variation génétique intra-spécifique, avec des perspectives allant de la génétique des populations à l'inférence sur l'abondance minimale d'individus contributeurs (Andres et al., 2023). Le projet s'inscrira dans cette dynamique en ciblant en priorité des marqueurs nucléaires courts et informatifs, adaptés à l'état fragmenté de l'ADNe aquatique.
Le cinquième objectif, plus exploratoire mais fortement innovant, sera d'évaluer si des signatures de parenté peuvent être reconstruites à partir de données nucléaires environnementales et utilisées dans un cadre de close-kin mark-recapture (CKMR). Le CKMR est une méthode d'estimation d'abondance et de paramètres démographiques fondée non pas sur la recapture physique d'individus marqués, mais sur la détection de liens de parenté proches, tels que parent-progéniture ou demi-fratrie, à partir de génotypes. Dans sa forme classique, cette approche a déjà permis d'estimer l'abondance, la survie et parfois Ne dans plusieurs systèmes animaux, y compris aquatiques, à partir de génotypes individuels (Bravington et al., 2016 ; Trenkel et al., 2022 ; Babyn et al., 2024). L'originalité de cette thèse sera d'examiner si une partie de cette logique peut être transposée à l'ADNe, en travaillant non plus directement sur des individus capturés, mais sur des mélanges de séquences nucléaires. L'objectif n'est pas de promettre d'emblée une estimation opérationnelle en milieu naturel, mais de poser rigoureusement les bases mathématiques, expérimentales et bioinformatiques d'une telle approche. La thèse sera structurée en trois chapitres complémentaires, articulés selon une logique de calibration - validation - généralisation.
Chapitre 1 - Calibration expérimentale en conditions contrôlées
(volet à développer sous réserve de financements complémentaires)
Le premier chapitre aura pour objectif de construire le cadre expérimental nécessaire pour transformer des signaux ADNe en variables biologiques interprétables. Des bassins expérimentaux seront mis en place à la station SETE-CNRS de Moulis avec une espèce modèle de petite taille telle que le vairon (Phoxinus phoxinus), espèce adaptée aux dispositifs expérimentaux. Des groupes de taille connue seront constitués, avec contrôle du nombre d'individus, et de leur structure en familles. Des prélèvements d'eau répétés seront réalisés selon un protocole standardisé, avec réplications techniques et biologiques, afin de suivre la dynamique temporelle des signaux mitochondriaux et nucléaires en lien avec l'abondance et l'activité reproductive.
En parallèle, tous les individus introduits dans les bassins seront génotypés sur tissu afin de constituer une vérité de référence : identité individuelle, appartenance familiale, demi-fratries ou fratries, nombre réel de contributeurs au mélange. Cette étape est essentielle, car elle permettra de comparer ce que l'on sait du système biologique réel à ce qui peut être reconstruit à partir de l'ADNe seul. Sur cette base, la thèse développera et testera des marqueurs nucléaires courts, adaptés à de l'ADN dégradé. L'objectif sera d'évaluer jusqu'où l'on peut remonter depuis un mélange d'ADNe vers des informations intra-spécifiques fiables : nombre minimal de génotypes contributeurs, diversité allélique, composition familiale, et éventuels signaux de parenté.
Ce premier chapitre permettra également de tester expérimentalement le ratio ADN nucléaire / mitochondrial comme indicateur de reproduction. En échantillonnant avant, pendant et après les épisodes reproducteurs, il sera possible d'évaluer si le rapport entre ces deux compartiments d'ADN varie de manière répétable et exploitable, comme suggéré par la littérature en lacs et en milieux contrôlés (Bylemans et al., 2017 ; Wu et al., 2023), mais encore peu étudié en eau courante. Enfin, les signaux ADNe seront modélisés en fonction du nombre réel d'individus, du débit, de la température et d'autres covariables expérimentales afin d'identifier les modèles les plus prédictifs pour l'abondance.
Chapitre 2 - Validation et transfert sur la Nivelle
(volet déjà sécurisé par les données acquises)
Le deuxième chapitre exploitera les échantillons ADNe déjà collectés sur la Nivelle avant, pendant et après l'arasement du barrage de Darguy. L'objectif sera double : d'une part, tester dans un contexte réel les indicateurs calibrés en système expérimental ; d'autre part, produire des résultats directement utiles à la compréhension de la recolonisation post-arasement.
Les analyses combineront approches ciblées et approches plus globales. Des quantifications ciblées par dPCR ou méthodes apparentées permettront de suivre certaines espèces patrimoniales, en particulier les salmonidés, tandis que les données de présence/absence et de composition spécifique alimenteront une lecture plus large des trajectoires de recolonisation. Ces signaux seront confrontés aux suivis indépendants disponibles : abondances halieutiques, pêche électrique, frayères, température, débit, et données géomatiques si elles sont intégrées au projet. L'enjeu sera de déterminer dans quelle mesure les modèles issus du chapitre expérimental restent valides en rivière et quelles corrections doivent être introduites pour tenir compte du transport de l'ADNe, des contrastes amont/aval et des effets hydrologiques.
Ce chapitre permettra aussi de tester l'usage du ratio ADN nucléaire / mitochondrial pour repérer des fenêtres de reproduction en rivière, et d'examiner si des marqueurs nucléaires courts permettent déjà d'accéder à une information intra-spécifique exploitable sur le terrain. Le cas de la Nivelle est ici particulièrement fort, car il offre un système naturel où un évènement de restauration de continuité est documenté de manière indépendante, avec déjà un signal biologique fort de retour du saumon.
Chapitre 3 - Génétique de la conservation, parenté et ouverture vers le CKMR
Le troisième chapitre portera sur le développement conceptuel, analytique et appliqué d'approches de parenté à partir de l'ADNe nucléaire, avec une ouverture vers le close-kin mark-recapture (CKMR). Le CKMR repose sur une idée simple mais puissante : dans une population diploïde, chaque individu porte la moitié du génome de chacun de ses parents. Si l'on échantillonne génétiquement suffisamment d'individus et que l'on identifie des paires apparentées proches - parent-progéniture, demi-frères/soeurs, frères/soeurs complets - alors le nombre et la structure de ces liens deviennent informatifs sur l'abondance, la survie, la fécondité et, dans certaines extensions récentes, sur la taille efficace Ne. Plus la population adulte est grande, moins on s'attend à observer de paires apparentées proches parmi un nombre donné d'échantillons ; à l'inverse, un excès de paires proches reflète un plus petit nombre de reproducteurs ou une plus forte variance du succès reproducteur. C'est en ce sens qu'il s'agit d'un mark-recapture génétique : on ne recapture pas un individu marqué physiquement, mais ses apparentés génétiques, qui jouent le rôle de marques héréditaires (Bravington et al., 2016 ; Trenkel et al., 2022 ; Babyn et al., 2024).
Dans la littérature actuelle, le CKMR a déjà été utilisé pour estimer l'abondance de thon rouge du Sud, de requins, de truites, de saumons, de chauves-souris et d'autres organismes, à partir de génotypes individuels bien caractérisés. Les travaux récents montrent aussi qu'en combinant paires parent-progéniture, demi-fratries entre cohortes et fratries au sein d'une cohorte, il est possible d'aller jusqu'à une estimation de Ne, en reliant le nombre de fratries observées à la variance du succès reproducteur (Babyn et al., 2024). En revanche, ces approches n'ont pas été conçues à l'origine pour des mélanges anonymes de séquences environnementales, ce qui constitue précisément le défi méthodologique de la thèse.
Le travail proposé dans ce chapitre sera donc mené en deux temps. D'abord, sur les données expérimentales de Moulis, où la vérité de parenté sera connue, on évaluera si les marqueurs nucléaires développés permettent de détecter une information compatible avec des signatures de parenté : présence d'allèles partagés non aléatoires, reconstruction partielle de génotypes, estimation du nombre minimal de familles contributrices, et concordance avec la composition réelle des bassins. Ensuite, à partir de ces résultats, des simulations mathématiques et bioinformatiques seront développées sous R et Python pour déterminer sous quelles hypothèses un signal de type CKMR peut être reconstruit à partir de séquences environnementales. Ces simulations permettront d'explorer plusieurs niveaux d'observation : séquences brutes, fréquences alléliques, combinaisons multilocus, nombre minimal de contributeurs, présence de fratries ou demi-fratries. Le but n'est pas de prétendre qu'une estimation CKMR opérationnelle sera immédiatement obtenue à partir d'ADNe de rivière, mais de fournir la première évaluation rigoureuse de sa faisabilité, de ses conditions de validité et de ce qu'elle pourrait apporter à la science du suivi non invasif.
L'apport potentiel est majeur. Si une partie de la logique CKMR peut être transférée à l'ADNe, même de façon partielle, cela ouvrirait la voie à des estimations non invasives de l'abondance, du nombre de familles contributrices, voire de paramètres reliés à Ne, dans des systèmes où les captures individuelles sont difficiles, coûteuses ou perturbatrices. Une telle avancée dépasserait le cadre du suivi classique par présence/absence et positionnerait l'ADNe comme un outil de génomique démographique non invasive, particulièrement pertinent pour les espèces patrimoniales ou restaurées.
Le profil recherché
- Formation en écologie, biologie des populations, génétique, biologie moléculaire, bioinformatique ou domaine proche.
- Goût pour les approches interdisciplinaires mêlant laboratoire, analyses quantitatives, statistiques/mathématiques, écologie et questions de conservation.
- Compétences souhaitées en biologie moléculaire (PCR, extraction ADN) et/ou en analyses de données sous R ; une expérience préalable en ADNe, génétique des populations ou bioinformatique sera appréciée.
- Rigueur, autonomie, capacité rédactionnelle et intérêt pour le travail collectif avec chercheurs, ingénieurs et gestionnaires.
- Intérêt pour la modélisation statistique et curiosité pour les développements méthodologiques.