Thèse Vers une Modélisation Prédictive des Structures de Protéines Désordonnées Grâce à l'Intégration de Données Expérimentales et de Méthodes Computationnelles H/F - Doctorat.Gouv.Fr
- Montpellier - 34
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Montpellier École doctorale : Sciences Chimiques et Biologiques pour la Santé Laboratoire de recherche : CBS - Centre de Biologie Structurale Direction de la thèse : Pau BERNADO ORCID 0000000173955922 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-11T23:59:59 Les protéines intrinsèquement désordonnées (IDPs) et les régions intrinsèquement désordonnées (IDRs) jouent un rôle central dans de nombreux processus biologiques, notamment la signalisation, la régulation et la séparation de phase. Contrairement aux protéines repliées, les IDPs/IDRs n'adoptent pas une structure tridimensionnelle unique et stable, mais explorent des ensembles conformationnels hautement dynamiques. Cette hétérogénéité structurelle remet en question le paradigme classique structure-fonction et rend leur caractérisation particulièrement difficile. Le développement de modèles prédictifs et quantitatifs des paysages conformationnels des IDPs et IDRs constitue ainsi un objectif majeur de la biologie structurale actuelle.
Ces dernières années, les approches intégratives combinant données expérimentales et modélisation computationnelle se sont imposées comme des stratégies puissantes pour décrire les ensembles d'IDPs. Parmi les techniques expérimentales, la diffusion des rayons X aux petits angles (SAXS) et la résonance magnétique nucléaire (RMN) fournissent des informations complémentaires, respectivement globales et résolues à l'échelle du résidu, sur les conformations en solution. Toutefois, l'interprétation de ces données en termes d'ensembles structuraux précis reste un défi, nécessitant des cadres méthodologiques robustes capables de concilier observables expérimentaux et vaste espace conformationnel.
L'objectif de ce projet de thèse est de développer des modèles computationnels prédictifs des structures d'IDPs et d'IDRs en intégrant des données SAXS et RMN dans des approches de modélisation avancées déjà développées au sein de l'équipe d'accueil. Ces approches reposent sur des stratégies d'échantillonnage très efficaces et des cadres statistiques capables de générer rapidement de très grands ensembles conformationnels, un atout essentiel pour capturer la diversité des états désordonnés.
Le premier axe du projet portera sur l'optimisation des paramètres du modèle afin de reproduire fidèlement des jeux de données SAXS et RMN à grande échelle issus de bases de données publiques. Cette calibration guidée par les données permettra de capturer les caractéristiques physiques essentielles gouvernant le comportement conformationnel des IDPs et IDRs pour des séquences variées. Une attention particulière sera accordée au développement d'algorithmes rapides et scalables, permettant une exploration systématique de l'espace des paramètres et la génération d'ensembles structuraux étendus compatibles avec les données expérimentales.
Une fois un modèle précis et bien paramétré établi, le second axe abordera sa transférabilité et son pouvoir prédictif. Le projet visera notamment à prédire des quantités difficilement accessibles expérimentalement telles que les concentrations effectives régissant les interactions intra- et intermoléculaires dans les systèmes désordonnés. La génération rapide de grands ensembles permettra une estimation quantitative de ces propriétés et apportera un éclairage nouveau sur les interactions biomoléculaires impliquant IDPs et IDRs.
La combinaison d'une grande efficacité computationnelle et de la précision atteinte pour les protéines globulaires par des approches d'intelligence artificielle comme AlphaFold ouvre la voie à des applications à grande échelle. L'approche développée permettra d'étudier systématiquement l'effet de mutations ponctuelles, ainsi que de construire des modèles structuraux précis pour des familles entières de protéines désordonnées, voire à l'échelle du protéome.
Au final, ce projet vise à établir un pont entre expériences et modélisation afin de parvenir à une description prédictive des protéines désordonnées. En combinant intégration de données à grande échelle et des méthodes d'échantillonnage rapides, il ambitionne de fournir un cadre robuste et prédictif pour l'étude des IDPs et IDRs, avec des retombées importantes en biologie.
Ce projet sera réalisé au CBS de Montpellier sous la co direction de Pau Bernadó (CBS) et Juan Cortés (LAAS Toulouse). Les deux équipes sont reconnues internationalement et disposent d'un solide parcours en matière de co encadrement réussi. Ensemble, elles ont développé des méthodologies clés pour la caractérisation des protéines désordonnées, en intégrant modélisation moléculaire et données expérimentales. S'appuyant sur ces bases établies, la thèse proposée vise à développer des outils computationnels avancés ayant un potentiel d'impact significatif en biologie structurale et en biophysique.
Le profil recherché
Le candidat idéal possède un diplôme de Master en biologie, biophysique, bioinformatique ou dans un domaine connexe, avec des bases solides en structure et dynamique des protéines. Il/elle doit avoir de l'expérience en modélisation computationnelle, en programmation (Python et/ou C++) et en analyse de données expérimentales. La maîtrise des environnements de calcul haute performance et des méthodes statistiques est souhaitable. Le candidat doit être très motivé, capable de travailler de manière autonome et en équipe, et posséder de bonnes compétences en communication scientifique pour présenter efficacement ses résultats