Recrutement Université de Lille

Thèse Organisation Structurelle de la Machinerie de Glycosylation une Investigation Computationelle des Assemblees Cazyme dans le Golgi H/F - Université de Lille

  • Lille - 59
  • CDD
  • Université de Lille
Publié le 17 mars 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université de Lille
École doctorale : Sciences de la Matière du Rayonnement et de l'Environnement
Laboratoire de recherche : UGSF - Unité de Glycobiologie Structurale et Fonctionnelle
Direction de la thèse : Marc LENSINK ORCID 0000000339579470
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-30T23:59:59

La glycosylation des protéines est une modification post-traductionnelle essentielle qui influence profondément la stabilité, le trafic et la reconnaissance moléculaire des protéines. Elle représente l'une des voies métaboliques les plus complexes et dynamiques, capable de générer une extraordinaire diversité de structures glycaniques jouant un rôle crucial dans le développement, l'immunité et les maladies. Contrairement aux macromolécules synthétisées par matrice, la biosynthèse des glycanes n'est pas directement codée par le génome, mais résulte de l'action coordonnée de multiples glycosyltransférases, glycosylhydrolases et transporteurs (CAZymes) localisés le long de la voie de sécrétion. Ces enzymes agissent de manière séquentielle et compétitive sur des substrats communs, mais les principes structuraux et organisationnels régissant leur coopération restent largement méconnus.

Ce projet de doctorat vise à élucider les bases structurales de l'organisation fonctionnelle des voies de glycosylation en étudiant les interactions protéine-protéine entre les CAZymes résidentes de l'appareil de Golgi agissant successivement. S'appuyant sur le cadre conceptuel et méthodologique établi au sein de l'équipe (MassiveFold, CDP, GlycoPlay, et autres références), ce projet appliquera des techniques de pointe en bioinformatique structurale et en modélisation d'assemblages à grande échelle afin d'identifier, de caractériser et de rationaliser les complexes multi-enzymatiques putatifs, en se concentrant sur les CAZymes impliquées dans la biosynthèse des O-glycanes. La collaboration interne au sein de l'institut hôte (UGSF) orientera la sélection et l'interprétation des cibles, tout en assurant une validation expérimentale, garantissant ainsi une boucle de rétroaction étroite entre les approches computationnelles et expérimentales.

En combinant la prédiction de structures par apprentissage profond, l'échantillonnage massif d'assemblages protéiques et l'analyse graphique des interfaces d'interaction, ce projet vise à fournir des preuves moléculaires de l'existence de métabolons de glycosylation et à clarifier comment l'organisation structurale contribue à la spécificité, à la robustesse et à la régulation des voies métaboliques.

Protein glycosylation is a central and highly complex post-translational modification that plays essential roles in development, immunity, and disease. Unlike templated biological polymers, glycan biosynthesis emerges from the coordinated action of multiple enzymes acting sequentially within confined cellular compartments such as the Golgi apparatus. While genetic and glycomics approaches have identified the components and outputs of glycosylation pathways, the molecular mechanisms governing enzyme coordination, dynamics, and pathway control remain largely unresolved, mainly due to the transient and weak nature of the underlying protein-protein interactions.

Recent breakthroughs in deep learning-based protein structure prediction, particularly AlphaFold and large-scale sampling frameworks such as MassiveFold, have made it possible to model protein assemblies and interaction networks at an unprecedented level of detail. These advances create a timely opportunity to address long-standing questions regarding the structural organization of glycosylation pathways. Within this context, the project aims to provide molecular-level insight into how Golgi-resident CAZymes interact, form transient assemblies, and potentially organize into metabolons, thereby contributing to pathway fidelity and regulation. More broadly, the project fits into an emerging scientific effort to understand how enzyme cascades are structurally and dynamically organized in confined cellular environments, beyond glycosylation alone

The central objective of this project is to identify and structurally characterize protein-protein interactions between CAZymes acting sequentially in the O-glycosylation pathway. A secondary objective is to relate the predicted interaction interfaces to enzyme specificity, regulation, and known pathological variants affecting O-glycosylation. Phylogenetic input will be used to prioritize conserved enzyme pairs and to interpret interaction models in an evolutionary context, while experimental validation will be carried out by partners within the host institute.

The project will primarily rely on structural bioinformatics approaches developed in the host team. Target enzymes involved in O-glycan initiation and elongation will be selected based on biological relevance, availability of sequence data, and guidance from phylogenetic analyses. For each enzyme, high-confidence monomeric models will be generated using AlphaFold-based approaches, with particular attention to luminal catalytic domains and flexible stem regions characteristic of type II Golgi membrane proteins.

Assembly modeling will then be performed using MassiveFold to generate large ensembles of putative homo- and heteromeric complexes between consecutively acting enzymes. This approach allows extensive sampling of relative orientations and interfaces on GPU-accelerated architectures, capturing alternative interaction modes that may correspond to transient or condition-dependent assemblies. Complementary docking methods will be employed where appropriate to assess methodological robustness and to incorporate experimental or bioinformatics restraints.

The resulting ensembles of structural models will be analyzed using graph-based consensus scoring and network centrality measures to identify recurrent interaction interfaces and key amino acid residues contributing to complex stability. These residues will be mapped onto sequence alignments and, where available, interpreted in light of co-evolutionary signals. The integration of structural and evolutionary information will enable the formulation of testable hypotheses regarding interaction specificity and functional relevance

Le profil recherché

The candidate is required to be at ease with the Linux Operating System and be fluent in programming languages such as Python. A strong background in bioinformatics is required, with knowledge of protein structure and protein interaction networks. Knowledge of glycobiology, in particular the CAZymes localized in the Golgi is desired.

Postuler sur le site du recruteur

Parcourir plus d'offres d'emploi