Thèse Gestion et Optimisation des Accès Concurrents au Stockage Objet dans les Environnements de Calcul Haute Performance H/F - Université de Bordeaux
- Bordeaux - 33
- CDD
- Université de Bordeaux
Les missions du poste
Établissement : Université de Bordeaux
École doctorale : Mathématiques et Informatique
Laboratoire de recherche : LaBRI - Laboratoire Bordelais de Recherche en Informatique
Direction de la thèse : Francieli ZANON BOITO ORCID 0000000211390724
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-04T23:59:59
Les infrastructures de calcul haute performance (HPC) reposent traditionnellement sur des systèmes de fichiers parallèles tels que Lustre ou GPFS afin de fournir des performances élevées pour les opérations d'entrée/sortie (E/S). Cependant, l'émergence du stockage objet, notamment via des interfaces compatibles S3, suscite un intérêt croissant dans les environnements scientifiques et industriels. Ces systèmes offrent des avantages en termes de scalabilité, de simplicité de gestion et d'intégration avec des infrastructures cloud ou hybrides.
L'objectif de cette thèse est d'étudier l'utilisation du stockage objet dans les environnements HPC et d'analyser les phénomènes d'interférence lors d'accès concurrents. Dans un premier temps, le travail consistera à caractériser les performances et les comportements d'interférence de différentes charges de travail HPC accédant simultanément à un stockage objet. Cette analyse permettra d'identifier les facteurs influençant les performances, tels que les schémas d'accès, la taille des objets ou le niveau de concurrence.
Dans un second temps, la thèse visera à proposer des techniques d'ordonnancement ou de gestion des accès permettant de limiter ces interférences et d'améliorer les performances globales du système. Enfin, les travaux chercheront à identifier les situations dans lesquelles l'utilisation d'un stockage objet peut constituer une alternative pertinente aux systèmes de fichiers parallèles traditionnels.
Les résultats attendus contribueront à une meilleure compréhension du rôle du stockage objet dans les infrastructures HPC modernes et permettront de proposer des méthodes d'optimisation adaptées aux charges de travail scientifiques.
Ce travail s'inscrit dans le contexte des collaborations internationales de l'équipe-projet TADaaM. Notamment, il s'appuie sur une collaboration déjà initiée avec l'entreprise DDN et le RIKEN (Japon).
Les principaux objectifs de la thèse sont :
1. caractériser les performances du stockage objet dans les environnements HPC ;
2. analyser les phénomènes d'interférence entre applications lors d'accès concurrents ;
3. identifier les facteurs influençant ces interférences ;
4. concevoir et évaluer des mécanismes d'ordonnancement ou de gestion des accès permettant de limiter ces interférences ;
5. déterminer les cas d'usage dans lesquels le stockage objet constitue une alternative pertinente aux systèmes de fichiers parallèles.
La méthodologie reposera sur plusieurs approches complémentaires :
1. étude de l'état de l'art sur les systèmes de stockage objet et leur utilisation en HPC ;
2. expérimentation sur des plateformes intégrant des solutions de stockage objet compatibles S3 ;
3. modélisation et analyse des phénomènes d'interférence ;
4. conception et évaluation de mécanismes d'ordonnancement ou de gestion des accès permettant d'améliorer les performances globales.
Les propositions seront validées par des expérimentations reproductibles sur des applications ou benchmarks représentatifs.
Le profil recherché
Le candidat ou la candidate devra être titulaire (ou en cours d'obtention) d'un diplôme de master ou d'ingénieur en informatique, avec une spécialisation en systèmes, calcul haute performance (HPC), systèmes distribués ou domaines connexes.
Des compétences solides en programmation sont attendues, notamment en C/C++ ou Python, ainsi qu'une bonne connaissance des systèmes Linux et des environnements de développement scientifique. Une familiarité avec les systèmes de stockage distribués, les systèmes de fichiers parallèles, ou l'analyse de performance constituera un atout important.
Le candidat devra également démontrer :
1. un intérêt pour la recherche en systèmes et infrastructures HPC ;
2. des compétences en analyse expérimentale et évaluation de performance ;
3. une capacité à travailler de manière autonome tout en collaborant avec une équipe de recherche ;
4. de bonnes compétences en communication scientifique en anglais, à l'écrit comme à l'oral.
Une expérience préalable avec les plateformes HPC, les charges de travail scientifiques, ou les technologies de stockage distribuées sera appréciée.