Recrutement Doctorat.Gouv.Fr

Thèse Systèmes Décentralisés pour la Représentation et l'Interrogation de Données Multidimensionnelles H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 18 mai 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Données Algorithmes pour une ville intelligente et durable Direction de la thèse : Iulian SANDU POPA ORCID 0000000299374242 Début de la thèse : 2027-01-15 Date limite de candidature : 2026-07-31T23:59:59 La numérisation généralisée des activités humaines a entraîné la production continue de données à grande échelle, hétérogènes et riches en contexte, permettant ainsi de représenter les comportements individuels, les interactions ou les schémas de mobilité. Ces données peuvent intégrer des attributs sémantiques, sociaux et contextuels et sont généralement multidimensionnelles. Ces écosystèmes de données ouvrent d'importantes perspectives pour l'analyse avancée, les services adaptatifs et les systèmes d'aide à la décision. Les applications potentielles comprennent l'analyse comportementale, l'optimisation des infrastructures, les systèmes de recommandation et les services contextuels. Cependant, cela nécessite des systèmes orientés données adaptés pour gérer ces données.

La plupart des approches existantes s'appuient sur des infrastructures centralisées ou partiellement centralisées pour le stockage, la gestion et le traitement des requêtes. En revanche, ce travail explore une architecture entièrement décentralisée dans laquelle la propriété et le stockage des données restent répartis entre des participants autonomes. Dans un tel environnement, chaque participant apporte des descriptions structurées des caractéristiques de ses données et des informations contextuelles, formant ainsi un espace de connaissances distribué pouvant faire l'objet de requêtes et d'analyses collaboratives.

L'objectif principal est de concevoir des mécanismes évolutifs et fiables pour l'organisation, l'indexation et la recherche de données multidimensionnelles distribuées dans des environnements décentralisés. Cela nécessite de relever plusieurs défis fondamentaux, notamment la représentation efficace des données distribuées, les stratégies d'indexation et de maintenance adaptatives, le traitement évolutif des requêtes, l'équilibrage de charge, la robustesse face à une participation dynamique et la résilience face à des pannes partielles du système. Plus largement, ces travaux explorent les compromis entre efficacité, cohérence, évolutivité et fiabilité dans les systèmes de gestion de données décentralisés à grande échelle.
La numérisation généralisée des activités humaines a entraîné la production continue de données à grande échelle, hétérogènes et riches en contexte, permettant ainsi de représenter les comportements individuels, les interactions ou les schémas de mobilité. Ces données peuvent intégrer des attributs sémantiques, sociaux et contextuels et sont généralement multidimensionnelles. Ces écosystèmes de données ouvrent d'importantes perspectives pour l'analyse avancée, les services adaptatifs et les systèmes d'aide à la décision. Les applications potentielles comprennent l'analyse comportementale, l'optimisation des infrastructures, les systèmes de recommandation et les services contextuels. Cependant, cela nécessite des systèmes orientés données adaptés pour gérer ces données.

La plupart des approches existantes s'appuient sur des infrastructures centralisées ou partiellement centralisées pour le stockage, la gestion et le traitement des requêtes. En revanche, ce travail explore une architecture entièrement décentralisée dans laquelle la propriété et le stockage des données restent répartis entre des participants autonomes. Dans un tel environnement, chaque participant apporte des descriptions structurées des caractéristiques de ses données et des informations contextuelles, formant ainsi un espace de connaissances distribué pouvant faire l'objet de requêtes et d'analyses collaboratives.
L'objectif principal est de concevoir des mécanismes évolutifs et fiables pour l'organisation, l'indexation et la recherche de données multidimensionnelles distribuées dans des environnements décentralisés. Cela nécessite de relever plusieurs défis fondamentaux, notamment la représentation efficace des données distribuées, les stratégies d'indexation et de maintenance adaptatives, le traitement évolutif des requêtes, l'équilibrage de charge, la robustesse face à une participation dynamique et la résilience face à des pannes partielles du système. Plus largement, ces travaux explorent les compromis entre efficacité, cohérence, évolutivité et fiabilité dans les systèmes de gestion de données décentralisés à grande échelle.

Le profil recherché

Connaissances approfondies des systèmes de gestion de données (Master type Data Science ou équivalent) et/ou systèmes distribués.

Fortes compétences en programmation.

Bonnes compétences en communication en anglais.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi