Recrutement Doctorat.Gouv.Fr

Thèse Modélisation et Régulation des Risques Systémiques dans les Plateformes en Ligne à l'Aide de la Théorie des Graphes H/F - Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Doctorat.Gouv.Fr
Publié le 28 avril 2026
Postuler sur le site du recruteur

Les missions du poste

Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : ISP - Institut des Sciences sociales du Politique Direction de la thèse : Fabien TARISSAN Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-12T23:59:59 Il s'agit d'une thèse préparé dans le cadre d'un partenariat avec l'ARCOM (Autorité de régulation de la communication audiovisuelle et numérique) qui a notamment une mission de veille des plateformes en ligne, en particulier pour la mesure, l'analyse et la réduction des risques systémiques affectant les publics vulnérables.

Dans ce contexte, la thèse a pour objectif de contribuer à cet effort en développant une recherche en informatique, fondée sur la théorie des graphes, afin de répondre aux enjeux liés à ces risques. Elle se structure autour de trois axes principaux, qui seront abordés de manière séquentielle :

1. Collecte et classification de données :

Il s'agit de développer une méthodologie transparente, reproductible et conforme au RGPD, permettant la collecte d'échantillons représentatifs des graphes d'interaction entre utilisateurs et plateformes en ligne. Cette étape portera sur la collecte des types de graphes suivants :

- graphe d'interaction : un graphe orienté et pondéré représentant les interactions directes entre utilisateurs.
- graphe de consommation : un graphe biparti décrivant les contenus visionnés par les
utilisateurs
- graphe de création : un graphe biparti décrivant les contenus publiés par les utilisateurs
- graphe de recommandation: un graphe biparti décrivant les contenus recommandés aux utilisateurs.

En parallèle, un travail de classification du contenu sera réalisé en adaptant les techniques développées par l'ARCOM pour le classement de contenus audiovisuels, basées sur des transformers.

2. Analyse et quantification des risques systémiques :

Cet axe consiste à développer et estimer des indicateurs permettant de mesurer les risques systémiques, en prenant en compte des facteurs socio-démographiques des utilisateurs. Trois types d'indicateurs seront particulièrement étudiés :

- L'exposition des publics vulnérables à des contenus nuisibles
- La concentration de l'engagement et de l'audience des publics vulnérables sur certains créateurs de contenu
- La diversité des contenus recommandés

L'accent de cette recherche sera mis sur ce dernier indicateur. En exploitant les distributions de probabilité induites par des marches aléatoires dans des graphes, il est déjà possible de mesurer la diversité avec laquelle un utilisateur accède à un contenu. Cependant, ce cadre est limité aux graphes statiques. L'enjeu sera donc d'adapter cette approche au contexte des graphes temporels qui décrivent l'évolution des interactions des utilisateurs avec la plateforme, afin de proposer une mesure de la diversité temporelle.

3. Simulation et régulation du système de recommandation :

Il s'agit ici développer un système de recommandation similaire à ceux des plateformes étudiées, en s'appuyant sur les modèles de substitution basés sur les GNNs (Graph Neural Networks). Ceci permettra dans un second temps de poursuivre une recherche permettant de :

- Évaluer des influences problématiques : analyser les mécanismes qui conduisent certains contenus toxiques à être recommandés aux publics vulnérables

- Proposer des mesures d'atténuation : identifier des ajustements à apporter aux données utilisées par le modèle afin de réduire les risques systémiques, tout en préservant autant que possible la qualité des recommandations.

Cette thèse vise donc à apporter des solutions concrètes pour minimiser les risques systémiques associés aux plateformes en ligne, en mettant l'accent sur l'analyse et la régulation des systèmes de recommandation. Avec l'avènement des plateformes numériques, des enjeux éthiques et sociaux émergent. Les questions de transparence et de protection des utilisateurs, notamment les plus vulnérables, se retrouvent ainsi au coeur des débats politiques et du discours public. Les évolutions des marchés audiovisuel et numérique, portées par l'essor des services en streaming et des réseaux sociaux, ont transformé les habitudes de consommation et redistribué les revenus publicitaires. Cela a accentué la concurrence entre acteurs traditionnels, soumis à une régulation stricte, et plateformes numériques, longtemps moins encadrées aux niveaux nationaux et européen.

Si ces dernières ont élargi l'accès à l'information et au divertissement, elles ont aussi amplifié les risques de désinformation, de polarisation idéologique, d'exposition à des contenus préjudiciables et d'abus vis-à-vis des données personnelles des utilisateurs. Par ailleurs, l'intelligence artificielle, qui personnalise les expériences sur ces réseaux via des systèmes de recommandation propres à chaque plateforme en générant, synthétisant et analysant du contenu audiovisuel, soulève en elle-même des enjeux éthiques et réglementaires tels que les bulles de filtre ou encore la modération automatisée du contenu.

De nouvelles législations (DSA, IA Act) imposent aux plateformes une responsabilité accrue en exigeant un accès élargi à leurs données pour les chercheurs, les utilisateurs et les régulateurs. Cela favorise la mesure, l'analyse et, potentiellement, l'atténuation des risques systémiques, notamment pour les publics vulnérables. De plus, ces dispositions facilitent la supervision des algorithmes d'IA, qui exercent une influence significative sur les comportements et les opinions des utilisateurs.

Développée en partenariat avec l'ARCOM (Autorité de régulation de la communication audiovisuelle
et numérique), cette thèse a pour objectif de contribuer à cet effort en développant une recherche en informatique, fondée sur la théorie des graphes, afin de répondre aux enjeux liés à ces risques. La thèse poursuit 3 objectifs :
1. Collecte et classification des données : développer une méthodologie conforme au RGPD pour collecter des graphes d'interactions entre utilisateurs et plateformes en ligne, puis classer les contenus à l'aide de techniques adaptées.
2. Analyse et quantification des risques systémiques : concevoir des indicateurs pour mesurer les risques systémiques, notamment l'exposition des publics vulnérables à des contenus nuisibles, la concentration d'engagement sur certains créateurs et la diversité des contenus recommandés.
3. Simulation et régulation du système de recommandation : développer un système de recommandation similaire à ceux des plateformes étudiées, analyser les influences problématiques et proposer des mesures d'atténuation pour réduire les risques systémiques tout en maintenant la qualité des recommandations.

Le profil recherché

Le profil recherché est celui d'un étudiant en science des données avec des compétences spécifique en graphes et analyse de réseaux. Les compétences suivantes sont recherchées :

1. Théorie des graphes et analyse de réseaux : concepts fondamentaux de la théorie des graphes, dans une perspective de représentation et d'analyse des réseaux sociaux.

2. Compétences en programmation :

- Maîtrise des langages de programmation courants en science des données (Python, R, ...) pour l'analyse, le traitement et la visualisation des données.
- Familiarité avec des bibliothèques standard pour les développements liés aux graphes et aux réseaux.

3. Mécanismes de collecte de données en ligne

- Connaissance des techniques de collecte de données en ligne via des techniques comme le web scraping et l'utilisation de sock-puppets (comptes fictifs sur les réseaux sociaux), tout en respectant strictement les législations en vigueur telles que le RGPD.
- Capacité à concevoir des stratégies de collecte de données efficaces tout en assurant la représentativité des échantillons obtenus

4. Systèmes de recommandation

- Connaissance du fonctionnement général des systèmes de recommandation en ligne.
- Capacité à paramétrer des algorithmes d'apprentissage issus de la littérature scientifique.

5. Intérêt pour le contexte de la régulation :

- sensibilité aux enjeux éthiques et légaux, en particulier en matière de traitement de données personnelles et d'intelligence artificielle.
- connaissance des régulations actuelles en lien avec le sujet de thèse, telles que le DSA (Digital Services Act), le RGPD (Règlement Général sur la Protection des Données), et l'IA Act.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.