Recrutement Service Public

Un·e Ingénieur Poc Cahiers Citoyens H/F - Service Public

  • Aubervilliers - 93
  • Fonctionnaire
  • Service Public
Publié le 9 mars 2026
Postuler sur le site du recruteur

Les missions du poste

Le 11 mars 2025, l'Assemblée Nationale a adopté une résolution relative à la publicisation des 20 000 « cahiers de doléances » ou « cahiers citoyens » collectés dans le cadre du Grand Débat National de 2019, à la suite du mouvement des Gilets jaunes. Ces cahiers, produits dans 17 000 mairies, regroupent plus de 225 000 contributions ; il s'agit d'un des plus vastes corpus d'expression citoyenne de notre époque.

La mission consiste, sous la direction du responsable de l'Huma-Num Lab, et en lien avec les équipes existantes, à sélectionner, intégrer, et mettre en oeuvre les outils logiciels constitutifs de cette chaîne, afin de :

- transcrire automatiquement par technologie de HTR, le contenu des cahiers citoyens, à partir des numérisations déjà existantes ;

- anonymiser automatiquement les cahiers (images et texte) ;

- mettre en oeuvre dans un système d'information les transcriptions à des fin de relecture et de validation les contenus ;

- participer avec les équipes de l'Humathèque Condorcet à leur mise en ligne.

Le POC sera réalisé sur une sous-partie du corpus (environ 5% des cahiers), afin de tester la capacité d'industrialiser le processus.·Concevoir, développer et maintenir des pipelines de données dans une logique de qualité et de fiabilité

·Organiser le traitement des données et participer à l'analyse des résultats

·Adapter et concevoir les outils numériques de traitement, d'analyse, d'annotation et anonymisation de ces données, en garantissant traçabilité et conformité aux normes éthiques et réglementaires

·Concevoir une démarche méthodologique et un protocole adaptés (charte de publication, règles d'usage, processus de validation, comité éthique léger, tests et choix des outils de traitement)

·Éventuellement, valoriser les activités menées par des communications dans des journées scientifiques et professionnelles ou des billets de blog

Le profil recherché

Formation & expérience

·Formation supérieure (Master, ingénieur ou équivalent) en traitement des données mixtes, HTR, humanités numériques, TAL.

·Expérience significative en traitement et analyse de données textuelles.

·Expérience en réalisation de projet ou réalisation de POC (une expérience minimum de 3 ans, idéalement dans des projets interdisciplinaires serait un atout).

Compétences clés

·Environnement Linux

·Programmation Python

·Très bonne connaissance des outils de chainage et pipeline de traitement des données (Apache Nifi ou Camel, ou équivalent par exemple)

·Très bonne connaissance des techniques de HTR sous Python (ou autre)

·Très bonne connaissance des technique d'anonymisation algorithmique (Faker, SpaCy:NER, Stanza, AnonyPy, AnonyPyx, méthodes mixes par LLM, etc.)

·Très bonne connaissance des techniques de traitement par IA

·Une connaissance des corpus SHS serait un plus

Qualités professionnelles

·Discrétion, sensibilité aux enjeux politiques et éthiques du projet

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi