Recrutement Ministère de l'enseignement supérieur et de la recherche

Ingénieur d'Études en Production Traitement Analyse de Données et Enquêtes Réf. Erc-L-2 H/F - Ministère de l'enseignement supérieur et de la recherche

  • Paris 5e - 75
  • CDD
  • Ministère de l'enseignement supérieur et de la recherche
Publié le 1 Avril 2025
Postuler sur le site du recruteur

Les missions du poste

Fonctions : Ingénieur-e d'études en production, traitement, analyse de données et enquêtes

Emploi-type : D2A41

Catégorie : A

Corps : IGE

BAP : D

CDD de 12 mois, à 50%, renouvelable

Mission : Numérisation de corpus grammaticaux (commentaires).

Activités principales :

Sous la direction du responsable du projet, l'IGE réalisera un texte numérique des commentaires et lexiques constituant les textes sources des fragments grammaticaux, suivant le format standard TEI-XML. Le texte des manuels normatifs et des ouvrages sur la métrique, publiés à l'origine par Keil entre 1855 et 1880 (4 453 pages) et mis à jour avec des éditions plus modernes lorsqu'elles sont disponibles, sera fourni par le corpus en ligne CGL (Garcea & Lomanto éd. 2022), qui suit déjà ce standard, et sera combiné avec les autres textes sources. Afin d'éviter le risque de créer un corpus excessivement volumineux par l'accumulation de tous les matériaux conservés, LiTeRA ne cherchera pas l'exhaustivité. Il se concentrera plutôt sur l'analyse et l'exploitation des oeuvres principales de deux sous-genres critiques qui servent de sources aux oeuvres fragmentaires : (1) les lexiques ; (2) les commentaires : Servius et les autres scholies sur Virgile (éd. Thilo & Hagen, 2 200 pages, XML partiellement disponible dans la Perseus Digital Library sous une licence CC BY-SA 3.0 US) ; Donatus (éd. Wessner, 1 091 pages).

L'IGE s'occupera de Donat et de Servius.

La constitution du corpus sera considérablement accélérée par l'utilisation de la reconnaissance optique de caractères (OCR), avec l'aide de logiciels open-source tels qu'eScriptorium. Une post-correction automatique sera effectuée à l'aide de bibliothèques Python et de systèmes basés sur l'apprentissage automatique. À ce stade, tant le corpus OCR que celui provenant des fichiers XML nécessiteront une relecture et un processus de « pré-édition » non automatisé, c'est-à-dire une normalisation formelle qui n'interférera pas avec les choix textuels des éditions critiques.

Autres activités :

En tant que membre de l'équipe, l'IGE aura l'opportunité de présenter les résultats de ses recherches lors de plusieurs conférences internationales, notamment la Conference on the History of the Language Sciences (ICHoLS) qui a lieu tous les trois ans, le International Colloquium on Latin Linguistics (ICLL), qui a lieu tous les deux ans, le Colloquium Latin vulgaire - latin tardif (LVLT), le Colloque annuel de la Henry Sweet Society for the History of Linguistic Ideas, ainsi que le Latin Grammarians Forum. Ces communications seront publiées soit dans les actes des conférences, soit dans d'autres revues
scientifiques de renom, conformément aux politiques de libre accès de l'ERC

Le profil recherché

Connaissances transversales requises :
- Organisation et fonctionnement de la recherche et de l'enseignement supérieur en France et à l'étranger
- Organisation et fonctionnement de Sorbonne Université
- Connaissance des langues anciennes (latin, grec) et de leur exploitation numérique
- Connaissance des standards patrimoniaux (XML, TEI...)

Savoir-faire :
- Capacité à proposer et à élaborer des tâches en lien avec les projets en cours
- Capacité à définir et à implémenter des solutions informatiques agiles et sur mesure
- Capacité à interagir avec des interlocuteurs de différentes disciplines

Afficher la suite
Savoir-être :
- Bon relationnel et sens du travail en équipe
- Disponibilité et réactivité
- Organisation et rigueur
- Sens du service public

Critères de sélection :
- Diplôme souhaité de doctorat en études classiques, linguistique des langues anciennes, langues et littératures de l'Antiquité gréco-latine, philosophie antique
- Compétences démontrées en humanités numériques
- Un intérêt pour l'histoire de la pensée linguistique antique
- D'excellentes capacités de communication
- Une bonne maîtrise du français et de l'anglais
- Un grand sens de l'organisation.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.