Recrutement Soc Etude Systemes Informations

Data Scientist H/F - Soc Etude Systemes Informations

  • Boulogne-Billancourt - 92
  • CDI
  • Soc Etude Systemes Informations
Publié le 1 juillet 2025
Postuler sur le site du recruteur

Les missions du poste

Au sein du pôle R&D IA et sous la responsabilité du Directeur Technique, vous participerez à la conception, au développement et au déploiement de solutions d'intelligence artificielle appliquées à la gestion électronique des documents et courriers (GED / GEC) :
- Développer des outils de traitement automatique de documents : OCR / OMR, segmentation, détection de doublons, Reconnaissance de types de documents (RAD) et Extraction automatique d'informations clés (LAD)
- Mettre en oeuvre des modèles de Question Answering et de RAG (Retrieval-Augmented Generation) pour interroger les bases documentaires
- Concevoir des assistants IA pour la rédaction automatique, la correction grammaticale ou la reformulation
- Participer à l'entraînement et à l'évaluation de modèles de machine learning / deep learning (fine-tuning sur corpus internes)
- Travailler sur des solutions d'indexation intelligente, avec auto-apprentissage basé sur les corrections manuelles
- Contribuer à l'amélioration continue des performances des algorithmes (précision, rappel, temps de traitement)
- Documenter les solutions développées et travailler en collaboration avec les équipes produit, fonctionnelle et technique

De formation Bac +5 (école d'ingénieur ou université) en data science, intelligence artificielle ou informatique, vous avez une première expérience (stage ou alternance) dans le développement de solutions IA appliquées à la gestion documentaire ou au traitement de texte.

Vous maîtrisez Python et ses bibliothèques de data science (Pandas, scikit-learn), ainsi que des frameworks de deep learning tels que PyTorch ou TensorFlow.
Une connaissance des modèles de langage (LLMs - LLaMA, GPT, Mistral...), du question answering, et des architectures de RAG (Retrieval-Augmented Generation) est fortement appréciée.
Vous avez déjà mis en oeuvre des traitements d'OCR, d'extraction automatique de données (LAD), de reconnaissance de documents (RAD), ou de classification supervisée sur des documents semi-structurés (PDF, courriers, images...).

Vous êtes capable de concevoir des pipelines IA de bout-en-bout : ingestion, prétraitement, inférence, intégration dans des API ou systèmes GED.
Curieux(se), rigoureux(se) et autonome, vous appréciez les environnements techniques complexes, l'innovation, et le travail en équipe.
La connaissance de LangChain, Haystack, Elasticsearch ou d'outils d'annotation et de fine-tuning est un plus.

La société Sesin est éditeur et intégrateur de logiciels de GEIDE, de gestion de contenus et de dématérialisation des documents et des processus. Sesin développe et commercialise des applications basées sur son Framework, Poséidon, qui répondent à l'ensemble des enjeux technologiques, fonctionnels et réglementaires de la dématérialisation et de la valorisation du patrimoine documentaire. Pionnière de la gestion de documents, Sesin accompagne les organisations, les institutions publiques et les entreprises dans leurs projets de digitalisation. Les solutions logicielles de Sesin sont le fruit d une longue expérience mais également de notre volonté de renouvellement et de notre capacité d'adaptation. Grâce à ses outils de travail collaboratif, ses solutions mobiles et ses applications de gestion et de partage des informations, Sesin participe à la digitalisation des entreprises et de la société. Créée il y a près de 40 ans, Sesin, c'est aujourd'hui une vingtaine de collaborateurs au service d une clientèle de grands comptes et d'administrations. La société est implantée sur 2 sites en France, mais également au Brésil et en Côte d Ivoire.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi