
Ingénieur - Ingénieure Data Scientist H/F - Lingua Custodia
- Paris 8e - 75
- CDI
- Lingua Custodia
Les missions du poste
Présentation de l'entreprise :
Lingua Custodia a été créée en 2011 par deux professionnels du secteur financier afin de répondre à une problématique qu'ils avaient identifiée dans le secteur financier : la nécessité de disposer de moteurs de traduction automatique sécurisés et dédiés au langage financier.
Aujourd'hui, l'entreprise déploie ses solutions technologiques auprès d'une cinquantaine d'institution financières et directions financières de grands groupes pour la traduction automatique et l'extraction de données en collant à l'état de l'art en matière de RAG (Retrieval Augmented Generation). Lingua Custodia possède une solide expertise dans le domaine des technologies du langage et publie 4 à 5 articles de recherche par an, la société publie également des set de données et des modèles d'IA en open source pour contribuer aux progrès de l'état de l'art dans le domaine de l'IA générative.
L'entreprise collabore directement avec les départements innovation et intelligence artificielle de certains de ses clients dans le cadre de projets de recherche conjoints liés à l'IA générative.
Lingua Custodia est l'une des rares entreprises sur le marché français à posséder l'expertise sur l'ensemble de la chaîne de valeur de l'IA générative :
- Elle développe ses propres LLMs (grands modèles de langage) de fondation,
- Elle finetune des modèles tiers pour des tâches spécifiques,
- Elle a conçu des plateformes utilisateurs aujourd'hui accessibles par plus de 10 000 professionnels de la finance pour les faire bénéficier de ses technologies.
La société est largement reconnue pour sa capacité d'innovation et a été régulièrement récompensée. L'équipe de Lingua Custodia est composée d'un mélange diversifié de profils, fortement compétents dans leur domaine d'expertise, tous engagés dans notre aventure entrepreneuriale. Mais ce que nous apprécions le plus chez Lingua Custodia, ce sont les compétences relationnelles : L'esprit d'équipe, la confiance, l'ouverture d'esprit, l'enthousiasme, la liberté d'essayer de nouvelles idées ou pratiques.
Mission :
Nous recherchons un Data Scientist pour développer et déployer des solutions d'IA générative spécialisées pour le langage et les tâches de l'industrie financière. Vous serez responsable de la conception, de l'implémentation et de l'optimisation de modèles d'IA générative et de grands modèles de Langue (LLM) pour répondre à des problématiques complexes auxquelles sont confrontés les clients de la société. Un des aspects clés de la mission consiste en l'identification et le traitement des corpus de données nécessaires pour l'entrainement et l'évaluation des modèles.
La mission impliquera la participation à des projets de recherche susceptibles de mener à la publication de travaux dans le cadre de conférences scientifiques internationales
Profil recherché :
- Formation : Master en Machine Learning / Data Science ou diplôme d'ingénieur avec spécialisation en intelligence artificielle et traitement de la donnée.
- Expérience : 1 ère expérience professionnelle ou stage long au sein d'une institution financière en tant que Data Scientist, avec une expertise confirmée dans le développement et le déploiement de modèles d'IA.
- Technologies maîtrisées : Compétences techniques avancées en Python, PyTorch, SQL, AWS (S3, SageMaker, Lambda), ainsi qu'une connaissance des méthodologies et framework de machine learning et de deep learning.
- Langues : Maîtrise du français et de l'anglais, tant à l'écrit qu'à l'oral.
Le profil recherché
Experience : 12 Mois
Compétences : Mastère spécialisé expert en sciences des données, Modélisation statistique, Programmation en Python, Utilisation de logiciels statistiques, Adapter les outils de traitement statistique de données, Conduire des travaux d'études et de recherche, Définir et faire évoluer des procédés de traitement de l'information, Déterminer l'opportunité de l'intégration d'outils IA/Data Science dans le modèle d'affaires, Exploiter des solutions de Data Science ou d'Intelligence Artificielle, Réaliser une analyse ou modélisation statistique de données
Langues : Anglais souhaité, Français souhaité
Qualification : Cadre
Secteur d'activité : Traduction et interprétation