
Doctorant Thèse Cifre Tal H/F - Probayes
- Montbonnot-Saint-Martin - 38
- CDD
- Probayes
Les missions du poste
Vous êtes encadré(e) par un chercheur de l'équipe Getalp ou MRIM (Laboratoire d'Informatique de Grenoble), ainsi que par le Directeur Scientifique Traitement Automatique des Langues de Probayes.
Vous travaillez à l'extension des méthodes de RAG (retrieval-augmented generation) grâce aux données structurées.
Un système RAG permet l'interrogation en langage naturel d'une base de documents :
- Les documents sont découpés et indexés dans une base de données vectorielles
- La requête utilisateur est rapprochée des passages indexés, et les passages les plus proches sont remontés
- Un LLM (grand modèle de langue) génère la réponse à la question à partir des passages pertinents.
Plusieurs structures peuvent être extraites d'une base documentaire :
- La structure inter-documents
- La structure intra-document
- Des structures sémantiques, entre concepts présents dans les documents
Dans cette thèse, nous proposons d'exploiter ces structures pour améliorer :
- La compréhension et le nettoyage de la base documentaire
- La récupération des passages pertinents
- La génération de réponses pertinentes et leur justification
La recherche pourra s'appuyer sur :
- Des déploiement industriels de RAG existant chez Probayes, incluant des jeux de données, bancs d'essais, tests utilisateurs et moyens de calcul
- L'état de l'art de la recherche d'information et de l'exploitation de structure parmi les travaux récents de Getalp et MRIM.
La thèse se déroulera à Grenoble, en alternance dans les bureaux de Probayes (Montbonnot) et au sein du LIG (Campus de Saint Martin d'Hères).
Qualifications :
- Master, avec une formation en traitement automatique des langues
Compétences Souhaitées :
- Culture scientifique et pratique de l'apprentissage automatique et du traitement automatique des langues
- Programmation en Python
- Anglais et Français
Profil recherché :
- Vous êtes autonome, curieux(se), rigoureux(se), organisé(e)
- Vous aimez travailler en équipe
- Vous avez une bonne communication orale et écrite
Spin-off de l'Inria et du CNRS, Probayes est né de la volonté d'être le chainon manquant entre la recherche et l'industrie.
Créé en 2003, Probayes est un des leaders français dans le développement de solutions en Intelligence Artificielle. Nos Data Scientists, architectes et développeurs travaillent avec les plus grands groupes pour développer des solutions IA sur mesure, à l'état de l'art de la littérature scientifique, et à fort ROI.
Avec un savoir-faire central en Machine Learning, complété par des expertises scientifiques en optimisation, en fusion de capteurs, en traitement d'images et en Traitement Automatique des Langues /NLP et par des compétences de conception et de développement, Probayes développe, pour ses clients, des modèles comme moteur d'innovation, d'optimisation et d'aide à la décision.
Probayes adresse ses solutions auprès de divers secteurs : automobile, défense, énergie, finance, industrie, logistique, santé, et souhaite à la fois renforcer sa présence sur ces verticaux et développer des collaborations sur de nouveaux secteurs stratégiques. Probayes, qui a rejoint La Poste en mai 2016, est devenu le centre de compétence en Intelligence Artificielle du groupe. Probayes bénéficie également de cette collaboration dans le domaine des infrastructures « Big Data » et de la sécurité informatique.
Basée à Montbonnot (38), Probayes a ouvert en 2017 une antenne à Paris.