Vous n'avez pas de compte ? Inscrivez-vous
logo jobintree

chargé de référentiel - sourcing de données sémantiques (h/f) CDI

chargé de référentiel - sourcing de données sémantiques (h/f)

Hellowork 

Rennes (35)

Publiée le 21/12/2023

CDI

Référence:91154242

Description du poste :

HelloWork Group est le premier acteur digital français de l'emploi, du recrutement et de la formation. A travers ses différentes solutions, le groupe accompagne les actifs tout au long de leur vie professionnelle, les entreprises, cabinets de recrutement, ETT sur leurs enjeux RH et recrutement et les centres de formation / écoles sur la valorisation de leurs offres de formation.

Fort de 500 collaborateurs, 94 millions d'Euros de commandes en 2022, les services du groupe HelloWork sont utilisés par 40 000 professionnels et 4 millions d'utilisateurs* chaque mois. Ils permettent plus de 4 400 recrutements et 300 entrées en formations chaque jour. En 2022, le groupe a été labellisé HappyIndex®AtWork dans les catégories Tech®AtWork, HappyAtWork et AgileAtWork®.
Vous avez le profil idéal si :
- Vous avez une formation et/ou une expérience solide dans le domaine de la représentation des connaissances / du management de l'information numérique, ou plus généralement en sciences de l'information ou en documentation ;
- Vous maitrisez tous les enjeux du sourcing de l'information et des jeux de données (sources, process d'intégration, mise à jour) ;
- Vous êtes très à l'aise dans la manipulation de données textuelles en grandes quantité (manipulation de CSV, tri et filtre, etc.) ;
- Vous avez des connaissances et des expériences en graphes de données / ontologies / thésaurus / taxonomies, bref, des référentiels ;
- Vous êtes curieux, rigoureux, pédagogue, force de proposition et bon communicant.

Les petits + :
- Vous maîtrisez les standards du web sémantique (RDF, SKOS, OWL, etc.) et du langage de requête SPARQL ;
- Vous avez des notions de développement (Java, Python ou autre), data science ou TAL ;
- Vous possédez une connaissance du droit de l'information.

Technos et outils utilisés :
- Bases de graphes : triple store, Vocbench, RDF4J et Neo4J ;
- Standards du web sémantique : RDF, OWL, SKOS ;
- Langages de requêtages : SPARQL et Cypher ;
- Git.
Notre équipe Référentiel a pour mission la représentation des connaissances dans le domaine de l'emploi, des métiers, et de la formation.

Nous constituons des référentiels : il s'agit de définir des concepts et les liens sémantiques qui existent entre eux. Ces connaissances sont organisées au sein de graphes sémantiques, qui vont de la simple liste contrôlée au thésaurus des métiers.

Ces ressources, combinées aux outils de l'équipe data science, servent par exemple à l'analyse sémantique des offres et des CV, l'objectif d'HelloWork étant de mettre en relation des candidats et des recruteurs ou centres de formation.

Dans ce contexte, en tant qu'Ingénieur sourcing de données sémantiques, vous interviendrez du sourcing des données à la modélisation sémantique.

Concrètement, vos missions seront les suivantes :
- Analyser les besoins ;
- Identifier et évaluer les sources et producteurs de données ;
- Préparer les données (jeux de données externes, ou constitution en interne) : manipuler, nettoyer, formater ;
- Etablir une modélisation et importer les données ;
- Automatiser la mise à jour des référentiels ;
- Requêter les données ;
- Participer activement à la veille et à la documentation ;

La Team référentiel, composée de 4 personnes, vous accompagnera pour vous donner les clefs sur l'ensemble de ces aspects.

Postulez à cette offre maintenant

Postuler