Alternance - Optimisation de l'Accès aux Données Scientifiques Marines » Formats Arco Standards Ogc H/F - Ifremer
- Plouzané - 29
- Alternance
- Ifremer
Les missions du poste
Rejoignez l'Ifremer pour un océan mieux compris, mieux protégé qui demeure un allié du bien-vivre sur la planète
Des abysses à la surface, de la côte au large, l'Ifremer est l'institut de recherche français entièrement dédié à l'Océan. Ses équipes mènent des recherches, innovent et produisent des expertises pour protéger l'océan, exploiter ses ressources de manière responsable et partager les données marines.
L'Ifremer apporte son expertise scientifique pour éclairer les politiques publiques et élabore des solutions puisées dans l'océan pour répondre aux enjeux de la transition écologique. Opérateur de la Flotte océanographique française avec sa filiale d'armement Genavir, l'Ifremer imagine, conçoit et déploie des moyens technologiques de pointe pour percer les mystères de l'océan.
Rejoignez nos équipes, composées de 1500 scientifiques et métiers supports à la recherche, et présentes sur tout le littoral métropolitain et en Outre-mer.
www.ifremer.fr
Date de clôture de réception de candidatures : 29/05/2026
Le département IRSI (Infrastructures de Recherche et Systèmes d'Information) de l'Ifremer administre et fait évoluer les systèmes d'information scientifiques de l'institut couvrant un large spectre de domaines.
Dans ce cadre, l'Ifremer produit, collecte et exploite des volumes importants de données scientifiques hétérogènes, notamment :
- Des données d'observation in situ (capteurs, campagnes en mer, bouées, instruments embarqués) ;
- Des données de télédétection issues de l'observation satellitaire ;
- Des données issues de modèles numériques (simulation, prévision, réanalyses).
Dans un contexte de développement de la science ouverte, de valorisation des données marines et d'émergence des jumeaux numériques de l'océan, l'Ifremer met en place des solutions visant à faciliter l'accès, l'interopérabilité et la réutilisation des données environnementales.
Un besoin fort émerge pour :
Accéder rapidement aux fichiers de données d'intérêts ;
- Accéder à des sous-ensembles de données de manière efficace, notamment via des mécanismes de streaming, de filtrage et de transformation à la volée, afin d'éviter les transferts massifs inutiles ;
- Permettre l'accès direct depuis le supercalculateur Datarmor, en support de traitements parallèles et distribués, tout en garantissant la performance et la scalabilité des flux de données ;
- Simplifier l'accès aux données via des catalogues techniques ou des applications de plus haut niveau (ex : exploration et visualisation des données) ;
- Garantir un accès interopérable pour les partenaires et utilisateurs externes à l'Ifremer, en s'appuyant sur des standards ouverts.
Dans ce cadre, les formats ARCO (Analysis-Ready, Cloud-Optimised) ainsi que les standards OGC (Open Geospatial Consortium) constituent un socle clé pour garantir un accès efficient, performant et interopérable aux données scientifiques marines.
Quelles seront vos missions ?
Vous participerez, en lien avec les équipes scientifiques, aux activités suivantes :
1. Analyse des besoins et état de l'art
- Analyser les cas d'usage d'accès aux données (calcul sur Datarmor, visualisation, API, partenaires externes)
- Identifier les verrous actuels : volumétrie, formats, latence, accès partiel aux données
- Étudier les formats ARCO (ex : [geo]Zarr, [geo]Parquet, NetCDF optimisé) et leur pertinence selon les usages
- Analyser les standards de l'Open Geospatial Consortium pour l'exposition interopérable des données
2. Optimisation des formats et des accès aux données
- Proposer et mettre en oeuvre des stratégies de stockage et d'organisation des données (chunking, partitionnement, indexation spatio-temporelle) afin de permettre :
- Un accès partiel efficace (subsetting spatial, temporel, thématique)
- Une lecture performante en environnement distribué (Datarmor, calcul parallèle)
- Étudier et expérimenter la conversion vers des formats ARCO adaptés aux différents usages
- Tester des mécanismes de streaming et d'accès distant (HTTP range requests, stockage objet type S3)
- Évaluer les performances (temps d'accès, volumétrie transférée, scalabilité)
3. Mise en place de services d'accès interopérables
- Déployer ou prototyper des services basés sur les standards OGC (ex : OGC API - Environmental Data Retrieval, OpenEO)
- Faciliter l'intégration avec les outils de calcul (ex : notebooks via Datarmor) et les applications web (ex : geoviewer)
4. Simplification de l'accès aux données
- Participer à la mise en place de catalogues techniques facilitant la découverte et l'accès aux jeux de données (ex : STAC, intake)
- Contribuer à la mise en place d'une couche d'abstraction et d'harmonisation, permettant de simplifier l'accès et la comparaison de données hétérogènes (in situ, satellite, modèles)
- Participer au développement de services de prétraitement des données (ex : colocalisation, agrégation, extraction de sous-domaines)
5. Documentation et valorisation
- Documenter les choix techniques, architectures et bonnes pratiques
- Produire des guides d'usage à destination des utilisateurs (scientifiques, ingénieurs, partenaires)
- Présenter les résultats sous forme de rapports, démonstrateurs ou présentations
Le profil recherché
Qui êtes-vous ?
Vous recherchez un contrat d'apprentissage ou de professionnalisation pour l'obtention d'un Bac +5 (école d'ingénieur ou master 2 (alternance sur plusieurs années acceptée)).
Techniques utilisées :
- Formats ARCO : NetCDF, parquet, Zarr, ...
- Standards OGC
- Calcul et environnement de traitements
- Développement python : xarray, pandas, dask, intake, ...
- CI/CD gitlab
Vous avez une bonne aptitude à travailler en équipe.
Vous avez les compétences, connaissances et expériences suivantes :
- Techniques utilisées :
- Web sémantique (RDF, OWL, SPARQL)
- Modélisation de données et/ou graphes de connaissances
- IA générative et les modèles de langage (LLM)
- Développement en python
- Aptitude à travailler en équipe
Pourquoi nous rejoindre ?
- Travailler sur des problématiques scientifiques et numériques à fort impact
- Manipuler des données riches, complexes et interdisciplinaires
- Explorer des technologies émergentes et structurantes
- Évoluer au sein d'un environnement collaboratif entre scientifiques, ingénieurs et experts SI