Stage de Data Science - Office National des Forêts H/F - Office National des Forêts
- Maisons-Alfort - 94
- Stage
- Office National des Forêts
Les missions du poste
Un métier au service de la forêt et du bois, y avez-vous pensé ?
Être ONF, c'est rejoindre les 8200 femmes et hommes qui se mobilisent pour :
- Valoriser la ressource en bois
- Agir pour l'environnement
- Accueillir le public en forêt
- Prévenir les risques naturels
- Proposer des prestations et services sur-mesure
Acteur majeur de la filière forêt-bois, l'Office national des forêts (ONF) rassemble plus de 9 000 professionnels. L'ONF gère près de 11 millions d'hectares de forêts publiques appartenant à l'État et aux collectivités territoriales, dont 4,6 en métropole. La gestion de ces forêts pour leur partie métropolitaine est assurée par 49 agences territoriales, réparties en 7 directions territoriales ou régionales (DT). La direction Forêt et adaptation au changement climatique (DFACC) a pour mission de piloter la gestion durable de ces forêts au niveau national. Au sein de la DFACC, le département Suivi des forêts et évaluation (SFE) rassemble les missions de pilotage métier de la donnée, le développement des outils de suivi, le calcul de nouvelles données et l'analyses, dans un objectif de mise à disposition d'informations complètes et de qualité pour une utilisation par l'ensemble des personnels ONF.Etablissement d'une base de données spatialisées de données « forêt » à l'échelle des unités de gestion pour la France métropolitaine, à partir de données multi source.
Objectif général :
Ce stage a pour objectif de contribuer à l'établissement d'une base de données spatialisées « enrichie » avec des variables descriptives des peuplements forestiers (composition en essence[1], essence majoritaire, catégorie de hauteur et de diamètre...), au grain des unités de gestion[2], à partir de données multi-source variées de par leur référentiel, leur grain spatial et leur exhaustivité : couche spatiale IGN, données spatiales territoriales, modèles de données dendrométriques spatialisés issus du Lidar et bases de données métiers alphanumériques. La priorité sera mise sur les variables liées à l'essence.
La base résultante devra répondre aux besoins et utilisations nationales et locales : le travail d'analyse sera donc précédé d'un inventaire des cas d'usages d'une telle base « UG enrichie » auprès des collègues en territoire. La constitution de référentiels répondant à ces divers besoins sera également nécessaire.
Les forêts et la récolte de données sources évoluant dans le temps, un mode opératoire et des scripts de calcul feront partie des livrables pour pouvoir actualiser les données selon une fréquence annuelle ou semestrielle.
[1] Essence : espèce arborée
[2] Unité de gestion : surface de base d'application de la sylviculture, de 1 à 25 hectares
Contexte :
Parmi les données indispensables à la gestion au quotidien des forêts, localement mais aussi au niveau national, l'essence du peuplement (composition et essence principale) est une des informations primordiales. A ce jour, cette donnée est disponible, mais dans des bases locales au niveau DT - la base de données patrimoniale ou BDPAT - et complétée selon des référentiels territoriaux et des pratiques locales. De plus, cette donnée n'est actualisée que lors des rédactions de documents de gestion tous les 20 ans. Enfin, le grain spatial de ces bases est celui des « Unités de description », une échelle infra aux « unités de gestion » utilisées pour le pilotage de la sylviculture et de la gestion forestière. Or, l'intégration de cette donnée dans les outils numériques mis à disposition des collègues de terrain et le suivi national de la gestion nécessite une base nationale harmonisée, à jour et au même grain que les actes de sylviculture. Par ailleurs, le déploiement de nouveaux outils tel que la télédétection et le Lidar apporte de nouvelles informations spatialisées et homogènes. Enfin, de nombreuses informations sur l'essence sont saisies au quotidien et disponibles dans les bases métiers de l'ONF : programme de coupes, suivi du renouvellement des peuplements... Cette problématique est également présente pour les autres variables dendrométriques : hauteur de peuplement, calibre, pourcentage de sol nu...
La décision a donc été prise de réaliser une base nationale des « unités de gestion (UG) enrichies » de données dendrométriques à partir de données multi source. Cette base devra être actualisable une à deux fois par an pour modifier les données « peuplement » le cas échéant et pouvoir intégrer au fur et à mesure les données nouvellement acquises dans une démarche d'amélioration continue.
L'objectif du stage est d'en réaliser la 1e étape en identifiant, pour chaque variable, les sources de données disponibles et un plan de travail hiérarchisé pour aller vers leur intégration, d'appliquer ce plan a minima pour la détermination de l'essence principale et la composition pour chaque unité de gestion, et d'en établir le mode opératoire (avec scripts) pour les actualisations futures.
Contenu du stage :
Le stage s'organisera selon trois axes complémentaires qui seront à préciser ou à ajuster par le/la stagiaire :
I) Enquête auprès des gestionnaires forestiers (contacts privilégiés : référent BDPAT en DT) pour déterminer leurs cas d'usage d'une base de données UG-enrichie et savoir comment aborder leurs données. Familiarisation avec les référentiels. Etablissement de référentiels (essence, catégorie de hauteur...) pour la base nationale, proche de ces cas d'usage et des référentiels de l'inventaire forestier de l'IGN.
II) Analyse : exploration des bases de données existantes (data mining, data visualisation), comparaison des bases (géomatique), tests de modélisation (analyses statistiques, forêts aléatoires, Machine learning...), phase de validation (photo-interprétation, échanges avec le terrain). Pour chaque phase, un rapport d'analyse sera à rédiger.
III) Calcul de la base finale pour les données « essence »et pérennisation du mode opératoire : codage du process final dans une version documentée et réutilisable en vue des mises à jour. Le process devra fournir des indicateurs de qualité pour les nouveaux calculs. La présentation de la base sera à assurer par le stagiaire lui-même aux référents DT.
Les livrables attendus sont : les rapports d'enquête et d'analyses, regroupés dans un mémoire de stage, les référentiels, une 1e version de la base de données « essence », les codes et le mode opératoire en vue d'une mise à jour, un diaporama de présentation de la base et de son utilisation.
Le profil recherché
Profil recherché : Autres
Master 2 ou fin d'étude ingénieur - analyses de données
Compétences nécessaires :
- Pratique du logiciel R indispensable
- Connaissances en statistiques et en analyses de données : data mining, data visualisation...
- Notion de base en machine learning et intelligence artificielle
- Pratique d'au moins un logiciel SIG (ArcGIS, QGIS)
- Capacités de conceptualisation de démarches d'analyses de données et de la conception de scripts de traitement
- Autonomie, organisation et rigueur. Ecoute, aisance relationnelle.
Logistique et aspects pratiques : stage de 6 mois, démarrage entre janvier et mars 2026.
Organisme d'accueil : Office National des Forêts, Département Suivi des forêts et évaluation, 2 bis Av. du Général Leclerc, 94700 Maisons-Alfort
Ordinateur fourni, travail en bureau partagé, déplacements possibles en territoire métropolitain pour rencontrer les acteurs, déplacements occasionnels en forêt.
Gratification : 15% du plafond horaire de la sécurité sociale + remboursement des frais de déplacements nécessaires à l'étude, sur justificatif, selon règles en vigueur pour les personnels de l'ONF
Contact et maître de stage :
Stage encadré par Quentin GIRARD, chargé de mission « Analyses de données » (DFACC / Département SFE).
Ce stage vous intéresse ?
Envoyer votre candidature par mail à ****@****.** : CV + lettre de motivation + description du cursus de formation suivi