Informatique scientifique, gestion des données de recherche

Mots-clés :
systèmes d'information, informatique scientifique, gestion de données, valorisation, science ouverte, FAIR

Ayant intégré l’IRD en 2009, j’occupe un poste d’ingénieur données et génie logiciel (emploi type E2B44 - Administrateur-trice de bases de données / Intégrateur d'applications) au sein de l'UMR ENTROPIE, une équipe de Recherche en Écologie marine tropicale implantée en Nouvelle-Calédonie. Depuis 2015, je coordonne également l’équipe transversale d’appui à la recherche qui regroupe des ingénieurs et techniciens de l’UMR.

Gestion des données et observatoires

Depuis mon arrivée au sein de l’IRD, je travaille sur des outils de gestion et de valorisation des données issues de la recherche et plus particulièrement dans le domaine de l’écologie marine, avec notamment la mise en œuvre complète du système d’information Lagplon dont je suis aujourd’hui la responsable de projet. Créé par le Service plongée de l'ORSTOM de Nouméa, Lagplon est une base de donnée de la biodiversité marine des récifs et lagon de Nouvelle-Calédonie et d'autres régions de l'Indo Pacifique. Les données de collection et d'observations sont issues des inventaires de la faune et de la flore benthique des eaux côtières. Lagplon contribue à l'actualisation des référentiels taxonomiques de l'outre-mer français et alimente, dans le cadre de l'initiative IFRECOR et la Stratégie nationale pour la biodiversité, les portails nationaux (INPN et PNDB) et internationaux (GBIF).

Depuis 2011, je suis responsable du système d’information de l’observatoire ReefTEMPS, pour lequel j’ai entièrement conçu et mis en œuvre l’architecture logicielle, en collaboration avec le chef de projet, Régis Hocdé de l’UMR MARBEC. ReefTEMPS est un réseau de capteurs physico-chimiques sur le domaine côtier d'une vingtaine de territoires et états insulaires à l'échelle du Pacifique sud, pour le suivi à long terme du changement climatique et de ses effets sur l'état des récifs coralliens et de leurs ressources. L’observatoire ReefTEMPS a été intégré à l’Infrastructure de Recherche « Infrastructure de recherche littorale et côtière » ILICO et depuis 2020 est labellisé Service National d’Observation (SNO), avec une mention spéciale pour son système d’information et la valorisation de ces données qui reposent sur une architecture FAIR (Findable, Accessible, Interoperable, Reusable) répondant ainsi aux critères définis dans le cadre du plan national pour la Science Ouverte du MESRI.

Science ouverte

Je travaille à la mise en pratique des principes FAIR, à la mise en œuvre de la réutilisabilité des données avec la définition de Plan de Gestion de Données (PGD) et plus généralement sur le domaine de l’Open Science que je mets en œuvre dans les projets de recherche de l’UMR. Dans ce périmètre,  je suis responsable du workpackage « bases de données » de l’ANR SEAMOUNTS qui étudie la biodiversité en poissons associée aux monts-sous-marins de Nouvelle-Calédonie. Cette ANR intègre des données issues de vidéos sous-marines, de la génétique des populations et de l’ADN environnemental en vue, notamment, de leur analyse avec des algorithmes d’intelligence artificielle.

Je suis également le référent « données » pour l’UMR Entropie auprès de DataSuds, l’entrepôt de données porté par l’IRD. Dans ce contexte, j’accompagne les chercheurs de l’UMR dans la description et la publication de leurs jeux de données.

Activités transversales et encadrement

Je suis coordinatrice principale de l’équipe transversale d’appui à la recherche (ETAR) de l’UMR ENTROPIE depuis 2015, en collaboration avec deux autres coordinateurs, l’un à La Réunion, la seconde basée à la station marine aquacole de Saint Vincent en Nouvelle-Calédonie. L’équipe est composée d’une partie des Ingénieurs et Techniciens de l’UMR, environ une vingtaine de personnes, regroupant des compétences en aquaculture, expertise biologique, formation, informatique, Qualité Hygiène et Sécurité, laboratoire et terrain, qui sont utiles à tous les axes de recherche. Elle a pour vocation de fournir un appui à la Recherche par de l’expertise technique et/ou scientifique sur les projets de l’Unité. L’équipe transversale intervient dans tous les stades du cycle de vie des données de recherche et contribue fortement à la traçabilité des résultats et la reproductibilité de la recherche.

Le cluster de calcul de Nouvelle-Calédonie, mutualisé entre l’Université de Nouvelle-Calédonie et l’IRD, et qui a fait l’objet d’un financement en 2020 afin de renforcer ses capacités en calcul haute performance et intégrer des capacités en intelligence artificielle, fait partie du périmètre de l’ETAR depuis 2020. J’ai intégré le groupe de réflexion du cluster afin d’aider à la mise des outils d’administration mutualisés entre l’UNC et l’IRD, proposer des solutions de sauvegarde automatisées et intégrer la surveillance des serveurs dans le périmètre du service régional des usages numériques innovants (SRUNI) de Nouméa.

Appui au Sud et formation

Je collabore depuis 2015 avec le département des pêches du Vanuatu (VFD) et l’Université du Pacifique Sud (USP) de Fidji dans le cadre d’un projet de suivi participatif du risque acanthasters « OREANET »  qui s’étend sur trois pays incluant la Nouvelle-Calédonie. Depuis 2018, je travaille avec le service des pêches des Seychelles (SFA) sur la mise en place d’outils de suivi des pêcheries d’holothuries dans le cadre du projet européen SEACUSEY. J’ai conçu les outils de suivi participatifs sur des bases de logiciels open source (de type Open Data Kit) afin qu’ils puissent être maintenus directement par les administrations des pays partenaires, cependant je suis toujours disponible en support en cas de problème ou de besoin ponctuel. 

Le Laboratoire Mixte International MIKAROKA, porté conjointement par l’Institut Halieutique et des Sciences marines (IH.SM) et le Centre National de Recherche Océanographique (CNRO) de Madagascar et l’IRD via l’UMR ENTROPIE, a pour ambition de mettre en place une plateforme d’observation fonctionnelle et pérenne de la biodiversité marine côtière et de ses usages à Madagascar. Depuis sa création en 2020, je suis engagée dans le LMI en tant que responsable de la Composante Transverse, responsabilité partagée avec Julien Barde de l’UMR MARBEC. Je suis plus particulièrement en charge du pôle support informatique pour la gestion des bases de données du LMI en respectant la mise en œuvre des principes de l’Open Science et du FAIR Data Management.

Dans le cadre de MIKAROKA, j’ai obtenu en 2020 un financement pour un Projet Structurant de Formation (PSF) « DONNEES », co-porté avec le directeur du CNRO Mr Mamy RAJAONARIVELO, qui consiste en la mise en œuvre d’un atelier de formation à la science ouverte à Nosy Bé, Madagascar. D'une durée de deux ans, le projet prévoit de regrouper les chercheurs et les étudiants en biodiversité marine de Madagascar et du LMI afin de leur présenter et les former à la science ouverte. Cet atelier aura la chance de pouvoir proposer des interventions du GBIF Madagascar et France, de la responsable du point focal de Nagoya à Madagascar, de membres de la Mission pour la Science Ouverte de l’IRD ainsi que de plusieurs ingénieurs et chercheurs spécialisés dans le domaine.

Terrain

Enfin, je suis diplomée d'un certificat d'aptitude à l'hyperbarie, CAH Classe 1B, et j'accompagne les chercheurs sur le terrain, notamment pour la collecte de données, ce qui me permet d'être au plus près du besoin métier pour leur gestion.