Descriptif

La gestion de données de recherche est une activité collective impliquant de multiples étapes et acteurs, tels que le chercheur ou la chercheuse responsable à l’initiative de la collecte et de la curation des données, le ou la délégué.e à la protection des données, des ingénieurs ou ingénieures d’études pour l’enrichissement des métadonnées, des ingénieurs ou ingénieures de recherche pour le dépôt en masse de données ou encore des archivistes pour leur préservation à long terme : tous ces acteurs et actrices du cycle de vie des données pouvant être dispersé.es au sein d’organisations et d’institutions et d’infrastructures de recherche différentes.

Ainsi, le groupe de travail COAR-Notify for Research Data a pour ambition d'initier une réflexion visant à tirer parti des capacités d'interopérabilité natives du web ainsi que des différentes normes qui le régissent en vue de fluidifier les activités et les processus métiers impliqués dans et par la gestion des données de recherche. 

Les années récentes ont en effet vu fleurir les initiatives visant à re-décentraliser le web en étendant les normes web ouvertes existantes afin de donner la priorité à l'autonomie de l'utilisateur face à des fournisseurs web qui tendent à stocker leurs données d'une manière qui est souvent limitée à certains systèmes et qui ne leur permettent pas de choisir des modes d'exploitation alternatifs de leurs données. En témoigne la récente constitution d'un groupe de travail du W3C dédié au stockage en ligne lié (Linked Web Storage) :  il vise à standardiser un protocole qui doit rendre possible un couplage lâche entre des applications d'une part et des serveurs d'identité et de stockage d'autre part.

C'est dans ce contexte qu' a été élaborée la spécification "Notifications d'événements dans les réseaux à valeur ajoutée" implémentée par l'initiative COAR Notify. L'objectif de cette dernière est de promouvoir l'adoption d'un protocole devant permettre à de multiples services tels que des entrepôts de données ou encore des services d'évaluation par les pairs de communiquer afin d'améliorer la qualité de leurs ressources. Un exemple d'enrichissement mis en oeuvre grâce à ce protocole est la publication de liens bi-directionnels liant entre eux des produits de recherche déposés dans des entrepôts différents (un jeu de données déposé dans un entrepôt de données et une publication déposée dans HAL et citant ce jeu de données, par exemple).

Cependant, l'initiative COAR-Notify se concentre essentiellement sur les publications scientifiques, laissant quelque peu de côté les spécificités et le cycle de vie propres à d'autres produits de recherche tels que les données. L'objectif du groupe de travail CN4RD est donc de proposer un scénario spécifique à ce domaine, tel que la notification de l'enregistrement d'un nouveau jeu de donnée à tous les acteurs de la Recherche susceptibles de le gérer dans la suite de son cycle de vie, et d'enrichir le protocole COAR-Notify de modèles de notifications, de vocabulaires et de flux de travail adaptés à ce scénario. 

Composé de chercheur.se.s et d'ingénieur.e.s de Recherche, le GT CN4RD s'appuie sur l'expérience et l'environnement de l'EHESS, notamment au travers de son Pôle Numérique Recherche, en étroite collaboration avec l'infrastructure de Recherche PROGEDO. Il propose cette journée d'étude, dédiée à la fois à l'exposition du fonctionnement de COAR-Notify et de son implémentation actuelle dans HAL, ainsi qu'à la mise en pratique d'un cas d'usage spécifique autour de l'enregistrement de nouveaux jeux de données.

 Programme

9h30 : Accueil et Café

10h00 : Ouverture par Hanen Bellili

10h15 : Présentation : le protocole COAR-Notify, une introduction - par Patrick Hochstenbach (ID-LAB, Université de Gand)

11h00 : Retour d'expérience : implémentation de COAR-Notify dans HAL - par Raphaël Tournoy (CCSD, CNRS)

12h00 : Pause déjeuner

14h00 : Atelier pratique : mise en situation simplifiée autour de COAR-Notify pour les données de la Recherche

15h00 : Echanges et clôture

Informations pratiques

Cette journée d'étude aura lieu à l'EHESS, 54 boulevard Raspail 75006, en salle B1-01 (1er étage gauche). Accès métro ligne 4 (station Saint-Placide) ou métro ligne 12 (station Sèvres-Babylone).

La journée d'étude se tiendra en français et en anglais.

Chargement... Chargement...