Descriptif

La gestion de données de recherche est une activité collective impliquant de multiples étapes et acteurs, tels que le chercheur ou la chercheuse responsable à l’initiative de la collecte et de la curation des données, le ou la délégué.e à la protection des données, des ingénieurs ou ingénieures d’études pour l’enrichissement des métadonnées, des ingénieurs ou ingénieures de recherche pour le dépôt en masse de données ou encore des archivistes pour leur préservation à long terme : tous ces acteurs et actrices du cycle de vie des données pouvant être dispersé.es au sein d’organisations et d’institutions et d’infrastructures de recherche différentes.

Ainsi, le groupe de travail COAR-Notify for Research Data a pour ambition d'initier une réflexion visant à tirer parti des capacités d'interopérabilité natives du web ainsi que des différentes normes qui le régissent en vue de fluidifier les activités et les processus métiers impliqués dans et par la gestion des données de recherche. 

Les années récentes ont en effet vu fleurir les initiatives visant à re-décentraliser le web en étendant les normes web ouvertes existantes afin de donner la priorité à l'autonomie de l'utilisateur face à des fournisseurs web qui tendent à stocker leurs données d'une manière qui est souvent limitée à certains systèmes et qui ne leur permettent pas de choisir des modes d'exploitation alternatifs de leurs données. En témoigne la récente constitution d'un groupe de travail du W3C dédié au stockage en ligne lié (Linked Web Storage) :  il vise à standardiser un protocole qui doit rendre possible un couplage lâche entre des applications d'une part et des serveurs d'identité et de stockage d'autre part.

C'est dans ce contexte qu' a été élaborée la spécification "Notifications d'événements dans les réseaux à valeur ajoutée" implémentée par l'initiative COAR Notify. L'objectif de cette dernière est de promouvoir l'adoption d'un protocole devant permettre à de multiples services tels que des entrepôts de données ou encore des services d'évaluation par les pairs de communiquer afin d'améliorer la qualité de leurs ressources. Un exemple d'enrichissement mis en oeuvre grâce à ce protocole est la publication de liens bi-directionnels liant entre eux des produits de recherche déposés dans des entrepôts différents (un jeu de données déposé dans un entrepôt de données et une publication déposée dans HAL et citant ce jeu de données, par exemple).

Cependant, l'initiative COAR-Notify se concentre essentiellement sur les publications scientifiques, laissant quelque peu de côté les spécificités et le cycle de vie propres à d'autres produits de recherche tels que les données. L'objectif du groupe de travail CN4RD est donc de proposer un scénario spécifique à ce domaine, tel que la notification de l'enregistrement d'un nouveau jeu de donnée à tous les acteurs de la Recherche susceptibles de le gérer dans la suite de son cycle de vie, et d'enrichir le protocole COAR-Notify de modèles de notifications, de vocabulaires et de flux de travail adaptés à ce scénario. 

Composé de chercheur.se.s et d'ingénieur.e.s de Recherche, le GT CN4RD s'appuie sur l'expérience et l'environnement de l'EHESS, notamment au travers de son Pôle Numérique Recherche, en étroite collaboration avec l'infrastructure de Recherche PROGEDO. Il propose cette journée d'étude, dédiée à la fois à l'exposition du fonctionnement de COAR-Notify et de son implémentation actuelle dans HAL, ainsi qu'à la mise en pratique d'un cas d'usage spécifique autour de l'enregistrement de nouveaux jeux de données.

 Programme

9h30 : Accueil et Café

10h00 : Ouverture par Hanen Bellili

10h15 : Présentation : Notifications d'événements et COAR Notify (intervention en anglais) - par Patrick Hochstenbach (ID-LAB, Université de Gand)

Cette présentation offre une brève introduction à l'état actuel de la communication savante et aux raisons qui motivent la promotion d'un système de communication savante décentralisé et découplé. Elle décrit les fonctions essentielles requises pour mettre en place un tel système. Le protocole Event Notifications répond aux principaux défis rencontrés par de nombreuses initiatives de décentralisation en permettant la communication par l'échange de messages asynchrones. COAR Notify est un profil du protocole Event Notifications, adapté aux cas d'utilisation réels dans le domaine de l'évaluation par les pairs et de l'approbation des revues. La présentation donnera également un aperçu des fonctionnalités de COAR Notify et explorera ses applications potentielles dans le domaine de l'utilisation des données de recherche.

Patrick Hochstenbach a travaillé pendant plus de 30 ans dans des bibliothèques universitaires en Belgique, aux États-Unis et en Suède. Il est actuellement employé à la bibliothèque de l'université de Gand en tant qu'intégrateur de données et prépare un doctorat en informatique sur le thème « La communication scientifique sur le web décentralisé », en collaboration avec IMEC/ID-Lab. Il est conseiller technique pour l'initiative COAR Notify et le groupe de travail COAR sur les défis posés par les robots IA dans les systèmes de dépôt. Patrick est l'auteur principal du protocole Event Notifications et a publié à l'échelle internationale sur des sujets tels que les protocoles Web, la communication scientifique, Solid, les langages de politique et le raisonnement RDF.

11h00 : Retour d'expérience : implémentation de COAR-Notify dans HAL et Nakala (titre provisoire) - par Raphaël Tournoy (CCSD, CNRS) et Yannick Barborini (CCSD, CNRS)

12h00 : Pause déjeuner

14h00 : Atelier pratique : mise en situation simplifiée autour de COAR-Notify pour les données de la Recherche

15h00 : Echanges et clôture

Informations pratiques

Cette journée d'étude aura lieu à l'EHESS, 54 boulevard Raspail 75006, en salle B1-01 (1er étage gauche). Accès métro ligne 4 (station Saint-Placide) ou métro ligne 12 (station Sèvres-Babylone).

La journée d'étude se tiendra en français et en anglais.

Chargement... Chargement...