Comprendre l’environnement des données de la recherche

Module 1.1 : Territoires, innovation et financement

  • Infrastructures de données, réseaux, plateformes, etc. (cartographie)

Ce cours introductif s’inscrit dans l’objectif général de compréhension de l’environnement des données dans le domaine scientifique. Il vise à dresser un état global des dispositifs actuels permettant de donner accès aux résultats et données de la recherche, en cherchant à identifier aussi bien les acteurs concernés que les logiques à l’œuvre au niveau national et international.

Les données de la recherche ont tendance à être considérées comme un objet en soi. Or, elles s’inscrivent dans l’écosystème plus général de construction et de diffusion de la science. Ce cours a donc pour objectif de cartographier la place des données de la recherche au sein de cet écosystème pour mieux identifier non seulement les infrastructures, réseaux et plateformes, mais aussi les acteurs, notions et enjeux qui sous-tendent les problématiques liées à la gestion des données de la recherche et qui seront approfondis dans les cours suivants.

  • Compétences :

– Définir les notions et éléments clés permettant d’appréhender les enjeux liés à la gestion des données de la recherche ;

– Inscrire ces enjeux dans le paysage global de la production et de la diffusion des résultats de la recherche ;

– Identifier les réseaux et infrastructures utiles dans le cadre des activités de gestion des données de la recherche


  • Qu’est-ce que l’open access/ l’open science ? Un regard sur la fabrique des politiques publiques de la recherche

Durant cette séance, nous allons replacer les enjeux de gestion et d’ingénierie des données dans le contexte plus général de la construction de politiques publiques de recherche orientées vers la science ouverte. Des premières initiatives autour du libre accès/accès ouvert (open access) jusqu’aux dernières mesures annoncées en France sur la science ouverte (PNSO2), nous découvrirons les différentes facettes de la science ouverte/open science. Ce premier cours d’introduction vous permettra de mieux vous repérer dans une diversité de problématiques que recoupent l’open science, de cerner les points de frictions entre différentes parties prenantes dans le cas de l’open access et d’en appréhender les enjeux juridiques (droits de la propriété intellectuelle) et économiques associées (modèles économiques, place des données). Une large place sera laissée aux échanges pour permettre également aux participant.e.s en ce début de DU de se connaître et de faire part de leurs expériences/premier contact avec la science ouverte.

Pré-requis : aucun si ce n’est avoir la possibilité de vous connecter avec le son et la vidéo pour les échanges en cours (format interactif)

A la fin du cours, vous aurez été familiarisé.e.s avec :

– Quelques dates clefs de l’open access, de l’open science et des politiques publiques de recherche asssociées

– Quelques parties prenantes de l’open science/open access et des frictions/alliances associées

– Différents acronymes employés aujourd’hui sur l’open access/open science (DMP, APC, RoR, PNSO etc.)

– Les enjeux juridiques, économiques et organisationnels sous-jacents à l’open access (modèle économique, usage de licences, gouvernance, communs)

– L’utilisation du langage markdown pour des documents collaboratifs et des présentations

Pour participer à ce module 1.1, il faudra obligatoirement s’inscrire aux modules suivants : « Module 1.2 : Recherche, gouvernance et données » et « Module 1.3 : Données, innovation et droit ».


Module 1.2 : Recherche, gouvernance et données

  • Gouvernance des données

  • L’institut de la science des données de Montpellier (ISDM)

Les données de la recherche font appel à de nombreuses compétences et métiers variés, aux usages et langages hétérogènes, de la gestion à l’analyse. Les outils de la science des données offrent de nombreuses opportunités. Cependant, ces outils sont parfois méconnus par les usagers ou producteurs de données, sans nécessairement appréhender correctement leur potentiel et/ou leurs limites, manquant de compétences en interne. Il apparaît alors la nécessité de proposer un centre de compétences autour de la donnée dans une organisation, en service support.

Dans ce cours, nous aborderons la diversité des aspects liés à la science des données, ainsi que leur gestion, et la structuration d’un centre de compétences correspondant. Après un aperçu des structures au niveau national et international, nous présenterons le cas de l’Institut de la Science des Données de Montpellier, inauguré en janvier 2020.

  • Compétences :

– Appréhender la diversité des métiers et des acteurs liés à la donnée;

– Connaître des exemples de structuration de centres de compétences « données » au niveau national et international;

– Gérer la variété des interlocuteurs et métiers sur un projet lié à la donnée.


  • Research Data Alliance (RDA)

La Research Data Alliance (RDA,https://www.rd-alliance.org/) est une organisation internationale dont l’objectif est de faciliter le partage des données de la recherche. Elle compte plus de 12 000 membres venant de 145 pays. C’est un forum international unique, dont une des richesses est la diversité des profils des participants (chercheurs, gestionnaires de projets, personnels des bibliothèques, ingénieurs informaticiens, curateurs de données, personnes qui travaillent dans des ministères ou des agences de financement, etc). La diversité des sujets qu’elle aborde, qui couvrent de nombreux aspects du partage des données qui peuvent être techniques ou sociologiques, ou une combinaison des deux, est également remarquable. Ces sujets sont proposés par les membres de la communauté, et pris en charge par des Groupes d’Intérêt, qui sont constitués sur la durée, et des Groupes de Travail mis en place sur une durée limitée pour préparer des recommandations. La RDA est soutenue par la France dans le cadre du Plan National pour la Science Ouverte (https://www.rd-alliance.org/groups/rda-france), et son chapitre français RDA France, développé par le CNRS, regroupe une communauté qui est aussi très diverse. Le séminaire présentera la RDA et RDA France, leurs communautés et leurs activités, montrera comment participer à celles-ci, et donnera des exemples des travaux et des recommandations de la RDA dans différents domaines.

Pour participer à ce module 1.2, il faut avoir obligatoirement suivi les modules suivants : « Module 1.1 : Territoires, innovation et financement » et le « Module 1.3 : Données, innovation et droit ».


Module 1.3 : Données, innovations et droit

Ce module permet, à travers la résolution d’un cas pratique qui sera déployé sur deux jours, de présenter les principales règles qui s’appliquent aux données de la recherche scientifique. Les règles seront appréhendées sous l’angle du droit français et du droit européen.

  • Protéger les innovations fondées sur les données – jour 1

Il s’agit tout d’abord de présenter et de comprendre les règles qui s’appliquent lorsque les données constituent des innovations (bases de données ou logiciels) susceptibles d’être privatisées via les droits de propriété intellectuelle en cas de partenariat public/privé en matière de recherche-développement.

  • Libérer les données de la recherche (open science) – jour 2

Il s’agit ensuite de présenter les règles qui s’appliquent aux données de la recherche scientifique en tant que données publiques (open data), c’est-à-dire produites ou reçues par une administration et de comprendre les enjeux de la politique d’ouverture des données publiques.

  • A la fin de ce cours, vous saurez :

– Expliquer les enjeux de la science ouverte au prisme du droit positif ;

– Orienter le choix des règles à appliquer aux jeux de données de la recherche ;

– Mettre en œuvre les méthodes de raisonnement en droit des données de la recherche.

Pour participer à ce module 1.3, il faut obligatoirement suivre le module suivant : « Module 3.4 : Valoriser et réutiliser les données »