Comprendre l’environnement des données de la science
La première partie de la formation permet de comprendre l’environnement des données de la science :
- Qu’est-ce que la recherche collaborative ?
- Comment financer une recherche orientée vers la collecte et l’analyse de données ?
- Quelles sont les stratégies de développement de projets de data science ?
- Quelles sont les règles juridiques et/ou de gouvernance qui s’appliquent aux données ?
Elle se décline en trois modules :
- Infrastructures de données, réseaux, plateformes, etc. (cartographie)
- Qu’est-ce que l’open access/ l’open science ? Un regard sur la fabrique des politiques publiques de la recherche
Pour participer à ce module, il faut avoir obligatoirement suivi les modules suivants : « Module 1.2 : Recherche, gouvernance et données » et « Module 1.3 : Données, innovation et droit ».
- Gouvernance des données
- L’institut de la science des données de Montpellier (ISDM)
- Research Data Alliance (RDA)
Pour participer à ce module, il faut avoir obligatoirement suivi les modules suivants : « Module 1.1 : Territoires, innovation et financement » et « Module 1.3 : Données, innovation et droit ».
- Protéger les innovations fondées sur les données
- Libérer les données de la recherche (open science)
Pour participer à ce module, il faut avoir obligatoirement suivi le module suivant : « Module 3.4 : Valoriser et réutiliser les données »
- Pascal Bonnet
- Sandrine Gropp
- Françoise Genova
- Célya Gruson-Daniel
- Agnès Robin
- Kenneth Maussang
Maîtriser les outils d’analyse des données de la science
La deuxième partie de la formation permet de se former à la maîtrise des outils d’analyse des données de la science, c’est-à-dire les outils destinés à extraire, contextualiser, fouiller, sécuriser et protéger les données.
Elle se décline en cinq modules :
- Reproductibilité des résultats de la recherche
- Fiabilité des données de curation
- Intégrité scientifique pour une science responsable
- Intégrité scientifique et procédure administrative
- Intégrité scientifique et propriété intellectuelle
- Intégrité technique des données – Les objets connectés
- Construire et gérer les métadonnées
- Le métier de Data Scientist
- Pérenniser les données
- Fouiller des textes et des données. Techniques de fouille
- Fouiller des textes et des données. Extraction et partage d’information
- Exploration de textes – ISTEX/Gargantext
- Exception de TDM (droit d’auteur/droit des bases de données)
- Sécurisation technique des données (cloud, serveurs, localisation, etc.)
- Sécurisation juridique des données (confidentialité/PI)
- RGPD et exception de recherche
- Anonymiser les données – L’appariement des données de santé
- RGPD et données de santé
- Philippe Amiel
- Alain Foucaran
- Francesca Frontini
- Kamel Gadouche
- Clément Jonquet
- Anne Laurent
- Julien Le Clainche
- Olivier Le Gall
- Claire Nedellec
- Christophe Perignon
- Agnès Robin
- Maxime Ragot
- Mathieu Roche
- Marie-Christine Sordino
- Gille Vieira
Gérer l’ouverture des données de la science
La troisième partie propose de former à l’ouverture des données de la science. Elle consiste ainsi à apprendre à partager, publier, mais aussi stocker et archiver les données de façon sécurisée et de manière à ce qu’elles puissent éventuellement donner lieu à une réutilisation et/ou une valorisation.
Elle se décline en quatre modules :
- Qu’est-ce que le FAIR ?
- Le PGD, enjeux financier et institutionnel : quelles obligations pour les porteurs de projets ?
- Construire un Plan de gestion de données. Elaboration et rédaction
Pour participer à ce module, il faut avoir obligatoirement suivi le module suivant : « Module 3.3 : Diffuser et partager les données ».
- Construire une infrastructure de données
- Fonctionnalités des entrepôts de données pour le stockage et la réutilisation des données
- Les entrepôts de données. HumaNum Des services pour la gestion des données en SHS, la TGIR Huma-Num
- Solutions d’archivage : l’expertise des archivistes
- Obtenir une certification CTS
- Stratégies de diffusion et de partage des données (open access, publimétrie)
- Rédiger un Data paper
- S’identifier en tant que chercheur
Pour participer à ce module, il faut avoir obligatoirement suivi le module suivant : « Module 3.1 : Construire un plan de gestion de données (PGD) ».
- Stratégies d’innovation, financement, valorisation
- Licences ouvertes Données publiques (Open data)
- Stratégies de valorisation des données scientifiques
Pour participer à ce module, il faut avoir obligatoirement suivi le module suivant : « Module 1.3 : Données, innovation et droit ».
- Hugo Catherine
- Laurence Dedieu-Engelmann
- Emilie Domanico
- Françoise Genova
- Véronique Ginouvès
- Célya Gruson-Daniel
- Laure Lefrançois
- Pascal Neveu
- Olivier Rouchon
- Joachim Schöpfel
- Jérémie Valentin