Open-Access, Open-Source, Open-Data

Les 3 piliers de la science ouverte

Benoît Seignovert

Jeudi 28 avril 2022

Open-Access

Open-source initiative

HAL Open-Science

Open-License

Ouvrir la science

Quoi, pourquoi, pour qui ?

2022

2021

2021

La science ouverte est la diffusion sans entrave des résultats, des méthodes et des produits de la recherche scientifique. Elle s’appuie sur l’opportunité que représente la mutation numérique pour développer l’accès ouvert aux publications et – autant que possible – aux données, aux codes sources et aux méthodes de la recherche.

Quoi ?

Elle permet à la recherche financée sur fonds publics de conserver la maîtrise des résultats qu’elle produit. Elle construit un écosystème dans lequel la science est plus transparente, plus solidement étayée et reproductible, plus efficace et cumulative.

Pourquoi ?

Elle induit une démocratisation de l’accès aux savoirs, utile à l’enseignement, à la formation, à l’économie, aux politiques publiques, aux citoyens et à la société dans son ensemble. Elle constitue enfin un levier pour l’intégrité scientifique et favorise la confiance des citoyens dans la science.

Pour qui ?

SCIENCE OUVERTE

Publications

Code source

& méthodes

Données

SCIENCE OUVERTE

Souveraineté

Intégrité

Transparence Reproductibilité

Accessibilité

Équité

En France 🇫🇷

2016 : Loi pour une République numérique

Cadre juridique et ouverture par défaut des données administratives.

2018 : Plan national pour la science ouverte

Obligation de mise en livre accès des publications de recherche financées sur appel à projets.

Structuration et ouverture des données de la recherche et systématisation des plans de gestion des données.

2021 : ANR

L'attribution de financements est conditionnée au respect des principes de sciences ouverte.

Accès complet et immédiat aux publications résultant du projet.

Obligation d'avoir un plan de gestion des données.

En Europe 🇪🇺 et à l'international 🇺🇳🇺🇸

2017 / 2021 : ERC / Horizon 2020 / Horizon Europe

Obligation de diffusion des publications en accès ouvert.

Forte incitation à la diffusion des données.

Diffusion libre et immédiate des publications financées par des fonds européen dans des revues et des plateformes en accès ouvert.

2022-2027 : NASA Transition to Open Source initiative (TOPS)

2023 Year of Open Science (NASA)

5 years to promote open-science.

75% of mission and research PI certified in open-science principles (20K scientists).

2021 : UNESCO recommandation on Open Science

Promouvoir une définition commune de la science ouverte [...] et les différents moyens d'y accéder.

Instaurer un environnement politique favorable à la science ouverte.

Investir dans les infrastructures et les services de la science ouverte.

Promouvoir la coopération internationale et multipartite [...] en vue de réduire les fractures numériques et technologiques.

⚠️ Attention !

Publier des articles, des logiciels ou des données peut être gratuit ou payant en fonction du modèle économique de la revue ou de l'entrepôt dans lequel ils sont déposés.

 

Dans certains cas, les coûts de fonctionnement sont pris en charge directement ou indirectement par des institutions.

💶 Gratuit

🔓 Ouvert

Open-Access

Un contenu en accès ouvert est accessible à tous sans barrière : sans authentification requise, sans ressource sous embargo, sans accès payant.

Cela peut concerner des publications scientifiques, des données, du code.

Il existe plusieurs façons de diffuser des publications en accès ouvert :

  • la publication dans une revue en libre accès
  • l’auto-archivage des productions scientifiques dans une archive ouverte (HAL, arXiv, theses.fr…)

2017: 1er papier en 1er auteur…

👍

👎

🤕 Pas de sources…

🙄 Pas de données…

😬

arxiv: 1704.00842

Version Editeur

Pre-print / post-print

Open-Source

Open source is a term that originally referred to open source software (OSS). Open source software is code that is designed to be publicly accessible: anyone can see, modify, and distribute the code as they see fit.

Open source software is developed in a decentralized and collaborative way, relying on peer review and community production. Open source software is often cheaper, more flexible, and has more longevity than its proprietary peers because it is developed by communities rather than a single author or company.

Open source has become a movement and a way of working that reaches beyond software production. The open source movement uses the values and decentralized production model of open source software to find new ways to solve problems in their communities and industries.

Open-Source

Lire

Modifier

Redistribuer

Github

Gitlab

🧪 Cahier de manip numérique

Open-License

La licence permet de définir les éléments de paternité et les conditions d'utilisation (copyright).

Une licence ouverte définit en plus les conditions de diffusion et de réutilisation d’un contenu (copyleft).

Exemples de licence ouverte

Pas de droit d'auteur.

Copie, modification et redistribution sans aucun préalable.

Attribution d'auteur

Copie, modification et redistribution sans aucun préalable.

Attribution d'auteur.

Copie, modification et redistribution sous une licence équivalente.

Attribution d'auteur

Copie et redistribution possible mais pas de modification.

Pas d’utilisation commerciale

Toute production doit avoir une licence ‼️

🧑‍🔬 Le chercheur garde la paternité sur ses productions.

📚 L'employeur garde les droits sur leurs diffusions.

(ouverte ou restreinte)

(contacter les services de valorisation)

Open-Data

Ensemble de données numériques dont l'accès et l'usage sont laissés libres aux usagers, qui peuvent être d'origine privée mais surtout publique, produites notamment par une collectivité ou un établissement public.

 

Elles sont diffusées de manière structurée selon une méthode et une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.

Dans le cadre de la Science ouverte, il est recommandé d’utiliser des entrepôts de données institutionnels, généralistes ou disciplinaires [dont la pérennité dans le temps est garantie].

Archive institutionnelle

Archive locale

Entrepôt disciplinaire

Entrepôt généraliste

🔭 Portails d'indexation

🏷 Identifiants pérennes

Référence unique et stable pour un objet ou un sujet numérique (jeu de données, article, auteur…)

📊 Open-data

👀 Good data

Comment bien diffuser mes données ?

Respecter les principes FAIR

Findable

Accessible

Interoperable

Ruseable

Respecter les principes FAIR

Le principe Findable (Facile à trouver) a pour objectif de faciliter la découverte des données par les humains et les systèmes informatiques et requiert une description et une indexation des données et des métadonnées.

Respecter les principes FAIR

Le principe Accessible encourage à stocker durablement les données et les métadonnées et à faciliter leur accès et/ou leur téléchargement, en spécifiant les conditions d’accès (accès ouvert ou restreint) et d’utilisation (licence).

Respecter les principes FAIR

Le principe Interoperable peut se décomposer en : téléchargeable, utilisable, intelligible, et combinable avec d'autres données, par des humains et des machines.

Respecter les principes FAIR

Le principe Reusable (Réutilisable) met en avant les caractéristiques qui rendent les données réutilisables pour de futures recherches ou d’autres finalités (enseignement, innovation, reproduction/transparence de la science).

🔗 Liens utiles

Cette présentation est disponible sur : slides.com/seignovert/open-science et distribué sous licence ouverte:

Merci de votre attention !

Backup

Exemple de publication avec son jeu de données et le code source des figures

Archiver du code source sur Software Heritage