Data Paper – Data journal

Il s’agit d’un modèle éditorial nouveau dont le principe est de décrire un ou des jeux de données librement accessibles selon un format d’article spécifique précisé par les éditeurs. Objectifs d’un data paper : les données sont valorisées, accessibles, interprétables et réutilisables. Ne pas confondre ce type d’article décrivant un ou des jeux de données avec un article accompagné de jeux de données. 

La publication des données 

Schéma adapté de Report on integration of data and publications. Opportunities for Data Exchange (Reilly S. et al., 2011)


Extrait du "Guide : les data papiers",http://guides-­formadoct.ueb.eu/datapapers, 23 mai 2016

Extrait du « Guide : les data papers », mai 2016.

Avant de vous lancer dans la rédaction d’un data paper, veuillez-vous imprégner des contenus des trois sites suivants et des informations données :

Caractéristiques d’un data paper 

Il s’agit d’un article publié dans des périodiques reviewés à l’international. Ces périodiques sont en open access : articles et données. Les bases de données sont déposées sur des entrepôts avec un lien pérenne : DOI, sont libres d’accès et peuvent être réutilisables. La publication d’un article a un coût : Apc s = article processing charge voir en infra L’article est rédigé selon des préconisations/templates définies par l’éditeur : voir en infra.

Deux exemples de data paper 

Bonforte, A. et al. Global positioning system survey data for active seismic and volcanic areas of eastern Sicily, 1994 to 2013. Sci. Data 3:160062. doi: 10.1038/sdata.2016.62 (2016)

et Bonforte, A. et al. PANGAEA. Database of GPS data collected by surveys on seismic and volcanic areas of Sicily (Italy) from 1994 to 2013. doi : 10.1594/PANGAEA.857795 (2016).

Définitions 

Un data paper est une publication décrivant un ou plusieurs jeux de données scientifiques brutes (data – data set) avec des métadonnées/informations précises de type : obtention, description des données, etc.. La réutilisation de celles-­ci par d’autres chercheurs est incontournable et justifie l’acceptation du data paper par le comité éditorial de la revue. Le jeu de données est disponible pour la communauté : le dépôt dans un entrepôt ouvert est obligatoire et doit être retrouvable via un DOI.

L’article est examiné/reviewe par des pairs dans des revues spécifiques : data papers voir liste des titres de la thématique sciences de l’Univers ci –dessous.

Ce qu’il n’est pas :
-Une interprétation des données
-Des conclusions sur l'analyse des données

Les données de recherche sont des "enregistrements factuels (chiffres, textes, images, sons) utilisés comme source principale pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l'objet de la recherche." (OCDE, 2007).

Cette définition exclut : "carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens pour les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris.)

Le jeu de données (datasets)
peut être défini comme l'agrégation, sous une forme lisible, de données brutes ou dérivées présentant une certaine "unité", rassemblées pour former un ensemble cohérent (Gaillard R., 2014).

Les métadonnées descriptives de jeux de données (metadata)
Il existe plusieurs standards de description des jeux de données. Chaque revue propose le standard de son choix. Ces standards comportent en général une formalisation des métadonnées suivantes : Qui a créé les données ? Que contiennent-­elles ? Où sont-­elles (identifiant pérenne, notamment) ? Quand ont-­elles été créées, Comment ont-­elles été créées, Pourquoi ont-­elles été créées ? Ces métadonnées doivent être interprétables par des machines.

Extraits de http://guides-­formadoct.ueb.eu/datapapers

Structuration du data paper 

Suivre les préconisations/templates des éditeurs :

1-­Les données doivent être accessibles,  quelque soit l’entrepôt des données

2-­La partie descriptive


Extrait de : L'Hostis, D., Hamelin, M., Lelievre, V., Aventurier, P. (2016). Publier un Data Paper pour valoriser ses données.

Evaluation d’un data paper 

avant publication, s’assurer de :
-L’importance et l'originalité des données
-La réutilisation des données
-La fiabilité des données
-De l’accès aux données : attribution de DOI De la méthode de collecte des données
-Du choix des métadonnées descriptives et formats

Exemples de citation d’un data paper 

Peter N. Eze, Valiant S. Mosokomani, Theophilus K. Udeigwe, Opeoluwa F. Oyedele, Adeniyi F. Fagbamigbe, Geostatistical analysis of trace elements PXRF dataset of near-­surface semi-­arid soils from Central Botswana, Data in Brief, Volume 9, December 2016, Pages 764‐770, ISSN 2352-­3409, http://dx.doi.org/10.1016/j.dib.2016.10.010.

Morak-­Bozzo, S., Merchant, C. J., Kent, E. C., Berry, D. I. and Carella, G. (2016), Climatological diurnal variability in sea surface temperature characterized from drifting buoy data. Geosci. Data J., 3: 20–28. doi:10.1002/gdj3.35

Datas : Morak-­Bozzo, Simone; Merchant, Christopher J (2016): Climatological diurnal variability in sea surface temperature characterised from drifting buoy day v1.1. figshare. 

Chercher un entrepôt de données 

  • re3data.org : ce répertoire recense plus de 1500 entrepôts de données de recherche de divers domaines disciplinaires ; depuis 2012 grâce à la German Research Foundation (DFG) qui en est le financeur principal et géré par Data site.

Titres de data journals généralistes et en sciences de la Terre et de l'Univers

Tous les titres ci-­dessous sont en open access et reviewes. La publication d’un article a un coût : apcs ( article processing charges ). Les repositories/entrepôts accueillant les jeux de données sont divers.

  • Geoscience Data Journal

http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049­‐6060 published by Royal Meteorological Society and John Wiley & Sons Ltd.
Repositories : liste sur cette page : http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-­6060
APCs : €1,200 /article

  • Earth System Science Data

http://earth-­system-­science-­data.net/
Living data process : http://www.earth-­system-­science-­data.net/living_data_process.html
Repositories : http://www.earth-­system-­science-­ata.net/for_authors/repository_criteria.html
Apcs : http://www.earth-­system-­science-­data.net/for_authors/article_processing_charges.html - Pas spécifiés à ce jour

  • Geoscientific Model Development (GMD) 

http://www.geoscientific-­model-­development.net/Copernicus.org
Repository Criteria : http://www.re3data.org/
Manuscript types : http://www.geoscientific-­model-­development.net/about/manuscript_types.html
Apcs : http://www.geoscientific-­modeldevelopment.net/for_authors/article_processing_charges.html

  • Data in Brief – Elsevier

http://www.journals.elsevier.com/
Public repositories to store and find data : https://www.journals.elsevier.com/data-in-brief/policies-and-guidelines/public-repositories-to-store-and-find-data
Apcs : 500 $/article

  • Scientific Data : Nature Publishing Group

http://www.nature.com/sdata/
Pour les données : http://www.nature.com/sdata/policies/repositories 
APC Prices : 1050€/article - http://www.nature.com/sdata/about/oa 

  • CODATA's Data Science Journal

http://datascience.codata.org/
Repository : The Dryad Digital Repository
http://datadryad.org/pages/organization http://datascience.codata.org/about/research-­integrity/
Pour le texte : http://datascience.codata.org/about/submissions/ lire le paragraphe Data Articles
Apcs : 375 €/article