Retour d'expérience DOI - Université Bordeaux Montaigne

De Bibliopedia
Aller à : navigation, rechercher

Attribution de DOI - Université Bordeaux Montaigne[modifier]


Contexte[modifier]

Logo DOI

Fin 2016, l’université Bordeaux Montaigne, à travers son service commun de documentation (SCD) s’est rapprochée de l’INIST pour bénéficier du service d’attribution de DOI qu’offre l’organisme.

En contractualisant avec l’INIST, l’université bénéficie d’un accès à Datacite et peut se connecter à l’interface proposée par cette agence d’enregistrement[1]. Il existe plusieurs agences d’enregistrement pour les DOI, dont Datacite et CrossRef sont les plus connues pour les données scientifiques. CrossRef est la plus utilisée pour les publications scientifiques (par OpenEdition, par exemple) ; Datacite est davantage spécialisée pour les données. La prestation est différente :

  • CrossRef propose un coût lié au nombre de DOI (1$ le doi + frais d’adhésion en fonction des revenus ou budget de l’organisme)
  • DataCite via l’INIST permet, pour 180€ par an, de créer un nombre de DOI illimité[2], avec une interface de gestion des identifiants administrée par l’INIST (voir ci-dessous)

Notre choix s’est donc porté sur l’offre de l’INIST dans le cadre de ce test pour des raisons de simplicité de mise en place, de coût, et pour bénéficier d’un accompagnement direct par un organisme français.

À l’heure de rédaction de ce document, environ un millier de DOI ont été attribués dans le cadre de deux projets : les articles d’une revue et les entrées d’une base de données. Les demandes initiales des porteurs de projet concernaient surtout le fait de pouvoir citer efficacement les données, et d’avoir des url pérennes et durables.

Organisation de l’attribution des DOI[modifier]

Lors de l’inscription via l’INIST, l’université s’est vu affecter un préfixe DOI sous lequel elle est libre de générer des DOI avec la forme qu’elle souhaite. Dans le cas de l’Université Bordeaux Montaigne, nous sommes donc titulaire du préfixe 10.21412

Pour les deux projets gérés jusqu’ici nous avons décidé d’une attribution de DOI propre à chaque projet. :

  • revue LEAVES[3] : les identifiants sont sous la forme 10.21412/LEAVES_[VV][AA] où [VV] correspond au numéro de la revue sur deux chiffres (01, 02 …) et [AA] correspond à un numéro séquentiel de position de l’article à l’intérieur du numéro (01, 02 …). Le DOI 10.21412/LEAVES_0105 correspond ainsi au 5ème article du premier numéro de la revue.
  • Base Adriaticum Mare[4] : les identifiants reprennent l’identifiant interne de la base de données qui nous a été communiqué au moment du transfert des métadonnées. Le DOI 10.21412/adriatlas_911 correspond ainsi à l’entrée n° 911 de la base de données.

Ces deux méthodes permettent aux services et chercheurs auxquels nous fournissons les DOI de maîtriser à l’avance leur propre numérotation de manière autonome (par opposition à un numéro séquentiel commun à l’ensemble de nos projets) et ainsi d’anticiper la mention de l’identifiant sur des pages, ou des PDF dans le cadre de la revue, en amont de la création effective des DOI par le SCD.

Aspects techniques de la génération de DOI[modifier]

Génération unitaire[modifier]

Formulaire de création unitaire de DOI

Datacite permet l’enregistrement de nouvelles ressources directement à travers une interface web présentée dans la capture d’écran ci-contre. Trois éléments sont nécessaires :

  • DOI souhaité (qui sera ensuite préfixé par « 10.21412/ » dans notre cas) ;
  • Adresse URL : url du document signalé dans son environnement propre ;
  • Fichier XML de description du contenu selon le schéma proposé par Metacite[5].

Cette solution n’a pas été retenue à l’Université Bordeaux Montaigne jusqu’à maintenant car les DOI que nous avons eus à générer l’ont été par lot et nous avons préféré passer par un script décrit à la section suivante.

Génération en série[modifier]

Pour les deux projets l’ensemble des métadonnées nous ont été fournies à l’avance en une fois (pour un lot de données) par les responsables des projets sous la forme d’un fichier (CSV dans un cas, XML dans l’autre). Le SCD ne prend pas en charge la collecte des métadonnées, mais a pu conseiller ponctuellement les interlocuteurs sur des choix de métadonnées et des normes de rédaction. Pour chacune des situations traitée jusqu’à maintenant, un script a été créé afin d’ingérer ce fichier lié au projet source et de le formater pour suivre le format attendu par Datacite[5]. Suite à cette mise au format, le script se charge aussi de faire les appels à l’API Datacite pour la création des DOI[6].

Les scripts ont été développés en PHP en raison de la facilité offerte de créer une interface web pour le dépôt si le nombre de projets concernés par la création de DOI devenait trop important et que concentrer la génération des DOI sur la seule personne informaticienne du service n’était plus possible. Pour le moment ces scripts sont appelés en ligne de commande de manière locale sur la machine de l’informaticien mais cette situation pourra changer à l’avenir.

Les scripts sont disponibles dans le dépôt https://github.com/symac/doi_inist et sont librement adaptables.

Conclusion[modifier]

Après deux années d’adhésion au service de l’INIST, le bilan est plutôt positif : la mise en place du service est simple et rapide une fois la contractualisation avec l’INIST confirmée. Le coût est réduit compte tenu du service fourni. L’INIST propose un accompagnement initial à la mise en place qui s’est avéré satisfaisant dans la mesure de nos besoins. La mise en place du service demande néanmoins la présence d’un informaticien ou d’un spécialiste de l’informatique documentaire dès lors qu’il s’agit de manipuler des fichiers XML et des scripts d’automatisation des processus sur un nombre important de données.

Plusieurs points suscitent encore des questionnements chez nous et méritent d’être mis en exergue :

  • L’attribution de ces DOI « DataCite » pour des articles scientifiques n’est pas pleinement satisfaisante dans la mesure où plusieurs services du monde des bibliothèques se basent plutôt sur les métadonnées offertes par Crossref : à titre d’exemple, les DOI attribués via ce système ne sont pas repérés lors d’un dépôt dans HAL. Nous n’avons pas encore exploré de pistes complémentaires qui permettrait de rendre ces DOI mieux repérables. C’est là la principale limite de ce système dans le cas des publications scientifiques (par opposition aux DOI CrossRef, qui semblent mieux adaptés).
  • Il est important de s’assurer d’une bonne compétence en matière de fourniture de fichiers CSV ou XML du côté du demandeur : dans notre configuration actuelle, le SCD ne gère que la partie « production de métadonnées ».
  • La question de la mise à jour des données (notamment en cas d’ajout ou de changement d’url) n’est pas techniquement difficile mais nécessite un suivi et une relance régulière des porteurs de projet pour assurer une réelle pérennité dans le temps à l’identifiant attribué.
  • Nous souhaitons tester la compatibilité de l’attribution de DOI pour les données avec d’autres systèmes de gestion de données, en particulier Nakala et Dataverse : y a-t-il redondance entre les deux systèmes ? Peut-on automatiser la récupération de métadonnées pour éviter une double saisie ? La question pourrait se poser dans le cadre de projets pour lesquelles les données sont déjà affectées d’un DOI et qu’elles doivent aussi entrer dans un entrepôt pour lequel l’université affecte des DOI, doit-on et peut-on utiliser le DOI pré-existant ou en générer un nouveau via notre schéma habituel.

Notes et références[modifier]

  1. https://mds.datacite.org/
  2. http://www.inist.fr/?Attribution-de-DOI
  3. http://climas.u-bordeaux-montaigne.fr/leaves
  4. http://adriaticummare.org
  5. 5,0 et 5,1 http://schema.datacite.org/meta/
  6. Nous utilisons pour cela une librairie PHP développée par Minh Duc Nguyen de l’Australian National Data Service disponible sur github : https://github.com/minhd/php-datacite-client