Bordeaux 3 - Statistiques TEL

De Bibliopedia
Aller à : navigation, rechercher

Bordeaux 3 - Statistiques de téléchargement des thèses électroniques + portail des thèses


Contexte

Depuis le 1er janvier 2012, l'université Bordeaux 3 est passé au dépôt électronique des thèses. Le choix de la plateforme de diffusion s'est porté sur TEL<ref>http://tel.archives-ouvertes.fr</ref>.

Besoin

Suite à la mise en place de la thèse électronique, deux besoins sont apparus :

  • présenter de manière simple les thèses soutenues et en cours à Bordeaux 3
  • obtenir des statistiques sur la consultation de ces thèses

Présentation des thèses

Le premier point peut-être résolu par l'utilisation des web services mis en place par le site theses.fr. En ajoutant &format=xml à une url de theses.fr on obtient les résultats au format XML. Le fichier index.php intègre les différentes fonctions permettant d'afficher la liste des thèses. Ce script pourrait être amélioré par l'amélioration de la gestion des facettes.

Statistiques sur les thèses TEL

Récupération des thèses TEL

La récupération des thèses diffusées par TEL se fait par l'intermédiaire du serveur OAI du CCSD, à l'aide du script get_theses.php en moissonnant le set qui correspond au tampon de la bibliothèque.

Récupération des statistiques de téléchargement

L'administrateur d'une collection HAL a la possibilité d'accéder aux statistiques de consultations des documents attachés aux collections dont il a la charge.

Pour ce second point, la première piste suivie a été d'utiliser la fonction getArticleCounter des web services HAL. Malheureusement on ne peut consulter les statistiques que pour les articles que l'on a déposé soi-même.

La solution finalement retenue a été de développer une solution de screen scraping à partir du compte administrateur de la collection (en effet, s'il n'est pas possible d'accéder aux statistiques de sa collection via le web service, il est possible de le faire par l'interface publique). Une méthode a donc été développée, basée sur la librairie php-curl<ref>http://php.net/manual/fr/book.curl.php</ref> et qui fonctionne en deux temps :

  • la fonction stats_init_session qui crée la connexion à l'interface d'admin et retourne le halsid qui correspond à l'identifiant de la session
  • la fonction stats_get_from_tel qui va prendre en paramètre l'identifiant tel de la notice et son identifiant dans la base de données puis va aller interroger le formulaire http://tel.archives-ouvertes.fr/stat_2011/consultationArticles/graphiqueNbCons.php avec les bons paramètres.

Code source

Le code source développé par Bordeaux 3 est disponible sur github et peut être librement réutilisé.

Liens externes

Notes et références

<references/>