Bordeaux 3 - Statistiques TEL

De Bibliopedia
Révision datée du 18 novembre 2013 à 11:32 par Symac (discussion | contributions) (création page)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à : navigation, rechercher

Bordeaux 3 - Statistiques de téléchargement des thèses électroniques + portail des thèses[modifier]


Contexte[modifier]

Depuis le 1er janvier 2012, l'université Bordeaux 3 est passé au dépôt électronique des thèses. Le choix de la plateforme de diffusion s'est porté sur TEL<ref>http://tel.archives-ouvertes.fr</ref>.

Besoin[modifier]

Suite à la mise en place de la thèse électronique, deux besoins sont apparus :

  • présenter de manière simple les thèses soutenues et en cours à Bordeaux 3
  • obtenir des statistiques sur la consultation de ces thèses

Présentation des thèses[modifier]

Le premier point peut-être résolu par l'utilisation des web services mis en place par le site theses.fr. En ajoutant &format=xml à une url de theses.fr on obtient les résultats au format XML. Le fichier index.php intègre les différentes fonctions permettant d'afficher la liste des thèses. Ce script pourrait être amélioré par l'amélioration de la gestion des facettes.

Statistiques sur les thèses TEL[modifier]

Récupération des thèses TEL[modifier]

La récupération des thèses diffusées par TEL se fait par l'intermédiaire du serveur OAI du CCSD, à l'aide du script get_theses.php en moissonnant le set qui correspond au tampon de la bibliothèque.

Récupération des statistiques de téléchargement[modifier]

L'administrateur d'une collection HAL a la possibilité d'accéder aux statistiques de consultations des documents attachés aux collections dont il a la charge.

Pour ce second point, la première piste suivie a été d'utiliser la fonction getArticleCounter des web services HAL. Malheureusement on ne peut consulter les statistiques que pour les articles que l'on a déposé soi-même.

La solution finalement retenue a été de développer une solution de screen scraping à partir du compte administrateur de la collection (en effet, s'il n'est pas possible d'accéder aux statistiques de sa collection via le web service, il est possible de le faire par l'interface publique). Une méthode a donc été développée, basée sur la librairie php-curl<ref>http://php.net/manual/fr/book.curl.php</ref> et qui fonctionne en deux temps :

  • la fonction stats_init_session qui crée la connexion à l'interface d'admin et retourne le halsid qui correspond à l'identifiant de la session
  • la fonction stats_get_from_tel qui va prendre en paramètre l'identifiant tel de la notice et son identifiant dans la base de données puis va aller interroger le formulaire http://tel.archives-ouvertes.fr/stat_2011/consultationArticles/graphiqueNbCons.php avec les bons paramètres.

Code source[modifier]

Le code source développé par Bordeaux 3 est disponible sur github et peut être librement réutilisé.

Liens externes[modifier]

Notes et références[modifier]

<references/>