Outils personnels
User menu

Relevé des logs d'accès

De Dbpedia.fr.

Une synthèse des logs est écrite chaque jour dans une page de la Catégorie:LogsAccès.

Les logs sont générés par Virtuoso, voir Déploiement_de_Virtuoso pour activer la génération de logs.

Trois valeurs sont relevées:

  • le nombre de requêtes SPARQL
  • le nombre de déréférencement (accès aux pages /resource/[...] , /resourceById/[...], /property/[...] et /ontology/[...].
  • le nombre d'accès unique (i.e., le nombre d'adresses IP différentes apparaissant dans les logs).


Sommaire

Relevé des logs

Un script perl AccessLogParser-Virtuoso permet de parser les logs Virtuoso pour obtenir ces valeurs.

Un autre script perl ReportAccessLog appelle le bot pywikimedia pour charger les valeurs dans le wiki.


Chargement dans le wiki

Les données sont chargées dans le wiki par un bot pywikipediabot qui publie sur le wiki avec le compte WikiBot.


Configuration de pywikipediabot

Explication adpatée de http://www.mediawiki.org/wiki/Manual:Pywikipediabot/Use_on_non-WMF_wikis.

Testé avec la version pywikipedia, à tester avec pywikipedia-rewrite.

Après avoir téléchargé et dézippé le fichier pywikipedia-nightly.zip, aller dans le répertoire pywikipedia.

Editer le fichier user-config.py :

mylang='fr'
family = 'DBpediaFr'
usernames['DBpediaFr']['fr']=u'WikiBot'
console_encoding = 'utf-8'

Générer le fichier /families/DBpediaFr_family.py :

$ python generate_family_file.py

et entrer l'adresse du wiki (sans index.php) et son nom lorsqu'ils vous sont demandés.

Pour tester, exécuter

python login.py

On devrait vous demander le mot de passe de WikiBot et vous dire que vous êtes bien connectés.


Bot pour l'écriture des logs

A Faire : écrire un bot spécialisé pour le chargement des logs (qui controle aussi le parsing des logs).

Pour l'instant, on utilise le bot create_page.py, non fourni avec pywikipediabot. Quelle origine ???

Le code est donné sur la page: create_page,l'auteur est inconnu.

  • Dernière modification de cette page le 29 novembre 2012 à 08:33.
  • Cette page a été consultée 1 393 fois.