Tutoriel édition de mappings
De Dbpedia.fr.
Les mappings sont édités sur le site http://mappings.dbpedia.org, ce tutoriel présente le fonctionnalités de base des mappings. Une présentation plus complète est donnée dans la page Documentation mappings, la documentation en Anglais peut être consultée cette la page.
Sommaire |
En pratique
Scénario 1: mapping de modèles les plus fréquents
- Choisir un modèle à mapper dans la liste http://mappings.dbpedia.org/server/statistics/fr/. Les plus fréquents apparaissent en premier, un code de couleur indique l'état de complétude du mapping : du vert pour un mapping qui couvre presque toutes les propriétés, au rouge pour un mapping inexistant.
- Cliquer sur le modèle choisi pour aller sur la page d'édition du mapping, si la page existe, créer la page au besoin.
- Mapper le type de l'instance : voir TemplateMapping
- Mapper les propriétés : voir PropertyMapping
- Pour voir la liste des propriétés à mapper : enregister la page de mapping et cliquer sur le lien «properties are not mapped yet.»
- Tester le mapping : après avoir enregistré la page, cliquer sur le lien «Test this mapping».
Scénario 2: à partir d'un article en particulier
- L'identifiant de la ressource correspondante dans «DBpedia en français» est obtenu en remplaçant http://fr.wikipedia.org/wiki/ par http://fr.dbpedia.org/resource/ dans l'adresse de l'article Wikipédia.
Par exemple le Musée du Louvre, dont l'article wikipédia a l'adresse http://fr.wikipedia.org/wiki/Musée_du_Louvre est identifié par la resource DBpedia http://fr.dbpedia.org/resource/Musée_du_Louvre.
- Pour obtenir la liste des modèles utilisés dans l'article, remplacer http://fr.dbpedia.org/resource/Musée_du_Louvre par la ressource voulue dans la requête SPARQL :
select ?t where { <http://fr.dbpedia.org/resource/Musée_du_Louvre> <http://fr.dbpedia.org/property/wikiPageUsesTemplate> ?t . }
Dans l'exemple on obtient trois modèles : http://fr.dbpedia.org/resource/Modèle:Autres_projets, http://fr.dbpedia.org/resource/Modèle:Lien_web, http://fr.dbpedia.org/resource/Modèle:Infobox_Musée . La plupart du temps, ce sont les infobox qui nous intéressent : on va éditer le mapping des Infobox Musée.
- Éditer le modèle comme pour le Scénario 1.
- Pour tester le résultat du mapping sur la page voulue, tapper le titre (Ici Musée du Louvre) dans le champ Page title de la page http://mappings.dbpedia.org/server/extraction/fr/ .
Chercher une classe
- Le plus rapide est de parcourir la hiérarchie des classes : http://mappings.dbpedia.org/server/ontology/classes/ .
- Pour mapper un modèle, comparer à ce qui est fait pour les autres langues :
- il y a parfois des liens interlangues dans la page de définition du modèle (dont le lien est donné sur la page du mapping). Voir s'il existe des mappings pour ces modèles correspondants dans d'autres langues.
- prendre quelques ressources échantillon et chercher leur type sur les endpoints d'autres chapitres.
Chercher une propriété
C'est le plus difficile.
- La liste des propriétés est accessible à partir du menu à gauche du wiki de mappings : http://mappings.dbpedia.org/index.php?title=Special:AllPages&namespace=202 . C'est suffisant pour chercher des propriétés suivant les noms possibles (souvent les noms utilisés dans les infobox de Wikipedia en).
- Comparer à ce qui est fait dans d'autres langues. Si vous connaissez le type associé à l'infobox à mapper, par exemple http://dbpedia.org/ontology/Museum, la requête suivante permet d'obtenir les propriétés les plus fréquentes :
select distinct ?p (count (distinct ?s) as ?nb) where { ?s rdf:type <http://dbpedia.org/ontology/Museum> . ?s ?p ?v . filter(strstarts(str(?p),"http://dbpedia.org/ontology")) } group by ?p order by desc(?nb)
Cette requête peut être un peu trop lourde pour des modèles fréquemment utilisés, essayer de retirer la ligne avec "filter". Sinon, ne prenez qu'un échantillon :
select distinct ?p (count (distinct ?s) as ?nb) where { {select distinct ?s where {?s rdf:type <http://dbpedia.org/ontology/Museum> .} limit 10000 } ?s ?p ?v . filter(strstarts(str(?p),"http://dbpedia.org/ontology")) } group by ?p order by desc(?nb)
- Autre aide : cliquer sur le nom d'une classe dans la hiérarchie de classes, la page contient un tableau avec l'ensemble des propriétés déjà mappées à l'une des instances de cette classe.
Liens utiles
Pour l'édition de l'ontologie :
- Hiérarchie des classes : http://mappings.dbpedia.org/server/ontology/classes/
- Labels manquants en français : http://mappings.dbpedia.org/server/ontology/labels/missing/fr/
Pour l'édition de mappings :
- Statistiques des mappings en français http://mappings.dbpedia.org/server/statistics/fr/
- Liste des attribut à mapper pour un modèle : lien «properties are not mapped yet.» depuis la page du mapping
- Vérifier le rendu de l'extraction
- d'un article particulier avec http://mappings.dbpedia.org/server/extraction/fr/
- d'un mapping : lien «Test this mapping» depuis la page du mapping
- Dernière modification de cette page le 12 avril 2013 à 21:54.
- Cette page a été consultée 4 730 fois.