Tutoriel édition de mappings
De Dbpedia.fr.
Les mappings sont édités sur le site http://mappings.dbpedia.org, la documentation en Anglais peut être consultée cette la page.
Il s'agit d'un mediawiki, différentes données de DBpedia y sont éditées :
- l'ontologie
- les classes
- les propriétés
- les datatypes
- les mappings pour faire correspondre les modèles à des classes de l'ontologie et leurs attributs à des propriétés.
Sommaire |
Édition de l'ontologie
Édition des classes
Chaque classes est définie par un modèle {{Class}} dans la page dans l'espace de noms OntologyClass: avec le nom de la classe.
Par exemple la classe http://dbpedia.org/ontology/Person est définie dans la page http://mappings.dbpedia.org/index.php/OntologyClass:Person qui contient :
{{Class | labels = {{label|en|person}} {{label|de|Person}} {{label|fr|personne}} [...] | rdfs:subClassOf = Agent | owl:equivalentClass = foaf:Person, schema:Person }}
Le nom de la classe est donnée par le nom de la page qui contient ce modèle (ici Person), le modèle contient en plus les champs :
- label qui permet de donner les labels dans différentes langues en utilisant le modèle {{label}}. Ces entrées gênèrent des triplets avec la propriété rdfs:label.
- comments qui permet de donner une explication plus détaillée de la classe dans différentes langues avec les modèles {{comment}}. Ces entrées génèrent des triplets avec la propriété rdfs:comment. Une bonne pratique est d'y inclure une référence à un article Wikipédia ou Wiktionnaire.
- rdfs:subClassOf, owl:equivalentClass et owl:disjointWith pour placer la classe dans la hiérarchie de classes.
- specificProperties permet de spécifier l'unité par défaut à utiliser pour les valeurs d'une propriété applicable à cette classe.
Liens utiles:
- Hiérarchie de classes existantes : http://mappings.dbpedia.org/server/ontology/classes/
- Liste des classes sans label en français : http://mappings.dbpedia.org/server/ontology/labels/missing/fr/
Édition des propriétés
Chaque propriété est définie dans la page dans l'espace de noms OntologyProperty: avec le nom de la propriété.
Deux modèles sont utilisés suivant s'il s'agit
- d'une propriété ayant pour valeur des instances : {{ObjectProperty}},
- ou une propriété ayant pour valeur des litéraux : {{DatatypeProperty}}.
Les champs de ces modèles sont les mêmes, la seule différence concerne les valeurs admises pour le champ rdfs:range.
Par exemple pour propriété http://dbpedia.org/ontology/locationCity est définie dans la page http://mappings.dbpedia.org/index.php/OntologyProperty:LocationCity qui contient :
{{ObjectProperty | labels = {{label|en|location city}} {{label|fr|situé dans la ville}} [...] | rdfs:domain = Organisation | rdfs:range = City | rdfs:subPropertyOf = location |comments = {{comment|en|City the thing is located.}} }}
Le champ rdfs:range doit contenir une classe définie dans le wiki.
La propriété http://dbpedia.org/ontology/birthDate est définie dans la page http://mappings.dbpedia.org/index.php/OntologyProperty:BirthDate qui contient :
{{DatatypeProperty | labels = {{label|en|birth date}} {{label|fr|date de naissance}} {{label|de|Geburtsdatum}} [...] | rdfs:domain = Person | rdfs:range = xsd:date | rdf:type = owl:FunctionalProperty | owl:equivalentProperty = schema:birthDate }}
Le champ rdfs:range doit contenir soit un datatype XSD, soit un datatype défini dans le wiki (voir #Édition_des_datatypes).
Les autres champs sont en commun :
- labels et comments, définis comme pour les classes permettent d'exprimer et d'expliquer la propriété dans différentes langues.
- rdfs:domain donne le domaine de la propriété, c'est-à-dire une classe à laquelle doivent appartenir les sujets de la propriété, celle-ci doit avoir été définie dans le wiki.
- rdfs:subPropertyOf et owl:equivalentProperty permettent de définir des relations de généralisation/spécialisation ou d'équivalence par rapport à d'autres propriétés, celles-ci doivent être définies dans le wiki.
- rdf:type permet de préciser le type de la propriété (au delà du type owl:ObjectProperty / owl:DatatypeProperty). Actuellement seul le type owl:FunctionalProperty peut être donné, il signifie que la propriété définit une fonction, c'est-à-dire qu'elle ne peut prendre qu'une valeur par sujet.
Liens utiles :
- Liste des propriétés : http://mappings.dbpedia.org/index.php?title=Special:AllPages&namespace=202
- Liste des propriétés sans label en français : http://mappings.dbpedia.org/server/ontology/labels/missing/fr/
Édition des datatypes
Les datatypes (ou types de données) permettent de définir des types de valeurs absents du vocabulaire XSD, notemment pour définir des unités (centimètre, litre, ...)
Chaque type de donnée est définie par un modèle {{Datatype}} dans la page dans l'espace de noms Datatype: avec le nom du type de donnée.
Par exemple la classe http://dbpedia.org/ontology/Currency est définie dans la page http://mappings.dbpedia.org/index.php/Datatype:Currency qui contient :
{{Datatype |labels = {{label|en|Currency}} {{label|fr|Monnaie}} [...] }}
Liens utiles :
- Liste des datatypes http://mappings.dbpedia.org/index.php?title=Special:AllPages&namespace=206
- Liste des datatypes sans label en français : http://mappings.dbpedia.org/server/ontology/labels/missing/fr/
Édition des mappings
Principe
Les modèles (template en anglais), en particulier les infobox sont utilisés pour donner des informations factuelles sur les éléments décrits. Différents modèles sont utilisés suivant le type du sujet décrit (Artiste, Batiment, Évènement ...)
Chaque modèle contient une liste d'attributs qui contiennent les valeurs décrivant le sujet. La signification des attributs dépend du modèle, par exemple dans les Infobox Musée, l'attribut pays désigne l'emplacement du musée, alors que dans les Infobox Cycliste il désigne la nationalité sportive du cycliste.
Les mappings permettent deux choses :
- typer les instances en associant une classe de l'ontologie à chaque modèle
- traduire les attributs des modèles en propriétés de l'ontologie.
Mapping élémentaire d'un modèle
Le mapping d'un modèle de Wikipédia en français est défini par un modèle [http://mappings.dbpedia.org/index.php/Template:TemplateMapping {{TemplateMapping}} dans une page de l'espace de noms Mapping_fr: suivi du nom du modèle.
Par exemple le mapping du modèle [Infobox Arbitre] est défini dans la page http://mappings.dbpedia.org/index.php/Mapping_fr:Infobox_Arbitre qui contient :
{{TemplateMapping | mapToClass = Referee | mappings = {{PropertyMapping | templateProperty = nom | ontologyProperty = foaf:name }} {{PropertyMapping | templateProperty = nom_de_l'arbitre | ontologyProperty = foaf:name }} {{PropertyMapping | templateProperty = surnom | ontologyProperty = foaf:nick }} {{PropertyMapping | templateProperty = date_de_naissance | ontologyProperty = birthDate }} [...] }}
Le champ mapToClass donne la classe a associer au modèle mappé, ici toutes les instances dont l'article Wikipédia contient une [Infobox Arbitre] prendra le type http://dbpedia.org/ontology/Referee. La classe doit être définie dans le wiki.
Le champ mappings contient les mappings des attributs (appelés ici template properties). Les mappings d'attributs sont définis dans les modèles {{PropertyMapping}} avec les champs :
- templateProperty : l'attribut du modèle mappé
- ontologyProperty : propriété associée à l'attribut (doit être définie dans le wiki).
- unit permet de spécifier le type de données associé si la propriété est de type owl:DatatypeProperty (soit un dataype xsd, soit défini dans le wiki)
- facteur permet de multiplier la valeur trouvée par ce facteur, par exemple si un nombre est exprimé en millions.