Outils personnels
User menu

Extraction du 22 février 2012

De Dbpedia.fr.

Version du 23 février 2012 à 13:51 par Julien.Cojan (discuter | contributions)
(diff) ← Version précédente | Voir la version courante (diff) | Version suivante → (diff)

Extraction partielle du dump wikipedia du 3 février 2012 avec l'extracteur InfoboxExtractor.

Cette extraction a eu pour but de corriger un problème de format des export XML/RDF. Les caractères "'", "(" et ")" ont été supprimés des nom de relations.


Nombre de pages wikipedia : 2 807 900 Adresses sous formes d'IRI ? oui

Nombre de triplets extraits : 125588538

fichier nbr de triplets
infobox_properties_fr 15896443
infobox_property_definitions_fr 31044
infobox_test_fr 15070246

Temps de chargement des données dans Virtuoso : 8033060ms