Extraction du 22 février 2012
De Dbpedia.fr.
(Différences entre les versions)
Julien.Cojan (discuter | contributions)
(Page créée avec « Extraction partielle du dump wikipedia du 3 février 2012 avec l'extracteur InfoboxExtractor. Cette extraction a eu pour but de corriger un problème de format des e... »)
Modification suivante →
(Page créée avec « Extraction partielle du dump wikipedia du 3 février 2012 avec l'extracteur InfoboxExtractor. Cette extraction a eu pour but de corriger un problème de format des e... »)
Modification suivante →
Version du 23 février 2012 à 13:51
Extraction partielle du dump wikipedia du 3 février 2012 avec l'extracteur InfoboxExtractor.
Cette extraction a eu pour but de corriger un problème de format des export XML/RDF. Les caractères "'", "(" et ")" ont été supprimés des nom de relations.
Nombre de pages wikipedia : 2 807 900
Adresses sous formes d'IRI ? oui
Nombre de triplets extraits : 125588538
fichier | nbr de triplets |
infobox_properties_fr | 15896443 |
infobox_property_definitions_fr | 31044 |
infobox_test_fr | 15070246 |
Temps de chargement des données dans Virtuoso : 8033060ms