Chargement des données dans Virtuoso
De Dbpedia.fr.
Version du 21 mars 2013 à 13:56 par Julien.Cojan (discuter | contributions)
Essais
methode 1
DB.DBA.TTLP_MT(file_to_string_output('[fichier .nt]'), , '[nom de graphe]', 255);
Machine | RAM | NumberOfBuffers | MaxDirtyBuffers | Temps de chargement | max charge CPU (somme freq) | max RAM utilisée |
dbpedia.inria.fr, 2CPU | 8 Go | 2000 | 1200 | 2225054 msec - 37 min | 2500 MHz | 2600 Mo |
methode 2
Avec la fonction rdfloader (préinstallée dans Virtuoso 6.1.5. Sinon, le code sql est donné dans ce tutoriel).
- Sélectionnez les fichiers à charger :
SQL> ld_dir ('[répertoire des fichiers à charger]', '*.nt', 'http://fr.dbpedia.org');
Remarque: selon la documentation, rdfloader est capable de lire directement les données dans des fichiers compressés en gzip, il faut alors remplacer '*.nt' par '*.nt.gz'. Ca ne marche pas avec des fichiers compressés en bzip2.
Il faut aussi que le [répertoire des fichiers à charger] soit listé dans l'attribut DirsAllowed du fichier de configuration virtuoso.ini, sinon un message d'erreur
- Lancer le chargement des données :
SQL> rdf_loader_run ();