Chargement des données dans Virtuoso
De Dbpedia.fr.
(simplification, méthode rdfloader en méthode 1) |
(mise à jour) |
||
Ligne 1 : | Ligne 1 : | ||
- | == | + | == Supprimer les données à remplacer == |
- | + | Lors de la suppression d'un volume de données important, Virtuoso peut bloquer voir [http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VirtTipsAndTricksGuideDeleteLargeGraphs la documentation de Virtuoso]. Pour éviter cela, changer le niveau de logs : | |
+ | <nowiki>$ isql-v | ||
+ | > log_enable(3,1);</nowiki> | ||
+ | |||
+ | La suppression des données d'un graphe se fait par la commande : | ||
+ | <nowiki>$ isql-v | ||
+ | > SPARQL CLEAR GRAPH <graph-name>;</nowiki> | ||
+ | |||
+ | |||
+ | |||
+ | == Charger les données == | ||
+ | |||
+ | La fonction rdfloader est préinstallée depuis la version 6.1.5 de Virtuoso. Pour les verions précédentes, importer le sql donné dans ce [http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VirtBulkRDFLoaderExampleDbpedia tutoriel]). | ||
* Sélectionnez les fichiers à charger : | * Sélectionnez les fichiers à charger : | ||
Ligne 11 : | Ligne 23 : | ||
* Lancer le chargement des données : | * Lancer le chargement des données : | ||
<nowiki>SQL> rdf_loader_run ();</nowiki> | <nowiki>SQL> rdf_loader_run ();</nowiki> | ||
- | |||
- | |||
- | |||
- | |||
- |
Version du 4 septembre 2013 à 22:38
Supprimer les données à remplacer
Lors de la suppression d'un volume de données important, Virtuoso peut bloquer voir la documentation de Virtuoso. Pour éviter cela, changer le niveau de logs :
$ isql-v > log_enable(3,1);
La suppression des données d'un graphe se fait par la commande :
$ isql-v > SPARQL CLEAR GRAPH <graph-name>;
Charger les données
La fonction rdfloader est préinstallée depuis la version 6.1.5 de Virtuoso. Pour les verions précédentes, importer le sql donné dans ce tutoriel).
- Sélectionnez les fichiers à charger :
SQL> ld_dir ('[répertoire des fichiers à charger]', '*.nt', 'http://fr.dbpedia.org');
Remarque: selon la documentation, rdfloader est capable de lire directement les données dans des fichiers compressés en gzip, il faut alors remplacer '*.nt' par '*.nt.gz'. Ca ne marche pas avec des fichiers compressés en bzip2.
Il faut aussi que le [répertoire des fichiers à charger] soit listé dans l'attribut DirsAllowed du fichier de configuration virtuoso.ini, sinon un message d'erreur
- Lancer le chargement des données :
SQL> rdf_loader_run ();