Chargement des données dans Virtuoso
De Dbpedia.fr.
(Différences entre les versions)
m (saut de ligne nécessaire dans la commande SQL) |
(→methode 2 : mis à jour méthode rdfloader) |
||
Ligne 26 : | Ligne 26 : | ||
=== methode 2 === | === methode 2 === | ||
- | Avec la | + | Avec la fonction rdfloader (préinstallée dans Virtuoso 6.1.5. Sinon, le code sql est donné dans ce [http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VirtBulkRDFLoaderExampleDbpedia tutoriel]). |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
* Sélectionnez les fichiers à charger : | * Sélectionnez les fichiers à charger : | ||
<nowiki>SQL> ld_dir ('[répertoire des fichiers à charger]', '*.nt', 'http://fr.dbpedia.org');</nowiki> | <nowiki>SQL> ld_dir ('[répertoire des fichiers à charger]', '*.nt', 'http://fr.dbpedia.org');</nowiki> | ||
Remarque: selon la documentation, rdfloader est capable de lire directement les données dans des fichiers compressés en gzip, il faut alors remplacer <nowiki>'*.nt'</nowiki> par <nowiki>'*.nt.gz'</nowiki>. | Remarque: selon la documentation, rdfloader est capable de lire directement les données dans des fichiers compressés en gzip, il faut alors remplacer <nowiki>'*.nt'</nowiki> par <nowiki>'*.nt.gz'</nowiki>. | ||
Ca ne marche pas avec des fichiers compressés en bzip2. | Ca ne marche pas avec des fichiers compressés en bzip2. | ||
- | + | ||
- | + | Il faut aussi que le ''[répertoire des fichiers à charger]'' soit listé dans l'attribut '''DirsAllowed''' du fichier de configuration '''virtuoso.ini''', sinon un message d'erreur | |
* Lancer le chargement des données : | * Lancer le chargement des données : | ||
<nowiki>SQL> rdf_loader_run ();</nowiki> | <nowiki>SQL> rdf_loader_run ();</nowiki> | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- |
Version du 21 mars 2013 à 13:56
Essais
methode 1
DB.DBA.TTLP_MT(file_to_string_output('[fichier .nt]'), , '[nom de graphe]', 255);
Machine | RAM | NumberOfBuffers | MaxDirtyBuffers | Temps de chargement | max charge CPU (somme freq) | max RAM utilisée |
dbpedia.inria.fr, 2CPU | 8 Go | 2000 | 1200 | 2225054 msec - 37 min | 2500 MHz | 2600 Mo |
methode 2
Avec la fonction rdfloader (préinstallée dans Virtuoso 6.1.5. Sinon, le code sql est donné dans ce tutoriel).
- Sélectionnez les fichiers à charger :
SQL> ld_dir ('[répertoire des fichiers à charger]', '*.nt', 'http://fr.dbpedia.org');
Remarque: selon la documentation, rdfloader est capable de lire directement les données dans des fichiers compressés en gzip, il faut alors remplacer '*.nt' par '*.nt.gz'. Ca ne marche pas avec des fichiers compressés en bzip2.
Il faut aussi que le [répertoire des fichiers à charger] soit listé dans l'attribut DirsAllowed du fichier de configuration virtuoso.ini, sinon un message d'erreur
- Lancer le chargement des données :
SQL> rdf_loader_run ();