InterLanguageLinksExtractor
De Dbpedia.fr.
(Created page with "Lie l’instance avec les instances tirées des pages Wikipedia traitant du même sujet dans d’autres langues. Fonctionne après une petite modification du code. == Triple...") |
(→Triplets générés) |
||
Ligne 14 : | Ligne 14 : | ||
[[Category:Extracteur]] | [[Category:Extracteur]] | ||
+ | |||
+ | |||
+ | == Générer les liens owl:SameAs == | ||
+ | |||
+ | Les liens interlangues servent à établir les relations s'équivalence entre les ressources de chapitres linguistiques de DBpedia. | ||
+ | |||
+ | Les liens interlangues de wikipédia sont censés relier des pages traîtant du même sujet dans différentes langues. En pratique, il arrive qu'il y ait une légère différence de sens. On peut alors se trouver dans le cas où une page A en français est reliée à une page B en anglais qui est elle même reliée à une page C en français. Il ne faut pas établir de relations owl:sameAs entre les ressources correspondantes car cela impliquerait l'équivalence entre les sujets des pages A et C. | ||
+ | |||
+ | Le script ''[déport extraction_framework]/scripts/shell-scripts/interwiki_links/interwiki_links.sh'' effectue une vérification de symétrie des liens interlangue avant d'établir les relations owl:sameAs. | ||
+ | |||
+ | -- ToDo, expliquer comment faire -- |
Version du 14 janvier 2013 à 15:11
Lie l’instance avec les instances tirées des pages Wikipedia traitant du même sujet dans d’autres langues.
Fonctionne après une petite modification du code.
Triplets générés
interlanguage_links_en.nt | ||
---|---|---|
dbr:[NomPage] | owl:sameAs | [resource autre langue]:[NomPage autre langue] |
Générer les liens owl:SameAs
Les liens interlangues servent à établir les relations s'équivalence entre les ressources de chapitres linguistiques de DBpedia.
Les liens interlangues de wikipédia sont censés relier des pages traîtant du même sujet dans différentes langues. En pratique, il arrive qu'il y ait une légère différence de sens. On peut alors se trouver dans le cas où une page A en français est reliée à une page B en anglais qui est elle même reliée à une page C en français. Il ne faut pas établir de relations owl:sameAs entre les ressources correspondantes car cela impliquerait l'équivalence entre les sujets des pages A et C.
Le script [déport extraction_framework]/scripts/shell-scripts/interwiki_links/interwiki_links.sh effectue une vérification de symétrie des liens interlangue avant d'établir les relations owl:sameAs.
-- ToDo, expliquer comment faire --