Home
De Dbpedia.fr.
(Suppression du sommaire) |
|||
Ligne 118 : | Ligne 118 : | ||
ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr | ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr | ||
pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr | pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr | ||
+ | |||
+ | == Qui ? == | ||
+ | Cette initiative est une convention entre l'équipe [http://wimmics.inria.fr Wimmics] d'[http://www.inria.fr Inria] et le [http://www.culturecommunication.gouv.fr/ Ministère de la Culture et de la Communication] avec le soutient de l'[http://www.iri.centrepompidou.fr/ Institut de recherche et d’innovation] et la [http://www.wikimedia.fr/ fondation Wikimédia France]. |
Version du 14 février 2012 à 09:39
Le projet DBpedia.fr a pour but de créer une version francophone de la base DBpedia qui est utilisée dans de nombreuses applications anglophones, notamment pour la publication de collections culturelles.
État projet |
|
Statut | Alpha |
Données publiées | Extraction du 16 décembre 2011 |
Qu’est-ce que DBpedia ?
Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de Wikipédia afin de rendre ces données disponibles sur le Web.
En tant que base de connaissances, DBpedia a plusieurs avantages sur les bases existantes. Elle couvre de très nombreux domaines, capture un véritable consensus collectif qui évolue automatiquement en fonction des transformations de Wikipédia et peut ainsi suivre les nouvelles tendances, pierre d’achoppement de la plupart des référentiels et autres thésaurus peuplant les systèmes d’information traditionnels. Elle fournit dès lors un large référentiel vivant pour d’autres collections de ressources sur le Web et rend possible, entre autre et dans le désordre : leur identification, indexation, références croisées, intégration, interrogation structurée, et même certaines formes de raisonnement automatique utiles, par exemple, à la recherche d’information. DBPedia permet donc de répondre automatiquement à des requêtes structurées complexes sur les données de Wikipédia et de les lier à d'autres ensembles de données sur le Web.
À quoi sert DBpedia ?
Pour les détenteurs de données :
DBpedia permet d'ouvrir de nouveaux moyens d’accès à ces données et d'en accroître la valeur.
Pour les développeurs :
DBpedia fournit des données pour alimenter les applications et répondre aux besoins des utilisateurs.
D'autres utilisations peuvent être imaginées, par exemple la recherche de descripteurs partagés à l’échelle du Web afin de les reprendre pour d'autres référentiels (classifications bibliothéconomiques, thésauri, etc.).
Quelques exemples d'utilisation :
- La plateforme consacrée aux documentaires animaliers de la BBC exploite les données et catégories de DBpedia afin de proposer une meilleure structuration de ses contenus et une navigation enrichie.
- L’expérience “Picture Book Mashup” du Brooklyn Museum associe DBpedia au catalogue du musée pour créer un album interactif et structuré de la collection.
- La collection complète du Musée d’Amsterdam est disponible sur le « Linked Open Data » (5 millions de triplets RDF décrivant plus de 70 000 objets du patrimoine culturel lié à la ville d'Amsterdam), fournissant des liens vers un thésaurus (AATNed), une liste d'artistes (ULAN), une base de lieux (Geonames) et les ressources de DBpedia pour en enrichir la structuration et l’exploitation.
- Le « Museum Finland » dont l’intégration du catalogue à d’autres bases permet notamment la navigation en anglais dans une collection finlandaise.
Des problématiques et exemples similaires existent tant pour les bibliothèques que les archives comme l’INA par exemple. Chaque lien créé entre les bases dégage un accès supplémentaire à la collection permettant aux utilisateurs et à leurs applications d’y entrer et d’en sortir selon autant de nouveaux parcours.
Pourquoi un DBpedia Français ?
Dans sa version Française, Wikipédia compte très précisément (au moment où nous écrivons ces lignes) 1 210 130 articles traitant de culture, géographie, histoire, sciences, divertissement, société ou technologie. Malheureusement, DBPedia, centré sur la version anglaise de Wikipédia, ignore par conséquent les articles en français ne bénéficiant pas d’équivalents anglais et n’en expose donc pas les données.
A ce jour, l’Allemagne, la Grèce et la Corée ont toutes trois mis en place des versions de DBPedia dans leurs langues nationales respectives. La version française est actuellement absente, ce qui retarde l’intégration de nombreuses collections françaises, comme francophones, au Web de données. Ainsi, le célèbre quatuor « Les Frères Jacques » n’est pas identifié dans DBPedia car l’article décrivant ces artistes est absent de la version anglaise. Ce défaut signifie que pour toutes les ressources culturelles francophones dans le même cas, aucunes données n’existent dans DBPedia qui permettraient de les référencer, de les indexer, de les interroger, etc.
Partant, il est extrêmement important de garantir la pérennité d’un site qui publierait de telles données afin d’assurer la stabilité des liens qu’il autoriserait (dans tous les sens du terme) ; la stabilité constituant la condition sine qua non pour que d’autres applications et d’autres jeux de données fondent leur déploiement et leur expansion sur cette base.
Enfin, en s’inscrivant dans un calendrier à court terme, l’initiative pourra bénéficier de la dynamique de Datalift, projet financé par l'Agence Nationale de la Recherche (ANR), dont le but est de développer une plateforme de publication et d’interconnexion des jeux de données liés (Linked data) sur le Web (outre la publication de données gouvernementales, la spécificité de Data Lift étant la prise en compte des besoins des acteurs de la culture et de la recherche). Datalift propose ainsi un ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr
Qui ?
Cette initiative est une convention entre l'équipe Wimmics d'Inria et le Ministère de la Culture et de la Communication avec le soutient de l'Institut de recherche et d’innovation et la fondation Wikimédia France.