Home
De Dbpedia.fr.
(→Pourquoi un DBpedia en français ?) |
|||
(30 versions intermédiaires masquées) | |||
Ligne 1 : | Ligne 1 : | ||
- | + | Ce projet a pour but de créer une version francophone de la base [http://dbpedia.org DBpedia] qui est utilisée dans de | |
nombreuses applications anglophones, notamment pour la publication de collections culturelles. | nombreuses applications anglophones, notamment pour la publication de collections culturelles. | ||
+ | __NOTOC__ | ||
+ | <div style="clear:both; overflow:auto;"> | ||
+ | <div style="max-width: 400px; float:left; margin-left: 30px;"> | ||
+ | <table style="font-size: 95%; border:1px solid grey; max-width: 300px; "> | ||
+ | <tr> | ||
+ | <td colspan="2" align="center" width="270" style="background: #fdbb21; font-size: 110%;"> | ||
+ | <p><b><span class="fn org">État projet</span></b></p> | ||
+ | </td> | ||
+ | </tr> | ||
+ | <tr><td>Statut</td><td>Alpha</td></tr> | ||
+ | <tr><td>Données</td><td>{{#ask: [[serveur SPARQL]] | ?loadedData= }}</td></tr> | ||
+ | <!-- tr><td>Développement</td><td>[[Liste des tâches]]</td></tr --> | ||
+ | </table> | ||
+ | </div> | ||
- | <div style="max-width: | + | <div style="max-width: 400px; float:left; margin-left: 30px;"> |
- | <table style="font-size: 95%; border:1px solid grey; border-spacing:2 2px; "> | + | <table style="font-size: 95%; border:1px solid grey; border-spacing:2 2px; max-width: 300px;"> |
<tr> | <tr> | ||
<td align="center" width="270" style="background: #608090; font-size: 110%;"> | <td align="center" width="270" style="background: #608090; font-size: 110%;"> | ||
Ligne 11 : | Ligne 25 : | ||
</tr> | </tr> | ||
<tr><td> | <tr><td> | ||
- | [ | + | [[Serveur SPARQL]] |
<br/> | <br/> | ||
[[Installation des outils d'extraction]] | [[Installation des outils d'extraction]] | ||
<br/> | <br/> | ||
- | [[ | + | [[Configuration de Virtuoso| Mise en place d'un serveur SPARQL]] |
<br/> | <br/> | ||
[[:Category:Extracteur | Extracteurs]] | [[:Category:Extracteur | Extracteurs]] | ||
<br/> | <br/> | ||
- | [[ | + | [[Bilan des extractions]] |
</td></tr> | </td></tr> | ||
</table> | </table> | ||
</div> | </div> | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
</div> | </div> | ||
== Qu’est-ce que DBpedia ? == | == Qu’est-ce que DBpedia ? == | ||
- | [http:// | + | Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de [http://wikipedia.org Wikipédia] afin de rendre ces données disponibles sur le Web. |
- | sur le Web | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | En tant que base de connaissances, [http://dbpedia.org DBpedia] a plusieurs avantages sur les bases existantes. Elle | |
- | + | ||
- | tant que base de connaissances, | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
couvre de très nombreux domaines, capture un véritable consensus collectif qui évolue | couvre de très nombreux domaines, capture un véritable consensus collectif qui évolue | ||
automatiquement en fonction des transformations de Wikipédia et peut ainsi suivre les nouvelles | automatiquement en fonction des transformations de Wikipédia et peut ainsi suivre les nouvelles | ||
Ligne 72 : | Ligne 52 : | ||
identification, indexation, références croisées, intégration, interrogation structurée, et même | identification, indexation, références croisées, intégration, interrogation structurée, et même | ||
certaines formes de raisonnement automatique utiles, par exemple, à la recherche d’information. | certaines formes de raisonnement automatique utiles, par exemple, à la recherche d’information. | ||
- | + | DBpedia permet donc de répondre automatiquement à des requêtes structurées complexes sur les | |
données de Wikipédia et de les lier à d'autres ensembles de données sur le Web. | données de Wikipédia et de les lier à d'autres ensembles de données sur le Web. | ||
+ | <!-- | ||
+ | En tant que base de connaissances, DBpedia bénéficie donc du gigantesque corpus de Wikipédia et | ||
+ | décrit actuellement plus de 3,5 million de d’objets, dont 364 000 personnes, 462 000 lieux, 99 000 | ||
+ | albums de musique, 54 000 films, 17 000 jeux vidéo, 148 000 organisations, 169 000 espèces et 5 200 | ||
+ | maladies. Les données de DBpedia décrivent en outre ces 3,5 millions d’éléments dans 97 langues | ||
+ | différentes et proposent 1 850 000 liens vers des images et 5 900 000 liens vers des pages Web | ||
+ | externes. --> | ||
- | + | == À quoi sert DBpedia ? == | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | '''Pour les détenteurs de données :''' | |
- | + | DBpedia permet d'ouvrir de nouveaux moyens d’accès à ces données et d'en accroître la valeur. | |
- | + | <br/> | |
- | catalogue du musée pour créer un album interactif et structuré de la collection. | + | '''Pour les développeurs :''' |
- | collection complète du Musée | + | DBpedia fournit des données pour alimenter les applications et répondre aux besoins des utilisateurs. |
- | de triplets RDF décrivant plus de 70 000 objets du patrimoine culturel lié à la ville d'Amsterdam), | + | <br/> |
- | fournissant des liens vers un thésaurus (AATNed), une liste d'artistes (ULAN), une base de lieux | + | D'autres utilisations peuvent être imaginées, par exemple la recherche de descripteurs partagés à l’échelle du Web pour les reprendre dans d'autres référentiels (classifications bibliothéconomiques, thésauri, etc.). |
- | (Geonames) et les ressources de | + | |
- | + | ==== Quelques exemples d'utilisation :==== | |
- | navigation en anglais dans une collection finlandaise | + | * La plateforme consacrée aux documentaires animaliers de la BBC exploite les données et catégories de DBpedia afin de proposer une meilleure structuration de ses contenus et une navigation enrichie. |
+ | * L’expérience “Picture Book Mashup” du Brooklyn Museum associe DBpedia au catalogue du musée pour créer un album interactif et structuré de la collection. | ||
+ | * La collection complète du Musée d’Amsterdam est disponible sur le « Linked Open Data » (5 millions de triplets RDF décrivant plus de 70 000 objets du patrimoine culturel lié à la ville d'Amsterdam), fournissant des liens vers un thésaurus (AATNed), une liste d'artistes (ULAN), une base de lieux (Geonames) et les ressources de DBpedia pour en enrichir la structuration et l’exploitation. | ||
+ | * Le « Museum Finland » dont l’intégration du catalogue à d’autres bases permet notamment la navigation en anglais dans une collection finlandaise. | ||
Des problématiques et exemples similaires existent tant pour les bibliothèques que les archives | Des problématiques et exemples similaires existent tant pour les bibliothèques que les archives | ||
comme l’INA par exemple. Chaque lien créé entre les bases dégage un accès supplémentaire à la | comme l’INA par exemple. Chaque lien créé entre les bases dégage un accès supplémentaire à la | ||
collection permettant aux utilisateurs et à leurs applications d’y entrer et d’en sortir selon autant de | collection permettant aux utilisateurs et à leurs applications d’y entrer et d’en sortir selon autant de | ||
- | nouveaux parcours | + | nouveaux parcours. |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | == Pourquoi un | + | == Pourquoi Semanticpedia, un dbpedia en français ? == |
- | Dans sa version | + | Dans sa version francophone, Wikipédia compte très précisément (au moment où nous écrivons ces |
- | lignes) 1 | + | lignes) 1 210 130 articles traitant de culture, géographie, histoire, sciences, divertissement, société |
- | ou technologie. Malheureusement, | + | ou technologie. Malheureusement, DBpedia, centré sur la version anglophone de Wikipédia, ignore par |
- | conséquent les articles en français ne bénéficiant pas d’équivalents anglais et n’en expose donc pas | + | conséquent les articles en français ne bénéficiant pas d’équivalents en anglais et n’en expose donc pas |
les données. | les données. | ||
- | + | Par exemple, le célèbre quatuor « Les Frères Jacques » n’est pas identifié dans DBpedia car l’article décrivant | |
- | ces artistes est absent de la version | + | ces artistes est absent de la version anglophone. La version francophone de contient les données consultables sur [http://dbpedia.inria.fr/resource/Les_Frères_Jacques cette page]. |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | données | + | |
- | + | ||
- | + | ||
+ | Différentes [http://wiki.dbpedia.org/Internationalization/Chapters versions locales de DBpedia], | ||
+ | dont la version francophone ont pour but de donner accès aux données publiées dans les version respectives de Wikipedia. | ||
+ | La version francophone de DBpedia offre ainsi la possibilité d'interroger ces données mais aussi d'intégrer différentes ressources francophones au Web de données. | ||
+ | Si ce projet a ses spécificités, il travaille cependant étroitement avec les responsable de DBpedia.org : http://dbpedia.org/Internationalization | ||
+ | <!-- Il faut aussi noter l’importance d’une gouvernance publique en première ligne sur ces questions pour | ||
+ | éviter une prise de contrôle par des acteurs ne partageant pas le souci de l’accès ouvert aux données | ||
+ | relevant de l’utilité publique. --> | ||
+ | <!-- | ||
== Pourquoi maintenant ? == | == Pourquoi maintenant ? == | ||
- | |||
- | |||
- | |||
- | |||
Il faut aussi noter l’importance d’une gouvernance publique en première ligne sur ces questions pour | Il faut aussi noter l’importance d’une gouvernance publique en première ligne sur ces questions pour | ||
Ligne 149 : | Ligne 116 : | ||
ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr | ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr | ||
pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr | pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr | ||
+ | --> | ||
+ | |||
+ | == Qui ? == | ||
+ | Cette initiative est une convention entre l'équipe [http://wimmics.inria.fr Wimmics] de l'[http://www.inria.fr Inria] et le [http://www.culturecommunication.gouv.fr/ Ministère de la Culture et de la Communication] avec le soutien de l'[http://www.wikimedia.fr/ association Wikimédia France]. | ||
+ | |||
+ | {| align="center" style="border-spacing: 30pt" | ||
+ | |[[Fichier:LogoINRIA.png|link=http://www.inria.fr]] | ||
+ | |[[Fichier:Logo_ministere_culture_et_communication.png|link=http://www.culturecommunication.gouv.fr/]] | ||
+ | |[[Fichier:Wikimedia_France_logo.png|link=http://www.wikimedia.fr]] | ||
+ | |} |
Version actuelle en date du 15 mars 2012 à 17:08
Ce projet a pour but de créer une version francophone de la base DBpedia qui est utilisée dans de nombreuses applications anglophones, notamment pour la publication de collections culturelles.
État projet |
|
Statut | Alpha |
Données | Extraction du 27 Aout 2013 |
Qu’est-ce que DBpedia ?
Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de Wikipédia afin de rendre ces données disponibles sur le Web.
En tant que base de connaissances, DBpedia a plusieurs avantages sur les bases existantes. Elle couvre de très nombreux domaines, capture un véritable consensus collectif qui évolue automatiquement en fonction des transformations de Wikipédia et peut ainsi suivre les nouvelles tendances, pierre d’achoppement de la plupart des référentiels et autres thésaurus peuplant les systèmes d’information traditionnels. Elle fournit dès lors un large référentiel vivant pour d’autres collections de ressources sur le Web et rend possible, entre autre et dans le désordre : leur identification, indexation, références croisées, intégration, interrogation structurée, et même certaines formes de raisonnement automatique utiles, par exemple, à la recherche d’information. DBpedia permet donc de répondre automatiquement à des requêtes structurées complexes sur les données de Wikipédia et de les lier à d'autres ensembles de données sur le Web.
À quoi sert DBpedia ?
Pour les détenteurs de données :
DBpedia permet d'ouvrir de nouveaux moyens d’accès à ces données et d'en accroître la valeur.
Pour les développeurs :
DBpedia fournit des données pour alimenter les applications et répondre aux besoins des utilisateurs.
D'autres utilisations peuvent être imaginées, par exemple la recherche de descripteurs partagés à l’échelle du Web pour les reprendre dans d'autres référentiels (classifications bibliothéconomiques, thésauri, etc.).
Quelques exemples d'utilisation :
- La plateforme consacrée aux documentaires animaliers de la BBC exploite les données et catégories de DBpedia afin de proposer une meilleure structuration de ses contenus et une navigation enrichie.
- L’expérience “Picture Book Mashup” du Brooklyn Museum associe DBpedia au catalogue du musée pour créer un album interactif et structuré de la collection.
- La collection complète du Musée d’Amsterdam est disponible sur le « Linked Open Data » (5 millions de triplets RDF décrivant plus de 70 000 objets du patrimoine culturel lié à la ville d'Amsterdam), fournissant des liens vers un thésaurus (AATNed), une liste d'artistes (ULAN), une base de lieux (Geonames) et les ressources de DBpedia pour en enrichir la structuration et l’exploitation.
- Le « Museum Finland » dont l’intégration du catalogue à d’autres bases permet notamment la navigation en anglais dans une collection finlandaise.
Des problématiques et exemples similaires existent tant pour les bibliothèques que les archives comme l’INA par exemple. Chaque lien créé entre les bases dégage un accès supplémentaire à la collection permettant aux utilisateurs et à leurs applications d’y entrer et d’en sortir selon autant de nouveaux parcours.
Pourquoi Semanticpedia, un dbpedia en français ?
Dans sa version francophone, Wikipédia compte très précisément (au moment où nous écrivons ces lignes) 1 210 130 articles traitant de culture, géographie, histoire, sciences, divertissement, société ou technologie. Malheureusement, DBpedia, centré sur la version anglophone de Wikipédia, ignore par conséquent les articles en français ne bénéficiant pas d’équivalents en anglais et n’en expose donc pas les données.
Par exemple, le célèbre quatuor « Les Frères Jacques » n’est pas identifié dans DBpedia car l’article décrivant ces artistes est absent de la version anglophone. La version francophone de contient les données consultables sur cette page.
Différentes versions locales de DBpedia, dont la version francophone ont pour but de donner accès aux données publiées dans les version respectives de Wikipedia. La version francophone de DBpedia offre ainsi la possibilité d'interroger ces données mais aussi d'intégrer différentes ressources francophones au Web de données. Si ce projet a ses spécificités, il travaille cependant étroitement avec les responsable de DBpedia.org : http://dbpedia.org/Internationalization
Qui ?
Cette initiative est une convention entre l'équipe Wimmics de l'Inria et le Ministère de la Culture et de la Communication avec le soutien de l'association Wikimédia France.
- Dernière modification de cette page le 15 mars 2012 à 17:08.
- Cette page a été consultée 13 882 fois.