Outils personnels
User menu

Accueil

De Dbpedia.fr.

(Différences entre les versions)
(import depuis "Nouvel acceuil")
Ligne 1 : Ligne 1 :
-
<!--#REDIRECTION [[Home]]-->
+
__NOTOC__
-
<div id="mainFrame">
+
 
 +
====Extraction de données structurées des pages de Wikipédia en français.====
 +
 
 +
== Présentation du projet ==
 +
 
 +
DBpedia en français est le chapitre francophone de [http://dbpedia.org DBpedia], il s'inscrit dans [http://wiki.dbpedia.org/Internationalization/ l'effort d'internationalisation de DBpedia] dont le but est de maintenir des données structurées extraites de différents chapitres de [http://wikipedia.org Wikipedia].
 +
 
 +
Le développement de DBpedia en français est mené dans le cadre de la plateforme [http://semanticpedia.org Semanticpedia] dont les partenaires sont :
 +
* l'équipe [http://wimmics.inria.fr Wimmics] de l'[http://www.inria.fr Inria]
 +
* le [http://www.culturecommunication.gouv.fr/ Ministère de la Culture et de la Communication]
 +
* et l'[http://www.wikimedia.fr/ association Wikimédia France]
 +
 
-
{| style="border:0; margin: 0;" cellspacing="10"
+
<center>
-
| valign="top" class="mainpage_hubbox" width="45%" |
+
{|style="font-size: 95%; border:1px solid grey;"
-
<div class="mainpage_headboxtitle">[[File:LogoSemanticpedia.png|x150px|center]]</div> <!--'''Semanticpedia'''-->
+
|-
-
<div class="mainpage_boxcontents">
+
!colspan="2" style="background-color:#fdbb21; padding:5px;"|Tableau de bord
-
* Projet de déploiement d'une version francophone de DBpedia
+
|-
-
* Projet mené par l'INRIA, le ministère de la Culture et de Communications et Wikimédia France
+
|Status || Alpha ([[Agenda]])
-
* Membre du comité d'internationalisation de DBpedia sous l'étiquette "DBpedia francophone"
+
|-
-
</div>
+
|Données || {{#ask: [[serveur SPARQL]] | ?loadedData= }}
-
| valign="top" class="mainpage_hubbox" width="45%" |
+
-
<div class="mainpage_headboxtitle">[[File:LogoDBpediaFr.png|x150px|center]]</div> <!-- '''DBpedia francophone''' fr.dbpedia.org -->
+
-
<div class="mainpage_boxcontents">
+
-
* Nom sous lequel le projet est membre du [http://wiki.dbpedia.org/Internationalization/ comité d'internationalisation de DBpedia.org]
+
-
* Administrateur du site [http://fr.dbpedia.org http://fr.dbpedia.org]
+
-
</div>
+
|}
|}
 +
</center>
-
__NOTOC__
 
== Qu’est-ce que DBpedia ? ==
== Qu’est-ce que DBpedia ? ==
-
Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de [http://wikipedia.org Wikipédia] afin de rendre ces données disponibles sur le Web.
+
Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de [http://en.wikipedia.org Wikipedia] afin de rendre ces données disponibles sur le Web.
 +
 
 +
DBpedia est cependant centré sur les pages en anglais de DBpedia, et ignore par conséquent des informations présentes sur les pages d'autres langues. C'est le cas notamment lorsqu'une page n'a pas d'équivalent en anglais, par exemple [http://fr.wikipedia.org/wiki/Les_Frères_Jacques Les Frères Jacques].
 +
 
 +
Différentes [http://wiki.dbpedia.org/Internationalization/Chapters versions locales de DBpedia],
 +
dont la version francophone ont pour but de donner accès aux données publiées dans les version respectives de Wikipedia.
 +
La version francophone de DBpedia offre ainsi la possibilité d'interroger ces données mais aussi d'intégrer différentes ressources francophones au Web de données.
 +
Si ce projet a ses spécificités, il travaille cependant étroitement avec les responsable de DBpedia.org : http://dbpedia.org/Internationalization
-
En tant que base de connaissances, [http://dbpedia.org DBpedia] a plusieurs avantages sur les bases existantes. Elle
 
-
couvre de très nombreux domaines, capture un véritable consensus collectif qui évolue
 
-
automatiquement en fonction des transformations de Wikipédia et peut ainsi suivre les nouvelles
 
-
tendances, pierre d’achoppement de la plupart des référentiels et autres thésaurus peuplant les
 
-
systèmes d’information traditionnels. Elle fournit dès lors un large référentiel vivant pour d’autres
 
-
collections de ressources sur le Web et rend possible, entre autre et dans le désordre : leur
 
-
identification, indexation, référence croisée, intégration, interrogation structurée, et même
 
-
certaines formes de raisonnement automatique utiles, par exemple, à la recherche d’information.
 
-
DBpedia permet donc de répondre automatiquement à des requêtes structurées complexes sur les
 
-
données de Wikipédia et de les lier à d'autres ensembles de données sur le Web.
 
-
<!--
 
-
En tant que base de connaissances, DBpedia bénéficie donc du gigantesque corpus de Wikipédia et
 
-
décrit actuellement plus de 3,5 million de d’objets, dont 364 000 personnes, 462 000 lieux, 99 000
 
-
albums de musique, 54 000 films, 17 000 jeux vidéo, 148 000 organisations, 169 000 espèces et 5 200
 
-
maladies. Les données de DBpedia décrivent en outre ces 3,5 millions d’éléments dans 97 langues
 
-
différentes et proposent 1 850 000 liens vers des images et 5 900 000 liens vers des pages Web
 
-
externes. -->
 
== &Agrave; quoi sert DBpedia ? ==
== &Agrave; quoi sert DBpedia ? ==
Ligne 63 : Ligne 58 :
nouveaux parcours.
nouveaux parcours.
-
== Pourquoi un dbpedia en français ? ==
 
-
 
-
Dans sa version francophone, Wikipédia compte très précisément (au moment où nous écrivons ces
 
-
lignes) 1 210 130 articles traitant de culture, géographie, histoire, sciences, divertissement, société
 
-
ou technologie. Malheureusement, DBpedia, centré sur la version anglophone de Wikipédia, ignore par
 
-
conséquent les articles en français ne bénéficiant pas d’équivalents en anglais et n’en expose donc pas
 
-
les données.
 
-
 
-
Par exemple, le célèbre quatuor « Les Frères Jacques » n’est pas identifié dans DBpedia car l’article décrivant
 
-
ces artistes est absent de la version anglophone. La version francophone de Wikipédia contient les données consultables sur [http://dbpedia.inria.fr/resource/Les_Frères_Jacques cette page].
 
-
 
-
Différentes [http://wiki.dbpedia.org/Internationalization/Chapters versions locales de DBpedia],
 
-
dont la version francophone ont pour but de donner accès aux données publiées dans les version respectives de Wikipedia.
 
-
La version francophone de DBpedia offre ainsi la possibilité d'interroger ces données mais aussi d'intégrer différentes ressources francophones au Web de données.
 
-
Si ce projet a ses spécificités, il travaille cependant étroitement avec les responsable de DBpedia.org : http://dbpedia.org/Internationalization
 
-
 
-
<!-- Il faut aussi noter l’importance d’une gouvernance publique en première ligne sur ces questions pour
 
-
éviter une prise de contrôle par des acteurs ne partageant pas le souci de l’accès ouvert aux données
 
-
relevant de l’utilité publique. -->
 
-
<!--
 
-
== Pourquoi maintenant ? ==
 
-
 
-
Il faut aussi noter l’importance d’une gouvernance publique en première ligne sur ces questions pour
 
-
éviter une prise de contrôle par des acteurs ne partageant pas le souci de l’accès ouvert aux données
 
-
relevant de l’utilité publique.
 
-
 
-
Enfin, en s’inscrivant dans un calendrier à court terme, l’initiative
 
-
pourra bénéficier de la dynamique de Datalift, projet financé par l'Agence Nationale de la Recherche (ANR),
 
-
dont le but est de développer une plateforme de publication et d’interconnexion des jeux de données liés (Linked data)
 
-
sur le Web (outre la publication de données gouvernementales, la spécificité de Data Lift étant la
 
-
prise en compte des besoins des acteurs de la culture et de la recherche). Datalift propose ainsi un
 
-
ensemble d'outils facilitant ce processus de publication. Un jeu de données extrait de Wikipédia.fr
 
-
pourrait donc d’ores et déjà bénéficier de l’infrastructure de cette plateforme pour devenir DBPedia.fr
 
-
-->
 
-
 
-
== Qui ? ==
 
-
Cette initiative est une convention entre l'équipe [http://wimmics.inria.fr Wimmics] de l'[http://www.inria.fr Inria] et le [http://www.culturecommunication.gouv.fr/ Ministère de la Culture et de la Communication] avec le soutien de l'[http://www.wikimedia.fr/ association Wikimédia France].
 
-
 
-
{| align="center" style="border-spacing: 30pt"
 
-
|[[Fichier:LogoINRIA.png|link=http://www.inria.fr]]
 
-
|[[Fichier:Logo_ministere_culture_et_communication.png|link=http://www.culturecommunication.gouv.fr/]]
 
-
|[[Fichier:Wikimedia_France_logo.png|link=http://www.wikimedia.fr]]
 
-
|}
 
-
 
-
</div>
 
-
<div id="sideBar-status">
 
-
<table style="font-size: 95%; border:1px solid grey; max-width: 300px; ">
 
-
<tr>
 
-
<td colspan="2" align="center" width="270" style="background: #fdbb21; font-size: 110%;">
 
-
<p><b><span class="fn org">&Eacute;tat projet</span></b></p>
 
-
</td>
 
-
</tr>
 
-
<tr><td>Statut</td><td>Alpha</td></tr>
 
-
<tr><td>Données</td><td>{{#ask: [[serveur SPARQL]] | ?loadedData= }}</td></tr>
 
-
<!-- tr><td>Développement</td><td>[[Liste des tâches]]</td></tr -->
 
-
</table>
 
<!--{{#widget:Twitter
<!--{{#widget:Twitter
Ligne 131 : Ligne 70 :
|shell.background=#608090  
|shell.background=#608090  
}}-->
}}-->
-
 
-
</div>
 

Version du 3 juillet 2012 à 14:19


Extraction de données structurées des pages de Wikipédia en français.

Présentation du projet

DBpedia en français est le chapitre francophone de DBpedia, il s'inscrit dans l'effort d'internationalisation de DBpedia dont le but est de maintenir des données structurées extraites de différents chapitres de Wikipedia.

Le développement de DBpedia en français est mené dans le cadre de la plateforme Semanticpedia dont les partenaires sont :


Tableau de bord
Status Alpha (Agenda)
Données Extraction du 27 Aout 2013


Qu’est-ce que DBpedia ?

Il s'agit d'un effort communautaire ayant pour but d’extraire des informations structurées des pages de Wikipedia afin de rendre ces données disponibles sur le Web.

DBpedia est cependant centré sur les pages en anglais de DBpedia, et ignore par conséquent des informations présentes sur les pages d'autres langues. C'est le cas notamment lorsqu'une page n'a pas d'équivalent en anglais, par exemple Les Frères Jacques.

Différentes versions locales de DBpedia, dont la version francophone ont pour but de donner accès aux données publiées dans les version respectives de Wikipedia. La version francophone de DBpedia offre ainsi la possibilité d'interroger ces données mais aussi d'intégrer différentes ressources francophones au Web de données. Si ce projet a ses spécificités, il travaille cependant étroitement avec les responsable de DBpedia.org : http://dbpedia.org/Internationalization


À quoi sert DBpedia ?

Pour les détenteurs de données : DBpedia permet d'ouvrir de nouveaux moyens d’accès à ces données et d'en accroître la valeur.
Pour les développeurs : DBpedia fournit des données pour alimenter les applications et répondre aux besoins des utilisateurs.
D'autres utilisations peuvent être imaginées, par exemple la recherche de descripteurs partagés à l’échelle du Web pour les reprendre dans d'autres référentiels (classifications bibliothéconomiques, thésaurus, etc.).

Quelques exemples d'utilisation :

  • La plateforme consacrée aux documentaires animaliers de la BBC exploite les données et catégories de DBpedia afin de proposer une meilleure structuration de ses contenus et une navigation enrichie.
  • L’expérience “Picture Book Mashup” du Brooklyn Museum associe DBpedia au catalogue du musée pour créer un album interactif et structuré de la collection.
  • La collection complète du Musée d’Amsterdam est disponible sur le « Linked Open Data » (5 millions de triplets RDF décrivant plus de 70 000 objets du patrimoine culturel lié à la ville d'Amsterdam), fournissant des liens vers un thésaurus (AATNed), une liste d'artistes (ULAN), une base de lieux (Geonames) et les ressources de DBpedia pour en enrichir la structuration et l’exploitation.
  • Le « Museum Finland » dont l’intégration du catalogue à d’autres bases permet notamment la navigation en anglais dans une collection finlandaise.

Des problématiques et exemples similaires existent tant pour les bibliothèques que les archives comme l’INA par exemple. Chaque lien créé entre les bases dégage un accès supplémentaire à la collection permettant aux utilisateurs et à leurs applications d’y entrer et d’en sortir selon autant de nouveaux parcours.