Commit 0d16dccd authored by Stéphane Pouyllau's avatar Stéphane Pouyllau 💬
Browse files

Ré-écriture de la partie sur le moissonnage par RDFa

parent f16f2ab7
Pipeline #5216 passed with stage
in 3 minutes and 1 second
...@@ -423,30 +423,27 @@ initiative](https://www.openarchives.org/pmh/tools/). Enfin, nous conseillons au ...@@ -423,30 +423,27 @@ initiative](https://www.openarchives.org/pmh/tools/). Enfin, nous conseillons au
### Comment signaler ses données dans ISIDORE avec des métadonnées RDFa ? ### Comment signaler ses données dans ISIDORE avec des métadonnées RDFa ?
Le RDFa permet d'exprimer une structure de métadonnées selon les principe du Web sémantique (RDF pour *Resource Description Framework*) dans le code HTML de pages Web. Le "a" de RDFa veut dire "in
attributes", c'est à dire au sein du code HTML).
Comment exprimer des métadonnées d’une page web très simplement en Comment exprimer des métadonnées d’une page web très simplement en
utilisant la [syntaxe utilisant la [syntaxe
RDFa](http://tcuvelier.developpez.com/tutoriels/web-semantique/rdfa/introduction/) RDFa](http://tcuvelier.developpez.com/tutoriels/web-semantique/rdfa/introduction/)
? Prenons par exemple un billet de blog publié avec WordPress. S’il ? Par exemple, dans un billet de blog publié avec WordPress. S’il
peut exister des [plugins pour faire peut exister des [plugins pour faire
cela](http://wordpress.org/extend/plugins/search.php?q=RDFa), cela](http://wordpress.org/extend/plugins/search.php?q=RDFa),
l’obsolescence de ces derniers peut rendre difficile leur maintien dans l’obsolescence de ces derniers peut rendre difficile leur maintien dans
le temps. Une autre solution consiste à implémenter RDFa dans le code le temps. Une autre solution consiste à implémenter RDFa dans le code
HTML du thème WordPress que l’on a choisi. Pour ce que cela soit facile HTML du thème WordPress que l’on a choisi. Pour ce que cela soit facile
et gérable dans le temps, le plus simple est d’utiliser l’entête HTML et gérable dans le temps, le plus simple est d’utiliser l’entête HTML
`<head>` afin d’y placer des balises `<meta>` qui contiendront les `<head>` afin d’y placer des balises `<meta>` qui contiendront quelques métadonnées.
métadonnées.
Exprimer des métadonnées selon le modèle RDF via la syntaxe RDFa permet Exprimer des métadonnées selon le modèle RDF via la syntaxe RDFa permet
à des machines (principalement des moteurs de recherche) de mieux à des machines (principalement des moteurs de recherche et des indexeurs) de mieux traiter l’information car elle devient plus explicite : pour une machine, une chaîne de caractère peut être un titre ou un résumé, si vous ne lui dites pas que c’est un titre ou que c’est un résumé elle
traiter l’information car elle devient plus explicite : pour une
machine, une chaîne de caractère peut être un titre ou un résumé, si
vous ne lui dites pas que c’est un titre ou que c’est un résumé elle
ne le devinera pas. A minima, il est donc possible d’utiliser les ne le devinera pas. A minima, il est donc possible d’utiliser les
balises `<meta>` pour définir une structure RDF offrant la possibilité balises `<meta>` pour définir une structure RDF offrant la possibilité
de structurer les métadonnées minimales par exemple avec le vocabulaire de structurer les métadonnées minimales par exemple avec le vocabulaire
documentaire Dublin Core Element Set. Le RDFa est une façon d’écrire des documentaire Dublin Core Element Set.
triplets RDF dans du HTML (le "a" de RDFa veut dire "in
attributes").
#### Comment faire ? #### Comment faire ?
...@@ -458,11 +455,9 @@ DOCTYPE sera : ...@@ -458,11 +455,9 @@ DOCTYPE sera :
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
``` ```
Dans la balise `<html>`, nous allons indiquer les adresses des Dans la balise `<html>`, doivent être présente les adresses des
vocabulaires documentaires - par l’intermédiaire de namespace XML - qui ontologie documentaires (via leurs *NameSpace XML*) qui servent
vont nous servir à typer les informations, dans notre exemple, nous à "typer" les informations. RDFa — qui place des métadonnées dans le Web sémantique, nécessite à minima de faire appel aux ontologies RDF et RDF Schema et au Dublin Core Element Set (dc). Il est possible d'utiliser en plus — afin d'afiner les métadonnées, le Dublin Core Terms (dcterms) :
allons utiliser le Dublin Core simple et le Dublin Core Terms (DC Terms)
:
```xml ```xml
<html xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" <html xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
...@@ -472,8 +467,8 @@ xmlns:dc="http://purl.org/dc/elements/1.1/" ...@@ -472,8 +467,8 @@ xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"> xmlns:dcterms="http://purl.org/dc/terms/">
``` ```
Il serait possible, pour encoder plus d’information, d’utiliser plus Il est possible, pour encoder plus d’information, d’utiliser plus
de vocabulaires documentaires : d'ontologies documentaires :
```xml ```xml
<html <html
...@@ -487,12 +482,11 @@ xmlns:foaf="http://xmlns.com/foaf/0.1/" ...@@ -487,12 +482,11 @@ xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:cc="http://creativecommons.org/ns#"> xmlns:cc="http://creativecommons.org/ns#">
``` ```
Ici, [foaf](http://www.foaf-project.org/) nous servirait à encoder des Dans l'exemple ci-dessus, [foaf](http://www.foaf-project.org/) sert à encoder des
informations relatives à une personne ou un objet décrit par les informations relatives à une personne ou un objet décrit par les
métadonnées, [CC](http://creativecommons.org) nous permettrait de métadonnées. L'ontologie [CC](http://creativecommons.org) permet de signaler quelle licence, issues des *Creative Commons*, s’appliquerait à ce contenu.
signaler quelle licence Creative Commons s’appliquerait à ce contenu.
Après avoir déclaré des les vocabulaires documentaires que nous allons La structure RDFa au travers de balises
utiliser, nous allons ajouter la structure RDFa au travers de balises
`<meta>` dans l’en-tête `<head>` de la page HTML. Dans un premier `<meta>` dans l’en-tête `<head>` de la page HTML. Dans un premier
temps, à l’aide d’une balise `<link>`, nous allons définir l’objet temps, à l’aide d’une balise `<link>`, nous allons définir l’objet
numérique auquel les informations encodées en RDF seront rattachées : numérique auquel les informations encodées en RDF seront rattachées :
...@@ -504,38 +498,74 @@ numérique auquel les informations encodées en RDF seront rattachées : ...@@ -504,38 +498,74 @@ numérique auquel les informations encodées en RDF seront rattachées :
Cette balise définit donc un conteneur pour les informations que nous Cette balise définit donc un conteneur pour les informations que nous
allons indiquer à l’aide des balises `<meta>`. Ce conteneur est allons indiquer à l’aide des balises `<meta>`. Ce conteneur est
identifié par une URI qui se trouve être une URL, c’est à dire identifié par une URI qui se trouve être une URL, c’est à dire
l’adresse de la page dans le web. Maintenant, nous enchaînons les l’adresse de la page dans le web.
balises `<meta>` qui définissent donc un ensemble de métadonnées, c’est
à dire dans notre cas, des informations descriptives de la page web :
![Mon Image](media/meta.png) Les balises `<meta>` définissent ensuite un ensemble de métadonnées, c’est à dire dans notre cas, des informations descriptives de la page web du billet du blog :
Suivant la nature du contenu de la page web, il sera bien sûr possible ```xml
<meta property="dc:title" content="Le titre de mon billet" />
<meta property="dc:creator" content="Prénom Nom de l'auteur 1" />
<meta property="dc:creator" content="Prénom Nom de l'auteur 2" />
<meta property="dcterms:created" content="2011-01-27" />
<meta property="dcterms:abstract" content="Un résumé descriptif du contenu de ma page" xml:lang="fr" />
<meta property="dcterms:abstract" content="A summary in english" xml:lang="en" />
<meta property="dc:subject" content="mot-clé 3" />
<meta property="dc:subject" content="mot-clé 2" />
<meta property="dc:type" content="billet" />
<meta property="dc:format" content="text/html" />
<meta property="dc:relation" content="Un lien vers une page web complémentaire" />
```
Suivant la nature du contenu de la page web, il est bien sûr possible
d’être plus précis, plus fin et plus complet dans les informations d’être plus précis, plus fin et plus complet dans les informations
encodées. Par exemple, il sera judicieux d’utiliser le vocabulaire DC encodées. Par exemple, il sera judicieux d’utiliser le vocabulaire DC
Terms. Terms.
Le DC Terms permettra avec : Le DC Terms permet par exemple d'inclure une forme précise pour une référence bibliographique du contenu :
![Mon Image](media/meta2.png) ```xml
<meta property="dcterms:bibliographicCitation" content="Mettre ici une référence bibliographique" />
```
de proposer une forme pour une référence bibliographique dans le cas Il serait possible de passer l’ensemble du texte d’une page web à l’aide du vocabulaire SIOC [en utilisant la propriété
d’une page web décrivant un ouvrage par exemple. Il serait possible de
passer l’ensemble du texte d’une page web à l’aide du vocabulaire
SIOC [en utilisant la propriété
sioc:content](http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique). sioc:content](http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique).
Il est possible également de relier des pages web entre elles (pour Il est possible également de relier des pages web entre elles (pour
définir un corpus d’auteurs par exemple) en utilisant dans le définir un corpus d’auteurs par exemple) en utilisant dans le
vocabulaire DC Terms la propriété du DC Terms : dcterms:isPartOf. vocabulaire DC Terms la propriété du DC Terms :
dcterms:isPartOf.
```xml
<meta property="dcterms:isPartOf" content="URL d'une autre page Web" />
```
Une fois l’encodage RDFa fait dans les pages HTML, il vous reste à créer Une fois l’encodage RDFa fait dans les pages HTML, il vous reste à créer
un sitemap.xml listant les pages que vous souhaitez qu’ISIDORE moissonne un fichier XML de type Sitemap listant les pages que vous souhaitez qu’ISIDORE moissonne et soumettre l’URL de ce sitemap :
et nous soumettre l’URL de votre sitemap par e-mail
à isidore-sources@huma-num.fr. ```xml
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://monsiteweb.com/</loc>
<lastmod>2018-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://monsiteweb.com/page1/</loc>
<lastmod>2018-03-05</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
```
Il est possible de tester l’extraction que fera ISIDORE de vos Il est possible de tester l’extraction que fera ISIDORE de vos
métadonnées en RDFa à l’aide de l’application "ISIDORE à la demande" métadonnées RDFa à l’aide de l’application "ISIDORE à la demande"
disponible ici : <http://rd.rechercheisidore.fr/ondemand/fr/rdfa.html> disponible sur à l'adresse <http://rd.rechercheisidore.fr/ondemand/fr/rdfa.html>
### Un site web utilisant Drupal peut-il être référencé par ISIDORE ? ### Un site web utilisant Drupal peut-il être référencé par ISIDORE ?
......
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment