isidore.md 44.5 KB
Newer Older
1
2
---
lang: fr
3
description: Présentation d'ISIDORE, le moteur de recherche permettant de trouver des publications, des données numériques et profils de chercheur·e·s en sciences humaines et sociales venant du monde entier.
4
5
---

6
# ISIDORE
Stephane Pouyllau's avatar
Stephane Pouyllau committed
7

8
## Qu’est-ce qu’ISIDORE ?
9

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
10
ISIDORE est un moteur de recherche permettant de découvrir et de trouver des publications, des données numériques et profils de chercheur·e·s en sciences humaines et sociales (SHS) venant du monde entier.
11

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
12
Il permet de rechercher dans le texte intégral de plusieurs millions de documents (articles, thèses et mémoires, rapports, jeux de données, pages Web, notices de bases de données, description de fonds d’archives, etc.), des signalements événements (séminaires, colloques, etc.). De plus, ISIDORE relie entre eux ces millions de documents en les enrichissants à l'aide de concepts scientifiques issus des travaux des communautés de recherche des SHS.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
13

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
14
Il est accessible sur le Web sur le portail [isidore.science](https://isidore.science).
15

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
16
Il propose également des fonctionnalités de réseau social scientifique. À ce titre, il entre dans la catégorie des moteurs et assistants de recherche et offre de nombreuses fonctionnalités pour organiser de la veille scientifique.
17

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
18
Lancé le 8 décembre 2010, ISIDORE est le fruit de la collaboration du "très grand équipement" Adonis du CNRS (2007-2013), du Centre pour la communication scientifique directe et des sociétés Antidot, Mondéca et Sword. Il est actuellement développé, mise à jour et exploité par la TGIR Huma-Num.
19

20
Références sur l'histoire d'ISIDORE :
Stephane Pouyllau's avatar
Stephane Pouyllau committed
21

22
23
24
- Yannick Maignien, "ISIDORE, de l'interconnexion de données à l'intégration de services", Hyper Article en Ligne - Sciences de l'Homme et de la Société, [10670/1.k9lck9](https://isidore.science/document/10670/1.k9lck9)
- Stéphane Pouyllau et al., "Bilan 2011 de la plateforme ISIDORE et perspectives 2012-2015", MoDyCo, Modèles, Dynamiques, Corpus - UMR 7114, [10670/1.bqexsj](https://isidore.science/document/10670/1.bqexsj)
- Philippe Bourdenet, "L'espace documentaire en restructuration : l'évolution des services des bibliothèques universitaires", Le serveur TEL (thèses-en-ligne), [10670/1.lnieuv](https://isidore.science/document/10670/1.lnieuv)
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
25

26
## Comment fonctionne ISIDORE ?
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
27

28
ISIDORE moissonne des métadonnées textuelles et du texte intégral, les enrichit puis les indexe. Il exploite les métadonnées des documents ainsi que le texte intégral, le but est d'analyser ces informations afin de les enrichir, de les relier des concepts des référentiels scientifiques (thésaurus, etc.), de les relier aux identifiants des auteurs (ORCID, IDRef, IDHAL, VIAF, etc.).
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
29
30
31

Plusieurs enrichissements sont effectués :

32
- L'annotation sémantique : les mots présents dans les métadonnées des documents sont comparés aux entrées des référentiels par le biais d'un algorithme fondé sur une analyse morphologique des termes. Si une équivalence s'effectue entre un terme issu du document une entrée de l'un des référentiels, alors la ressource sera reliée à ladite entrée du référentiel. Les référentiels sont multilingues et alignés entre eux. Ainsi, l'annotation sémantique est multilingue.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
33
34
35
36
37
38
39

- La catégorisation disciplinaire : ISIDORE utilise un classifieur sémantique qui, après avoir été entrainé sur un corpus de référence, catégorise dans les disciplines SHS du référentiel MORESS, tous les documents présents dans ISIDORE. L'entrainement du classifieur est réalisé à l'aide de la catégorisation manuelle réalisé par les chercheurs dans HAL lors du dépôt de leurs publications.

- La détection des auteurs : ISIDORE détecte les auteurs des documents et enrichit la forme auteur (prénom et nom) à l'aide d'identifiants auteurs internationaux (ORCID, VIAF, ISNI) et nationaux (IDHAL, IDRef).

ISIDORE indexe, dans son moteur de recherche :

Laurent CAPELLI's avatar
Laurent CAPELLI committed
40
41
42
43
44
- Les métadonnées des documents ;
- Le texte intégral (s'il est disponible en libre accès) ;
- Les annotations sémantiques ;
- La classification disciplinaire ;
- L'enrichissement et la normalisation des auteurs.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
45

46
Plus d'information est disponible sur [la page "Référentiels"](https://isidore.science/vocabularies) d'ISIDORE.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
47

48
49
50
### ISIDORE peut-il indexer des documents et données multilingues ?

Oui. Depuis 2015, les documents et jeux de données en anglais, espagnol
51
et français sont indexés, enrichis et reliés aux référentiels scientifiques par ISIDORE (métadonnées et texte intégral). Pour le texte intégral hors de ces trois langues, il est indexé dans la langue du document mais l'enrichissement n'a pas lieu.
52
53
54
55
56
57
58
59
60
Pour plus d’information, vous pouvez consulter notre billet sur le sujet : [Isidore speaks English, sino también español et toujours en français](https://humanum.hypotheses.org/921).

### Quelle est la fréquence de mise à jour d’ISIDORE ?

ISIDORE est mis à jour, de façon incrémentale, en moyenne une fois par
mois. Pourquoi ce délai ? En plus de moissonner et d’indexer les
documents, ISIDORE les enrichit à l’aide de concepts issus de
référentiels scientifiques (thésaurus, taxonomie, etc.). Ce travail d’enrichissement sémantique est
automatique et permet de vous proposer des suggestions de lecture. Il
Laurent CAPELLI's avatar
Laurent CAPELLI committed
61
s’agit de vous faire découvrir des documents autres que ceux que vous
62
63
64
65
66
cherchiez. Cela nécessite un certain temps de traitement et de calcul.
Les mises à jour des documents vous concernant, qui vous seront ainsi
proposés dans votre compte utilisateur comme des documents à
revendiquer, suivront elles aussi ce rythme mensuel de mise à jour.

67
68
69
70
71
72
73
74
75
76
### Quel est le circuit d'ajout de collections dans ISIDORE ?

Deux cas de figure :

- Un projet de recherche, une équipe, un laboratoire, une bibliothèque peuvent proposer des collections à moissonner par simple e-mail à <isidore-sources@huma-num.fr>. L'équipe d'Huma-Num étudie la demande et échange avec le demandeur afin de bien comprendre comment sont décrites les métadonnées et les données à indexer. Le plus souvent il est procédé à un premier moissonnage et une première indexation et enrichissement pour que le demandeur puisse voir et analyser comment seront indexées ses données dans ISIDORE. Puis, les échanges se poursuivent potentiellement pour ajuster au mieux le processus d'indexation.

- L'équipe d'Huma-Num repère un entrepôt de données ou une bibliothèque numérique et prend contact avec le producteur des données ou la structure qui diffuse ces données pour échanger et proposer le moissonnage et l'indexation dans ISIDORE. Il est procédé à un premier moissonnage et une première indexation et enrichissement pour que le demandeur puisse voir et analyser comment seront indexées ses données dans ISIDORE. Puis, les échanges se poursuivent potentiellement pour ajuster au mieux le processus d'indexation.



77
## Comment utiliser ISIDORE ?
78

nsauret's avatar
nsauret committed
79
ISIDORE propose plusieurs outils pour rechercher, découvrir, collecter et organiser les contenus qu’il indexe :
80

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
81
82
### Le portail isidore.science

Laurent CAPELLI's avatar
Laurent CAPELLI committed
83
Le portail [isidore.science](https://isidore.science) est un site Web en trois langues qui propose un [moteur de recherche par pertinence](https://isidore.science) qui peut être utilisé avec plusieurs méthodes d’interrogation.
84

nsauret's avatar
nsauret committed
85
-   Par défaut, ISIDORE cherche tous les mots d’une requête posée par
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
86
87
    l’utilisateur/utilisatrice en enlevant les mots vides ("de", "la", "le",
    "les", etc.) ;
88
89
90
91
92
93
-   Il est possible de chercher un document avec une phrase complète ou
    un groupe de mots en utilisant les guillemets autour de la phrase,
    par exemple : "direction de conscience" cherchera précisément
    cette phrase. Ainsi, dans ce cas-là, le "de" ne sera pas considéré
    comme un mot vide ;

94
#### Opérateurs de recherche
95
Plusieurs opérateurs de recherche booléens sont disponibles dans
Laurent CAPELLI's avatar
Laurent CAPELLI committed
96
ISIDORE. À noter que la syntaxe des opérateurs est importante dans
97
98
ISIDORE, ils sont toujours en MAJUSCULE (ex. ET ou AND) :

nsauret's avatar
nsauret committed
99
- ET (AND) : l’intersection permet de trouver les termes (ou ensemble
Laurent CAPELLI's avatar
Laurent CAPELLI committed
100
    de termes) communs à la requête. Par exemple :
101
102
    -   conscience ET genre
    -   "guerre froide" ET migrations
Laurent CAPELLI's avatar
Laurent CAPELLI committed
103
- OU (OR) : la réunion permet de trouver les termes cherchés
nsauret's avatar
nsauret committed
104
    appartenant aux deux ensembles de termes, ou à l’un ou à l’autre.
Laurent CAPELLI's avatar
Laurent CAPELLI committed
105
    Par exemple :
106
    -   "web sémantique" OU "web 3.0"
nsauret's avatar
nsauret committed
107
- SAUF (NOT) : l’exclusion permet de réduire le bruit en excluant des
108
109
    termes. Par exemple :
    -   révolution SAUF Française
nsauret's avatar
nsauret committed
110
- PROCHE(n.) (NEAR(n.)) : l’opérateur PROCHE(n.) (comprendre "proche
111
112
113
114
    de") permet de lier des termes en indiquant une valeur "n." de
    proximité entre ces derniers. Il fonctionne comme un ET avec n.
    mot(s) entre les termes. La valeur "n." indique le nombre de mots
    devant séparer les deux termes recherchés. PROCHE fonctionne aussi
nsauret's avatar
nsauret committed
115
    sans la valeur n. et est dans ce cas-là égal à un PROCHE(10), c’est
116
    à dire 10 mots entre les termes recherchés (espacement standard).
Laurent CAPELLI's avatar
Laurent CAPELLI committed
117
    -   maison PROCHE(4) noblesse : recherche maison et noblesse avec
118
119
        une proximité de 4 mots

120
121
#### Tri des résultats de recherche

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
122
Par défaut, dans [isidore.science](https://isidore.science), il est proposé un tri des résultats par pertinence sémantique. Il est possible de changer le tri des résultats de recherche pour :
123
124
125

- un tri par nouveauté
- un tri sur le nom de l'auteur·e par ordre alphabétique
Laurent CAPELLI's avatar
Laurent CAPELLI committed
126
- un tri sur le nom de l'auteur·e par ordre alphabétique inversé
127
128
129
- un tri par date croissante
- un tri par date décroissante

130
Très prochainement, sera disponible de nouveau :
131
132

- un tri sur le titre par ordre alphabétique
Laurent CAPELLI's avatar
Laurent CAPELLI committed
133
- un tir sur le titre par ordre alphabétique inversé
134

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
135
136
### La recherche avancée

Laurent CAPELLI's avatar
Laurent CAPELLI committed
137
Une recherche avancée est également disponible à l’adresse [https://isidore.science/as](https://isidore.science/as) et également accessible depuis
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
138
139
140
la première page du [portail](https://isidore.science/as).

### L'espace personnel pour les chercheur·e·s
141

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
142
Isidore.science propose un espace personnel pour les chercheur·e·s permettant :
Stephane Pouyllau's avatar
Stephane Pouyllau committed
143

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
144
145
146
147
148
- de collecter, de classer, d’organiser les documents trouvés ;
- d’y regrouper l’ensemble de sa production scientifique afin de l’éditorialiser dans une page de profil personnel ;
- d’y suivre les productions de collègues ;
- d’y enregistrer et d'y publier ses requêtes et leurs résultats à des fins de veille ;
- d’y constituer des bibliographies exportables vers Zotero ;
Stephane Pouyllau's avatar
Stephane Pouyllau committed
149

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
150
151
### Les API d'isidore.science

152
153
Les [API du moteur de recherche d'isidore.science](https://api.isidore.science) sont disponibles à l'URL [https://api.isidore.science](https://api.isidore.science) par la méthode GET sur HTTP ou HTTPS.
Elles offrent un service de requêtage des données d'ISIDORE à la fois rapide, précis et fiable avec des fonctionnalités de recherche élaborées (auto-complétion, correction orthographique, recherches multi-critères, booléenne et à facettes, tri, agrégation des réponses, etc).
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
154
155
156

Chaque requête au moteur est soumise au moyen d'une URI pointant vers un service web spécifique. La réponse est un flux au format XML (format par défaut) ou JSON.

157
La page Web sur les [API d'isidore.science](https://api.isidore.science) détaille l'ensemble des commandes disponibles pour les différents services disponibles.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
158
159
160

### Les métadonnées enrichies pour le *Linked Open Data*

161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
Les information des métadonnées, ontologies et référentiels d'ISIDORE sont disponibles au sein d'un entrepôt de triplets [RDF (Resource Description Framework) ou *TripleStore*](https://fr.wikipedia.org/wiki/Resource_Description_Framework), plaçant ainsi les données d'ISIDORE dans le *Linked Open Data*. Une interface Web permettant d'interroger à l'aide du language SPARQL et de parcourir le graph d'ISIDORE est disponible via :

- Une interface d'interrogation SPARQL documentée et présentation du modèle de données d'ISIDORE : https://isidore.science/sqe  
- L'interface de base du logiciel Virtuoso : https://isidore.science/sparql

Dans le *TripleStore* d'ISIDORE, les principaux vocabulaires de structuration documentaire des informations sont :

- RDF et RDFS
- Dublin Core Element Set
- Duclin Core TERMS
- SIOC
- FOAF
- OWL
- SKOS
- ORE
- DBPEDIA

(La liste complète est disponible sur <https://isidore.science/sparql?nsdecl>)
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
179
180


181
### Complémentarité entre ISIDORE et Zotero
182

183
#### Utilisation depuis ISIDORE du connecteur Zotero pour alimenter sa base bibliographique
184
185
186

ISIDORE est compatible avec Zotero et permet d’importer les références des documents sur deux niveaux dès lors que l’utilisateur a installé [le connecteur Zotero](https://www.zotero.org/download/) dans son navigateur :

nsauret's avatar
nsauret committed
187
188
- Sur la page listant les résultats d’une recherche,
- Dans la page de visualisation d’un document.
189

190
#### Utilisation depuis Zotero du connecteur de recherche d'ISIDORE
191

192
Zotero (client Linux, MacOS, Windows) permet d’utiliser des moteurs de recherche pour rechercher ou compléter des références bibliographiques directement depuis l’interface de Zotero. Nous proposons ici deux connecteurs ISIDORE pour Zotero permettant d’utiliser ISIDORE à partir de recherche sur les auteurs.
193
194
195
196
197
198

L’ajout d’ISIDORE à Zotero permet :

- De compléter des références à partir d’une recherche sur le nom de l’auteur : c’est le "ISIDORE, aide-moi à trouver ce qu’il/elle a publié."
- De trouver des documents dans lequel l’auteure ou l’auteur est cité : c’est le "ISIDORE, qu’as-tu sur l’auteur/auteure ?"

Laurent CAPELLI's avatar
Laurent CAPELLI committed
199
Ces [connecteurs et la documentation d'installation sont disponibles sur le GitLab de la TGIR Huma-Num](https://gitlab.huma-num.fr/spouyllau/ISIDORtero).
200
201
202

### Utilisation des flux RSS

Laurent CAPELLI's avatar
Laurent CAPELLI committed
203
ISIDORE peut proposer ses résultats de recherche sous la forme de flux RSS dans le but d'alimenter des logiciels de veille scientifique (dont Zotero par exemple), des carnets de recherche, etc. Les flux RSS créés dans ISIDORE sont mis à jour, comme l’ensemble des contenus du moteur de recherche, une fois par mois environ lors de la mise à jour générale des contenus d'ISIDORE. Ainsi, il est possible de suivre, depuis Zotero, la mise à jour des documents d’ISIDORE issus des requêtes enregistrées.
204
205
206

Pour cela, il faut demander à ISIDORE --- dans son espace personnel en
mode connecté, le lien vers le flux RSS d’une requête enregistrée en
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
207
allant, une fois dans votre espace personnel, dans "Mes requêtes" :
208

209
![Mon Image](media/isidore.png)
210
211

Pour une requête enregistrée, il faut cliquer sur le pictogramme "Flux
nsauret's avatar
nsauret committed
212
RSS de la requête" disponible à droite ![Mon Image](media/isidore-rss-001.png){: style="width:170px"} et d’en copier le lien avec ![Mon Image](media/isidore-requeteRSS.png){: style="width:120px"}.
213

nsauret's avatar
nsauret committed
214
Le lien copié est de la forme : `https://isidore.science/feed/lt3913`.
215
216
217
218
219

Si votre navigateur est équipé d’un module de lecture des flux RSS, il
sera possible d’utiliser ce lien directement dans votre navigateur.
Dans notre exemple, Nous allons l’utiliser dans Zotero.

nsauret's avatar
nsauret committed
220
Dans Zotero, il faut choisir : Nouveau flux > À partir de l’URI :
221

nsauret's avatar
nsauret committed
222
![Mon Image](media/zot-001.png){: style="width:60%;margin-left:20%"}
223
224
225
226
227
228

Puis d’ajouter l’url du flux fournit par ISIDORE (avec le navigateur
Safari sous MacOS prendre soin de retirer la mention "feed:" de
l’url). Venir ensuite le coller dans "URL" de la fenêtre de création
de flux RSS de Zotero, exemple ci-dessous :

229
![Mon Image](media/zot-002.png)
230
231
232
233

Il faut ensuite donner un titre à son flux, par exemple :
"isidore.science - veille sur ...".

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
234
235
## Que trouve-t-on dans ISIDORE ?

236
237
### Organisation des documents et données dans ISIDORE

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
238
239
240
241
ISIDORE contient plusieurs millions de documents en SHS qui moissonnés, enrichis avec des référentiels scientifiques et indexés. Ils sont organisés en :

- Documents et données de la recherche (fonds d'archives, matériaux bruts, photographies, films, jeux de données, statistiques, etc) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/primaires
- Documents et données publiées (articles, livres, mémoires et thèses, rapports, etc.) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/secondaires
Laurent CAPELLI's avatar
Laurent CAPELLI committed
242
- Événements scientifiques (colloques, journées d'études, etc.) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/evenementielles
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
243
244
245


Pour un grand nombre de disciplines des SHS, ISIDORE permet de rechercher des documents venant des principales plateformes de publications du monde entier, ainsi qu’un grand nombre des fonds numérisés par les bibliothèques nationales, universitaires et
246
municipales.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
247
248
249
Pour des usages poussés de recherche, la [recherche avancée d’ISIDORE](https://isidore.science/as) offre par exemple, la
possibilité de rechercher des documents entre deux dates et par discipline ou encore par collections.

250
Les principales plateformes de publications (revues et livres) présentes dans ISIDORE sont :
nsauret's avatar
nsauret committed
251

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
252
253
254
255
256
257
258
259
- OpenEdition
- Cairn
- Persée
- Erudit
- Oapen
- Redalyc
- Scielo Books

260
La liste complète des collections contenant des publications peut être obtenu en requêtant [le 3store d'ISIDORE](https://isidore.science/sqe) avec la SPARQL [suivante](https://isidore.science/sparql?query=SELECT+*+WHERE+%7B%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2FCollection%3E.%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2Fpublications%3E.%0D%0A%3Fs+dcterms%3Atitle+%3Ftitre%0D%0A%7D+ORDER+BY+ASC%28%3Ftitre%29&format=text%2Fhtml&debug=on&timeout=0) :
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
261
262
263

```
SELECT * WHERE {
264
265
266
 ?s rdf:type <http://isidore.science/class/Collection>.
 ?s rdf:type <http://isidore.science/class/publications>.
 ?s dcterms:title ?titre
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
267
268
269
} ORDER BY ASC(?titre)
```
Les principales bibliothèques numériques (municipales, nationales, etc.) présentes dans ISIDORE sont :
nsauret's avatar
nsauret committed
270

271
- Gallica
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
272
273
274
275
276
277
278
279
280
281
282
- Sélène
- E-rara
- NuBIS
- Octaviana
- Burgerbibliothek
- Berkeley Library Digital Collections
- Argonnaute
- BNE
- Cornell
- Didόmena

283
La liste complète des collections contenant des fonds d'archives et collections de livre peut être obtenu en requêtant [le 3store d'ISIDORE](https://isidore.science/sqe) avec la SPARQL [suivante](https://isidore.science/sparql/?default-graph-uri=&query=SELECT+*+WHERE+%7B%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2FCollection%3E.%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2Fprimaires%3E.%0D%0A%3Fs+dcterms%3Atitle+%3Ftitre%0D%0A%7D+ORDER+BY+ASC%28%3Ftitre%29&format=text%2Fhtml&timeout=0&debug=on) :
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
284
285
286

```
SELECT * WHERE {
287
288
289
 ?s rdf:type <http://isidore.science/class/Collection>.
 ?s rdf:type <http://isidore.science/class/primaires>.
 ?s dcterms:title ?titre
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
290
291
} ORDER BY ASC(?titre)
```
292

293
### Indexation des principales plateformes de données en SHS
294

Laurent CAPELLI's avatar
Laurent CAPELLI committed
295
ISIDORE moissonne, c'est le terme consacré, puis indexe les contenus de nombreuses plateformes de données en SHS permettant aux chercheurs de regrouper dans leur profil d'utilisateur l'ensemble de leurs données. Nous encourageons les chercheur·e·s, pour leurs programmes de recherche, à utiliser des plateformes proposant des dispositifs et protocoles d'interopérabilité ouverts permettant de présenter des métadonnées documentaires et scientifiques.
296

Laurent CAPELLI's avatar
Laurent CAPELLI committed
297
Les principales plateformes de données (sources, archives mais aussi publications) sont moissonné par ISIDORE.
298
299
300
301
302
303
304
305
306
307
308

La liste complète des collections peut être obtenu en requêtant [le 3store d'ISIDORE](https://isidore.science/sqe) avec la SPARQL [suivante](https://isidore.science/sparql/?default-graph-uri=&query=SELECT+*+WHERE+%7B%0D%0A+%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2FCollection%3E.%0D%0A+%3Fs+dcterms%3Atitle+%3Ftitre%0D%0A%7D+ORDER+BY+ASC%28%3Ftitre%29%0D%0A&format=text%2Fhtml&timeout=0&debug=on) :

```
SELECT * WHERE {
 ?s rdf:type <http://isidore.science/class/Collection>.
 ?s dcterms:title ?titre
} ORDER BY ASC(?titre)
```

N'hésitez pas à nous en signaler.
309

310
#### Les données déposées et documentées dans NAKALA peuvent-elles être référencées par ISIDORE ?
311

312
Oui, les données déposés et documentées dans NAKALA peuvent être
313
314
accessibles dans ISIDORE. NAKALA propose en standard le protocole d'interopérabilité [OAI-PMH](https://fr.wikipedia.org/wiki/Open_Archives_Initiative_Protocol_for_Metadata_Harvesting) qui permet de moissonner, c'est le terme consacré, les métadonnées des documents, et donc
de les référencer, enrichir et indexer par ISIDORE.
315

316
317
Le référencement par moissonnage OAI-PMH n’est cependant pas
automatique pour le moment, notamment pour permettre aux utilisateurs de préparer et d'organiser leurs
318
données et métadonnées. Pour être référencé, il suffit de demander par e-mail à être indexé ISIDORE via <isidore-sources@huma-num.fr>.
319

320
#### Comment des articles et images scientifiques déposées dans l’archive ouverte HAL, HAL-SHS et MédiHAL seront-elles accessibles dans ISIDORE ?
321

322
323
324
325
326
327
Tous les fichiers (PDF, illustrations, photographies, audio et vidéo) déposés et documentés dans l’archive ouverte HAL, dont HAL-SHS, ainsi que MédiHAL sont automatiquement référencés dans ISIDORE et indexés au niveau de leurs métadonnées. Tous ces documents et leurs notices sont donc accessibles à travers les différentes interfaces d’interrogation d’ISIDORE.

#### Les données déposées dans l'entrepôt Didómena (EHESS) peuvent-elles être référencées par ISIDORE ?

Oui, [Didómena](https://didomena.ehess.fr) (l'entrepôt de données de la recherche de l'EHESS) propose une interopérabilité en OAI-PMH. Attention, le moissonnage n'est pas automatique. Pour être référencé au niveau de votre collection, merci de nous communiquer le point d'accès OAI-PMH via <isidore-sources@huma-num.fr>.

328
329
#### Les données déposées dans Calames (ABES) peuvent-elles être référencées par ISIDORE ?

330
Oui, les descriptions de fonds d'archives catalogués dans [Calames](http://calames.abes.fr) (le catalogue des archives et des manuscrits des bibliothèques universitaires françaises) sont indexés dans ISIDORE. Cependant, la norme EAD-XML, utilisé dans Calames, ne permet pas toujours une indexation documentaire optimale : principalement au niveau de la richesse des métadonnées. Ceci est dû à la logique propre à la norme EAD-XML dans l'encodage des informations dans les niveaux de description des fonds.
331

332
333
334
335
336
337
338
#### Les données déposées dans l'entrepôt Data.sciencespo peuvent-elles être référencées par ISIDORE ?

Oui, les données déposées et documentées dans [Data.sciencespo](https://data.sciencespo.fr) (Dataverse) propose une interopérabilité en OAI-PMH. Il est moissonné automatiquement par ISIDORE.

#### Les données déposées dans la plateforme COCOON peuvent-elles être référencées par ISIDORE ?

Oui, les données déposées et documentées dans [la plateforme COCOON](https://cocoon.huma-num.fr) propose une interopérabilité en OAI-PMH. Cette plateforme est moissonnée automatiquement par ISIDORE.
339

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
340
#### Les fichiers et documents déposés dans la plateforme européenne Zenodo peuvent-ils être référencés par ISIDORE ?
341

Laurent CAPELLI's avatar
Laurent CAPELLI committed
342
Oui, il est possible pour ISIDORE de référencer les fichiers et
343
344
documents déposés et documentés sur la plateforme
[Zenodo](https://zenodo.org).
345

Laurent CAPELLI's avatar
Laurent CAPELLI committed
346
Le référencement repose sur le principe du moissonnage OAI-PMH sur un
347
ensemble de fichiers et données (et donc leurs métadonnées) correspondant à un ou
348
des identifiant(s) correspondants aux identifiants des "communities" dans Zenodo (voir https://developers.zenodo.org/#sets).
349
350
351
352
Nous pouvons aussi regrouper plusieurs identifiants Zenodo dans une même
collection ISIDORE permettant ainsi aux déposants de plusieurs corpus
déposés dans Zenodo de les regrouper dans ISIDORE pour leur donner plus
de visibilité.
353

354
355
356
Pour ajouter dans ISIDORE vos dépôts Zenodo, [merci de nous envoyer
l’URL
OAI-PMH](mailto:isidore-sources@huma-num.fr?subject=%22Je%20souhaiterai%20faire%20moissonner%20mes%20dépôts%20Zenodo%22)
357
358
de votre dépôt (voir <https://developers.zenodo.org/#oai-pmh>).

359

360
## Comment faire pour que des données soient référencées par ISIDORE ?
361

Laurent CAPELLI's avatar
Laurent CAPELLI committed
362
Il y a plusieurs façons de faire référencer des données et documents par
363
364
ISIDORE :

365
366
-   Proposer ses données via [un flux XML de métadonnées normalisées et
    utilisant le protocole OAI-PMH](#comment-signaler-ses-donnees-dans-isidore-avec-des-metadonnees-et-le-protocole-oai-pmh) associé à des métadonnées au format
367
    Dublin core. Cette méthode est adaptée pour les bases de données
nsauret's avatar
nsauret committed
368
    documentaires, les corpus, les fonds d’archives scientifiques et les
369
370
    bibliothèques de documents/données. A titre d’exemple, [un outil tel
    que Omeka (Classic ou S) propose le protocole OAI-PMH via des modules](#un-site-web-utilisant-omeka-classic-et-omeka-s-peuvent-il-etre-reference-par-isidore).
371
    Cette méthode est adaptée aux sites web de programme de recherche présentant des corpus de documents ou de données, blogs scientifique (hors Hypotheses.org), et pages Web en général.
372

373
Ces deux méthodes sont par ailleurs souvent implémentées par des outils de publication de données (CMS, SIGB, etc.), par exemple :
374
375
376
377
378
379
380

### Un site web utilisant Drupal peut-il être référencé par ISIDORE ?

Oui, il est possible de faire indexer par ISIDORE des pages web générées
par le CMS Drupal. Il y a deux façons de faire, suivant la nature des
contenus de vos pages :

Laurent CAPELLI's avatar
Laurent CAPELLI committed
381
-   Soit via le protocole OAI-PMH et dans ce cas il existe plusieurs
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
    modules pour Drupal, voir sur
    [https://www.drupal.org/search/site/OAI-PMH](https://www.drupal.org/search/site/OAI-PMH?f%5B0%5D=ss_meta_type%3Amodule "OAI-PMH pour Drupal").
-   Soit via l’utilisation d’une structure de métadonnées en Dublin
    Core dans les pages web générées par Drupal utilisant RDFa et un
    sitemap.xml. Un article dédié à cette façon de procéder est
    disponible à l’adresse ci-dessus.

### Un site web utilisant Omeka Classic et Omeka-S peuvent-il être référencé par ISIDORE ?

Oui, Omeka *Classic* et Omeka S proposent des modules permettant d'exposer les métadonnées selon le protocole OAI-PMH :

- Module pour [Omeka S](https://omeka.org/s/modules/OaiPmhRepository/)
- Module pour [Omeka Classic](https://omeka.org/classic/docs/Plugins/OaiPmhRepository/)


397
### Comment signaler ses données dans ISIDORE avec des métadonnées et le protocole OAI-PMH ?
398
399
400
401
402
403

Pour signaler ses données dans ISIDORE en utilisant le protocole
OAI-PMH, il suffit :

-   De préparer ses données et ses métadonnées en utilisant le
    vocabulaire documentaire Dublin Core Element Set ou le Dublin Core
nsauret's avatar
nsauret committed
404
    Terms, suivant le niveau de précision que l’on souhaite et de les
405
    rendre accessibles via [le protocole OAI-PMH](https://fr.wikipedia.org/wiki/Open_Archives_Initiative_Protocol_for_Metadata_Harvesting) ;
406
-   D’organiser et de documenter les *Sets* de son entrepôt OAI-PMH
nsauret's avatar
nsauret committed
407
-   De signaler à <isidore-sources@huma-num.fr> l’adresse de son
408
    entrepôt à Huma-Num.
409

410
#### Les ensembles de document en OAI-PMH : les *Sets*
411

412
413
414
415
Le protocole OAI-PMH permet, par la création de *Sets*, de rassembler en un
ensemble cohérent des notices dont le périmètre fait sens sur le plan scientifique ou éditorial et qui est laissé à la libre appréciation du producteur des données.

Il permet aussi de définir une hiérarchie dans les *Sets* avec un mécanisme d’héritage en précisant
416
dans le nom du set le nom du ou des *Sets* parents et du *Set* enfant
nsauret's avatar
nsauret committed
417
séparé par le caractère `:`. ISIDORE est en capacité d’utiliser ces
418
*Sets* pour limiter le moissonnage à un ensemble de notices ou pour
nsauret's avatar
nsauret committed
419
différencier différentes sources de données au sein d’un même entrepôt.
420
421
Le producteur devra donc préciser les modalités de moissonnage qui lui
paraissent les plus appropriées afin de valoriser au mieux ses
422
423
ressources au sein d’ISIDORE. Pour cela, il indiquera le ou les *Sets*
concernés ou une règle permettant de distinguer les *Sets* à prendre en
424
425
compte.

426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
Les *Sets* peuvent présenter des métadonnées, en Dublin Core Element Set, qui leurs sont propres. Par exemple :

```xml
<set>
 <setSpec>OuvColl</setSpec>
 <setName>Ouvrages</setName>
 <setDescription>
  <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
   <dc:description>Ouvrages de recherche diffusés sur Cairn.info</dc:description>
  </oai_dc:dc>
 </setDescription>
</set>
```

#### Les notices en OAI-PMH ou *Records* :
441

442
443
Dans le cadre d’ISIDORE, chaque "record" OAI-PMH correspond à un document.
Le moissonneur d’ISIDORE exploite ainsi les métadonnées décrites selon le
nsauret's avatar
nsauret committed
444
profil d’applications défini par l’Open Archive Initiative pour le
445
446
Dublin Core Element Set (connu aussi Dublin Core "simple"). De
surcroît, le moissonneur collecte également le ou les documents en texte
nsauret's avatar
nsauret committed
447
intégral dont les URL (débutant par `https://` ou `http://`) sont indiquées
448
dans l’élément `<dc:identifier>`.
449

Laurent CAPELLI's avatar
Laurent CAPELLI committed
450
Nous recommandons aux producteurs de données de proposer des records les
451
plus riches possible en métadonnées. En effet, la pertinence dans
452
453
454
ISIDORE favorise les métadonnées les plus riches possibles. Des champs
tel que :

nsauret's avatar
nsauret committed
455
```xml
456
457
458
459
460
461
462
<dcterms:description>
<dcterms:creator>
<dcterms:date>
```

sont indispensables.

463
##### Exemple d’une notice complète selon le protocole OAI-PMH :
464

nsauret's avatar
nsauret committed
465
```xml
466
<record>
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
 <header>
  <identifier>oai:halshs.archives-ouvertes.fr:halshs-00514304</identifier>
  <datestamp>2010-09-02T11:06:50Z</datestamp>
  <setSpec>halshs</setSpec>
  <setSpec>SHS:ECO</setSpec>
  <setSpec>SDV:BIO</setSpec>
  <setSpec>INFO:INFO_BT</setSpec>
  <setSpec>SDV:SA:AEP</setSpec>
  <setSpec>SDV:SA:STA</setSpec>
  <setSpec>CIRAD</setSpec>
  <setSpec>SHS</setSpec>
 </header>
 <metadata>
  <oai_dc:dc xsi:schemaLocation=”http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd”>
  <dc:identifier>http://halshs.archives-ouvertes.fr/halshs-00514304/en/ </dc:identifier>
  <dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/Regulation_GMO_pprint.pdf</dc:identifier>
  <dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/ppt_nocmt_broader_regulation.pdf </dc:identifier>
  <dc:title>Broadening the scope of regulation: a prerequisite for a positive contribution of transgenic crop useto sustainable development</dc:title>
  <dc:creator>Fok, Michel</dc:creator>
  <dc:subject>[SHS:ECO] Humanities and Social Sciences/Economy and finances </dc:subject>
  <dc:subject>[SDV:BIO] Life Sciences/Biotechnology</dc:subject>
  <dc:subject>[INFO:INFO_BT] Computer Science/Biotechnology</dc:subject>
  <dc:subject>[SDV:SA:AEP] Life Sciences/Agricultural sciences/Agriculture, economy and politics </dc:subject>
  <dc:subject>[SDV:SA:STA] Life Sciences/Agricultural sciences/Sciences and technics of agriculture</dc:subject>
  <dc:subject>regulation</dc:subject>
  <dc:subject>coordination</dc:subject>
  <dc:subject>GMO</dc:subject>
  <dc:subject>biotechnology</dc:subject>
  <dc:subject>seed price</dc:subject>
  <dc:subject>research</dc:subject>
  <dc:subject>weed resistance</dc:subject>
  <dc:subject>pest complex shift</dc:subject>
  <dc:description>Ex-ante regulation of transgenic crop use generally prevails, before the authorization of commercial release.This kind of regulation addresses the concerns of biosafety and coexistence, under pressure of pros and/or cons of GMO. After fifteen years of large scale use of transgenic crops (notablysoybean and cotton) in various countries (USA, China, Brasil, India...), ecological and economic phenomena are observed and which could threaten the sustainable use of transgenic varieties. I advocate that the regulation scope must be extended so as to a) promote a systemic and coordinatedapproach of transgenic crop use, b) ensure seed purity with regard to the transgenic trait, c) maintain research on non-transgenic varieties, and d) warrant fair pricing of transgenic seeds.</dc:description>
  <dc:coverage>Montpellier</dc:coverage>
  <dc:coverage>France</dc:coverage>
  <dc:date>2010-08-29</dc:date>
  <dc:language>English</dc:language>
  <dc:type>proceeding with peer review</dc:type>
  <dc:source>Proceedings of Agro2010, the XIth ESA Congress</dc:source>
  <dc:source>Agro2010, the XIth ESA Congress</dc:source>
 </oai_dc:dc>
508
509
510
511
512
513
</metadata>
</record>
```

En plus de cette description en *Dublin Core Element Set*, chaque
enregistrement peut être décrit suivant un ou plusieurs formats de
nsauret's avatar
nsauret committed
514
métadonnées dont le choix est laissé à l’appréciation de
515
516
517
l’administrateur de l’entrepôt OAI-PMH.

Le moissonneur d’ISIDORE est en capacité d’exploiter le format *Dublin Core Terms* et tous schémas XML permettant
nsauret's avatar
nsauret committed
518
l’exposition du texte intégral (dont la TEI ou l’EAD) améliorant ainsi
519
520
son indexation. Le producteur de données devra veiller à respecter
scrupuleusement les spécifications du protocole OAI-PMH dans sa version
521
522
523
524
525
2.0 en particulier sur :

- Le respect strict des valeurs de "datestamp" dans les *records* afin de synchroniser au mieux les mise à jour entre le producteur et ISIDORE ;
- La bonne gestion des données supprimées ([détail sur la documentation du protocole OAI-PMH](http://www.openarchives.org/OAI/openarchivesprotocol.html#DeletedRecords)) ;
- Dans le cadre d'entrepôt de données d'éditeurs ou de taille importante, l'accès à son entrepôt OAI-PMH par les adresses IPs des moissonneurs OAI-PMH d’ISIDORE (signalement du moissonnage par ISIDORE auprès de sa DSI).
526
527

Nous conseillons aux producteurs de valider régulièrement la conformité
nsauret's avatar
nsauret committed
528
de leur entrepôt grâce, par exemple, aux [outils de l’Open archive
529
initiative](https://www.openarchives.org/pmh/tools/). Enfin, nous conseillons aux producteurs de données de contacter l'équipe d'Huma-Num pour toutes demandes d'informations.
530

531
### Comment signaler ses données dans ISIDORE avec des métadonnées RDFa ?
532

533
Le RDFa permet d'exprimer une structure de métadonnées selon les principes du Web sémantique (RDF pour *[Resource Description Framework](https://fr.wikipedia.org/wiki/Resource_Description_Framework)*) dans le code HTML de pages Web. Le "a" de RDFa veut dire "in
534
535
attributes", c'est à dire au sein du code HTML).

nsauret's avatar
nsauret committed
536
Comment exprimer des métadonnées d’une page web très simplement en
537
utilisant la [syntaxe
nsauret's avatar
nsauret committed
538
RDFa](https://tcuvelier.developpez.com/tutoriels/web-semantique/rdfa/introduction/)
539
? Par exemple, dans un billet de blog publié avec WordPress. S’il
540
peut exister des [plugins pour faire
nsauret's avatar
nsauret committed
541
cela](https://wordpress.org/plugins/search/RDFa/),
nsauret's avatar
nsauret committed
542
l’obsolescence de ces derniers peut rendre difficile leur maintien dans
543
le temps. Une autre solution consiste à implémenter RDFa dans le code
nsauret's avatar
nsauret committed
544
545
HTML du thème WordPress que l’on a choisi. Pour ce que cela soit facile
et gérable dans le temps, le plus simple est d’utiliser l’entête HTML
546
`<head>` afin d’y placer des balises `<meta>` qui contiendront quelques métadonnées.
547
548

Exprimer des métadonnées selon le modèle RDF via la syntaxe RDFa permet
549
à des machines (principalement des moteurs de recherche et des indexeurs) de mieux traiter l’information car elle devient plus explicite : pour une machine, une chaîne de caractère peut être un titre ou un résumé, si vous ne lui dites pas que c’est un titre ou que c’est un résumé elle
nsauret's avatar
nsauret committed
550
ne le devinera pas. A minima, il est donc possible d’utiliser les
nsauret's avatar
nsauret committed
551
balises `<meta>` pour définir une structure RDF offrant la possibilité
552
de structurer les métadonnées minimales par exemple avec le vocabulaire
553
documentaire Dublin Core Element Set.
554

555
#### Comment faire pratiquement ?
556

nsauret's avatar
nsauret committed
557
En premier, il faut indiquer dans le DOCTYPE de la page web, qu’elle va
558
559
560
contenir des informations qui vont utiliser le modèle RDF, ainsi, le
DOCTYPE sera :

nsauret's avatar
nsauret committed
561
```xml
562
563
564
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
```

565
566
Dans la balise `<html>`, doivent être présente les adresses des
ontologie documentaires (via leurs *NameSpace XML*) qui servent
567
à "typer" les informations. RDFa — qui place des métadonnées dans le Web sémantique, nécessite à minima de faire appel aux ontologies RDF et RDF Schema et au Dublin Core Element Set (dc). Il est possible d'utiliser en plus — afin d'affiner les métadonnées, le Dublin Core Terms (dcterms) :
568

nsauret's avatar
nsauret committed
569
```xml
570
571
572
573
<html xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
574
575
576
xmlns:dcterms="http://purl.org/dc/terms/">
```

577
578
Il est possible, pour encoder plus d’information, d’utiliser plus
d'ontologies documentaires :
579

nsauret's avatar
nsauret committed
580
```xml
581
582
583
584
585
586
587
588
<html
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
589
590
591
xmlns:cc="http://creativecommons.org/ns#">
```

nsauret's avatar
nsauret committed
592
Dans l'exemple ci-dessus, [foaf](http://www.foaf-project.org/) sert à encoder des informations relatives à une personne ou un objet décrit par les métadonnées. L'ontologie [CC](https://creativecommons.org) permet de signaler quelle licence, issues des *Creative Commons*, s’appliquerait à ce contenu.
593
594

La structure RDFa au travers de balises
nsauret's avatar
nsauret committed
595
596
`<meta>` dans l’en-tête `<head>` de la page HTML. Dans un premier
temps, à l’aide d’une balise `<link>`, nous allons définir l’objet
597
598
numérique auquel les informations encodées en RDF seront rattachées :

nsauret's avatar
nsauret committed
599
```xml
600
601
602
603
<link rel="dc:identifier" href="http://monblog.com/monbillet.html" />
```

Cette balise définit donc un conteneur pour les informations que nous
nsauret's avatar
nsauret committed
604
allons indiquer à l’aide des balises `<meta>`. Ce conteneur est
nsauret's avatar
nsauret committed
605
identifié par une URI qui se trouve être une URL, c’est à dire
606
607
l’adresse de la page dans le web.

608

609
Les balises `<meta>` définissent ensuite un ensemble de métadonnées, c’est à dire dans notre cas, des informations descriptives de la page web du billet du blog :
610

611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
```xml
<meta property="dc:title" content="Le titre de mon billet" />
<meta property="dc:creator" content="Prénom Nom de l'auteur 1" />
<meta property="dc:creator" content="Prénom Nom de l'auteur 2" />
<meta property="dcterms:created" content="2011-01-27" />
<meta property="dcterms:abstract" content="Un résumé descriptif du contenu de ma page" xml:lang="fr" />
<meta property="dcterms:abstract" content="A summary in english" xml:lang="en" />
<meta property="dc:subject" content="mot-clé 3" />
<meta property="dc:subject" content="mot-clé 2" />
<meta property="dc:type" content="billet" />
<meta property="dc:format" content="text/html" />
<meta property="dc:relation" content="Un lien vers une page web complémentaire" />
```

Suivant la nature du contenu de la page web, il est bien sûr possible
nsauret's avatar
nsauret committed
626
627
d’être plus précis, plus fin et plus complet dans les informations
encodées. Par exemple, il sera judicieux d’utiliser le vocabulaire DC
628
629
Terms.

630
631
Le DC Terms permet par exemple d'inclure une forme précise pour une référence bibliographique du contenu :

632

633
634
635
```xml
<meta property="dcterms:bibliographicCitation" content="Mettre ici une référence bibliographique" />
```
636

637
Il serait possible de passer l’ensemble du texte d’une page web à l’aide du vocabulaire SIOC [en utilisant la propriété
nsauret's avatar
nsauret committed
638
`sioc:content`](http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique).
639

640
Il est possible également de relier des pages web entre elles (pour
nsauret's avatar
nsauret committed
641
définir un corpus d’auteurs par exemple) en utilisant dans le
nsauret's avatar
nsauret committed
642
vocabulaire DC Terms la propriété du DC Terms : `dcterms:isPartOf`.
643
644
645
646

```xml
<meta property="dcterms:isPartOf" content="URL d'une autre page Web" />
```
647

nsauret's avatar
nsauret committed
648
649
#### Création du Sitemap

nsauret's avatar
nsauret committed
650
Une fois l’encodage RDFa fait dans les pages HTML, il vous reste à créer
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
un fichier XML de type Sitemap listant les pages que vous souhaitez qu’ISIDORE moissonne et soumettre l’URL de ce sitemap :

```xml
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<url>
		<loc>http://monsiteweb.com/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	</url>
	<url>
		<loc>http://monsiteweb.com/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
  </url>
</urlset>
```
669

nsauret's avatar
nsauret committed
670
Il est possible de tester l’extraction que fera ISIDORE de vos
671
métadonnées RDFa à l’aide de l’application "ISIDORE à la demande"
Laurent CAPELLI's avatar
Laurent CAPELLI committed
672
disponible sur à l'adresse <https://rd.isidore.science/ondemand/fr/rdfa.html>
673

674
## Périmètre d'ISIDORE
675

676
### Pourquoi certains articles ne se retrouvent pas dans ISIDORE ?
677
678
679
680
681
682

Si vous ne retrouvez pas la totalité de votre production scientifique
dans [ISIDORE](https://isidore.science), il peut y avoir plusieurs
explications. Il se peut que vos articles soient publiés dans des revues
qui ne sont pas électroniques ou qui ne rendent pas accessibles leurs
articles même longtemps après leur publication. En effet, depuis sa
683
création, [ISIDORE](https://isidore.science) favorise l’open
nsauret's avatar
nsauret committed
684
access : l’indexation est meilleure pour les articles disponibles en
685
686
accès libre. De nombreuses revues électroniques ont fait ce choix au
travers de portails tels que Open Edition Journal (anciennement
687
Revues.org), Érudit, Persée, et Cairn.info, Redalyc, OApen et les articles de
688
689
690
691
ces revues sont donc collectés et indexés par
[ISIDORE](https://isidore.science).

Il se peut également que vos articles soient publiés en ligne, mais pas
nsauret's avatar
nsauret committed
692
693
694
695
696
697
sur une plateforme d’édition électronique (mais un site web), ou sur une
plateforme d’édition électronique ne permettant pas l’indexation via le
protocole standard (voir la question-réponse sur l’OAI-PMH).

D’autres revues rendent accessibles leurs articles, mais seulement après
une période d’embargo. Dans ce cas,
698
[ISIDORE](https://isidore.science) n’indexe que les métadonnées
nsauret's avatar
nsauret committed
699
de l’article. Si vous vous connectez via votre bibliothèque
700
701
702
universitaire, centre de documentation ou par BibCNRS, il est possible
que vous ayez quand même accès à ces articles.

Laurent CAPELLI's avatar
Laurent CAPELLI committed
703
Il est possible de rechercher dans les collections indexées par
704
[ISIDORE](https://isidore.science) en utilisant le moteur lui-même et en
705
indiquant que vous souhaitez recherche dans les collections.
706
707
708

Il se peut aussi que votre article soit publié sous forme de PDF image,
dans ce cas seul le référencement par
709
[ISIDORE](https://isidore.science) sera permis, mais pas son
710
711
712
713
714
715
indexation en texte intégral.

Il se peut enfin que certains de vos articles soient publiés dans des
revues qui ne sont pas classées en SHS.

Dans tous ces cas, vous pouvez vous-même déposer vos articles dans une
716
archive ouverte comme HAL (HAL-SHS en particulier) qui est aussi indexée par
Laurent CAPELLI's avatar
Laurent CAPELLI committed
717
[ISIDORE](https://isidore.science) ou vous rapprocher de votre
718
719
bu/centre de documentation.

nsauret's avatar
nsauret committed
720
Si vous n’êtes dans aucun de ces cas et pensez donc qu’il s’agit d’une
721
722
erreur, vous pouvez nous envoyer un mail à isidore@huma-num.fr.

723
### Pourquoi certains ouvrages/chapitres d’ouvrage ne sont pas signalés dans ISIDORE ?
724

725
ISIDORE sait identifier qu’un document est de type "ouvrage", ainsi, il y
nsauret's avatar
nsauret committed
726
a plus de 500000 ouvrages et chapitres d’ouvrages signalés dans
727
728
ISIDORE.

nsauret's avatar
nsauret committed
729
Il faut savoir qu’il existe relativement peu de plateformes d’édition
730
731
d’ouvrages en ligne en libre accès. ISIDORE indexe en SHS, par exemple, les
contenus des plateformes d'ouvrage comme :
732

733
734
735
736
737
- [OpenEdition Books](https://isidore.science/search/?collection=10670/3.szxq6s) (au niveau des chapitres, et de les signaler) ;
- [Scielo Books](https://isidore.science/search/?collection=10670/3.7oraz1) (Brésil) ;
- [OApen](https://isidore.science/search/?collection=10670/3.pwofj8) (Pays-Bas) ;
- [Erudit](https://isidore.science/s/collection?q=erudit) (Canada) ;
-
738
739

Par ailleurs, vous pouvez, en accord avec votre éditeur, déposer votre
nsauret's avatar
nsauret committed
740
ouvrage ou chapitres d’ouvrages dans l’archive ouverte
741
[HAL-SHS](https://halshs.archives-ouvertes.fr). Il sera alors indexé par
742
743
744
ISIDORE dans le cadre de l’indexation de HAL-SHS et reconnu comme un chapitre d'ouvrage.

### Pourquoi certaines bases de données ne sont pas signalées dans ISIDORE ?
745

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
746
Le moissonnage par ISIDORE nécessite une exposition de métadonnées (documentaires, scientifiques, etc.) standardisées et normalisées (soit en utilisant le protocole OAI-PMH, soit à l'aide d'un Sitemap XML et de métadonnées RDFa, voir ci-dessus).
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
747
748

Si vous connaissez des bases de données qui ne sont pas présentes dans ISIDORE, n'hésitez pas à nous les signaler afin que nous puissions voir avec leurs éditeurs/producteurs de données.
749

750
## Formations à ISIDORE
751

752
Nous listons ici les formations, présentations fonctionnelles et auto-formations en ligne à l'utilisation d'ISIDORE. N'hésitez pas à nous faire par de formations que vous organiseriez :
753
754

- [L'Urfist Méditerranée vous propose une nouvelle formation e-learning sur Isidore](https://urfist.univ-cotedazur.fr/nouvelle-formation-en-ligne-une-initiation-a-isidore/) (mars 2021)
755
- [« Isidore, mon assistant de recherche personnel »](https://ig.hypotheses.org/2215) par Johanna Daniel (avril 2020)