isidore.md 34.1 KB
Newer Older
1
# ISIDORE
Stephane Pouyllau's avatar
Stephane Pouyllau committed
2

3
## Qu’est-ce qu’ISIDORE ?
4

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
5
ISIDORE est un moteur de recherche permettant de trouver des publications, des données numériques et profils de chercheur•e•s en sciences humaines et sociales venant du monde entier.
6

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
7
8
9
Il permet de rechercher dans plusieurs millions de documents (articles, thèses et mémoires, rapports, jeux de données, pages Web, notices de bases de données, fonds d’archives scientifiques, etc.), des signalements évènements (séminaires, colloques, etc.).

Il propose des fonctionnalités de réseau social scientifique. À ce titre il fonctionne comme un assistant de recherche et offre de nombreuses fonctionnalités pour organiser sa veille scientifique.
10

Stephane Pouyllau's avatar
Stephane Pouyllau committed
11
Il est accessible sur [isidore.science](https://isidore.science). Pour plus
nsauret's avatar
nsauret committed
12
d’information sur ISIDORE, vous pouvez consulter la page "[À
13
14
propos](https://isidore.science/apropos)" du site.

nsauret's avatar
nsauret committed
15
Lancé le 8 décembre 2010, ISIDORE est le fruit de la collaboration du "très grand équipement" Adonis du CNRS (2007-2013), du Centre pour la communication scientifique directe et des sociétés Antidot, Mondéca et Sword.
16
17

ISIDORE est actuellement développement et exploité par la TGIR Huma-Num.
Stephane Pouyllau's avatar
Stephane Pouyllau committed
18

19
## Comment fonctionne ISIDORE ?
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
20
21
22
23
24
25
26

ISIDORE moissonne des métadonnées textuelles et du texte intégral.

Il exploite les métadonnées des documents ainsi que le texte intégral, le but est d'analyser ces informations afin de les enrichir, de les relier des concepts des référentiels scientifiques (thésaurus, etc.), de les relier aux identifiants des auteurs (ORCID, IDRef, IDHAL, VIAF, etc.).

Plusieurs enrichissements sont effectués :

27
- L'annotation sémantique : les mots présents dans les métadonnées des documents sont comparés aux entrées des référentiels par le biais d'un algorithme fondé sur une analyse morphologique des termes. Si une équivalence s'effectue entre un terme issu du document une entrée de l'un des référentiels, alors la ressource sera reliée à ladite entrée du référentiel. Les référentiels sont multilingues et alignés entre eux. Ainsi, l'annotation sémantique est multilingue.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
28
29
30
31
32
33
34

- La catégorisation disciplinaire : ISIDORE utilise un classifieur sémantique qui, après avoir été entrainé sur un corpus de référence, catégorise dans les disciplines SHS du référentiel MORESS, tous les documents présents dans ISIDORE. L'entrainement du classifieur est réalisé à l'aide de la catégorisation manuelle réalisé par les chercheurs dans HAL lors du dépôt de leurs publications.

- La détection des auteurs : ISIDORE détecte les auteurs des documents et enrichit la forme auteur (prénom et nom) à l'aide d'identifiants auteurs internationaux (ORCID, VIAF, ISNI) et nationaux (IDHAL, IDRef).

ISIDORE indexe, dans son moteur de recherche :

35
- Les métadonnées des documents
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
36
37
38
39
40
- Le texte intégral (s'il est disponible en libre accès)
- les annotations sémantiques
- la classication disciplinaire
- l'enrichissement et la normalisation des auteurs

41
Plus d'information est disponible sur [la page "Référentiels"](https://isidore.science/vocabularies) d'ISIDORE.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
42

43
## Comment utiliser ISIDORE ?
44

nsauret's avatar
nsauret committed
45
ISIDORE propose plusieurs outils pour rechercher, découvrir, collecter et organiser les contenus qu’il indexe :
46

nsauret's avatar
nsauret committed
47
Il propose un [moteur de recherche par pertinence](https://isidore.science) qui peut être utilisé avec plusieurs méthodes d’interrogation.
48

nsauret's avatar
nsauret committed
49
50
-   Par défaut, ISIDORE cherche tous les mots d’une requête posée par
    l’utilisateur/utilisatrice en enlevant les mots vides (de, la, le,
51
52
53
54
55
56
57
58
59
60
61
    les, etc.) ;
-   Il est possible de chercher un document avec une phrase complète ou
    un groupe de mots en utilisant les guillemets autour de la phrase,
    par exemple : "direction de conscience" cherchera précisément
    cette phrase. Ainsi, dans ce cas-là, le "de" ne sera pas considéré
    comme un mot vide ;

Plusieurs opérateurs de recherche booléens sont disponibles dans
ISIDORE. À noter que la syntaxe des opérateurs est importante dans
ISIDORE, ils sont toujours en MAJUSCULE (ex. ET ou AND) :

nsauret's avatar
nsauret committed
62
- ET (AND) : l’intersection permet de trouver les termes (ou ensemble
63
64
65
    de termes) communs à la requête. Par exemple : 
    -   conscience ET genre
    -   "guerre froide" ET migrations
Stephane Pouyllau's avatar
Stephane Pouyllau committed
66
- OU (OR) : la réunion permet de trouver les termes cherchés
nsauret's avatar
nsauret committed
67
    appartenant aux deux ensembles de termes, ou à l’un ou à l’autre.
68
69
    Par exemple : 
    -   "web sémantique" OU "web 3.0"
nsauret's avatar
nsauret committed
70
- SAUF (NOT) : l’exclusion permet de réduire le bruit en excluant des
71
72
    termes. Par exemple :
    -   révolution SAUF Française
nsauret's avatar
nsauret committed
73
- PROCHE(n.) (NEAR(n.)) : l’opérateur PROCHE(n.) (comprendre "proche
74
75
76
77
    de") permet de lier des termes en indiquant une valeur "n." de
    proximité entre ces derniers. Il fonctionne comme un ET avec n.
    mot(s) entre les termes. La valeur "n." indique le nombre de mots
    devant séparer les deux termes recherchés. PROCHE fonctionne aussi
nsauret's avatar
nsauret committed
78
    sans la valeur n. et est dans ce cas-là égal à un PROCHE(10), c’est
79
80
81
82
    à dire 10 mots entre les termes recherchés (espacement standard).
    -   maison PROCHE(4) noblesse : recherche maison et noblesse avec
        une proximité de 4 mots

Stephane Pouyllau's avatar
Stephane Pouyllau committed
83
Il propose également une recherche avancée très complète à
nsauret's avatar
nsauret committed
84
l’adresse : <https://isidore.science/as> et également accessible depuis
85
86
la première page du site.

Stephane Pouyllau's avatar
Stephane Pouyllau committed
87
88
Il propose un espace personnel pour les chercheurs permettant :

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
89
90
91
92
93
- de collecter, de classer, d’organiser les documents trouvés ;
- d’y regrouper l’ensemble de sa production scientifique afin de l’éditorialiser dans une page de profil personnel ;
- d’y suivre les productions de collègues ;
- d’y enregistrer et d'y publier ses requêtes et leurs résultats à des fins de veille ;
- d’y constituer des bibliographies exportables vers Zotero ;
Stephane Pouyllau's avatar
Stephane Pouyllau committed
94

95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
### ISIDORE propose-t-il une connexion avec Zotero ?

#### Utilisation depuis ISIDORE du connecteur Zotero (la plus courante)

ISIDORE est compatible avec Zotero et permet d’importer les références des documents sur deux niveaux dès lors que l’utilisateur a installé [le connecteur Zotero](https://www.zotero.org/download/) dans son navigateur :

- Sur la page listant les résultats d’une recherche
- Dans la page de visualisation d’un document

#### Utilisation depuis Zotero du connecteur de recherche ISIDORE

L’outil Zotero permet d’utiliser des moteurs de recherche pour rechercher ou compléter des références bibliographiques directement depuis l’interface de Zotero. Nous proposons ici deux connecteurs ISIDORE pour Zotero permettant d’utiliser ISIDORE à partir de recherche sur les auteurs.

L’ajout d’ISIDORE à Zotero permet :

- De compléter des références à partir d’une recherche sur le nom de l’auteur : c’est le "ISIDORE, aide-moi à trouver ce qu’il/elle a publié."
- De trouver des documents dans lequel l’auteure ou l’auteur est cité : c’est le "ISIDORE, qu’as-tu sur l’auteur/auteure ?"

Ces [connecteurs et leurs documentations sont disponibles sur le gitlab de la TGIR Huma-Num](https://gitlab.huma-num.fr/spouyllau/ISIDORtero).

### Utilisation des flux RSS

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
117
ISIDORE peut proposer ses résultats de recherche sous la forme de flux RSS dans le but d'alimenter des logiciel de veille scientifique (dont Zotero par exemple), des carnets de recherche, etc. Les flux RSS créés dans ISIDORE sont mis à jour, comme l’ensemble des contenus du moteur de recherche, une fois par mois environ lors de la mise à jour générale des contenus d'ISIDORE. Ainsi, il est possible de suivre, depuis Zotero, la mise à jour des documents d’Isidore issus des requêtes enregistrées.
118
119
120

Pour cela, il faut demander à ISIDORE --- dans son espace personnel en
mode connecté, le lien vers le flux RSS d’une requête enregistrée en
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
121
allant, une fois dans votre espace personnel, dans "Mes requêtes" :
122

123
![Mon Image](media/isidore.png)
124
125

Pour une requête enregistrée, il faut cliquer sur le pictogramme "Flux
126
RSS de la requête" disponible à droite ![](https://documentation.huma-num.fr/images/isidore-rss-001.png){: style="width:170px"} et d’en copier le lien avec ![](https://documentation.huma-num.fr/images/isidore-requeteRSS.png){: style="width:120px"}
127

128
Le lien copié est de la forme : `https://isidore.science/feed/lt3913`
129
130
131
132
133
134
135

Si votre navigateur est équipé d’un module de lecture des flux RSS, il
sera possible d’utiliser ce lien directement dans votre navigateur.
Dans notre exemple, Nous allons l’utiliser dans Zotero.

Dans Zotero, il faut faire : Nouveau flux > À partir de l’URI :

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
136
![](https://documentation.huma-num.fr/images/zot-001.png)
137
138
139
140
141
142

Puis d’ajouter l’url du flux fournit par ISIDORE (avec le navigateur
Safari sous MacOS prendre soin de retirer la mention "feed:" de
l’url). Venir ensuite le coller dans "URL" de la fenêtre de création
de flux RSS de Zotero, exemple ci-dessous :

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
143
![](https://documentation.huma-num.fr/images/zot-002.png)
144
145
146
147

Il faut ensuite donner un titre à son flux, par exemple :
"isidore.science - veille sur ...".

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
148
149
## Que trouve-t-on dans ISIDORE ?

150
151
### Organisation des documents et données dans ISIDORE

Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
152
153
154
155
156
157
158
159
ISIDORE contient plusieurs millions de documents en SHS qui moissonnés, enrichis avec des référentiels scientifiques et indexés. Ils sont organisés en :

- Documents et données de la recherche (fonds d'archives, matériaux bruts, photographies, films, jeux de données, statistiques, etc) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/primaires
- Documents et données publiées (articles, livres, mémoires et thèses, rapports, etc.) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/secondaires
- Evènements scientifiques (colloques, journées d'études, etc.) et sont identifiés dans l'ontologie d'ISIDORE par : http://isidore.science/class/evenementielles


Pour un grand nombre de disciplines des SHS, ISIDORE permet de rechercher des documents venant des principales plateformes de publications du monde entier, ainsi qu’un grand nombre des fonds numérisés par les bibliothèques nationales, universitaires et
160
municipales.
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
161
162
163
Pour des usages poussés de recherche, la [recherche avancée d’ISIDORE](https://isidore.science/as) offre par exemple, la
possibilité de rechercher des documents entre deux dates et par discipline ou encore par collections.

164
Les principales plateformes de publications (revues et livres) présentes dans ISIDORE sont :
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
165
166
167
168
169
170
171
172
- OpenEdition
- Cairn
- Persée
- Erudit
- Oapen
- Redalyc
- Scielo Books

173
La liste complète des collections contenant des publications peut être obtenu en requêtant [le 3store d'ISIDORE](https://isidore.science/sqe) avec la SPARQL [suivante](https://isidore.science/sparql?query=SELECT+*+WHERE+%7B%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2FCollection%3E.%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2Fpublications%3E.%0D%0A%3Fs+dcterms%3Atitle+%3Ftitre%0D%0A%7D+ORDER+BY+ASC%28%3Ftitre%29&format=text%2Fhtml&debug=on&timeout=0) :
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
174
175
176
177
178
179
180
181
182

```
SELECT * WHERE {
?s rdf:type <http://isidore.science/class/Collection>.
?s rdf:type <http://isidore.science/class/publications>.
?s dcterms:title ?titre
} ORDER BY ASC(?titre)
```
Les principales bibliothèques numériques (municipales, nationales, etc.) présentes dans ISIDORE sont :
183
- Gallica
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
184
185
186
187
188
189
190
191
192
193
194
- Sélène
- E-rara
- NuBIS
- Octaviana
- Burgerbibliothek
- Berkeley Library Digital Collections
- Argonnaute
- BNE
- Cornell
- Didόmena

195
La liste complète des collections contenant des fonds d'archives et collections de livre peut être obtenu en requêtant [le 3store d'ISIDORE](https://isidore.science/sqe) avec la SPARQL [suivante](https://isidore.science/sparql/?default-graph-uri=&query=SELECT+*+WHERE+%7B%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2FCollection%3E.%0D%0A%3Fs+rdf%3Atype+%3Chttp%3A%2F%2Fisidore.science%2Fclass%2Fprimaires%3E.%0D%0A%3Fs+dcterms%3Atitle+%3Ftitre%0D%0A%7D+ORDER+BY+ASC%28%3Ftitre%29&format=text%2Fhtml&timeout=0&debug=on) :
Stéphane Pouyllau's avatar
Stéphane Pouyllau committed
196
197
198
199
200
201
202
203

```
SELECT * WHERE {
?s rdf:type <http://isidore.science/class/Collection>.
?s rdf:type <http://isidore.science/class/primaires>.
?s dcterms:title ?titre
} ORDER BY ASC(?titre)
```
204

205
### Interopérabilité d'ISIDORE les principales plateformes de données en SHS
206

207
208
ISIDORE moissonne et indexe de nombreuses plateformes de données en SHS permettant aux chercheurs de regrouper dans leur profil d'utilisateur l'ensemble de leurs données.

209
#### Les données déposées et documentées dans NAKALA peuvent-elles être référencées par ISIDORE ?
210

211
Oui, les données déposés et documentées dans NAKALA peuvent être
212
213
accessibles dans ISIDORE. NAKALA propose en standard le protocole d'interopérabilité [OAI-PMH](https://fr.wikipedia.org/wiki/Open_Archives_Initiative_Protocol_for_Metadata_Harvesting) qui permet de moissonner, c'est le terme consacré, les métadonnées des documents, et donc
de les référencer, enrichir et indexer par ISIDORE.
214

215
216
Le référencement par moissonnage OAI-PMH n’est cependant pas
automatique pour le moment, notamment pour permettre aux utilisateurs de préparer et d'organiser leurs
217
données et métadonnées. Pour être référencé, il suffit de demander par e-mail à être indexé ISIDORE via <isidore-sources@huma-num.fr>.
218

219
#### Comment des images scientifiques déposées dans l’archive ouverte MédiHAL seront-elles accessibles dans ISIDORE ?
220

221
Tous les fichiers (illustrations, photographies, audio et vidéo) déposés et documentés dans l’archive ouverte MédiHAL sont automatiquement référencés dans ISIDORE et indexés au niveau de leurs métadonnées. Tous ces documents et leurs notices sont donc accessibles à travers les différentes interfaces d’interrogation d’ISIDORE.
222

223
#### Les fichiers et documents déposés dans Zenodo peuvent-ils être référencés par ISIDORE ?
224

225
226
227
Oui, il est possible pour ISIDORE de référencer les fichiers et
documents déposés et documentés sur la plateforme
[Zenodo](https://zenodo.org).
228

229
230
231
232
233
234
235
Le référencement repose sur le principe du moissonnage OAI-PMH sur un
ensemble de fichiers et données (et donc leurs métadonnées) correspondant à un ou
des identifiant(s) correspondants aux identifiants des "communities" dans Zenodo (voir (https://developers.zenodo.org/#sets)).
Nous pouvons aussi regrouper plusieurs identifiants Zenodo dans une même
collection ISIDORE permettant ainsi aux déposants de plusieurs corpus
déposés dans Zenodo de les regrouper dans ISIDORE pour leur donner plus
de visibilité.
236

237
238
239
Pour ajouter dans ISIDORE vos dépôts Zenodo, [merci de nous envoyer
l’URL
OAI-PMH](mailto:isidore-sources@huma-num.fr?subject=%22Je%20souhaiterai%20faire%20moissonner%20mes%20dépôts%20Zenodo%22)
240
241
242
243
244
245
246
247
248
de votre dépôt (voir <https://developers.zenodo.org/#oai-pmh>).

#### Les données déposées dans l'entrepôt Didómena peuvent-elles être référencées par ISIDORE ?

Oui, [Didómena](https://didomena.ehess.fr) (l'entrepôt de données de la recherche de l'EHESS) propose une interopérabilité en OAI-PMH. Attention, le moissonnage n'est pas automatique. Pour être référencé au niveau de votre collection, merci de nous communiquer le point d'accès OAI-PMH via <isidore-sources@huma-num.fr>.

#### Les données déposées dans l'entrepôt Dataverse Data.sciencespo peuvent-elles être référencées par ISIDORE ?

Oui, les données déposées et documentées dans [le dataverse Data.sciencespo.fr](https://data.sciencespo.fr) propose une interopérabilité en OAI-PMH. Il est moissonné automatiquement par ISIDORE.
249

250
#### Les données déposées dans la plateforme COCOON peuvent-elles être référencées par ISIDORE ?
251

252
Oui, les données déposées et documentées dans [la plateforme COCOON](https://cocoon.huma-num.fr) propose une interopérabilité en OAI-PMH. Cette plateforme est moissonnée automatiquement par ISIDORE.
253

254
## Quelle est la fréquence de mise à jour d’ISIDORE ?
255

256
257
258
259
260
261
262
263
264
265
ISIDORE est mis à jour, de façon incrémentale, en moyenne une fois par
mois. Pourquoi ce délai ? En plus de moissonner et d’indexer les
documents, ISIDORE les enrichit à l’aide de concepts issus de
référentiels scientifiques (thésaurus, taxonomie, etc.). Ce travail d’enrichissement sémantique est
automatique et permet de vous proposer des suggestions de lecture. Il
s’agit de vous faire découvrir des documents autres que ceux que vous
cherchiez. Cela nécessite un certain temps de traitement et de calcul.
Les mises à jour des documents vous concernant, qui vous seront ainsi
proposés dans votre compte utilisateur comme des documents à
revendiquer, suivront elles aussi ce rythme mensuel de mise à jour.
266

267
## ISIDORE peut-il indexer des documents et données multilingues ?
268

269
270
271
Oui. Depuis 2015, les documents et jeux de données en anglais, espagnol
et français sont indexés, enrichis et reliés aux référentiels scientifiques par ISIDORE (métadonnées et texte intéral). Pour le texte intéral hors de ces trois langues, il est indexé dans la langue du document mais l'enrichissement n'a pas lieu.
Pour plus d’information, vous pouvez consulter notre billet sur le sujet : [Isidore speaks English, sino también español et toujours en français](http://humanum.hypotheses.org/921).
272

273
## Comment faire pour que des données soient référencées par ISIDORE ?
274
275
276
277
278
279
280

Il y a deux façon de faire référencer des données et documents par
ISIDORE :

-   Proposer ses données via un flux XML de métadonnées normalisées et
    utilisant le protocole OAI-PMH associé à des métadonnées au format
    Dublin core. Cette méthode est adaptée pour les bases de données
nsauret's avatar
nsauret committed
281
282
    documentaires, les corpus, les fonds d’archives scientifiques et les
    bibliothèques de documents/données. A titre d’exemple, un outil tel
283
284
285
286
287
    que Omeka propose OAI-PMH via un module (voir
<http://info.omeka.net/build-a-website/manage-plugins/oai-pmh-repository/>).
-   Proposer ses données via [un flux sitemap XML pointant vers des
    pages web contenant des métadonnées
    RDFa](https://documentation.huma-num.fr/index.php?solution_id=1035).
288
    Cette méthode est adaptée aux sites web de programme de recherche présentant des corpus de documents ou de données, blogs scientifique (hors Hypotheses.org), et pages Web en général.
289
290
291
292
293

Pour aller plus loin, un guide plus technique est disponible en ligne :
[comment contribuer à ISIDORE avec ses données
numériques](http://www.huma-num.fr/sites/default/files/guide-isidore.pdf).

294
### Comment signaler ses données dans ISIDORE avec des métadonnées et le protocole OAI-PMH ?
295
296
297
298
299
300

Pour signaler ses données dans ISIDORE en utilisant le protocole
OAI-PMH, il suffit :

-   De préparer ses données et ses métadonnées en utilisant le
    vocabulaire documentaire Dublin Core Element Set ou le Dublin Core
nsauret's avatar
nsauret committed
301
    Terms, suivant le niveau de précision que l’on souhaite et de les
302
    rendre accessibles via le protocole OAI-PMH
303
-   D’organiser et de documenter les *Sets* de son entrepôt OAI-PMH
nsauret's avatar
nsauret committed
304
-   De signaler à <isidore-sources@huma-num.fr> l’adresse de son
305
306
    entrepôt à Huma-Num

307
#### Les "sets" en OAI-PMH :
308

309
Le protocole OAI-PMH permet, par la création de *Sets*, de rassembler un
310
311
ensemble cohérent de notices dont le périmètre est laissé à la libre
appréciation du producteur des données. Il permet aussi de définir une
312
313
hiérarchie dans les *Sets* avec un mécanisme d’héritage en précisant
dans le nom du set le nom du ou des *Sets* parents et du *Set* enfant
nsauret's avatar
nsauret committed
314
séparé par le caractère `:`. ISIDORE est en capacité d’utiliser ces
315
*Sets* pour limiter le moissonnage à un ensemble de notices ou pour
nsauret's avatar
nsauret committed
316
différencier différentes sources de données au sein d’un même entrepôt.
317
318
Le producteur devra donc préciser les modalités de moissonnage qui lui
paraissent les plus appropriées afin de valoriser au mieux ses
319
320
ressources au sein d’ISIDORE. Pour cela, il indiquera le ou les *Sets*
concernés ou une règle permettant de distinguer les *Sets* à prendre en
321
322
compte.

323
#### Les notices en OAI-PMH ou "record" :
324

nsauret's avatar
nsauret committed
325
326
327
Dans le cadre d’ISIDORE, chaque record correspond à un document. Le
moissonneur d’ISIDORE exploite ainsi les métadonnées décrites selon le
profil d’applications défini par l’Open Archive Initiative pour le
328
329
Dublin Core Element Set (connu aussi Dublin Core "simple"). De
surcroît, le moissonneur collecte également le ou les documents en texte
nsauret's avatar
nsauret committed
330
331
intégral dont les URL (débutant par `https://` ou `http://`) sont indiquées
dans l’élément `<dc:identifier>`
332
333
334
335
336
337

Nous recommendons aux producteurs de données de proposer des record les
plus riches possible en métadonnées. En effet, la pertinance dans
ISIDORE favorise les métadonnées les plus riches possibles. Des champs
tel que :

nsauret's avatar
nsauret committed
338
```xml
339
340
341
342
343
344
345
<dcterms:description>
<dcterms:creator>
<dcterms:date>
```

sont indispensables.

346
##### Exemple d’une notice en OAI-PMH :
347

nsauret's avatar
nsauret committed
348
```xml
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
<record>
<header>
<identifier>oai:halshs.archives-ouvertes.fr:halshs-00514304</identifier>
<datestamp>2010-09-02T11:06:50Z</datestamp>
<setSpec>halshs</setSpec>
<setSpec>SHS:ECO</setSpec>
<setSpec>SDV:BIO</setSpec>
<setSpec>INFO:INFO_BT</setSpec>
<setSpec>SDV:SA:AEP</setSpec>
<setSpec>SDV:SA:STA</setSpec>
<setSpec>CIRAD</setSpec>
<setSpec>SHS</setSpec>
</header>
<metadata>
<oai_dc:dc xsi:schemaLocation=”http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd”>
<dc:identifier>http://halshs.archives-ouvertes.fr/halshs-00514304/en/ </dc:identifier>
<dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/Regulation_GMO_pprint.pdf</dc:identifier>
<dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/ppt_nocmt_broader_regulation.pdf </dc:identifier>
<dc:title>Broadening the scope of regulation: a prerequisite for a positive contribution of transgenic crop useto sustainable development</dc:title>
<dc:creator>Fok, Michel</dc:creator>
<dc:subject>[SHS:ECO] Humanities and Social Sciences/Economy and finances </dc:subject>
<dc:subject>[SDV:BIO] Life Sciences/Biotechnology</dc:subject>
<dc:subject>[INFO:INFO_BT] Computer Science/Biotechnology</dc:subject>
<dc:subject>[SDV:SA:AEP] Life Sciences/Agricultural sciences/Agriculture, economy and politics </dc:subject>
<dc:subject>[SDV:SA:STA] Life Sciences/Agricultural sciences/Sciences and technics of agriculture</dc:subject>
<dc:subject>regulation</dc:subject>
<dc:subject>coordination</dc:subject>
<dc:subject>GMO</dc:subject>
<dc:subject>biotechnology</dc:subject>
<dc:subject>seed price</dc:subject>
<dc:subject>research</dc:subject>
<dc:subject>weed resistance</dc:subject>
<dc:subject>pest complex shift</dc:subject>
<dc:description>Ex-ante regulation of transgenic crop use generally prevails, before the authorization of commercial release.This kind of regulation addresses the concerns of biosafety and coexistence, under pressure of pros and/or cons of GMO. After fifteen years of large scale use of transgenic crops (notablysoybean and cotton) in various countries (USA, China, Brasil, India...), ecological and economic phenomena are observed and which could threaten the sustainable use of transgenic varieties. I advocate that the regulation scope must be extended so as to a) promote a systemic and coordinatedapproach of transgenic crop use, b) ensure seed purity with regard to the transgenic trait, c) maintain research on non-transgenic varieties, and d) warrant fair pricing of transgenic seeds.</dc:description>
<dc:coverage>Montpellier</dc:coverage>
<dc:coverage>France</dc:coverage>
<dc:date>2010-08-29</dc:date>
<dc:language>English</dc:language>
<dc:type>proceeding with peer review</dc:type>
<dc:source>Proceedings of Agro2010, the XIth ESA Congress</dc:source>
<dc:source>Agro2010, the XIth ESA Congress</dc:source>
</oai_dc:dc>
</metadata>
</record>
```

En plus de cette description en *Dublin Core Element Set*, chaque
enregistrement peut être décrit suivant un ou plusieurs formats de
nsauret's avatar
nsauret committed
397
398
399
400
métadonnées dont le choix est laissé à l’appréciation de
l’administrateur de l’entrepôt. Le moissonneur d’ISIDORE est en capacité
d’exploiter le format *Dublin Core Terms* et tous schémas XML permettant
l’exposition du texte intégral (dont la TEI ou l’EAD) améliorant ainsi
401
402
son indexation. Le producteur de données devra veiller à respecter
scrupuleusement les spécifications du protocole OAI-PMH dans sa version
nsauret's avatar
nsauret committed
403
2.0 et à autoriser l’accès à son entrepôt au moissonneur d’ISIDORE.
404
405

Nous conseillons aux producteurs de valider régulièrement la conformité
nsauret's avatar
nsauret committed
406
de leur entrepôt grâce, par exemple, aux [outils de l’Open archive
407
408
initiative](https://www.openarchives.org/pmh/tools/).

409
### Comment signaler ses données dans ISIDORE avec des métadonnées RDFa ?
410

nsauret's avatar
nsauret committed
411
Comment exprimer des métadonnées d’une page web très simplement en
412
413
utilisant la [syntaxe
RDFa](http://tcuvelier.developpez.com/tutoriels/web-semantique/rdfa/introduction/)
nsauret's avatar
nsauret committed
414
? Prenons par exemple un billet de blog publié avec WordPress. S’il
415
416
peut exister des [plugins pour faire
cela](http://wordpress.org/extend/plugins/search.php?q=RDFa),
nsauret's avatar
nsauret committed
417
l’obsolescence de ces derniers peut rendre difficile leur maintien dans
418
le temps. Une autre solution consiste à implémenter RDFa dans le code
nsauret's avatar
nsauret committed
419
420
HTML du thème WordPress que l’on a choisi. Pour ce que cela soit facile
et gérable dans le temps, le plus simple est d’utiliser l’entête HTML
nsauret's avatar
nsauret committed
421
`<head>` afin d’y placer des balises `<meta>` qui contiendront les
422
423
424
425
métadonnées.

Exprimer des métadonnées selon le modèle RDF via la syntaxe RDFa permet
à des machines (principalement des moteurs de recherche) de mieux
nsauret's avatar
nsauret committed
426
traiter l’information car elle devient plus explicite : pour une
427
machine, une chaîne de caractère peut être un titre ou un résumé, si
nsauret's avatar
nsauret committed
428
429
vous ne lui dites pas que c’est un titre ou que c’est un résumé elle
ne le devinera pas. A minima, il est donc possible d’utiliser les
nsauret's avatar
nsauret committed
430
balises `<meta>` pour définir une structure RDF offrant la possibilité
431
de structurer les métadonnées minimales par exemple avec le vocabulaire
nsauret's avatar
nsauret committed
432
documentaire Dublin Core Element Set. Le RDFa est une façon d’écrire des
433
434
435
triplets RDF dans du HTML (le "a" de RDFa veut dire "in
attributes").

436
#### Comment faire ?
437

nsauret's avatar
nsauret committed
438
En premier, il faut indiquer dans le DOCTYPE de la page web, qu’elle va
439
440
441
contenir des informations qui vont utiliser le modèle RDF, ainsi, le
DOCTYPE sera :

nsauret's avatar
nsauret committed
442
```xml
443
444
445
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
```

nsauret's avatar
nsauret committed
446
Dans la balise `<html>`, nous allons indiquer les adresses des
nsauret's avatar
nsauret committed
447
vocabulaires documentaires - par l’intermédiaire de namespace XML - qui
448
449
450
451
vont nous servir à typer les informations, dans notre exemple, nous
allons utiliser le Dublin Core simple et le Dublin Core Terms (DC Terms)
:

nsauret's avatar
nsauret committed
452
```xml
453
454
455
456
<html xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
457
458
459
xmlns:dcterms="http://purl.org/dc/terms/">
```

nsauret's avatar
nsauret committed
460
Il serait possible, pour encoder plus d’information, d’utiliser plus
461
462
de vocabulaires documentaires :

nsauret's avatar
nsauret committed
463
```xml
464
465
466
467
468
469
470
471
<html
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
472
473
474
475
476
477
xmlns:cc="http://creativecommons.org/ns#">
```

Ici, [foaf](http://www.foaf-project.org/) nous servirait à encoder des
informations relatives à une personne ou un objet décrit par les
métadonnées, [CC](http://creativecommons.org) nous permettrait de
nsauret's avatar
nsauret committed
478
signaler quelle licence Creative Commons s’appliquerait à ce contenu.
479
480
Après avoir déclaré des les vocabulaires documentaires que nous allons
utiliser, nous allons ajouter la structure RDFa au travers de balises
nsauret's avatar
nsauret committed
481
482
`<meta>` dans l’en-tête `<head>` de la page HTML. Dans un premier
temps, à l’aide d’une balise `<link>`, nous allons définir l’objet
483
484
numérique auquel les informations encodées en RDF seront rattachées :

nsauret's avatar
nsauret committed
485
```xml
486
487
488
489
<link rel="dc:identifier" href="http://monblog.com/monbillet.html" />
```

Cette balise définit donc un conteneur pour les informations que nous
nsauret's avatar
nsauret committed
490
allons indiquer à l’aide des balises `<meta>`. Ce conteneur est
nsauret's avatar
nsauret committed
491
492
identifié par une URI qui se trouve être une URL, c’est à dire
l’adresse de la page dans le web. Maintenant, nous enchaînons les
nsauret's avatar
nsauret committed
493
balises `<meta>` qui définissent donc un ensemble de métadonnées, c’est
494
495
496
497
498
499
à dire dans notre cas, des informations descriptives de la page web :

![](https://documentation.huma-num.fr/images/meta.png){width="646"
height="220"}

Suivant la nature du contenu de la page web, il sera bien sûr possible
nsauret's avatar
nsauret committed
500
501
d’être plus précis, plus fin et plus complet dans les informations
encodées. Par exemple, il sera judicieux d’utiliser le vocabulaire DC
502
503
504
505
506
507
508
509
Terms.

Le DC Terms permettra avec :

![](https://documentation.huma-num.fr/images/meta2.png){width="637"
height="67"}

de proposer une forme pour une référence bibliographique dans le cas
nsauret's avatar
nsauret committed
510
511
d’une page web décrivant un ouvrage par exemple. Il serait possible de
passer l’ensemble du texte d’une page web à l’aide du vocabulaire
512
513
514
SIOC [en utilisant la propriété
sioc:content](http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique).
Il est possible également de relier des pages web entre elles (pour
nsauret's avatar
nsauret committed
515
définir un corpus d’auteurs par exemple) en utilisant dans le
516
517
vocabulaire DC Terms la propriété du DC Terms : dcterms:isPartOf.

nsauret's avatar
nsauret committed
518
519
520
Une fois l’encodage RDFa fait dans les pages HTML, il vous reste à créer
un sitemap.xml listant les pages que vous souhaitez qu’ISIDORE moissonne
et nous soumettre l’URL de votre sitemap par e-mail
521
522
à isidore-sources@huma-num.fr.

nsauret's avatar
nsauret committed
523
524
Il est possible de tester l’extraction que fera ISIDORE de vos
métadonnées en RDFa à l’aide de l’application "ISIDORE à la demande"
525
526
disponible ici : <http://rd.rechercheisidore.fr/ondemand/fr/rdfa.html>

527
### Un site web utilisant Drupal peut-il être référencé par ISIDORE ?
528
529
530
531
532
533
534
535

Oui, il est possible de faire indexer par ISIDORE des pages web générées
par le CMS Drupal. Il y a deux façons de faire, suivant la nature des
contenus de vos pages :

-   Soit via le protocole OAI-PMH et dans ce cas il existe  plusieurs
    modules Drupal, voir sur
    [https://www.drupal.org/search/site/OAI-PMH](https://www.drupal.org/search/site/OAI-PMH?f%5B0%5D=ss_meta_type%3Amodule "OAI-PMH pour Drupal").
nsauret's avatar
nsauret committed
536
-   Soit via l’utilisation d’une structure de métadonnées en Dublin
537
538
    Core dans les pages web générées par Drupal utilisant RDFa et un
    sitemap.xml. Un article dédié à cette façon de procéder est
nsauret's avatar
nsauret committed
539
    disponible à l’adresse :
540
541
    [https://documentation.huma-num.fr/index.php?solution_id=1035](https://documentation.huma-num.fr/index.php?solution_id=1035%20)

542
## Périmètre d'ISIDORE
543

544
### Pourquoi certains articles ne se retrouvent pas dans ISIDORE ?
545
546
547
548
549
550

Si vous ne retrouvez pas la totalité de votre production scientifique
dans [ISIDORE](https://isidore.science), il peut y avoir plusieurs
explications. Il se peut que vos articles soient publiés dans des revues
qui ne sont pas électroniques ou qui ne rendent pas accessibles leurs
articles même longtemps après leur publication. En effet, depuis sa
nsauret's avatar
nsauret committed
551
552
création, [ISIDORE](https://www.rechercheisidore.fr) favorise l’open
access : l’indexation est meilleure pour les articles disponibles en
553
554
555
556
557
558
559
accès libre. De nombreuses revues électroniques ont fait ce choix au
travers de portails tels que Open Edition Journal (anciennement
Revues.org), Érudit, Persée, et Cairn.info, Redalyc et les articles de
ces revues sont donc collectés et indexés par
[ISIDORE](https://isidore.science).

Il se peut également que vos articles soient publiés en ligne, mais pas
nsauret's avatar
nsauret committed
560
561
562
563
564
565
566
567
sur une plateforme d’édition électronique (mais un site web), ou sur une
plateforme d’édition électronique ne permettant pas l’indexation via le
protocole standard (voir la question-réponse sur l’OAI-PMH).

D’autres revues rendent accessibles leurs articles, mais seulement après
une période d’embargo. Dans ce cas,
[ISIDORE](https://www.rechercheisidore.fr) n’indexe que les métadonnées
de l’article. Si vous vous connectez via votre bibliothèque
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
universitaire, centre de documentation ou par BibCNRS, il est possible
que vous ayez quand même accès à ces articles.

Il est possible de rechercher dans les collections indexées par
[ISIDORE](https://isidore.science) en utilisant le moteur lui-même et en
indicant que vous souhaitez recherche dans les collections.

Il se peut aussi que votre article soit publié sous forme de PDF image,
dans ce cas seul le référencement par
[ISIDORE](https://www.rechercheisidore.fr) sera permis, mais pas son
indexation en texte intégral.

Il se peut enfin que certains de vos articles soient publiés dans des
revues qui ne sont pas classées en SHS.

Dans tous ces cas, vous pouvez vous-même déposer vos articles dans une
archive ouverte comme HAL-SHS qui est aussi indexée par
[ISIDORE](https://www.rechercheisidore.fr) ou vous rapprocher de votre
bu/centre de documentation.

nsauret's avatar
nsauret committed
588
Si vous n’êtes dans aucun de ces cas et pensez donc qu’il s’agit d’une
589
590
erreur, vous pouvez nous envoyer un mail à isidore@huma-num.fr.

591
### Pourquoi certains ouvrages/chapitres d’ouvrage ne sont pas signalés dans ISIDORE ?
592

nsauret's avatar
nsauret committed
593
594
ISIDORE sait identifier qu’un document est de type ouvrage, ainsi, il y
a plus de 500000 ouvrages et chapitres d’ouvrages signalés dans
595
596
ISIDORE.

nsauret's avatar
nsauret committed
597
598
599
Il faut savoir qu’il existe relativement peu de plateformes d’édition
d’ouvrages en ligne en libre accès. ISIDORE indexe par exemple les
contenus de la principale d’entre elles dans le monde francophone,
600
601
[OpenEdition
Books](https://www.rechercheisidore.fr/search/?collection=10670/3.szxq6s),
nsauret's avatar
nsauret committed
602
603
la plateforme du [Centre pour l’édition électronique
ouverte](http://www.cleo.cnrs.fr) et cela permet d’indexer des livres
604
605
--- au niveau des chapitres, et de les signaler.

nsauret's avatar
nsauret committed
606
Hors du monde francophone, ISIDORE indexe aussi les ouvrages présents sur [Scielo Books](https://www.rechercheisidore.fr/search/?collection=10670/3.7oraz1) (Brésil) et [OApen](https://www.rechercheisidore.fr/search/?collection=10670/3.pwofj8) (Pays-Bas).
607
608

Par ailleurs, vous pouvez, en accord avec votre éditeur, déposer votre
nsauret's avatar
nsauret committed
609
ouvrage ou chapitres d’ouvrages dans l’archive ouverte
610
[HAL-SHS](https://halshs.archives-ouvertes.fr). Il sera alors indexé par
nsauret's avatar
nsauret committed
611
ISIDORE dans le cadre de l’indexation de HAL-SHS.
612

nsauret's avatar
nsauret committed
613
Si votre ouvrage est disponible sur l’une de ces plateformes et que
614
615
616
vous ne le trouvez cependant pas sur ISIDORE, vous pouvez nous le
signaler ici via le formulaire de
[contact](http://documentation.huma-num.fr/index.php?action=contact).