Commit 4fc7fa06 authored by Laurent CAPELLI's avatar Laurent CAPELLI
Browse files

typo nakala

parent ac610164
Pipeline #5226 passed with stage
in 38 seconds
......@@ -23,7 +23,7 @@ Les services de la Grille de sevices sont destinés à être utilisés dans le s
La demande d’ouverture d’un ou plusieurs services est à effectuer par mail à <cogrid@huma-num.fr>. Pour permettre à l’équipe d’Huma-Num d’examiner votre demande, le responsable du projet est invité à nous donner le maximum d’informations concernant ses besoins : une courte présentation du projet scientifique, les responsables (scientifiques et techniques), la structure administrative support, les services sollicités, la volumétrie envisagée, le type de données concernées et les technologies mises en œuvre.
Les services suivants peuvent se demander sans passer par cogrid@huma-num.fr : ISIDORE, ShareDocs, GitLab, Stylo, Mattermost. Pour ces services, l’utilisateur est invité à se rendre sur http://humanid@huma-num.fr, créer son compte et demander l’ouverture du service souhaité.
Les services suivants peuvent se demander sans passer par cogrid@huma-num.fr : ISIDORE, ShareDocs, GitLab, Stylo, Mattermost. Pour ces services, l’utilisateur est invité à se rendre sur https://humanid.huma-num.fr, créer son compte et demander l’ouverture du service souhaité.
## Responsabilité de l’utilisateur
......@@ -68,7 +68,7 @@ Huma-Num se réserve le droit de publier la liste des projets, y compris l’inf
L’utilisateur s’engage à citer dans tous les documents relatifs au projet, et sur les supports Web, le soutien apporté par la TGIR Huma-Num.
Cette indication sera suivie du logo d’Huma-Num disponible à cette adresse <http://www.huma-num.fr/ressources/boite-a-logos> et fera un lien vers le site de la TGIR Huma-Num.
Cette indication sera suivie du logo d’Huma-Num disponible à cette adresse <https://www.huma-num.fr/supports-communication/> et fera un lien vers le site de la TGIR Huma-Num.
Afin d’accorder le meilleur suivi à chacun des projets, toute interaction avec la TGIR devra, autant que possible s’effectuer par voie électronique via les adresses suivantes :
......@@ -87,4 +87,4 @@ L’utilisation du ou des services proposés par Huma-Num équivaut à l’accep
- la loi n° 94-665 du 4 août 1994 modifiée relative à l’emploi de la langue française- la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l’économie numérique
- les dispositions du code de propriété intellectuelle relative à la propriété littéraire et artistique
[^2]: À ce titre, l’utilisateur est notamment renvoyé à la lecture de la charte informatique de [RENATER](https://www.renater.fr/chartes), du [CNRS](http://www.cil.cnrs.fr/CIL/spip.php?article1386), du [CC-In2p3](http://cctools.in2p3.fr/baseConnaissance/upload/574/frcharteinformatiquecnrs012007.pdf) et du [CINES](https://www.cines.fr/charte-du-cines-2/).
[^2]: À ce titre, l’utilisateur est notamment renvoyé à la lecture de la charte informatique de [RENATER](https://www.renater.fr/chartes), du [CNRS](https://www.cil.cnrs.fr/CIL/spip.php?article1386), du [CC-In2p3](http://cctools.in2p3.fr/baseConnaissance/upload/574/frcharteinformatiquecnrs012007.pdf) et du [CINES](https://www.cines.fr/charte-du-cines-2/).
......@@ -28,7 +28,7 @@ Ainsi, Huma-Num procure, exploite et accompagne l’utilisation de services num
### Formats de données produites ou collectées
Huma-Num travaille avec le CINES, expert dans l’archivage numérique des formats. On peut se référer à la liste des formats validés par le CINES pour sa plateforme PAC (https://facile.cines.fr/). Le service facile du cines est intégré dans Nakala (possibilité de vérifier la validité de ses dépôts directement)
Huma-Num travaille avec le CINES, expert dans l’archivage numérique des formats. On peut se référer à la liste des formats validés par le CINES pour sa plateforme PAC (https://facile.cines.fr/). Le service facile du cines est intégré dans NAKALA (possibilité de vérifier la validité de ses dépôts directement)
Il existe des communautés d’usages autour des formats dont voici des exemples :
......@@ -66,17 +66,17 @@ Dès le début du projet et tout au long de sa vie, Huma-Num procure, exploite e
#### Services pour la préservation et l’exposition des données
L’entrepôt Nakala répond au besoin de préservation (données documentées) et à l’exposition des données.
L’entrepôt NAKALA répond au besoin de préservation (données documentées) et à l’exposition des données.
HN : Huma-Num exploite et maintient un entrepôt de données Nakala qui répond aux exigences de préservation et d’exposition des données
HN : Huma-Num exploite et maintient un entrepôt de données NAKALA qui répond aux exigences de préservation et d’exposition des données
Ici encore le code du patrimoine s’applique. = règles de délais d’embargo etc.
HN : Sur la réutilisation, le choix d’une licence est impératif : les données ne peuvent être considérés comme pleinement ouverts que s’ils sont rendus publics sous les conditions d’une licence dite libre ou ouverte. En effet, un objet diffusé sans licence est certes consultable par les tiers, ce qui constitue une forme minimale d’ouverture, mais ses modalités de réutilisation ne sont pas connues. Le choix final de la licence appartient à ceux qui rendent publics leur production (cf https://www.ouvrirlascience.fr/wp-content/uploads/2019/11/Avis_GTEvaluation_DGRI_14novembre.pdf)
On permet de donner une licence dans Nakala = C’est ça que propose HN
On permet de donner une licence dans NAKALA = C’est ça que propose HN
#### Services pour la diffusion des données
Isidore indexe les sources de données SHS et les diffuse (interface web, API etc) permettant leur réutilisation (ajout d’une licence).
ISIDORE indexe les sources de données SHS et les diffuse (interface web, API etc) permettant leur réutilisation (ajout d’une licence).
### Questions éthiques et juridiques
......
......@@ -10,7 +10,7 @@ Vous êtes invités à mentionner sur la page d’accueil de votre site Web
le fait que vous êtes hébergé par la TGIR Huma-Num.
Vous trouverez un choix
d’images sur [www.huma-num.fr/ressources/boite-a-logos](http://www.huma-num.fr/ressources/boite-a-logos).
d’images sur [www.huma-num.fr/supports-communication/](https://www.huma-num.fr/supports-communication/).
## Annuaire des sites hébergés
......@@ -23,7 +23,7 @@ dans cet annuaire.
Il est rappelé qu’un des critères essentiels d’hébergement est la mise
en place d’une interopérabilité des métadonnées et données, afin
qu’elles soient signalées dans notre plateforme [ISIDORE](http://isidore.science/).
qu’elles soient signalées dans notre plateforme [ISIDORE](https://isidore.science/).
Concernant les données, nous vous encourageons à adopter les bonnes pratiques en terme de formats (pérennité) en vous basant sur la liste proposée par l’outil [FACILE du CINES](https://facile.cines.fr/).
......@@ -37,7 +37,7 @@ institutions (Gallica, Europeana) ou par des portails web
disciplinaires. Il s’agit du protocole documentaire le plus
répandu actuellement dans le monde des humanités numériques.
Pour cela, un [guide d’implémentation des méthodes de moissonnage](http://www.huma-num.fr/ressources/guide-isidore%20) est
Pour cela, un [guide d’implémentation des méthodes de moissonnage](isidore.md) est
disponible sur notre site.
Les demandes de moissonnage ou d’aide pour sa mise en place sont à adresser à
......
......@@ -8,13 +8,13 @@ ses structures partenaires, et consolidé sur ses points de présence à
Villeurbanne et à Paris.
Celui-ci vise à faciliter pour les chercheurs le
stockage, la sécurisation et la gestion de leurs jeux de données volumineux. 
stockage, la sécurisation et la gestion de leurs jeux de données volumineux.
Le dispositif est indépendant des autres systèmes et services
d’Huma-Num (Sharedocs, Nakala, hébergement Web et machine virtuelle).
d’Huma-Num (Sharedocs, NAKALA, hébergement Web et machine virtuelle).
Il offre un service complémentaire pour accueillir des jeux de données,
principalement de grandes tailles (plusieurs centaines de Téraoctets au total). 
principalement de grandes tailles (plusieurs centaines de Téraoctets au total).
Ce dispositif est une infrastructure technique, indépendante des
usages fonctionnels (au sens des données : usage, référencement,
......@@ -22,7 +22,7 @@ traitement, publication, ...) et des usages métier.
Il est à considérer comme un équivalent technique d’un serveur de fichiers ordinaire, avec
des fonctionnalités supplémentaires de sécurisation et de préservation
(cf. infra). Le dispositif utilise des disques magnétiques et des bandes
(cf. infra). Le dispositif utilise des disques magnétiques et des bandes
magnétiques, pour stocker les données.
## Caractéristiques des données pouvant être accueillies par le dispositif
......@@ -34,13 +34,13 @@ seront effectués durant toute la vie de ces données.
Par contre ces données ont vocation à être conservées de manière fiable durant
plusieurs années (5 à 10 ans), car elles constituent la matière première
du travail de recherche et ont souvent une valeur de type
patrimonial. 
patrimonial.
Ce service de stockage peut être vu comme le pendant
numérique d’une armoire sécurisée où l’on stocke des documents
importants, nombreux, organisés (en rayonnages, boites archives,
dossiers) et documentés (fiches).
Ceci à la différence d’un bureau où se trouvent en vrac les documents courants et de toutes natures. 
Ceci à la différence d’un bureau où se trouvent en vrac les documents courants et de toutes natures.
Ces données sont notamment issues de campagnes de numérisation de fonds
anciens, de photos, d’enregistrements audio, de cartes, de vidéos, de
......@@ -55,7 +55,7 @@ Les données stockées ne peuvent pas être des bases de données au sens inform
Seuls des fichiers peuvent être stockés sur le dispositif.
Leur volume pourra atteindre plusieurs Téraoctets par jeu de
données. Les données sont organisées en "partages" (ou "volumes"),
données. Les données sont organisées en "partages" (ou "volumes"),
disposant de règles d’accès comme celles utilisées sur des services de
fichiers classiques.
......@@ -70,8 +70,8 @@ Pour chaque partage, il est défini :
- les personnes pouvant accéder en lecture et en écriture à ces données ;
- les sites et plus finement les adresses IP pouvant accéder à ces données (un même partage pourra être accessible depuis plusieurs sites) ;
- le nombre de copies des données pouvant varier typiquement de 1 à 2 ;
- avec ou non une copie sur bandes magnétiques ;
- le nombre de copies des données pouvant varier typiquement de 1 à 2 ;
- avec ou non une copie sur bandes magnétiques ;
- la gestion des versions dans le temps d’un même fichier (mécanisme d’historisation) ;
- la durée de rétention permettant de conserver des données supprimées par les utilisateurs (mais restant accessibles aux administrateurs du dispositif).
......@@ -82,12 +82,12 @@ et une politique de sécurisation qui lui sont propres, et qui peuvent
Le dispositif assure en continu le
respect de ces politiques. Ainsi la modification des localisations, du
nombre d’instances, du nombre de versions dans le temps, ne nécessite
aucune opération humaine.  
aucune opération humaine.
## Architecture du dispositif
Le dispositif est à considérer comme un ensemble intégré unique,
comportant plusieurs serveurs répartis entre les structures partenaires et Huma-Num.  
comportant plusieurs serveurs répartis entre les structures partenaires et Huma-Num.
À ce jour, les structures partenaires sont les MSH de
Rennes, Nantes, Val de Loire, Toulouse et Lyon, ainsi que l’EHESS
......@@ -96,7 +96,7 @@ Rennes, Nantes, Val de Loire, Toulouse et Lyon, ainsi que l’EHESS
10 serveurs sont en production
pour une capacité de 800 Téraoctets sur disques et 1000 Téraoctets sur bandes.
Près de 200 jeux de données sont définis, pour environ 650 Téraoctets. 
Près de 200 jeux de données sont définis, pour environ 650 Téraoctets.
Chaque serveur a un rôle équivalent aux autres et participe aux divers traitements
mis en œuvre, notamment pour la sécurisation constante des données.
......@@ -109,26 +109,26 @@ LDAP/Human-ID d’Huma-Num commun à de nombreux services de la TGIR.
La gestion de l’annuaire est déléguée par branche à chaque site participant grâce à
l’outil FusionDirectory et l’interface accessible en
[annuaire.huma-num.fr](https://annuaire.huma-num.fr). 
[annuaire.huma-num.fr](https://annuaire.huma-num.fr).
Enfin la volumétrie disponible et les licences logicielles sont également globales.
On parle de stockage virtualisé. 
On parle de stockage virtualisé.
L’investissement d’Huma-Num consiste en :
L’investissement d’Huma-Num consiste en :
- les 10 serveurs et les 14 baies de stockage de marque Dell ;
- les licences du logiciel Active-Circle de la société Oodrive ;
- une garantie matérielle et logicielle sur 7 ans sur l’ensemble ;
- la ressource humaine pour la gestion complète du dispositif. 
- les 10 serveurs et les 14 baies de stockage de marque Dell ;
- les licences du logiciel Active-Circle de la société Oodrive ;
- une garantie matérielle et logicielle sur 7 ans sur l’ensemble;
- la ressource humaine pour la gestion complète du dispositif.
Huma-Num est le seul maître d’œuvre et administrateur du dispositif.
Chaque projet demande à Huma-Num la création, la suppression
ou la modification des caractéristiques des partages.
Un groupe d’utilisateurs est associé à un partage, permettant ainsi de déléguer
la gestion de qui accède au partage (par gestion de ce groupe dans l’annuaire commun). 
la gestion de qui accède au partage (par gestion de ce groupe dans l’annuaire commun).
Des présentations du dispositif sont disponibles en :
Des présentations du dispositif sont disponibles en :
- [Rencontre Huma-Num 2018](https://rhn2018.sciencesconf.org/data/20180612_hnbox.pdf)
- [Conférence JRES 2017](https://isidore.science/document/10670/1.yd8n65)
......@@ -147,11 +147,11 @@ positionner des noeuds supplémentaires dans tel ou tel site.
### A. Depuis tout point de l’Internet
Trois méthodes d’accès sont disponibles :                 
Trois méthodes d’accès sont disponibles :
1. via un client utilisant le protocole SFTP (comme Filezilla, rsync, etc.)  vers le serveur sftp.huma-num.fr ;
2. via une interface Web en lecture uniquement permettant une consultation minimaliste de l’arborescence des fichiers (URL à choisir). Un exemple est en [images.eurhisfirm.eu](http://images.eurhisfirm.eu) ;
3. de plus, il est tout à fait possible de coupler une application Web plus élaborée en lien avec un jeu de données stocké dans le dispositif.  Les sites Cocoon, Archeogrid, Telemeta illustrent cette possibilité.
1. via un client utilisant le protocole SFTP (comme Filezilla, rsync, etc.) vers le serveur sftp.huma-num.fr
2. via une interface Web en lecture uniquement permettant une consultation minimaliste de l’arborescence des fichiers (URL à choisir). Un exemple est en [images.eurhisfirm.eu](http://images.eurhisfirm.eu) ;
3. de plus, il est tout à fait possible de coupler une application Web plus élaborée en lien avec un jeu de données stocké dans le dispositif. Les sites Cocoon, Archeogrid, Telemeta illustrent cette possibilité.
### B. Pour les sites hébergeant un des noeuds du dispositif
......@@ -160,10 +160,10 @@ L’intérêt secondaire du service est aussi d’amener une fonction de type
local où se trouve un des noeuds.
Ceci afin d’en rendre l’usage le plus simple possible, proche de celui d’un disque interne.
L’accès aux partages peut alors se faire par une fonction « Connexion à un lecteur réseau »
L’accès aux partages peut alors se faire par une fonction «Connexion à un lecteur réseau»
Le jeu de données apparaît sur le Bureau ou dans l’Explorateur de
fichiers de l’ordinateur de l’utilisateur.
Il peut alors manipuler les données strictement comme si elles étaient sur son disque interne. 
Il peut alors manipuler les données strictement comme si elles étaient sur son disque interne.
Pour étendre cette fonctionnalité
aux utilisateurs ne se trouvant pas sur un site où est hébergé un noeud,
......@@ -178,24 +178,24 @@ nombre de fichiers. Aussi chaque structure candidate indique un ordre de
grandeur du nombre de fichiers qu’elle compte déposer.
Au delà de 10 millions de fichiers, une étude devra être menée avec Huma-Num pour
préciser la faisabilité. 
préciser la faisabilité.
De plus, il est instamment demandé de ne pas dépasser environ 10&nbsp;000 fichiers dans un même dossier.
Au-delà, il convient d’étudier avec Huma-Num les solutions de contournement. 
Au-delà, il convient d’étudier avec Huma-Num les solutions de contournement.
### Limitations sur la nature des données
Les données sous forme de bases de données binaires (MySQL, PostgreSQL,
etc.) ne peuvent pas être stockées dans le dispositif. De même pour les
disques virtuels de machines virtuelles. 
etc.) ne peuvent pas être stockées dans le dispositif. De même pour les
disques virtuels de machines virtuelles.
## Performances
Le dispositif n’est pas conçu pour :                 
Le dispositif n’est pas conçu pour :
- un temps d’accès ultra-rapide ;               
- un temps d’accès ultra-rapide ;
- une très grande vitesse en transfert, en lecture comme en écriture ;
- un usage bureautique ;             
- un traitement intensif et parallèle sur les données. 
- un usage bureautique ;
- un traitement intensif et parallèle sur les données.
Néanmoins le retour d’expériences après cinq d’années d’exploitation
......@@ -206,7 +206,7 @@ Des vitesses de transfert de plus de 50 Mo/s (500 Mb/s)
sont observées régulièrement.
Des traitements intensifs ont pu être réalisés avec de bonnes performances,
en respectant un traitement séquentiel. 
en respectant un traitement séquentiel.
De plus, trois sites Web importants publient
désormais leurs fichiers media via un stockage sur ce dispositif. Il
......@@ -214,33 +214,33 @@ s’agit des sites Cocoon, Archeogrid et Telemeta.
Aussi il convient de noter que le dispositif peut être utilisé
pour publier un corpus de données par une application Web sous forme
de fichiers de taille significative (images, sons, vidéos). 
de fichiers de taille significative (images, sons, vidéos).
Ainsi une instance Omeka-S et une instance de serveur IIIF sont reliées au dispositif.
## Disponibilité, intégrité, confidentialité
L’engagement d’Huma-Num sur ce dispositif est de la même nature que
pour les autres services :                  
pour les autres services :
- "best effort", quant à la disponibilité ;
- haut niveau, quant à l’intégrité et la confidentialité.
- "best effort", quant à la disponibilité ;
- haut niveau, quant à l’intégrité et la confidentialité.
Le retour d’expérience sur cinq ans montre :                  
Le retour d’expérience sur cinq ans montre :
- aucun incident concernant la conservation, l’intégrité ou la confidentialité des données ;
- une disponibilité très satisfaisante. 
- aucun incident concernant la conservation, l’intégrité ou la confidentialité des données ;
- une disponibilité très satisfaisante.
Le dispositif est réputé sûr quant à la conservation des données,
moyennant évidemment l’existence de deux jeux de données sur deux
sites. Un mécanisme de vérification automatique des signatures des
fichiers peut être mis en place.  
fichiers peut être mis en place.
De plus, un archivage binaire des données peut être mis en place sur
De plus, un archivage binaire des données peut être mis en place sur
bandes magnétiques LTO. Ceci constitue une duplication des données sur
d’autres médias que des disques magnétiques. Ces bandes peuvent être
verrouillées en écriture, sont relues et contrôlées automatiquement et
périodiquement, et elles sont écrites dans un format ouvert et normalisé
(TAR). 
(TAR).
Quant à la confidentialité, plusieurs points :
......
......@@ -103,7 +103,7 @@ It combines the power of Omeka for editing and displaying digital data
and the features of NAKALA’s repository for sharing data and metadata in
an interoperable way. The main goal of NAKALONA is to offer the
possibility of sharing and displaying the data and metadata already
stored inside Nakala while taking advantage of Omeka’s possibilities
stored inside NAKALA while taking advantage of Omeka’s possibilities
such as its powerful search engine and extended OAI-PMH feeds. This
software package is entirely managed and administered by the Huma-Num
team, and provided as a Software As A Service (SAAS).
......
......@@ -111,7 +111,7 @@ Combina la potencia de Omeka para editar y exponer datos digitales y las
características del repositorio de NAKALA para compartir datos y
metadatos de una manera interoperable. El principal objetivo de NAKALONA
es ofrecer la posibilidad de compartir y mostrar los datos y metadatos
ya almacenados dentro de Nakala, aprovechando al mismo tiempo las
ya almacenados dentro de NAKALA, aprovechando al mismo tiempo las
posibilidades de Omeka, como su potente motor de búsqueda y el sistema
de alimentación de datos OAI-PMH.
......
......@@ -2,7 +2,7 @@
Vous trouverez ici la présentation et la documentation des services mis en place par Huma-Num.
D'autres informations sur notre [site web](http://huma-num.fr) et notre [carnet de recherche](https://humanum.hypotheses.org/).
D'autres informations sur notre [site web](https://huma-num.fr) et notre [carnet de recherche](https://humanum.hypotheses.org/).
## Comment contacter la TGIR Huma-Num
......
......@@ -114,7 +114,7 @@ Ces [connecteurs et leurs documentations sont disponibles sur le gitlab de la TG
### Utilisation des flux RSS
ISIDORE peut proposer ses résultats de recherche sous la forme de flux RSS dans le but d'alimenter des logiciel de veille scientifique (dont Zotero par exemple), des carnets de recherche, etc. Les flux RSS créés dans ISIDORE sont mis à jour, comme l’ensemble des contenus du moteur de recherche, une fois par mois environ lors de la mise à jour générale des contenus d'ISIDORE. Ainsi, il est possible de suivre, depuis Zotero, la mise à jour des documents d’Isidore issus des requêtes enregistrées.
ISIDORE peut proposer ses résultats de recherche sous la forme de flux RSS dans le but d'alimenter des logiciel de veille scientifique (dont Zotero par exemple), des carnets de recherche, etc. Les flux RSS créés dans ISIDORE sont mis à jour, comme l’ensemble des contenus du moteur de recherche, une fois par mois environ lors de la mise à jour générale des contenus d'ISIDORE. Ainsi, il est possible de suivre, depuis Zotero, la mise à jour des documents d’ISIDORE issus des requêtes enregistrées.
Pour cela, il faut demander à ISIDORE --- dans son espace personnel en
mode connecté, le lien vers le flux RSS d’une requête enregistrée en
......@@ -268,7 +268,7 @@ revendiquer, suivront elles aussi ce rythme mensuel de mise à jour.
Oui. Depuis 2015, les documents et jeux de données en anglais, espagnol
et français sont indexés, enrichis et reliés aux référentiels scientifiques par ISIDORE (métadonnées et texte intéral). Pour le texte intéral hors de ces trois langues, il est indexé dans la langue du document mais l'enrichissement n'a pas lieu.
Pour plus d’information, vous pouvez consulter notre billet sur le sujet : [Isidore speaks English, sino también español et toujours en français](http://humanum.hypotheses.org/921).
Pour plus d’information, vous pouvez consulter notre billet sur le sujet : [Isidore speaks English, sino también español et toujours en français](https://humanum.hypotheses.org/921).
## Comment faire pour que des données soient référencées par ISIDORE ?
......@@ -587,7 +587,7 @@ un fichier XML de type Sitemap listant les pages que vous souhaitez qu’ISIDORE
Il est possible de tester l’extraction que fera ISIDORE de vos
métadonnées RDFa à l’aide de l’application "ISIDORE à la demande"
disponible sur à l'adresse <http://rd.rechercheisidore.fr/ondemand/fr/rdfa.html>
disponible sur à l'adresse <https://rd.isidore.science/ondemand/fr/rdfa.html>
## Périmètre d'ISIDORE
......
......@@ -4,7 +4,7 @@ La qualité des métadonnées est mise en avant dans les principes FAIR
comme un moyen d'atteindre les objectifs visés (faire en sorte que les données soient
faciles à trouver, accessibles, interopérables et réutilisables).
Les métadonnées de Nakala sont essentiellement exprimées avec le vocabulaire Dublin-Core.
Les métadonnées de NAKALA sont essentiellement exprimées avec le vocabulaire Dublin-Core.
Nous déclinons dans ce qui suit quelques conseils pour le codage de ces métadonnées.
## Le modèle Dublin-Core
......@@ -40,7 +40,7 @@ Une description doit être riche, précise et exacte.
----------
### Les éléments (obligatoires) du vocabulaire Nakala
### Les éléments (obligatoires) du vocabulaire NAKALA
#### Titre (nakala:title)
Titre ou nom donné à la ressource.
......@@ -132,7 +132,7 @@ Utilisez une syntaxe W3CDTF (YYYY, YYYY-MM ou YYYY-MM-DD) ou la valeur "Inconnue
```
On devrait plutôt gérer une propriété de ce sens par Nakala (nakala:available)
On devrait plutôt gérer une propriété de ce sens par NAKALA (nakala:available)
qui aurait pour valeur la date de publication ou la date cible d'après embargo si embargo déclaré.
```
......
# 1 Introduction
Sont décrits ici les différents processus de gestion de la pérennisation des données de Nakala
Sont décrits ici les différents processus de gestion de la pérennisation des données de NAKALA
ainsi que leur gestion par l’équipe de la TGIR Huma-Num.
La norme conceptuelle ISO 14721:2012 « Open Archival Information System (OAIS) » est utilisée ici
La norme conceptuelle ISO 14721:2012 «Open Archival Information System (OAIS)» est utilisée ici
pour son modèle fonctionnel ainsi que pour son vocabulaire (termes notés en majuscules).
# 2 Les acteurs
Le diagramme ci-dessous présente les différents acteurs échangeant de l’information avec l’OAIS (l’archive Nakala).
Le diagramme ci-dessous présente les différents acteurs échangeant de l’information avec l’OAIS (l’archive NAKALA).
![oais-acteurs](../media/oais-acteurs.png)
## 2.1 L’archive
L’archive Nakala conserve et donne accès à des ressources scientifiques issues de la communauté
académique française en sciences humaines et sociale. Une ressource, dans Nakala, peut contenir
L’archive NAKALA conserve et donne accès à des ressources scientifiques issues de la communauté
académique française en sciences humaines et sociale. Une ressource, dans NAKALA, peut contenir
un ou plusieurs fichiers. Un ensemble de ressources peut former une collection. Les fichiers
peuvent être de tout type (Par exemple une image, un enregistrement audio, un
document textuel, etc.)
......@@ -22,15 +22,15 @@ Les producteurs de ressources sont :
les auteurs ou contributeurs responsables scientifiques de la collecte ou la production des ressources.
## 2.3 Les utilisateurs
Les ressources de l’archive Nakala sont à destination de la communauté scientifique SHS afin
d’alimenter sa base de connaissances. Le service Nakala fait en sorte que les données soient
Les ressources de l’archive NAKALA sont à destination de la communauté scientifique SHS afin
d’alimenter sa base de connaissances. Le service NAKALA fait en sorte que les données soient
utilisables pour cette communauté visée et soient présentées comme des objets scientifiques
et culturels en utilisant des formats et vocabulaires largement répandus dans cette communauté
et au-delà. (par exemple : le Dublin-core qualifié pour les métadonnées ou des référentiels
tels que ORCID pour identifier les personnes ou encore l’ISO-639-3 pour identifier les langues).
## 2.4 Le management
La gestion de l’archive Nakala est prise en charge par la TGIR Huma-Num qui est une unité du Centre National de la Recherche Scientifique (CNRS) rattachée à l’Institut des sciences humaines et sociales du CNRS (INSHS) et labellisée comme une Très Grande Infrastructure de Recherche (TGIR) par le Ministère de l’enseignement supérieur, de la recherche et de l’innovation (MESRI).
La gestion de l’archive NAKALA est prise en charge par la TGIR Huma-Num qui est une unité du Centre National de la Recherche Scientifique (CNRS) rattachée à l’Institut des sciences humaines et sociales du CNRS (INSHS) et labellisée comme une Très Grande Infrastructure de Recherche (TGIR) par le Ministère de l’enseignement supérieur, de la recherche et de l’innovation (MESRI).
# 3 Les paquets d’information
La norme OAIS distingue 3 formes de paquets d’information. Le « SIP » (Submission Information
......@@ -39,7 +39,7 @@ Information Package) paquet échangée entre l’archive et les utilisateurs et
Information Package) qui représente la forme du paquet d’information interne à l’archive.
## 3.1 Paquet d’informations fourni par le producteur (SIP)
Les informations fournies dans un paquet soumis à l’archive Nakala par le producteur se répartissent en deux ensemble:
Les informations fournies dans un paquet soumis à l’archive NAKALA par le producteur se répartissent en deux ensemble:
- un ou plusieurs fichiers de données
- des métadonnées
......@@ -61,7 +61,7 @@ preservation »). La forme d’empaquetage du SIP dépend du mode de dépôt dan
via un formulaire web ou via des API.
## 3.2 Paquet d’information archivé (AIP)
Le processus d'ingestion de Nakala génère de nouvelles métadonnées notamment par l’analyse du
Le processus d'ingestion de NAKALA génère de nouvelles métadonnées notamment par l’analyse du
contenu des données ou par l’enrichissement effectué par des experts « données »
(Cf. 3.6.3 La part des experts « données » dans le processus d’ingestion).
......@@ -92,28 +92,28 @@ Note: Dans le cas d’un niveau de service 2, seuls les fichiers aux formats de
```
## 3.3 Paquet d’information diffusé (DIP)
Les données et métadonnées de Nakala sont rendues accessibles aux utilisateurs via différentes interfaces
Les données et métadonnées de NAKALA sont rendues accessibles aux utilisateurs via différentes interfaces
qui permettent la recherche, le filtrage et la récupération de tout ou partie des informations.
Cf « 4.5 Accès aux informations (ACCESS) » pour une description de celles-ci.
Toutes les données et métadonnées sont accessibles. Les fichier de données peuvent-être éventuellement
soumis à un contrôle d’accès.
# 4 Description du processus d’ingestion dans Nakala
# 4 Description du processus d’ingestion dans NAKALA
## 4.1 Schéma d’ensemble
Cette section décrit comment l’organisation de l’ingestion de données dans l’OAIS Nakala dans le contexte d’un OAIS.
Cette section décrit comment l’organisation de l’ingestion de données dans l’OAIS NAKALA dans le contexte d’un OAIS.
![oais](../media/oais.png)
Plusieurs profils de l’équipe de la TGIR Huma-Num sont impliqués dans le mécanisme d’ingestion de données de Nakala.
Plusieurs profils de l’équipe de la TGIR Huma-Num sont impliqués dans le mécanisme d’ingestion de données de NAKALA.
Les experts de « domaines » de SHS (SHS dans le schéma ci-dessus) garantissent la qualité des données diffusée. Les experts de domaines gèrent également les priorités dans les entrées.
Les experts « données » (documentalistes, archivistes) avec de bonnes connaissance du domaine SHS (D dans le schéma ci-dessus), sont en charge du contrôle des données et métadonnées.
Les ingénieurs IT (IT dans le schéma ci-dessus) sont en charge du système d’information et de la maintenance du service.
## 4.2 Réception des données (ENTRY)
La phase de réception des données correspond à l’entité « ENTRY » dans le modèle OAIS. Dans Nakala, le paquet d’information soumis SIP est composé de fichiers de données et de métadonnées. Son ingestion peut suivre différents chemins:
La phase de réception des données correspond à l’entité « ENTRY » dans le modèle OAIS. Dans NAKALA, le paquet d’information soumis SIP est composé de fichiers de données et de métadonnées. Son ingestion peut suivre différents chemins:
Dépôt par l’auteur par le biais d’une interface web
Dépôt par l’auteur par le biais d’API
Pour le niveau de service 1, des contrôles automatiques sont opérés qui conditionnent la poursuite du processus d’ingestion (vérification de la présence des 5 métadonnées obligatoires, vérifications syntaxiques sur l’expression des métadonnées, vérification de l’identité du producteur). En cas d’échec à un contrôle le SIP n’est pas créé et des messages d’erreurs sont envoyés au producteur.
......@@ -132,7 +132,7 @@ L’ensemble des métadonnées soumises par le producteur, calculées lors des c
## 4.5 Accès aux informations (ACCESS)
Cette phase correspond à l’entité « ACCESS » du modèle OAIS.
Nakala permet plusieurs types d’accès à ses archives (see section 2.9) à travers des outils maintenus par Huma-Num.
NAKALA permet plusieurs types d’accès à ses archives (see section 2.9) à travers des outils maintenus par Huma-Num.
Interface web
SPARQL
OAI-PMH
......@@ -162,15 +162,15 @@ Blabla
## 4.7 Planification de la pérennisation (PRESERVATON PLANNING)
Cette phase correspond à l’entité « PRESERVATON PLANNING » du modèle OAIS.
#5 Responsabilités de l’OAIS Nakala
Dans cette section, nous relions divers aspects des processus de gestion de Nakala à la liste des « responsabilités obligatoires » (énumérées dans la norme OAIS) pour une archive.
#5 Responsabilités de l’OAIS NAKALA
Dans cette section, nous relions divers aspects des processus de gestion de NAKALA à la liste des « responsabilités obligatoires » (énumérées dans la norme OAIS) pour une archive.
1. **Négocier avec les Producteurs d’information et accepter les informations appropriées de leur part**
La TGIR Huma-Num dialogue avec les communautés de recherche en SHS pour identifier les formats de représentation des informations qu’elle utilisent et mène, conjointement avec le CINES, d’éventuelles études pour évaluer ces formats vis à vis de leur capacité à être conservés sur le long terme ainsi que pour identifier les contrôles à effectuer pour leur acceptation dans l’archive.
2. **Acquérir une maîtrise suffisante de l’information fournie, au niveau requis pour pouvoir en garantir la Pérennisation**.
Le processus d'ingestion de Nakala est supervisé par les experts « données » d’Huma-Num. Les métadonnées sont définies dans un premier temps par les auteurs. Elles sont complétées ensuite par le résultat des contrôles puis éventuellement directement par les experts « données » d’Huma-Num.
Huma-Num est responsable de la conservation et de l’accès aux données publiées dans Nakala: ce qui lui donne le droit de modifier leur format en fonction des nouveautés technologiques ou de l'obsolescence. Les données et méta-données sont stockées dans des formats de conservation à long terme qui permettent de recréer la base de données.
Le processus d'ingestion de NAKALA est supervisé par les experts « données » d’Huma-Num. Les métadonnées sont définies dans un premier temps par les auteurs. Elles sont complétées ensuite par le résultat des contrôles puis éventuellement directement par les experts « données » d’Huma-Num.
Huma-Num est responsable de la conservation et de l’accès aux données publiées dans NAKALA: ce qui lui donne le droit de modifier leur format en fonction des nouveautés technologiques ou de l'obsolescence. Les données et méta-données sont stockées dans des formats de conservation à long terme qui permettent de recréer la base de données.
Voir la description du contenu des données et métadonnées dans les sections 3.1 Paquet d’informations fourni par le producteur (SIP) et 3.2 Paquet d’information archivé (AIP)
3. **Déterminer, soit par lui-même, soit en collaboration avec d’autres, quelles communautés doivent constituer la Communauté d’utilisateurs cible en mesure de comprendre l’information fournie, définissant ainsi sa Base de connaissance.**
......@@ -186,7 +186,7 @@ BlablaBlabla.
BlablaBlabla
#6 Procédures mises en œuvre
Cette section fournis une liste non exhaustive des procédures utilisées dans Nakala.
Cette section fournis une liste non exhaustive des procédures utilisées dans NAKALA.
## 6.1 Procedures in use for data coming from journals
......
# Documentation Nakala
# Documentation NAKALA
## Introduction et présentation
### À quoi sert Nakala ?
### À quoi sert NAKALA ?
NAKALA est un service d’Huma-Num permettant à des chercheurs, enseignants-chercheurs
ou équipes de recherche
de déposer tous types de données numériques documentées (fichiers textes, sons,
de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons,
images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé
afin de les publier en accord avec les principes du _FAIR data_
(Facile à trouver, Accessible, Interopérable et Réutilisable).
......@@ -18,7 +18,7 @@ stables fournis par Huma-Num et basés sur Handle et/ou DOI.
NAKALA s’inscrit dans le Web des données permettant notamment de rendre
interopérables les métadonnées, c’est-à-dire la possibilité de pouvoir
les connecter à d’autres entrepôts existants suivant ainsi la logique des
données ouvertes et liées (*Linked Open Data*) .
données ouvertes et liées (*Linked Open Data*).
Par ailleurs, NAKALA propose également un dispositif d’exposition des
métadonnées qui permet de les référencer par des moteurs de recherche
......@@ -28,7 +28,7 @@ NAKALA s’inscrit dans un dispositif cohérent de services mis en place
par Huma-Num pour faciliter l’accès, le signalement, la conservation et
l’archivage à long terme des données de la recherche en SHS.
La description riche, précise, et harmonisée de vos données avec NAKALA
La description riche, précise et harmonisée de vos données avec NAKALA
permet à celles-ci d’être comprises sur le long terme, de garantir leur
traçabilité dans le temps et d’encadrer leur réutilisation.
......@@ -151,7 +151,7 @@ Après avoir dûment rempli les métadonnées correspondantes aux données, l’
### Modèle de données de NAKALA et format des métadonnées
L’utilisateur peut décrire ses données selon plusieurs vocabulaires (Nakala, DublinCore, Foaf). Vous pouvez proposer à l’équipe d’HUMA-NUM de nouveau vocabulaires pour compléter cette liste.
L’utilisateur peut décrire ses données selon plusieurs vocabulaires (NAKALA, DublinCore, Foaf). Vous pouvez proposer à l’équipe d’HUMA-NUM de nouveau vocabulaires pour compléter cette liste.
Cinq métadonnées sont obligatoires pour décrire une donnée :
......@@ -161,7 +161,7 @@ Cinq métadonnées sont obligatoires pour décrire une donnée :
- Date (nakala:created)
- Licence (nakala:license)
Ces métadonnées doivent être exprimées au moment du dépôt dans le vocublaire Nakala, mais peuvent être converties en DublinCore au moment du requêtage des données via l’API ou via le protocole OAI-PMH.
Ces métadonnées doivent être exprimées au moment du dépôt dans le vocabulaire NAKALA, mais peuvent être converties en DublinCore au moment du requêtage des données via l’API ou via le protocole OAI-PMH.
Il est possible d’ajouter plusieurs titres en précisant la langue de chacun. NAKALA propose une liste de plus de 7000 langues vivantes ou éteintes selon les normes ISO-639-2 et ISO-639-3.
......@@ -187,9 +187,9 @@ y accéder ou citer la donnée est : <https://www.nakala.fr/data/11280/000028fb>
### Utiliser et accéder aux données
L’accès à Nakala se fait via l’adresse <https://nakala.fr>.
L’accès à NAKALA se fait via l’adresse <https://nakala.fr>.
Nakala propose, lorsque l’utilisateur n’est pas connecté à son compte personnel, une page d’exploration et de recherche des données permettant de les visualiser. Par exemple : <https://nakala.fr/11280/d6dfc55a>
NAKALA propose, lorsque l’utilisateur n’est pas connecté à son compte personnel, une page d’exploration et de recherche des données permettant de les visualiser. Par exemple : <https://nakala.fr/11280/d6dfc55a>
La page de présentation d’un objet est <https://doi.org/DOI> ou <https://nakala.fr/{identifiant}>, {identifiant} correspondant à un Handle ou un DOI pour les objets récemment déposés.
......
......@@ -4,7 +4,7 @@
### Qu’est-ce que ShareDocs
ShareDocs est un gestionnaire de fichiers mis en oeuvre par la TGIR Huma-Num, sur ses propres serveurs, pouvant être utilisé via un navigateur web, un client WebDAV ou un logiciel de synchronisation de fichiers. La plateforme est basée sur l’application FileRun : [Présentation générale](http://www.filerun.com/) et [Manuel d’utilisation des opérations de base](http://docs.filerun.com/user_guide). Il s’agit d’un stockage déporté en ligne sur le réseau recherche français (semblable à des outils comme DropBox hébergés eux sur le cloud public). Les données hébergées peuvent être cryptées de manière simple grâce à des outils comme [ZED encrypt](https://www.zedencrypt.com/download).
ShareDocs est un gestionnaire de fichiers mis en oeuvre par la TGIR Huma-Num, sur ses propres serveurs, pouvant être utilisé via un navigateur web, un client WebDAV ou un logiciel de synchronisation de fichiers. La plateforme est basée sur l’application FileRun : [Présentation générale](https://filerun.com/) et [Manuel d’utilisation des opérations de base](https://docs.filerun.com/user_guide). Il s’agit d’un stockage déporté en ligne sur le réseau recherche français (semblable à des outils comme DropBox hébergés eux sur le cloud public). Les données hébergées peuvent être cryptées de manière simple grâce à des outils comme [ZED encrypt](https://www.zedencrypt.com/download).
Il est adapté aux projets de recherche qui souhaitent stocker, échanger, partager, travailler sur des données de type fichiers (ensemble de photos, de textes transcrits, etc). Ainsi, l’usage courant de ShareDocs permet de préparer des fichiers pour une édition en ligne ou bien une diffusion dans [NAKALA](https://www.nakala.fr/) (par exemple).
......
......@@ -11,7 +11,7 @@ Vous êtes invités à mentionner sur la page d’accueil de votre site Web
le fait que vous êtes hébergé par la TGIR Huma-Num.
Vous trouverez un choix
d’images sur [www.huma-num.fr/ressources/boite-a-logos](http://www.huma-num.fr/ressources/boite-a-logos).
d’images sur [www.huma-num.fr/supports-communication/](https://www.huma-num.fr/supports-communication/).
## Annuaire des sites hébergés
......@@ -196,7 +196,7 @@ temps plus restreint.
### Annuaire LDAP
L’accès au service de supervision nécessite une authentification via.
notre annuaire LDAP ([annuaire.huma-num.fr/](http://annuaire.huma-num.fr/)).
notre annuaire LDAP ([annuaire.huma-num.fr/](https://annuaire.huma-num.fr/)).
Cet annuaire permet une délégation de gestion de branches. Si vous avez
besoin de gérer un certain nombre de comptes (système ou applicatifs), vous
......
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment