nakala-faq.md 12.2 KB
Newer Older
Nicolas Larrousse's avatar
Nicolas Larrousse committed
1
2
3
4
---
lang: fr
---

Nicolas Larrousse's avatar
Nicolas Larrousse committed
5
6
7
8
!!! Note  
    Document en cours de rédaction


Nicolas Larrousse's avatar
Nicolas Larrousse committed
9
10
11
# NAKALA : Foire Aux Questions 


12
13
14
15
* [Données dans NAKALA](#donnees-dans-nakala)
    * [Quelles données peut-on déposer dans NAKALA](#quelles-donnees-peut-on-deposer-dans-nakala)
    * [Propriété des données déposées dans NAKALA ](#propriete-des-donnees-deposees-dans-nakala)
    * [Taille des données](#taille-des-donnees)
Nicolas Larrousse's avatar
Nicolas Larrousse committed
16
17
    * [Comment sont gérés les identifiants (Digital Objet Identifiers)](#comment-sont-geres-les-identifiants)
    * [Quels sont les différents statuts des données dans Nakala](#quels-sont-les-differents-statuts-des-donnees-dans-nakala)
18
19
20
21
22
23
24
    * [Quels contrôles sont effectués sur les données](#quels-controles-sont-effectues-sur-les-donnees)
        * [Au moment du dépôt](#au-moment-du-depot)
        * [Contrôles réguliers](#controles-reguliers)
        * [Lors de la demande de préservation à long terme](#lors-de-la-demande-de-preservation-a-long-terme)
    * [Sécurité des données](#securite-des-donnees)
        * [Où sont hébergées les données](#ou-sont)hebergees-les-donnees)
        * [Comment sont sauvegardées les données](#comment-sont-sauvegardees-les-donnees)
Nicolas Larrousse's avatar
Nicolas Larrousse committed
25
        * [Comment sont sauvegardées les métadonnées](#comment-sont-sauvegardees-les-metadonnees)    
Nicolas Larrousse's avatar
Nicolas Larrousse committed
26
* [Continuité du service NAKALA](#continuite-du-service-nakala)
Nicolas Larrousse's avatar
Nicolas Larrousse committed
27
* [NAKALA et Huma-Num ](#nakala-et-huma-num)
Nicolas Larrousse's avatar
Nicolas Larrousse committed
28
29
30
    * [Quel est le statut de Huma-Num ](#quel-est-le statut-de-huma-num)
    * [Comment est financée Huma-Num ](#comment-est-financee-huma-num)
    * [Et si Huma-Num disparait](#et-si-huma-num-disparait) 
31
32
33



Nicolas Larrousse's avatar
Nicolas Larrousse committed
34
35
36
37
38
## Données dans NAKALA


### Quelles données peut-on déposer dans NAKALA

39
Tous types de données peuvent être déposés dans NAKALA à condition qu'il s'agisse de données de la recherche (e.g. NAKALA n'accepte pas de données de type administratif). 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
40

Nicolas Larrousse's avatar
Nicolas Larrousse committed
41
Le type de format n'est pas imposé mais il est (fortement) recommandé d'utiliser des formats ouverts (Cf. [Préparer ses données](https://documentation.huma-num.fr/meta/nakala-preparer-ses-donnees/)).
Nicolas Larrousse's avatar
Nicolas Larrousse committed
42

Nicolas Larrousse's avatar
Nicolas Larrousse committed
43
Les données doivent être documentées le plus finement possible. Cinq métadonnées sont obligatoires, mais il est (fortement) recommandé d'en utiliser plus (Cf. [Guide de dépôt](https://documentation.huma-num.fr/meta/nakala-guide-de-depot)).
Nicolas Larrousse's avatar
Nicolas Larrousse committed
44
45
46
47


### Propriété des données déposées dans NAKALA 

48
49
50
51
Les données déposées dans NAKALA restent la propriété du déposant et demeurent sous sa responsabilité.

Les données publiées ne peuvent pas être supprimées sauf pour des causes de force majeure
auquel cas l'opération de supression est effectuée après vérification par l'équipe NAKALA
52
53
54
et une trace associée à l'identifiant pérenne est conservée (i.e. "pierre tombale"). 
La supression définitive de l'information ne sera effective qu'après un temps de lattence
en raison du rafraichissement des supports et de la rotation des sauvegardes. 
55

Nicolas Larrousse's avatar
Nicolas Larrousse committed
56
La réutilisation des données est régie par la licence qui leur est associée : pour cette raison, la licence est une métadonnée obligatoire.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
57
58
59
60


### Taille des données 

Nicolas Larrousse's avatar
Nicolas Larrousse committed
61
Il n'y a pas formellement de limitation pour la taille des données déposées. Cependant, s'il est envisagé de déposer de gros volumes (e.g. supérieur à 10 GOs par fichiers), il est nécessaire de prendre contact avec l'équipe NAKALA au préalable. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
62
63


Nicolas Larrousse's avatar
Nicolas Larrousse committed
64
### Comment sont gérés les identifiants (Digital Objet Identifiers)
Nicolas Larrousse's avatar
Nicolas Larrousse committed
65

Nicolas Larrousse's avatar
Nicolas Larrousse committed
66
Un identifiant de type DOI est affecté à tous les dépôts (e.g. [10.34847/nkl.de148w0r](https://doi.org/10.34847/nkl.de148w0r)), ce qui permet de citer la donnée (Cf. via l'interface de NAKALA ou directement https://citation.crosscite.org/) de manière normalisée et d'y accéder de manière pérenne.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
67
68
69

Comme cela a été mentionné plus haut, lorsqu'une donnée est supprimée, une mise à jour des métadonnée est effectuée pour conserver une trace du dépôt dans NAKALA. 

70
### Quels sont les différents statuts des données dans NAKALA
Michel Jacobson's avatar
Michel Jacobson committed
71

Nicolas Larrousse's avatar
Nicolas Larrousse committed
72
73
74
75
76
Une donnée déposée dans NAKALA peut avoir un statut différent en fonction de sa progression dans le cycle de vie :  
- Donnée déposée : donnée qui est en cours de documentation avant d'être publiée et non accessible   
- Donnée publiée (avec ou sans embargo) : donnée documentée qui est publiée et accessible si elles n'est pas sous embargo  
- Donnée supprimée : donnée qui a été publiée dans NAKALA et dont l'utilisateur a demandé la suppression à l'équipe NAKALA. Une trace de sa présence est conservée dans les métadonnées associées à l'identifiant DOI 
- Donnée préservée au CINES : donnée publiée dans NAKALA qui a été déposée au CINES après un audit (e.g. vérification du format) et une préparation (e.g. organisation et documentation) préalable au dépôt au CINES  
Michel Jacobson's avatar
Michel Jacobson committed
77

Nicolas Larrousse's avatar
Nicolas Larrousse committed
78
### Quels contrôles sont effectués sur les données 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
79

Nicolas Larrousse's avatar
Nicolas Larrousse committed
80
#### Au moment du dépôt :
Nicolas Larrousse's avatar
Nicolas Larrousse committed
81
Différents contrôles sont effectués au moment du dépôt de la donnée pour la validation, en voici quelques exemples :  
82
-  Vérification de la présence des métadonnées obligatoires;  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
83
84
85
86
87
-  Les valeurs de "nakala:license"  doivent être issues du référentiel des licences de NAKALA;   
-  Les valeurs de "nakala:type" doivent être issues du référentiel des types de NAKALA;  
-  Le code ISO de la langue d'une métadonnée doit appartenir au référentiel des langues de NAKALA (Norme ISO-639-2 quand cela est possible sinon Norme ISO-639-3);    
-   La valeur de la date "nakala:created" peut être vide ou doit être une chaine de caractères qui respecte le format "AAAA", "MM-AAAA", "JJ-MM-AAAA".   
etc.  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
88

Nicolas Larrousse's avatar
Nicolas Larrousse committed
89
#### Contrôles réguliers
Nicolas Larrousse's avatar
Nicolas Larrousse committed
90
Un bilan de la qualité des dépôts est effectué régulièrement et fourni aux déposants :  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
91
92
-  Vérification des types de formats utilisés pour les fichiers et de la conformité des fichiers à ces formats (Cf. [Préparer ses données](https://documentation.huma-num.fr/meta/nakala-preparer-ses-donnees/));  
-  Vérification du nombre et de la qualité des métadonnées (e.g. par rapport à des référentiels).  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
93
etc.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
94

Nicolas Larrousse's avatar
Nicolas Larrousse committed
95
Un "index de qualité" basé sur ces différents critères est calculé.  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
96

Nicolas Larrousse's avatar
Nicolas Larrousse committed
97
98
99
100

Une comparaison des empreintes des fichiers est effectuée régulièrement pour vérifier l'intégrité  des fichiers de données. 


Nicolas Larrousse's avatar
Nicolas Larrousse committed
101
#### Lors de la demande de préservation à long terme 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
102
Lorsque la demande de préservation à long terme est effectuée, un audit des données à préserver est effectué par le pôle "accompagnement des utilisateurs".
Nicolas Larrousse's avatar
Nicolas Larrousse committed
103

Nicolas Larrousse's avatar
Nicolas Larrousse committed
104
Des échanges ont lieu pour mettre les données (et les métadonnées) en conformité avec les exigences attendues pour la préservation à long terme :  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
105
106
107
-   Organisation générale des données;  
-   Qualité des formats utilisés et conformité des données aux spécifications des formats;  
-   Vérification des métadonnées et ajout d'informations nécessaires à la préservation à long terme (e.g. statut, communicabilité etc.).    
Nicolas Larrousse's avatar
Nicolas Larrousse committed
108
109
etc.

110
Lorsque ces différents points ont été examinés, le choix du type de préservation à long terme est effectué au sein d'un "comité de liaison" définit par la convention de collaboration avec le CINES, [partenaire de Huma-Num](https://documentation.huma-num.fr/meta/partenariat-hn-cines) pour la préservation. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
111
112
113

## Sécurité des données 

Nicolas Larrousse's avatar
Nicolas Larrousse committed
114
### Où sont hébergées les données 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
115
Les données déposées dans NAKALA sont stockées sur les serveurs gérés par Huma-Num qui sont hébergés au [centre de calcul de l'IN2P3](https://cc.in2p3.fr/). Ce centre a été créé pour gérer les données produites par la physique des particules, la physique nucléaire et la physique des astroparticules.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
116

Nicolas Larrousse's avatar
Nicolas Larrousse committed
117
Cet important centre national est sécurisé d'un point de vue matériel (e.g. redondance de l'alimentation électrique, des dispositifs réseau, des systèmes de refroidissement) et met en oeuvre les restrictions d'accès de type [ZRR](https://fr.wikipedia.org/wiki/Zone_%C3%A0_r%C3%A9gime_restrictif) (Zone à Régime Restrictif).
Nicolas Larrousse's avatar
Nicolas Larrousse committed
118

Nicolas Larrousse's avatar
Nicolas Larrousse committed
119
### Comment sont sauvegardées les données 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
120

Nicolas Larrousse's avatar
Nicolas Larrousse committed
121
122
123
Les données de NAKALA sont stockées sur une dispositif de stockage réseau de type [NAS](https://fr.wikipedia.org/wiki/Serveur_de_stockage_en_r%C3%A9seau). Une image des données (snapshot) est réalisée à intervalles réguliers ce qui permet de restaurer rapidement les données en cas de problèmes.

Par ailleurs une sauvegarde sur bande est effectuée quotidiennement sur le robot de sauvegarde du [CCIN2P3](https://cc.in2p3.fr/)  en utilisant le logiciel [TSM](https://fr.wikipedia.org/wiki/IBM_Tivoli_Storage_Manager) édité par IBM. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
124
125


Nicolas Larrousse's avatar
Nicolas Larrousse committed
126
### Comment sont sauvegardées les métadonnées 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
127

Nicolas Larrousse's avatar
Nicolas Larrousse committed
128
129
130
Les métadonnées de NAKALA sont stockées dans une base de données SQL (MariaDB) qui est sauvegardée quotidiennement sur l'infrastructure de Huma-Num. 

Les métadonnées sont également exposées en format RDF via un [Triple-Store](https://nakala.fr/sparql) (GraphDB) qui est également sauvegardé quotidiennement sur l'infrastructure de Huma-Num.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
131

Nicolas Larrousse's avatar
Nicolas Larrousse committed
132
133
134
135
## Continuité du service NAKALA

Le service NAKALA est hébergé sur l'infrastructure de Huma-Num qui dispose d'un [plan général de reprise en cas de panne](https://documentation.huma-num.fr/meta/reprise-en-cas-de-panne/).

136
Plus spécifiquement la redondance du service NAKALA est assurée par :  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
137
- l'application NAKALA est redondée sur deux machines différentes en utilisant un outil de répartition ([HAProxy](http://www.haproxy.org)) ce qui permet d'éviter les interruptions de service en cas de panne ;  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
138
139
- les données sont stockées sur un dispositif de type NAS qui permet de restaurer rapidement une donnée. En complément, des sauvegardes sont effectuées sur des bandes magnétiques quotidiennement ;  
- Les métadonnées sont stockées dans une base de données relationnelle "classique" qui est sauvegardée quotidiennement. Ces métadonnées sont également stockées en format RDF dans un TripleStore qui est est sauvegardé quotidiennement .    
Nicolas Larrousse's avatar
Nicolas Larrousse committed
140
141
  
[Technologies employées dans NAKALA](https://documentation.huma-num.fr/media/meta/nakala-technologies.png)  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
142

Nicolas Larrousse's avatar
Nicolas Larrousse committed
143
144
145

## NAKALA et Huma-Num 

Nicolas Larrousse's avatar
Nicolas Larrousse committed
146
[NAKALA](https://www.huma-num.fr/les-services-par-etapes/#nakalapreservation) est un entrepôt de données développé par Huma-Num basé sur des technologies eprouvées et respectant les standards (e.g. Framework Symfony, Triple Store GraphDB etc.). Une équipe de trois personnes de Huma-Num travaille sur son évolution et sa maintenance.
Nicolas Larrousse's avatar
Nicolas Larrousse committed
147

Nicolas Larrousse's avatar
Nicolas Larrousse committed
148
### Quel est le statut de Huma-Num 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
149

Nicolas Larrousse's avatar
Nicolas Larrousse committed
150
[Huma-Num](https://www.huma-num.fr/quest-ce-que-la-tgir-huma-num/) est une infrastructure nationale pour les Sciences Humaines et Sociales.  
Nicolas Larrousse's avatar
Nicolas Larrousse committed
151

Nicolas Larrousse's avatar
Nicolas Larrousse committed
152
En tant qu'insfrastructure nationale, Huma-Num est inscrite dans la [feuille de route nationale](https://www.enseignementsup-recherche.gouv.fr/cid70554/la-feuille-de-route-nationale-des-infrastructures-de-recherche.html) dont l'évolution est alignée sur celle des infrastructures europénnes gérée par l'[ESFRI](https://www.esfri.eu/). 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
153

Nicolas Larrousse's avatar
Nicolas Larrousse committed
154
Huma-Num est opérée par le [CNRS](https://www.cnrs.fr) (Centre National de la Recherche Scientifique), une institution de recherche parmi les plus [importantes](https://www.cnrs.fr/fr/le-cnrs) au monde, qui a été créée en 1939. Le CNRS en 2021 emploie plus de 30 000 personnes dont plus de 10 000 chercheurs et dispose d'un budget de 3 M€. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
155

Nicolas Larrousse's avatar
Nicolas Larrousse committed
156
### Comment est financée Huma-Num 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
157

Nicolas Larrousse's avatar
Nicolas Larrousse committed
158
Huma-Num est financée par le [MESRI](https://www.enseignementsup-recherche.gouv.fr/) (Ministère de l'Enseignement Supérieur, de la Recherche et de l'Innovation) dans le cadre de la feuille de route nationale des infrastructures (Cf. section précédente).
Nicolas Larrousse's avatar
Nicolas Larrousse committed
159
160


161
### Et si Huma-Num disparait
Nicolas Larrousse's avatar
Nicolas Larrousse committed
162

Nicolas Larrousse's avatar
Nicolas Larrousse committed
163
Comme Huma-Num est opérée par le CNRS, la responsabilité des données hébergées dans NAKALA lui est transférée en cas de dissolution de Huma-Num. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
164

Nicolas Larrousse's avatar
Nicolas Larrousse committed
165
Les choix technologiques effectués basés sur des standards internationaux permettront a minima de transferer les données pour les mettre à disposition avec les métadonnées associées sur un autre type d'infrastructure. Par exemple, les métadonnées étant exprimées dans le format [RDF](https://fr.wikipedia.org/wiki/Resource_Description_Framework), base des technologies du Web Sémantique, leur transfert dans un Triple Store respectant ces standards sera simplifiée. Les données elles mêmes sont stockées sur des systèmes de fichiers standard (Unix). Les identifiants pérennes peuvent être mis à jour aisément pour conserver les liens d'accès aux données. 
Nicolas Larrousse's avatar
Nicolas Larrousse committed
166
167
168
169
170
171
172
173