Commit 5f47133b authored by nsauret's avatar nsauret
Browse files

typo '>’

parent ebd190fc
......@@ -5,8 +5,8 @@ Research), Aix-Marseille University and the Campus Condorcet, Huma-Num
is a French Very Large Research Infrastructure ("Très Grande
Infrastructure de Recherche", TGIR) with international reach devoted to
Social Sciences and Humanities. It is part of the national ESFRI
roadmap, which is in turn aligned with the European Union's ESFRI
framework. Indeed, Huma-Num is entrusted with France's participation in
roadmap, which is in turn aligned with the European Unions ESFRI
framework. Indeed, Huma-Num is entrusted with Frances participation in
two European Research Infrastructure Consortia (ERIC): DARIAH (Digital
Research Infrastructure for the Arts and Humanities) and CLARIN (Common
Language Resources and Technologies Infrastructure). It is also involved
......@@ -16,7 +16,7 @@ Huma-Num aims at supporting research communities by providing services,
assessment and tools on digital research data. To perform its missions,
the TGIR Huma-Num bases its activities on a innovative form of
organization that combines human (collective consultation through
Huma-Num's consortia, which are groups of researchers and engineers,
Huma-Nums consortia, which are groups of researchers and engineers,
funded by Huma-Num, working on common areas of interest) and
technological resources (sustainable digital services ; see below) on a
national and European scale. 
......@@ -29,7 +29,7 @@ involvement is to promote data sharing so that other researchers,
communities or disciplines, can reuse them, including from an
interdisciplinary perspective and in different ways. More generally, the
principles and methods of the Web of data (RDF, SPARQL, SKOS, OWL) on
which Huma-Num's services rely enable data to be documented or
which Huma-Nums services rely enable data to be documented or
re-documented for various uses without confining them to inaccessible
silos. 
......@@ -43,9 +43,9 @@ Technically, the infrastructure itself is hosted in a big data center in
Lyon built by and for physicists. A long-term preservation facility from
another data center ([CINES](https://www.cines.fr/en/)) based in
Montpellier is also used. In addition, a group of correspondents in the
MSH (Maison des Sciences de l'Homme) network
MSH (Maison des Sciences de lHomme) network
(<http://www.msh-reseau.fr>) all over France is in charge of relaying
information about Huma-Num's services and tools.
information about Huma-Nums services and tools.
## What can Huma-Num do for you?
......@@ -100,10 +100,10 @@ Media, George Mason University, Virginia, USA) and NAKALA, a service
created by Huma-Num.
It combines the power of Omeka for editing and displaying digital data
and the features of NAKALA's repository for sharing data and metadata in
and the features of NAKALAs repository for sharing data and metadata in
an interoperable way. The main goal of NAKALONA is to offer the
possibility of sharing and displaying the data and metadata already
stored inside Nakala while taking advantage of Omeka's possibilities
stored inside Nakala while taking advantage of Omekas possibilities
such as its powerful search engine and extended OAI-PMH feeds. This
software package is entirely managed and administered by the Huma-Num
team, and provided as a Software As A Service (SAAS).
......@@ -135,10 +135,10 @@ administrators perceive to be always changing).
### For cold data: Backup on tapes
For cold data, the CC-IN2P3 Datacenter where Huma-Num's infrastructure
For cold data, the CC-IN2P3 Datacenter where Huma-Nums infrastructure
is hosted provides a backup on tapes (currently around 700 Tos).
### For hot data: NAS's service
### For hot data: NASs service
For hot data, high availability is provided with a NAS associated with
regular snapshots (currently around 100 Tos).
......@@ -153,7 +153,7 @@ logically private network: the software allows complete flexibility in
the type and frequency of backups and versioning (currently around 300
Tos).
### ShareDocs' tool
### ShareDocs tool
ShareDocs is a file manager that can be used via a web browser, a WebDAV
client or a file synchronization software. Some of its features are
......@@ -195,9 +195,9 @@ with the aim of creating synergies. In return, a consortium is expected
to provide guidelines of technological and (or scientific) best
practices, new standards and tools.
### What is a Huma-Num's consortia? What is their life cycle?
### What is a Huma-Nums consortia? What is their life cycle?
A Huma-Num's consortium is a group of people, often from different
A Huma-Nums consortium is a group of people, often from different
institutions, sometimes from different disciplines, working on the same
scientific objects, methods, themes. Together, they submit a common
project to Huma-Num Scientific Council which provides an evaluation and
......@@ -206,15 +206,15 @@ four years.
Every year, the Scientific Council evaluates them by making a scientific
evaluation of their actions and he gives a recommendation on the budget
requested. Then, the Huma-Num's Steering Committee validates or proposes
requested. Then, the Huma-Nums Steering Committee validates or proposes
modification to the budget; and so on.
Every year Huma-Num labels new entrants, receives submissions, or renews
labels based on a mix of continuum and new projects of the group.
### What are Huma-Num's consortia goals and what do they do?
### What are Huma-Nums consortia goals and what do they do?
With the help of Huma-Num's services and personnel, Huma-Num's consortia
With the help of Huma-Nums services and personnel, Huma-Nums consortia
are tasked with creating synergies from within the research community
for SSH. Their main goal is to facilitate the appropriation of digital
tools and their inclusion in open data, open source and open access
......@@ -225,7 +225,7 @@ concertation on good practices, organising training sessions, developing
specific or generic tools, publishing guidelines and promoting
multi-scale dialog.
See the current list of Huma-Num's national consortia
See the current list of Huma-Nums national consortia
[here](https://www.huma-num.fr/consortiums).
## Huma-Num’s International Collaborations
......
......@@ -48,7 +48,7 @@ en Lyon construido por y para físicos. Huma-Num también colabora con el
Centro Informático Nacional de Educación Superior dedicado a la 
preservación de datos a largo plazo (CINES) con sede en Montpellier.
Además, Huma-Num trabaja con un grupo de correspondientes en la red de
MSH (Maison des Sciences de l'Homme, <http://www.msh-reseau.fr>). Ellos
MSH (Maison des Sciences de lHomme, <http://www.msh-reseau.fr>). Ellos
ayudan a transmitir información sobre sus servicios y herramientas.
## ¿Qué puede hacer Huma-Num por usted?
......
# Hébergement Web mutualisé : Linux, Apache, MySQL/PostgreSQL, PHP, Java
## Conditions Générales d'Utilisation (CGU)
## Conditions Générales dUtilisation (CGU)
Voir dans cette documentation, [les CGU](CGU.html).
## Référence à Huma-Num
Vous êtes invités à mentionner sur la page d'accueil de votre site Web
Vous êtes invités à mentionner sur la page daccueil de votre site Web
le fait que vous êtes hébergé par la TGIR Huma-Num.
Vous trouverez un choix
d'images sur [www.huma-num.fr/ressources/boite-a-logos](http://www.huma-num.fr/ressources/boite-a-logos).
dimages sur [www.huma-num.fr/ressources/boite-a-logos](http://www.huma-num.fr/ressources/boite-a-logos).
## Annuaire des sites hébergés
Un annuaire des sites Web hébergés est consultable sur [www.huma-num.fr/annuaire-des-sites-web](https://www.huma-num.fr/annuaire-des-sites-web).
Chaque gestionnaire de site est invité à demander l'inscription et la modification de son site
Chaque gestionnaire de site est invité à demander linscription et la modification de son site
dans cet annuaire.
## Interopérabilité et signalement des données
Il est rappelé qu'un des critères essentiels d'hébergement est la mise
en place d'une interopérabilité des métadonnées et données, afin
qu'elles soient signalées dans notre plateforme [ISIDORE](http://isidore.science/).
Il est rappelé quun des critères essentiels dhébergement est la mise
en place dune interopérabilité des métadonnées et données, afin
quelles soient signalées dans notre plateforme [ISIDORE](http://isidore.science/).
Concernant les données, nous vous encourageons à adopter les bonnes pratiques en terme de formats (pérennité) en vous basant sur la liste proposée par l'outil [FACILE du CINES](https://facile.cines.fr/).
Concernant les données, nous vous encourageons à adopter les bonnes pratiques en terme de formats (pérennité) en vous basant sur la liste proposée par loutil [FACILE du CINES](https://facile.cines.fr/).
Dans le cadre des corpus de données utilisant des bases de données, nous
souhaitons que les projets s'inscrivent dans le signalement de leurs
données par l'intermédiaire de métadonnées normalisées et moissonnables
souhaitons que les projets sinscrivent dans le signalement de leurs
données par lintermédiaire de métadonnées normalisées et moissonnables
selon le protocole OAI-PMH par notre moteur de recherche ISIDORE.
Le protocole OAI-PMH permet en outre un moissonnage par d'autres
Le protocole OAI-PMH permet en outre un moissonnage par dautres
institutions (Gallica, Europeana) ou par des portails web
disciplinaires. Il s'agit du protocole documentaire le plus
disciplinaires. Il sagit du protocole documentaire le plus
répandu actuellement dans le monde des humanités numériques.
Pour cela, un [guide d'implémentation des méthodes de moissonnage](http://www.huma-num.fr/ressources/guide-isidore%20) est
Pour cela, un [guide dimplémentation des méthodes de moissonnage](http://www.huma-num.fr/ressources/guide-isidore%20) est
disponible sur notre site.
Les demandes de moissonnage ou d'aide pour sa mise en place sont à adresser à
Les demandes de moissonnage ou daide pour sa mise en place sont à adresser à
[isidore-sources@huma-num.fr](mailto:isidore-sources@huma-num.fr).
## Ce que la TGIR ne fait pas
Un élément important est à noter : l'équipe de la TGIR Huma-Num ne peut
Un élément important est à noter : léquipe de la TGIR Huma-Num ne peut
se substituer aux gestionnaires des sites pour développer, maintenir des
applications développées dans les équipes de recherche (ou par des prestataires de
services). Nous ne développons pas de logiciels propres pour les
programmes de recherche.
Ainsi, les équipes de recherche qui n'ont pas d'informaticien
Ainsi, les équipes de recherche qui nont pas dinformaticien
(développeurs, etc.) sont invitées à utiliser nos solutions "clés en
main" : NAKALA, NAKALA-PRESS, ISIDORE ou bien sûr à constituer des
programmes de recherche embarquant des développeurs. Vous pouvez solliciter l'équipe Huma-Num pour tout avis et conseil en amont de la construction du
programmes de recherche embarquant des développeurs. Vous pouvez solliciter léquipe Huma-Num pour tout avis et conseil en amont de la construction du
programme.
## Ce que le gestionnaire du site doit faire : engagement de mise à jour
Chaque gestionnaire de site porte la responsabilité de réaliser, durant
toute la vie du site, la mise à jour continue des briques applicatives qu'il aura installées.
toute la vie du site, la mise à jour continue des briques applicatives quil aura installées.
Ainsi une mise à jour très rapide des CMS (Content Management System) les plus courants
comme Wordpress, Drupal, Joomla, SPIP, devra impérativement être réalisée à chaque publication
d'une nouvelle version ou d'un avis de sécurité.
dune nouvelle version ou dun avis de sécurité.
## Serveurs
Nos serveurs sont sous le système d'exploitation CentOS 7.
Nos serveurs sont sous le système dexploitation CentOS 7.
Seul un serveur interactif vous est accessible par SSH et SFTP.
Les serveurs Web, d'applications et de bases de données ne vous sont pas accessibles
Les serveurs Web, dapplications et de bases de données ne vous sont pas accessibles
de manière interactive.
Mais votre dossier principal ("home directory") est le même entre tous les serveurs concernés.
Aussi vous avez la vue et la main sur l'ensemble de vos fichiers.
Aussi vous avez la vue et la main sur lensemble de vos fichiers.
## Langages, logiciels et applications disponibles
Les langages et logiciels mis en œuvre dans le cadre de l'hébergement Web mutualisé :
Les langages et logiciels mis en œuvre dans le cadre de lhébergement Web mutualisé :
- Des langages de programmation et scripts : C, C++, PHP, Python, Java
- Des logiciels de bases de données relationnelles : MySQL, PostgreSQL, PostGIS
- Des logiciels et bases de données XML : BaseX, eXist
- Des serveurs d'applications : Tomcat, Jetty
- Des serveurs dapplications : Tomcat, Jetty
- Des triplestores RDF : Virtuoso, Sesame
- Des moteurs de recherche : Elasticsearch, SolR
......@@ -106,27 +106,27 @@ Le serveur PostgreSQL par défaut est en version 9.6 et se nomme `postgresql.db.
Des versions plus récentes (respectivement 8 et 11) sont disponibles sur demande.
Une interface de gestion de vos bases de donnée MySQL est disponible à l'aide du logiciel en ligne PHPMyAdmin
et accessible à l'adresse [mygrid.huma-num.fr/tools/myadmin_v4/](https://mygrid.huma-num.fr/tools/myadmin_v4/).
Une interface de gestion de vos bases de donnée MySQL est disponible à laide du logiciel en ligne PHPMyAdmin
et accessible à ladresse [mygrid.huma-num.fr/tools/myadmin_v4/](https://mygrid.huma-num.fr/tools/myadmin_v4/).
## Applications Java
Il est possible d'ajouter une application basée sur un serveur
d'applications Java à son site HTML ou PHP.
Il est possible dajouter une application basée sur un serveur
dapplications Java à son site HTML ou PHP.
Cependant il convient de demander à l'équipe Huma-Num de
réaliser l'installation de cette application.
Cependant il convient de demander à léquipe Huma-Num de
réaliser linstallation de cette application.
L'application se trouvera en `resource/<application>/current``application` peut donc valoir `tomcat`, `exist`, `elasticsearch`, `solr`, `basex` ou `virtuoso`.
Lapplication se trouvera en `resource/<application>/current``application` peut donc valoir `tomcat`, `exist`, `elasticsearch`, `solr`, `basex` ou `virtuoso`.
Pour passer un ordre à cette application, il convient :
- d'écrire l'ordre dans le fichier texte nommé `resource/order/<application>` où l'ordre peut valoir `stop`, `start`, `restart`, `kill`, `forcekill`, `top` ;
- et d'attendre maximum 3 minutes pour voir le résultat dans `resource/order/<application>.out`
- décrire lordre dans le fichier texte nommé `resource/order/<application>` où lordre peut valoir `stop`, `start`, `restart`, `kill`, `forcekill`, `top` ;
- et dattendre maximum 3 minutes pour voir le résultat dans `resource/order/<application>.out`
## Envoi de messages électroniques
Vous disposez d'un serveur SMTP permettant l'envoi de messages à l'adresse `relay.huma-num.fr` (ceci sans chiffrement, sans authentification et sur le port 25 traditionnel).
Vous disposez dun serveur SMTP permettant lenvoi de messages à ladresse `relay.huma-num.fr` (ceci sans chiffrement, sans authentification et sur le port 25 traditionnel).
## Journaux
......@@ -134,13 +134,13 @@ Les journaux Apache sont stockés jour par jour et conservés pendant un an dans
## Statistiques Web
Nous proposons un service de statistiques sur les consultations basé sur l'outil Piwik/Matomo.
Nous proposons un service de statistiques sur les consultations basé sur loutil Piwik/Matomo.
Il convient d'en faire la demande sur [humanid.huma-num.fr](https://humanid.huma-num.fr/)
Il convient den faire la demande sur [humanid.huma-num.fr](https://humanid.huma-num.fr/)
## Sauvegardes
Une sauvegarde incrémentale de l'ensemble de vos fichiers
Une sauvegarde incrémentale de lensemble de vos fichiers
et de vos bases de données est effectuée chaque nuit.
Vous avez un accès
......@@ -156,12 +156,12 @@ un fichier ou un dossier dans leur version précédente.
## Support
Toute demande concernant ce service doit impérativement être envoyée à l'adresse [assistance@huma-num.fr](mailto:assistance@huma-num.fr)
Toute demande concernant ce service doit impérativement être envoyée à ladresse [assistance@huma-num.fr](mailto:assistance@huma-num.fr)
## Machine virtuelle
Dans le cas où :
- vous avez des bonnes raisons de penser que des limitations techniques existent sur cet hébergement Web mutualisé,
- ou si vous souhaitez plus d'autonomie de gestion technique tout en pouvant assumer l'administration système d'un système Linux,
- ou si vous souhaitez plus dautonomie de gestion technique tout en pouvant assumer ladministration système dun système Linux,
nous pouvons mettre à disposition une machine virtuelle dans laquelle vous disposez du droit d'administration.
nous pouvons mettre à disposition une machine virtuelle dans laquelle vous disposez du droit dadministration.
......@@ -11,7 +11,7 @@ Celui-ci vise à faciliter pour les chercheurs le
stockage, la sécurisation et la gestion de leurs jeux de données volumineux. 
Le dispositif est indépendant des autres systèmes et services
d'Huma-Num (Sharedocs, Nakala, hébergement Web et machine virtuelle).
dHuma-Num (Sharedocs, Nakala, hébergement Web et machine virtuelle).
Il offre un service complémentaire pour accueillir des jeux de données,
principalement de grandes tailles (plusieurs centaines de Téraoctets au total). 
......@@ -20,7 +20,7 @@ Ce dispositif est une infrastructure technique, indépendante des
usages fonctionnels (au sens des données : usage, référencement,
traitement, publication, ...) et des usages métier.
Il est à considérer comme un équivalent technique d'un serveur de fichiers ordinaire, avec
Il est à considérer comme un équivalent technique dun serveur de fichiers ordinaire, avec
des fonctionnalités supplémentaires de sécurisation et de préservation
(cf. infra). Le dispositif utilise des disques magnétiques et des bandes
magnétiques, pour stocker les données.
......@@ -28,7 +28,7 @@ magnétiques, pour stocker les données.
## Caractéristiques des données pouvant être accueillies par le dispositif
Les données candidates à ce dispositif sont réputées "tièdes" voire
"froides", au sens où relativement peu d'accès en écriture et en lecture
"froides", au sens où relativement peu daccès en écriture et en lecture
seront effectués durant toute la vie de ces données.
Par contre ces données ont vocation à être conservées de manière fiable durant
......@@ -37,31 +37,31 @@ du travail de recherche et ont souvent une valeur de type
patrimonial. 
Ce service de stockage peut être vu comme le pendant
numérique d'une armoire sécurisée où l'on stocke des documents
numérique dune armoire sécurisée où lon stocke des documents
importants, nombreux, organisés (en rayonnages, boites archives,
dossiers) et documentés (fiches).
Ceci à la différence d'un bureau où se trouvent en vrac les documents courants et de toutes natures. 
Ceci à la différence dun bureau où se trouvent en vrac les documents courants et de toutes natures. 
Ces données sont notamment issues de campagnes de numérisation de fonds
anciens, de photos, d'enregistrements audio, de cartes, de vidéos, de
anciens, de photos, denregistrements audio, de cartes, de vidéos, de
modèles 3D. Elles existent uniquement sous la forme de fichiers,
éventuellement accompagnés de fichiers de méta-données techniques et
documentaires librement produits par les utilisateurs.
Le dispositif lui-même ne gère pas l'association des méta-données et des données&nbsp;:
c'est à l'utilisateur de prendre en charge cet aspect.
Le dispositif lui-même ne gère pas lassociation des méta-données et des données&nbsp;:
cest à lutilisateur de prendre en charge cet aspect.
Les données stockées ne peuvent pas être des bases de données au sens informatique.
Seuls des fichiers peuvent être stockés sur le dispositif.
Leur volume pourra atteindre plusieurs Téraoctets par jeu de
données. Les données sont organisées en "partages" (ou "volumes"),
disposant de règles d'accès comme celles utilisées sur des services de
disposant de règles daccès comme celles utilisées sur des services de
fichiers classiques.
Chaque gestionnaire de ces partages définit
librement l'organisation arborescente des fichiers contenus dans chaque
partage, afin de répondre au plan de classement qu'il aura défini
librement lorganisation arborescente des fichiers contenus dans chaque
partage, afin de répondre au plan de classement quil aura défini
lui-même.
## Caractéristiques fonctionnelles du dispositif
......@@ -72,16 +72,16 @@ Pour chaque partage, il est défini :
- les sites et plus finement les adresses IP pouvant accéder à ces données (un même partage pourra être accessible depuis plusieurs sites) ;
- le nombre de copies des données pouvant varier typiquement de 1 à 2 ;
- avec ou non une copie sur bandes magnétiques ;
- la gestion des versions dans le temps d'un même fichier (mécanisme d'historisation) ;
- la gestion des versions dans le temps dun même fichier (mécanisme dhistorisation) ;
- la durée de rétention permettant de conserver des données supprimées par les utilisateurs (mais restant accessibles aux administrateurs du dispositif).
Globalement, chaque partage est caractérisé par une politique d'accès
Globalement, chaque partage est caractérisé par une politique daccès
et une politique de sécurisation qui lui sont propres, et qui peuvent
être modifiées au fil du temps.
Le dispositif assure en continu le
respect de ces politiques. Ainsi la modification des localisations, du
nombre d'instances, du nombre de versions dans le temps, ne nécessite
nombre dinstances, du nombre de versions dans le temps, ne nécessite
aucune opération humaine.  
## Architecture du dispositif
......@@ -90,7 +90,7 @@ Le dispositif est à considérer comme un ensemble intégré unique,
comportant plusieurs serveurs répartis entre les structures partenaires et Huma-Num.  
À ce jour, les structures partenaires sont les MSH de
Rennes, Nantes, Val de Loire, Toulouse et Lyon, ainsi que l'EHESS
Rennes, Nantes, Val de Loire, Toulouse et Lyon, ainsi que lEHESS
(Paris) et La Contemporaine (Nanterre).
10 serveurs sont en production
......@@ -104,65 +104,65 @@ mis en œuvre, notamment pour la sécurisation constante des données.
Le dispositif maintient un catalogue global et unique des partages et des données,
dont chaque partie est présente sur au moins trois serveurs, afin de la sécuriser fortement. 
L'authentification des utilisateurs s'appuie sur l'annuaire
LDAP/Human-ID d'Huma-Num commun à de nombreux services de la TGIR.
Lauthentification des utilisateurs sappuie sur lannuaire
LDAP/Human-ID dHuma-Num commun à de nombreux services de la TGIR.
La gestion de l'annuaire est déléguée par branche à chaque site participant grâce à
l'outil FusionDirectory et l'interface accessible en
La gestion de lannuaire est déléguée par branche à chaque site participant grâce à
loutil FusionDirectory et linterface accessible en
[annuaire.huma-num.fr](https://annuaire.huma-num.fr)
Enfin la volumétrie disponible et les licences logicielles sont également globales.
On parle de stockage virtualisé. 
L'investissement d'Huma-Num consiste en :
Linvestissement dHuma-Num consiste en :
- les 10 serveurs et les 14 baies de stockage de marque Dell ;
- les licences du logiciel Active-Circle de la société Oodrive ;
- une garantie matérielle et logicielle sur 7 ans sur l'ensemble ;
- une garantie matérielle et logicielle sur 7 ans sur lensemble ;
- la ressource humaine pour la gestion complète du dispositif. 
Huma-Num est le seul maître d'œuvre et administrateur du dispositif.
Huma-Num est le seul maître dœuvre et administrateur du dispositif.
Chaque projet demande à Huma-Num la création, la suppression
ou la modification des caractéristiques des partages.
Un groupe d'utilisateurs est associé à un partage, permettant ainsi de déléguer
la gestion de qui accède au partage (par gestion de ce groupe dans l'annuaire commun). 
Un groupe dutilisateurs est associé à un partage, permettant ainsi de déléguer
la gestion de qui accède au partage (par gestion de ce groupe dans lannuaire commun). 
Des présentations du dispositif sont disponibles en :
- [Rencontre Huma-Num 2018](https://rhn2018.sciencesconf.org/data/20180612_hnbox.pdf)
- [Conférence JRES 2017](https://isidore.science/document/10670/1.yd8n65)
- Les documentations de l'éditeur sont en [activecircle-help.com/](https://activecircle-help.com/fr/%C2%A0).
- Les documentations de léditeur sont en [activecircle-help.com/](https://activecircle-help.com/fr/%C2%A0).
## Accès au dispositif
Il est à noter qu'il n'est pas du tout nécessaire de se
Il est à noter quil nest pas du tout nécessaire de se
trouver sur un site où se trouve un des noeuds pour utiliser le service.
Celui-ci est accessible à tout le monde, sans prérequis technique ou
d'hébergement de serveur ou encore d'investissement financier.
dhébergement de serveur ou encore dinvestissement financier.
Huma-Num se réserve la responsabilité de faire évoluer l'architecture du
dispositif en fonction de sa croissance et de l'opportunité de
Huma-Num se réserve la responsabilité de faire évoluer larchitecture du
dispositif en fonction de sa croissance et de lopportunité de
positionner des noeuds supplémentaires dans tel ou tel site.
### A. Depuis tout point de l'Internet
### A. Depuis tout point de lInternet
Trois méthodes d'accès sont disponibles :                 
Trois méthodes daccès sont disponibles :                 
1. via un client utilisant le protocole SFTP (comme Filezilla, rsync, etc.)  vers le serveur sftp.huma-num.fr ;
2. via une interface Web en lecture uniquement permettant une consultation minimaliste de l'arborescence des fichiers (URL à choisir). Un exemple est en [images.eurhisfirm.eu](http://images.eurhisfirm.eu) ;
2. via une interface Web en lecture uniquement permettant une consultation minimaliste de larborescence des fichiers (URL à choisir). Un exemple est en [images.eurhisfirm.eu](http://images.eurhisfirm.eu) ;
3. de plus, il est tout à fait possible de coupler une application Web plus élaborée en lien avec un jeu de données stocké dans le dispositif.  Les sites Cocoon, Archeogrid, Telemeta illustrent cette possibilité.
### B. Pour les sites hébergeant un des noeuds du dispositif
L'intérêt secondaire du service est aussi d'amener une fonction de type
Lintérêt secondaire du service est aussi damener une fonction de type
"serveur de fichiers" au plus près des utilisateurs sur le réseau
local où se trouve un des noeuds.
Ceci afin d'en rendre l'usage le plus simple possible, proche de celui d'un disque interne.
Ceci afin den rendre lusage le plus simple possible, proche de celui dun disque interne.
L'accès aux partages peut alors se faire par une fonction « Connexion à un lecteur réseau »
Le jeu de données apparaît sur le Bureau ou dans l'Explorateur de
fichiers de l'ordinateur de l'utilisateur.
Laccès aux partages peut alors se faire par une fonction « Connexion à un lecteur réseau »
Le jeu de données apparaît sur le Bureau ou dans lExplorateur de
fichiers de lordinateur de lutilisateur.
Il peut alors manipuler les données strictement comme si elles étaient sur son disque interne. 
Pour étendre cette fonctionnalité
......@@ -175,12 +175,12 @@ un dispositif de VPN (Virtual Private Network) est disponible.
Comme tout système de stockage distribué, le dispositif est sensible au
nombre de fichiers. Aussi chaque structure candidate indique un ordre de
grandeur du nombre de fichiers qu'elle compte déposer.
grandeur du nombre de fichiers quelle compte déposer.
Au delà de 10 millions de fichiers, une étude devra être menée avec Huma-Num pour
préciser la faisabilité. 
De plus, il est instamment demandé de ne pas dépasser environ 10&nbsp;000 fichiers dans un même dossier.
Au-delà, il convient d'étudier avec Huma-Num les solutions de contournement. 
Au-delà, il convient détudier avec Huma-Num les solutions de contournement. 
### Limitations sur la nature des données
......@@ -190,17 +190,17 @@ disques virtuels de machines virtuelles. 
## Performances
Le dispositif n'est pas conçu pour :                 
Le dispositif nest pas conçu pour :                 
- un temps d'accès ultra-rapide ;               
- un temps daccès ultra-rapide ;               
- une très grande vitesse en transfert, en lecture comme en écriture ;
- un usage bureautique ;             
- un traitement intensif et parallèle sur les données. 
Néanmoins le retour d'expériences après cinq d'années d'exploitation
Néanmoins le retour dexpériences après cinq dannées dexploitation
est positif. Aucune limitation perceptible par les utilisateurs du
dispositif n'est à noter.
dispositif nest à noter.
Des vitesses de transfert de plus de 50 Mo/s (500 Mb/s)
sont observées régulièrement.
......@@ -210,7 +210,7 @@ en respectant un traitement séquentiel. 
De plus, trois sites Web importants publient
désormais leurs fichiers media via un stockage sur ce dispositif. Il
s'agit des sites Cocoon, Archeogrid et Telemeta.
sagit des sites Cocoon, Archeogrid et Telemeta.
Aussi il convient de noter que le dispositif peut être utilisé
pour publier un corpus de données par une application Web sous forme
......@@ -219,33 +219,33 @@ Ainsi une instance Omeka-S et une instance de serveur IIIF sont reliées au disp
## Disponibilité, intégrité, confidentialité
L'engagement d'Huma-Num sur ce dispositif est de la même nature que
Lengagement dHuma-Num sur ce dispositif est de la même nature que
pour les autres services :                  
- "best effort", quant à la disponibilité ;
- haut niveau, quant à l'intégrité et la confidentialité.
- haut niveau, quant à lintégrité et la confidentialité.
Le retour d'expérience sur cinq ans montre :                  
Le retour dexpérience sur cinq ans montre :                  
- aucun incident concernant la conservation, l'intégrité ou la confidentialité des données ;
- aucun incident concernant la conservation, lintégrité ou la confidentialité des données ;
- une disponibilité très satisfaisante. 
Le dispositif est réputé sûr quant à la conservation des données,
moyennant évidemment l'existence de deux jeux de données sur deux
moyennant évidemment lexistence de deux jeux de données sur deux
sites. Un mécanisme de vérification automatique des signatures des
fichiers peut être mis en place.  
De plus, un archivage binaire des données peut être mis en place sur
bandes magnétiques LTO. Ceci constitue une duplication des données sur
d'autres médias que des disques magnétiques. Ces bandes peuvent être
dautres médias que des disques magnétiques. Ces bandes peuvent être
verrouillées en écriture, sont relues et contrôlées automatiquement et
périodiquement, et elles sont écrites dans un format ouvert et normalisé
(TAR). 
Quant à la confidentialité, plusieurs points :
- Elle est d'abord garantie par la bonne gestion des droits d'accès aux partages.
- Les accès en SFTP opèrent un chiffrement de la communication entre l'utilisateur et le service.
- Elle est dabord garantie par la bonne gestion des droits daccès aux partages.
- Les accès en SFTP opèrent un chiffrement de la communication entre lutilisateur et le service.
- Une fonction de chiffrement à la volée est désormais disponible, qui assure une conservation chiffrée sur disques et bandes.
- Une journalisation exhaustive des accès aux données est en place.
- Le besoin de chiffrement des données sur les PC des utilisateurs reste à leur charge.
......@@ -253,4 +253,4 @@ Quant à la confidentialité, plusieurs points :
## Support
Toute demande concernant ce service doit impérativement être envoyée à l'adresse [assistance@huma-num.fr](mailto:assistance@huma-num.fr).
Toute demande concernant ce service doit impérativement être envoyée à ladresse [assistance@huma-num.fr](mailto:assistance@huma-num.fr).
This diff is collapsed.
......@@ -8,19 +8,19 @@ Huma-Num propose un ensemble de services pour les données numériques produites
Huma-Num est une très grande infrastructure de recherche (TGIR) visant à faciliter le tournant numérique de la recherche en sciences humaines et sociales.
La mission première d'Huma-Num est d'assurer la préservation, la valorisation et l'utilisation du patrimoine scientifique des programmes de recherche en sciences humaines et sociales (SHS), et plus particulièrement des données et documents : corpus, bases de données, systèmes d'information, enquêtes, données d'observation, cartes, photographies, vidéos, enregistrements sonores.
La mission première dHuma-Num est dassurer la préservation, la valorisation et lutilisation du patrimoine scientifique des programmes de recherche en sciences humaines et sociales (SHS), et plus particulièrement des données et documents : corpus, bases de données, systèmes dinformation, enquêtes, données dobservation, cartes, photographies, vidéos, enregistrements sonores.
Pour remplir cette mission, la TGIR Huma-Num est bâtie sur une organisation consistant à mettre en œuvre un dispositif humain (concertation collective au sein de Consortiums) et technologique (des services numériques pérennes) à l'échelle nationale et européenne en s'appuyant sur un important réseau de partenaires et d'opérateurs.
Pour remplir cette mission, la TGIR Huma-Num est bâtie sur une organisation consistant à mettre en œuvre un dispositif humain (concertation collective au sein de Consortiums) et technologique (des services numériques pérennes) à léchelle nationale et européenne en sappuyant sur un important réseau de partenaires et dopérateurs.
La TGIR Huma-Num favorise ainsi, par l'intermédiaire de consortiums regroupant des acteurs des communautés scientifiques, la coordination de la production raisonnée et collective de corpus de sources (recommandations scientifiques, bonnes pratiques technologiques).
La TGIR Huma-Num favorise ainsi, par lintermédiaire de consortiums regroupant des acteurs des communautés scientifiques, la coordination de la production raisonnée et collective de corpus de sources (recommandations scientifiques, bonnes pratiques technologiques).
Elle développe également un dispositif technologique unique permettant le traitement, la conservation, l'accès et l'interopérabilité des données de la recherche. Ouvert à l'ensemble des programmes de recherche de l'enseignement supérieur et de la recherche (UMR, UMS, EA, etc.), il est composé de services numériques dédiés, d'une plateforme d'accès unifié (ISIDORE) et d'une procédure d'archivage à long terme.
Elle développe également un dispositif technologique unique permettant le traitement, la conservation, laccès et linteropérabilité des données de la recherche. Ouvert à lensemble des programmes de recherche de lenseignement supérieur et de la recherche (UMR, UMS, EA, etc.), il est composé de services numériques dédiés, dune plateforme daccès unifié (ISIDORE) et dune procédure darchivage à long terme.
La TGIR Huma-Num propose en outre des guides de bonnes pratiques technologiques généralistes à destination des chercheurs. Elle peut mener ponctuellement des actions d'expertise et de formation.
La TGIR Huma-Num propose en outre des guides de bonnes pratiques technologiques généralistes à destination des chercheurs. Elle peut mener ponctuellement des actions dexpertise et de formation.
Enfin, elle porte la participation de la France dans les ERIC (European Research Infrastructure Consortium) DARIAH et CLARIN en coordonnant les contributions nationales. Elle est également impliquée depuis 2015 dans deux projets H2020 : Parthenos et Humanities at Scale.
## À qui s'adressent les services d’Huma-Num ?
## À qui sadressent les services d’Huma-Num ?
Les services d’Huma-Num sont accessibles aux programmes de recherche scientifiques menés collectivement par des équipes de recherche en sciences humaines et sociales. Les programmes de recherche peuvent être portés par des enseignant.e.s-chercheur.e.s, des ingénieur.e.s, des doctorant.e.s et des chercheur.e.s en post-doctorat.
......
This diff is collapsed.
......@@ -3,7 +3,7 @@
- [1 / Fonctionnement du dossier hnTools_WatchFolder](#S1)
- [2 / Conversion/Transcodage audio et vidéo](#S2)
- [3 / Reconnaissance de caractères (OCR)](#S3)
- 3.1 Conditions d'utilisations des logiciels d'OCR
- 3.1 Conditions dutilisations des logiciels dOCR
- 3.2 Tesseract
- 3.3 AbbyyCloud
- 3.4 AbbyyServer
......@@ -15,9 +15,9 @@
## []{#S1}1 / Fonctionnement du dossier hnTools_WatchFolder
Sous l'arborescence du compte utilisateur, on trouvera un répertoire
Sous larborescence du compte utilisateur, on trouvera un répertoire
hnTools_watchFolder qui contient des outils de conversion. Ce
répertoire fonctionne sur le principe de Watch Folder. Une fois qu'un
répertoire fonctionne sur le principe de Watch Folder. Une fois quun
fichier est déposé, un processus scan à fréquence régulière les fichiers
et crée une demande de traitement à un outil spécifique. À la fin du
traitement, un mail est envoyé automatiquement à la personne qui a
......@@ -28,7 +28,7 @@ Folder après utilisation.
Le nom du répertoire et de ces sous-répertoires définit le traitement
qui est effectué dessus. La structure est de la forme:
hnTools_watchFolder->[Tool]->[Engine]->Preset1->Preset2
L'organisation est la suivante :
Lorganisation est la suivante :
- Audio
    |- ffmpeg
......@@ -63,17 +63,17 @@ _hnOCR.docx
*Le transcodage audio/vidéo utilise [FFmpeg](https://ffmpeg.org/) comme
engine par défaut. Un programme comme HandBrake
(<https://handbrake.fr/>) utilise FFmpeg comme outil de conversion et
permet d'avoir accès dans une GUI à toutes ses options.
Il est a noter qu'en vidéo, on parle de transcodage plutôt que de
permet davoir accès dans une GUI à toutes ses options.
Il est a noter quen vidéo, on parle de transcodage plutôt que de
conversion, car le changement de format est un changement significatif