From f80fd74fcd149c1b08d0ae43ed9a7fd3b7214241 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 15:29:06 +0100 Subject: [PATCH 01/11] modifs in README + adding suggestions --- README.md | 54 +++++++++++++++++++++++++++++++++++++++++++++--------- 1 file changed, 45 insertions(+), 9 deletions(-) diff --git a/README.md b/README.md index a5f2ca7..31f3358 100644 --- a/README.md +++ b/README.md @@ -1,28 +1,64 @@ -Codex palatinus graecus 23 -=========================== +Codex palatinus graecus 23 - Ground Truth Dataset Medieval Greek Manuscripts +============================================================================ -Ground Truth dataset for the Codex palatinus graecus 23 (Palatine Anthology), byzantine writing from the X^th^ century. +    + +<!-- to be completed: + [](https://doi.org/10.5281/zenodo.123) +--> + +Dataset of HTR ground truth for the Codex palatinus graecus 23 (Palatine Anthology), byzantine writing from the X^th^ century. ## License This work is licensed under CC BY 4.0. To view a copy of this license, visit http://creativecommons.org/licenses/by/4.0/ -## Description +## Dataset description + +This dataset was produced by the Canada Research Chair on Digital Textualities, as part of the [Anthologia graeca project](https://anthologiagraeca.org/). + +A first batch of 50 pages (143-195) were initially transcribed to train a transcription model prototype. We then added 20 pages (196-215) to produce the first version of a transcription model for Greek manuscripts. The transcription of these 70 pages can be found in `data/CPgr23`. -The model was trained from the ground truth produced by the Canada Research Chair on Digital Textualities, as part of the [Anthologia graeca project](https://anthologiagraeca.org/). We focused our ground truth on 50 pages (143-195) and did finetuning on 20 extra pages (196-215). +### Transcription guidelines -## Transcription guidelines +<!-- to be completed --> +<!-- remember to illustrate! :) --> To come. -## Sources + +## Model description + +<!-- to be completed --> +A transcription model for Greek manuscripts was trained using this dataset. It can be found here: {placeholder}. ## Images -The training has been done with images of the codex palatinus graecus 23 digitized by the Universitätsbibliothek Heidelberg (where the first part of the manuscript is kept -- the second one being in the BNF, as Supplementum graecum 384), and then uploaded to eScriptorium using IIIF. Find the manuscript [here](https://doi.org/10.11588/diglit.3449). +This ground truth is based on images of the codex palatinus graecus 23 digitized by the Universitätsbibliothek Heidelberg (where the first part of the manuscript is kept -- the second one being in the BNF, as Supplementum graecum 384), and then uploaded to eScriptorium using IIIF. Find the manuscript [here](https://doi.org/10.11588/diglit.3449). ## How to cite +<!-- copyright related info should go in "Licence"--> This dataset was built and is maintained by Maxime Guénette (@mguenette), Mathilde Verstraete (@mverstraete), Alix Chagué (@achague), Marcello Vitali-Rosati (@marviro). The digitization is not copyright-free, but the transcription is. However, properly annotating a corpus takes time and is a task that should be recognized. If you use any item from this corpus of ground truth, cite the dataset using the following information: -- [ ] Ajouter la référence Zenodo. \ No newline at end of file +- [ ] Ajouter la référence Zenodo. + +### Cite the Model + +<!-- add Bibtex citation for the model --> + +### Cite the Dataset + +<!-- add Bibtex citation for the dataset--> + +### Cite the Project + +<!-- add stuff here if you feel like keep this --> + +## Funding + +<!-- feel free to complete this section --> + +## Infrastructure + +This project relied on the [CREMMA](https://cremmacall.sciencescall.org/) infrastructure. \ No newline at end of file -- GitLab From e74bae2201ff582c4ac8bdcff474063712cbb942 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <33317799+alix-tz@users.noreply.github.com> Date: Fri, 8 Mar 2024 15:31:31 +0100 Subject: [PATCH 02/11] Create LICENSE --- LICENSE | 461 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 461 insertions(+) create mode 100644 LICENSE diff --git a/LICENSE b/LICENSE new file mode 100644 index 0000000..033df8d --- /dev/null +++ b/LICENSE @@ -0,0 +1,461 @@ +Attribution 4.0 International + +======================================================================= + +Creative Commons Corporation ("Creative Commons") n'est pas un +cabinet d'avocats et ne donne ni services ni conseils juridiques. La +mise à disposition des licences publiques Creative Commons ne crée pas +de rapport analogue à celui d’un client avec son conseil ni aucun +autre type de relation juridique. Creative Commons propose ses licences +et les informations qui y sont associées telles quelles, sans aucune +garantie relative à ses licences, aux Å“uvres mises à disposition +conformément aux termes et conditions d’utilisation de ses licences, ou +à toute autre information afférente. Creative Commons décline +formellement toute responsabilité quant aux préjudices pouvant résulter +de leur utilisation. + +Utilisation des licences publiques Creative Commons + +Les licences publiques Creative Commons proposent des termes et +conditions d’utilisation standardisés que les auteurs et autres +titulaires de droits peuvent utiliser pour partager une Å“uvre originale +ou toute autre Å“uvre protégée par le droit d'auteur et certains autres +droits précisés dans la licence publique ci-dessous. Les avertissements +suivants sont indiqués à titre informatif uniquement ; ils ne sont pas +exhaustifs et ne font pas partie de nos licences. + + Avertissements à l’attention des donneurs de licence : Nos + licences publiques sont conçues pour être utilisées par les + auteurs et titulaires de droits dans la limite des lois et + règlements en vigueur. Nos licences sont irrévocables. Les + donneurs de licence doivent lire et comprendre les termes et + conditions de la licence qu'ils choisissent avant de l’utiliser. + Les donneurs de licence doivent également obtenir tous les droits + nécessaires avant d'utiliser nos licences de façon à ce que le + public puisse utiliser l’œuvre comme prévu. Les donneurs de + licence doivent clairement indiquer quelle Å“uvre n'est pas soumise + à la licence. Cela comprend les Å“uvres soumises à d’autres + licences Creative Commons et les Å“uvres utilisées aux termes d'une + exception ou d'une limitation du droit d'auteur. Autres + avertissements à l’attention des donneurs de licence: + wiki.creativecommons.org/Considerations_for_licensors + + Avertissements à l’attention du public : Le donneur de licence qui + utilise l'une de nos licences publiques accorde au public + l’autorisation d’utiliser l’œuvre aux termes et conditions + précisés dans la licence. Si l’autorisation du donneur de licence + n'est pas nécessaire pour quelque raison que ce soit (en raison, + par exemple, d’une exception ou d’une limitation applicable au + droit d'auteur), cette utilisation n'est pas soumise aux termes et + conditions d’utilisation de la licence. Nos licences accordent + uniquement des autorisations en vertu du droit d'auteur et de + certains autres droits qu'un donneur de licence a le droit + d’accorder. L’utilisation de l’œuvre peut néanmoins être restreint + pour d'autres raisons, par exemple, si d'autres personnes + détiennent un droit d'auteur ou d'autres droits sur l’œuvre. Un + donneur de licence peut formuler des demandes particulières, comme + notamment que toute modification soit indiquée ou décrite. Même si + cela n'est pas rendu obligatoire par nos licences, nous vous + invitons à honorer ces demandes dans la mesure du possible. Autres + avertissements à l’attention du public. + wiki.creativecommons.org/Considerations_for_licensees + +======================================================================= + +Licence publique Creative Commons Attribution 4.0 International + +Lorsque Vous exercez les Droits accordés par la licence (définis +ci-dessous), Vous acceptez d'être lié par les termes et conditions de +la présente Licence publique Creative Commons Attribution 4.0 +International (la « Licence publique »). Dans la mesure où la présente +Licence publique peut être interprétée comme un contrat, Vous +bénéficiez des Droits accordés par la licence en contrepartie de Votre +acceptation des présents termes et conditions, et le Donneur de licence +Vous accorde ces droits en contrepartie des avantages que lui procure +le fait de mettre à disposition l’Œuvre sous licence en vertu des +présents termes et conditions. + + +Article 1 -- Définitions. + + a. Å’uvre dérivée signifie Å“uvre protégée par les Droit d’auteur et + droits connexes, dérivée ou adaptée de l’Œuvre sous licence et + dans laquelle l’Œuvre sous licence est traduite, retouchée, + arrangée, transformée, ou modifiée de telle façon que + l’autorisation du Donneur de licence est nécessaire, conformément + aux dispositions des Droit d’auteur et droits connexes. Dans le + cas de la présente Licence publique, lorsque l’Œuvre sous licence + est une Å“uvre musicale, une représentation publique ou un + enregistrement sonore, la synchronisation de l'Å’uvre sous licence + avec une image animée sera considérée comme une Å’uvre dérivée aux + fins de la présente Licence publique. + + b. Licence d’Œuvre dérivée signifie licence par laquelle Vous + accordez Vos Droit d'auteur et droits connexes portant sur Vos + contributions à l'Å’uvre dérivée, selon les termes et conditions de + la présente Licence publique. + + c. Droit d’auteur et droits connexes signifie droit d’auteur et/ou + droits connexes incluant, notamment, la représentation, la radio + et télédiffusion, l’enregistrement sonore et le Droit sui generis + des producteurs de bases de données, quelle que soit la + classification ou qualification juridique de ces droits. Dans le + cadre de la présente Licence publique, les droits visés + à l’Article 2(b)(1)-(2) ne relèvent ni du Droit d’auteur ni de + droits connexes. + + d. Mesures techniques efficaces signifie mesures techniques qui, en + l’absence d’autorisation expresse, ne peuvent être contournées + dans le cadre de lois conformes aux dispositions de l’Article 11 + du Traité de l’OMPI sur le droit d’auteur adopté le 20 Décembre + 1996 et/ou d’accords internationaux de même objet. + + e. Exceptions et limitations signifie utilisation loyale et équitable + (fair use et fair dealing) et/ou toute autre exception ou + limitation applicable à Votre utilisation de l’Œuvre sous licence. + + f. Å’uvre sous licence signifie Å“uvre littéraire ou artistique, base + de données ou toute autre Å“uvre pour laquelle le Donneur de + licence a recours à la présente Licence publique. + + g. Droits accordés par la licence signifie droits qui Vous sont + accordés selon les termes et conditions d’utilisation définis par + la présente Licence publique, limités aux Droit d’auteur et droits + connexes applicables à Votre utilisation de l’Œuvre sous licence + et que le Donneur de licence a le droit d’accorder. + + h. Donneur de licence signifie un individu ou une entité octroyant la + présente Licence publique et les droits accordés par elle. + + i. Partager signifie mettre une Å“uvre à la disposition du public par + tout moyen ou procédé qui requiert l’autorisation découlant des + Droits accordés par la licence, tels que les droits de + reproduction, de représentation au public, de distribution, de + diffusion, de communication ou d’importation, y compris de manière + à ce que chacun puisse y avoir accès de l’endroit et au moment + qu’il choisit individuellement. + + j. Droit sui generis des producteurs de bases de données signifie + droits distincts du droit d'auteur résultant de la Directive + 96/9/CE du Parlement européen et du Conseil du 11 mars 1996 sur la + protection juridique des bases de données, ainsi que tout autre + droit de nature équivalente dans le monde. + + k. Vous (preneur de licence) se rapporte à tout individu ou entité + exerçant les Droits accordés par la licence. Votre et Vos + renvoient également au preneur de licence. + +Article 2 - Champ d’application de la présente Licence publique. + + a. Octroi de la licence. + + 1. Sous réserve du respect des termes et conditions + d'utilisation de la présente Licence publique, le Donneur de + licence Vous autorise à exercer pour le monde entier, à titre + gratuit, non sous-licenciable, non exclusif, irrévocable, les + Droits accordés par la licence afin de : + + a. reproduire et Partager l’Œuvre sous licence, en tout ou + partie ; et + + b. produire, reproduire et Partager l’Œuvre dérivée. + + 2. Exceptions et limitations. Afin de lever toute ambiguïté, + lorsque les Exceptions et limitations s’appliquent à Votre + utilisation, la présente Licence publique ne s’applique pas + et Vous n’avez pas à Vous conformer à ses termes et + conditions. + + 3. Durée. La durée de la présente Licence publique est définie à l’Article 6(a). + + 4. Supports et formats : modifications techniques autorisées. Le + Donneur de licence Vous autorise à exercer les Droits + accordés par la licence sur tous les supports et formats + connus ou encore inconnus à ce jour, et à apporter toutes les + modifications techniques que ceux-ci requièrent. Le Donneur + de licence renonce et/ou accepte de ne pas exercer ses droits + qui pourraient être susceptibles de Vous empêcher d’apporter + les modifications techniques nécessaires pour exercer les + Droits accordés par la licence, y compris celles nécessaires + au contournement des Mesures techniques efficaces. Dans le + cadre de la présente Licence publique, le fait de ne procéder + qu’à de simples modifications techniques autorisées selon les + termes du présent Article 2(a)(4) n’est jamais de nature + à créer une Å’uvre dérivée. + + 5. Utilisateurs en aval. + + a. Offre du Donneur de licence – Å’uvre sous licence. Chaque + utilisateur de l’Œuvre sous licence reçoit automatiquement + une offre de la part du Donneur de licence lui permettant + d’exercer les Droits accordés par la licence selon les + termes et conditions de la présente Licence publique. + + b. Offre additionnelle du Donneur de licence – Å’uvre + dérivée. Chaque utilisateur d’une Å’uvre dérivée reçoit + automatiquement une offre du Donneur de licence lui + permettant d’exercer les Droits accordés par la licence + sur l’Œuvre dérivée selon les termes et conditions de la + Licence d’Œuvre dérivée que Vous appliquez. + + c. Pas de restrictions en aval pour les utilisateurs + suivants. Vous ne pouvez proposer ou imposer des termes + et conditions supplémentaires ou différents, ou + appliquer quelque Mesure technique efficace que ce soit + à l’Œuvre sous licence si ceux(celles)-ci sont de nature + à restreindre l’exercice des Droits accordés par la + licence aux utilisateurs de l’Œuvre sous licence. + + 6. Non approbation. Aucun élément de la présente Licence + publique ne peut être interprété comme laissant supposer que + le preneur de licence ou que l’utilisation qu’il fait de + l’Œuvre sous licence est lié à , parrainé, approuvé, ou doté + d'un statut officiel par le Donneur de licence ou par toute + autre personne à qui revient l’attribution de l’Œuvre sous + licence, comme indiqué à l’Article 3(a)(1)(A)(i). + +b. Autres droits. + + 1. Les droits moraux, tel que le droit à l’intégrité de l’œuvre, ne + sont pas accordés par la présente Licence publique, ni le + droit à l’image, ni le droit au respect de la vie privée, ni + aucun autre droit de la personnalité ou apparenté + ; cependant, dans la mesure du possible, le Donneur de + licence renonce et/ou accepte de ne pas faire valoir les + droits qu’il détient de manière à Vous permettre d’exercer + les Droits accordés par la licence. + + 2. Le droit des brevets et le droit des marques ne sont pas + concernés par la présente Licence publique. + + 3. Dans la mesure du possible, le Donneur de licence renonce au + droit de collecter des redevances auprès de Vous pour + l’exercice des Droits accordés par la licence, directement ou + indirectement dans le cadre d’un régime de gestion collective + facultative ou obligatoire assorti de possibilités de + renonciation quel que soit le type d’accord ou de licence. + Dans tous les autres cas, le Donneur de licence se réserve + expressément le droit de collecter de telles redevances. + + +Article 3 – Conditions d'utilisation de la présente Licence publique. + +L’exercice des Droits accordés par la licence est expressément soumis +aux conditions suivantes. + + a. Attribution. + + 1. Si Vous partagez l’Œuvre sous licence (y compris sous une + forme modifiée), Vous devez : + + a. conserver les informations suivantes lorsqu’elles sont fournies par le Donneur de licence avec l’Œuvre sous licence : + + i. identification du(des) auteur(s) de l’Œuvre sous + licence et de toute personne à qui revient + l’attribution de l’Œuvre sous licence, dans la + mesure du possible, conformément à la demande du + Donneur de licence (y compris sous la forme d’un + pseudonyme s’il est indiqué) ; + + ii. l’indication de l’existence d’un droit d’auteur ; + + iii. une notice faisant référence à la présente Licence + publique ; + + iv. une notice faisant référence aux limitations de + garantie et exclusions de responsabilité ; + + v. un URI ou un hyperlien vers l’Œuvre sous licence + dans la mesure du possible ; + + b. Indiquer si Vous avez modifié l’Œuvre sous licence et + conserver un suivi des modifications précédentes ; et + + c. Indiquer si l’Œuvre sous licence est mise à disposition + en vertu de la présente Licence publique en incluant le + texte, l’URI ou l’hyperlien correspondant à la présente + Licence publique. + + 2. Vous pouvez satisfaire aux conditions de l’Article 3(a)(1) + dans toute la mesure du possible, en fonction des supports, + moyens et contextes dans lesquels Vous Partagez l’Œuvre sous + licence. Par exemple, Vous pouvez satisfaire aux conditions + susmentionnées en fournissant l’URI ou l’hyperlien vers la + ressource incluant les informations requises. + + 3. Bien que requises aux termes de l’Article 3(a)(1)(A), + certaines informations devront être retirées, dans la mesure + du possible, si le Donneur de licence en fait la demande. + + b. Partage dans les mêmes conditions. + + Outre les conditions indiquées à l’Article 3(a), si Vous Partagez + une Å’uvre dérivée que Vous avez réalisée, les conditions suivantes + s’appliquent aussi. + + 1. La Licence d’Œuvre dérivée que Vous appliquez doit être une + licence Creative Commons avec les mêmes Eléments de licence, + qu’il s’agisse de cette version ou d’une version ultérieure, + ou une Licence compatible BY-SA. + + 2. Vous devez inclure le texte, l’URI ou l’hyperlien + correspondant à la Licence d’Œuvre dérivée que Vous + appliquez. Ces conditions peuvent être satisfaites dans la + mesure du raisonnable suivant les supports, moyens et + contextes via lesquels Vous Partagez l’Œuvre dérivée. + + 3. Vous ne pouvez pas proposer ou imposer des termes ou des + conditions supplémentaires ou différents ou appliquer des + Mesures techniques efficaces à l’Œuvre dérivée qui seraient + de nature à restreindre l’exercice des Droits accordés par la + Licence d’Œuvre dérivée que Vous appliquez. + + +Article 4 – Le Droit sui generis des producteurs de bases de données. + +Lorsque les Droits accordés par la licence incluent le Droit sui +generis des producteurs de bases de données applicable à Votre +utilisation de l’Œuvre sous licence : + + a. afin de lever toute ambiguïté, l’Article 2(a)(1) Vous accorde le + droit d’extraire, réutiliser, reproduire et Partager la totalité + ou une partie substantielle du contenu de la base de données ; + + b. si Vous incluez la totalité ou une partie substantielle du contenu + de la base de données dans une base de données pour laquelle Vous + détenez un Droit sui generis de producteur de bases de données, la + base de données sur laquelle Vous détenez un tel droit (mais pas + ses contenus individuels) sera alors considérée comme une Å’uvre + dérivée, y compris pour l’application de l’Article 3(b) ; et + + c. Vous devez respecter les conditions de l’Article 3(a) si Vous + Partagez la totalité ou une partie substantielle du contenu des + bases de données. + +Afin de lever toute ambiguïté, le présent Article 4 complète mais ne +remplace pas Vos obligations découlant des termes de la présente +Licence publique lorsque les Droits accordés par la licence incluent +d’autres Droit d’auteur et droits connexes. + + +Article 5 – Limitations de garantie et exclusions de responsabilité. + + a. Sauf indication contraire et dans la mesure du possible, le + Donneur de licence met à disposition l’Œuvre sous licence telle + quelle, et n’offre aucune garantie de quelque sorte que ce soit, + notamment expresse, implicite, statutaire ou autre la concernant. + Cela inclut, notamment, les garanties liées au titre, à la valeur + marchande, à la compatibilité de certaines utilisations + particulières, à l’absence de violation, à l’absence de vices + cachés ou autres défauts, à l’exactitude, à la présence ou + à l’absence d’erreurs connues ou non ou susceptibles d’être + découvertes dans l’Œuvre sous licence. Lorsqu’une limitation de + garantie n’est pas autorisée en tout ou partie, cette clause peut + ne pas Vous être applicable. + + b. Dans la mesure du possible, le Donneur de licence ne saurait voir + sa responsabilité engagée vis-à -vis de Vous, quel qu’en soit le + fondement juridique (y compris, notamment, la négligence), pour + tout préjudice direct, spécial, indirect, incident, conséquentiel, + punitif, exemplaire, ou pour toutes pertes, coûts, dépenses ou + tout dommage découlant de l’utilisation de la présente Licence + publique ou de l’utilisation de l’Œuvre sous licence, même si le + Donneur de licence avait connaissance de l’éventualité de telles + pertes, coûts, dépenses ou dommages. Lorsqu’une exclusion de + responsabilité n’est pas autorisée en tout ou partie, cette clause + peut ne pas Vous être applicable. + + c. Les limitations de garantie et exclusions de responsabilité + ci-dessus doivent être interprétées, dans la mesure du possible, + comme des limitations et renonciations totales de toute + responsabilité. + + +Article 6 – Durée et fin. + + a. La présente Licence publique s’applique pendant toute la durée de + validité des Droits accordés par la licence. Cependant, si Vous + manquez à Vos obligations prévues par la présente Licence + publique, Vos droits accordés par la présente Licence publique + seront automatiquement révoqués. + + b. Lorsque les Droits accordés par la licence ont été révoqués selon + les termes de l’Article 6(a), ils seront rétablis : + + 1. automatiquement, à compter du jour où la violation aura + cessé, à condition que Vous y remédiiez dans les 30 jours + suivant la date à laquelle Vous aurez eu connaissance de la + violation ; ou + + 2. à condition que le Donneur de licence l’autorise + expressément. + + Afin de lever toute ambiguïté, le présent Article 6(b) n’affecte + pas le droit du Donneur de licence de demander réparation dans les + cas de violation de la présente Licence publique. + + c. Afin de lever toute ambiguïté, le Donneur de licence peut + également proposer l’Œuvre sous licence selon d’autres termes et + conditions et peut cesser la mise à disposition de l’Œuvre sous + licence à tout moment ; une telle cessation n’entraîne pas la fin + de la présente Licence publique. + + d. Les Articles 1, 5, 6, 7, et 8 continueront à s’appliquer même + après la résiliation de la présente Licence publique. + + +Article 7 – Autres termes et conditions. + + a. Sauf accord exprès, le Donneur de licence n’est lié par aucune + modification des termes de Votre part. + + b. Tous arrangements, ententes ou accords relatifs à l’Œuvre sous + licence non mentionnés dans la présente Licence publique sont séparés + et indépendants des termes et conditions de la présente Licence + publique. + + +Article 8 – Interprétation. + + a. Afin de lever toute ambiguïté, la présente Licence publique ne + doit en aucun cas être interprétée comme ayant pour effet de + réduire, limiter, restreindre ou imposer des conditions plus + contraignantes que celles qui sont prévues par les dispositions + légales applicables. + + b. Dans la mesure du possible, si une clause de la présente Licence + publique est déclarée inapplicable, elle sera automatiquement + modifiée a minima afin de la rendre applicable. Dans le cas où la + clause ne peut être modifiée, elle sera écartée de la présente + Licence publique sans préjudice de l’applicabilité des termes et + conditions restants. + + c. Aucun terme ni aucune condition de la présente Licence publique ne + sera écarté(e) et aucune violation ne sera admise sans l’accord + exprès du Donneur de licence. + + d. Aucun terme ni aucune condition de la présente Licence publique ne + constitue ou ne peut être interprété(e) comme une limitation ou + une renonciation à un quelconque privilège ou à une immunité + s’appliquant au Donneur de licence ou à Vous, y compris lorsque + celles-ci émanent d’une procédure légale, quel(le) qu’en soit le + système juridique concerné ou l’autorité compétente. + + +======================================================================= + +Creative Commons n’est pas partie prenante de ses licences publiques. +Néanmoins, Creative Commons se réserve le droit d'utiliser une de ses +licences publiques pour les Å“uvres qu’elle publie, et dans ce cas sera +considérée comme « Donneur de licence ». Le texte des licences +publiques Creative Commons est versé au domaine public en vertu de CC0 +Domaine Public. A l’exception des seuls cas où il est indiqué que +l’œuvre est mise à disposition sous licence publique Creative Commons +et ceux autorisés par les statuts de Creative Commons disponibles sur +creativecommons.org/policies, Creative Commons n’autorise l’utilisation +par aucune partie de la marque "Creative Commons" ou de toute autre +marque ou logo de Creative Commons sans le consentement écrit préalable +de Creative Commons. Cette restriction relative à l'utilisation des +marques ne constitue pas une partie de nos licences publiques. + +Vous pouvez joindre Creative Commons via creativecommons.org. -- GitLab From aeb51414645c532278ad0f7311f683460dba9b72 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 15:35:23 +0100 Subject: [PATCH 03/11] regrouping github actions specs into one file --- .github/workflows/HTRUC.yml | 23 -------- .github/workflows/chocomufin.yml | 24 -------- .github/workflows/htr-united.yml | 95 ++++++++++++++++++++++++++++++ .github/workflows/htrvx.yml | 23 -------- .github/workflows/humGenerator.yml | 32 ---------- 5 files changed, 95 insertions(+), 102 deletions(-) delete mode 100644 .github/workflows/HTRUC.yml delete mode 100644 .github/workflows/chocomufin.yml create mode 100644 .github/workflows/htr-united.yml delete mode 100644 .github/workflows/htrvx.yml delete mode 100644 .github/workflows/humGenerator.yml diff --git a/.github/workflows/HTRUC.yml b/.github/workflows/HTRUC.yml deleted file mode 100644 index f25bcb8..0000000 --- a/.github/workflows/HTRUC.yml +++ /dev/null @@ -1,23 +0,0 @@ -# This workflow will install Python dependencies, run tests and lint with a single version of Python -# For more information see: https://help.github.com/actions/language-and-framework-guides/using-python-with-github-actions - -name: HTRUC - -on: [push, pull_request] - -jobs: - test: - runs-on: ubuntu-latest - steps: - - uses: actions/checkout@v2 - - name: Set up Python 3.8 - uses: actions/setup-python@v2 - with: - python-version: 3.8 - - name: Install dependencies - run: | - python -m pip install --upgrade pip - pip install htruc - - name: Run HTRUC - run: | - htruc test htr-united.yml \ No newline at end of file diff --git a/.github/workflows/chocomufin.yml b/.github/workflows/chocomufin.yml deleted file mode 100644 index 5594e8f..0000000 --- a/.github/workflows/chocomufin.yml +++ /dev/null @@ -1,24 +0,0 @@ -# This workflow will install Python dependencies, run tests and lint with a single version of Python -# For more information see: https://help.github.com/actions/language-and-framework-guides/using-python-with-github-actions - -name: ChocoMufin - -on: [push, pull_request] - -jobs: - test: - runs-on: ubuntu-latest - steps: - - uses: actions/checkout@v2 - - name: Set up Python 3.8 - uses: actions/setup-python@v2 - with: - python-version: 3.8 - - name: Install dependencies - run: | - python -m pip install --upgrade pip - pip install chocomufin==0.0.4 - - name: Run ChocoMufin - run: | - chocomufin generate table.csv ./data/**/*.xml - cat table.csv diff --git a/.github/workflows/htr-united.yml b/.github/workflows/htr-united.yml new file mode 100644 index 0000000..26915fa --- /dev/null +++ b/.github/workflows/htr-united.yml @@ -0,0 +1,95 @@ + + +# This file has been generated automatically with HTR-United <3 Github Actions form +name: HTR United Workflow +'on': + - push + - pull_request +permissions: + contents: write +jobs: + HTRUC: + runs-on: ubuntu-latest + steps: + - uses: actions/checkout@v2 + - name: Set up Python 3.8 + uses: actions/setup-python@v2 + with: + python-version: 3.8 + - name: Install dependencies + run: | + python -m pip install --upgrade pip + pip install htruc + - name: Run HTRUC + run: | + htruc test htr-united.yml + HTR_United_Metadata_Generator: + runs-on: ubuntu-latest + env: + GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }} + steps: + - uses: actions/checkout@v2 + - name: Set up Python 3.8 + uses: actions/setup-python@v2 + with: + python-version: 3.8 + - name: Install dependencies + run: | + python -m pip install --upgrade pip + pip install htr-united-metadata-generator htruc anybadge + - name: Run Report + run: | + humGenerator --chars -n NFD --parse alto --group ./data/**/*.xml --github-envs --to-json updated_metrics.json + cat envs.txt >> $GITHUB_ENV + - name: Get HTR United Badge Template + if: github.ref == 'refs/heads/master' + uses: andymckay/get-gist-action@master + with: + gistURL: https://gist.github.com/PonteIneptique/7813bb99f234b334fbf9c6c429ec2406 + - name: Automatically update the Catalog & the Badges + if: github.ref == 'refs/heads/master' + run: |- + htruc update-volumes htr-united.yml updated_metrics.json --inplace + # Generate badges + mkdir -p badges + anybadge --value=${{ env.HTRUNITED_CHARS }} --file=badges/characters.svg --label=Characters --color=#007ec6 --overwrite --template=${{ steps.get.outputs.file }} + anybadge --value=${{ env.HTRUNITED_REGNS }} --file=badges/regions.svg --label=Regions --color=#007ec6 --overwrite --template=${{ steps.get.outputs.file }} + anybadge --value=${{ env.HTRUNITED_LINES }} --file=badges/lines.svg --label=Lines --color=#007ec6 --overwrite --template=${{ steps.get.outputs.file }} + anybadge --value=${{ env.HTRUNITED_FILES }} --file=badges/files.svg --label="XML Files" --color=#007ec6 --overwrite --template=${{ steps.get.outputs.file }} + git config user.name github-actions + git config user.email github-actions@github.com + git add htr-united.yml ./badges/ + git commit -m "[Automatic] Update the Catalog & the Badges" || echo "Nothing to commit" + git push || echo "Nothing to push" + ChocoMufin: + runs-on: ubuntu-latest + steps: + - uses: actions/checkout@v2 + - name: Set up Python 3.8 + uses: actions/setup-python@v2 + with: + python-version: 3.8 + - name: Install dependencies + run: | + python -m pip install --upgrade pip + pip install chocomufin + - name: Run ChocoMufin + run: | + chocomufin generate table.csv ./data/**/*.xml + cat table.csv + HTRVX: + runs-on: ubuntu-latest + steps: + - uses: actions/checkout@v2 + - name: Set up Python 3.8 + uses: actions/setup-python@v2 + with: + python-version: 3.8 + - name: Install dependencies + run: | + python -m pip install --upgrade pip + pip install htrvx + - name: Run HTRVX + run: | + htrvx --verbose --group --format alto --check-empty --segmonto --xsd ./data/**/*.xml + diff --git a/.github/workflows/htrvx.yml b/.github/workflows/htrvx.yml deleted file mode 100644 index 1a39ece..0000000 --- a/.github/workflows/htrvx.yml +++ /dev/null @@ -1,23 +0,0 @@ -# This workflow will install Python dependencies, run tests and lint with a single version of Python -# For more information see: https://help.github.com/actions/language-and-framework-guides/using-python-with-github-actions - -name: htrvx - -on: [push, pull_request] - -jobs: - test: - runs-on: ubuntu-latest - steps: - - uses: actions/checkout@v2 - - name: Set up Python 3.8 - uses: actions/setup-python@v2 - with: - python-version: 3.8 - - name: Install dependencies - run: | - python -m pip install --upgrade pip - pip install htrvx - - name: Run HTRVX - run: | - htrvx --verbose --group --format alto --segmonto --xsd --check-empty ./data/**/*.xml \ No newline at end of file diff --git a/.github/workflows/humGenerator.yml b/.github/workflows/humGenerator.yml deleted file mode 100644 index 70ca90f..0000000 --- a/.github/workflows/humGenerator.yml +++ /dev/null @@ -1,32 +0,0 @@ -# This workflow will install Python dependencies, run tests and lint with a single version of Python -# For more information see: https://help.github.com/actions/language-and-framework-guides/using-python-with-github-actions - -name: HTR United Report - -on: [push, pull_request] - -jobs: - test: - runs-on: ubuntu-latest - steps: - - uses: actions/checkout@v2 - - name: Set up Python 3.8 - uses: actions/setup-python@v2 - with: - python-version: 3.8 - - name: Install dependencies - run: | - python -m pip install --upgrade pip - pip install htr-united-metadata-generator htruc - - name: Run Report - run: | - humGenerator --group ./data/**/*.xml --github-envs --to-json updated_metrics.json - cat envs.txt >> $GITHUB_ENV - - name: Automatically update the catalog's volume key - run: | - htruc update-volumes htr-united.yml updated_metrics.json --inplace - git config user.name github-actions - git config user.email github-actions@github.com - git add htr-united.yml - git commit -m "[Automatic] Update of the Catalog" || echo "Nothing to commit" - git push \ No newline at end of file -- GitLab From 2290043019f525a2e848997848ac36c760540c14 Mon Sep 17 00:00:00 2001 From: github-actions <github-actions@github.com> Date: Fri, 8 Mar 2024 14:43:41 +0000 Subject: [PATCH 04/11] [Automatic] Update the Catalog & the Badges --- badges/characters.svg | 23 +++++++ badges/files.svg | 23 +++++++ badges/lines.svg | 23 +++++++ badges/regions.svg | 23 +++++++ htr-united.yml | 156 ++++++++++++++++++++++++++++-------------- 5 files changed, 196 insertions(+), 52 deletions(-) create mode 100644 badges/characters.svg create mode 100644 badges/files.svg create mode 100644 badges/lines.svg create mode 100644 badges/regions.svg diff --git a/badges/characters.svg b/badges/characters.svg new file mode 100644 index 0000000..5c415bb --- /dev/null +++ b/badges/characters.svg @@ -0,0 +1,23 @@ +<?xml version="1.0" encoding="UTF-8"?> +<svg xmlns="http://www.w3.org/2000/svg" width="128" height="20"> + <linearGradient id="b" x2="0" y2="100%"> + <stop offset="0" stop-color="#bbb" stop-opacity=".1"/> + <stop offset="1" stop-opacity=".1"/> + </linearGradient> + <mask id="anybadge_1"> + <rect width="128" height="20" rx="3" fill="#fff"/> + </mask> + <g mask="url(#anybadge_1)"> + <path fill="#555" d="M0 0h76v20H0z"/> + <path fill="#007ec6" d="M76 0h52v20H76z"/> + <path fill="url(#b)" d="M0 0h128v20H0z"/> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="39.0" y="15" fill="#010101" fill-opacity=".3">Characters</text> + <text x="38.0" y="14">Characters</text> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="103.0" y="15" fill="#010101" fill-opacity=".3">114289</text> + <text x="102.0" y="14">114289</text> + </g> +</svg> diff --git a/badges/files.svg b/badges/files.svg new file mode 100644 index 0000000..95d06aa --- /dev/null +++ b/badges/files.svg @@ -0,0 +1,23 @@ +<?xml version="1.0" encoding="UTF-8"?> +<svg xmlns="http://www.w3.org/2000/svg" width="91" height="20"> + <linearGradient id="b" x2="0" y2="100%"> + <stop offset="0" stop-color="#bbb" stop-opacity=".1"/> + <stop offset="1" stop-opacity=".1"/> + </linearGradient> + <mask id="anybadge_1"> + <rect width="91" height="20" rx="3" fill="#fff"/> + </mask> + <g mask="url(#anybadge_1)"> + <path fill="#555" d="M0 0h67v20H0z"/> + <path fill="#007ec6" d="M67 0h24v20H67z"/> + <path fill="url(#b)" d="M0 0h91v20H0z"/> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="34.5" y="15" fill="#010101" fill-opacity=".3">XML Files</text> + <text x="33.5" y="14">XML Files</text> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="80.0" y="15" fill="#010101" fill-opacity=".3">71</text> + <text x="79.0" y="14">71</text> + </g> +</svg> diff --git a/badges/lines.svg b/badges/lines.svg new file mode 100644 index 0000000..06e9670 --- /dev/null +++ b/badges/lines.svg @@ -0,0 +1,23 @@ +<?xml version="1.0" encoding="UTF-8"?> +<svg xmlns="http://www.w3.org/2000/svg" width="80" height="20"> + <linearGradient id="b" x2="0" y2="100%"> + <stop offset="0" stop-color="#bbb" stop-opacity=".1"/> + <stop offset="1" stop-opacity=".1"/> + </linearGradient> + <mask id="anybadge_1"> + <rect width="80" height="20" rx="3" fill="#fff"/> + </mask> + <g mask="url(#anybadge_1)"> + <path fill="#555" d="M0 0h42v20H0z"/> + <path fill="#007ec6" d="M42 0h38v20H42z"/> + <path fill="url(#b)" d="M0 0h80v20H0z"/> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="22.0" y="15" fill="#010101" fill-opacity=".3">Lines</text> + <text x="21.0" y="14">Lines</text> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="62.0" y="15" fill="#010101" fill-opacity=".3">3374</text> + <text x="61.0" y="14">3374</text> + </g> +</svg> diff --git a/badges/regions.svg b/badges/regions.svg new file mode 100644 index 0000000..bce99b5 --- /dev/null +++ b/badges/regions.svg @@ -0,0 +1,23 @@ +<?xml version="1.0" encoding="UTF-8"?> +<svg xmlns="http://www.w3.org/2000/svg" width="87" height="20"> + <linearGradient id="b" x2="0" y2="100%"> + <stop offset="0" stop-color="#bbb" stop-opacity=".1"/> + <stop offset="1" stop-opacity=".1"/> + </linearGradient> + <mask id="anybadge_1"> + <rect width="87" height="20" rx="3" fill="#fff"/> + </mask> + <g mask="url(#anybadge_1)"> + <path fill="#555" d="M0 0h56v20H0z"/> + <path fill="#007ec6" d="M56 0h31v20H56z"/> + <path fill="url(#b)" d="M0 0h87v20H0z"/> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="29.0" y="15" fill="#010101" fill-opacity=".3">Regions</text> + <text x="28.0" y="14">Regions</text> + </g> + <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> + <text x="72.5" y="15" fill="#010101" fill-opacity=".3">595</text> + <text x="71.5" y="14">595</text> + </g> +</svg> diff --git a/htr-united.yml b/htr-united.yml index b5ca7f6..0b3805b 100644 --- a/htr-united.yml +++ b/htr-united.yml @@ -1,64 +1,116 @@ -schema: https://htr-united.github.io/schema/2023-06-27/schema.json -title: HTR_CPgr23 -url: https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23 authors: - - name: Maxime - surname: Guénette - orcid: 0009-0006-2076-1220 - roles: - - transcriber - - aligner - - quality-control - - name: Mathilde - surname: Verstraete - orcid: 0000-0003-1642-8610 - roles: - - transcriber - - aligner - - quality-control - - name: Alix - surname: Chagué - orcid: 0000-0002-0136-4434 - roles: - - quality-control - - support - - name: Marcello - surname: Vitali-Rosati - orcid: 0000-0001-6424-3229 - roles: - - project-manager -institutions: [] +- name: Maxime + orcid: 0009-0006-2076-1220 + roles: + - transcriber + - aligner + - quality-control + surname: Guénette +- name: Mathilde + orcid: 0000-0003-1642-8610 + roles: + - transcriber + - aligner + - quality-control + surname: Verstraete +- name: Alix + orcid: 0000-0002-0136-4434 + roles: + - quality-control + - support + surname: Chagué +- name: Marcello + orcid: 0000-0001-6424-3229 + roles: + - project-manager + surname: Vitali-Rosati +automatically-aligned: false +characters: + members: + - α + - ι + - Ì + - ο + - ε + - ν + - σ + - Ï„ + - Ì“ + - Ï… + - Ï + - · + - κ + - λ + - η + - Ì€ + - Ï€ + - μ + - δ + - ω + - Í‚ + - θ + - γ + - Ì” + - χ + - φ + - ':' + - á¾½ + - β + - ⋇ + - â› + - ξ + - '~' + - ̈ + - ζ + - ψ + - ※ + - ∻ + - "'" + - ↑ + - . + - x + - o + mode: NFD description: >- Ground Truth dataset for the Codex palatinus graecus 23 (Palatine Anthology), byzantine writing from the X^th^ century. -project-website: https://anthologiagraeca.org/ -language: - - grc -production-software: eScriptorium + Kraken -automatically-aligned: false -script: - - iso: Grek - qualify: byzantine -script-type: only-manuscript -time: - notBefore: '900' - notAfter: '1000' +format: Alto-XML hands: count: less-than-11 precision: estimated +institutions: [] +language: +- grc license: name: CC-BY 4.0 url: https://creativecommons.org/licenses/by/4.0/ -format: Alto-XML +production-software: eScriptorium + Kraken +project-website: https://anthologiagraeca.org/ +schema: https://htr-united.github.io/schema/2023-06-27/schema.json +script: +- iso: Grek + qualify: byzantine +script-type: only-manuscript sources: - - reference: >- - Cod. Pal. graec. 23 (10e s. av., Constantinople). Universitätsbibliothek - Heidelberg, Germany. - link: https://doi.org/10.11588/diglit.3449 +- link: https://doi.org/10.11588/diglit.3449 + reference: >- + Cod. Pal. graec. 23 (10e s. av., Constantinople). Universitätsbibliothek + Heidelberg, Germany. +time: + notAfter: '1000' + notBefore: '900' +title: HTR_CPgr23 +transcription-guidelines: we do not resolve the abbreviation, except when they are + non ambiguous +url: https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23 volume: - - metric: pages - count: 50 - - metric: lines - count: 2400 -transcription-guidelines: we do not resolve the abbreviation, except when they are non ambiguous - +- count: 114289 + metric: characters +- count: 71 + metric: files +- count: 3374 + metric: lines +- count: 50 + metric: pages +- count: 595 + metric: regions -- GitLab From df617d209be2b01f16ce3f9dc284a77206058804 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 15:46:52 +0100 Subject: [PATCH 05/11] adding a folder for static images --- images/.placeholder | 2 ++ 1 file changed, 2 insertions(+) create mode 100644 images/.placeholder diff --git a/images/.placeholder b/images/.placeholder new file mode 100644 index 0000000..acee568 --- /dev/null +++ b/images/.placeholder @@ -0,0 +1,2 @@ +Add static images here, used to illustrate the README file. For example, image to illustrate the transcription guidelines or to show what the handwriting looks like. +Remove this placeholder when you don't need it anymore! \ No newline at end of file -- GitLab From f6cd0cf87a5dacdd1d95209dbfd318e7a71e9ffa Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 15:50:07 +0100 Subject: [PATCH 06/11] changing location of METS file so that it is not counted in the dataset and minor changes in the specs of chocomufin --- .github/workflows/htr-united.yml | 2 +- data/{CPgr23 => }/METS.xml | 0 2 files changed, 1 insertion(+), 1 deletion(-) rename data/{CPgr23 => }/METS.xml (100%) diff --git a/.github/workflows/htr-united.yml b/.github/workflows/htr-united.yml index 26915fa..8232146 100644 --- a/.github/workflows/htr-united.yml +++ b/.github/workflows/htr-united.yml @@ -75,7 +75,7 @@ jobs: pip install chocomufin - name: Run ChocoMufin run: | - chocomufin generate table.csv ./data/**/*.xml + chocomufin generate ./char_table.csv ./data/**/*.xml cat table.csv HTRVX: runs-on: ubuntu-latest diff --git a/data/CPgr23/METS.xml b/data/METS.xml similarity index 100% rename from data/CPgr23/METS.xml rename to data/METS.xml -- GitLab From 8a07dbf6130d7aa52f8b3d82272bfab9b6fff8ab Mon Sep 17 00:00:00 2001 From: github-actions <github-actions@github.com> Date: Fri, 8 Mar 2024 14:50:51 +0000 Subject: [PATCH 07/11] [Automatic] Update the Catalog & the Badges --- badges/files.svg | 4 ++-- htr-united.yml | 2 +- 2 files changed, 3 insertions(+), 3 deletions(-) diff --git a/badges/files.svg b/badges/files.svg index 95d06aa..3927d81 100644 --- a/badges/files.svg +++ b/badges/files.svg @@ -17,7 +17,7 @@ <text x="33.5" y="14">XML Files</text> </g> <g fill="#fff" text-anchor="middle" font-family="DejaVu Sans,Verdana,Geneva,sans-serif" font-size="11"> - <text x="80.0" y="15" fill="#010101" fill-opacity=".3">71</text> - <text x="79.0" y="14">71</text> + <text x="80.0" y="15" fill="#010101" fill-opacity=".3">70</text> + <text x="79.0" y="14">70</text> </g> </svg> diff --git a/htr-united.yml b/htr-united.yml index 0b3805b..ccbcdc6 100644 --- a/htr-united.yml +++ b/htr-united.yml @@ -106,7 +106,7 @@ url: https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23 volume: - count: 114289 metric: characters -- count: 71 +- count: 70 metric: files - count: 3374 metric: lines -- GitLab From 2b98555e8595e4b7cec34640124d1c38e74e303c Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 15:56:45 +0100 Subject: [PATCH 08/11] fix chocomufin --- .github/workflows/htr-united.yml | 4 +--- 1 file changed, 1 insertion(+), 3 deletions(-) diff --git a/.github/workflows/htr-united.yml b/.github/workflows/htr-united.yml index 8232146..1dd0589 100644 --- a/.github/workflows/htr-united.yml +++ b/.github/workflows/htr-united.yml @@ -1,5 +1,3 @@ - - # This file has been generated automatically with HTR-United <3 Github Actions form name: HTR United Workflow 'on': @@ -76,7 +74,7 @@ jobs: - name: Run ChocoMufin run: | chocomufin generate ./char_table.csv ./data/**/*.xml - cat table.csv + cat ./char_table.csv HTRVX: runs-on: ubuntu-latest steps: -- GitLab From e212dcab0a7caa16cbc2bb9f983160fd5d67504d Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <33317799+alix-tz@users.noreply.github.com> Date: Fri, 8 Mar 2024 16:14:18 +0100 Subject: [PATCH 09/11] fix chocomufin * chocomufin slightly differently set up * added character table in commits --- .github/workflows/htr-united.yml | 18 +-- data/CPgr23/table.csv => table.csv | 178 ++++++++++++++--------------- 2 files changed, 98 insertions(+), 98 deletions(-) rename data/CPgr23/table.csv => table.csv (97%) diff --git a/.github/workflows/htr-united.yml b/.github/workflows/htr-united.yml index 1dd0589..f117638 100644 --- a/.github/workflows/htr-united.yml +++ b/.github/workflows/htr-united.yml @@ -59,7 +59,7 @@ jobs: git add htr-united.yml ./badges/ git commit -m "[Automatic] Update the Catalog & the Badges" || echo "Nothing to commit" git push || echo "Nothing to push" - ChocoMufin: + HTRVX: runs-on: ubuntu-latest steps: - uses: actions/checkout@v2 @@ -70,12 +70,11 @@ jobs: - name: Install dependencies run: | python -m pip install --upgrade pip - pip install chocomufin - - name: Run ChocoMufin + pip install htrvx + - name: Run HTRVX run: | - chocomufin generate ./char_table.csv ./data/**/*.xml - cat ./char_table.csv - HTRVX: + htrvx --verbose --group --format alto --check-empty --segmonto --xsd ./data/**/*.xml + ChocoMufin: runs-on: ubuntu-latest steps: - uses: actions/checkout@v2 @@ -86,8 +85,9 @@ jobs: - name: Install dependencies run: | python -m pip install --upgrade pip - pip install htrvx - - name: Run HTRVX + pip install chocomufin + - name: Run ChocoMufin run: | - htrvx --verbose --group --format alto --check-empty --segmonto --xsd ./data/**/*.xml + chocomufin generate table.csv ./data/**/*.xml + cat table.csv diff --git a/data/CPgr23/table.csv b/table.csv similarity index 97% rename from data/CPgr23/table.csv rename to table.csv index 56b643b..9fe3e97 100644 --- a/data/CPgr23/table.csv +++ b/table.csv @@ -1,112 +1,112 @@ char,name,replacement,codepoint,mufidecode -ἡ,GREEK SMALL LETTER ETA WITH DASIA,,1F21,e -ὤ,GREEK SMALL LETTER OMEGA WITH PSILI AND OXIA,,1F64,o -á¼”,GREEK SMALL LETTER EPSILON WITH PSILI AND OXIA,,1F14,e -ῶ,GREEK SMALL LETTER OMEGA WITH PERISPOMENI,,1FF6,o -á½€,GREEK SMALL LETTER OMICRON WITH PSILI,,1F40,o +á½”,GREEK SMALL LETTER UPSILON WITH PSILI AND OXIA,,1F54,u +ή,GREEK SMALL LETTER ETA WITH TONOS,,03AE,e +á¼³,GREEK SMALL LETTER IOTA WITH DASIA AND VARIA,,1F33,i ὓ,GREEK SMALL LETTER UPSILON WITH DASIA AND VARIA,,1F53,u +â›,FOUR DOT MARK,,205B,[UNKNOWN] Ï„,GREEK SMALL LETTER TAU,,03C4,t -κ,GREEK SMALL LETTER KAPPA,,03BA,k -ὕ,GREEK SMALL LETTER UPSILON WITH DASIA AND OXIA,,1F55,u +⋇,DIVISION TIMES,,22C7,[UNKNOWN] +ἕ,GREEK SMALL LETTER EPSILON WITH DASIA AND OXIA,,1F15,e +ὺ,GREEK SMALL LETTER UPSILON WITH VARIA,,1F7A,u +ζ,GREEK SMALL LETTER ZETA,,03B6,z +ν,GREEK SMALL LETTER NU,,03BD,n +ἆ,GREEK SMALL LETTER ALPHA WITH PSILI AND PERISPOMENI,,1F06,a +ÏŽ,GREEK SMALL LETTER OMEGA WITH TONOS,,03CE,o +á¼£,GREEK SMALL LETTER ETA WITH DASIA AND VARIA,,1F23,e +á½,GREEK SMALL LETTER UPSILON WITH PSILI,,1F50,u +á¼¢,GREEK SMALL LETTER ETA WITH PSILI AND VARIA,,1F22,e +ἄ,GREEK SMALL LETTER ALPHA WITH PSILI AND OXIA,,1F04,a +ἂ,GREEK SMALL LETTER ALPHA WITH PSILI AND VARIA,,1F02,a +Î,GREEK SMALL LETTER EPSILON WITH TONOS,,03AD,e +á½€,GREEK SMALL LETTER OMICRON WITH PSILI,,1F40,o +ὶ,GREEK SMALL LETTER IOTA WITH VARIA,,1F76,i Î,GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS,,0390,I -.,FULL STOP,,002E,. -:,COLON,,003A,: -á½¥,GREEK SMALL LETTER OMEGA WITH DASIA AND OXIA,,1F65,o -á¼µ,GREEK SMALL LETTER IOTA WITH DASIA AND OXIA,,1F35,i -á½,GREEK SMALL LETTER OMICRON WITH DASIA,,1F41,o -ι,GREEK SMALL LETTER IOTA,,03B9,i +á½´,GREEK SMALL LETTER ETA WITH VARIA,,1F74,e x,LATIN SMALL LETTER X,,0078,x -â›,FOUR DOT MARK,,205B,[UNKNOWN] -ὺ,GREEK SMALL LETTER UPSILON WITH VARIA,,1F7A,u -Ï‹,GREEK SMALL LETTER UPSILON WITH DIALYTIKA,,03CB,u +:,COLON,,003A,: +α,GREEK SMALL LETTER ALPHA,,03B1,a +á¾½,GREEK KORONIS,,1FBD,' ῦ,GREEK SMALL LETTER UPSILON WITH PERISPOMENI,,1FE6,u -γ,GREEK SMALL LETTER GAMMA,,03B3,g -Ï…,GREEK SMALL LETTER UPSILON,,03C5,u -ή,GREEK SMALL LETTER ETA WITH TONOS,,03AE,e -∻,HOMOTHETIC,,223B, +↑,UPWARDS ARROW,,2191,| á¼±,GREEK SMALL LETTER IOTA WITH DASIA,,1F31,i -η,GREEK SMALL LETTER ETA,,03B7,e -Ï€,GREEK SMALL LETTER PI,,03C0,p -á½´,GREEK SMALL LETTER ETA WITH VARIA,,1F74,e -φ,GREEK SMALL LETTER PHI,,03C6,ph -ὶ,GREEK SMALL LETTER IOTA WITH VARIA,,1F76,i -á¿“,GREEK SMALL LETTER IOTA WITH DIALYTIKA AND OXIA,,1FD3,i -á¼²,GREEK SMALL LETTER IOTA WITH PSILI AND VARIA,,1F32,i -á½¼,GREEK SMALL LETTER OMEGA WITH VARIA,,1F7C,o -á¼…,GREEK SMALL LETTER ALPHA WITH DASIA AND OXIA,,1F05,a -ο,GREEK SMALL LETTER OMICRON,,03BF,o -※,REFERENCE MARK,,203B, +ἧ,GREEK SMALL LETTER ETA WITH DASIA AND PERISPOMENI,,1F27,e +Ï…,GREEK SMALL LETTER UPSILON,,03C5,u á¼°,GREEK SMALL LETTER IOTA WITH PSILI,,1F30,i -á¼,GREEK SMALL LETTER EPSILON WITH PSILI,,1F10,e -ò,LATIN SMALL LETTER O WITH GRAVE,,00F2,o -ψ,GREEK SMALL LETTER PSI,,03C8,ps -á¿–,GREEK SMALL LETTER IOTA WITH PERISPOMENI,,1FD6,i -↑,UPWARDS ARROW,,2191,| ε,GREEK SMALL LETTER EPSILON,,03B5,e +ο,GREEK SMALL LETTER OMICRON,,03BF,o +á¼,GREEK SMALL LETTER EPSILON WITH PSILI,,1F10,e +ἡ,GREEK SMALL LETTER ETA WITH DASIA,,1F21,e +ÏŒ,GREEK SMALL LETTER OMICRON WITH TONOS,,03CC,o ὃ,GREEK SMALL LETTER OMICRON WITH DASIA AND VARIA,,1F43,o -ᾶ,GREEK SMALL LETTER ALPHA WITH PERISPOMENI,,1FB6,a -ξ,GREEK SMALL LETTER XI,,03BE,x -~,TILDE,,007E,~ -á½²,GREEK SMALL LETTER EPSILON WITH VARIA,,1F72,e +ἦ,GREEK SMALL LETTER ETA WITH PSILI AND PERISPOMENI,,1F26,e +Ï‹,GREEK SMALL LETTER UPSILON WITH DIALYTIKA,,03CB,u +η,GREEK SMALL LETTER ETA,,03B7,e +á½°,GREEK SMALL LETTER ALPHA WITH VARIA,,1F70,a +ἤ,GREEK SMALL LETTER ETA WITH PSILI AND OXIA,,1F24,e +Ï,GREEK SMALL LETTER UPSILON WITH TONOS,,03CD,u +χ,GREEK SMALL LETTER CHI,,03C7,kh +β,GREEK SMALL LETTER BETA,,03B2,b +λ,GREEK SMALL LETTER LAMDA,,03BB,l +∻,HOMOTHETIC,,223B, +ἃ,GREEK SMALL LETTER ALPHA WITH DASIA AND VARIA,,1F03,a ά,GREEK SMALL LETTER ALPHA WITH TONOS,,03AC,a -ὦ,GREEK SMALL LETTER OMEGA WITH PSILI AND PERISPOMENI,,1F66,o -Î,GREEK SMALL LETTER EPSILON WITH TONOS,,03AD,e -ν,GREEK SMALL LETTER NU,,03BD,n -á½”,GREEK SMALL LETTER UPSILON WITH PSILI AND OXIA,,1F54,u -Ï,GREEK SMALL LETTER RHO,,03C1,r +ὕ,GREEK SMALL LETTER UPSILON WITH DASIA AND OXIA,,1F55,u +á½¼,GREEK SMALL LETTER OMEGA WITH VARIA,,1F7C,o +á¼”,GREEK SMALL LETTER EPSILON WITH PSILI AND OXIA,,1F14,e +θ,GREEK SMALL LETTER THETA,,03B8,th +μ,GREEK SMALL LETTER MU,,03BC,m +ὸ,GREEK SMALL LETTER OMICRON WITH VARIA,,1F78,o ὑ,GREEK SMALL LETTER UPSILON WITH DASIA,,1F51,u -ÏŠ,GREEK SMALL LETTER IOTA WITH DIALYTIKA,,03CA,i -ζ,GREEK SMALL LETTER ZETA,,03B6,z -á½°,GREEK SMALL LETTER ALPHA WITH VARIA,,1F70,a -ὧ,GREEK SMALL LETTER OMEGA WITH DASIA AND PERISPOMENI,,1F67,o -ἆ,GREEK SMALL LETTER ALPHA WITH PSILI AND PERISPOMENI,,1F06,a -á¼€,GREEK SMALL LETTER ALPHA WITH PSILI,,1F00,a -á¿’,GREEK SMALL LETTER IOTA WITH DIALYTIKA AND VARIA,,1FD2,i á¼ ,GREEK SMALL LETTER ETA WITH PSILI,,1F20,e -á¼¥,GREEK SMALL LETTER ETA WITH DASIA AND OXIA,,1F25,e +á¼´,GREEK SMALL LETTER IOTA WITH PSILI AND OXIA,,1F34,i +á½²,GREEK SMALL LETTER EPSILON WITH VARIA,,1F72,e +á½…,GREEK SMALL LETTER OMICRON WITH DASIA AND OXIA,,1F45,o á¼,GREEK SMALL LETTER ALPHA WITH DASIA,,1F01,a -ὄ,GREEK SMALL LETTER OMICRON WITH PSILI AND OXIA,,1F44,o -ἑ,GREEK SMALL LETTER EPSILON WITH DASIA,,1F11,e +á¼€,GREEK SMALL LETTER ALPHA WITH PSILI,,1F00,a +ὤ,GREEK SMALL LETTER OMEGA WITH PSILI AND OXIA,,1F64,o ί,GREEK SMALL LETTER IOTA WITH TONOS,,03AF,i -ἧ,GREEK SMALL LETTER ETA WITH DASIA AND PERISPOMENI,,1F27,e -á½…,GREEK SMALL LETTER OMICRON WITH DASIA AND OXIA,,1F45,o -ἃ,GREEK SMALL LETTER ALPHA WITH DASIA AND VARIA,,1F03,a -á½ ,GREEK SMALL LETTER OMEGA WITH PSILI,,1F60,o -á½—,GREEK SMALL LETTER UPSILON WITH DASIA AND PERISPOMENI,,1F57,u -á¼³,GREEK SMALL LETTER IOTA WITH DASIA AND VARIA,,1F33,i -á¼¢,GREEK SMALL LETTER ETA WITH PSILI AND VARIA,,1F22,e -ἂ,GREEK SMALL LETTER ALPHA WITH PSILI AND VARIA,,1F02,a -λ,GREEK SMALL LETTER LAMDA,,03BB,l -',APOSTROPHE,,0027,' +ψ,GREEK SMALL LETTER PSI,,03C8,ps +ÏŠ,GREEK SMALL LETTER IOTA WITH DIALYTIKA,,03CA,i ω,GREEK SMALL LETTER OMEGA,,03C9,o -β,GREEK SMALL LETTER BETA,,03B2,b +κ,GREEK SMALL LETTER KAPPA,,03BA,k +ὦ,GREEK SMALL LETTER OMEGA WITH PSILI AND PERISPOMENI,,1F66,o +á¼¥,GREEK SMALL LETTER ETA WITH DASIA AND OXIA,,1F25,e +Ï,GREEK SMALL LETTER RHO,,03C1,r +á½,GREEK SMALL LETTER OMICRON WITH DASIA,,1F41,o á¿£,GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND OXIA,,1FE3,u -ÏŽ,GREEK SMALL LETTER OMEGA WITH TONOS,,03CE,o -á¿¥,GREEK SMALL LETTER RHO WITH DASIA,,1FE5,R -χ,GREEK SMALL LETTER CHI,,03C7,kh -ἄ,GREEK SMALL LETTER ALPHA WITH PSILI AND OXIA,,1F04,a +',APOSTROPHE,,0027,' +ὄ,GREEK SMALL LETTER OMICRON WITH PSILI AND OXIA,,1F44,o +á½ ,GREEK SMALL LETTER OMEGA WITH PSILI,,1F60,o +γ,GREEK SMALL LETTER GAMMA,,03B3,g +ι,GREEK SMALL LETTER IOTA,,03B9,i +ἑ,GREEK SMALL LETTER EPSILON WITH DASIA,,1F11,e +·,MIDDLE DOT,,00B7, +á¼²,GREEK SMALL LETTER IOTA WITH PSILI AND VARIA,,1F32,i +Ï€,GREEK SMALL LETTER PI,,03C0,p +á¿’,GREEK SMALL LETTER IOTA WITH DIALYTIKA AND VARIA,,1FD2,i +ὧ,GREEK SMALL LETTER OMEGA WITH DASIA AND PERISPOMENI,,1F67,o ἶ,GREEK SMALL LETTER IOTA WITH PSILI AND PERISPOMENI,,1F36,i -ὡ,GREEK SMALL LETTER OMEGA WITH DASIA,,1F61,o -ἤ,GREEK SMALL LETTER ETA WITH PSILI AND OXIA,,1F24,e +á½—,GREEK SMALL LETTER UPSILON WITH DASIA AND PERISPOMENI,,1F57,u +ᾶ,GREEK SMALL LETTER ALPHA WITH PERISPOMENI,,1FB6,a á¿¢,GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND VARIA,,1FE2,u -⋇,DIVISION TIMES,,22C7,[UNKNOWN] +ἇ,GREEK SMALL LETTER ALPHA WITH DASIA AND PERISPOMENI,,1F07,a +※,REFERENCE MARK,,203B, á¼·,GREEK SMALL LETTER IOTA WITH DASIA AND PERISPOMENI,,1F37,i -·,MIDDLE DOT,,00B7, -á¾½,GREEK KORONIS,,1FBD,' -α,GREEK SMALL LETTER ALPHA,,03B1,a -á½–,GREEK SMALL LETTER UPSILON WITH PSILI AND PERISPOMENI,,1F56,u +ò,LATIN SMALL LETTER O WITH GRAVE,,00F2,o +~,TILDE,,007E,~ ΰ,GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS,,03B0,u -δ,GREEK SMALL LETTER DELTA,,03B4,d -ἦ,GREEK SMALL LETTER ETA WITH PSILI AND PERISPOMENI,,1F26,e -θ,GREEK SMALL LETTER THETA,,03B8,th -á¼´,GREEK SMALL LETTER IOTA WITH PSILI AND OXIA,,1F34,i -μ,GREEK SMALL LETTER MU,,03BC,m -á½,GREEK SMALL LETTER UPSILON WITH PSILI,,1F50,u +φ,GREEK SMALL LETTER PHI,,03C6,ph σ,GREEK SMALL LETTER SIGMA,,03C3,s -ὸ,GREEK SMALL LETTER OMICRON WITH VARIA,,1F78,o -ἕ,GREEK SMALL LETTER EPSILON WITH DASIA AND OXIA,,1F15,e -Ï,GREEK SMALL LETTER UPSILON WITH TONOS,,03CD,u ῆ,GREEK SMALL LETTER ETA WITH PERISPOMENI,,1FC6,e -á¼£,GREEK SMALL LETTER ETA WITH DASIA AND VARIA,,1F23,e -ÏŒ,GREEK SMALL LETTER OMICRON WITH TONOS,,03CC,o -ἇ,GREEK SMALL LETTER ALPHA WITH DASIA AND PERISPOMENI,,1F07,a +á¿“,GREEK SMALL LETTER IOTA WITH DIALYTIKA AND OXIA,,1FD3,i +á¿¥,GREEK SMALL LETTER RHO WITH DASIA,,1FE5,R +δ,GREEK SMALL LETTER DELTA,,03B4,d +ξ,GREEK SMALL LETTER XI,,03BE,x +á¿–,GREEK SMALL LETTER IOTA WITH PERISPOMENI,,1FD6,i +á½–,GREEK SMALL LETTER UPSILON WITH PSILI AND PERISPOMENI,,1F56,u +á¼…,GREEK SMALL LETTER ALPHA WITH DASIA AND OXIA,,1F05,a +á¼µ,GREEK SMALL LETTER IOTA WITH DASIA AND OXIA,,1F35,i +ῶ,GREEK SMALL LETTER OMEGA WITH PERISPOMENI,,1FF6,o +.,FULL STOP,,002E,. +á½¥,GREEK SMALL LETTER OMEGA WITH DASIA AND OXIA,,1F65,o +ὡ,GREEK SMALL LETTER OMEGA WITH DASIA,,1F61,o -- GitLab From ad6e5a29ecd2baf8acde2f44d6ee5fe3cc8e1f91 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 16:43:21 +0100 Subject: [PATCH 10/11] adding a CITATION file --- CITATION.cff | 32 ++++++++++++++++++++++++++++++++ 1 file changed, 32 insertions(+) create mode 100644 CITATION.cff diff --git a/CITATION.cff b/CITATION.cff new file mode 100644 index 0000000..2740bb3 --- /dev/null +++ b/CITATION.cff @@ -0,0 +1,32 @@ +# This CITATION.cff file was generated with cffinit. +# Visit https://bit.ly/cffinit to generate yours today! + +cff-version: 1.2.0 +title: >- + Codex palatinus graecus 23 - Ground Truth Dataset Medieval + Greek Manuscripts +message: >- + If you use this dataset, please cite it using the metadata + from this file. +type: dataset +authors: + - given-names: Maxime + family-names: Guénette + orcid: 'https://orcid.org/0009-0006-2076-1220' + - given-names: Mathilde + family-names: Verstraete + orcid: 'https://orcid.org/0000-0003-1642-8610' + - given-names: Alix + family-names: Chagué + orcid: 'https://orcid.org/0000-0002-0136-4434' + - given-names: Marcello + family-names: Vitali-Rosati + orcid: 'https://orcid.org/0000-0001-6424-3229' +repository-code: 'https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23' +keywords: + - HTR + - ground-truth + - greek + - medieval manuscript + - palatine anthology +license: CC-BY-4.0 -- GitLab From 8ad61fdf97a31902be46084f19d55e0b933bd124 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Alix=20Chagu=C3=A9?= <alix.chague@inria.fr> Date: Fri, 8 Mar 2024 16:46:07 +0100 Subject: [PATCH 11/11] adding dataset citation in readme --- README.md | 12 ++++++++++-- 1 file changed, 10 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index 31f3358..5c5d526 100644 --- a/README.md +++ b/README.md @@ -49,7 +49,15 @@ This dataset was built and is maintained by Maxime Guénette (@mguenette), Mathi ### Cite the Dataset -<!-- add Bibtex citation for the dataset--> +> Guénette, M., Verstraete, M., Chagué, A., & Vitali-Rosati, M. Codex palatinus graecus 23 - Ground Truth Dataset Medieval Greek Manuscripts [Data set]. https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23 + +``` +@misc{Guenette_Codex_palatinus_graecus, +author = {Guénette, Maxime and Verstraete, Mathilde and Chagué, Alix and Vitali-Rosati, Marcello}, +title = {{Codex palatinus graecus 23 - Ground Truth Dataset Medieval Greek Manuscripts}}, +url = {https://gitlab.huma-num.fr/ecrinum/anthologia/htr_cpgr23} +} +``` ### Cite the Project @@ -61,4 +69,4 @@ This dataset was built and is maintained by Maxime Guénette (@mguenette), Mathi ## Infrastructure -This project relied on the [CREMMA](https://cremmacall.sciencescall.org/) infrastructure. \ No newline at end of file +This dataset project relied on the [CREMMA](https://cremmacall.sciencescall.org/) infrastructure. \ No newline at end of file -- GitLab