Explore projects
-
Détecter des doublons au sein d’un corpus d’images
Updated -
Entraîner un modèle de détection de mise en page de documents grâce à l’outil Layout Parser
Updated -
Statistiques sur les images contenues dans un ou plusieurs documents Gallica
Updated -
Outils de textométrie utilisables sur un corpus de textes en format structuré
Updated -
Calculer des informations lexicométriques d’une liste de termes au sein d’un corpus
Updated -
-
Détecter et extraire des illustrations dans les documents Gallica
Updated -
Détecter et extraire des objets présents dans les images d’un corpus
Updated -
Segmentation des blocs de texte
Updated -
Updated
-
-
-
-
UpdatedUpdated
-
Analyse des structures d'urls pour filtrer des volumes importants de permaliens
Updated -
Matthieu Decorde / txm-manual
Creative Commons Zero v1.0 UniversalTXM User's Manual writing and online hosting
Updated -
BnF DataLab / Gallica / Visualisation métadonnées presse - notebook présentation
Etalab Open License 2.0Notebook quarto de médiation autour de la numérisation du quotidien La Croix dans Gallica
Updated