KF: Corpus Mariage pour tous: Import or Sub-corpus
From KF:
Problem with 'mariage pour tous' corpus.
import > XML TEI TXM > sous-corpus impossible mais pas de bug évident
import > XML /w + CSV > sous-corpus possible
testé sur corpus MPT (mariage pour tous)
In ‘Mariage pour tous’ corpus web site (Nicolas Legrand): https://github.com/nlegrand/mariagepourtousInXML
We find two corpora:
- MPT_2013-03-20, TXM source corpus to import: http://perso.obspm.fr/nicolas.legrand/MPT_2013-03-20.zip
- MPT-TXM_2013-03-20, TXM binary corpus to load: http://perso.obspm.fr/nicolas.legrand/MPT-TXM_2013-03-20.zip
Diagnostic 1
Test with binary version:
- File / Load MPT-TXM_2013-03-20 ->new ‘MPT’ corpus
- Sub-corpus structure=metadata, property=debat, value=mpt ->new sub-corpus
- Lexicon on sub-corpus working ->‘24730 items pour 946286 occurrences.’
Conclusion 1
Impossible to reproduce the problem.
Diagnostic 2
Test with source version:
- File / Import / XML/w+CSV MPT ->new ‘MPTSRC’ corpus
- Sub-corpus structure=metadata, property=debat, value=mpt ->new sub-corpus
- Lexicon on sub-corpus working ->‘24730 items pour 946286 occurrences.’
Conclusion 2
Impossible to reproduce the problem.
Diagnostic 3
Test with binary version on Windows 7 64-bit:
Load command should abort with the following error (FR), [from AD]:
Échec de l'extraction du corpus binaire : java.io.FileNotFoundException: ...\TXM\corpora\mpt\data\MPT\metadata_debat.avs (L’opération demandée n’a pu s’accomplir sur un fichier ayant une section mappée utilisateur ouverte)
Conclusion 3
(from redmine: issue id 1049, created on 2014/10/09 by Serge Heiden)