import, impossible to tokenize words written with point (.) characters inside

added import type::bug + 1 deleted label

changed milestone to %TXM 0.8.4

The import parameters were re-initialized.

(from redmine: written on 2023/05/17 by Matthieu Decorde)

Index result when removing “.” from the tokenizer import parameters

word   Fréquence
‘   3
nḫ-mst.pl   2
ḥm  1
Ḫpr-kȝ-R    1
ḫr  1
Ḥrw 1
nb.tỉ   1
nỉ  1
nswt-bỉtỉ   1

Edition rendering :

ḫr ḥm nỉ Ḥrw ‘ nḫ-mst.pl nb.tỉ ‘ nḫ-mst.pl nswt-bỉtỉ Ḫpr-kȝ-R ‘

(from redmine: written on 2023/05/17 by Matthieu Decorde)

Correct token parameters usage has been verified on the test text sample (for ‘accented characters’ and ‘sentence end characters’).

(from redmine: written on 2023/05/22 by Serge Heiden)

closed

assigned to @mdecorde

Designs