Étudier la possibilité de formuler une définition formelle (computationnelle, algorithmique) – d’un concept littéraire :
Étudier la possibilité de formuler une définition formelle (computationnelle, algorithmique) – d’un concept littéraire :
- Appliquer des algorithmes de fouille de données et de traitement automatique du langage afin de définir formellement un concept littéraire ([la variation]{.alert}) au sein d’un corpus donné ([l’Anthologie grecque]{.alert}) ;
- Appliquer des algorithmes de fouille de données et de traitement automatique du langage afin de définir formellement un concept littéraire ([la variation]{.alert}) au sein d’un corpus donné ([l’Anthologie grecque]{.alert}) ;
- Si l’algorithme est capable de retrouver les variations précédemment relevées, c’est qu’il incarne la définition dudit concept ;
- Si l’algorithme est capable de retrouver les variations précédemment relevées, c’est qu’il incarne la définition dudit concept.
::: {.callout-note icon=false}
::: {.callout-note icon=false}
...
@@ -107,6 +107,8 @@ Livre VI :
...
@@ -107,6 +107,8 @@ Livre VI :
- Réduit le temps de computation ;
- Réduit le temps de computation ;
- Sert de preuve de concept qui sera ensuite étendu à l’ensemble des épigrammes.
- Sert de preuve de concept qui sera ensuite étendu à l’ensemble des épigrammes.
Waltz, 1931
:::
:::
# Le projet d'édition numérique collaborative de l'*Anthologie grecque*
# Le projet d'édition numérique collaborative de l'*Anthologie grecque*
...
@@ -139,6 +141,13 @@ De ce projet éditorial découle un corpus complet et hautement structuré : un
...
@@ -139,6 +141,13 @@ De ce projet éditorial découle un corpus complet et hautement structuré : un
<!--
<!--
@math: nombre de formes (mots uniques), d'occurence (taille du corpus), taille moyenne des épigrammes
@math: nombre de formes (mots uniques), d'occurence (taille du corpus), taille moyenne des épigrammes
4134 épigrammes,
En grec, 139731 mots et 989693 caractères, en moyenne 33 mots et 234 caractères
En français (sachant qu'un texte peut avoir plusieurs traductions françaises), 157244 mots et 828307 caractères, en moyenne 54 mots et 287 caractères