diff --git a/PRODUCTION/2024_Acfas/2024_Acfas_v01.html b/PRODUCTION/2024_Acfas/2024_Acfas_v01.html index 03729442bb70a60c20d789cb21c182891f33fa5b..77a74381ca2536739dbb6bfd5274ed3093cd7c0c 100644 --- a/PRODUCTION/2024_Acfas/2024_Acfas_v01.html +++ b/PRODUCTION/2024_Acfas/2024_Acfas_v01.html @@ -404,23 +404,16 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <section id="projet-intelligence-artificielle-littéraire" class="title-slide slide level1 center" data-number="1"> <h1><span class="header-section-number">1</span> Projet Intelligence artificielle littéraire</h1> <ul> -<li>Un projet de la Chaire de recherche du Canada sur les Écritures numériques~;</li> -<li>Financement du Conseil de Recherche en Sciences Humaines du Canada~;</li> +<li>Un projet de la Chaire de recherche du Canada sur les Écritures numériques ;</li> +<li>Financement du Conseil de Recherche en Sciences Humaines du Canada ;</li> <li>Équipe multidisciplinaire : <ul> -<li>Yann Audin~;</li> -<li>Mathilde Verstraete~;</li> -<li>Marcello Vitali-Rosati~;</li> +<li>Yann Audin ;</li> +<li>Mathilde Verstraete ;</li> +<li>Marcello Vitali-Rosati ;</li> <li>Dominic Forest.</li> </ul></li> </ul> -<div class="callout callout-note no-icon callout-style-simple"> -<div class="callout-body"> -<div class="callout-content"> -<p>Basé sur la plateforme <a href="https://anthologiagraeca.org/">Anthologia graeca</a></p> -</div> -</div> -</div> <div class="quarto-figure quarto-figure-center"> <figure> <p><img data-src="images/logo/all3.jpg" class="quarto-figure quarto-figure-center" height="150"></p> @@ -431,8 +424,8 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <h2><span class="header-section-number">1.1</span> Objectifs du projet</h2> <p>Étudier la possibilité de formuler une définition formelle (computationnelle, algorithmique) – d’un concept littéraire :</p> <ul> -<li>Appliquer des algorithmes de fouille de données et de traitement automatique du langage afin de définir formellement un concept littéraire (<span class="alert">la variation</span>) au sein d’un corpus donné (<span class="alert">l’Anthologie grecque</span>)~;</li> -<li>Si l’algorithme est capable de retrouver les variations précédemment relevées, c’est qu’il incarne la définition dudit concept~;</li> +<li>Appliquer des algorithmes de fouille de données et de traitement automatique du langage afin de définir formellement un concept littéraire (<span class="alert">la variation</span>) au sein d’un corpus donné (<span class="alert">l’Anthologie grecque</span>) ;</li> +<li>Si l’algorithme est capable de retrouver les variations précédemment relevées, c’est qu’il incarne la définition dudit concept ;</li> </ul> <div class="callout callout-note no-icon callout-titled callout-style-default"> <div class="callout-body"> @@ -464,7 +457,7 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <section> <section id="corpus-lanthologie-grecque-ag" class="title-slide slide level1 center scrollable" data-number="2"> <h1><span class="header-section-number">2</span> Corpus : l’<em>Anthologie grecque</em> (AG)</h1> -<p>L’AG regroupe la poésie épigrammatique grecque antique de la période classique à byzantine, soit 15 siècles d’épigrammatique~;</p> +<p>L’AG regroupe la poésie épigrammatique grecque antique de la période classique à byzantine, soit 15 siècles d’épigrammatique ;</p> <p>Composé de l’<em>Anthologie palatine</em><sup>1</sup> et de l’<em>Appendix Planudea</em><sup>2</sup>, ces recueils sont eux-mêmes issus de compilations successives des épigrammes.</p> <aside><ol class="aside-footnotes"><li id="fn1"><p>Heidelbergensis Palatinus graecus 23, X<sup>e</sup> s.</p></li><li id="fn2"><p>Marcianus gr. 481, 1299</p></li></ol></aside></section> <section id="la-plateforme-du-projet-dédition-numérique-collaborative-de-lanthologie-grecque" class="slide level2" data-number="2.1"> @@ -479,11 +472,11 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <p><a href="https://anthologiagraeca.org/api/" class="uri">https://anthologiagraeca.org/api/</a>.</p> <p>Une base de données en JSON hautement structurée pour les 4 134 épigrammes et 311 auteurs de l’<em>Anthologie grecque</em> :</p> <ul> -<li>Textes~;</li> -<li>Traductions~;</li> -<li>Images des manuscrits~;</li> -<li>Commentaires~;</li> -<li>Métadonnées~;</li> +<li>Textes ;</li> +<li>Traductions ;</li> +<li>Images des manuscrits ;</li> +<li>Commentaires ;</li> +<li>Métadonnées ;</li> <li>…</li> </ul> <aside class="notes"> @@ -504,8 +497,8 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <h2><span class="header-section-number">2.3</span> Sous-corpus étudié actuellement</h2> <p>Nous concentrons nos efforts sur le Livre IV (358 épigrammes votives) en traduction française (Waltz, les Belles Lettres).</p> <ul> -<li>Variations nombreuses et bien annotées~;</li> -<li>Réduit le temps de computation~;</li> +<li>Variations nombreuses et bien annotées ;</li> +<li>Réduit le temps de computation ;</li> <li>Sert de preuve de concept qui sera ensuite étendu à l’ensemble des épigrammes.</li> </ul> <!-- @@ -519,7 +512,7 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu <div class="column" style="width:36%;"> <p><span class="alert">Stylistique</span> : Concerne les mots et leur agencement, introduisant de multiples mais infimes modifications par quelques éléments déplacés ou par des substitutions d’ordre lexical ou stylistique</p> </div><div class="column" style="width:32%;"> -<p><span class="alert">Rhétorique</span> : Porte sur la forme générale des épigrammes~; l’impression est celle d’une multiplication à l’infini des possibilités d’expression d’une même idée</p> +<p><span class="alert">Rhétorique</span> : Porte sur la forme générale des épigrammes ; l’impression est celle d’une multiplication à l’infini des possibilités d’expression d’une même idée</p> </div><div class="column" style="width:32%;"> <p><span class="alert">Paradigmatique</span> : Conserve la structure de l’épigramme, mais en fait varier le sujet même, lequel est considéré comme une variable parmi d’autres</p> </div> @@ -636,7 +629,7 @@ Marcello Vitali-Rosati <a href="https://orcid.org/0000-0001-6424-3229" class="qu }</style></aside> <!-- @Dominic, je réalise que je ne sais pas quelle vision tu avais en tête, je serai heureux d'avoir du feedback ou un exemple au niveau du style! --> <!-- Plein, ce sont nos données selon les annotations, les lignes, ce sont si oui ou non ce sont des variations. La moyenne pondérée des trois lignes, c'est la zone verte. La ligne bleue a + de poids, c'est parce qu'il y a plus de variations stylistiques. -Le schéma démontre qu'il y a une faible similarité dans les non variations~; le petit creu rouge : à droite du petit creu, au moins un mot en commun~; les variations stylistiques doivent avoir plusieurs mots en commun pour être considérées comme variation. +Le schéma démontre qu'il y a une faible similarité dans les non variations ; le petit creu rouge : à droite du petit creu, au moins un mot en commun ; les variations stylistiques doivent avoir plusieurs mots en commun pour être considérées comme variation. Attention, les erreurs sont pas dans ce graphique. Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à savoir quand la ligne verte est la plus loin possible de la ligne rouge et/ou quand la ligne bleue était le plus à droite et la rouge le plus à gauche (+ si grosse différence entre les deux, discrimination plus haute) --> </section> @@ -644,18 +637,18 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <h2><span class="header-section-number">4.1</span> Nettoyage et normalisation</h2> <p><span class="alert">48 combinaisons considérées</span></p> <ul> -<li><p>Avec ou sans l’application d’un anti-dictionnaire~;</p></li> -<li><p>Avec ou sans la normalisation de la casse~;</p></li> -<li><p>Avec ou sans la suppression de la ponctuation~;</p></li> -<li><p>Avec ou sans la suppression de l’accentuation~;</p></li> +<li><p>Avec ou sans l’application d’un anti-dictionnaire ;</p></li> +<li><p>Avec ou sans la normalisation de la casse ;</p></li> +<li><p>Avec ou sans la suppression de la ponctuation ;</p></li> +<li><p>Avec ou sans la suppression de l’accentuation ;</p></li> <li><p>Avec ou sans traitement supplémentaire :</p> <ul> -<li>Racinisation~;</li> +<li>Racinisation ;</li> <li>Lemmatisation.</li> </ul></li> </ul> <aside class="notes"> -<p>Pour chaque épigramme, on a effectué tous les nettoyages possibles~; chaque extrait a été nettoyé de 48 façons différentes</p> +<p>Pour chaque épigramme, on a effectué tous les nettoyages possibles ; chaque extrait a été nettoyé de 48 façons différentes</p> <style type="text/css"> span.MJX_Assistive_MathML { position:absolute!important; @@ -672,9 +665,9 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <h2><span class="header-section-number">4.2</span> Représentations numériques</h2> <p><span class="alert">4 représentations considérées</span></p> <ul> -<li>Sac de mots (binaire)~;</li> -<li>Sac de mots (pondéré tf-idf)~;</li> -<li>Ensembles de bi-grammes~;</li> +<li>Sac de mots (binaire) ;</li> +<li>Sac de mots (pondéré tf-idf) ;</li> +<li>Ensembles de bi-grammes ;</li> <li>Liste des formes en tenant compte de leur ordre d’apparition.</li> </ul> <aside class="notes"> @@ -685,7 +678,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <li>Ensembles de bi-grammes: liste de chaque co-occurrence de 2 mots dans une épigramme</li> <li>Liste des formes en tenant compte de leur ordre d’apparition</li> </ul> -<p>4 représentations pour chacune des 48 représentations de chaque épigramme~; on peut alors commencer à regarder quelles combinaisons sont les plus efficaces.</p> +<p>4 représentations pour chacune des 48 représentations de chaque épigramme ; on peut alors commencer à regarder quelles combinaisons sont les plus efficaces.</p> <style type="text/css"> span.MJX_Assistive_MathML { position:absolute!important; @@ -705,13 +698,13 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <ul> <li>Similarité cosinus : <ul> -<li>Sac de mots (binaire)~;</li> -<li>Sac de mots (pondéré tf-idf)~;</li> +<li>Sac de mots (binaire) ;</li> +<li>Sac de mots (pondéré tf-idf) ;</li> </ul></li> <li>Coefficient de Jaccard : <ul> -<li>Sac de mots (binaire)~;</li> -<li>Ensembles de bi-grammes~;</li> +<li>Sac de mots (binaire) ;</li> +<li>Ensembles de bi-grammes ;</li> </ul></li> <li>Distance de Damerau-Levenshtein (convertie en similarité): <ul> @@ -721,7 +714,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <aside class="notes"> <p>Chaque épigramme est décrite par des représentations numériques (slide précédente), alors on peut calculer la similarité entre deux épigrammes, et ce en employant des mesures différentes, combinant une métrique et une représentation :</p> <ul> -<li>Similarité cosinus: un vecteur par épigramme (nombre de dimension correspond au nombre de mots uniques dans le corpus, soit le livre VI)~; distance de l’angle entre deux épgirammes/vecteurs<br> +<li>Similarité cosinus: un vecteur par épigramme (nombre de dimension correspond au nombre de mots uniques dans le corpus, soit le livre VI) ; distance de l’angle entre deux épgirammes/vecteurs<br> </li> <li>Jaccard: Nombre objets communs / nombre d’objects pas en commun</li> <li>Damerau-Levenshtein: L’épigramme est représentée de façon séquentielle, combien de changements pour aller de la 1e à la 2e suite</li> @@ -834,7 +827,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <p>Pour chacune des 48 combinaisons possibles de nettoyage, on cherchait la méthode la plus discriminante (= distribution de similarité pour les variations confirmées la plus différente possible par rapport aux non variations).</p> <p>X = Similarités Y = Distributions normalisées</p> <p>Les non-variations ont une similarité cosinus très proche de 0</p> -<p>Les variations confirmées ont des plus hautes similarités cosinus. La courbe des variations confirmées se distingue en trois courbes, selon le type de variations. Les paradigmatiques ont une courbe qui s’apparente beaucoup à celle des variations. Les variations stylistiques ont un pic vers 0,4~; cette mesure de similarité (cosinus avec la représentation sac de mots binaires) permet de discriminer, de séparer la courbe des stylistiques des non-variations. C’est un pattern qu’on a retrouvé dans la plupart des cas de figure. Stylistiques vs non variation. Notre modèle capture quelque chose pour les variations stylistiques. C’est sur celles ci que nous nous concentrons dans la suite</p> +<p>Les variations confirmées ont des plus hautes similarités cosinus. La courbe des variations confirmées se distingue en trois courbes, selon le type de variations. Les paradigmatiques ont une courbe qui s’apparente beaucoup à celle des variations. Les variations stylistiques ont un pic vers 0,4 ; cette mesure de similarité (cosinus avec la représentation sac de mots binaires) permet de discriminer, de séparer la courbe des stylistiques des non-variations. C’est un pattern qu’on a retrouvé dans la plupart des cas de figure. Stylistiques vs non variation. Notre modèle capture quelque chose pour les variations stylistiques. C’est sur celles ci que nous nous concentrons dans la suite</p> <p>(Les stylistiques partagent donc bcp de formes entre elles) xxxxx</p> <p>Notre chaîne de traitement offre une discrimination pour les variations stylistiques que nous cherchons maintenant à modéliser. Notre hypothèse est qu’une haute similarité (c’est-à -dire une valeur élevée sur l’axe des X) est indicatrice de la présence d’une variation.</p> <p>En bas, similarité, à gauche, nombre (avec une distribution normalisée). La première pointe rouge qu’il y a effectivement bcp de non variations. (pcq ils sont pas similaires et ca montre que nos modèles marchent). Les variation stylistiques ont la valeur la plus élevée en terme de nombres.</p> @@ -854,8 +847,8 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <h2><span class="header-section-number">4.4</span> Algorithmes prédictifs</h2> <p><span class="alert">3 algorithmes considérés</span></p> <ul> -<li>Arbre de décision~;</li> -<li>Régression logistique~;</li> +<li>Arbre de décision ;</li> +<li>Régression logistique ;</li> <li>Perceptron.</li> </ul> <aside class="notes"> @@ -887,7 +880,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <p>–</p> <p><strong>Matrices de confusion</strong>: On veut une diagonale parfaite. On a 176 variations, tel algo en a correctement identifié n. Les non-var sont plus facilement faciles à identifier ! Les rapports de classification découlent juste des matrices de confusion.</p> <p>Attention, le 1.00, c’est plutôt 0,999998, mais on a gardé le score parfait en guise d’encouragement.</p> -<p><strong>Rappel / Précision</strong> Pêche au saumon~; 93 saumon + 5 bar MAIS il me manque 83 saumons dans l’océan, rappel est faible~; le 5 contribute à la précision de la première catégorie et au rappel de la seconde.</p> +<p><strong>Rappel / Précision</strong> Pêche au saumon ; 93 saumon + 5 bar MAIS il me manque 83 saumons dans l’océan, rappel est faible ; le 5 contribute à la précision de la première catégorie et au rappel de la seconde.</p> <p>Précision équilibrée = Balanced accuracy</p> <style type="text/css"> span.MJX_Assistive_MathML { @@ -917,7 +910,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <li>Les méthodes qui se concentrent essentiellement sur la similarité du vocabulaire sont un bon point de départ pour la modélisation des variations stylistiques.</li> <li>Il est plus facile de détecter les non-variations que de discerner les variations stylistiques, ce qui suggère deux choses : <ul> -<li>Ce concept n’est pas limité au partage de vocabulaire~;</li> +<li>Ce concept n’est pas limité au partage de vocabulaire ;</li> <li>Les non-variations ne partagent pas ou peu de formes.</li> </ul></li> <li>D’autres représentations textuelles et méthodes d’analyse des données sont nécessaires pour modéliser les variations paradigmatiques et rhétoriques.</li> @@ -931,7 +924,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à </ul> <p>Chaque méthode produit quelques faux positifs qui demandent une attention spéciale :</p> <ul> -<li>Comme dans le cas des faux négatifs, nous pouvons étudier leurs caractéristiques pour raffiner les modèles~;</li> +<li>Comme dans le cas des faux négatifs, nous pouvons étudier leurs caractéristiques pour raffiner les modèles ;</li> <li>Il est possible de trouver des variations qui ont échappé aux annotateurs et certaines paires d’épigrammes ont un statut ambigüe.</li> </ul> <aside class="notes"> @@ -943,7 +936,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <ul> <li>Pour les variatons stylistiques, besoin de mesurer les synonymes (?) -> certaines variations stylistiques évidentes pour des lecteurs humains ne sont pas détectées par les algorithmes, notamment à cause d’un usage trop important de synonymes.</li> </ul></li> -<li><p>Enfin, entre 17 et 47% (cf. évaluation des modèles) des variations répertoriées échappent encore aux modèles, ce qui indique que d’autres représentations des données textuelles et mesures de similarité doivent être envisagées dans les prochaines étapes du projet pour discriminer ces paires d’épigrammes des non-variations. (dans tous les cas, on a 176~; 30/176 = 17%~; 83/176 = 47%)</p></li> +<li><p>Enfin, entre 17 et 47% (cf. évaluation des modèles) des variations répertoriées échappent encore aux modèles, ce qui indique que d’autres représentations des données textuelles et mesures de similarité doivent être envisagées dans les prochaines étapes du projet pour discriminer ces paires d’épigrammes des non-variations. (dans tous les cas, on a 176 ; 30/176 = 17% ; 83/176 = 47%)</p></li> </ul> <style type="text/css"> span.MJX_Assistive_MathML { @@ -978,7 +971,7 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à </tbody> </table> <aside class="notes"> -<p>paires d’épigrammes prédites par nos algo comme étant des variations mais qui n’avaient pas été relevées (Mark Olsen sur Diderot et D’Alembert)~; p-ê que des paires sont passées inaperçues aux yeux des anotateurs (vrais faux positifs)</p> +<p>paires d’épigrammes prédites par nos algo comme étant des variations mais qui n’avaient pas été relevées (Mark Olsen sur Diderot et D’Alembert) ; p-ê que des paires sont passées inaperçues aux yeux des anotateurs (vrais faux positifs)</p> <p>L’exemple ci-dessous, qui n’avait pas été repéré initialement par les annotateurs, a un haut score de similarité et provoqua des désaccords quant à son classement – s’agit-il d’une variation stylistique, rhétorique, d’un simple topos ?</p> <style type="text/css"> span.MJX_Assistive_MathML { @@ -1008,13 +1001,13 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à <tbody> <tr class="odd"> <td>Les trois frères t’ont consacré, chasseur Pan, ces filets, pris par chacun à son genre de chasse : Pigrès, pour les oiseaux ; Damis, pour les quadrupèdes ; Cléitor, pour le peuple de la mer. Envoie-leur en échange une bonne chasse à l’un par les airs, au second par les bois, à l’autre par les grèves.</td> -<td>Le chasseur Damis a consacré ce long panneau, Pigrès ce filet aux fines mailles pour attraper les oiseaux et le rameur de nuit Cleitor ce tramail à mettre les rougets : c’est à toi, Pan, que tous trois ont dédié ces instruments de leur travail~; sois propice à ces frères si pieux, accorde-leur leur provende de volatiles, de venaison et d’habitants des eaux.</td> +<td>Le chasseur Damis a consacré ce long panneau, Pigrès ce filet aux fines mailles pour attraper les oiseaux et le rameur de nuit Cleitor ce tramail à mettre les rougets : c’est à toi, Pan, que tous trois ont dédié ces instruments de leur travail ; sois propice à ces frères si pieux, accorde-leur leur provende de volatiles, de venaison et d’habitants des eaux.</td> </tr> </tbody> </table> <aside class="notes"> <ul> -<li>Les faux négatifs sont plus nombreux : certaines variations stylistiques évidentes pour des lecteurs humains ne sont pas détectées par les algorithmes, notamment à cause d’un usage trop important de synonymes. Revenons au groupe des trois frères, dont il a été question plus haut~; l’épigramme VI.13 apparaît comme un faux négatif (avec les trois algorithmes sélectionnés) en face du l’épigramme VI.11 : Algo dit Non variations alors qu’il s’agit bien de variations</li> +<li>Les faux négatifs sont plus nombreux : certaines variations stylistiques évidentes pour des lecteurs humains ne sont pas détectées par les algorithmes, notamment à cause d’un usage trop important de synonymes. Revenons au groupe des trois frères, dont il a été question plus haut ; l’épigramme VI.13 apparaît comme un faux négatif (avec les trois algorithmes sélectionnés) en face du l’épigramme VI.11 : Algo dit Non variations alors qu’il s’agit bien de variations</li> </ul> <style type="text/css"> span.MJX_Assistive_MathML { @@ -1030,15 +1023,13 @@ Ce graphe là a été fait 5x48 fois, on a gardé les 5 meilleurs résultats, à </section></section> <section id="conclusion" class="title-slide slide level1 center" data-number="6"> <h1><span class="header-section-number">6</span> Conclusion</h1> +<p>Nous avons obtenu des résultats encourageants pour la formalisation du concept de <span class="alert">variation stylistique</span> dans le <span class="alert">livre VI</span> de l’<em>Anthologie grecque</em>.</p> +<p>Nous sommes maintenant à même de commencer le cercle herméneutique pour améliorer par itérations notre modèle.</p> +<p>Pour la suite :</p> <ul> -<li>Résultats encourageants pour la formalisation du concept de <span class="alert">variation stylistique</span> dans le <span class="alert">livre VI</span> de l’<em>Anthologie grecque</em>~;</li> -<li>Corrélation entre la présence d’une V. stylistique et la cooccurrence de termes et, plus précisément, des fréquences similaires de formes autrement plus rares dans le reste du corpus (modélisé par la pondération tf-idf)~; <!-- - La mesure de similarité cosinus appliquée aux représentations de type sac de mots (pondéré ou non) peut servir d'indicateur potentiel de variations stylistiques. --> <!-- - Les variations paradigmatiques et rhétoriques, en revanche, demanderont un travail de modélisation plus important : il sera nécessaire d’élaborer de nouvelles approches algorithmiques pour capturer formellement ces concepts. --></li> -<li>Pour la suite : -<ul> -<li>Étendre nos expérimentations à l’ensemble de l’<em>Anthologie grecque</em>~;</li> -<li>Adapter nos méthodes computationnelles au grec ancien~;</li> -<li>Analyser les V. rhétoriques et paradigmatiques.</li> -</ul></li> +<li>Étendre nos expérimentations à l’ensemble de l’<em>Anthologie grecque</em> ;</li> +<li>Adapter nos méthodes computationnelles au grec ancien ;</li> +<li>Modéliser les variations rhétoriques et paradigmatiques.</li> </ul> <aside class="notes"> <ul> diff --git a/PRODUCTION/2024_Acfas/2024_Acfas_v01.qmd b/PRODUCTION/2024_Acfas/2024_Acfas_v01.qmd index c21cfb00e600f0f64a0c70441af8b7c68c28237d..9400f3dfe0217aa2a310dbf111d839af45a0b5e7 100644 --- a/PRODUCTION/2024_Acfas/2024_Acfas_v01.qmd +++ b/PRODUCTION/2024_Acfas/2024_Acfas_v01.qmd @@ -51,11 +51,6 @@ format: - Marcello Vitali-Rosati ; - Dominic Forest. -:::{.callout-note appearance="minimal"} - -Basé sur la plateforme [Anthologia graeca](https://anthologiagraeca.org/) -::: - {height="150" fig-align="center"} ## Objectifs du projet @@ -452,14 +447,15 @@ paires d'épigrammes prédites par nos algo comme étant des variations mais qui # Conclusion -- Résultats encourageants pour la formalisation du concept de [variation stylistique]{.alert} dans le [livre VI]{.alert} de l’*Anthologie grecque* ; -- Corrélation entre la présence d’une V. stylistique et la cooccurrence de termes et, plus précisément, des fréquences similaires de formes autrement plus rares dans le reste du corpus (modélisé par la pondération tf-idf) ; -<!-- - La mesure de similarité cosinus appliquée aux représentations de type sac de mots (pondéré ou non) peut servir d'indicateur potentiel de variations stylistiques. --> -<!-- - Les variations paradigmatiques et rhétoriques, en revanche, demanderont un travail de modélisation plus important : il sera nécessaire d’élaborer de nouvelles approches algorithmiques pour capturer formellement ces concepts. --> -- Pour la suite : - - Étendre nos expérimentations à l'ensemble de l'*Anthologie grecque* ; - - Adapter nos méthodes computationnelles au grec ancien ; - - Analyser les V. rhétoriques et paradigmatiques. +Nous avons obtenu des résultats encourageants pour la formalisation du concept de [variation stylistique]{.alert} dans le [livre VI]{.alert} de l’*Anthologie grecque*. + +Nous sommes maintenant à même de commencer le cercle herméneutique pour améliorer par itérations notre modèle. + +Pour la suite : + +- Étendre nos expérimentations à l'ensemble de l'*Anthologie grecque* ; +- Adapter nos méthodes computationnelles au grec ancien ; +- Modéliser les variations rhétoriques et paradigmatiques. ::: {.notes}