What Would Cicero Write?

Examining Critical Textual Decisions with a Language Model

  • Todd G. Cook, TGC Classical Language Toolkit (CLTK.org)

Résumé

Les développements récents des modèles de langage Transformer permettent désormais à leurs utilisateurs de prévoir la probabilité de différentes phrases et de prévoir les mots manquants avec plus de précision qu’auparavant. Ces nouvelles informations et perspectives peuvent être utilisées pour évaluer de nouvelles modifications textuelles et pour apprécier davantage les choix éditoriaux adoptés dans les éditions plus anciennes. Nous examinons l’importance de l’analyse du corpus d’un auteur, et l’impact de la théorie de Good-Turing sur l’estimation de la fréquence lorsque l’on formule des hypothèses sur les mots manquants. Nous soulignerons également certaines des limites de ce que les modèles de langage Transformer peuvent faire, et comment les évaluer de manière pratique.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Biographie de l'auteur

Todd G. Cook, TGC, Classical Language Toolkit (CLTK.org)

Todd G. Cook is a core contributor to the Classical Language Toolkit (CLTK.org), and he has studied Classics at California State Universities of Chico and Long Beach. He works as a data scientist and software engineer with years of experience writing educational software.

Publiée
2021-12-31