What Would Cicero Write? Examining Critical Textual Decisions with a Language Model

Todd G. Cook

doi:10.13135/2532-5353/6523

What Would Cicero Write?

Examining Critical Textual Decisions with a Language Model

Auteurs

Todd G. Cook, TGC Classical Language Toolkit (CLTK.org)

DOI :

https://doi.org/10.13135/2532-5353/6523

Résumé

Les développements récents des modèles de langage Transformer permettent désormais à leurs utilisateurs de prévoir la probabilité de différentes phrases et de prévoir les mots manquants avec plus de précision qu’auparavant. Ces nouvelles informations et perspectives peuvent être utilisées pour évaluer de nouvelles modifications textuelles et pour apprécier davantage les choix éditoriaux adoptés dans les éditions plus anciennes. Nous examinons l’importance de l’analyse du corpus d’un auteur, et l’impact de la théorie de Good-Turing sur l’estimation de la fréquence lorsque l’on formule des hypothèses sur les mots manquants. Nous soulignerons également certaines des limites de ce que les modèles de langage Transformer peuvent faire, et comment les évaluer de manière pratique.

Téléchargements

Biographie de l'auteur

Todd G. Cook, TGC, Classical Language Toolkit (CLTK.org)

Todd G. Cook is a core contributor to the Classical Language Toolkit (CLTK.org), and he has studied Classics at California State Universities of Chico and Long Beach. He works as a data scientist and software engineer with years of experience writing educational software.

Téléchargements

PDF (English)

Publiée

2021-12-31

Comment citer

Cook, T. G. (2021). What Would Cicero Write? Examining Critical Textual Decisions with a Language Model. Ciceroniana On Line, 5(2), 285–296. https://doi.org/10.13135/2532-5353/6523

Télécharger la référence bibliographique

Numéro

Vol. 5 No 2 (2021): “Cicero digitalis” Actes du Colloque édités par Alice Borgna et Mélanie Lucciano

Rubrique

Articles

Licence

Les auteurs qui publient dans cette revue acceptent les termes suivants :

Les auteurs conservent leur propriété intellectuelle sur le texte soumis et accordent à la revue le droit de première publication, l'ouvrage étant alors disponible simultanément sous Licence d’attribution Creative Commons – qui permet le partage de l’œuvre tout en en reconnaissant la paternité intellectuelle – et la publication initiale dans cette revue.
Les auteurs peuvent conclure des ententes contractuelles supplémentaires pour la diffusion non exclusive de la version imprimée de l'ouvrage par la revue (par exemple, le dépôt institutionnel ou la publication dans une monographie), à condition d’indiquer une mention reconnaissant la publication initiale du texte dans cette revue.

What Would Cicero Write?

Examining Critical Textual Decisions with a Language Model

Auteurs

DOI :

Résumé

Téléchargements

Biographie de l'auteur

Todd G. Cook, TGC, Classical Language Toolkit (CLTK.org)

Téléchargements

Publiée

Comment citer

Numéro

Rubrique

Licence

Développé par

Langue

Informations