What Would Cicero Write?
Examining Critical Textual Decisions with a Language Model
DOI :
https://doi.org/10.13135/2532-5353/6523Résumé
Les développements récents des modèles de langage Transformer permettent désormais à leurs utilisateurs de prévoir la probabilité de différentes phrases et de prévoir les mots manquants avec plus de précision qu’auparavant. Ces nouvelles informations et perspectives peuvent être utilisées pour évaluer de nouvelles modifications textuelles et pour apprécier davantage les choix éditoriaux adoptés dans les éditions plus anciennes. Nous examinons l’importance de l’analyse du corpus d’un auteur, et l’impact de la théorie de Good-Turing sur l’estimation de la fréquence lorsque l’on formule des hypothèses sur les mots manquants. Nous soulignerons également certaines des limites de ce que les modèles de langage Transformer peuvent faire, et comment les évaluer de manière pratique.
Téléchargements
Téléchargements
Publiée
Comment citer
Numéro
Rubrique
Licence
Les auteurs qui publient dans cette revue acceptent les termes suivants :
- Les auteurs conservent leur propriété intellectuelle sur le texte soumis et accordent à la revue le droit de première publication, l'ouvrage étant alors disponible simultanément sous Licence d’attribution Creative Commons – qui permet le partage de l’œuvre tout en en reconnaissant la paternité intellectuelle – et la publication initiale dans cette revue.
- Les auteurs peuvent conclure des ententes contractuelles supplémentaires pour la diffusion non exclusive de la version imprimée de l'ouvrage par la revue (par exemple, le dépôt institutionnel ou la publication dans une monographie), à condition d’indiquer une mention reconnaissant la publication initiale du texte dans cette revue.