Reconnaissance des écritures dans les imprimés - Archive ouverte du site Alsace Accéder directement au contenu
Communication Dans Un Congrès Année : 2024

Reconnaissance des écritures dans les imprimés

Elina Leblanc

Résumé

La reconnaissance optique de caractères (OCR) a connu d'importants succès pour les documents manuscrits ou les imprimés anciens ces dernières années, mais ce type de document reste marginal dans la production textuelle aujourd'hui disponible. Afin d'offrir aux chercheur.e.s des modèles performants couvrant un plus grand large éventail de cas, nous avons conçu un nouveau modèle généraliste, capable de gérer au mieux des imprimés, anciens comme contemporains, écrits dans une pluralité de langues. Plusieurs architectures sont évaluées, afin de comparer leur efficacité respective en terme de taux d'erreur par caractère, mais aussi de temps d'inférence.
Fichier principal
Vignette du fichier
Humanistica_2024_Gabay.pdf (366.1 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04557457 , version 1 (24-04-2024)

Licence

Paternité

Identifiants

  • HAL Id : hal-04557457 , version 1

Citer

Simon Gabay, Thibault Clérice, Pauline Jacsont, Elina Leblanc, Marie Jeannot-Tirole, et al.. Reconnaissance des écritures dans les imprimés : CATMuS print : un modèle générique, multilingue et diachronique. Humanistica 2024, Association francophone des humanités numériques, May 2024, Meknès, Maroc. ⟨hal-04557457⟩
0 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More