Transcription automatique et segmentation thématique de livres d’heures manuscrits

2019 
Les livres d’heures sont le plus grand best-seller de tout le Moyen Âge, avec plus de 10 000 temoins conserves. Incontournables pour comprendre l’univers mental medieval, leurs textes ont ete tres peu etudies. Ils sont tres longs et ont une structure complexe correspondant a l’organisation liturgique medievale et la priere quotidienne de l’office. Cet article decrit les methodes et les traitements automatiques mis en oeuvre sur les livres d’heures : la reconnaissance de l’ecriture manuscrite et la segmentation adaptees a ces manuscrits. L’approche de segmentation semi-supervisee proposee tire profit de la constitution specifique du manuscrit pour mieux retrouver leur structure malgre le bruit engendre par la reconnaissance de l’ecriture.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []