L’ordinateur au service du dépouillement de sources historiques. Éléments d’analyse semi-automatique d’un corpus diplomatique homogène

2020 
L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []