Corpus EN-Istex : un corpus d’articles scientifiques annoté manuellement en entités nommées (ISTEX-EN Corpus: a scientific paper corpus manually annotated in named entities)

2021 
Nous presentons ici une nouvelle ressource libre : le corpus EN-ISTEX, un corpus de deux cents articles scientifiques annotes manuellement en entites nommees. Ces articles ont ete extraits des deux editeurs scientifiques les plus importants de la plateforme ISTEX. Tous les domaines sont concernes, meme si les sciences dites dures, en particulier les sciences du vivant et de la sante, sont preponderantes. Parmi ceux-ci vingt articles ont ete multi-annotes afin de verifier l’adequation du guide d’annotation et la fiabilite de l’annotation. L’accord inter annotateurs sur ces vingt textes s’eleve a 91 %.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []