Détection automatique de phrases en domaine de spécialité en français (Sentence boundary detection for specialized domains in French )

2018 
La detection de frontieres de phrase est generalement considere comme un probleme resolu. Cependant, les outils performant sur des textes en domaine general, ne le sont pas forcement sur des domaines specialises, ce qui peut engendrer des degradations de performance des outils intervenant en aval dans une chaine de traitement automatique s’appuyant sur des textes decoupes en phrases. Dans cet article, nous evaluons 5 outils de segmentation en phrase sur 3 corpus issus de different domaines. Nous re-entrainerons l’un de ces outils sur un corpus de specialite pour etudier l’adaptation en domaine. Notamment, nous utilisons un nouveau corpus biomedical annote specifiquement pour cette tâche. La detection de frontieres de phrase a l’aide d’un modele OpenNLP entraine sur un corpus clinique offre une F-mesure de .73, contre .66 pour la version standard de l’outil.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []