Classification multilabel de concepts médicaux pour l'identification du profil clinique du patient (Multilabel classification of medical concepts for patient's clinical profile identification ).

2021 
La premiere tâche du Defi fouille de textes 2021 a consiste a extraire automatiquement, a partir de cas cliniques, les phenotypes pathologiques des patients regroupes par tete de chapitre du MeSH-maladie. La solution presentee est celle d’un classifieur multilabel base sur un transformer. Deux transformers ont ete utilises : le camembert-large classique (run 1) et le camembert-large fine-tune (run 2) sur des articles biomedicaux francais en acces libre. Nous avons egalement propose un modele « bout-enbout », avec une premiere phase d’extraction d’entites nommees egalement basee sur un transformer de type camembert-large et un classifieur de genre sur un modele Adaboost. Nous obtenons un tres bon rappel et une precision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modele « bout-en-bout » est similaire aux autres methodes.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []