Effacement de dimensions de similarité textuelle pour l'exploration de collections de rapports d'incidents aéronautiques

2012 
Cet article etudie le lien entre la similarite textuelle et une classification extrinseque dans des collections de rapports d'incidents aeronautiques. Nous cherchons a completer les strategies d'analyse de ces collections en etablissant automatiquement des liens de similarite entre les documents de facon a ce qu'ils ne refletent pas l'organisation des schemas de codification utilises pour leur classement. Afin de mettre en evidence les dimensions de variation transversales a la classification, nous calculons un score de dependance entre les termes et les classes et excluons du calcul de similarite les termes les plus correles a une classe donnee. Nous montrons par une application sur 500 documents que cette methode permet effectivement de degager des thematiques qui seraient passees inapercues au vu de la trop grande saillance des similarites de haut niveau.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    7
    References
    3
    Citations
    NaN
    KQI
    []