Apprentissage statistique pour la constitution des corpus d'évaluation.

2006 
La constitution de corpus d’evaluation est une etape essentielle pour evaluer la performance des systemes de recherche d’information. Le cout de developpement de tels corpus est en general assez eleve a cause en particulier de l’effort humain necessaire a l’evaluation de la pertinence des documents pour chaque requete. Cette difficulte devient un veritable goulot d’etranglement dans le cas de corpus de tres grande taille. Le travail que nous presentons vise a selectionner adaptativement les documents des corpus d’evaluation. Nous utilisons pour cela des algorithmes d’apprentissage statistique qui optimisent des criteres d’ordonnancement. Nous presentons des essais d’un algorithme d’ordonnancement, dit RankBoost, sur des donnees de TREC et analysons les resultats obtenus au moyen de differents criteres. Les resultats de ces analyses montrent que la methode proposee permet de creer des corpus d’evaluation de qualite superieure a la methode de TREC.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    24
    References
    3
    Citations
    NaN
    KQI
    []