Contextualisation de messages courts :l’importance des métadonnées

2013 
Les recherches presentees portent sur l’analyse de donnees fournies par le site Vodkaster. Dans l’optique d’alimenter un systeme de recommandation (SR) base sur le contenu, nous developpons un systeme permettant, grâce a l’apprentissage automatique, de predire la categorie de note d’une critique. Cette critique est appelee micro-critique (μC) (140 caracteres ou moins). Durant cette tâche, la prise en compte de l’identite de l’utilisateur et du titre du film, en les integrant tels quels dans le sac de mot de la μC, a permis d’ameliorer globalement les performances du systeme et ce, quelle que soit la methode utilisee pour la prediction. Nous montrons qu’avec un nombre egal de documents, l’ensemble d’apprentissage le plus proche (temporellement parlant) des donnees de test donnait de meilleurs resultats que les documents plus eloignes dans le temps. Ceci nous amene a envisager pour la suite de considerer une metadonnee additionnelle : la dimension temporelle.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []