Bandits manchots avec échantillonnage de Thompson pour des recommandations multiples suivant un modèle fondé sur les positions

2020 
Les systemes de recommandation en ligne ont pour but de proposer les produits les plus interessantsaux positions adequates sur une page internet. Nous presentons un nouvel algorithme, PB-MHB, permettant de faire des recommandations multiples en ligne en suivant un modele fonde sur les positions. Cet algorithme s’appuie sur le principe des bandits manchots et utilise un echantillonnage de Thompson couple avec un algorithme de Metropolis-Hastings pour tirer les parametres des lois probabilistes utilisees, ce qui n’avait jamais ete fait dans le contexte d’un modele base positions. Notre methode ne necessite pas d’avoir en parametre les probabilites de vue des utilisateurs sur chaque position de la page Web, comme cela est usuellement le cas pour les algorithmes repondant a ce type d’interaction. Celles-ci sont d’ailleurs en pratique difficile a obtenir a priori. Les experiences faites sur des donnees simulees et sur des donnees issues de bases de donnees reelles (KDD-CUP2012 et Yandex) montrent que notre methode, avec moins d’information, fournit de meilleurs recommandations que l’etat de l’art.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []