Détection de points de vue sur les médias sociaux numériques

2018 
De nombreux domaines ont interet a etudier les points de vue exprimes en ligne, que ce soit a des fins de marketing, de cybersecurite ou de recherche avec l'essor des humanites numeriques. Nous proposons dans ce manuscrit deux contributions au domaine de la fouille de points de vue, axees sur la difficulte a obtenir des donnees annotees de qualite sur les medias sociaux. Notre premiere contribution est un jeu de donnees volumineux et complexe de 22853 profils Twitter actifs durant la campagne presidentielle francaise de 2017. C'est l'un des rares jeux de donnees considerant plus de deux points de vue et, a notre connaissance, le premier avec un grand nombre de profils et le premier proposant des communautes politiques recouvrantes. Ce jeu de donnees peut etre utilise tel quel pour etudier les mecanismes de campagne sur Twitter ou pour evaluer des modeles de detection de points de vue ou des outils d'analyse de reseaux. Nous proposons ensuite deux modeles generiques semi-supervises de detection de points de vue, utilisant une poignee de profils-graines, pour lesquels nous connaissons le point de vue, afin de categoriser le reste des profils en exploitant differentes proximites inter-profils. En effet, les modeles actuels sont generalement fondes sur les specificites de certaines plateformes sociales, ce qui ne permet pas l'integration de la multitude de signaux disponibles. En construisant des proximites a partir de differents types d'elements disponibles sur les medias sociaux, nous pouvons detecter des profils suffisamment proches pour supposer qu'ils partagent une position similaire sur un sujet donne, quelle que soit la plateforme. Notre premier modele est un modele ensembliste sequentiel propageant les points de vue grâce a un graphe multicouche representant les proximites entre les profils. En utilisant des jeux de donnees provenant de deux plateformes, nous montrons qu'en combinant plusieurs types de proximite, nous pouvons correctement etiqueter 98% des profils. Notre deuxieme modele nous permet d'observer l'evolution des points de vue des profils pendant un evenement, avec seulement un profil-graine par point de vue. Ce modele confirme qu'une grande majorite de profils ne changent pas de position sur les medias sociaux, ou n'expriment pas leur revirement.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []