Analyse statistique des réseaux et applications aux sciences humaines

2016 
Depuis les travaux precurseurs de Moreno (1934), l’analyse des reseaux est devenue une discipline forte, qui ne se limite plus a la sociologie et qui est a present appliquee a des domaines tres varies tels que la biologie, la geographie ou l’histoire. L’interet croissant pour l’analyse des reseaux s’explique d’une part par la forte presence de ce type de donnees dans le monde numerique d’aujourd’hui et, d’autre part, par les progres recents dans la modelisation et le traitement de ces donnees. En effet, informaticiens et statisticiens ont porte leurs efforts depuis plus d’une dizaine d’annees sur ces donnees de type reseau en proposant des nombreuses techniques permettant leur analyse. Parmi ces techniques on note les methodes de clustering qui permettent en particulier de decouvrir une structure en groupes caches dans le reseau. De nombreux facteurs peuvent exercer une influence sur la structure d’un reseau ou rendre les analyses plus faciles a comprendre. Parmi ceux-ci, on trouve deux facteurs importants: le facteur du temps, et le contexte du reseau. Le premier implique l’evolution des connexions entre les nœuds au cours du temps. Le contexte du reseau peut alors etre caracterise par differents types d’informations, par exemple des messages texte (courrier electronique, tweets, Facebook, messages, etc.) echanges entre des nœuds, des informations categoriques sur les nœuds (age, sexe, passe-temps, Les frequences d’interaction (par exemple, le nombre de courriels envoyes ou les commentaires affiches), et ainsi de suite. La prise en consideration de ces facteurs nous permet de capturer de plus en plus d’informations complexes et cachees a partir des donnees. L’objectif de ma these ete de definir des nouveaux modeles de graphes aleatoires qui prennent en compte les deux facteurs mentionnes ci-dessus, afin de developper l’analyse de la structure du reseau et permettre l’extraction de l’information cachee a partir des donnees. Ces modeles visent a regrouper les sommets d’un reseau en fonction de leurs profils de connexion et structures de reseau, qui sont statiques ou evoluant dynamiquement au cours du temps. Le point de depart de ces travaux est le modele de bloc stochastique (SBM). Il s’agit d’un modele de melange pour les graphiques qui ont ete initialement developpes en sciences sociales. Il suppose que les sommets d’un reseau sont repartis sur differentes classes, de sorte que la probabilite d’une arete entre deux sommets ne depend que des classes auxquelles ils appartiennent.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []