Une méthodologie pour la comparaison de partitions

2004 
Nous proposons une methodologie pour comparer des partitions d'un meme ensemble de donnees. Nous presentons tout d'abord quelques mesures de comparaison de deux classifications d'un meme ensemble de donnees : l'indice de Rand, sous sa forme brute ou corrigee, ainsi que sa version asymetrique, puis deux autres indices : le premier est inspire du test de Mac Nemar et le second de l'indice de Jaccard. On presente les ecritures logiques et relationnelles de ces indices ainsi que leurs distributions d'echantillonnage sous une hypothese nulle d'absence de liaison. Pour etudier la stabilite des classes on utilise ensuite un modele particulier de melanges de distributions, les profils latents qui sert a simuler des donnees que l'on classe selon deux groupes de variables.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    15
    Citations
    NaN
    KQI
    []