Mots audio-visuels joints pour la détection de scènes violentes dans les vidéos

2014 
Ce papier presente une representation audio-visuelle des donnees pour la detection des scenes violentes dans les films. Les travaux existants dans ce domaine considerent l'infor- mation visuelle ou l'information audio; voire leur fusion classique. Jusqu'a present peu d'ap- proches ont explore leur dependance mutuelle pour la detection de scenes violentes. Ainsi, nous proposons un descripteur qui fournit des indices multimodaux audio et visuels; tout d'abord en assemblant les descripteurs audio et visuels, ensuite en revelant statistiquement les motifs conjoints multimodaux. La validation experimentale a ete effectuee dans le cadre de la tâche "detection de scenes violentes" de MediaEval 2013. Les resultats obtenus montrent le potentiel de l'approche proposee en comparaison avec les methodes utilisant les descripteurs audio et visuels separement ou d'autres types de fusion.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    15
    References
    0
    Citations
    NaN
    KQI
    []