Estimation de poses 3D multi-personnes à partir d'images RGB

2020 
L’estimation de poses 3D humaines a partir d’images RGB monoculaires est le processus permettant de localiser les articulations humaines a partir d’une image ou d’une sequence d’images. Elle fournit une information geometrique et de mouvement riche sur le corps humain. La plus part des approches d’estimation de poses 3D existantes supposent que l’image ne contient qu’une personne, entierement visible. Un tel scenario n’est pas realiste. Dans des conditions reelles plusieurs personnes interagissent. Elles ont alors tendance a s’occulter mutuellement, ce qui rend l’estimation de poses 3D encore plus ambigue et complexe. Les travaux realises durant cette these se sont focalises sur l’estimation single-shot de poses 3D multi-personnes a partir d’images monoculaires RGB. Nous avons d’abord propose une approche bottom-up de prediction de poses 3D multi-personnes qui predit d’abord les coordonnees 3D de toutes les articulations presentes dans l’image puis fait appel a un processus de regroupement afin de predire des squelettes 3D complets. Afin d’etre robuste aux cas ou les personnes dans l’image sont nombreuses et eloignees de la camera, nous avons developpe PandaNet qui repose sur une representation par ancres et qui integre un processus permettant d’ignorer les ancres associees de maniere ambigue aux verites de terrain et une ponderation automatique des fonctions de pertes. Enfin, PandaNet est complete avec un Module d’Estimation de Distances Absolues, Absolute Distances Estimation Module (ADEM). L’ensemble, appele Absolute PandaNet, permet de predire des poses 3D humaines absolues exprimees dans le repere la camera.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []