Towards novel inter-prediction methods for image and video compression

Jean Begaint

Towards novel inter-prediction methods for image and video compression

2018

Jean Begaint

En raison de la grande disponibilite des dispositifs de capture video et des nouvelles pratiques liees aux reseaux sociaux, ainsi qu’a l’emergence des services en ligne, les images et les videos constituent aujourd’hui une partie importante de donnees transmises sur internet. Les applications de streaming video representent ainsi plus de 70% de la bande passante totale de l’internet. Des milliards d’images sont deja stockees dans le cloud et des millions y sont telecharges chaque jour. Les besoins toujours croissants en streaming et stockage necessitent donc une amelioration constante des outils de compression d’image et de video. Cette these vise a explorer des nouvelles approches pour ameliorer les methodes actuelles de prediction inter-images. De telles methodes tirent parti des redondances entre images similaires, et ont ete developpees a l’origine dans le contexte de la video compression. Dans une premiere partie, de nouveaux outils de prediction inter globaux et locaux sont associes pour ameliorer l’efficacite des schemas de compression de bases de donnees d’image. En associant une compensation geometrique et photometrique globale avec une prediction lineaire locale, des ameliorations significatives peuvent etre obtenues. Une seconde approche est ensuite proposee qui introduit un schema de prediction inter par regions. La methode proposee est en mesure d’ameliorer les performances de codage par rapport aux solutions existantes en estimant et en compensant les distorsions geometriques et photometriques a une echelle semi locale. Cette approche est ensuite adaptee et validee dans le cadre de la compression video. Des ameliorations en reduction de debit sont obtenues, en particulier pour les sequences presentant des mouvements complexes reels tels que des zooms et des rotations. La derniere partie de la these se concentre sur l’etude des methodes d’apprentissage en profondeur dans le cadre de la prediction inter. Ces dernieres annees, les reseaux de neurones profonds ont obtenu des resultats impressionnants pour un grand nombre de tâches de vision par ordinateur. Les methodes basees sur l’apprentissage en profondeur proposees a l’origine pour de l’interpolation d’images sont etudiees ici dans le contexte de la compression video. Des ameliorations en terme de performances de codage sont obtenues par rapport aux methodes d’estimation et de compensation de mouvements traditionnelles. Ces resultats mettent en evidence le fort potentiel de ces architectures profondes dans le domaine de la compression video.

Keywords:

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations