Soutiendra publiquement ses travaux de thèse intitulés
Vidéo pour l’événementiel : Compression et transport de la nouvelle génération de codec vidéo
dirigés par Monsieur Frédéric DUFAUX
Soutenance prévue le mercredi 04 mai 2022 à 14h00 Lieu : CentraleSupélec (Université Paris-Saclay) 3 Rue Joliot Curie, 91190 Gif-sur-Yvette Salle : amphi Peugeot – bâtiment Bouygues (Sc.046) URL salle virtuelle : https://cnrs.zoom.us/j/91636387938?pwd=dFBBdE85VTViRlZIdkg4MSttM2FQUT09
Composition du jury proposé
M. Frédéric DUFAUX
CNRS/Université Paris-Saclay
Directeur de thèse
M. Michel KIEFFER
Université Paris-Saclay
Co-directeur de thèse
M. Marc LENY
Ektacom
Co-encadrant de thèse
Mme Anissa MOKRAOUI
Université Sorbonne Paris Nord
Examinatrice
M. Christian TIMMERER
University of Klagenfurt
Examinateur
Mme Aline ROUMY
INRIA/Rennes
Rapporteure
M. François-Xavier COUDOUX
Université Polytechnique Hauts-de-France
Rapporteur
Mots-clés :
transmission basse latence,streaming vidéo,codage adaptatif de la vidéo,contrôle du débit,Versatile Video Coding,compression video,
Résumé :
L’acquisition et la diffusion de contenus avec une latence minimale sont devenus essentiel dans plusieurs domaines d’activités tels que la diffusion d’évènements sportifs, la vidéoconférence, la télé-présence, la télé-opération de véhicules ou le contrôle à distance de systèmes. L’industrie de la diffusion en direct a connu une croissance en 2020, et son importance va encore croitre au cours des prochaines années grâce à l’émergence de nouveaux codecs vidéo à haute efficacité reposant sur le standard Versatile Video Coding(VVC)et à la cinquième génération de réseaux mobiles (5G). Les méthodes de streaming de type HTTP Adaptive Streaming (HAS) telles que MPEG-DASH, grâce aux algorithmes d’adaptation du débit de transmission de vidéo compressée, se sont révélées très efficaces pour améliorer la qualité d’expérience (QoE) dans un contexte de vidéo à la demande (VOD). Cependant, dans les applications où la latence est critique, minimiser le délai entre l’acquisition de l’image et son affichage au récepteur est essentiel. La plupart des algorithmes d’adaptation de débit sont développés pour optimiser la transmission vidéo d’un serveur situé dans le cœur de réseau vers des clients mobiles. Dans les applications nécessitant un streaming à faible latence, le rôle du serveur est joué par un terminal mobile qui va acquérir, compresser et transmettre les images via une liaison montante comportant un canal radio vers un ou plusieurs clients. Les approches d’adaptation de débit pilotées par le client sont par conséquent inadaptées. De plus, les HAS, pour lesquelles la prise de décision se fait avec une périodicité de l’ordre de la seconde ne sont pas suffisamment réactives lors d’une mobilité importante du serveur et peuvent engendrer des délais importants. Il est donc essentiel d’utiliser une granularité d’adaptation très fine afin de réduire le délai de bout-en-bout. En effet, la taille réduite des tampons d’émission et de réception afin de minimiser la latence rend plus délicate l’adaptation du débit dans notre cas d’usage. Lorsque la bande passante varie avec une constante de temps plus petite que la période avec laquelle la régulation est faite, les mauvaises décisions de débit de transmission peuvent induire un surcroit de latence important. L’objet de cette thèse est d’apporter des éléments de réponse à la problématique de la transmission vidéo à faible latence depuis des terminaux (émetteurs) mobiles. Nous présentons d’abord un algorithme d’adaptation de débit image-par-image pour la diffusion à faible latence. Une approche de type Model Predictive Control (MPC) est proposée pour déterminer le débit de codage de chaque image à transmettre. Cette approche utilise des informations relatives au niveau de tampon de l’émetteur et aux caractéristiques du canal de transmission. Les images étant codées en direct, un modèle reliant le paramètre de quantification (QP) au débit de sortie du codeur vidéo est nécessaire. Nous avons donc proposé un nouveau modèle reliant le débit au paramètre de quantification et à la distorsion de l’image précédente. Ce modèle fournit de bien meilleurs résultats dans le contexte d’une décision prise image par image du débit de codage que les modèle de référence de la littérature. En complément des techniques précédentes, nous avons également proposé des outils permettant de réduire la complexité de codeurs vidéo tels que VVC. La version actuelle du codeur VVC (VTM10) a un temps d’exécution neuf fois supérieur à celui du codeur HEVC. Par conséquent, le codeur VVC n’est pas adapté aux applications de codage et diffusion en temps réel sur les plateformes actuellement disponibles. Dans ce contexte, nous présentons une méthode systématique, de type branch-and-prune, permettant d’identifier un ensemble d’outils de codage pouvant être désactivés tout en satisfaisant une contrainte sur l’efficacité de codage. Ce travail contribue à la réalisation d’un codeur VVC temps réel.