L'Alliance for Open Media (AOMedia) a récemment officiellement publié la première version de spécification finale 1.0.0 de la norme d'encodage vidéo AV2, marquant ainsi que cette nouvelle génération de format d'encodage vidéo open source et libre de droits, considéré comme le successeur d'AV1, est entrée dans une phase stable, permettant à l'industrie de développer des encodeurs et décodeurs conformes aux normes et d'effectuer une optimisation à long terme autour de spécifications fixes, sans avoir à se soucier des problèmes de compatibilité causés par les versions futures. AV2 devrait compresser davantage le débit binaire et réduire les coûts de bande passante dans les scénarios de streaming multimédia et de vidéo ultra haute définition. Cependant, les experts de l'industrie préviennent également que sa complexité de décodage est bien supérieure à celle de l'AV1 existant et qu'il sera confronté à des défis considérables en matière de prise en charge des terminaux et d'accélération matérielle.

AOMedia a été fondée en 2015. La norme d'encodage AV1 publiée en 2018 a été conçue comme un format vidéo libre de droits pouvant rivaliser avec le H.265 (HEVC). Après plusieurs années de développement, même si sa popularité n'est pas rapide, il a progressivement pris pied dans les vidéos en ligne et les services vidéo cloud. YouTube expérimente l'encodage AV1 depuis 2018, suivi par Netflix qui a introduit le streaming AV1 sur son application mobile Android en 2020, et par Amazon qui a lancé la prise en charge de l'encodage en temps réel AV1 via les services multimédias AWS Elemental en 2024. Dans le même temps, des fabricants tels qu'AMD, Intel et NVIDIA ont successivement ajouté une prise en charge accélérée du décodage et de l'encodage AV1 dans leur matériel et leurs pilotes, faisant progressivement mûrir l'expérience de lecture sur terminal de ce format.

Par rapport à l'AV1, le principal argument de vente de l'AV2 est de réduire considérablement le débit binaire dans les mêmes conditions subjectives de qualité d'image. Selon les données d'évaluation officielles publiées par AOMedia, sous différents indicateurs objectifs (tels que PSNR, etc.), AV2 peut atteindre une réduction moyenne du débit binaire d'environ 30 à 34 % par rapport à AV1, tout en conservant la même qualité visuelle. Pour les plateformes multimédias en streaming, cela signifie que tout en garantissant l'expérience visuelle de l'utilisateur, AV2 peut effectuer une transmission vidéo de la même qualité avec une bande passante inférieure, réduisant ainsi davantage les coûts de distribution de contenu. En particulier dans les scénarios vidéo haute résolution et à plage dynamique élevée tels que 4K, 8K et HDR, les économies de bande passante et de stockage seront encore plus considérables.

La comparaison fournie par AOMedia montre la différence de fidélité de compression entre AV1 et AV2 en termes de rapport signal/bruit de crête (PSNR). Le PSNR est un indicateur mathématique couramment utilisé qui mesure la différence entre l'image vidéo compressée et le signal d'origine. Des valeurs plus élevées signifient généralement que davantage de détails sont préservés. Lors de ces tests, AV2 a pu produire à un débit binaire nettement inférieur dans les mêmes conditions PSNR, reflétant sa mise à niveau complète des outils et algorithmes de codage.

Pour obtenir les gains de compression mentionnés ci-dessus, AV2 introduit un certain nombre d'améliorations dans la technologie de codage, notamment des méthodes de prédiction intra-image et inter-image plus avancées, une modélisation de mouvement plus sophistiquée, des outils de transformation et de filtrage plus complexes, une structure de partitionnement de blocs plus flexible et un mécanisme de codage entropique amélioré. Ces changements augmentent la dimension décisionnelle et la liberté de l'algorithme du côté de l'encodage, permettant à l'encodeur de correspondre plus précisément aux caractéristiques du contenu vidéo, compressant ainsi davantage d'informations redondantes avec la même qualité d'image.

Cependant, une efficacité de compression plus élevée n’est pas sans prix. Selon l'évaluation du chef du projet VideoLAN, Jean-Baptiste Kempf, la complexité informatique d'AV2 côté décodage a considérablement augmenté par rapport à AV1. On estime actuellement que la complexité de décodage de l'AV2 est environ cinq fois supérieure à celle de l'AV1, ce qui rendra très difficile pour un grand nombre de processeurs existants le décodage fluide des vidéos AV2 via un logiciel pur. En l'absence d'une prise en charge étendue de l'accélération matérielle du décodage, les terminaux ordinaires pourraient ne pas être en mesure de supporter la charge supplémentaire apportée par AV2 en termes de consommation d'énergie, de génération de chaleur et de fluidité, ralentissant ainsi sa mise en œuvre sur les navigateurs, les boîtiers TV et les appareils mobiles.

Pour cette raison, Kempf estime qu'avant que les puces et plates-formes grand public ne fournissent une accélération matérielle complète AV2, de nombreuses incertitudes subsistent quant aux perspectives d'adoption à grande échelle de cette norme. En d’autres termes, la possibilité pour AV2 de suivre le chemin de développement d’AV1 et d’être réellement déployée sur de grandes plateformes de streaming multimédia telles que YouTube, Netflix et Amazon dépendra en grande partie de la volonté et du moment où les fabricants de CPU, GPU et SoC seront disposés à y consacrer suffisamment de ressources de support matériel.

Actuellement, avec la mise en œuvre officielle de la spécification AV2 1.0.0, AOMedia et ses membres peuvent déjà promouvoir la mise en œuvre et l'optimisation des encodeurs, décodeurs et chaînes d'outils de développement associées sous une norme unifiée. L'industrie s'attend généralement à ce qu'au cours des prochaines années, un support expérimental autour d'AV2 apparaisse pour la première fois dans les lecteurs open source, les versions expérimentales des navigateurs et certains services de transcodage cloud. Les véritables applications commerciales destinées aux utilisateurs de masse doivent encore attendre que l'écosystème matériel arrive à maturité et que les plates-formes de contenu grand public offrent des voies d'adoption plus claires.