EP1900223A2

EP1900223A2 - Procede et dispositif de codage video

Info

Publication number: EP1900223A2
Application number: EP06778946A
Authority: EP
Inventors: Joël JUNG; Marc Baillavoine; Patrick Boissonade
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2005-06-30
Filing date: 2006-06-19
Publication date: 2008-03-19
Also published as: US20090213939A1; JP2008545309A; KR101092684B1; KR20080031324A; JP5122448B2; WO2007003836A3; WO2007003836A2; US8396135B2; CN101213843B; CN101213843A

Abstract

L'invention concerne un procédé de codage vidéo au cours duquel: - a) on code des images successives (F) d'une séquence vidéo pour générer des paramètres de codage, - b) on inclut les paramètres de codage dans un flux de sortie (Φ) à transmettre à une station (B) comportant un décodeur (2), - c) on reçoit de ladite station des informations de retour sur la restitution des images de la séquence vidéo par le décodeur, - d) on analyse les informations de retour pour : • d1 ) identifier, parmi les images restituées, si au moins une image comprend au moins une partie qui a été perdue au niveau du décodeur, • d2) identifier, parmi les images codées s'étant succédées entre, d'une part, ladite image restituée et, d'autre part, une image courante à coder, au moins une partie d'image qui se réfère à ladite partie perdue identifiée à l'étape d1 ), - e) on code ladite image courante de la séquence vidéo selon un mode de codage qui est fonction de l'identification ou de la non identification d'au moins une partie perdue telle qu'effectuée à l'étape d).

Description

PROCEDE ET DISPOSITIF DE CODAGE VIDEO

La présente invention concerne les techniques de codage vidéo.

Elle s'applique à des situations où un codeur produisant un flux de signal vidéo codé émis vers un décodeur vidéo bénéficie d'un canal de retour, sur lequel le côté décodeur fournit de l'information indiquant, explicitement ou implicitement, si les images du signal vidéo ont pu ou non être convenablement reconstruites.

Beaucoup de codeurs vidéo supportent un mode de codage interimages ("inter-frame coding", ci-après codage en Inter), dans lequel le mouvement entre les images successives d'une séquence vidéo est estimé afin que l'image la plus récente soit codée relativement à une ou plusieurs images précédentes. Une estimation de mouvement est effectuée dans la séquence, les paramètres d'estimation sont envoyés au décodeur, et l'erreur d'estimation est transformée, quantifiée et envoyée au décodeur.

Chaque image de la séquence peut aussi être codée sans référence aux autres. C'est ce qu'on appelle le codage en Intra ("intra-frame coding"). Ce mode de codage exploite les corrélations spatiales au sein d'une image. Pour un débit de transmission donné du codeur vers le décodeur, il procure une moins bonne qualité vidéo que le codage en Inter puisqu'il ne tire pas parti des corrélations temporelles entre les images successives de la séquence vidéo.

Couramment, une portion de séquence vidéo a sa première image codée en Intra puis les images suivantes codées soit en Intra, soit en Inter. Des informations incluses dans le flux de sortie du codeur indiquent les macroblocs codés en Intra et en Inter et, dans ce dernier cas, la ou les images(s) de référence à employer.

Un problème du codage en Inter est son comportement en présence d'erreurs de transmission ou de pertes de paquets sur le canal de communication entre Ie codeur et le décodeur. La dégradation ou Ia perte d'une image se propage sur les images suivantes jusqu'à ce que survienne une nouvelle image codée en Intra. Il est courant que le mode de transmission du signal codé entre le codeur et le décodeur engendre des pertes totales ou partielles de certaines images. De telles pertes résultent par exemple de la perte ou de l'arrivée trop tardive de certains paquets de données lorsque la transmission a lieu sur un réseau de paquets sans garantie de délivrance tel qu'un réseau IP (Internet Protocol). Des pertes peuvent aussi résulter d'erreurs introduites par le canal de transmission au-delà des capacités de correction des codes correcteurs d'erreurs employés.

Dans un environnement sujet à des pertes diverses de signal, il est nécessaire de fournir des mécanismes pour améliorer la qualité de l'image au décodeur. L'un de ces mécanismes est l'utilisation d'un canal de retour, du décodeur vers le codeur, sur lequel le décodeur informe le codeur qu'il a perdu tout ou partie de certaines images. L'inconvénient de cette disposition réside dans le fait que :

- l'information n'est pas précise temporellement, c'est-à-dire que le numéro de l'image n'est pas connu,

- l'information n'est pas précise spatialement, c'est-à-dire que le décodeur ne fait pas de distinction entre les parties d'images reçues et perdues.

Suite à la réception de ces informations, le codeur fait des choix de codage pour corriger ou du moins réduire les effets des erreurs de transmission. Les codeurs actuels renvoient simplement une image codée en Intra, c'est-à-dire sans référence aux images précédemment codées dans le flux et pouvant contenir des erreurs.

Ces images Intra permettent de rafraîchir l'affichage et de corriger les erreurs dues aux pertes de transmission. Mais elles sont d'une moins bonne qualité que les images Inter. Ainsi, le mécanisme habituel de compensation des pertes d'image donne malgré tout lieu à une dégradation de la qualité du signa! restitué pendant un certain temps après la perte. On connaît par ailleurs des mécanismes selon lesquels le décodeur est capable de signaler de manière plus fine (mieux localisée spatialement et temporellement) au codeur les parties d'images perdues. Par exemple, si au cours du traitement d'une image N par le décodeur, ce dernier analyse que les macroblocs /, j, et k, de l'image N sont perdus, le décodeur informe alors le codeur de la perte de ces macroblocs. De tels mécanismes sont notamment décrits dans les documents suivants:

- IETF/AVT Draft, Εxtended RTP Profile for RTCP-based Feedback (RTP/AVPF)", Ott, Wenger, Sato, Burmeister, Rey, août 2004 ; - ITU-T Video Coding Experts Group (ITU-T SG 16 Q.6), VCEG-X09,

"Introduction of a back channel for H.264", Loras, octobre 2004;

- ITU-T Video Coding Experts Group (ITU-T SG16 Q.6), VCEG-Y15, "Définition of a back channel for H.264: some results", Baillavoine, Jung, janvier 2004; - ITU-T, "Control protocol for multimédia communication,

Recommandation H.245", juillet 2003.

L'inconvénient de ce type de mécanisme réside dans l'absence de réaction, et donc, de traitement du codeur, suite à la réception par ce dernier de l'information selon laquelle des parties d'images ont été perdues.

Un but de la présente invention est d'améliorer la qualité d'un signal vidéo suite à des erreurs de transmission lorsqu'un canal de retour est présent du décodeur vers le codeur.

L'invention propose ainsi un procédé de codage vidéo, comprenant les étapes suivantes:

- a) coder des images successives d'une séquence vidéo pour générer des paramètres de codage, - b) inclure les paramètres de codage dans un flux de sortie à transmettre à une station comportant un décodeur,

- c) recevoir de ladite station des informations de retour sur ia restitution des images de la séquence vidéo par Ie décodeur,

- d) analyser les informations de retour pour : • d1 ) identifier, parmi les images restituées, si au moins une image comprend au moins une partie qui a été perdue au niveau du décodeur,

• d2) identifier, parmi les images codées s'étant succédées entre, d'une part, l'image restituée et, d'autre part, une image courante à coder, au moins une partie d'image qui se réfère à la partie perdue identifiée à l'étape d1 ),

- e) coder l'image courante de la séquence vidéo selon un mode de codage qui est fonction de l'identification ou de la non identification d'au moins une partie perdue telle qu'effectuée à l'étape d).

Une telle disposition permet ainsi, au niveau du codeur, d'adopter un mode de codage (Intra, Inter 16x16, Inter 8x8,...) qui soit le plus approprié en fonction du résultat de l'analyse des informations de retour.

Une telle disposition permet en particulier d'éviter, au niveau du codeur, le choix systématique du codage Intra en présence d'erreurs de transmission.

Dans des modes de réalisation du procédé selon l'invention, on a recours à l'une ou l'autre des dispositions suivantes :

- si au moins une partie perdue a été identifiée au cours de l'étape d1 ), l'image courante est codée en référence aux images précédentes de la séquence vidéo, en excluant ladite perdue identifiée à l'étape d1 ), ainsi que les parties d'images codées identifiées à l'étape d2) comme se référant à ladite partie perdue; - au cours de l'étape d'analyse d):

• l'étape d'identification d1 ) comprend la mémorisation d'un identifiant associé à l'image restituée, en correspondance avec au moins un paramètre d'état qui indique soit la perte, soit l'absence de perte, d'au moins une partie de l'image restituée,

• l'étape d'identification d2) comprend la mise à jour de la correspondance mémorisée à l'étape d1 ), en fonction de l'identification ou non, parmi les images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à la partie perdue identifiée à l'étape d1 );

- l'étape d'analyse d) comprend en outre une identification, parmi les images restituées, des parties d'images qui sont reçues au niveau du décodeur;

- au cours de l'étape d'analyse d):

• l'étape d'identification d1 ) comprend la mémorisation d'un identifiant associé à l'image restituée, en correspondance avec une pluralité de paramètres d'état dont certains sont destinés à indiquer respectivement les parties de l'image restituée qui sont reçues au niveau du décodeur, et dont certains autres sont destinés à indiquer respectivement les parties de l'image restituée qui sont perdues au niveau du décodeur,

• l'étape d'identification d2) comprend Ia mise à jour de la correspondance mémorisée à l'étape d1 ), en fonction de l'identification ou non, parmi les images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à la partie perdue identifiée à l'étape d1 ); - l'étape de mise à jour consiste à affecter à un paramètre d'état donné une valeur réelle comprise entre 0 et 1 , où:

• la valeur 0 indique, d'une part, l'identification d'au moins une partie perdue dans l'image restituée et, d'autre part l'identification d'au moins une partie d'image codée qui se réfère à la partie perdue,

• la valeur 1 indique l'identification d'au moins une partie reçue dans l'image restituée;

- la sélection du mode codage, pour une partie d'image donnée de l'image courante à coder, consiste à pondérer, au moyen de la valeur du paramètre d'état associé à la partie d'image donnée, une valeur qui est fonction de la distorsion de l'image courante à coder et du nombre de bits de codage de cette dernière.

Un autre aspect de l'invention se rapporte à un programme d'ordinateur à installer dans un appareil de traitement vidéo, comprenant des instructions pour mettre en œuvre les étapes d'un procédé de codage vidéo tel que défini ci-dessus lors d'une exécution du programme par une unité de calcul dudit appareil.

Un autre aspect de l'invention se rapporte à un codeur vidéo, comprenant:

- des moyens de codage d'images successives d'une séquence vidéo pour générer des paramètres de codage; - des moyens de formation d'un flux de sortie du codeur à transmettre à une station comportant un décodeur, le flux de sortie incluant lesdits paramètres de codage ;

- des moyens de réception depuis ladite station d'informations de retour sur la restitution des images de la séquence vidéo par Ie déœdeur; et - des moyens d'analyse des informations de retour qui comprennent:

• des premiers moyens d'identification pour identifier, parmi les images restituées, si au moins une image comprend au moins une partie qui a été perdue au niveau du décodeur, • des seconds moyens d'identification pour identifier, parmi les images codées s'étant succédées entre, d'une part, ladite image restituée et, d'autre part, une image courante à coder, au moins une partie d'image qui se réfère à ladite partie perdue identifiée par les premiers moyens d'identification, - des moyens de codage de ladite image courante de la séquence vidéo selon un mode de codage qui est fonction de l'identification ou de la non identification, par lesdits premiers moyens d'identification, d'au moins une partie perdue.

Dans des modes de réalisation du codeur selon l'invention, on a recours à l'une ou l'autre des dispositions suivantes :

- les premiers moyens d'identification identifient en outre, parmi les images restituées, des parties d'images qui sont reçues au niveau du décodeur;

- lesdits premiers moyens d'identification comprennent des moyens de mémorisation d'un identifiant associé à ladite image restituée, en correspondance avec une pluralité de paramètres d'état dont certains sont destinés à indiquer respectivement les parties de ladite image restituée qui sont reçues au niveau du décodeur, et dont certains autres sont destinés à indiquer respectivement les parties de ladite image restituée qui sont perdues au niveau du décodeur,

- lesdits seconds moyens d'identification comprennent des moyens de mise à jour de ladite correspondance mémorisée par Sesdits moyens de mémorisation, en fonction de l'identification ou non, parmi iesdîtes images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à ladite partie perdue identifiée par lesdits premiers moyens d'identification;

- lesdits moyens de mise à jour comprennent des moyens d'affectation à un paramètre d'état donné d'une valeur réelle comprise entre 0 et 1 , où:

- la valeur 0 indique, d'une part, l'identification d'au moins une partie perdue dans ladite image restituée et, d'autre part l'identification d'au moins une partie d'image codée qui se réfère à ladite partie perdue,

- la valeur 1 indique l'identification d'au moins une partie reçue dans ladite image restituée;

il est prévu en outre des moyens de sélection de mode de codage qui sont destinés à sélectionner, pour une partie d'image donnée de l'image courante à coder, un mode de codage choisi parmi au moins deux modes de codage, par pondération, au moyen de la valeur du paramètre d'état associé à ladite partie d'image donnée, d'une valeur qui est fonction de la distorsion de ladite image courante à coder et du nombre de bits de codage de cette dernière.

D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de réalisation non limitatifs, en référence aux dessins annexés, dans lesquels :

- la figure 1 est un schéma montrant deux stations en communication, pourvues de codeurs/décodeurs vidéo; - la figure 2 est un schéma synoptique d'un codeur vidéo selon l'invention;

- la figure 3 est un schéma synoptique d'un décodeur vidéo apte à restituer des images codées par le codeur de la figure 2,

- les figures 4a à 4d illustrent l'implémentation de l'analyse dans le codeur de la figure 2 des informations de retour selon un premier mode de réalisation; - les figures 5a à 5d illustrent l'implémentation de l'analyse dans le codeur de la figure 2 des informations de retour selon un second mode de réalisation;

Le procédé de codage selon l'invention est par exemple applicable à la visioconférence sur un réseau IP (sujet à des pertes de paquets), entre deux stations A et B (figure 1 ). Ces stations communiquent directement, en ce sens qu'aucun équipement de transcodage vidéo ne participe à leur communication.

Chaque station A, B utilise des média vidéo compressés selon une norme qui se base sur la prédiction (différence entre l'image courante et une image précédente) dont le but est de ne transmettre que ce qui a changé entre les deux images pour augmenter la compression. Une telle norme est par exemple la norme ITU-T H.264.

Dans une phase préalable de négociation, par exemple effectuée au moyen du protocole ITU-T H.323 bien connu dans le domaine de la visioconférence sur IP, les stations A, B se sont mises d'accord sur une configuration de dialogue, et, au moyen du protocole ITU-T H.241 , se sont mises d'accord sur une configuration de H.264 avec marquage à long terme, ainsi que sur l'établissement d'un canal de retour, par exemple de type ITU-T H.245.

Dans l'exemple d'application à la visioconférence, chaque station A, B est naturellement équipée à la fois d'un codeur et d'un décodeur (codée). Ici, nous supposerons que la station A est l'émetteur qui contient le codeur vidéo 1 (figure 2) et que la station B est le récepteur qui contient le décodeur 2 (figure 3). On s'intéresse donc au flux H.264 émis de A vers B et au canal de retour de B vers A.

Les stations A, B sont par exemple constituées d'ordinateurs personnels, comme dans l'illustration de la figure 1.

Comme on peut le voir sur (es figures 2 et 3, les ordinateurs A et B sont équipés chacun de systèmes de prise et de restitution d'images vidéo, d'une interface réseau 3, 4 pour le raccordement au réseau IP, ainsi que de logiciels de visioconférence exécutés par ['unité centrale de l'ordinateur. Pour fe codée vidéo, ces logiciels reposent sur des programmes implémeπtant H.264. Du côté du codeur, le programme est adapté pour inclure les particularités décrites ci- après. Bien entendu, le codée peut aussi être implémenté à l'aide d'un processeur spécialisé ou d'un circuit spécifique. Le procédé décrit peut aussi s'adapter à des normes de codage autres que H.264.

Dans H.264, le module de reconstruction d'images vidéo du décodeur 2 se trouve aussi dans le codeur 1. Ce module de reconstruction 5 est visible sur chacune des figures 2 et 3; il est composé d'éléments sensiblement identiques portant les mêmes références numériques 51-57. Le résidu de prédiction d'une image courante F, c'est-à-dire la différence calculée par un soustracteur 6 entre l'image F et une image prédite P, est transformé et quantifié par le codeur 1 (modules 7, 8 de la figure 2).

Un module de codage entropique 9 construit le flux de sortie Φ du codeur 1 qui inclut les paramétres de codage des images successives de la séquence vidéo (paramètres de prédiction et de quantification du résidu transformé) ainsi que divers paramètres de contrôle obtenus par un module de contrôle 10 du codeur 1.

Ces paramètres de contrôle indiquent en particulier quel est le mode de codage (Inter ou Intra) utilisé pour l'image courante et, dans le cas du codage Inter, la ou les images de référence à employer.

Du côté du décodeur 2, le flux Φ reçu par l'interface réseau 4 est soumis à un décodeur entropique 11 qui récupère les paramètres de codage et les paramètres de contrôle, ces derniers étant fournis à un module de contrôle 12 du décodeur 2. Les modules de contrôle 10, 12 supervisent respectivement le codeur 1 et le décodeur 2 en leur fournissant les commandes nécessaires pour connaître le mode de codage employé, désigner les images de référence en codage Inter, configurer et paramétrer les éléments de transformation, quantification et filtrage, etc. Pour le codage Inter, chaque image de référence utilisable F_R est stockée dans une mémoire tampon 51 du module de reconstruction 5. Celle-ci contient une fenêtre de N images reconstruites précédant immédiatement l'image en cours (images à court terme) et éventuellement une ou plusieurs images que le codeur a spécialement marquées (images à long terme).

Le nombre N d'images à court terme conservées en mémoire est contrôlé par le codeur 1. Il est habituellement limité pour ne pas occuper trop de ressources des stations A, B. Le rafraîchissement de ces images à court terme intervient au bout de N images du flux vidéo.

Chaque image marquée à long terme est conservée dans la mémoire tampon 51 du décodeur 2 (et dans celle du codeur 1 ) jusqu'à ce que le codeur produise une commande de démarquage correspondante. Ainsi, les paramètres de contrôle obtenus par le module 10 et insérés dans le flux Φ comportent également les commandes de marquage et de démarquage des images à long terme.

Les paramètres de prédiction pour le codage Inter sont calculés de façon connue par un module d'estimation de mouvement 15 en fonction de l'image courante F et d'une ou plusieurs images de référence F_R. L'image prédite P est générée par un module de compensation de mouvement 52 sur la base de la ou des images de référence F_R et des paramètres de prédiction calculés par le module 15.

Le module de reconstruction 5 comporte un module 53 qui récupère les paramètres transformés et quantifiés d'après les index de quantification produits par le module de quantification 8, Un module 54 opère la transformation inverse du module 7 pour récupérer une version quantifiée du résidu de prédiction. Celle-ci est ajoutée aux blocs de l'image prédite P par un additionneur 55 pour fournir les blocs d'une image pré-traitée PF'. L'image prétraitée PF^* est finalement traitée par un filtre de déblocage 57 pour fournir l'image reconstruite F' délivrée par Ie décodeur et enregistrée dans sa mémoire tampon 51. En mode Intra, une prédiction spatiale est effectuée de façon connue au fur et à mesure du codage par blocs de l'image courante F. Cette prédiction est effectuée par un module 56 sur la base des blocs déjà disponibles de l'image pré-traitée PF'.

Pour une qualité de codage donnée, la transmission de paramètres codés en Intra requiert généralement un débit plus important que celle de paramètres codés en Inter. En d'autres termes, pour un débit de transmission donné, le codage en Intra d'une image d'une séquence vidéo procure une moins bonne qualité que son codage en Inter.

La sélection entre les modes Intra et Inter pour une image courante est effectuée par le module de contrôle 10 du codeur 1 (figure 2), lequel, conformément à l'invention, se fonde sur les informations de retour en provenance du module de contrôle 12 du décodeur 2 (figure 3), telles qu'en particulier la perte d'une partie ou de plusieurs parties d'une image, mais également l'identification des parties reçues d'une image. De telles dispositions sont par exemple employées dans la norme ITU-T H.263+ (Annexe N) et sont transposables à d'autres normes telles que H.264.

Premier mode de réalisation

On va maintenant décrire, principalement en référence aux figures 2 et 4, un premier mode de réalisation dans lequel le codeur 1 effectue, pour une image courante, la sélection entre les modes Intra et Inter, suite à la réception d'informations de retour en provenance du décodeur 2 (figure 3) qui indiquent la perte d'une ou de plusieurs parties d'images traitées par ce dernier.

Dans l'exemple représenté, on suppose que les parties perdues de l'image sont les macroblocs de cette image.

Dans le mode de réalisation représenté sur la figure 2, le codeur 1 comprend :

- un module de mémorisation 16 dans lequel est stockée une table de correspondance TC qui, pour une image de référence à court terme ou long terme donnée, lui associe ses macrocblocs perdus au niveau du décodeur 2, - un module de mise à jour 17 destiné à mettre à jour Ia table de correspondance TC en fonction du résultat de l'analyse des informations de retour effectuée par le module de contrôle 10.

En particulier, le module de mise à jour 17 contient une table de mise à jour TMAJ qui, pour une image de référence à court terme ou long terme donnée, lui associe un ou plusieurs paramètres d'état indiquant si le décodeur 2 a identifié ou non, dans cette image, respectivement un ou plusieurs macroblocs perdus.

Supposons que dans l'exemple représenté à la figure 4a, la table de correspondance TC du module 16 comprend trois images de référence à court terme n-1, n-2, n-3, et une image de référence à long terme LT identifiées chacune par leur numéro dans un champ intitulé "Numéro d'image" et associées chacune à un ou plusieurs macroblocs perdus dans un champ "Macroblocs perdus".

Supposons maintenant qu'à l'instant t, le codeur 1 traite l'image n et que le décodeur 2 n'a signalé aucune perte au codeur 1.

En conséquence, en référence à la figure 4b, le module de mise à jour

17 actualise la table TMAJ, de telle façon que pour chaque image de référence indiquée dans le champ "Numéro d'image" soit associé un paramètre d'état indiqué dans un champ "Macroblocs exclus", ce paramètre d'état étant intitulé par exemple "vide", puisque aucune perte n'a été signalée par le décodeur 2.

Sur la base du contenu de la table de mise à jour TMAJ à l'instant t, le codeur 1 choisit alors de coder l'image n en mode Inter, via le module de compensation de mouvement 52, du fait de l'absence de dégradation des images de référence précédentes n-1 , n-2, n-3 et LT.

Supposons maintenant, en référence à la figure 4c, qu'à l'instant t+1, le décodeur 2 traite l'image n-1, tandis que le codeur traite l'image n+1. Au cours du traitement, le décodeur 2 identifie la perte d'un macrobloc de l'image n-1 , par exemple le macrobloc MB₁. Le décodeur 2 envoie alors cette information au codeur 1 , via le module de contrôle 12 et l'interface réseau 4 (figure 3).

Le module de contrôle 10 du codeur 1 analyse cette information et détecte l'identification de la perte du macrobloc MB, de l'image n-1. Comme on peut le voir à la figure 4b, la table de correspondance TC est alors modifiée à l'instant t+1 de telle façon que l'image n-1 soit associée à son macrobloc MB₁ perdu.

Dans le même instant t+1 , le codeur 1 identifie que l'image n+1 à coder doit exclure le macrobloc MB, de l'image n-1 , mais aussi tous les macroblocs de l'image n qui se réfèrent au macrobloc / de l'image n-1, tels que par exemple les macroblocs MB₁, MB,+i, MB₁₊₈, MB₁₊₉. A cet effet, le module de contrôle 10 active le module de mise à jour 17 pour actualiser la table de correspondance TMAJ.

Comme on peut le voir à la figure 4d, la table de correspondance TMAJ est actualisée à l'instant t+1 de telle façon que d'une part, l'image n-1 soit associée à un paramètre d'état qui indique la perte du macrobloc MB,, et que, d'autre part, l'image n soit associée à des paramètres d'état qui indiquent l'exclusion de ses macroblocs MB,, MB,+i, MB_1+S, MB₁₊₉. Dans l'exemple représenté, chaque paramètre d'état est représenté par l'indice du macrobloc à exclure, à savoir "i" pour le macrobloc perdu MB₁ de l'image n-1 et "i", "i+1",

"i+8", et "i+9" pour les macroblocs à exclure de l'image n.

Sur la base du contenu de la table de mise à jour TMAJ à l'instant t+1 , le codeur 1 choisit alors de coder l'image n+1 en mode Inter, via le module de compensation de mouvement 52, ceci afin de minimiser la dégradation de qualité de l'image n+1 suite à la détection de la perte du macrobloc MB,, signalée par le décodeur 2, et à la décision de l'exclusion des macroblocs MB₁, MBi+i, MB₁₊S, MB,₊9 précités. Le procédé favorise ainsi la reprise du codage non pas en fntra, comme procèdent les codeurs actuels en cas d'erreurs de transmission, mais plutôt en mode Inter. La gestion des tables TC et TMAJ est ainsi effectuée pour chaque image de la séquence vidéo.

Second mode de réalisation

On va maintenant décrire, principalement en référence aux figures 2 et 5, un second mode de réalisation dans lequel le codeur 1 effectue, pour une image courante, la sélection entre les modes Intra et Inter, suite à la réception d'informations de retour en provenance du décodeur 2 (figure 3) qui indiquent non seulement la perte d'une ou de plusieurs parties d'images traitées par ce dernier, comme dans le cas du premier mode de réalisation précité, mais également les parties reçues d'images traitées par le décodeur 2.

Dans l'exemple représenté, on suppose à nouveau que les parties perdues de l'image sont les macroblocs de cette image.

Le second mode de réalisation se distingue également du premier mode de réalisation en ce sens que :

- le module de mémorisation 16 comporte une table de correspondance TC dont le contenu diffère de celui de la table de correspondance TC précitée,

- le module de mise à jour 17 comporte une table de mise à jour TMAJ¹ dont le contenu diffère de celui de la table de mise à jour TMAJ précitée.

Plus précisément: - la table de correspondance TC associe, pour une image de référence à court terme ou long terme donnée, ses macroblocs perdus au niveau du décodeur 2, ainsi que ses macroblocs reçus par ce dernier,

- la table de mise à jour TMAJ" qui, pour une image de référence à court terme ou long terme donnée, associe à chacun de ses macroblocs perdus ou reçus MB₀, MBi,..., MB_n, un paramètre d'état ! qui sera indiqué par la suite "indice de confiance". Cet indice de confiance I est une valeur réelle comprise dans l'intervalle [0;1] où :

- la valeur 0 indique, pour un macrobloc donné, qu'il ne faut pas faire confiance à ce macrobloc, - la valeur 1 indique, pour un macrobloc donné, que ce macrobloc est fiable et qu'il est même conseillé de l'utiliser en tant que macrobloc de référence.

Supposons que dans l'exemple représenté à la figure 5a, la table de correspondance TC du module 16 comprend deux images de référence à court terme n-2, n-3, et une image de référence à long terme LT identifiées chacune par leur numéro dans un champ intitulé "Numéro d'image" et associées chacune, dans un champ intitulé "Macroblocs " à un ou plusieurs macroblocs perdus, mais également à un ou plusieurs macroblocs reçus.

Supposons maintenant qu'à l'instant t, le codeur 1 traite l'image n et que le décodeur 2 traite l'image n-2.

Supposons en outre qu'à cet instant t, le décodeur 2 ne signale aucune perte au codeur 1 sur l'image n-2.

En conséquence, la table de correspondance TC à l'instant t est comme représenté à la figure 5a.

A l'instant t, le module de mise à jour 17 actualise la table TMAJ', de telle façon que pour chaque image de référence indiquée dans le champ "Numéro d'image" soit associé à chaque macrobloc de cette image de référence une valeur d'indice de confiance I dans un champ intitulé "Indice de confiance".

Comme représenté sur la figure 5b, du fait qu'aucune perte n'a été signalée par le décodeur 2 en ce qui concerne les images n-2, n-3 et LT, pour chaque macrobloc associé aux images n-2, n-3 et LT, est associé l'indice de confiance I de valeur 1 , ce qui assure la fiabilité de tels macrobfocs. En revanche, en ce qui concerne l'image n-1 , que le décodeur 2 n'a pas encore traitée à l'instant t, une valeur d'indice de confiance I est alors associée à chaque macrobloc de l'image n-1 , cette valeur étant fixée à 0,5, dans l'exemple représenté, de façon à indiquer une incertitude sur le mode de codage qui sera choisi pour cette image.

Sur la base du contenu de la table de mise à jour TMAJ' à l'instant t, le module de compensation de mouvement 52 et le module de prédiction intra 56 calculent respectivement, pour chaque macrobloc identifié dans la table TMAJ¹, un critère de coût J= — • (D + λR) où:

- 1 est l'indice de confiance associé au macrobloc identifié, - D est la distorsion du macrobloc identifié, c'est-à-dire sa dégradation liée au codage Inter ou Intra

-R est le nombre de bits du macrobloc identifié à coder en mode Inter ou Intra.

Le choix du codage à l'instant t de l'image n en mode Inter ou Intra est ensuite effectué en fonction du critère de coût J évalué le plus bas.

Dans l'exemple représenté, c'est le critère de coût J calculé par le module d'estimation de mouvement 52 qui est le plus bas. En conséquence, l'image n est codée en mode Inter.

Supposons maintenant, en référence à la figure 5c, qu'à l'instant t+1, le décodeur 2 traite l'image n-1, tandis que le codeur traite l'image n+1.

Au cours du traitement, le décodeur 2 identifie la perte d'un macrobloc de l'image n-1 , par exemple le macrobloc MB₂. Le décodeur 2 envoie alors cette information au codeur 1 , via le module de contrôle 12 et l'interface réseau 4 (figure 3). Le module de contrôle 10 du codeur 1 analyse cette information et détecte l'identification de la perte du macrobloc ME$2. Comme on peut le voir à la figure 5c, la table de correspondance TC est alors modifiée à l'instant t+1 de telle façon que la perte du macrobloc MB2 de l'image n-1 soit identifiée au moyen du paramètre d'état "vide".

Dans le même instant t+1 , le codeur 1 identifie que l'image n+1 à coder doit exclure le macrobloc MB2 de l'image n-1 , mais aussi tous les macroblocs de l'image n qui se réfèrent au macrobloc MB₂ de l'image n-1, tels que par exemple les macroblocs MB₂ et MBi. A cet effet, le module de contrôle 10 active le module de mise à jour 17 pour actualiser la table de correspondance TMAJ¹.

Comme on peut le voir à la figure 5d, la table de correspondance

TMAJ' est actualisée à l'instant t+1 de telle façon que : pour chaque macrobloc associé aux images n-2, n-3 et LT est associée la valeur 1 de l'indice de confiance I, ce qui assure la fiabilité de tels macroblocs, - pour le macrobloc MB2 associé à l'image n-1 est associée la valeur 0, pusique ce macrobloc a été perdu, les autres macroblocs de l'image n-1 étant associés chacun à la valeur 1 de l'indice de confiance,

- pour chaque macrobloc de l'image n qui se réfère au macrobloc MB₂, en particulier les macroblocs MB₂ et MB₁, la valeur 0 de l'indice de confiance I leur est associée, les autres macroblocs de l'image n-1 étant par ailleurs chacun associés à la valeur d'incertitude 0,5 de l'indice de confiance I puisque le décodeur 2 n'a pas encore traitée l'image n à l'instant t+1.

Sur la base du contenu de la table de mise à jour TMAJ^* à l'instant t+1 , le module de compensation de mouvement 52 et le module de prédiction intra 56 calculent respectivement, pour chaque macrobloc identifié dans la table TMAJ", le critère de coût J précité. Dans l'exemple représenté, c'est le critère de coût J calculé par le module de prédiction Intra 56 qui est le plus bas. En conséquence, l'image n+1 est codée en mode Intra.

Ce second mode de réalisation permet ainsi d'optimiser encore davantage la stratégie de codage au niveau du codeur 1 , grâce à la pondération du critère de coût par l'indice de confiance, ce qui engendre le choix du mode de codage le plus adapté.

Ce second mode de réalisation permet avantageusement d'effectuer un compromis entre efficacité de codage et robustesse (résistance aux erreurs).

Claims

R E V E N D I C A T I O N S

1. Procédé de codage vidéo, comprenant les étapes suivantes:

- a) coder des images successives (F) d'une séquence vidéo pour générer des paramètres de codage, - b) inclure les paramètres de codage dans un flux de sortie (Φ) à transmettre à une station (B) comportant un décodeur (2),

- c) recevoir de ladite station des informations de retour sur la restitution des images de la séquence vidéo par le décodeur,

• d2) identifier, parmi les images codées s'étant succédées entre, d'une part, ladite image restituée et, d'autre part, une image courante à coder, au moins une partie d'image qui se réfère à ladite partie perdue identifiée à l'étape d1 ),

- e) coder ladite image courante de la séquence vidéo selon un mode de codage qui est fonction de l'identification ou de la non identification d'au moins une partie perdue telle qu'effectuée à l'étape d).

2. Procédé selon la revendication 1 , dans lequel si au moins une partie perdue a été identifiée au cours de l'étape d1 ), l'image courante est codée en référence aux images précédentes de la séquence vidéo, en excluant ladite perdue identifiée à l'étape d1 ), ainsi que les parties d'images codées identifiées à l'étape d2) comme se référant à ladite partie perdue;

3. Procédé selon Ia revendication 1 ou la revendication 2, dans lequel:

- ladite étape d'identification d1 ) comprend la mémorisation d'un identifiant associé à ladite image restituée, en correspondance avec au moins un paramètre d'état qui indique soit la perte, soit l'absence de perte, d'au moins une partie de l'image restituée,

- ladite étape d'identification d2) comprend la mise à jour de ladite correspondance mémorisée à l'étape d1 ), en fonction de l'identification ou non, parmi lesdites images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à ladite partie perdue identifiée à l'étape d1 )

4. Procédé selon la revendication 1 , dans lequel l'étape d'analyse d) comprend en outre une identification, parmi les images restituées, des parties d'images qui sont reçues au niveau du décodeur.

5. Procédé selon la revendication 4, dans lequel, au cours de l'étape d'analyse d):

- ladite étape d'identification d1 ) comprend la mémorisation d'un identifiant associé à ladite au moins une image restituée, en correspondance avec une pluralité de paramètres d'état dont certains sont destinés à indiquer respectivement les parties de ladite image restituée qui sont reçues au niveau du décodeur, et dont certains autres sont destinés à indiquer respectivement les parties de ladite image restituée qui sont perdues au niveau du décodeur,

- ladite étape d'identification d2) comprend la mise à jour de ladite correspondance mémorisée à l'étape d1 ), en fonction de l'identification ou non, parmi lesdites images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à ladite partie perdue identifiée à l'étape d1 ).

6. Procédé selon la revendication 5, dans lequel ladite étape de mise à jour consiste à affecter à un paramètre d'état donné une valeur réelle comprise entre 0 et 1 , où:

- la valeur 1 indique l'identification d'au moins une partie reçue dans ladite image restituée.

7. Procédé selon les revendications 1 et 6, dans lequel la sélection du mode codage, pour une partie d'image donnée de l'image courante à coder, consiste à pondérer, au moyen de la valeur du paramètre d'état associé à ladite partie d'image donnée, une valeur qui est fonction de la distorsion de ladite image courante à coder et du nombre de bits de codage de cette dernière.

8. Programme d'ordinateur à installer dans un appareil de traitement vidéo (A), comprenant des instructions pour mettre en œuvre les étapes d'un procédé de codage vidéo selon l'une quelconque des revendications 1 à 7 lors d'une exécution du programme par une unité de calcul dudit appareil.

9. Codeur vidéo (1 ), comprenant:

- des moyens (5-8, 10, 15) de codage d'images successives d'une séquence vidéo pour générer des paramètres de codage;

- des moyens (9) de formation d'un flux de sortie (Φ) du codeur à transmettre à une station (B) comportant un décodeur (2), le flux de sortie incluant fesdits paramètres de codage ;

- des moyens de réception depuis ladite station d'informations de retour sur la restitution des images de la séquence vidéo par le décodeur; et

- des moyens (10) d'analyse des informations de retour qui comprennent: • des premiers moyens d'identification (16) pour identifier, parmi les images restituées, si au moins une image comprend au moins une partie qui a été perdue au niveau du décodeur,

• des seconds moyens d'identification (17) pour identifier, parmi les images codées s'étant succédées entre, d'une part, ladite image restituée et, d'autre part, une image courante à coder, au moins une partie d'image qui se réfère à ladite partie perdue identifiée par les premiers moyens d'identification (16),

- des moyens de codage de ladite image courante de la séquence vidéo selon un mode de codage qui est fonction de l'identification ou de la non identification, par lesdits premiers moyens d'identification (16), d'au moins une partie perdue.

10. Codeur vidéo selon la revendication 9, dans lequel lesdits premiers moyens d'identification (16) identifient en outre, parmi les images restituées, des parties d'images qui sont reçues au niveau du décodeur (2).

11. Codeur vidéo selon la revendication 9 ou la revendication 10, dans lequel:

- lesdits premiers moyens d'identification (16) comprennent des moyens de mémorisation d'un identifiant associé à ladite au moins une image restituée, en correspondance avec une pluralité de paramètres d'état dont certains sont destinés à indiquer respectivement les parties de ladite image restituée qui sont reçues au niveau du décodeur, et dont certains autres sont destinés à indiquer respectivement les parties de ladite image restituée qui sont perdues au niveau du décodeur,

- lesdits seconds moyens d'identification (17) comprennent des moyens de mise à jour de ladite correspondance mémorisée par lesdits moyens de mémorisation, en fonction de l'identification ou non, parmi fesdites images codées qui se sont succédées, d'au moins une partie d'image qui se réfère à ladite partie perdue identifiée par lesdits premiers moyens d'identification (16).

12. Codeur selon la revendication 11 , dans lequel lesdits moyens de mise à jour comprennent des moyens d'affectation à un paramètre d'état donné d'une valeur réelle comprise entre 0 et 1 , où:

- la valeur 0 indique, d'une part, l'identification d'au moins une partie perdue dans ladite image restituée et, d'autre part l'identification d'au moins une partie d'image codée qui se réfère à ladite partie perdue, - la valeur 1 indique l'identification d'au moins une partie reçue dans ladite image restituée.

13. Codeur selon les revendications 9 et 12, comprenant en outre des moyens de sélection de mode de codage (10, 52, 56) qui sont destinés à sélectionner, pour une partie d'image donnée de l'image courante à coder, un mode de codage, par pondération, au moyen de la valeur du paramètre d'état associé à ladite partie d'image donnée, d'une valeur qui est fonction de la distorsion de ladite image courante à coder et du nombre de bits de codage de cette dernière.