FR2919412A1 - Procede et dispositif de reconstruction d'une image. - Google Patents

Procede et dispositif de reconstruction d'une image. Download PDF

Info

Publication number
FR2919412A1
FR2919412A1 FR0756708A FR0756708A FR2919412A1 FR 2919412 A1 FR2919412 A1 FR 2919412A1 FR 0756708 A FR0756708 A FR 0756708A FR 0756708 A FR0756708 A FR 0756708A FR 2919412 A1 FR2919412 A1 FR 2919412A1
Authority
FR
France
Prior art keywords
block
image
prediction
images
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0756708A
Other languages
English (en)
Inventor
Guillaume Boisson
Patrick Lopez
Jerome Vieron
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority to FR0756708A priority Critical patent/FR2919412A1/fr
Priority to PCT/EP2008/059520 priority patent/WO2009013266A1/fr
Priority to EP08775247.3A priority patent/EP2177034B1/fr
Priority to US12/452,768 priority patent/US8379731B2/en
Publication of FR2919412A1 publication Critical patent/FR2919412A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention concerne un procédé de reconstruction d'une image appartenant à une séquence d'images, à partir de données numériques codées représentatives de ladite image courante. Il comprend les étapes suivantes :- construire (30, 34, 32, 36), pour chaque bloc de l'image des premiers et seconds blocs de prédiction à partir d'une première image (I1) et d'une seconde image (I2) précédemment reconstruites; et- calculer (38), pour chaque bloc, une valeur de confiance représentative de la proximité entre le contenu visuel du premier bloc de prédiction et le contenu visuel du second bloc de prédiction; et- reconstruire chaque bloc:- à partir d'une partie desdites données numériques codées représentative dudit bloc et de premières données auxiliaires calculées à partir des premier et second blocs de prédiction si la mesure de confiance est supérieure à un seuil prédéfini; et- à partir d'autres données si la mesure de confiance est inférieure ou égale au seuil prédéfini.

Description

PROCEDE ET DISPOSITIF DE RECONSTRUCTION D'UNE IMAGE
1. Domaine de l'invention L'invention se rapporte au domaine général du codage vidéo. Elle concerne, plus particulièrement, un procédé et un dispositif de reconstruction d'une image appartenant à une séquence d'images à partir de données numériques codées représentatives de ladite séquence d'images.
2. Etat de l'art Il est connu des codeurs vidéo aptes à recevoir en entrée une séquence d'images et à coder les images de la séquence selon un mode INTRA, i.e. indépendamment des autres images de la séquence ou selon un mode INTER, i.e. par prédiction temporelle à partir d'autres images de la séquence préalablement codées. De tels codeurs connus sous le nom de codeurs prédictifs sont particulièrement adaptés aux applications de type diffusion ( broadcast en anglais) numérique ou de type streaming dans lesquelles la séquence est codée une seule fois et décodée de nombreuses fois. De tels codeurs prédictifs sont relativement complexes par rapport aux décodeurs correspondants car ils mettent en oeuvre une estimation de mouvement. Or l'estimation de mouvement est une opération couteuse en ressource mémoire et en temps de calcul. Par ailleurs, en référence à la figure 1, il est connu des codeurs vidéo aptes à recevoir en entrée une séquence d'images source. Un tel codeur comprend un premier module 10 de codage classique, par exemple de type prédictif, apte à coder en mode INTRA les images d'une première sous-séquence de ladite séquence sous la forme d'un premier train binaire S1. Les images de la première sous-séquence sont appelées image clés. De tels codeurs comprennent, en outre, un second module de codage 12 de type Slepian-Wolf ou Wyner-Ziv apte à coder, sous la forme d'un second train binaire S2, les autres images de la séquence qui ne sont pas des images clés indépendamment desdites images clés. Les trains binaires S1 et S2 sont éventuellement multiplexés en un seul train binaire ou bien transmis séparément sur deux canaux indépendants. Ces images sont appelées images de Wyner-Ziv et notées WZ. Un tel codeur vidéo, connu sous le nom de codeur distribué, est décrit dans le document de B. Girod et al. intitulé Distributed Video Coding et publié dans la revue IEEE special isssue on advances in video coding and delivery . De tels codeurs vidéo sont relativement simples par rapport aux codeurs classiques car ils n'effectuent aucune prédiction de mouvement. Ils sont donc particulièrement adaptés aux applications utilisant des caméras numériques mobiles qui requièrent une faible consommation d'énergie. Les deux trains binaires S1 et S2 générés par le codeur vidéo sont transmis au travers d'un canal 14 à un décodeur 16. II est également envisageable de transmettre S1 et S2 séparément, chaque train binaire étant transmis au travers d'un canal dédié. Un tel décodeur 16 est apte à traiter conjointement les deux trains binaires S1 et S2 qui lui sont transmis via le canal 14 et à exploiter les dépendances statistiques existant entre les images clés et les images WZ, et entre les différentes images WZ, afin de générer une séquence d'images reconstruites. Plus précisément, le décodeur 16 comprend un premier module de décodage 160 apte reconstruire les images clés à partir du premier train binaire S1. A cet effet, le premier module de décodage 160 est adapté pour reconstruire des images de type INTRA codées par le premier module de codage 10. Le décodeur 16 comprend en outre un second module de décodage 162 apte à reconstruire les images WZ à partir du second train binaire S2 et de données auxiliaires. A cet effet, le second module de décodage 162 est adapté pour générer pour chaque image WZ des données auxiliaires à l'aide d'images clés préalablement reconstruites. Pour ce faire, le second module de décodage 162 comprend un module d'estimation de mouvement apte à estimer des informations de mouvement pour générer les données auxiliaires. Par exemple, en référence à la figure 2, le module d'estimation de mouvement est apte à estimer un champ de mouvement, dit vers l'arrière, entre une image clé 12 subséquente à l'image WZ courante et une image clé Il précédant l'image WZ courante. A cet effet, un vecteur de mouvement est associé à chacun des blocs B de 12, ce vecteur étant représentatif du mouvement entre ledit bloc B et un bloc B'l de Il. A chacun des blocs Bwz de l'image WZ courante un vecteur de mouvement est associé qui est déduit du vecteur de mouvement associé au bloc B de l'image I2 colocalisé au bloc courant Bwz. Notons (dX,dy") les coordonnées du vecteur de mouvement associé au bloc BWz, alors (dx,dy" )= (a * dx,a *d) où (dx,dy ) sont les coordonnées du vecteur de mouvement associé au bloc B de l'image 12 colocalisé au bloc courant BWz et où a=p/N, où (N-1) est le nombre d'images WZ entre les images h et 12 et p est l'indice de l'image WZ courante, p>_1. A partir des vecteurs de mouvement associés à chacun des blocs de l'image WZ courante une image de prédiction de l'image WZ courante, notée Pi, est construite. Dans cette image de prédiction Pi, le bloc Bpi colocalisé au bloc courant BWz est une copie du bloc B'2 de l'image h pointé par le vecteur de mouvement (dX,dy" ). Cette image de prédiction Pi représente les données auxiliaires utilisées pour reconstruire l'image WZ courante. De la même manière, une seconde image de prédiction P2 peut être construite en inversant le rôle des images clé h et 12 comme illustré sur la figure 3. A cet effet, un champ de mouvement vers l'avant est estimé entre l'image clé h et l'image clé 12. Dans ce cas, (dx,dy" )= ((1-a)*dx,(1-a)*dy) où (dx,dy) sont les coordonnées du vecteur de mouvement associé au bloc B' de l'image colocalisé au bloc courant BWz. A partir des vecteurs de mouvement associés à chacun des blocs de l'image WZ courante une image de prédiction de l'image WZ courante, notée P2, est construite. Dans cette image de prédiction P2, le bloc Bp2 colocalisé au bloc courant BWz est une copie du bloc B2 de l'image 12 pointé par le vecteur de mouvement (dX,dy" ). Cette image de prédiction P2 comprend des données auxiliaires utilisées pour reconstruire l'image WZ courante. De tels décodeurs 16 sont plus complexes que les décodeurs classiques car ils mettent en oeuvre une estimation de mouvement. Ils présentent, en outre, l'inconvénient de ne pas être efficaces dans certaines configurations comme par exemple dans le cas de changement de scène, de fondus ( fading en anglais), et d'occlusions. En effet, dans de telles configurations il est difficile d'effectuer une estimation de mouvement correcte. 3. Résumé de l'invention L'invention a pour but de pallier au moins un des inconvénients de l'art antérieur. L'invention concerne un procédé de reconstruction d'une image, dite image courante, appartenant à une séquence d'images, à partir de données numériques codées représentatives de l'image courante laquelle est divisée en blocs de pixels. Le procédé comprend les étapes suivantes : -construire, pour chaque bloc de l'image courante, un premier bloc de prédiction à partir d'une première image et d'une seconde image de la séquence précédemment reconstruites; - construire, pour chaque bloc de l'image courante, un second bloc de prédiction à partir de la première image et de la seconde image; - calculer, pour chaque bloc de l'image courante, une valeur, dite valeur de confiance, représentative de la proximité entre le contenu visuel du premier bloc de prédiction et le contenu visuel du second bloc de prédiction; et - reconstruire chaque bloc de l'image courante: - à partir d'une partie des données numériques codées représentative du bloc et de premières données auxiliaires calculées à partir des premier et second blocs de prédiction si la mesure de confiance du bloc est supérieure à un seuil prédéfini; et - à partir d'autres données numériques si la mesure de confiance du bloc est inférieure ou égale au seuil. Avantageusement, en ne prenant pas en compte les données images des images de prédiction si celle-ci sont jugées non pertinentes au regard d'un critère prédéfini, l'invention permet d'améliorer la qualité de reconstruction des images WZ notamment dans les configurations telles que les fondus, les changements de scène, configurations dans lesquelles une estimation de mouvement ne fournit pas une information pertinente. Selon un premier aspect de l'invention, la valeur de confiance est une fonction décroissante de la somme des valeurs absolues des différences pixel à pixel entre le premier bloc de prédiction et le second bloc de prédiction. Selon une variante, la valeur de confiance est une fonction décroissante de la somme des valeurs absolues des différences niveau à niveau entre un histogramme du premier bloc de prédiction et un histogramme du second bloc de prédiction.
Selon un second aspect de l'invention, les premières données auxiliaires sont égales à la moyenne pixel à pixel des premier et second blocs de prédiction. Selon un troisième aspect de l'invention, les autres données numériques sont constituées des données de la partie des données numériques codées représentative du bloc et de secondes données auxiliaires. Selon une caractéristique particulière, les secondes données auxiliaires sont calculées à partir de données image de l'image courante préalablement reconstruites.
L'invention concerne également un dispositif de reconstruction d'une séquence d'images, à partir de données numériques codées représentatives de la séquence d'images, les images étant divisées en blocs de pixels. Le dispositif comprend : - des premiers moyens de décodage pour reconstruire des premières images de la séquence, dites images clés ; - des moyens pour construire des premier et second blocs de prédiction pour chaque bloc de chacune des autres images de la séquence à partir d'une première image et d'une seconde image de la séquence précédemment reconstruites; - des moyens de comparaison pour calculer pour chaque bloc de chacune des autres images de la séquence, une valeur, dite valeur de confiance, représentative de la proximité entre le contenu visuel du premier bloc de prédiction et le contenu visuel du second bloc de prédiction du bloc; et -des seconds moyens de décodage pour reconstruire chaque bloc de chacune des autres images de la séquence : - à partir d'une partie des données numériques codées représentative du bloc et de premières données auxiliaires calculées à partir des premier et second blocs de prédiction si la mesure de confiance du bloc est supérieure à un seuil prédéfini; et - à partir d'autres données numériques si la mesure de confiance du bloc est inférieure ou égale au seuil. 4. Listes des fiqures L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, en référence aux figures annexées sur lesquelles : û la figure 1 illustre selon l'état de la technique un procédé de codage/décodage distribué; - la figure 2 illustre un procédé d'estimation d'un champ de mouvement vers l'arrière et de compensation de mouvement en vue de la construction d'une première image de prédiction; û la figure 3 illustre un procédé d'estimation d'un champ de mouvement vers l'avant et de compensation de mouvement en vue de la construction d'une seconde image de prédiction; - la figure 4 illustre un procédé de décodage selon l'invention; - la figure 5 illustre une variante du procédé de décodage selon l'invention; û la figure 6 illustre un dispositif de décodage selon l'invention; et - la figure 7 illustre une variante du dispositif de décodage selon l'invention.
5. Description détaillée de l'invention Une mise en oeuvre connue d'un procédé de codage de type Slepian- Wolf, est appelée méthode du syndrome ( Syndrom method en anglais). Supposons qu'un symbole X prennent ses valeurs dans l'ensemble E={X1, X2, XN}. Préalablement au codage du symbole X, l'ensemble E est divisé en K classes. Pour coder le symbole X, on code l'indice kx de la classe à laquelle il appartient, avec kx E {0, 1, ... K-11. En décodant, pour le symbole X, la valeur de l'indice de la classe à laquelle il appartient, notée kXeC il est possible de reconstruire la valeur du symbole X. Cette valeur, notée xrec, est la valeur de la classe d'indice kXecqui est la plus probable au regard d'une donnée auxiliaire. La donnée auxiliaire est générée à partir de symboles précédemment reconstruits. Dans le cas particulier de la vidéo, les images WZ sont codées selon la méthode du syndrome. Les valeurs de données image, par exemple de luminance ou de chrominance, associées à chaque pixel sont des valeurs entières comprises dans l'intervalle [0 ; 255]. Cet intervalle est divisé en K classes. Chaque classe d'indice k comprend les valeurs entières de l'intervalle [0 ; 255] qui sont congruentes à k modulo K. Par exemple, si K=10, la classe d'indice 0 comprend les valeurs entières de [0 ; 255] congruentes à zéro modulo 10, la classe 1 comprend les valeurs entières de [0 ; 255] congruentes à 1 modulo 10, etc. Plus précisément, la classe d'indice 0 comprend les valeurs {0, 10, 20, 30, ..., 230, 240, 250} et la classe d'indice 1 comprend les valeurs {1, 11, 21, 31, ..., 231, 241, 2511. A chaque pixel de coordonnées (p,q) d'une image WZ est associé un indice, noté kp,q, égal à l'indice de la classe à laquelle appartient la valeur de la donnée image associé audit pixel. Par exemple si la valeur de la donnée image du pixel de coordonnées (p,q) est égale à 30 alors kp, q = 0, si la valeur de la donnée image est égale à 44 alors kp,q = 4. Les indices associés à chacun des pixels des images WZ sont codés sous forme binaire par exemple par un procédé de codage entropique. Les indices codés sont transmis via un canal en vue d'un décodage ultérieur.
L'invention concerne un procédé de reconstruction d'une image WZ ou d'une partie d'une telle image, par exemple un bloc de pixels. Dans la suite de la description le procédé de reconstruction d'une image WZ divisée en blocs de pixels est décrit en référence aux figures 4 et 5. A l'étape 30, un premier champ de mouvement, dit vers l'arrière, est estimé. Ce premier champ de mouvement est représentatif du mouvement d'une seconde image 12 subséquente à l'image WZ courante vers une première image Il précédant temporellement l'image WZ courante, la première image et la seconde image ayant été préalablement reconstruites. Ces deux images peuvent être deux images clés ou deux images WZ ou une image clé et une image WZ. En outre, selon une variante, la première image et la seconde image précèdent temporellement l'image WZ ou suivent temporellement l'image WZ. Ce champ de mouvement est, par exemple, estimé par une méthode d'appariement de blocs, i.e. qu'un vecteur de mouvement vers l'avant est estimé pour chaque bloc de l'image WZ courante. Une telle méthode permet d'estimer des mouvements translationnels. Tout autre modèle de mouvement peut être utilisé.
A l'étape 32, un second champ de mouvement, dit vers l'avant, est estimé. Ce second champ de mouvement est représentatif du mouvement de la première image vers la seconde image 12. Ce champ de mouvement est, par exemple, estimé par une méthode d'appariement de blocs, i.e. qu'un vecteur de mouvement vers l'arrière est estimé pour chaque bloc de l'image WZ courante. Tout autre modèle de mouvement peut être utilisé.
A l'étape 34, une première image de prédiction Pi de l'image WZ courante, appelée image de prédiction vers l'avant, est construite à partir du premier champ de mouvement et de la première image comme décrit dans l'état de l'art en référence à la figure 2. L'image de prédiction Pi est constituée de blocs. Chaque bloc de Pi est un bloc de prédiction du bloc Bwz de l'image WZ courante colocalisé audit bloc de Pi.
A l'étape 36, une seconde image de prédiction P2 de l'image WZ courante, appelée image de prédiction vers l'arrière, est construite à partir du second champ de mouvement et de la seconde image comme décrit dans l'état de l'art en référence à la figure 3. L'image de prédiction P2 est constituée de blocs. Chaque bloc de P2 est un bloc de prédiction du bloc Bwz de l'image WZ courante colocalisé audit bloc de P2.
A l'étape 38, une ou plusieurs valeurs de confiance sont calculées pour l'image WZ courante. Ces valeurs sont représentatives de la proximité entre le contenu visuel de la première image de prédiction Pi et le contenu visuel de la seconde image de prédiction P2. A cet effet, les différences pixel à pixel entre les deux images de prédiction sont calculées. La différence associée au pixel de coordonnées (p,q) est notée diff(p,q).
Selon un premier mode de réalisation une valeur de confiance, notée CM(Bwz), est calculée pour chaque bloc Bwz de l'image WZ courante. Elle est, par exemple, calculée comme suit : CM(BWZ)= 1 . Selon diff(p,q) (p,4)EBwz
une variante, les histogrammes des deux blocs de prédiction Bpi et Bp2 du bloc Bwz sont construits et la valeur CM(Bwz) est alors calculée comme suit : CM(BWZ) = 1 , où diff hist(ng) est la différence entre la valeur diff hist(ng ) ngE NG de l'histogramme de Bpi associée au niveau ng et la valeur de l'histogramme de Bp2 associée au niveau ng et où NG est l'ensemble des valeurs ng possibles. Un niveau ng représente par exemple un niveau de luminance. Bpi est le bloc de Pi colocalisé au bloc courant Bwz et Bp2 est le bloc de P2 colocalisé au bloc courant Bwz. Si la valeur de confiance CM(Bwz) calculée pour le bloc courant Bwz dans l'image WZ est supérieure à un seuil prédéfini TH alors les deux blocs de prédiction Bpi et Bp2 du bloc courant construits aux étapes 34 et 36 sont considérés comme ayant un contenu visuel suffisamment proches et sont utilisés comme données auxiliaires pour reconstruire les données image associées aux pixels du bloc Bwz. Par exemple, la valeur moyenne des données image des pixels de coordonnées (p,q) dans les deux blocs de prédiction Bpi et Bp2 est utilisée comme donnée auxiliaire à l'étape 40 pour déterminer la valeur de la donnée image du pixel de coordonnées (p,q) dans l'image WZ reconstruite. Cette dernière valeur est déterminée à partir de l'indice décodé pour ce pixel, lui-même déterminé à partir d'une partie du second train binaire S2 représentative de ce pixel, et de la donnée auxiliaire associée. Par exemple, si l'indice décodé pour le pixel courant est 1 et si la donnée auxiliaire calculée pour ce pixel vaut 33, alors la valeur de donnée image 31 est associée à ce pixel. En effet, il s'agit de la valeur de la classe d'indice 1 la plus proche de la donnée auxiliaire calculée.
Si, en revanche, la valeur CM(Bwz) calculée pour le bloc courant Bwz est inférieure ou égale au seuil prédéfini TH alors les deux blocs de prédiction Bpi et Bp2 du bloc courant ne sont pas utilisés comme données auxiliaires pour reconstruire les données image des pixels du bloc Bwz courant. En effet, les deux blocs de prédiction Bpi et Bp2 sont considérés comme étant non pertinents. Dans ce cas, d'autres données auxiliaires sont utilisées lors de l'étape 42 pour déterminer la valeur des données images des pixels du bloc Bwz courant. Par exemple, la valeur moyenne de données images précédemment reconstruites associées à des pixels voisins du bloc courant Bwz dans l'image WZ peut être utilisée comme donnée auxiliaire.
Selon une variante illustrée par la figure 5, si la valeur de confiance calculée pour le bloc courant Bwz est inférieure ou égale au seuil prédéfini TH alors un signal est envoyé au codeur lors d'une étape 44 indiquant que l'information disponible n'est pas suffisante pour reconstruire les pixels du bloc Bwz courant et qu'il est nécessaire de renvoyer davantage d'information.
Cette solution est envisageable lorsqu'il existe une voie de retour du dispositif de décodage vers le dispositif de codage. Selon un second mode de réalisation, une valeur de confiance est calculée au niveau de l'image WZ courante, i.e. la même valeur de confiance 5 est associée à chaque bloc de l'image WZ courante. Elle est notée CM(Iwz) et est, par exemple, calculée comme suit : CM(IWZ)= 1 diff(p,q) (p,4)Elwz Avantageusement, en ne prenant pas en compte les données images des images de prédiction de l'image WZ courante si celle-ci sont jugées non pertinentes au regard d'un critère prédéfini, l'invention permet d'améliorer la 10 qualité de reconstruction des images WZ notamment dans les configurations telles que les fondus, les changements de scène, configurations dans lesquelles une estimation de mouvement ne fournit pas une information pertinente.
15 L'invention concerne également un dispositif de décodage décrit en référence aux figures 6 et 7. Sur ces figures, les modules représentés sont des unités fonctionnelles, qui peuvent ou non correspondre à des unités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant, ou constituer des 20 fonctionnalités d'un même logiciel. A contrario, certains modules peuvent éventuellement être composés d'entités physiques séparées. Par ailleurs, seuls sont représentés les éléments essentiels de l'invention. Le dispositif de décodage 6 peut comprendre d'autres éléments non représentés et bien connus de l'homme du métier, p.ex. un module de post-traitement des images 25 reconstruites. Le dispositif de codage 6 comprend notamment une entrée 60, éventuellement un module de démultiplexage 61, un premier module de décodage 62, une mémoire 64, un module d'estimation de mouvement 66, un module de prédiction 68, un module de comparaison 70, un second module 30 de décodage 72, et une sortie 74.
L'entrée 60 est apte à recevoir un train binaire S représentatif d'une séquence d'images provenant d'un codage distribué de ladite séquence d'images. Le module de démultiplexage 61 est apte à démultiplexer le train binaire S reçu de l'entrée 60 de manière à séparer le train binaire en un premier train binaire S1 représentatif des images clé et un second train binaire S2 représentatif des images WZ. Ce module est optionnel. En effet, selon une variante représentée sur la figure 7, le dispositif de décodage comprend deux entrées, la première entrée 76 étant apte à recevoir un premier train binaire S1 représentatif des images clé et la seconde entrée 78 étant apte à recevoir un second train binaire S2 représentatif des images WZ. Le premier module de décodage 62 est apte à reconstruire les images clés à partir du premier train binaire S1 reçu du module de démultiplexage. A cet effet, le premier module de décodage met en oeuvre un décodage de type H.264 si les images clé sont codées conformément à cette norme. Selon une variante le premier module de décodage 62 met en oeuvre un décodage de type MPEG-2 si images clé sont codées conformément à cette norme. Les images clés ainsi reconstruites sont stockées en mémoire 64 et transmises à la sortie 74.
Selon une caractéristique essentielle de l'invention, le module d'estimation de mouvement 66 est apte à estimer, conformément aux étapes 30 et 32 du procédé, un premier champ de mouvement et un second champ de mouvement entre une première image reconstruite et une seconde image reconstruite stockées en mémoire 64. Ces images reconstruites sont soit deux images clés, soit une image clés et une image WZ ou deux images WZ. Le module de prédiction 68 est apte à construire pour une image de WZ courante, conformément à l'étape 34 du procédé de l'invention, une première image de prédiction PI, dite image de prédiction vers l'avant, en fonction du premier champ de mouvement reçu du module d'estimation de mouvement 66 et des première et seconde images reconstruites stockées en mémoire 64. Le module de prédiction 68 est, en outre, apte à construire pour l'image de WZ courante, conformément à l'étape 36 du procédé de l'invention, une seconde image de prédiction P2, dite image de prédiction vers l'arrière, en fonction du second champ de mouvement reçu du module d'estimation de mouvement 66 et des première et seconde images reconstruites stockées en mémoire 64. Le module de comparaison 70 est apte à calculer, conformément à l'étape 38 du procédé de l'invention, une ou plusieurs valeurs de confiance par image WZ qui sont représentatives de la proximité entre le contenu visuel de la première image de prédiction PI et le contenu visuel de la seconde image de prédiction P2, lesdites deux images de prédiction étant reçues du module de prédiction 68. A cet effet, le module de comparaison 70 calcule la différence pixel à pixel entre l'image de prédiction vers l'avant et l'image de prédiction vers l'arrière. Le module de décodage 72 est apte à reconstruire conformément aux étapes 40 ou 42 du procédé de l'invention les images WZ à partir du second train binaire S2 reçu du module de démultiplexage 61 ou de la sortie 78 et éventuellement des images de prédiction vers l'avant et vers l'arrière en fonction des valeurs de confiance reçues du module de comparaison 70. Les images WZ ainsi reconstruites sont alors transmises par module de décodage 72 à la sortie 74.
Bien entendu, l'invention n'est pas limitée aux exemples de réalisation mentionnés ci-dessus. En particulier, l'homme du métier peut apporter toute variante dans les modes de réalisation exposés et les combiner pour bénéficier de leurs différents avantages.25

Claims (7)

Revendications
1. Procédé de reconstruction d'une image, dite image courante, appartenant à une séquence d'images, à partir de données numériques codées représentatives de ladite image courante laquelle est divisée en blocs de pixels, ledit procédé comprenant les étapes suivantes : - construire (30, 34), pour chaque bloc de l'image courante, un premier bloc de prédiction (Bpi) à partir d'une première image (Il) et d'une seconde image (12) de ladite séquence précédemment reconstruites; - construire (32, 36), pour chaque bloc de l'image courante, un second bloc de prédiction (Bp2) à partir de ladite première image (Il) et de ladite seconde image (12); le procédé étant caractérisé en ce qu'il comprend en outre les étapes suivantes : - calculer (38), pour chaque bloc de l'image courante, une valeur, dite valeur de confiance, représentative de la proximité entre le contenu visuel du premier bloc de prédiction (Bpi) et le contenu visuel du second bloc de prédiction (Bp2); et - reconstruire chaque bloc de l'image courante: - à partir d'une partie desdites données numériques codées représentative dudit bloc et de premières données auxiliaires calculées à partir des premier et second blocs de prédiction (Bpi, Bp2) si la mesure de confiance dudit bloc est supérieure à un seuil prédéfini (TH); et - à partir d'autres données numériques si la mesure de confiance dudit bloc est inférieure ou égale audit seuil (TH).
2. Procédé selon la revendication 1, dans lequel ladite valeur de confiance est une fonction décroissante de la somme des valeurs absolues des différences pixel à pixel entre le premier bloc de prédiction (Bpi) et le second bloc de prédiction (Bp2).
3. Procédé selon la revendication 1, dans lequel ladite valeur de confiance est une fonction décroissante de la somme des valeurs absolues des différencesniveau à niveau entre un histogramme du premier bloc de prédiction (Bpi) et un histogramme du second bloc de prédiction (Bp2).
4. Procédé selon l'une des revendications 1 à 3, dans lequel lesdites premières données auxiliaires sont égales à la moyenne pixel à pixel des premier et second blocs de prédiction (Bpi, Bp2).
5. Procédé selon l'une des revendications 1 à 4, dans lequel lesdites autres données numériques sont constituées des données de ladite partie desdites données numériques codées représentative dudit bloc et de secondes données auxiliaires.
6. Procédé selon la revendication 5, dans lequel lesdites secondes données auxiliaires sont calculées à partir de données image de ladite image courante préalablement reconstruites.
7. Dispositif de reconstruction d'une séquence d'images, à partir de données numériques codées représentatives de ladite séquence d'images, lesdites images étant divisées en blocs de pixels, ledit dispositif comprenant : - des premiers moyens de décodage (62) pour reconstruire des premières images de ladite séquence, dites images clés ; - des moyens (66, 68) pour construire des premier et second blocs de prédiction (Bpi, Bp2) pour chaque bloc de chacune des autres images de ladite séquence à partir d'une première image (Il) et d'une seconde image (12) de ladite séquence précédemment reconstruites; ledit dispositif étant caractérisé en ce qu'il comprend en outre : - des moyens de comparaison (70) pour calculer pour chaque bloc de chacune des autres images de ladite séquence, une valeur, dite valeur de confiance, représentative de la proximité entre le contenu visuel du premier bloc de prédiction (Bpi) et le contenu visuel du second bloc de prédiction (Bp2) dudit bloc; et - des seconds moyens de décodage (72) pour reconstruire chaque bloc de chacune des autres images de ladite séquence : - à partir d'une partie desdites données numériques codées représentative dudit bloc et de premières données auxiliaires calculées à partir des premier et second blocs de prédiction (Bpi, Bp2) si la mesure de confiance dudit bloc est supérieure à un seuil prédéfini (TH); et - à partir d'autres données numériques si la mesure de confiance dudit bloc est inférieure ou égale audit seuil (TH).
FR0756708A 2007-07-24 2007-07-24 Procede et dispositif de reconstruction d'une image. Pending FR2919412A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR0756708A FR2919412A1 (fr) 2007-07-24 2007-07-24 Procede et dispositif de reconstruction d'une image.
PCT/EP2008/059520 WO2009013266A1 (fr) 2007-07-24 2008-07-21 Procédé et dispositif de reconstruction d'une image
EP08775247.3A EP2177034B1 (fr) 2007-07-24 2008-07-21 Procédé et dispositif de reconstruction d'une image
US12/452,768 US8379731B2 (en) 2007-07-24 2008-07-21 Method and device for reconstructing a picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0756708A FR2919412A1 (fr) 2007-07-24 2007-07-24 Procede et dispositif de reconstruction d'une image.

Publications (1)

Publication Number Publication Date
FR2919412A1 true FR2919412A1 (fr) 2009-01-30

Family

ID=39402683

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0756708A Pending FR2919412A1 (fr) 2007-07-24 2007-07-24 Procede et dispositif de reconstruction d'une image.

Country Status (4)

Country Link
US (1) US8379731B2 (fr)
EP (1) EP2177034B1 (fr)
FR (1) FR2919412A1 (fr)
WO (1) WO2009013266A1 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007237313A1 (en) * 2007-12-03 2009-06-18 Canon Kabushiki Kaisha Improvement for error correction in distributed vdeo coding
AU2007242924A1 (en) * 2007-12-12 2009-07-02 Canon Kabushiki Kaisha Improvement for error correction in distributed video coding
US8599929B2 (en) * 2009-01-09 2013-12-03 Sungkyunkwan University Foundation For Corporate Collaboration Distributed video decoder and distributed video decoding method
CN109194974B (zh) * 2018-09-28 2020-12-01 北京网高科技股份有限公司 用于网络视频直播的媒体低延迟通信方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0648047A2 (fr) * 1993-10-11 1995-04-12 THOMSON multimedia Méthode et dispositif pour former un signal vidéo à l'aide d'un estimateur de mouvement et de voies de traitement de signal utilisant des procédés d'interpolation différents
US20040057523A1 (en) * 2002-01-18 2004-03-25 Shinichiro Koto Video encoding method and apparatus and video decoding method and apparatus
EP1610561A2 (fr) * 2004-06-27 2005-12-28 Apple Computer, Inc. Codage et décodage des images

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040258154A1 (en) * 2003-06-19 2004-12-23 Microsoft Corporation System and method for multi-stage predictive motion estimation
JP4047879B2 (ja) * 2005-08-23 2008-02-13 松下電器産業株式会社 動きベクトル検出装置および動きベクトル検出方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0648047A2 (fr) * 1993-10-11 1995-04-12 THOMSON multimedia Méthode et dispositif pour former un signal vidéo à l'aide d'un estimateur de mouvement et de voies de traitement de signal utilisant des procédés d'interpolation différents
US20040057523A1 (en) * 2002-01-18 2004-03-25 Shinichiro Koto Video encoding method and apparatus and video decoding method and apparatus
EP1610561A2 (fr) * 2004-06-27 2005-12-28 Apple Computer, Inc. Codage et décodage des images

Also Published As

Publication number Publication date
US20100322312A1 (en) 2010-12-23
WO2009013266A1 (fr) 2009-01-29
US8379731B2 (en) 2013-02-19
EP2177034B1 (fr) 2013-10-02
EP2177034A1 (fr) 2010-04-21

Similar Documents

Publication Publication Date Title
US10205958B2 (en) Video coding using temporally coherent dynamic range mapping
JP5521202B2 (ja) 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム
FR2948845A1 (fr) Procede de decodage d'un flux representatif d'une sequence d'images et procede de codage d'une sequence d'images
CN101176349B (zh) 可对视频信号缩放地进行编码和解码的方法
FR2773295A1 (fr) Appareil de compensation de deplacement et appareil et procede de codage d'images animees
EP2443835B1 (fr) Codage de vecteurs mouvement par compétition de prédicteurs
EP2279621B1 (fr) Procédé de codage, de décodage, codeur et décodeur
FR2919412A1 (fr) Procede et dispositif de reconstruction d'une image.
FR2932036A1 (fr) Procede et systeme permettant de proteger un flux video compresse contre les erreurs survenant lors d'une transmission
WO2019211541A2 (fr) Procédé et dispositif de décodage d'une vidéo multi-vue, et procédé et dispositif de traitement d'images
WO2019008254A1 (fr) Procédé de codage et décodage d'images, dispositif de codage et décodage et programmes d'ordinateur correspondants
EP2633686B1 (fr) Codage video echelonnable a partir d'un epitome hierarchique
US20130016775A1 (en) Video Encoding Using Visual Quality Feedback
FR2894759A1 (fr) Procede et dispositif de tatouage sur flux
FR2893806A1 (fr) Systeme de transmission d'images de dynamique elevee, unites et procedes de codage et de decodage pour ce systeme
EP2374278A1 (fr) Codage video base sur la compensation de mouvement global
FR2927758A1 (fr) Procede et dispositif de codage-decodage d'images video successives selon un flux video principal en pleine resolution et selon un flux video secondaire en qualite reduite
FR2916931A1 (fr) Procede de selection d'une donnee de codage et dispositif de codage implementant ledit procede
WO2019115899A1 (fr) Procédés et dispositifs de codage et de décodage d'une séquence vidéo multi-vues représentative d'une vidéo omnidirectionnelle
Martinez et al. DVC using a half-feedback based approach
FR2966681A1 (fr) Procede de codage d'une tranche d'image
US20240056654A1 (en) Method for playback of a video stream by a client
Maugey Distributed video coding of multiview sequences
FR3120174A1 (fr) Prédiction pondérée d’image, codage et décodage d’image utilisant une telle prédiction pondérée
FR3124674A1 (fr) Procede de traitement de flux video et equipement pour la mise en œuvre du procede