FR2820255A1 - Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants - Google Patents
Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants Download PDFInfo
- Publication number
- FR2820255A1 FR2820255A1 FR0101174A FR0101174A FR2820255A1 FR 2820255 A1 FR2820255 A1 FR 2820255A1 FR 0101174 A FR0101174 A FR 0101174A FR 0101174 A FR0101174 A FR 0101174A FR 2820255 A1 FR2820255 A1 FR 2820255A1
- Authority
- FR
- France
- Prior art keywords
- coding
- image
- coded
- encoding
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
- H04N19/54—Motion estimation other than block-based using feature points or meshes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/553—Motion estimation dealing with occlusions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Procédé de codage vidéo par hybridation d'un codage de type MPEG et d'un codage par interpolation temporelle basée sur une représentation par maillages, ainsi que le procédé de décodage et la structure de la représentation binaire associée.
Description
<Desc/Clms Page number 1>
Procédés de codage et de décodage d'images, dispositifs, systèmes, signaux et applications correspondants.
Le domaine technique de l'invention est celui du codage à réduction de débit des séquences d'images animées, vidéo notamment.
Les applications du codage vidéo sont particulièrement nombreuses.
Citons de manière non exclusive : - La transmission de la TV numérique ; - La transmission vidéo en temps réel sur différents types de réseaux :
IP, mobiles, ("Streaming IP") ;
Le stockage informatique de vidéos.
IP, mobiles, ("Streaming IP") ;
Le stockage informatique de vidéos.
Le présent document décrit un nouveau procédé de codage vidéo par hybridation d'un codage de type MPEG et d'un codage par interpolation temporelle basée sur une représentation par maillages, ainsi que le procédé de décodage et la structure de la représentation binaire associée.
Par codage de type MPEG, on entend un codage basé sur une prédiction temporelle et une transformation en cosinus discrète basée sur une structure de blocs rigides, souvent de taille fixes, mais éventuellement de tille variable. Les 2 standards représentatifs pour cette famille de codages étant les normes MPEG-4 de la version 1 à 4 et ITU-T/H. 263 jusqu'à la version 2.
Les schémas de codage et décodage vidéo proposés à ce jour se répartissent en 2 catégories : - Les codages normalisés, soit par l'ISO/MPEG, soit par l'ITU-T, tous basés sur le même type de techniques (prédiction temporelle et une transformation en cosinus discrète basées sur une structure de blocs) - Les codages en cours de développement proposés par des laboratoires de recherche, qui font appel à un large panel de techniques : Codage par
Ondelettes, par Régions, par Fractales, par Maillages, etc..
Ondelettes, par Régions, par Fractales, par Maillages, etc..
Actuellement, le codage MPEG-4 est considéré comme l'état de l'art non seulement des codages normalisés, mais aussi de l'ensemble des codages publiés.
Les codages de type MPEG-4 ou ITU-T/H. 263++ sont considérés comme
<Desc/Clms Page number 2>
ayant atteint leurs limites, notamment à cause de la structure de blocs rigides de taille fixe utilisée comme support de l'ensemble des calculs et opérations de codage. En particulier, la prédiction temporelle des images au sein d'une séquence est insuffisamment exploitée.
Par ailleurs, les codages alternatifs publiés n'ont pas encore atteint un degré suffisant d'optimisation.
Ainsi, pour permettre d'obtenir des séquences vidéos codées à bas débit, les codeurs procèdent en général à une réduction de la taille des images et au sous- échantillonnage temporel de la séquence vidéo originale. Toutefois, la seconde technique a pour inconvénient de restituer des mouvements saccadés plus ou moins gênants pour l'utilisateur en fonction du niveau de sous-échantillonnage.
Pour éviter de telles saccades, il importe de reconstruire les images manquantes (non codées) au décodeur par interpolation temporelle.
Cependant, les techniques actuelles d'interpolation temporelle d'images ne permettent pas d'obtenir de résultats satisfaisants, surtout lorsqu'elle sont mise en oeuvre au seul décodeur. En effet, ces techniques sont la source d'artéfacts visuels liés aux techniques de compensation de mouvement basés blocs qui ne définissent qu'un seul vecteur mouvement pour l'ensemble des pixels d'un bloc.
L'objectif de l'invention est précisément de pallier les limitations des techniques antérieures.
Plus précisément, un objectif de l'invention est de fournir une technique de codage, et de décodage, de données d'images, qui permette d'obtenir un débit réduit et/ou une meilleure qualité d'image reconstruite, par rapport aux techniques connues.
Cet objectif est atteint, selon l'invention, à l'aide d'un procédé de codage d'images, mettant en oeuvre sélectivement au moins deux modes de codage d'images, optimisant chacun la compression d'au moins une image d'une séquence vidéo en fonction de critères d'optimisation différents.
Selon plusieurs modes de réalisation avantageux, une information sur le choix d'un desdits modes de codage peut être connue d'un décodeur selon au
<Desc/Clms Page number 3>
moins une des techniques appartenant au groupe comprenant : choix prédéfini, connu au codage et au décodage ; information représentative du choix incluse dans un flux de données comprenant au moins certaines des données d'images codées ; information représentative du choix incluse dans un flux de données indépendant des données d'images codées ; détermination du choix de façon intrinsèque, par le décodeur.
Avantageusement, le procédé comprend une étape de sélection d'un mode de codage à appliquer à ladite image, parmi au moins : un premier codage optimisant une représentation photométrique d'une image ; un second codage optimisant une représentation du mouvement entre au moins deux images.
Préférentiellement, ledit second codage tient compte d'au moins une image précédente et/ou au moins une image suivante codée à l'aide dudit premier codage.
De façon avantageuse, ledit second codage tient compte d'un champ de vecteurs mouvement calculé à partir de l'image immédiatement précédente codée à l'aide dudit premier codage et/ou d'un champ de vecteurs mouvement calculé à partir de l'image immédiatement suivante codée à l'aide dudit premier codage.
Dans ce cas, lesdits champs de vecteurs mouvement peuvent être utilisés pour déterminer un champ de vecteurs mouvement déduit, associé à une image codée à l'aide dudit second codage.
Selon un mode de réalisation préférentiel de l'invention, ladite étape de sélection repose sur la mise en oeuvre d'un sous-échantillonnage de facteur fixé N, une image sur N étant codée à l'aide dudit premier codage.
Avantageusement, cette valeur N est variable, en fonction d'au moins un critère prédéterminé.
Selon un mode de réalisation particulier, ledit premier codage met en oeuvre une transformation sur des blocs d'images et une prédiction temporelle par
<Desc/Clms Page number 4>
Dans ce dernier cas, on utilisera préférentiellement des images de type 1 (intra) et/ou de type P (prédictif) (et non, préférentiellement, des images de type B).
Selon un autre aspect particulier de l'invention, ledit second codage repose avantageusement sur la mise en oeuvre d'un maillage, et par exemple un maillage triangulaire.
Dans ce cas, le procédé comprend préférentiellement une étape de gestion des zones d'occlusions.
Les données produites peuvent être regroupées dans un flux unique.
Avantageusement, on peut prévoir au moins deux flux de données, pouvant être transmis sur des voies de transmission indépendantes.
Lesdits flux de données appartiennent avantageusement au groupe comprenant : une entête globale ; des données d'image codées selon ledit premier codage ; des données d'image codées selon ledit second codage.
La transmission des flux peut donc avoir lieu de façon indépendante. Cela permet notamment un décodage progressif et/ou partiel des images, en fonction des moyens et des besoins.
Ainsi, selon un mode de réalisation particulier de l'invention, on exploite notamment les aspects suivants :
Optimisation poussée des modules constitutifs des codages normalisés de type MPEG ou ITU-T/H. 263
Prédiction temporelle et codage d'erreur associé performants pour les techniques basées maillages.
Optimisation poussée des modules constitutifs des codages normalisés de type MPEG ou ITU-T/H. 263
Prédiction temporelle et codage d'erreur associé performants pour les techniques basées maillages.
En effet l'approche basée maillage permet d'éviter les effets de bloc habituels grâce à l'utilisation de champs de mouvement continus. De plus, la technique des maillages permet de détecter les occultations d'objets , ainsi qu'un codage de l'erreur bien adapté à ces zones. En combinant de plus un codage
<Desc/Clms Page number 5>
d'erreur de type MPEG autour de ces zones, il est possible d'améliorer sensiblement l'efficacité de l'interpolation à un coût largement inférieur aux images bidirectionnelles (images de type B) proposées par MPEG.
Ainsi, on peut coder efficacement l'information de base à une faible résolution temporelle grâce au codage de type MPEG, avec une bonne qualité, puis restituer la pleine fluidité de la séquence grâce au codage en mode interpolé par maillage.
L'invention concerne également, bien sûr : les procédés de décodage d'un signal d'images codé à l'aide du procédé de codage décrit ci-dessus ; les dispositifs de codage d'un signal d'images codé à l'aide du procédé de codage décrit ci-dessus ; les dispositifs de décodage d'un signal d'images codé à l'aide du procédé de codage décrit ci-dessus (comprenant avantageusement des moyens de détermination d'au moins une partie d'un champ de vecteurs et/ou d'au moins une partie des zones d'occlusion, similaires à ceux mis en oeuvre lors du codage) ; les dispositifs de stockage d'au moins un signal d'images codé à l'aide du procédé de codage décrit ci-dessus ; les systèmes de codage, de transmission et/ou de décodage d'un signal d'images codé à l'aide du procédé de codage décrit ci-dessus (le choix d'un desdits modes de codage pouvant avantageusement être connue d'un décodeur selon au moins une des techniques appartenant au groupe comprenant : choix prédéfini, connu au codage et au décodage ; information représentative du choix incluse dans un flux de données comprenant au moins certaines des données d'images codées ; information représentative du choix incluse dans un flux de données indépendant des données d'images codées ;
<Desc/Clms Page number 6>
détermination du choix de façon intrinsèque, par le décodeur) ; les produits programme d'ordinateur pour le codage et/ou le décodage d'un signal d'images codé à l'aide du procédé de codage ; les supports de données d'un tel programme.
L'invention concerne également les signaux de données d'images comprenant des données codées selon le procédé décrit ci-dessus.
Avantageusement, ce signal comprend au moins un indicateur indiquant si le procédé est ou non activé.
De façon préférentielle, le signal comprend une donnée précisant la structure des trames, en début de séquence vidéo et/ou dans chaque trame de signal.
Avantageusement, une séquence codée à l'aide dudit second codage débute par une entête précisant le nombre de trames codées selon ce second codage.
Selon un mode de réalisation particulier, le signal comprend au moins deux flux de données, pouvant être transmis sur des voies de transmission indépendantes.
Dans ce cas, lesdits flux de données appartiennent avantageusement au groupe comprenant : une entête globale ; des données d'image codées selon ledit premier codage ; des données d'image codées selon ledit second codage.
L'invention trouve des applications dans de nombreux domaines, et notamment dans les domaines appartenant au groupe comprenant : la télévision numérique ; la vidéo temps réel sur réseau IP ; la vidéo temps réel sur réseau vers les mobiles ; le stockage de données d'images.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description d'un mode de réalisation préférentiel de
<Desc/Clms Page number 7>
l'invention, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés parmi lesquels : la figure lest un schéma de principe du codage de l'invention ; la figure 2 présente un exemple de structure de maillage hiérarchique pour le mouvement ; la figure 3 illustre le principe de l'interpolation affine sur une maille triangulaire ;
la figure 4 est un exemple d'occultation détectée par recouvrement de triangles ; la figure 5 illustre le processus de transformation d'un triangle quelconque de l'image en une matrice carrée symétrique ; la figure 6 illustre la transformation d'un triangle quelconque en un triangle isocèle rectangle ; la figure 7 illustre un maillage hiérarchique et la représentation par arbre quaternaire associée ; la figure 8 est un exemple de décision de codage pour le maillage hiérarchique ; la figure 9 présente une structure globale d'un train binaire selon l'invention ; la figure 10 présente un diagramme bloc d'un décodeur selon l'invention.
Le mode de réalisation de l'invention décrit ci-après consiste essentiellement en l'hybridation d'un codage de type MPEG, par exemple MPEG- 4 avec un codage par maillage fonctionnant en mode interpolé, appelé également mode B ou images B dans les normes MPEG.
Notons que le codage MPEG-4 mentionné ici peut être remplacé par tout codeur basé sur des techniques équivalentes, c'est à dire utilisant une prédiction temporelle et une transformation en cosinus discrète basées sur une structure de blocs, et les quantifications et codages entropiques pour les informations générées.
En particulier, un codage ITU-T/H. 263++ peut être substitué au codage MPEG-4.
<Desc/Clms Page number 8>
Pour chaque image de la séquence entrant dans le codeur, ce dernier décide en fonction d'un certain processus de décision (par exemple, un sous- échantillonnage temporel de facteur fixé) de la coder avec le module d'encodage MPEG-4, ou bien avec le module d'encodage basé maillage.
Les images codées en mode maillage utilisent comme références pour leur prédiction temporelles les images codées en mode MPEG-4 située immédiatement avant ou immédiatement après le groupe d'images codées en mode maillage auxquelles elles appartiennent.
Le point clé de l'efficacité en compression de l'invention est que la compensation de mouvement basée maillage conduit à une prédiction temporelle très performantes, pour un coût de codage associée très faible.
En effet, cette technique : - Prend en compte différents types de mouvements dans les images - Traite proprement les recouvrements et découvrements de zones dus aux mouvements d'objets.
La figure 1 donne une vue générale du principe du codeur.
Tout d'abord, les images entrantes sont aiguillées soit vers le module d'encodage MPEG, soit vers le module d'encodage base maillage, selon un mode de décision donné, par exemple selon un rythme prédéfini : 1 image sur N est codée en MPEG, les autres en mode interpolé maillage. On note Nk les numéros des images codées en mode MPEG.
Toutes les autres images 11, Nk < I < Nk, l sont encodées par un encodeur basé sur un maillage, par exemple triangulaire, fonctionnant en mode interpolé dit mode B. le principe général de cet encodeur est le suivant :
1. Calcul des champs de mouvement avant et arrière entre les images Nk et Nk+t. ces champs sont modélisés sous forme de maillages, triangulaires.
1. Calcul des champs de mouvement avant et arrière entre les images Nk et Nk+t. ces champs sont modélisés sous forme de maillages, triangulaires.
2. Détection des zones d'occultation, non prédictibles, dans les images
Il à coder, à partir de la connaissance de ces champs de mouvement
3. Codage spécifique de ces zones d'occultation selon l'un des trois
Il à coder, à partir de la connaissance de ces champs de mouvement
3. Codage spécifique de ces zones d'occultation selon l'un des trois
<Desc/Clms Page number 9>
modes possibles suivants : - Prédiction avec l'une des images de référence (Nk, Nk+l'ou ces images compensées en mouvement avec leurs champs de mouvement) sans compensation de mouvement, puis codage de l'erreur de prédiction avec une technique basée maillage triangulaire - Prédiction avec l'une des images de référence (Nk, Nu, ou ces images compensées en mouvement avec leurs champs de mouvement) avec compensation de mouvement intra- image, puis codage de l'erreur de prédiction avec une technique basée maillage triangulaire - Codage intra-image basé avec une technique basée maillage triangulaire
4. Optionnellement, codage de type MPEG mode P de l'erreur résiduelle de prédiction ou de codage, limité à une zone autour de la zone d'occultation.
1. Calcul des champs de mouvement avant et arrière entre les images NjetN
Des champs de mouvement avant et arrière entre les images Nk et Nk+l sont calculés, sous la forme de maillages hiérarchiques, par exemple triangulaires, Tb k et Tfk+l, comme indiqué figure 2.
Des champs de mouvement avant et arrière entre les images Nk et Nk+l sont calculés, sous la forme de maillages hiérarchiques, par exemple triangulaires, Tb k et Tfk+l, comme indiqué figure 2.
De tels maillages sont obtenus par division de certaines mailles, par exemple, les mailles triangulaires sont divisées en 4 sous-triangles, en fonction d'un certain critère au cours du processus d'estimation du mouvement. A chaque niveau de la hiérarchie, les décisions de division ou non sont prises pour chaque maille. Une fois ces divisions décidées, les mailles adjacentes des mailles divisées sont alors divisées de sorte à conserver une structure de maillage conforme. Le maillage initial, avant division (sommet de la hiérarchie), peut être quelconque.
Dans l'exemple de la figure 2, l'estimateur de mouvement décide de diviser les triangles 3 et 8. ceci entraîne la division des triangles 2,4, 7 et 9. le processus
<Desc/Clms Page number 10>
est itéré jusqu'à un niveau prédéfini de hiérarchie.
Dans le cas de maillages triangulaire, l'expression du champ de mouvement défini par un maillage triangulaire T est donné sur chaque triangle e par :
où : e e dénote l'élément triangulaire de T contenant le point courant p de coordonnées x et y, e fer (e) 1 dénote l'ensemble de ses trois noeuds ou sommets, numérotés i, j, k de positions j5,, et ,
e (l = i, j, k) représente les coordonnées barycentriques du point p (x, y) dans l'élément triangulaire e,. k avec :
ff ; () = a- ; + jS/. t+y,', ef ;, ,', 7 ; e 9 ! L... ) =' ()-.
1 Tje (X@ Y) = 1 (x, y) = 0 sinon
Un tel modèle définit un champ partout continu. De plus, il permet un contrôle fin de la précision de représentation, caractéristique essentielle pour la compression.
Un tel modèle définit un champ partout continu. De plus, il permet un contrôle fin de la précision de représentation, caractéristique essentielle pour la compression.
A chaque niveau de la hiérarchie de maillages, les vecteurs nodaux de mouvement sont calculés de sorte à minimiser une erreur de prédiction. Différents estimateurs de mouvement basés maillages peuvent être utilisés, par exemple celui décrit dans le brevet FR no 98 11227, ou FR no 99 15568.
Le point important est que le maillage final résulte d'un processus hiérarchique à partir d'un maillage initial par divisions. Ce caractère hiérarchique est en effet mis à profit pour le codage différentiel des vecteurs nodaux de mouvement entre un noeud et ses noeuds parents (les extrémités de l'arc sur lequel il a été inséré). La structure du maillage est recalculée au décodeur à partir de la connaissance du maillage initial, et des indicateurs de division de mailles.
Ainsi, en fin de processus, 2 maillages de mouvement sont obtenus pour chaque groupe d'images comprises entre les images Nk et Nk+l'utilisés pour
<Desc/Clms Page number 11>
2. Détection des zones d'occultation A partir de ces 2 maillages, les zones d'occultation, c'est-à-dire non prédictibles dans l'image Nk à partir de l'image Nj ou vice-versa, du fait du recouvrement ou du découvrement d'objets, sont détectées.
Ces zones sont simplement définies par les triangles se recouvrant, une fois déplacés par leur vecteurs nodaux.
La figure illustre la détection d'occultation base sur le recouvrement de triangles après déplacement.
Le codeur peut poursuivre l'estimation de mouvement en désactivant les triangles des zones d'occultation, de manière à obtenir des vecteurs déplacement moins biaisés.
Ceci est cependant strictement interne à la stratégie du codeur, et au final, c'est 2 maillages de mouvement complets Tbk et Tfk+1 qui sont codés et insérés dans le train binaire. Le décodeur est alors capable de retrouver les zones d'occultation à partir de ces 2 maillages.
Ces zones d'occultation sont définies sur les images Nk et Nk, et une fois détectés, les triangles leur appartenant sont étiquettés en conséquence, au codeur comme au décodeur.
Cependant, le codeur a besoin de connaître ces zones sur les images Nk+l
a N-l. Celles-ci sont simplement obtenues par projection des maillages Tbk et Tfk+l sur l'image à coder, par application des vecteurs mouvement nodaux, renormalisés pour tenir compte de la distance temporelle entre l'image courante et l'image de référence Nk ou nez
3. Codage des zones d'occultation :
Pour chaque zone d'occultation, l'image de référence pour une éventuelle
prédiction est sélectionnée parmi 1k, IN (k+l)' mais aussi Ici, qui est l'image obtenue à l'instant 1 par compensation de mouvement avec le maillage T\ ou T'kl à un niveau où il n'y a pas encore de recouvrement de maille.
a N-l. Celles-ci sont simplement obtenues par projection des maillages Tbk et Tfk+l sur l'image à coder, par application des vecteurs mouvement nodaux, renormalisés pour tenir compte de la distance temporelle entre l'image courante et l'image de référence Nk ou nez
3. Codage des zones d'occultation :
Pour chaque zone d'occultation, l'image de référence pour une éventuelle
prédiction est sélectionnée parmi 1k, IN (k+l)' mais aussi Ici, qui est l'image obtenue à l'instant 1 par compensation de mouvement avec le maillage T\ ou T'kl à un niveau où il n'y a pas encore de recouvrement de maille.
Plus précisément, le choix entre INk et IN(k+1) dépend simplement du
<Desc/Clms Page number 12>
maillage T\ ou Tfk+l ayant engendré la zone courante d'occultation. Ensuite, ce maillage est utilisé pour prédire l'image et donner IcI'Le choix entre IcI et INk ou IN (k+l) se fait sur critère d'erreur de prédiction : l'image donnant l'erreur la plus faible est retenue. Ainsi, il suffit d'insérer 1 bit dans le flux binaire, par zone, pour coder le choix de la prédiction retenue.
Notons Ir l'image de référence sélectionnée.
Le reste du codage de ces zones consiste en 2 étapes : - Une étape de prédiction - Une étape de codage de l'erreur de prédiction ou de la texture originale en cas de mauvaise prédiction
3. 1 Prédiction résiduelle de la texture des zones d'occlusion
3 modes peuvent être utilisés, de manière exclusive. La décision est prise sur critère de moindre erreur.
3. 1 Prédiction résiduelle de la texture des zones d'occlusion
3 modes peuvent être utilisés, de manière exclusive. La décision est prise sur critère de moindre erreur.
Mode 1 :
Les valeurs Y, U et V d'un pixel de la zone sont simplement celle du pixel de même localisation de l'image de référence Ir. Soit Î, l'image résultante. On code alors l'erreur de prédiction entre Î, et Il.
Les valeurs Y, U et V d'un pixel de la zone sont simplement celle du pixel de même localisation de l'image de référence Ir. Soit Î, l'image résultante. On code alors l'erreur de prédiction entre Î, et Il.
Mode 2 :
Une estimation de mouvement est alors réalisée entre I, (l'image à coder) et ÎI (le résultat de la prédiction du mode 1) sur la zone d'occultation. Le maillage résultant, issu du dernier niveau du maillage T,, r=k ou k+ 1, avant les recouvrements de mailles, est alors codé ainsi que ses mouvement nodaux. Enfin, l'erreur résiduelle de prédiction est codée selon une procédure définie plus loin.
Une estimation de mouvement est alors réalisée entre I, (l'image à coder) et ÎI (le résultat de la prédiction du mode 1) sur la zone d'occultation. Le maillage résultant, issu du dernier niveau du maillage T,, r=k ou k+ 1, avant les recouvrements de mailles, est alors codé ainsi que ses mouvement nodaux. Enfin, l'erreur résiduelle de prédiction est codée selon une procédure définie plus loin.
Mode 3 :
On n'effectue aucune prédiction et on code les valeur originale des pixels de la zone.
On n'effectue aucune prédiction et on code les valeur originale des pixels de la zone.
4. Codage de la texture ou de l'erreur de prédiction sur les zones d'occultation.
La texture originale et l'erreur de prédiction subissent le même codage, dont le principe est le suivant :
<Desc/Clms Page number 13>
On suppose qu'un maillage triangulaire initial a pu être défini à partir du maillage de mouvement T, retenu pour la prédiction de la zone à coder. La façon de dériver ce maillage initial sera décrit plus loin.
La texture est alors approximée sur chaque maille en fonction d'un choix : - Les mailles riches en hautes fréquences sont codées à base de transformée en cosinus discrète, dite DCT - Les mailles plus lisses sont codées par un modèle d'éléments finis, affine.
Là encore, on va tirer partie d'une approche hiérarchique pour diminuer le coût de codage de la représentation par maillage.
L'approche retenue permet de conserver le faible coût de codage associé à une hiérarchie régulière de mailles tout en permettant l'adaptation locale au contenu des images permise par la décomposition irrégulière de mailles.
A partir du maillage initial grossier de la zone, les mailles sont subdivisées en 4 sous-mailles triangulaires jusqu'à un niveau donné.
Sur le dernier niveau, une permutation optionnelle des diagonales des quadrilatères engendrés par 2 triangles adjacents peuvent être permutée, si cela induit une baisse de l'erreur d'approximation.
4. 1 Initialisation du maillage de texture sur les zones d'occultation
Ce maillage est simplement donné par le dernier niveau de Tr (maillage résultant du déplacement de Tk ou Tk+l selon le sens retenu) avant apparition des retournements sur la zone considérée. Ainsi, on a un maillage de texture qui s'insère de manière naturelle dans le maillage mouvement, puisqu'extrait de ce dernier.
Ce maillage est simplement donné par le dernier niveau de Tr (maillage résultant du déplacement de Tk ou Tk+l selon le sens retenu) avant apparition des retournements sur la zone considérée. Ainsi, on a un maillage de texture qui s'insère de manière naturelle dans le maillage mouvement, puisqu'extrait de ce dernier.
4. 2 Représentations utilisées pour la texture sur les triangles
2 représentations sont combinées : l'interpolation affine et la DCT 4triangulaire.
2 représentations sont combinées : l'interpolation affine et la DCT 4triangulaire.
Interpolation affine
Les noeuds du maillage triangulaire portent l'information photométrique (couleur, erreur) et l'interpolation pour les points à l'intérieur du triangle est
Les noeuds du maillage triangulaire portent l'information photométrique (couleur, erreur) et l'interpolation pour les points à l'intérieur du triangle est
<Desc/Clms Page number 14>
La valeur v (p) du point p (x, y) intérieur au triangle e, défini par les 3 noeuds p,, ! = i, j, k est donné par l'équation suivante :
où #l (l= i, j, k) représente les coordonnées barycentriques du point p(x, y). v (p) peut être l'une des composantes photométriquesY, U ou V du point, ou encore l'erreur de prédiction pour ces composantes.
où #l (l= i, j, k) représente les coordonnées barycentriques du point p(x, y). v (p) peut être l'une des composantes photométriquesY, U ou V du point, ou encore l'erreur de prédiction pour ces composantes.
Plusieurs méthodes peuvent être employées pour le calcul des valeurs nodales, en particulier la méthodes des moindres carrés.
Transformation en cosinus discrète (DCT) sur les triangles
Le principe de la méthode consiste à transformer un triangle quelconque en un triangle de référence isocèle rectangle. Le contenu de ce triangle est alors symétrisé par rapport à l'hypoténuse pour donner une matrice carrée symétrique (figure 4).
Le principe de la méthode consiste à transformer un triangle quelconque en un triangle de référence isocèle rectangle. Le contenu de ce triangle est alors symétrisé par rapport à l'hypoténuse pour donner une matrice carrée symétrique (figure 4).
Une DCT classique (carrée) est alors appliquée à cette matrice. On peut montrer que la matrice transformée est aussi symétrique. Seul les coefficients de son triangle inférieur sont alors quantifiés puis codés statistiquement (codage entropique).
La figure 4 décrit les différentes étapes du processus : sélection du triangle T, transformation affine de celui-ci en un triangle isocèle rectangle T'. Du fait de la transformation affine, les pixels du triangle ne sont plus située sur une grille orthogonale régulière, et il convient de ré-échantillonner les valeurs photométriques de l'intérieur du triangle de référence. On utilise pour cela un processus analogue à celui d'une compensation de mouvement dans l'image (en l'occurrence la transformation affine), à l'aide d'un interpolateur, par exemple bilinéaire.
La transformation affine F et son inverse'sont définies par les équations suivantes :
<Desc/Clms Page number 15>
Les valeurs photométriques M (/, y) du triangle T' (donc du bloc M, symétrisé de T') sont obtenue par transformation inverse F-'puis interpolation F de la texture de l'image à coder :
où : le coefficient M (ipj x) est la valeur au point Q (X, Y) dont le transformé P (x, y) est F-' (Q) Ir dénote l'interpolateur utilisé pour calculer la valeur de l'image au point P (x, y), de coordonnées potentiellement non entières. La reconstruction t de la texture F est donnée par :
où It dénote la texture interpolée à partir des valeurs du bloc M', version quantifié de M.
Cette technique ne peut être appliquée qu'aux seuls triangles d'aire non nulle. Mais de tels triangles ne nécessitent pas de codage de texture par définition.
Contrairement à la SADCT (DCT adaptée à une forme), cette transformation ne garantie pas la reconstruction parfaite après transformation inverse, même en l'absence de quantification.
Afin de réduire l'erreur de reconstruction, un facteur d'échelleα est introduit pour le calcul du bloc Mi (de taille Ni x N,) pour chaque triangle i :
où : e E est la partie entière par excès, e A, est l'aire du triangle i.
où : e E est la partie entière par excès, e A, est l'aire du triangle i.
<Desc/Clms Page number 16>
En fait, a = 1 réalise un compromis intéressant, qui est plus efficace pour les triangles proche d'un isocèle. Le casa < 1 est utilisé conjointement au pas de quantification pour comprimer le volume d'information.
Une fois le bloc Mi défini pour chaque triangle, une transformation DCT classique leur est appliquée, et les coefficients transformés sont quantifiés selon plusieurs procédés possibles, par exemple une quantification scalaire uniforme, ou encore une quantification incrémentale avec la fréquence du coefficient transformée. L'emploi des matrices de quantification MPEG ou JPEG bien connues est également possible.
L'expression de la DCT est donnée par : F (u, v) = \ (u) X (v) cos (2 kcost+*f (i, j) . (., ) -, 1 if = 0 ' 1 sinon On a la relation F (u, v) = F (v, u) car : f (i, =/0 i) (Vu, v, i, j =0,..., N-l) par définition.
Par conséquent, on peut se contenter de ne calculer que les coefficients de la partie inférieure de la matrice transformée.
4. 3 codage global de texture
Comme indiqué précédemment, on utilise un maillage hiérarchique uniforme obtenu par division de chaque triangle d'un niveau donné de la hiérarchie en 4 sous-triangles, par insertion de noeuds au milieu des arcs. Le processus est répété itérativement jusqu'à un niveau maximal. Cette hiérarchie de triangles est également représentée et gérée par le codeur sous forme d'un arbre quaternaire (figure 5). Notons que seuls les triangles inclus dans la zone à coder sont pris en compte. Le procédé de construction du maillage initial de base garanti que tout triangle de la hiérarchie de maillage appartient à la zone à coder.
Comme indiqué précédemment, on utilise un maillage hiérarchique uniforme obtenu par division de chaque triangle d'un niveau donné de la hiérarchie en 4 sous-triangles, par insertion de noeuds au milieu des arcs. Le processus est répété itérativement jusqu'à un niveau maximal. Cette hiérarchie de triangles est également représentée et gérée par le codeur sous forme d'un arbre quaternaire (figure 5). Notons que seuls les triangles inclus dans la zone à coder sont pris en compte. Le procédé de construction du maillage initial de base garanti que tout triangle de la hiérarchie de maillage appartient à la zone à coder.
Le processus de codage par maillage d'une zone d'occultation peut être résumé de la manière suivante
<Desc/Clms Page number 17>
CD un maillage hiérarchique imbriqué est défini sur la zone à coder, par creation d'un maillage initial régulier puis sub-division itérative des triangles en 4 sous-triangles par insertion de nouveaux noeuds au milieu des arcs. Les valeurs aux noeuds sont calculées pour minimiser l'erreur d'approximation de la zone par le maillage (2) les valeurs des pixels sont approchées par une interpolation affine sur le triangle les contenant à partir de ses valeurs aux noeuds.
Pour chaque triangle de la hiérarchie, on évalue alors l'erreur d'approximation E puis on décide des différents mode de representation et codage en fonction de 2 seuils : cri et or, : (D si E < #1, l'interpolation affine est suffisante sur le triangle ; (z si al < E < a z, il faut utiliser un décomposition plus fine du triangle pour obtenir une bonne approximation, toujours par interpolation affine. On, ; (M if E < a z, le triangle est texturé et on code l'erreur d'interpolation affine en utilisant la DCT.
Enfin, sur le maillage le plus fin, on teste la diminution d'erreur apportée par la permutation de diagonale des quadrilatères formés par 2 triangles adjacents.
En cas de résultat positif, on valide cette permutation.
Selon les modes de codage choisis pour les différents triangles, on codes les différentes information de la manière suivantes
Les valeurs nodales YUV sont d'abord prédites à partir des valeurs des noeuds parents (extrémités de l'arc où on a inséré le noeud courant). La différence entre la valeur du noeud et sa valeur prédite est alors quantifiée.
Les valeurs nodales YUV sont d'abord prédites à partir des valeurs des noeuds parents (extrémités de l'arc où on a inséré le noeud courant). La différence entre la valeur du noeud et sa valeur prédite est alors quantifiée.
Enfin, la structure de l'arbre quaternaire (incluant les indicateurs de division ou non des triangles), les indicateurs de permutation de diagonales, les valeurs différentielles nodales de YUV et les coefficients DCT quantifiées sont codés par un codeur arithmétique et insérés dans le train binaire.
5. Résumé des information codée dans le flux binaire des trames codées par maillage
Chaque groupe de trames encodées en mode maillage entre Nk+l et Nk+l-l
Chaque groupe de trames encodées en mode maillage entre Nk+l et Nk+l-l
<Desc/Clms Page number 18>
(où Nk Nk+l sont respectivement la trame précédente et la trame suivante encodée en mode MPEG) est représenté comme un tout dans le flux binaire.
L'information véhiculé comprend, sous forme codée :
Une entête pour l'ensemble du groupe de trames, incluant entre autres le nombre réel de trames encodées
Les maillages de mouvement (structure et vecteurs déplacement des
noeuds) T\ et Tk+l
La texture d'erreur de prédiction ou originale, pour chaque image du groupe
6. Structure globale du train binaire
Le train binaire global consiste en une succession de trames encodées en mode MPEG, et de groupes de trames encodés en mode maillage, comme indiqué figure 8.
Une entête pour l'ensemble du groupe de trames, incluant entre autres le nombre réel de trames encodées
Les maillages de mouvement (structure et vecteurs déplacement des
noeuds) T\ et Tk+l
La texture d'erreur de prédiction ou originale, pour chaque image du groupe
6. Structure globale du train binaire
Le train binaire global consiste en une succession de trames encodées en mode MPEG, et de groupes de trames encodés en mode maillage, comme indiqué figure 8.
L'entête globale du train binaire représentatif de la séquence codée contient entre autre l'indication de codage hybride.
La partie du train binaire correspondant à un groupe de trames codées en mode maillage débute par une entête indiquant entre autre le nombre de trame effectivement codées, éventuellement nul.
Les différents flux de données (trains binaires) correspondant respectivement à l'entête globale de la séquence codée, aux images encodées MPEG et aux groupes d'i images encodées en mode interpolé par maillage peuvent être envoyées sur différentes voies indépendantes si besoin. En particulier, le procédé de codage permet le décodage hiérarchique (ou scalable) de la séquence, c'est à dire un décodage n'utilisant qu'un partie du débit total.
7. Processus de décodage
La figure 9 donne une vue générale du principe du décodage.
La figure 9 donne une vue générale du principe du décodage.
Tout d'abord, le décodage de l'entête permet d'activer le décodage hybride.
Ensuite, le décodeur reconnaît pour chaque partie du train binaire correspondant à une entité autonome s'il s'agit d'une trame encodée MPEG-4 ou d'un groupe de trames encodées par maillage.
Ensuite, le décodeur reconnaît pour chaque partie du train binaire correspondant à une entité autonome s'il s'agit d'une trame encodée MPEG-4 ou d'un groupe de trames encodées par maillage.
<Desc/Clms Page number 19>
Les trames MPEG-4 sont fournies au module de décodage MPEG-4, et les groupes de trames codées en mode maillage sont fournies au module de décodage par maillage.
7. 1 Décodage basé maillage
Tout d'abord, les maillages de mouvement Tbk and Tf(k+1) pour le groupe d'images Il, Nk < kNk+l sont décodés.
Tout d'abord, les maillages de mouvement Tbk and Tf(k+1) pour le groupe d'images Il, Nk < kNk+l sont décodés.
Ensuite, les zones d'occultation pour ces images sont retrouvées selon le même procédé qu'au codeur.
Les pixels en dehors des zones d'occultation sont simplement interpolés à partir des images INk et INK+1 et des champs de mouvement Tbk et Tfk+1.
Le maillage de texture le plus grossier (sommet de la hiérarchie) est retrouvé pour chaque zone d'occultation selon un procédé identique à celui du codeur.
L'information associée au maillage hiérarchique correspondant (indicateur de division de triangles, décisions d'interpolation affine ou de codage DCT, valeur YUV nodale différentielles et coefficients DCT quantifiés) est alors décodée et les valeurs YUV des pixels de ces zones reconstruits.
Claims (32)
- 2. Procédé de codage selon la revendication 1, caractérisé en ce qu'une information sur le choix d'un desdits modes de codage est connue d'un décodeur selon au moins une des techniques appartenant au groupe comprenant : choix prédéfini, connu au codage et au décodage ; information représentative du choix incluse dans un flux de données comprenant au moins certaines des données d'images codées ; information représentative du choix incluse dans un flux de données indépendant des données d'images codées ; détermination du choix de façon intrinsèque, par le décodeur.
- 3. Procédé de codage selon l'une quelconque des revendications 1 et 2, caractérisé en ce qu'il comprend une étape de sélection d'un mode de codage à appliquer à ladite image, parmi au moins : un premier codage optimisant sensiblement une représentation photométrique d'une image ; un second codage optimisant sensiblement une représentation du mouvement entre au moins deux images.
- 4. Procédé de codage selon la revendication 3, caractérisé en ce que ledit second codage tient compte d'au moins une image précédente et/ou au moins une image suivante codée à l'aide dudit premier codage.
- 5. Procédé de codage selon la revendication 4, caractérisé en ce que ledit second codage tient compte d'un champ de vecteurs mouvement calculé à partir de l'image immédiatement précédente codée à l'aide dudit premier codage et/ou d'un champ de vecteurs mouvement calculé à partir de l'image immédiatement suivante codée à l'aide dudit premier codage.<Desc/Clms Page number 21>
- 6. Procédé de codage selon la revendication 5, caractérisé en ce que lesdits champs de vecteurs mouvement sont utilisés pour déterminer un champ de vecteurs mouvement déduit, associé à une image codée à l'aide dudit second codage.
- 7. Procédé de codage selon l'une quelconque des revendications 3 à 6, caractérisé en ce que ladite étape de sélection repose sur la mise en oeuvre d'un sous-échantillonnage de facteur fixé N, une image sur N étant codée à l'aide dudit premier codage.
- 8. Procédé de codage selon la revendication 7, caractérisé en ce que N est supérieur à 2.
- 9. Procédé de codage selon l'une quelconque des revendications 7 et 8, caractérisé en ce que N est variable.
- 10. Procédé de codage selon l'une quelconque des revendications 3 à 9, caractérisé en ce que ledit premier codage met en oeuvre une transformation sur des blocs d'images et une prédiction temporelle par blocs.
- 11. Procédé de codage selon la revendication 10, caractérisé en ce que ledit premier codage est un codage MPEG-4.
- 12. Procédé de codage selon la revendication 11, caractérisé en ce que les images délivrées par ledit codage MPEG-4 comprennent des images de type 1 (intra) et/ou de type P (prédictif).
- 13. Procédé de codage selon l'une quelconque des revendications 3 à 12, caractérisé en ce que ledit second codage repose sur la mise en oeuvre d'un maillage.
- 14. Procédé de codage selon la revendication 13, caractérisé en ce que ledit maillage est triangulaire.
- 15. Procédé de codage selon l'une quelconque des revendications 13 et 14, caractérisé en ce qu'il comprend une étape de gestion des zones d'occlusions.
- 17. Procédé de codage selon la revendication 16, caractérisé en ce que lesdits flux de données appartiennent au groupe comprenant : une entête globale ; des données d'image codées selon ledit premier codage ; des données d'image codées selon ledit second codage.
- 18. Procédé de décodage d'un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 20. Dispositif de codage d'un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 21. Dispositif de décodage d'un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 22. Dispositif de décodage selon la revendication 21, caractérisé en ce que il comprend des moyens de détermination d'au moins une partie d'un champ de vecteurs et/ou d'au moins une partie des zones d'occlusion, similaires à ceux mis en oeuvre lors du codage.
- 23. Dispositif de stockage d'au moins un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 24. Système de codage, de transmission et/ou de décodage d'un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 25. Système selon la revendication 24, caractérisé en ce qu'une information sur le choix d'un desdits modes de codage est connue d'un décodeur selon au moins une des techniques appartenant au groupe comprenant : choix prédéfini, connu au codage et au décodage ; information représentative du choix incluse dans un flux de données comprenant au moins certaines des données d'images codées ; information représentative du choix incluse dans un flux de données indépendant des données d'images codées ; détermination du choix de façon intrinsèque, par le décodeur.<Desc/Clms Page number 23>
- 26. Produit programme d'ordinateur pour le codage et/ou le décodage d'un signal d'images codé à l'aide du procédé de codage de l'une quelconque des revendications 1 à 17.
- 27. Support de données d'un programme selon la revendication 26.
- 28. Signal de données d'images, caractérisé en ce qu'il comprend des données codées selon le procédé de l'une quelconque des revendications 1 à 17.
- 29. Signal selon la revendication 28, caractérisé en ce qu'au moins un indicateur indiquant si le procédé selon l'une quelconque des revendications 1 à 14 est ou non activé.
- 30. Signal selon l'une quelconque des revendications 28 et 29, caractérisé en ce qu'il comprend une donnée précisant la structure des trames, en début de séquence vidéo et/ou dans chaque trame de signal.
- 31. Signal selon l'une quelconque des revendications 28 à 30, caractérisé en ce qu'une séquence codée à l'aide dudit second codage débute par une entête précisant le nombre de trames codées selon ce second codage.
- 32. Signal selon l'une quelconque des revendications 28 à 31, caractérisé en ce qu'il comprend au moins deux flux de données, pouvant être transmis sur des voies de transmission indépendantes.
- 33. Signal selon la revendication 32, caractérisé en ce que lesdits flux de données appartiennent au groupe comprenant : une entête globale ; des données d'image codées selon ledit premier codage ; des données d'image codées selon ledit second codage.
- 34. Application du procédé de codage selon l'une quelconque des revendications 1 à 17 à au moins un des domaines appartenant au groupe comprenant : la télévision numérique ; la vidéo temps réel sur réseau IP ; la vidéo temps réel sur réseau vers les mobiles ; le stockage de données d'images.
Priority Applications (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0101174A FR2820255A1 (fr) | 2001-01-26 | 2001-01-26 | Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants |
FR0109425A FR2820256B1 (fr) | 2001-01-26 | 2001-07-13 | Procedes de codage et de decodage d'images, dispositifs, systemes signaux et applications correspondantes |
BR0206798-6A BR0206798A (pt) | 2001-01-26 | 2002-01-25 | Método de codificação e decodificação de imagens, dispositivos e aplicações correspondentes |
EP02701323A EP1354482A1 (fr) | 2001-01-26 | 2002-01-25 | Procede de codage et de decodage d'images, dispositifs, et applications correspondants |
CA2435933A CA2435933C (fr) | 2001-01-26 | 2002-01-25 | Procede de codage et de decodage d'images, dispositifs et applications correspondants |
US10/470,316 US7512179B2 (en) | 2001-01-26 | 2002-01-25 | Image coding and decoding method, corresponding devices and applications |
CNB028055551A CN1288914C (zh) | 2001-01-26 | 2002-01-25 | 图象编码与解码方法以及对应的装置和应用 |
MXPA03006662A MXPA03006662A (es) | 2001-01-26 | 2002-01-25 | Procedimientos de codificacion y decodificacion de imagenes, dispositivos y aplicaciones correspondientes. |
KR1020037009910A KR100922510B1 (ko) | 2001-01-26 | 2002-01-25 | 영상의 부호화 및 복호화 방법, 장치 및 그 애플리케이션 |
JP2002560391A JP2004520744A (ja) | 2001-01-26 | 2002-01-25 | 画像の符号化と復号のための方法及び装置、それに関連する用途 |
PCT/FR2002/000322 WO2002060184A1 (fr) | 2001-01-26 | 2002-01-25 | Procede de codage et de decodage d'images, dispositifs et applications correspondants |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0101174A FR2820255A1 (fr) | 2001-01-26 | 2001-01-26 | Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants |
Publications (1)
Publication Number | Publication Date |
---|---|
FR2820255A1 true FR2820255A1 (fr) | 2002-08-02 |
Family
ID=8859354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0101174A Pending FR2820255A1 (fr) | 2001-01-26 | 2001-01-26 | Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants |
Country Status (8)
Country | Link |
---|---|
US (1) | US7512179B2 (fr) |
EP (1) | EP1354482A1 (fr) |
JP (1) | JP2004520744A (fr) |
KR (1) | KR100922510B1 (fr) |
CN (1) | CN1288914C (fr) |
BR (1) | BR0206798A (fr) |
FR (1) | FR2820255A1 (fr) |
WO (1) | WO2002060184A1 (fr) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8421804B2 (en) | 2005-02-16 | 2013-04-16 | At&T Intellectual Property Ii, L.P. | System and method of streaming 3-D wireframe animations |
JP4240283B2 (ja) * | 2002-10-10 | 2009-03-18 | ソニー株式会社 | 復号装置及び復号方法 |
FR2849329A1 (fr) * | 2002-12-20 | 2004-06-25 | France Telecom | Procede de codage d'une image par ondelettes, procede de decodage, dispositifs, signal et applications correspondantes |
FR2852773A1 (fr) * | 2003-03-20 | 2004-09-24 | France Telecom | Procedes et dispositifs de codage et de decodage d'une sequence d'images par decomposition mouvement/texture et codage par ondelettes |
US20070080963A1 (en) * | 2004-01-06 | 2007-04-12 | Koninklijke Philips Electronics N.V. | Method of rendering graphical objects |
US8331445B2 (en) | 2004-06-01 | 2012-12-11 | Qualcomm Incorporated | Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques |
WO2006030103A1 (fr) * | 2004-09-15 | 2006-03-23 | France Telecom | Procede d'estimation de mouvement a l'aide de maillages deformables |
US7606303B2 (en) * | 2004-09-28 | 2009-10-20 | General Instrument Corporation | Method and apparatus to detect anchor frames from digital video streams |
ITMI20041971A1 (it) * | 2004-10-15 | 2005-01-15 | Uni Degli Studi Brescia | Metodo di codifica video scalabile |
KR100813963B1 (ko) * | 2005-09-16 | 2008-03-14 | 세종대학교산학협력단 | 동영상의 무손실 부호화, 복호화 방법 및 장치 |
WO2009032255A2 (fr) * | 2007-09-04 | 2009-03-12 | The Regents Of The University Of California | Procédé, logiciel et dispositifs de traitement de vecteur de mouvement hiérarchique |
FR2933565A1 (fr) * | 2008-07-01 | 2010-01-08 | France Telecom | Procede et dispositif de codage d'une sequence d'images mettant en oeuvre une prediction temporelle, signal, support de donnees, procede et dispositif de decodage, et produit programme d'ordinateur correspondants |
JP5112229B2 (ja) * | 2008-09-05 | 2013-01-09 | 株式会社エヌ・ティ・ティ・ドコモ | 配信装置、端末装置及びシステム並びに方法 |
JP5080406B2 (ja) * | 2008-09-05 | 2012-11-21 | 株式会社エヌ・ティ・ティ・ドコモ | 配信装置、端末装置及びシステム並びに方法 |
WO2011126283A2 (fr) * | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Procédé et appareil destinés à coder une vidéo sur la base d'un incrément de profondeur de bit interne et procédé et appareil destinés à décoder une vidéo de décodage sur la base d'un incrément de profondeur de bit interne |
KR101682147B1 (ko) | 2010-04-05 | 2016-12-05 | 삼성전자주식회사 | 변환 및 역변환에 기초한 보간 방법 및 장치 |
KR101750046B1 (ko) * | 2010-04-05 | 2017-06-22 | 삼성전자주식회사 | 트리 구조에 따른 부호화 단위에 기반한 인루프 필터링을 수반하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치 |
MY191783A (en) | 2010-04-13 | 2022-07-15 | Samsung Electronics Co Ltd | Video encoding method and video encoding apparatus and video decoding method and video decoding apparatus, which perform deblocking filtering based on tree-structure encoding units |
WO2019124191A1 (fr) * | 2017-12-18 | 2019-06-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Dispositif de codage, dispositif de décodage, procédé de codage, et procédé de décodage |
GB2580084B (en) * | 2018-12-20 | 2022-12-28 | Canon Kk | Video coding and decoding |
CN109816611B (zh) * | 2019-01-31 | 2021-02-12 | 北京市商汤科技开发有限公司 | 视频修复方法及装置、电子设备和存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4383272A (en) * | 1981-04-13 | 1983-05-10 | Bell Telephone Laboratories, Incorporated | Video signal interpolation using motion estimation |
GB2279531B (en) * | 1993-06-24 | 1997-07-16 | Sony Uk Ltd | Motion compensated image interpolation |
JP3089165B2 (ja) | 1994-11-10 | 2000-09-18 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | 動きベクトル探索装置 |
KR0181034B1 (ko) * | 1995-03-18 | 1999-05-01 | 배순훈 | 특징점 기반 움직임 추정을 이용한 움직임 벡터 검출 방법 및 장치 |
US5654771A (en) * | 1995-05-23 | 1997-08-05 | The University Of Rochester | Video compression system using a dense motion vector field and a triangular patch mesh overlay model |
KR100209793B1 (ko) * | 1995-10-28 | 1999-07-15 | 전주범 | 특징점 기반 움직임 추정을 이용하여 비디오 신호를 부호화 및 복호화하는 장치 |
GB9607645D0 (en) * | 1996-04-12 | 1996-06-12 | Snell & Wilcox Ltd | Processing of video signals prior to compression |
JPH11509709A (ja) * | 1996-05-06 | 1999-08-24 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | ビデオ画像を分割符号化及び復号する方法とシステム |
US6078619A (en) | 1996-09-12 | 2000-06-20 | University Of Bath | Object-oriented video system |
US6668091B1 (en) * | 1998-10-02 | 2003-12-23 | Samsung Electronics Co., Ltd. | 3D mesh coding/decoding method |
FR2794269B1 (fr) * | 1999-05-26 | 2001-08-17 | France Telecom | Procede de codage d'images, a partition triangulaire et transformation reversible, et procede de decodage correspondant |
FR2802377B1 (fr) * | 1999-12-09 | 2002-03-08 | France Telecom | Procede d'estimation de mouvement entre deux images avec gestion des retournements de mailles et procede de codage correspondant |
US6898320B2 (en) * | 2000-03-14 | 2005-05-24 | Samsung Electronics Co., Ltd. | Method for processing nodes in 3D scene and apparatus thereof |
FR2813485B1 (fr) * | 2000-08-24 | 2003-12-26 | France Telecom | Procede de construction d'au moins une image interpolee entre deux images d'une sequence animee, procedes de codage et de decodage, signal et support de donnees correspondant |
-
2001
- 2001-01-26 FR FR0101174A patent/FR2820255A1/fr active Pending
-
2002
- 2002-01-25 CN CNB028055551A patent/CN1288914C/zh not_active Expired - Fee Related
- 2002-01-25 US US10/470,316 patent/US7512179B2/en not_active Expired - Fee Related
- 2002-01-25 WO PCT/FR2002/000322 patent/WO2002060184A1/fr active Application Filing
- 2002-01-25 BR BR0206798-6A patent/BR0206798A/pt active Search and Examination
- 2002-01-25 JP JP2002560391A patent/JP2004520744A/ja active Pending
- 2002-01-25 EP EP02701323A patent/EP1354482A1/fr not_active Withdrawn
- 2002-01-25 KR KR1020037009910A patent/KR100922510B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US7512179B2 (en) | 2009-03-31 |
JP2004520744A (ja) | 2004-07-08 |
WO2002060184A1 (fr) | 2002-08-01 |
KR20030081403A (ko) | 2003-10-17 |
KR100922510B1 (ko) | 2009-10-20 |
CN1531824A (zh) | 2004-09-22 |
EP1354482A1 (fr) | 2003-10-22 |
BR0206798A (pt) | 2004-02-03 |
CN1288914C (zh) | 2006-12-06 |
US20040151247A1 (en) | 2004-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2820255A1 (fr) | Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants | |
US20200280730A1 (en) | Training end-to-end video processes | |
US10630996B2 (en) | Visual processing using temporal and spatial interpolation | |
FR2894421A1 (fr) | Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique | |
FR2764156A1 (fr) | Dispositif de pretraitement pour codage mpeg ii | |
CN111586412A (zh) | 高清视频处理方法、主设备、从设备和芯片系统 | |
FR2889017A1 (fr) | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants | |
FR2813485A1 (fr) | Procede de construction d'au moins une image interpolee entre deux images d'une sequence animee, procedes de codage et de decodage, signal et support de donnees correspondant | |
EP1393573A1 (fr) | Procedes et dispositifs de codage et de decodage d'images mettant en oeuvre des maillages emboites, programme, signal et application correspondants | |
EP1574068B1 (fr) | Procede de codage d'une image par ondelettes et procede de decodage correspondant | |
FR2794269A1 (fr) | Procede de codage d'images, a partition triangulaire et transformation reversible, et procede de decodage correspondant | |
FR2820256A1 (fr) | Procedes de codage et de decodage d'images, dispositifs, systemes signaux et applications correspondantes | |
WO2004100552A1 (fr) | Procede et systeme pour securiser l'embrouillage, le desembrouillage et la distribution de sequences visuelles vectorielles | |
Meessen et al. | WCAM: smart encoding for wireless surveillance | |
CN118433404A (zh) | 视频解码方法、视频编码方法及译码设备 | |
Rahimi et al. | Image compression using high order wedgelets in a generalized quad-tree | |
Joung | Context modeling approach for image/video coding | |
FR2817698A1 (fr) | Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques | |
WO2006053841A1 (fr) | Procede de codage predictif d'une sequence d'images, dispositif de codage, procede et dispositif de decodage et programme correspondants |