FR2813001A1 - Procede de conversion de format couleur d'une sequence d'images - Google Patents

Procede de conversion de format couleur d'une sequence d'images Download PDF

Info

Publication number
FR2813001A1
FR2813001A1 FR0010551A FR0010551A FR2813001A1 FR 2813001 A1 FR2813001 A1 FR 2813001A1 FR 0010551 A FR0010551 A FR 0010551A FR 0010551 A FR0010551 A FR 0010551A FR 2813001 A1 FR2813001 A1 FR 2813001A1
Authority
FR
France
Prior art keywords
group
pixels
coded
image
converted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0010551A
Other languages
English (en)
Other versions
FR2813001B1 (fr
Inventor
Edouard Francois
Dominique Thoreau
Gwenael Kervella
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technicolor SA
Original Assignee
Thomson Multimedia SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Multimedia SA filed Critical Thomson Multimedia SA
Priority to FR0010551A priority Critical patent/FR2813001B1/fr
Priority to EP01401966A priority patent/EP1185107A3/fr
Priority to CN01123861.5A priority patent/CN1232933C/zh
Priority to US09/924,322 priority patent/US7415068B2/en
Priority to JP2001240466A priority patent/JP2002094997A/ja
Publication of FR2813001A1 publication Critical patent/FR2813001A1/fr
Application granted granted Critical
Publication of FR2813001B1 publication Critical patent/FR2813001B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Le procédé est caractérisé en ce que, pour un groupe de pixels codé à convertir, si le mode de codage utilisé est du type inter sans résidu (6), la conversion est effectuée par une copie (8, 10) d'un groupe de pixels converti d'une image précédente (11) mis en relation par le vecteur mouvement associé au dit groupe de pixels codé. Les applications concernent l'affichage et la composition d'images.

Description

1 2813001
L'invention concerne un procédé et un dispositif de conversion de
format couleur d'une séquence d'images à partir de données vidéo codées.
La plupart des applications qui nécessitent un affichage vidéo travaillent avec des données vidéo encodées. Après décodage, ces données sont souvent disponibles dans un format qui n'est pas compatible des formats d'affichage ou de composition souhaités. Il est ainsi nécessaire, dans la plupart des cas, d'effectuer une conversion de format à partir des données vidéo comprimées, avant d'afficher l'image correspondante ou d'effectuer la composition d'images. Cette conversion de format est appliquée sur l'image complète et est généralement consommatrice de temps et d'espace mémoire, car elle implique des additions et multiplications
successives pour chaque pixel de l'image.
Par exemple, le format en sortie de décodage d'un flux de données vidéo binaires au standard H 263 est du type 4:2:0, Y U V. Les bibliothèques de logiciel Java d'interface graphique (AWT) fournissent des interfaces API (de l'anglais Application Program Interface) pour des formats d'image basés sur le format 4:4:4, R V B. Ainsi, I'utilisation d'une "applet" (application Java chargée via internet) pour un tel flux nécessite de convertir les images au format 4:2:0, Y U V en images au format 4:4:4, R V B. Le terme image utilisé par la suite pourra s'appliquer à tout type
d'image, trame, bitrame..., et quel que soit le type de balayage.
On appellera domaine de décodage ce qui concerne la réception par le décodeur des données codées et leur décodage et domaine d'affichage ce qui concerne l'exploitation des données décodées pour leur composition et leur affichage. Le procédé de conversion consiste à passer
du domaine de décodage au domaine d'affichage.
Les procédés de décodage exploitent habituellement un mode temporel prédictif dans lequel des images sont prédites à partir d'images
2 2813001
précédentes ou suivantes. Il s'agit par exemple de la norme MPEG 1, MPEG 2, MPEG 4, H261 ou H263. Dans ces normes, une image de type P (prédictive) est prédite à partir d'une image précédente de type I (intra) ou d'une image précédente de type P et une image de type B (bidirectionnelle) est prédite à partir d'une image précédente de type I ou P et d'une image suivante de type I ou P. Dans un exemple, pour le codage d'un bloc d'image dans une image, l'image précédente est reconstruite et une estimation de mouvement est effectuée pour déterminer, dans cette image reconstruite, le bloc corrélant le mieux avec le bloc d'image à coder. L'image reconstruite est alors compensée en mouvement à partir du vecteur mouvement correspondant à cette estimation pour fournir le bloc prédit. Le bloc prédit est
soustrait au bloc courant pour fournir un bloc résidu qui est codé et transmis.
Le procédé de décodage consiste à calculer les blocs prédits en reconstruisant les images précédentes et à y ajouter les résidus transmis de
l'image courante.
Dans le cas des images de type B ou P, les blocs sont prédits à partir de l'image de référence précédente et, pour le type B, également à partir de l'image de référence suivante. Ces images de référence sont reconstruites au niveau du décodeur et le bloc prédit est calculé à partir de
ces images et des vecteurs mouvement transmis dans le flux de données.
Le bloc résidu transmis dans le flux de données est décodé puis ajouté au bloc prédit défini par le vecteur mouvement associé pour fournir le bloc
d'image reconstitué dans l'image.
La figure 1 représente de manière très schématique le procédé de
décodage et de conversion des données.
Les données vidéo relatives aux images de référence sont reçues sur un circuit de prédiction temporelle 1 pour fournir des images prédites à un additionneur 3. Les données vidéo relatives à l'image courante sont reçues sur un circuit de décodage 2 pour fournir des images décodées à l'additionneur 3. Les données en sortie de l'additionneur 3, qui
3 2813001
correspondent à l'image reconstituée, sont transmises à un circuit de conversion de format 4 qui convertit les images pour les transmettre à un
afficheur ou à un circuit de composition d'images.
La structure sur laquelle s'appliquent les différentes opérations de compression de données, dans la norme MPEG, est le macrobloc. Les pixels sont groupés en blocs d'images, par exemple d'une taille de 16 x 16 pixels, quatre blocs luminance et les blocs chrominance correspondant constituant le macrobloc. Si le format d'image, lors du codage, est 4:2:0, Y, Cr, Cb, le
macrobloc est constitué de 4 blocs de luminance et 2 blocs de chrominance.
Dans le mode temporel prédictif, chaque macrobloc a son propre mode de décision. Autrement dit, le mode de codage est décidé pour chaque macrobloc. Il peut s'agir d'un codage de type intra pour lequel aucune prédiction n'est utilisée, de type prédictif exploitant un vecteur de mouvement différé (forward vector dans la norme), anticipé (backward vector) ou bidirectionnel. Un macrobloc d'une image de type P peut être codé en mode intra alors que le macrobloc suivant peut être codé en mode inter en utilisant
la compensation de mouvement à partir d'une image de référence.
D'autres modes de compression, qui ne sont pas forcément standardisés, sont basés sur des calculs relatifs à des groupes de pixels qui ne sont pas des blocs d'image tels que décrits dans la norme MPEG. Les modes de prédiction peuvent être basés sur des régions obtenues par
segmentation de l'image selon des critères d'homogénéité.
L'invention s'applique à ces groupes de pixels, appelés également gop par la suite. Il peut donc s'agir de macroblocs ou blocs d'image mais
également de structures plus complexes telles que des régions connexes.
Le mode de décision de codage est indépendant pour chaque gop, qui peut être codé indépendamment ou à partir d'images précédentes et/ou suivantes. L'invention proposée a pour but de pallier les inconvénients
précédemment décrits.
Elle a pour objet un procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, caractérisé en ce que, pour un groupe de pixels codé à convertir, si le mode de codage utilisé est du type inter sans résidu, la conversion est effectuée par une copie d'un groupe de pixels converti d'une image précédente mis en relation par le vecteur mouvement
associé au dit groupe de pixels codé.
Si le vecteur mouvement associé au groupe de pixels est nul, la conversion est effectuée par recopie du groupe de pixels co-localisé et, si le vecteur mouvement est différent de zéro, la conversion est effectuée par
compensation en mouvement dans une image convertie précédente.
Elle a également pour objet un procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, caractérisé en ce que, si pour un groupe de pixels codé à convertir une erreur de transmission des données codées entraîne un mode de masquage des erreurs équivalent à un décodage du type inter sans résidu, la conversion est effectuée par une copie d'un groupe de pixels converti d'une image précédente mis en relation
par le vecteur mouvement associé au dit groupe de pixels codé.
Elle a également pour objet un procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, les données codées comprenant des données complémentaires permettant l'échelonnabilité c'est à dire l'obtention d'images de résolutions différentes (12, 13, 14), caractérisé en ce que, dans le cas o les données complémentaires relatives à un groupe de pixels et à une résolution donnée (13, 14) ont pour valeur zéro, ce groupe de pixels pour l'image convertie de résolution donnée (13, 14) est obtenu à
partir d'un groupe de pixels convertis de l'image de résolution inférieure (12).
La conversion de format n'est ainsi pas appliquée à toute l'image
mais simplement aux groupes de pixels dont le résidu n'est pas nul.
Lorsque le mode de décodage est un mode de prédiction temporelle correspondant à une compensation de mouvement et à l'ajout d'un résidu, dans le cas o ce résidu est nul, la compensation de mouvement est appliquée dans le domaine d'affichage et non dans le domaine de décodage. S'il n'y a pas de compensation de mouvement, une
recopie d'un groupe de pixels convertis est effectuée.
L'invention a pour principal avantage d'optimiser le temps de calcul pour la conversion de format en exploitant les modes de décision utilisés pour chaque gop dans les cas de prédiction temporelle. La compensation en mouvement d'un gop dans le domaine d'affichage est généralement moins consommatrice de temps que la conversion de format de ce gop. A plus forte raison lorsque le mouvement est nul o il s'agit alors d'une simple recopie. Le décodeur est simplifié et son coût en est ainsi réduit. D'autres particularités et avantages de l'invention apparaîtront
clairement dans le description suivante donnée à titre d'exemple non limitatif
faite en regard des figures annexées qui représentent: - la figure 1, une représentation schématique du procédé de décodage et de conversion de données, - la figure 2, un organigramme du procédé de conversion, - la figure 3, différents formats de chrominance pour la conversion d'un macrobloc, - la figure 4, une illustration de l'échelonnabilité dans une structure macrobloc. Le procédé de conversion de format d'images selon l'invention est
décrit à la figure 2.
6 2813001
Une première étape 5 reçoit les données vidéo codées, par exemple sous forme d'un flux de données. Elle effectue un décodage de ces données. Elle mémorise les informations relatives au mode de codage, inter ou intra, au résidu et aux vecteurs mouvement pour chaque gop. Par exemple, un drapeau indique si le résidu est codé, c'est à dire non nul, ou s'il
n'est pas codé, c'est à dire s'il est nul.
La conversion de format est réalisée à partir des étapes suivantes: L'étape 6 effectue, pour chaque groupe de pixels successif, un
test sur le mode de codage utilisé.
Si le mode de codage est du type inter et si le résidu du gop est
nul (type inter sans résidu), alors l'étape suivante est l'étape 7.
Si le mode de codage n'est pas du type inter (codage intra) ou, dans le cas o le mode de codage est du type inter, si le résidu n'est pas nul, l'étape suivante est l'étape 9 qui réalise une conversion de format
classique pour le groupe de pixels considéré.
L'étape 7 effectue un nouveau test sur le mode de codage utilisé pour le groupe de pixels. Si le vecteur mouvement du gop est un vecteur nul, l'étape suivante est l'étape 8. Si le vecteur mouvement n'est pas un vecteur nul, l'étape suivante est l'étape 10 qui réalise une compensation de mouvement à partir de ce vecteur et de l'image précédente affichée, c'est à
dire convertie, qui est également transmise à cette étape.
L'étape 8 effectue une recopie du groupe de pixels de l'image précédente affichée qui est transmise à cette étape. Le gop dans le domaine
d'affichage est ainsi obtenu par simple recopie du gop correspondant (co-
localisé) de l'image précédente affichée.
Les sorties de l'étape 9, 10 et 8 correspondent aux groupes de pixels de l'image courante à afficher et ces sorties sont transmises à l'étape 11 qui effectue une mémorisation de ces groupes de pixels de cette image courante. Cette étape fournit, lors du traitement de l'image courante, l'image précédente mémorisée qui est transmise à l'étape 8 et 10 comme
7 2813001
précédemment indiqué. Cette image précédente est l'image de référence à partir de laquelle a été effectuée l'estimation de mouvement pour l'image courante. L'image courante complète est ainsi disponible en sortie des étapes 9, 10 et 8 pour un affichage sur l'écran après que l'ensemble des
groupes de pixels constituant cette image aient été traités.
Les informations mémorisées à l'étape 5 sont obtenues différemment selon la norme de codage utilisée. Dans le cas du standard MPEG2, un macrobloc résidu nul est rencontré dans le mode "macrobloc
sauté" (skipped macroblock dans la norme) et dans les modes "non codé".
Le mode "macrobloc sauté" consiste en un macrobloc pour lequel aucune donnée n'est codée. Tous les coefficients DCT sont considérés comme égaux à zéro. Le décodeur forme une prédiction concernant les macroblocs sautés en exploitant leur environnement temporel ou spatial. Le traitement des macroblocs sautés est différent selon qu'il s'agisse d'images de type P ou d'images de type B. Dans le cas d'images de type P, les prédicteurs de vecteurs de mouvement sont remis à zéro. Le vecteur de mouvement transmis a la
valeur zéro.
En conséquence, le macrobloc courant est le même que celui de
l'image précédente au même emplacement (co-localisé).
Dans le cas d'images de type B, le sens de la prédiction (anticipée
/ différée / bidirectionnelle) est le même que pour le macrobloc précédent.
Les prédicteurs de vecteur de mouvement ne sont pas modifiés.
Le mode "non codé" consiste, quant à lui, en un macrobloc qui contient un en-tête et aucune donnée concernant les coefficients DCT. Les vecteurs de mouvement anticipés et/ou différés sont obtenus, coté décodeur, grâce à l'entête macrobloc. Selon le type d'image, différentes configurations existent: - pour les images de type P, le mode compensé en mouvement (MC) non codé est utilisé. Si toutefois le vecteur de mouvement différé est
nul, on revient au mode macrobloc sauté.
- pour les images de type B, les différents modes de codage sont "différé non codé", "anticipé non codé", "interpolé non codé" (bidirectionnel). La figure 3 représente la conversion en un standard 4:4:4 R V B à partir de différents types de standards correspondant à des formats de
chrominance liés aux structures macrobloc.
Dans le mode inter, en dehors du mode "macrobloc sauté" o l'ensemble des blocs composant le macrobloc ne sont pas codés, les blocs composant le macrobloc peuvent être ou non codés. C'est l'information "structure pattern_code" ou code cbp (pour coded block pattern) qui indique
pour quels blocs un résidu n'est pas codé, c'est à dire a pour valeur zéro.
Selon une caractéristique de l'invention, la conversion des blocs luminance Y et chrominance Cr, Cb en blocs R, V, B se fait en fonction de la valeur du code cbp. Un exemple est donné ci-dessous: Format 4:2:0 Si le code cbp indique que les blocs b3, b4 et b5 du domaine Y, Cr, Cb ne sont pas codés, alors un ou plusieurs des blocs b3, b10 et bl1 du domaine R, G, B peuvent être une recopie des blocs de l'image précédente
et ne nécessitent pas de conversion.
Format 4:2:2 Si le code cbp indique que les blocs b3, b6 et b7 du domaine Y, Cr, Cb ne sont pas codés, alors les blocs b3, b10 et bl1 du domaine R, G, B peuvent être une recopie des blocs de l'image précédente et ne nécessitent
pas de conversion.
Format 4:4:4 Si le code cbp indique que les blocs b3, b10 et bl1 du domaine Y, Cr, Cb ne sont pas codés, alors les blocs b3, b 10 et bl 1 du domaine R, G, B
9 2813001
peuvent être une recopie des blocs de l'image précédente et ne nécessitent
pas de conversion.
Dans le cas o le gop est un bloc d'image, les informations de code cbp permettent donc de déterminer les blocs d'image à résidu nul, pour lesquels un traitement classique de conversion du bloc n'est pas nécessaire; le bloc d'image dans le domaine d'affichage est obtenu par simple recopie
d'un autre bloc dans ce domaine d'affichage.
Un cas particulier concerne les erreurs dans la transmission des
données codées empêchant le décodage de gops.
Les décodeurs, lorsqu'une erreur de transmission est reconnue, mettent en oeuvre des algorithmes de masquage d'erreur. Ces algorithmes de reconstitution de gops consistent à copier ou compenser en mouvement les données décodées relatives à une ou plusieurs images précédentes. Les gops manquants sont reconstitués à partir de gops et de vecteurs
mouvement précédemment codés.
Un exemple est une recopie simple du macrobloc co-localisé de l'image précédente. L'invention propose, au lieu d'appliquer la conversion de format au macrobloc que l'on va utiliser pour remplacer le macrobloc manquant, de recopier tout simplement le macrobloc co-localisé converti de
l'image précédente.
La conversion de format, pour ce qui concerne les gops manquants, n'est donc pas nécessaire. Le procédé selon l'invention est mis en oeuvre lors d'une détection d'erreur par le décodeur. Il applique la même opération de masquage d'erreur que dans le domaine de décodage. Mais la reconstitution des gops est effectuée dans le domaine d'affichage, c'est à
dire en partant de blocs convertis au lieu de blocs décodés.
Certains algorithmes mis en oeuvre par les décodeurs effectuent des opérations simples sur les données décodées, par exemple pour l'amélioration de qualité d'image ou l'adjonction d'un logo. Ainsi, un
2813001
algorithme de traitement peut décider, pour une image décodée déclarée trop sombre, d'ajouter une composante continue (offset) aux coefficients
DCT afin d'augmenter de manière artificielle la luminance.
Au lieu d'effectuer cette addition d'une valeur d'offset sur les données décodées pour obtenir le nouveau macrobloc, si l'on prend l'exemple d'un macrobloc, et ensuite le convertir dans le domaine d'affichage, l'invention propose, pour les macroblocs non codés, c'est à dire ayant un résidu nul, d'appliquer cette opération directement sur les macroblocs convertis. C'est le macrobloc converti correspondant au macrobloc à résidu nul qui est exploité et non le macrobloc décodé. On lui ajoute l'offset converti, cet offset étant différent dans le domaine de décodage et dans le domaine d'affichage, pour obtenir le nouveau
macrobloc converti.
La superposition d'un logo consiste en l'adjonction d'un signal dans plusieurs macroblocs décodés, opération identique pour toutes les images. La solution proposée consiste à ajouter ce signal ou plus exactement le signal converti, à des macroblocs convertis, c'est à dire dans
le domaine d'affichage.
Une autre application concerne l'échelonnabilité.
Certains codages tels que la norme MPEG2 ou MPEG4 prévoient une échelonnabilité (scalability en anglais) au niveau de la résolution de l'image. Une couche de base est d'abord codée. Cette couche de base peut être améliorée par l'adjonction de résidus provenant de couches successives d'amélioration, qui ont la même taille que les gops de la couche de base. Le même principe de conversion de format que celui proposé dans le cas de la
prédiction temporelle peut alors être appliqué ici.
La figure 4 représente une couche de base 12, une couche
niveau 1, 13 et une couche niveau 2, 14.
Le décodeur décode d'abord la couche de base puis éventuellement les couches de résolution supérieure. Ces différentes il 2813001 couches correspondent à des résidus qui sont ajoutés à la couche de base pour améliorer la précision dans l'image décodée. Dans l'exemple d'une structure macrobloc, si pour une couche donnée, le résidu d'un macrobloc est nul, la procédé consiste à copier le macrobloc converti de la couche précédente. Il n'est ainsi pas nécessaire d'effectuer une conversion de
format pour obtenir le macrobloc relatif à cette couche donnée.
On peut assimiler cette échelonnabilité, pour les gop de la couche de résolution supérieure, à un mode de codage inter sans résidu avec vecteur de mouvement nul. Le codage inter se fait entre la couche de niveau
de résolution supérieur et la couche de base.
Les formats de conversion décrits ici ne sont pas limitatifs et
l'invention s'applique à tout type de conversion de format.
Elle s'applique également aux modes de codages "inter dans I'intra" qui consistent à coder un gop d'une image non pas en fonction d'un gop d'une image précédente mais en fonction d'un gop précédent de la même image. Si le résidu est nul, le gop codé "inter dans l'intra" est converti
par simple recopie du gop déjà converti dans la même image.
L'invention est d'autant plus efficace que le codage entraîne un nombre important de blocs de résidu nuls, ce qui est le cas pour des applications ne nécessitant pas une grande qualité de restitution, en particulier des applications vidéo sur Internet o le débit est faible. Elle est également efficace pour des images de peu de mouvement par exemple
pour des applications vidéophone.

Claims (6)

REVENDICATIONS
1 Procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, caractérisé en ce que, pour un groupe de pixels codé à convertir, si le mode de codage utilisé est du type inter sans résidu (6), la conversion est effectuée par une copie (8, 10) d'un groupe de pixels converti d'une image précédente (11) mis en relation par le vecteur mouvement
associé au dit groupe de pixels codé.
2 Procédé selon la revendication 1, caractérisé en ce que, si le vecteur mouvement associé au groupe de pixels est nul (7), la conversion est effectuée par recopie (8) du groupe de pixels co-localisé (11) et, si le vecteur mouvement est différent de zéro (7), la conversion est effectuée par compensation en mouvement (10) dans une image convertie précédente (11). 3 Procédé selon la revendication 1, caractérisé en ce que les données sont codées selon la norme MPEG, en ce que le groupe de pixels est un bloc d'images et en ce que le mode de codage est déterminé à partir du code cbp (coded block pattern) définissant la répartition des blocs codés
dans le macrobloc.
4 Procédé selon la revendication 1, caractérisé en ce que les données sont codées selon la norme MPEG, en ce que le groupe de pixels est un macrobloc et en ce que le dit mode de codage est déterminé à partir
des modes "macrobloc sauté" ou "non codé".
13 2813001
Procédé selon la revendication 1, la conversion de format étant complétée d'une modification de l'affichage à partir d'une opération mathématique simple applicable au niveau du groupe de pixels décodé, caractérisé en ce que l'opération, adaptée au domaine d'affichage, est appliquée aux groupes de pixels convertis copiés. 6 Procédé selon la revendication 5, caractérisé en ce que
l'opération simple est l'ajout d'un offset.
7 Procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, caractérisé en ce que, si pour un groupe de pixels codé à convertir une erreur de transmission des données codées entraîne un mode de masquage des erreurs équivalent à un décodage du type inter sans résidu, la conversion est effectuée par une copie d'un groupe de pixels converti d'une image précédente mis en relation par le vecteur mouvement
associé au dit groupe de pixels codé.
8 Procédé de conversion de format couleur d'une séquence d'images à partir de données vidéo codées sur la base d'une structure de groupes de pixels, les données codées comprenant des données complémentaires permettant l'échelonnabilité c'est à dire l'obtention d'images de résolutions différentes (12, 13, 14), caractérisé en ce que, dans le cas o les données complémentaires relatives à un groupe de pixels et à une résolution donnée (13, 14) ont pour valeur zéro, ce groupe de pixels pour l'image convertie de résolution donnée (13, 14) est obtenu à partir d'un
groupe de pixels convertis de l'image de résolution inférieure (12).
FR0010551A 2000-08-11 2000-08-11 Procede de conversion de format couleur d'une sequence d'images Expired - Fee Related FR2813001B1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0010551A FR2813001B1 (fr) 2000-08-11 2000-08-11 Procede de conversion de format couleur d'une sequence d'images
EP01401966A EP1185107A3 (fr) 2000-08-11 2001-07-23 Procédé de conversion de format couleur d'une séquence d'images
CN01123861.5A CN1232933C (zh) 2000-08-11 2001-08-07 图像序列的格式转换方法
US09/924,322 US7415068B2 (en) 2000-08-11 2001-08-08 Process for the format conversion of an image sequence
JP2001240466A JP2002094997A (ja) 2000-08-11 2001-08-08 画像シーケンスのフォーマット変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0010551A FR2813001B1 (fr) 2000-08-11 2000-08-11 Procede de conversion de format couleur d'une sequence d'images

Publications (2)

Publication Number Publication Date
FR2813001A1 true FR2813001A1 (fr) 2002-02-15
FR2813001B1 FR2813001B1 (fr) 2002-12-20

Family

ID=8853484

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0010551A Expired - Fee Related FR2813001B1 (fr) 2000-08-11 2000-08-11 Procede de conversion de format couleur d'une sequence d'images

Country Status (5)

Country Link
US (1) US7415068B2 (fr)
EP (1) EP1185107A3 (fr)
JP (1) JP2002094997A (fr)
CN (1) CN1232933C (fr)
FR (1) FR2813001B1 (fr)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100522595B1 (ko) 2002-11-29 2005-10-19 삼성전자주식회사 엠펙 비디오 복호화방법 및 엠펙 비디오 복호화기
JP4148041B2 (ja) * 2003-06-27 2008-09-10 ソニー株式会社 信号処理装置および信号処理方法、並びにプログラムおよび記録媒体
FR2881898A1 (fr) * 2005-02-10 2006-08-11 Thomson Licensing Sa Procede et dispositif de codage d'une image video en mode inter ou intra
FR2932050B1 (fr) * 2008-06-03 2010-05-21 Canon Kk Procede et dispositif de transmission de donnees video
US9602762B2 (en) * 2015-06-12 2017-03-21 Sharp Laboratories Of America, Inc. Fallback in frame rate conversion system

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0651574A1 (fr) * 1993-03-24 1995-05-03 Sony Corporation Procede et appareil pour le codage/decodage de vecteurs de mouvement, et procede et appareil pour le codage/decodage de signaux d'image
US5442400A (en) * 1993-04-29 1995-08-15 Rca Thomson Licensing Corporation Error concealment apparatus for MPEG-like video data
GB2305833A (en) * 1995-09-28 1997-04-16 Fujitsu Ltd Image processing apparatus for correcting color space coordinates and method
EP0805592A2 (fr) * 1996-05-03 1997-11-05 Intel Corporation Transcodage vidéo avec un format intermédiaire de codage
WO1998028917A1 (fr) * 1996-12-20 1998-07-02 Westford Technology Corporation Estimateur ameliore pour recuperer les composantes a haute frequence dans des donnees d'image compressees
WO1998032285A1 (fr) * 1997-01-21 1998-07-23 Multilink, Incorporated Dispositif et procede de transcodage video numerique
WO1999034603A1 (fr) * 1997-12-31 1999-07-08 Microsoft Corporation Codage video ameliore faisant appel a un codage adaptatif de parametres de bloc pour blocs codes/non codes
WO2000011875A1 (fr) * 1998-08-20 2000-03-02 Sarnoff Corporation Masquage d'erreurs pour le codage et le decodage hierarchiques de sous-bandes

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455629A (en) * 1991-02-27 1995-10-03 Rca Thomson Licensing Corporation Apparatus for concealing errors in a digital video processing system
US5761342A (en) * 1991-04-16 1998-06-02 Canon Kabushiki Kaisha Image processing apparatus and method
US5262854A (en) * 1992-02-21 1993-11-16 Rca Thomson Licensing Corporation Lower resolution HDTV receivers
NL9200499A (nl) * 1992-03-17 1993-10-18 Nederland Ptt Systeem omvattende ten minste een encoder voor het coderen van een digitaal signaal en ten minste een decoder voor het decoderen van een gecodeerd digitaal signaal, alsmede encoder en decoder voor toepassing in het systeem.
JP2558994B2 (ja) * 1992-07-06 1996-11-27 松下電器産業株式会社 デジタル画像信号の誤り補正方法及び誤り補正装置
JP3240017B2 (ja) * 1993-01-11 2001-12-17 ソニー株式会社 Mpeg信号記録方法およびmpeg信号再生方法
JPH10262229A (ja) * 1997-03-18 1998-09-29 Toshiba Corp 通信システム、多地点制御装置および映像表示方法
EP0890923A3 (fr) * 1997-07-09 2005-06-15 Hyundai Curitel, Inc. Procédé et appareil pour le codage et le décodage d'images
DE19919412B4 (de) * 1998-04-29 2006-02-23 Lg Electronics Inc. Decoder für einen digitalen Fernsehempfänger
US6259741B1 (en) * 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0651574A1 (fr) * 1993-03-24 1995-05-03 Sony Corporation Procede et appareil pour le codage/decodage de vecteurs de mouvement, et procede et appareil pour le codage/decodage de signaux d'image
US5442400A (en) * 1993-04-29 1995-08-15 Rca Thomson Licensing Corporation Error concealment apparatus for MPEG-like video data
GB2305833A (en) * 1995-09-28 1997-04-16 Fujitsu Ltd Image processing apparatus for correcting color space coordinates and method
EP0805592A2 (fr) * 1996-05-03 1997-11-05 Intel Corporation Transcodage vidéo avec un format intermédiaire de codage
WO1998028917A1 (fr) * 1996-12-20 1998-07-02 Westford Technology Corporation Estimateur ameliore pour recuperer les composantes a haute frequence dans des donnees d'image compressees
WO1998032285A1 (fr) * 1997-01-21 1998-07-23 Multilink, Incorporated Dispositif et procede de transcodage video numerique
WO1999034603A1 (fr) * 1997-12-31 1999-07-08 Microsoft Corporation Codage video ameliore faisant appel a un codage adaptatif de parametres de bloc pour blocs codes/non codes
WO2000011875A1 (fr) * 1998-08-20 2000-03-02 Sarnoff Corporation Masquage d'erreurs pour le codage et le decodage hierarchiques de sous-bandes

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BJOERK N ET AL: "TRANSCODER ARCHITECTURES FOR VIDEO CODING", IEEE TRANSACTIONS ON CONSUMER ELECTRONICS,IEEE INC. NEW YORK,US, vol. 44, no. 1, 1 February 1998 (1998-02-01), pages 88 - 98, XP000779254, ISSN: 0098-3063 *

Also Published As

Publication number Publication date
US20020021757A1 (en) 2002-02-21
CN1338705A (zh) 2002-03-06
JP2002094997A (ja) 2002-03-29
EP1185107A2 (fr) 2002-03-06
EP1185107A3 (fr) 2011-12-21
US7415068B2 (en) 2008-08-19
CN1232933C (zh) 2005-12-21
FR2813001B1 (fr) 2002-12-20

Similar Documents

Publication Publication Date Title
Gibson et al. An investigation of dehazing effects on image and video coding
US6751350B2 (en) Mosaic generation and sprite-based coding with automatic foreground and background separation
JP5364820B2 (ja) フィルタを選択する装置及び方法
US7421127B2 (en) Spatial scalable compression scheme using spatial sharpness enhancement techniques
JP5509390B2 (ja) ビデオ符号化および処理のための照明補償および遷移のための方法およびシステム
FR2782437A1 (fr) Procede de commutation de flux mpeg
US20150319442A1 (en) Content adaptive bi-directional or functionally predictive multi-pass pictures for high efficiency next generation video coding
US20060013308A1 (en) Method and apparatus for scalably encoding and decoding color video
US20180220129A1 (en) Motion, coding, and application aware temporal and spatial filtering for video pre-processing
JPH11243543A (ja) 低解像度ビデオ・デコーダにおいて、予測誤差をもたらすシーン内容を検出し、検出された情報を使用するための方法及び装置
CN110741640A (zh) 用于视频代码化中的运动补偿预测的光流估计
US6075567A (en) Image code transform system for separating coded sequences of small screen moving image signals of large screen from coded sequence corresponding to data compression of large screen moving image signal
FR2764156A1 (fr) Dispositif de pretraitement pour codage mpeg ii
JP2000041258A (ja) 低解像度ビデオ・デコーダで画質を改善するための方法及び装置
US20030206591A1 (en) System for and method of sharpness enhancement for coded digital video
JP2011522496A (ja) テクスチャ合成による画像符号化方法
FR2941581A1 (fr) Codage et decodage d'une sequence d'images video par zones d'images
EP3139608A1 (fr) Procédé de compression d'un flux de données vidéo
FR2633136A1 (fr) Procede et installation de diffusion de programmes de television haute definition compatible
FR2940577A1 (fr) Procede d'encodage par segmentation d'une image.
FR2813001A1 (fr) Procede de conversion de format couleur d'une sequence d'images
FR2768003A1 (fr) Procede de codage d'un signal de forme binaire
FR2769784A1 (fr) Methode de codage de mode dans un codage de forme binaire
FR2894422A1 (fr) Procede de prediction de donnees mouvement et de texture
EP3202147A1 (fr) Procédé de transcodage de données vidéo à fusion d'unités de codage, programme informatique, module de transcodage et équipement de télécommunications associés

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20110502