FR2800957A1 - Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes - Google Patents

Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes Download PDF

Info

Publication number
FR2800957A1
FR2800957A1 FR9914183A FR9914183A FR2800957A1 FR 2800957 A1 FR2800957 A1 FR 2800957A1 FR 9914183 A FR9914183 A FR 9914183A FR 9914183 A FR9914183 A FR 9914183A FR 2800957 A1 FR2800957 A1 FR 2800957A1
Authority
FR
France
Prior art keywords
information
pixel
encoding
decoded
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9914183A
Other languages
English (en)
Other versions
FR2800957B1 (fr
Inventor
Dae Sung Cho
Se Hoon Son
Jae Seob Shin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to FR9914183A priority Critical patent/FR2800957B1/fr
Publication of FR2800957A1 publication Critical patent/FR2800957A1/fr
Application granted granted Critical
Publication of FR2800957B1 publication Critical patent/FR2800957B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/649Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Les méthodes d'encodage et de décodage évolutifs d'image fixe et les appareils à cet effet sont fournies. L'information de forme est encodée et décodée de manière évolutive par des méthodes de ligne de balayage de trame entrelacée (ISL) et de ligne de balayage de trame (RSL). L'information de forme encodée et décodée est utilisée pour l'encodage de l'information de texture. L'information de forme d'une composante de chrominance (W) est encodée afin de compenser la composante de chrominance (W) dans la phase d'encodage. En outre, une grande image d'entrée est divisée en blocs (carreaux) ayant une taille uniforme, et la forme d'encodage est appliquée de manière indépendante à la composante de forme et de texture de chaque bloc divisé.Grâce â l'encodeur évolutif d'image fixe selon l'invention, il est possible d'encoder efficacement des pixels en réduisant le nombre de pixels à encoder en utilisant les caractéristiques entre les pixels ISL dans une forme de la couche à encoder, ou en utilisant des pixels situés entre deux couches dans l'encodage de l'information de forme entre les couches respectives. En conséquence, il est possiblede rétablir séquentiellement l'information de forme de l'image fixe, ainsi que l'information de texture de l'image fixe en effectuant l'encodage évolutif grâce à la résolution d'une image. Cela peut être efficacement appliqué à la recherche d'une image dans une base de données de grande capacité, comme une bibliothèque numérique par exemple. Il est possible de réduire le nombre de pixels à encoder et de simplifier les processus d'encodage.

Description

<Desc/Clms Page number 1>
METHODES EVOLUTIVES ET APPAREIL D'ENCODAGE/DE DECODAGE POL
LA CREATION D'IMAGE FIXE UTILISANT LA TRANSFORMATION PAR
ONDELETTES
CADRE DE L'INVENTION 1. Domaine de l'invention
Cette invention se rapporte aux méthodes évolutives e aux appareils d'encodage/de décodage employés dans u codeur d'image fixe utilisant la transformation pa ondelettes.
2. Description de la technique
Dans une méthode conventionnelle d'encodag d'information de forme employée dans un codeur d'imag fixe utilisant la transformation par ondelettes, le informations de pixel relatives aux formes de toute les couches de sortie dans un processus de divisic d'ondelettes doivent être codées. Dans ce cas lorsqu'une forme évolutive d'encodage est utilisée, 1 nombre de pixels à coder augmente énormément contrairement au cas où l'information de forme entier est directement codée. En conséquence, l'efficacit d'encodage diminue. En outre, plus le nombre de pixel à coder augmente, plus un système devient complexe
Lorsque la taille d'une image d'entrée est grande, ce effet se renforce. En conséquence, il faut un temp considérable pour rétablir une image entière.
<Desc/Clms Page number 2>
RESUME DE L'INVENTION
L'un des buts de cette invention est de fournir une méthode évolutive d'encodage d'image fixe et un appareil permettant de diviser une image fixe en blocs, de classer les blocs divisés grâce à la possibilité d'utiliser des informations OU exclusif de chaque pixel, et de coder les blocs grâce à des modes de codage classés de manière à ce que l'information de forme arbitraire puisse être codée efficacement par un codeur d'image fixe à ondelettes.
Un autre but de cette invention est de fournir une méthode et un appareil de décodage correspondant à l'appareil et à la forme évolutive d'encodage d'image fixe à ondelettes.
Un autre but de cette invention est de fournir des méthodes d'encodage et de décodage d'image fixe par division en carreaux d'une image d'entrée ayant une forme arbitraire, et de rétablissement indépendant d'une partie d'une image désirée par l'utilisateur sans trop de calculs, à partir de données compressées.
En conséquence, afin d'atteindre le premier but, il est fourni une méthode de codage évolutif d'information de forme sur une image fixe en utilisant une transformation par ondelettes, qui comprend les phases de: - transformation par ondelettes et encodage évolutif d'information de forme sur une composante de luminance (Y), - encodage par ondelettes de l'information de texture sur la composante de luminance (Y) utilisant l'information de forme sur la composante de luminance (Y) à ondelettes transformées,
<Desc/Clms Page number 3>
- le remplissage de l'information de forme et de l'information de texture sur une composante de chrominance (UV) utilisant l'information de forme sur la composante de luminance (Y) et l'information de texture sur la composante de chrominance (UV), - la transformation par ondelettes et l'encodage évolutif pour le codage de l'information de forme remplie sur la composante de chrominance (UV), - et l'encodage par ondelettes de l'information de texture sur la composante de chrominance (UV) utilisant l'information de forme sur la composante de chrominance (UV) à ondelettes transformées.
Dans une méthode d'encodage évolutif d'information de forme sur une image fixe utilisant une transformation par ondelettes grâce à la présente invention, les phases d'encodage évolutif d'information de forme sur la composante de luminance (Y) et d'encodage évolutif pour le codage de l'information de forme remplie sur la composante de chrominance (UV), comprennent chacune les phases d'obtention des couches respectives par : - ondelettes discrètes à forme adaptative transformant l'information de forme d'entrée, - encodage de l'information de forme de bande passante à basse fréquence de la couche la plus basse de la forme, - encodage évolutif pour le codage de l'information de forme de bande passante à basse fréquence de chaque couche utilisant l'information de forme de bande passante à basse fréquence de la couche inférieure pour chaque couche de la forme, sauf la couche la plus basse,
<Desc/Clms Page number 4>
- et la transmission de l'information de forme encodée de la couche la plus basse à la couche la plus haute.
Dans une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes selon la présente invention, la phase d'encodage évolutif pour le codage de l'information de forme de bande passante à basse fréquence de chaque couche comprend les phases : - de division en blocs de l'information de forme de bande passante à basse fréquence de la couche courante, et de l'information de forme de bande passante à basse fréquence des couches inférieures, - de délimitation des blocs respectifs dans l'information de forme, - de détermination du mode d'encodage, - de mise en #uvre de l'encodage arithmétique sur le mode d'encodage déterminé, - et d'encodage du bloc limitrophe grâce à des modes d'encodage déterminés, pour chaque bloc limitrophe.
Dans une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes selon la présente invention, lorsque lxl valeur de pixel Pl d'un bloc alpha binaire (BAB) f1(i,j) d'une couche inférieure correspond à 2x2 valeurs de pixel PO, P1, P2, et P3 d'un BAB f2(i,j) de la couche courante, le mode d'encodage est déterminé comme étant un mode de ligne de balayage de trame entrelacée (ISL) lorsque toutes les conditions suivantes sont remplies pour tous les pixels du BAB des couches inférieures, et le mode d'encodage est déterminé comme étant un mode de ligne
<Desc/Clms Page number 5>
de balayage de trame (RSL)lorsqu'une des conditions suivantes n'est pas remplie. condition1=(f2(2i,2j)==fl(i,j)) condition2=!(!(f2(2i,2j)~f2(2i+2,2j)&&(f2(2i+1,2j)!= f2(2i,2j))
Figure img00050001

condition3 = ! ( ! (f 2(2i, 2j) ~ fsub2(2i, 2j + 2) & & (f2(2i, 2j + 1)!= f Z (2i, 2j)) ondition4 =! (!(f2(2i + 1, 2j) ~ fsub2(2i+1,2j+2)&&(fz(2i+1,2j+I)!= f2 (2 + 1, 2j))
Dans une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes selon la présente invention, lorsque le mode d'encodage est l'ISL, pour chaque pixel du bloc, la phase d'encodage de chaque bloc limitrophe comprend les phases de non-encodage PO lorsque la valeur du pixel à encoder est PO, en calculant l'information de contexte montrant la disposition des pixels de la couche courante autour du pixel à encoder, ainsi que la valeur statistique pour effectuer un codage arithmétique sur le pixel à encoder seulement lorsque les valeurs du pixel à gauche et à droite de la valeur du pixel à encoder sont différentes les unes des autres, et en effectuant un encodage arithmétique sur P1 lorsque la valeur du pixel à encoder est P1, et en calculant l'information du contexte montrant la disposition des pixels de la couche courante autour du pixel à encoder, ainsi que la valeur statistique pour effectuer le codage arithmétique sur le pixel à encoder seulement lorsque les valeurs du pixel au-dessus et en dessous de la valeur du pixel à encoder sont différentes
<Desc/Clms Page number 6>
les unes des autres, et en effectuant le codage arithmétique sur P2 ou P3 lorsque la valeur du pixel à encoder est P2 ou P3.
Dans une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes selon la présente invention, lorsque le mode d'encodage est le mode RSL pour chaque pixel du bloc, la phase d'encodage de chaque bloc limitrophe comprend les phases de non-encodage PO lorsque la valeur du pixel à encoder est PO et le Pl correspondant est 0, en calculant l'information de contexte montrant la disposition des pixels de la couche courante et des couches inférieures autour du pixel à encoder et la valeur statistique pour effectuer le codage arithmétique sur le pixel à encoder et en effectuant le codage arithmétique sur PO lorsque la valeur du pixel à encoder est PO et que la valeur du pixel correspondante Pl n'est pas 0, et en calculant l'information de contexte montrant la disposition des pixels de la couche courante et des couches inférieures autour du pixel à encoder et la valeur statistique pour effectuer le codage arithmétique sur le pixel à encoder et en effectuant le codage arithmétique sur P1, P2 ou P3 lorsque la valeur du pixel à encoder est P1, P2 ou P3.
Il est fourni une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes sur la composante de luminance (Y) par un filtre à ondelettes à symétrie paire et un encodage évolutif pour le codage de
<Desc/Clms Page number 7>
l'information de forme sur la composante de luminance (Y), un encodage par ondelettes de l'information de texture sur la composante de luminance (Y) utilisant l'information de forme sur la composante de luminance (Y) à ondelettes transformées, et un encodage par ondelettes de l'information de texture sur la composante de chrominance (UV) utilisant l'information de forme sur la composante de chrominance (UV) à ondelettes transformées.
Dans une méthode d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant une transformation par ondelettes selon la présente invention, la phase de remplissage de l'information de forme et de l'information de texture sur la composante de chrominance (UV) comprend les phases d'obtention de l'information de forme échantillonnée depuis l'information de forme sur la composante de luminance (Y) pour compenser la composante de chrominance (UV) de 4 :2:0 4 :2:2, division en blocs de l'information de forme échantillonnée correspondant au nombre de couches, d'extension de l'information de forme à une région incluant tous les pixels des blocs limitrophes qui comprennent partiellement cette forme, et d'obtention de l'information de texture correspondant à la région étendue en remplissant l'information de texture sur la composante de chrominance (UV) horizontalement et verticalement.
Afin d'atteindre le second but, il est fourni une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes, comprenant les phases de décodage évolutif et de transformation par ondelettes de l'information de forme
<Desc/Clms Page number 8>
encodée sur la composante de luminance (Y), de décodage par ondelettes de la l'information de texture encodée sur la composante de luminance (Y) utilisant la l'information de forme sur la composante de luminance (Y) à ondelettes transformées, de décodage évolutif, et de transformation par ondelettes de l'information de forme encodée sur la composante de chrominance (UV), et de décodage par ondelettes de l'information de texture encodée sur la composante de chrominance (UV) utilisant l'information de forme sur la composante de chrominance (UV) à ondelettes transformées.
Dans une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes selon la présente invention, les phases de transformation par ondelettes de l'information de forme encodée sur la composante de luminance (Y) et de transformation par ondelettes de l'information de forme encodée sur la composante de chrominance (UV) comprennent les phases de réception de l'information de forme encodée de la couche la plus basse à la couche la plus haute, d'obtention de l'information de forme de bande passante à basse fréquence de la couche la plus basse en décodant l'information de forme encodée de la couche la plus basse, de décodage évolutif de l'information de forme de bande passante à basse fréquence en décodant l'information de forme codée de chaque couche utilisant l'information de forme de bande passante à basse fréquence pour les couches respectives sauf la couche la plus basse, et d'obtention des couches respectives par ondelettes discrètes à forme adaptative transformant l'information de
<Desc/Clms Page number 9>
forme de bande passante à basse fréquence des couches respectives décodées.
Dans une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes selon la présente invention, la phase de décodage évolutif de l'information de forme de bande passante à basse fréquence comprend les phases de réception de l'information de forme codée et de division en blocs de l'information de forme de la couche de forme courante, et de l'information de forme des couches inférieures, de délimitation des blocs respectifs dans l'information de forme, de mise en #uvre du décodage arithmétique sur les modes d'encodage des blocs limitrophes respectifs, et de décodage de l'information de forme encodée dans chaque bloc grâce au mode d'encodage décodé.
Dans une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes selon la présente invention, lorsque lxl valeur de pixel Pl d'un bloc alpha binaire (BAB) f1(i,j) d'une couche inférieure correspond à 2x2 valeurs de pixel PO, P1, P2 et P3 d'un BAB de la couche courante, le mode d'encodage est déterminé comme étant un mode de ligne de balayage de trame entrelacée (ISL) lorsque toutes les conditions suivantes sont remplies pour tous les pixels dans le BAB des couches inférieures. Le mode d'encodage est déterminé comme étant un mode de ligne de balayage de trame (RSL) lorsque l'une des conditions suivantes n'est pas remplie.
<Desc/Clms Page number 10>
condition1=(f2(2i,2j)== f1(i,j))
Figure img00100001

condition2=!(!(fz(2i,2j)- f2(2i+2,2j)&&(fz(2i+1,2j)!= fz(2i,2j)) condition3 = ! ( ! ( f 2 (2i, 2j) ~fsub2(2i, 2j + 2) & & (f 2(2i, 2j + 1) ! = f 2 (2i, 2j)) condition4=!(!(f2(2i+1,2j)- fsub2(2i + 1, 2j + 2) & & ( f2(2i + 1, 2j + 1) 1= f2 (2i
Dans une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes selon la présente invention, lorsque le mode d'encodage est le mode ISL, pour chaque pixel du bloc, la phase de décodage de l'information de forme encodée dans chaque bloc comprend les phases de rétablissement de PO par Pl lorsque la valeur du pixel à encoder est PO, de rétablissement de PO par la valeur du pixel à gauche ou à droite de la valeur du pixel à décoder lorsque la valeur du pixel à décoder est Pl et que les valeurs des pixels à gauche et à droite de la valeur du pixel sont égales, de calcul de l'information de contexte montrant la disposition des pixels de la couche courante autour du pixel à décoder, et de la valeur statistique pour effectuer le décodage arithmétique sur le pixel à décoder, ainsi que le décodage arithmétique sur Pl lorsque la valeur du pixel à décoder est Pl et que les valeurs des pixels à gauche et à droite de la valeur du pixel à décoder sont différentes, de décodage de P2 ou P3 par la valeur du pixel au-dessus ou en dessous de la valeur du pixel à décoder lorsque la valeur du pixel à décoder est P2 ou P3 et que les valeurs des pixels au-dessus ou en dessous de la valeur du pixel sont égales, et de calcul de l'information de contexte montrant la disposition des pixels de la couche courante autour du pixel à décoder, ainsi crue de la valeur
<Desc/Clms Page number 11>
statistique pour effectuer le décodage arithmétique sur le pixel à décoder et pour effectuer le décodage arithmétique sur P2 ou P3 lorsque la valeur du pixel à décoder est P2 ou P3 et que les valeurs des pixels au-dessus ou en dessous de la valeur du pixel sont différentes.
Dans une méthode de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes selon la présente invention, lorsque le mode d'encodage est le RSL, pour chaque pixel du bloc, la phase de décodage de l'information de forme encodée comprend les phases de rétablissement de PO par 0 lorsque la valeur du pixel à décoder est PO et que le Pl correspondant est 0, de calcul de l'information de contexte montrant la disposition des pixels de la couche courante et des couches inférieures autour du pixel à décoder, ainsi que de la valeur statistique pour effectuer le décodage arithmétique sur le pixel à décoder et pour effectuer le décodage arithmétique sur PO lorsque la valeur du pixel à décoder est PO et que le Pl correspondant n'est pas 0, de calcul de l'information de contexte montrant la disposition des pixels de la couche courante et des couches inférieures autour du pixel à décoder, ainsi que de la statistique pour effectuer le décodage arithmétique sur le pixel à décoder et pour effectuer le décodage arithmétique sur Pl, P2 ou P3 lorsque la valeur du pixel à décoder est Pl, P2 ou P3.
Afin d'atteindre le troisième but, il est fourni un appareil d'encodage évolutif pour le codage de l'information de forme sur image fixe utilisant la transformation par ondelettes, comprenant un codeur évolutif d'information de forme pour la transformation par
<Desc/Clms Page number 12>
ondelettes et pour l'encodage évolutif pour le codage de l'information de forme sur une composante de luminance (Y) et sur une composante de chrominance (UV), une unité de remplissage de texture/forme d'image de chrominance (UV) pour remplir l'information de forme et l'information de texture d'une composante de chrominance (UV) utilisant l'information de forme d'une composante de luminance (Y) et l'information de texture d'une composante de chrominance (UV) pour l'information de forme 4:2:0 ou 4:2:2, et un encodeur par ondelettes d'information de texture pour l'encodage par ondelettes de l'information de texture de la composante de luminance (Y) et de la composante de chrominance (UV) utilisant l'information de forme transformée par ondelettes par l'encodeur évolutif de l'information de forme.
Dans un appareil d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant la transformation par ondelettes selon la présente invention, le codeur évolutif d'information de forme comprend un encodeur évolutif de forme de luminance (Y) pour la transformation par ondelettes et pour l'encodage évolutif pour le codage de l'information de forme de la composante de luminance (Y), un encodeur évolutif de forme de chrominance (UV) pour la transformation par ondelettes et pour l'encodage évolutif pour le codage de l'information de forme de la composante de chrominance (UV) remplie par l'unité de remplissage de texture/forme d'image de chrominance (UV).
Dans un appareil d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant la
<Desc/Clms Page number 13>
transformation par ondelettes selon la présente invention, l'encodeur évolutif de forme de luminance (Y) et l'encodeur évolutif de forme de chrominance (UV) comprennent chacun une pluralité de transformateurs d'ondelettes discrètes à forme adaptative pour la réception des couches de forme et pour la création des couches de forme des couches inférieures, un encodeur de forme pour l'encodage de l'information de forme de bande passante à basse fréquence de la couche de forme la plus basse, une pluralité d'encodeurs évolutifs pour l'encodage évolutif pour le codage de l'information de forme de bande passante à basse fréquence des couches respectives utilisant l'information de forme de bande passante à basse fréquence des couches inférieures pour les couches de forme respectives sauf la couche de forme la plus basse, et un multiplexeur pour la transmission de l'information de forme encodée de la couche la plus basse aux couches les plus hautes.
Dans un appareil d'encodage évolutif pour le codage de l'information de forme sur une image fixe utilisant la transformation par ondelettes selon la présente invention, chaque codeur évolutif comprend des moyens de division en blocs de l'information de forme de bande passante à basse fréquence de la couche courante et l'information de forme de bande passante à basse fréquence des couches inférieures, des moyens de délimitation des blocs respectifs dans l'information de forme, des moyens de détermination du mode d'encodage grâce à la possibilité d'utiliser l'information OU exclusif de chaque pixel dans le bloc limitrophe, des moyens de balayage des pixels respectifs dans un bloc en mode ISL, d'omission d'encodage
<Desc/Clms Page number 14>
des pixels lorsque l'information OU exclusif peut être utilisée, des moyens d'obtention de l'information de contexte, et de mise en #uvre du codage arithmétique sur les pixels lorsque l'information OU exclusif ne peut pas être utilisée, lorsque le mode d'encodage est le mode ISL, et des moyens de balayage des pixels respectifs dans un bloc en mode RSL, d'obtention de l'information de contexte et de mise en #uvre du codage arithmétique sur les pixels lorsque le mode d'encodage est le mode RSL.
Afin d'atteindre le troisième but, il est fourni ici un appareil de décodage évolutif de l'information de forme encodée sur une image fixe utilisant la transformation par ondelettes, comprenant un décodeur évolutif de l'information de forme pour le décodage évolutif et la transformation par ondelettes de l'information de forme encodée sur la composante de luminance (Y) et sur la composante de chrominance (UV), et un décodeur par ondelettes d'information de texture pour le décodage par ondelettes de l'information de texture encodée sur la composante de luminance (Y) et sur la composante de chrominance (UV) utilisant l'information de forme à ondelettes transformées par le décodeur évolutif d'information de forme.
Dans un appareil de décodage évolutif de l'information de forme sur une image fixe utilisant la transformation par ondelettes selon la présente invention, le décodeur évolutif de forme comprend un décodeur évolutif de forme dédié à la luminance (Y) pour décoder de façon évolutive et transformer par ondelettes l'information de forme codée sur la composante de luminance (Y) et un décodeur évolutif de
<Desc/Clms Page number 15>
forme dédié à la chrominance (UV) pour décoder de façon évolutive et transformer par ondelettes l'information de forme codée sur la composante de chrominance (UV)
Dans un appareil de décodage évolutif de l'information de forme sur une image fixe utilisant la transformation par ondelettes selon la présente invention, le décodeur évolutif de forme de luminance (Y) et le décodeur évolutif de forme de chrominance (UV) comprennent chacun un démultiplexeur pour la distribution de l'information de forme encodée de la couche la plus basse aux couches supérieures, un décodeur de forme pour l'obtention de l'information de forme de bande passante à basse fréquence de la couche la plus basse par décodage de l'information de forme encodée de la couche de forme la plus basse, une pluralité de décodeurs évolutifs pour le décodage évolutif de l'information de forme de bande passante à basse fréquence par décodage de l'information de forme encodée des couches respectives utilisant l'information de forme de bande passante à basse fréquence, pour les couches de forme respectives sauf la couche de forme la plus basse, et une pluralité de transformateurs par ondelettes discrètes à forme adaptative pour l'obtention de chaque couche de forme par ondelettes discrètes à forme adaptative de transformant l'information de forme décodée de bande passante à basse fréquence des couches respectives.
Dans un appareil de décodage évolutif de l'information de forme sur une image fixe utilisant la transformation par ondelettes selon la présente invention, chaque décodeur évolutif comprend des moyens de réception de l'information
<Desc/Clms Page number 16>
de forme encodée, et de division en blocs de l'information de forme de la couche courante et de l'information de forme des couches inférieures, des moyens de délimitation des blocs respectifs dans l'information de forme, des moyens de mise en #uvre du décodage arithmétique sur le mode d'encodage déterminé grâce à la possibilité d'utiliser l'information OU exclusif des pixels respectifs dans le bloc limitrophe, des moyens de balayage des pixels respectifs dans un bloc en mode ISL, de décodage des pixels par l'information OU exclusif lorsque l'information OU exclusif peut être utilisée, des moyens d'obtention de l'information de contexte et de mise en #uvre du décodage arithmétique sur les pixels lorsque l'information OU exclusif ne peut pas être utilisée, lorsque le mode d'encodage est le mode ISL, des moyens de balayage des pixels respectifs dans un bloc, des moyens d'obtention de l'information de contexte, de mise en #uvre du décodage arithmétique sur les pixels lorsque le mode d'encodage est le mode ISL.
Afin d'atteindre le troisième but, il est fourni ici une méthode d'encodage évolutif d'image fixe utilisant la transformation par ondelettes, comprenant les phases de division en carreaux ayant une taille uniforme d'un objet d'entrée ayant une forme arbitraire, de classification d'une composante de commande, d'encodage d'un signal de commande pour chaque carreau, de transformation par ondelettes de l'information de forme et de l'information de texture, d'encodage évolutif des valeurs des couches respectives, et d'encodage de l'information de l'objet dans un carreau, pour chaque carreau, et de connexion
<Desc/Clms Page number 17>
séquentielle des trains binaires encodés pour chaque carreau.
Afin d'atteindre le troisième but, il est fourni ici une méthode de décodage d'un train binaire obtenu par encodage évolutif d'une image fixe utilisant la transformation par ondelettes, comprenant les phases de réception du train binaire encodé, de division en objets du train binaire encodé, de classification d'une composante de commande provenant d'une pluralité de composantes de carreau dans des trains binaires pour les objets respectifs, de décodage de la composante de commande, de décodage évolutif de l'information de forme et de l'information de texture, de décodage de l'information de l'objet dans un carreau, pour chaque composante du carreau, de composition des articles de l'information de l'objet décodés relativement aux composantes respectives du carreau utilisant la composante de commande décodée dans chaque objet, et de composition d'une pluralité d'articles d'information de l'objet sur un écran.
Afin d'atteindre le troisième but, il est fourni ici un appareil d'encodage évolutif d'image fixe utilisant la transformation par ondelettes, comprenant un ou plusieurs diviseur de carreau divisant en carreaux ayant une taille uniforme un objet d'entrée ayant une forme arbitraire, et une classification des composantes de commande, un (ou plusieurs) encodeur de signal de commande pour l'encodage de composantes de commande classifiés par les diviseurs de carreau, une pluralité d'encodeurs d'image pour la réception de carreaux divisés par les diviseurs de carreaux, pour la transformation par ondelettes de
<Desc/Clms Page number 18>
l'information de forme et de l'information de texture dans les carreaux, l'encodage évolutif des valeurs des couches respectives, et un multiplexeur pour la connexion séquentielle des trains binaires encodés aux carreaux respectifs.
Afin d'atteindre le troisième but, il est fourni ici un appareil de décodage d'un train binaire obtenu par encodage évolutif d'une image fixe utilisant la transformation par ondelettes, comprenant un démultiplexeur pour la réception du train binaire encodé, pour la division en objets du train binaire encodé, pour la classification d'une composante de commande, une pluralité de composantes de carreau dans le train binaire pour chaque objet, un (ou plusieurs) décodeurs de signal de commande pour le décodage de la composante de commande, une pluralité de décodeurs d'image fixe pour la réception d'une composante de carreau et pour le décodage évolutif de l'information de forme et de l'information de texture dans le carreau, un ou plusieurs compositeurs de carreau pour la composition de la composante de carreau décodée dans chaque objet, et un compositeur d'objet pour la composition d'une pluralité d'articles d'information d'objet composés par le compositeur de carreau sur un écran.
Les objets et avantages de la présente invention mentionnés ci-dessus seront plus explicites grâce à une description en détail de la réalisation selon les schémas ci-joints dans lesquels :
Les figures 1A et lb sont des schémas de principe montrant les structures d'un encodeur d'image fixe et d'un
<Desc/Clms Page number 19>
décodeur d'image fixe utilisant la transformation par ondelettes ;
La figure 2 est un organigramme montrant les processus de remplissage par région ;
Les figures 3A et 3B illustrent respectivement une forme d'extension de l'information de forme aux blocs, et le remplissage de l'information de forme dans les unités d'une région ;
La figure 4 est un schéma de principe montrant la structure d'un encodeur évolutif de forme utilisant la transformation par ondelettes ;
La figure 5 est un schéma de principe montrant la structure d'un décodeur évolutif de forme utilisant la transformation par ondelettes ;
La figure 6 décrit une méthode de création d'une pyramide d'image à laquelle une ondelette unidimensionnelle est appliquée ;
La figure 7 illustre un encodage évolutif de forme à 3 couches ;
Les figures 8A et 8B décrivent les méthodes évolutives d'encodage/de décodage dans les unités d'un bloc alpha binaire ;
Les figures 9A, 9B et 9C illustrent la délimitation de blocs alpha binaires ;
La figure 10 décrit les conditions de détermination du mode d'encodage d'un bloc alpha binaire ;
La figure 11 décrit une méthode d'encodage à ligne de balayage de trame entrelacée (ISL) d'un bloc alpha binaire ;
<Desc/Clms Page number 20>
La figure 12 est un organigramme montrant une méthode de décodage ISL d'un bloc alpha binaire ;
La figure 13 est un organigramme montrant une méthode d'encodage à ligne de balayage de trame (RSL) d'un bloc alpha binaire ;
La figure 14 est un organigramme montrant une méthode de décodage RSL d'un bloc alpha binaire ;
Les figures 15A et 15B montrent les ordres dans lesquels les pixels d'un bloc sont encodés dans un mode d'encodage ISL et dans un mode d'encodage RSL ;
Les figures 16A, 16B et 16C montrent l'information de contexte pour un codage arithmétique binaire ;
Les figures 17A et 17B sont des schémas de principe montrant un encodeur d'image fixe à objet et un décodeur d'image fixe à objet, qui utilisent chacun une opération de mosaïque ;
La figure 17C montre un objet à forme arbitraire dans une structure de carreau ;
Les figures 18A à 18F montrent les syntaxes des trains binaires compressés par l'encodeur d'image fixe selon la présente invention ;
Les figures 19A et 19B montrent des images rétablies (en utilisant un filtre à symétrie impaire) dans une couche 3 de l'image d'un enfant, dans laquelle l'information de forme de la composante de chrominance (UV) n'est pas corrigée dans la figure 19A, et l'information de forme de la composante de chrominance (UV) est corrigée dans la figure 19B ; et
Les figures 20A et 20B montrent des images rétablies (en utilisant un filtre à symétrie impaire) dans une couche
<Desc/Clms Page number 21>
3 de l'image de Fish & un Logo, dans laquelle l'information de forme de la composante de chrominance (UV) n'est pas corrigée dans la figure 20A, et l'information de forme de la composante de chrominance (UV) est corrigée dans la figure 20B.
Ci-après, la présente invention sera décrite en détail avec référence aux schémas ci-joints.
En se référant à la figure 1A, une réalisation d'un encodeur d'image fixe utilisant la transformation par ondelettes selon la présente invention inclut un encodeur évolutif de forme 103 de luminance (Y) (Y), un encodeur par ondelettes de texture de luminance 104 utilisant la transformation par ondelettes, une unité de remplissage de texture/forme d'image de chrominance (UV) 106, un encodeur évolutif de forme de chrominance (UV) (UV) 107, un encodeur par ondelettes de texture de chrominance (UV) (UV) 108 utilisant la transformation par ondelettes, et un multiplexeur 109. En référence à la figure 1B, une réalisation d'un décodeur d'image fixe utilisant la transformation par ondelettes pour rétablir une image depuis un train binaire encodé inclut un encodeur évolutif de forme de luminance (Y) (Y) 113, un décodeur par ondelettes de texture de chrominance (UV) (UV) 114, un décodeur évolutif de forme de chrominance (UV) (UV) 116, et un décodeur par ondelettes de texture de chrominance (UV) (UV) 117.
Dans une image en couleur d'un format de 4:2:0 ou 4 :2:2, le remplissage de l'information de forme et de l'information de texture est nécessaire afin de remédier à
<Desc/Clms Page number 22>
la diminution des couleurs dans chaque couche évolutive. En référence à la figure 2, le remplissage de l'information de forme et de l'information de texture consiste en des processus d'obtention de l'information de forme d'une composante de chrominance (UV) en échantillonnant l'information de forme d'une composante de luminance (Y), en étendant aux blocs l'information de forme obtenue de la composante de chrominance (UV), et en remplissant de manière répétée l'information de forme étendue aux blocs à l'horizontale et à la verticale en utilisant l'information de forme de la composante de chrominance (UV), l'information de forme étendue de la chrominance (UV), et l'information de texture des informations sur la chrominance (UV).
En référence à la figure 4, un processus d'encodage de forme évolutif consiste en des processus de transformation par ondelettes de l'information de forme, d'encodage séquentiel de l'information de forme transformée de bande passante à basse fréquence de chaque couche depuis l'information de forme de la basse résolution, et de sortie d'un train binaire. Le processus d'encodage évolutif pour le codage de l'information de forme effectué dans les unités d'un bloc inclut les phases de réception de blocs alpha binaires délimités (BAB) montrés dans la figure 9A, de détermination du mode d'encodage à utiliser grâce à la possibilité d'utiliser l'information OU exclusif de chaque pixel dans un bloc, d'obtention de l'information de contexte des pixels dans un bloc et de mise en #uvre du codage arithmétique sur les pixels dans un bloc grâce au mode d'encodage déterminé. Lorsque le mode d'encodage
<Desc/Clms Page number 23>
déterminé est un mode à ligne de balayage de trame entrelacée (ISL), l'information de contexte des pixels dans un bloc est obtenue et le codage arithmétique est effectué sur les pixels dans un bloc dans une commande à ligne de balayage de trame entrelacée comme montré sur la figure 12.
Lorsque le mode d'encodage est un mode à ligne de balayage de trame (RSL), l'information de contexte des pixels dans un bloc est obtenue et le codage arithmétique est effectué sur les pixels dans un bloc dans une commande à ligne de balayage de trame comme indiqué sur la figure 14.
En référence à la figure 5, un processus de décodage de forme évolutif consiste en des processus de réception d'un train binaire encodé, de décodage évolutif séquentiel du train binaire encodé à partir d'une couche de base, d'obtention de l'information de forme à basse fréquence de chaque couche, d'obtention de l'information de forme à ondelettes transformées, et une forme rétablie pour le rétablissement de l'information de texture depuis la bande passante à basse fréquence. Un processus de décodage évolutif du bloc alpha binaire effectué dans les unités d'un bloc inclue les phases de reconstruction du train binaire d'entrée encodé montré dans la figure 9A dans le bloc alpha binaire limitrophe (BAB), d'obtention de l'information de contexte des pixels dans un bloc, et de mise en #uvre du décodage arithmétique des pixels dans un bloc grâce au mode d'encodage. Lorsque le mode d'encodage est le mode ISL, l'information de contexte des pixels est obtenue dans la commande ISL et le décodage arithmétique est effectué sur les pixels dans un bloc, comme indiqué sur la figure 13, ce qui rétablit les pixels. Lorsque le mode
<Desc/Clms Page number 24>
d'encodage est le mode RSL, l'information de contexte des pixels dans un bloc est obtenue et le décodage arithmétique est effectué sur les pixels dans un bloc dans la commande RSL, comme indiqué sur la figure 14.
Pour une grande image d'entrée, lorsqu'un utilisateur désire rétablir rapidement non pas l'image entière mais une partie spécifique de l'image, non pas par les données entières encodées mais par quelques unes des données encodées avec un petit nombre de calculs, il est nécessaire de diviser en carreaux l'information de forme et l'information de texture, et d'encoder et de décoder de manière indépendante les carreaux respectifs.
La figure 17A est une autre réalisation d'un encodeur évolutif pour la création d'une image fixe utilisant la transformation par ondelettes selon la présente invention.
Elle montre la structure d'un encodeur d'image fixe à objet qui utilise une opération de mosaïque, pour la division en carreaux de l'image fixe et pour l'encodage des carreaux divisés utilisant l'encodeur évolutif d'image fixe montré sur la figure 1A. En référence à la figure 17A, une pluralité de diviseurs de carreaux 1701 et 1711 divise en carreaux un ou plusieurs objets d'entrée 1700 et 1710. Les encodeurs de signal de commande 1702 et 1712 encodent le signal de commande créé par les diviseurs de carreaux 1701 et 1711. La taille des carreaux divisés par les diviseurs de carreaux 1701 et 1711 est divisée par 2 avec un reste 0.
En outre, la taille des carreaux est divisée par les diviseurs de carreaux 1701 et 1711 est divisée par 2x(N+1) à l'horizontale et à la verticale lorsque le nombre de couches de transformation par ondelettes est N pour
<Desc/Clms Page number 25>
l'évolution de la résolution. Les encodeurs évolutifs 1703 et 1713 montrés sur la figure 1A encodent les carreaux (carreau 0, carreau 1, ..., et le carreau M-1 ou le carreau 0, carreau 1,... et le carreau N-1) divisés par les diviseurs de carreaux correspondants 1701 et 1711. Les trains binaires encodés de chaque objet d'entrée sont connectés de manière séquentielle entre eux par des multiplexeurs inférieurs 1704 et 1714. Un multiplexeur supérieur 1720 obtient un train binaire encodé 1730 pour tous les objets d'entrée, et transmet le train binaire encodé.
La figure 17B indique les processus inverses de ceux indiqués sur la figure 17A. La structure du décodeur d'image fixe à objet incluant l'opération de mosaïque de décodage d'une partie spécifique d'une image avec un petit nombre de calculs en utilisant une partie du train binaire encodé est montré. En référence à la figure 17B, un multiplexeur supérieur 1740 divise en objets encodés le train binaire 1730 reçu. Une pluralité de multiplexeurs inférieurs 1750 et 1760 divisent le train binaire de chaque objet en une composante de signal de commande, et en une pluralité de composantes de carreaux. Les décodeurs de signal de commande 1751 et 1761 reçoivent la composante de signal de commande par les multiplexeurs inférieurs 1750 et 1760, et décodent les composantes du signal de commande reçu. Une pluralité d'encodeurs évolutifs 1752 et 1762 montrés sur la figure 1B reçoit les composantes de carreaux par les multiplexeurs inférieurs 1750 et 1760, et décode les composantes de carreaux reçues. Une pluralité de compositeurs de carreaux 1753 et 1763 reconstruit un objet correspondant en utilisant les composantes de carreaux
<Desc/Clms Page number 26>
(carreau 0, carreau 1, ..., et carreau M-1, ou carreau 0, carreau 1, ..., et carreau N-1) et une composante de commande provenant des encodeurs évolutifs correspondants 1752 et 1762. Un compositeur d'objet 1780 compose une pluralité d'objets composés par les compositeurs de carreaux 1753 et 1763 afin d'obtenir une image de sortie finale 1790.
Le principe de fonctionnement de cette invention est décrit ci-après.
La figure 1A montre la structure d'un encodeur d'image fixe utilisant la transformation par ondelettes.
Comme indiqué sur la figure 1A, lorsque Activer~Forme (shape~enable) 102 est activé, l'information de forme sur la composante de luminance (Y) d'une image d'entrée est encodée de manière évolutive, et l'information de texture de la composante de luminance (Y) est encodée dans un domaine par ondelettes en utilisant l'information de forme à ondelettes transformées par l'encodeur évolutif de forme de luminance (Y). Lorsque Activer~Forme (Shape~enable) 102 est inactivé, seule l'information de texture est encodée sans l'information de forme.
L'information de texture sur la composante de chrominance (UV) est toujours encodée. Elle est déterminée si l'information de forme sur l'information de chrominance (UV) est encodée par une condition ; Activer-Forme (Shape~enable) & activer~Forme~Chroma(Chroma~shape~enable) 105. Lorsque la condition est remplie, l'information de forme et l'information de texture de la composante de chrominance (UV) est remplie et l'information de forme remplie de la composante de chrominance (UV) est encodée de manière évolutive. La condition, Activer~Forme
<Desc/Clms Page number 27>
(Shape~enable) & activer-Forme-Chroma (Chroma~shape~enable) 105, est remplie lorsque l'information de forme de la composante de chrominance (UV) doit être encodée étant donné que l'image d'entrée a une forme arbitraire, et que le filtre d'ondelettes inclus dans les encodeurs évolutifs 103 et 107 est un filtre à symétrie impaire.
Lorsque le filtre d'ondelettes inclus dans les encodeurs évolutifs 103 et 107 est un filtre à symétrie paire, il n'est pas nécessaire d'encoder une information de forme supplémentaire, étant donné qu'il est possible d'obtenir l'information de forme de la composante de chrominance (UV) depuis l'information de forme de la composante de luminance (Y) de chaque couche.
Un train binaire encodé 110 est rétabli comme indiqué sur la figure 1B . Lorsque le train binaire encodé 110 est introduit par un démultiplexeur 111, l'information de forme de la composante de luminance (Y) est encodée de manière évolutive grâce à une condition ; Activer~Forme (Shape~enable)112, et l'information de texture sur la composante de luminance (Y) est décodée dans un domaine d'ondelettes en utilisant l'information de forme de la composante de luminance (Y) décodée. Lorsque la condition, activer~Forme (Shape~enable) 112, n'est pas remplie, seule l'information de texture est décodée sans l'information de forme.
L'information de texture de la composante de chrominance (UV) est toujours décodée. Elle est déterminée lorsque l'information de forme de la composante de chrominance (UV) est décodée par une condition ; Activer-Forme (Shape~enable) & Chroma~activer~Forme
<Desc/Clms Page number 28>
(Chroma~shape~enable) 115. Lorsque la condition est remplie, l'information de forme de la composante de chrominance (UV) est décodée de manière évolutive. Les formes décodées provenant des couches respectives sont utilisées pour décoder l'information de texture. La conition, activer~Forme (Shape~enable)& activer~Forme~Chroma (Chroma~shape~enable) 115, est la même que la condition , activer~Forme (Shape~enable) & activer~Forme-Chroma (Chroma~shape~enable) 105.
La figure 2 indique les processus de remplissage de l'information de forme et de l'information de texture de la composante de chrominance (UV) de la figure 1A. Lorsqu'une image originale 201 est introduite , l'information de forme de la composante de luminance (Y) est échantillonnée en 4 : 1 (phase 202), et l'information de forme échantillonnée est étendue aux blocs (phase 204). La longueur d'un côté d'un bloc est B=2 (scal~level-1). Ici , niveau~éch (scal~level) indique le nombre de couches évolutives. La figure 3A montre un exemple d'extension aux blocs. L'information de forme échantillonnée 301 sur la figure 3A est étendue par une région 302 divisée en blocs. Dans le cas où l'information de forme sur l'information de chrominance (UV) est étendue, il n'y a aucune information de texture dans une région entre l'information de forme échantillonnée 301 et la région étendue 302. Afin de compenser cela, comme indiqué sur la figure 2, le remplissage horizontal et vertical à région (phases 206 et 207) est effectué en utilisant l'information de forme de la composante de chrominance (UV) étendue à la phase 204, l'information de forme de la composante de chrominance (UV) 203
<Desc/Clms Page number 29>
échantillonnée à la phase 202, et l'information de texture sur la composante de chrominance (UV) d'entrée 205. En conséquence, l'information de forme remplie de UV et l'information de texture 208 sont obtenues.
Le remplissage est effectué afin de compenser la position où il n'y a pas d'information de texture, en utilisant l'information de texture d'une position adjacente. En référence à la figure 3B, lorsqu' il y a une image de composante de chrominance (UV) originale 303 et une image étendue 304, l'information de texture de la région B 306 est remplie à l'horizontale et à la verticale en utilisant l'information de texture de la limite de la région A 305 partagée par les deux régions. La référence de l'information de texture est indiquée par des flèches sur la figure 3B. Le processus de remplissage répétitif à l'horizontale et à la verticale est détaillé comme suit. for (y=0; y<M; y++) { for (x=0; x<N; x++) { if(ref shape[y][x] =='1') if (s[y][x] = 1) { hor~pad[y][x] = d[y][x]; s'[y][x]=l; } else{ if(s[y][x']==1 && s[y][x"]==1){ hor~pad[y][x]= (d[y][x'] + d[y][x"]) // 2 ; s'[y][x]=l; } else if (s[y][x']==1){ hor~pad [y][x]=d[y][x'];s'[y][x]=1; } else if (s[y][x"]==1){ hor~pad [y][x]=d[y][x"];s'[y][x]=1; }
<Desc/Clms Page number 30>
Ici, forme~réf (ref~shape) [] [] , s [] [] , d[] [] , et remp~hor (hor~pad) [] [] indiquent respectivement une valeur d'information de forme étendue, l'information de forme échantillonnée à partir de l'information de forme de l'information sur la chrominance (UV), l'information de texture, et une valeur d'image obtenue après remplissage à la verticale et à l'horizontale. x' indique la position effective du pixel (s [y] [x']= =1) la plus proche, et à gauche de la position actuelle x. x" indique la position effective du pixel la plus proche, et à droite de la position actuelle x. M et N indiquent la largeur et la hauteur de l'image.
Lorsqu'une valeur de pixel existe seulement à gauche (ou à droite) de la position actuelle, la valeur est utilisée comme valeur du pixel de la position actuelle. Lorsque des valeurs de pixel existent à gauche et à droite du pixel courant, la principale valeur des deux valeurs est utilisée comme la valeur de pixel de la position actuelle. Le processus de remplissage répétitif à la verticale est le suivant. for(x=0;x<N;x++) { for(y=0;y<M;y++) { if (ref~shape[y][x]=='1'){ if (s'[y][x]=l) hv~pad[y][x] =hor~pad[y][x]; else{
<Desc/Clms Page number 31>
Figure img00310001

if (s'[y'][x]==1 && s'[y"][x]=1) hv~pad[y][x] = (hor~pad[y'][x] + hor~pad[y"][x])//2; } else if (s' [y'] [x]==1 ) hv~pad[y][x] = hor~pad[y'][x]; } else if (s'[y"][x]==1) hv~pad[y][x] = hor~pad [y"][x]; } } } } }
Ici, s' LJ LJ et remp~hv (hv~pad) LJ LJ indiquent l'information de forme obtenue en étendant l'information de forme obtenue en échantillonnant l'information de forme de la composante de luminance (Y) à l'horizontale et la valeur de l'image obtenue après remplissage à la verticale. y' indique la position effective du pixel (s' [y'] [x] = =1) la plus proche, et au-dessus de la position actuelle y. y'' indique la position effective du pixel la plus proche, et en dessous de la position actuelle y.
La figure 4 indique la structure de l'encodeur évolutif de l'information de forme utilisant la transformation par ondelettes. Une image d'entrée 401 obtient une pyramide de forme provenant des couches respectives 402,404, 406 et 408 grâce à des transformations d'ondelettes discrètes à forme adaptative (SA-DWT) 403,405 et 407. Les articles d'information de forme à ondelettes transformées 404,406 et 408 des couches respectives sont introduits dans les encodeurs par
<Desc/Clms Page number 32>
ondelettes de texture 104 et 108 de la figure 1A, et sont utilisés pour encoder l'information de texture de chaque couche. L'information de forme de bande passante à basse fréquence 409 de la couche la plus basse 408 est encodée par un encodeur de forme générale 410. Un encodeur arithmétique à contexte (CAE) peut être utilisé comme encodeur de forme. Les articles d'information de forme de bande passante à basse fréquence 412 et 415 des couches de forme 406 et 404, sauf la couche la plus haute, la couche la plus basse et l'article 402 de l'information de forme de la couche la plus haute sont encodés par les encodeurs 413416 et 418 fournis dans cette invention en utilisant les articles d'information de forme de bande passante à basse fréquence 409,412 et 415 des couches inférieures des couches respectives. Les trains binaires 411, 414, 417 et 419 encodés dans les couches respectives sont formés en un train binaire 421 de la couche inférieure jusqu'à la couche supérieure par un multiplexeur 420. Le train binaire 421 est envoyé vers un canal.
La figure 5 indique la structure du décodeur évolutif de l'information de forme utilisant la transformation par ondelettes. Un train binaire encodé 501 est divisé en trains binaires des couches inférieures et en trains binaires des couches supérieures. Le train binaire 503 de la couche la plus basse est utilisé pour obtenir une forme 505 d'une bande passante à basse fréquence grâce à un décodeur de forme générale 504. Les trains binaires 507, 511 et 515 des couches supérieures sont utilisés pour obtenir des bandes passantes à basse fréquence 509 et 513 des couches respectives, ou pour obtenir l'information de
<Desc/Clms Page number 33>
forme 517 de la couche la plus haute grâce aux décodeurs évolutifs 508,512 et 516. Les décodeurs évolutifs 508,512 et 516 des couches respectives reçoivent des trains binaires correspondant aux couches respectives, et les articles d'information de forme de bande passante à basse fréquence 505,509 et 513 des couches inférieures. Afin de rétablir l'information de forme à ondelettes transformées dans chaque couche, les articles d'information de forme de bande passante à basse fréquence 509 et 513 des couches supérieures des couches respectives et l'information de forme 517 de la couche la plus haute subissent une transformation par ondelettes à forme adaptative 518,519 et 520. Les formes rétablies 506,510 et 514 des couches respectives sont obtenues en utilisant les articles d'information de bande passante LL, LH, HL et HH des SA-DWT 518, 519 et 520. Les formes rétablies 506, 510 et 514 des couches respectives sont introduites dans les décodeurs par ondelettes de texture 114 et 117 de la figure 1B, et sont utilisées pour rétablir les composantes de texture.
La figure 3 indique les processus de formation de la pyramide de l'information de forme en utilisant une transformation par ondelettes unidimensionnelle et des processus d'inversion. La méthode de division de l'information de forme unidimensionnelle varie grâce au type de filtre de transformation par ondelettes. Lorsque la transformation par ondelettes est un filtre à symétrie paire, les valeurs paires de pixel comprises dans un signal d'entrée sont échantillonnées avec une bande passante à basse fréquence, et les valeurs paires de pixel sont échantillonnées avec une bande passante à haute fréquence.
<Desc/Clms Page number 34>
Lorsque l'information de forme de la longueur d'un pixel est reçue et que le pixel est un nombre impair, le pixel de la bande passante à basse fréquence est échangé avec celui de la bande passante à haute fréquence.
Lorsque le filtre de transformation par ondelettes est un filtre à symétrie paire, les valeurs paires de pixel du signal reçu sont échantillonnées avec une bande passante à basse fréquence, et les valeurs impaires de pixel sont échantillonnées avec une bande passante à haute fréquence, comme dans un filtre à symétrie impaire. Lorsque le point de début de trame d'un segment sur lequel une valeur de pixel successive est 1 est impair, le signal de la bande passante à haute fréquence au point de départ est échangé avec celui de la bande passante à basse fréquence. Il faut savoir qu'un effet de mise en #uvre d'une opération OU entre des articles d'information de basse fréquence des couches respectives est créé.
Une image d'entrée 601 est divisée en une bande passante à basse fréquence (L) et en une bande passante à haute fréquence (H) en effectuant une transformation unidimensionnelle 602 à la verticale. Lorsqu'une transformation 603 est effectuée dans chaque bande passante à l'horizontale, la bande passante à basse fréquence (L) est divisée en une bande passante à basse fréquence-basse fréquence(LL) et en une bande passante à haute fréquencebasse fréquence (HL). La bande passante à haute fréquence (H) est divisée en une bande passante à basse fréquencehaute fréquence (LH) et en une bande passante à haute fréquence-haute fréquence (HH). En conséquence, l'image d'entrée est divisée en quatre bandes passantes. Lorsque ce
<Desc/Clms Page number 35>
processus est effectué de manière répétitive dans la bande passante à basse fréquence-basse fréquence (LL), une structure pyramidale 606 de l'image est obtenue. Il est possible d'obtenir une image ayant quatre bandes passantes en effectuant une transformation 604 à l'horizontale, et en effectuant ensuite une transformation 605 à la verticale.
La figure 7 illustre des processus à trois couches de codage évolutif de forme pour une image de format 4 : 2 :0.
Sur la figure 7, les références 701 et 702 indiquent l'image pyramidale par ondelettes d'une composante de luminance (Y) divisée en trois couches, et l'image pyramidale par ondelettes d'une composante de chrominance (UV) divisée en deux couches. Le nombre de couches de l'image de la composante de chrominance (UV) est une fois plus petit que le nombre de couches de l'image de la composante de luminance (Y) étant donné que le rapport de taille de l'image de la composante de chrominance (UV) sur l'image de la composante de luminance (Y) est de 4:1.
Il est possible d'obtenir les images 703, 704, 705 et 706 de la bande passante LL des couches respectives à partir de l'image pyramidale par ondelettes 701 de la composante de luminance (Y). En outre, il est possible d'obtenir les images 710, 711 et 712 de la bande passante LL des couches respectives à partir de l'image pyramidale par ondelettes 702 de la composante de chrominance (UV). Un encodeur et un décodeur évolutifs encodent séquentiellement l'information de forme de la bande passante LL à partir de la couche inférieure. Les articles 703 et 710 d'information de forme la plus basse des pyramides respectives sont encodés par un encodeur de forme générale. Les articles
<Desc/Clms Page number 36>
d'information de forme 704, 705, 706,711 et 712 des couches supérieures sont encodés de manière évolutive en utilisant les articles d'information de forme 703,704, 705,710 et 711 des couches inférieures des couches respectives, ce qui est indiqué par les références 707, 708,709, 713 et 714.
Lorsque le filtre de transformation par ondelettes est un filtre à symétrie paire, les transformations par ondelettes 707,708, 709,713 et 714 entre les couches peuvent être exprimées par une opération OU. En conséquence, lorsque l'information de forme 712 sur la composante de chrominance (UV) est échantillonnée par une opération OU à partir de l'information de forme 706 de la couche la plus haute de la composante de luminance (Y), les articles d'information de forme 703,704 et 705 de la composante de luminance (Y) des couches respectives sont les mêmes que l'information de forme 710,711 et 712 sur la composante de chrominance (UV). Les composantes de chrominance (UV) échantillonnées dans le rapport 4 : 1, pour les composantes de luminance (Y) des couches évolutives respectives, sont les 715,716 et 717 correctement assorties de un pour un aux composantes de luminance (Y).
En conséquence, aucun problème visuel n'est causé. Dans ce cas, l'encodage évolutif de forme pour la composante de chrominance (UV) n'est pas nécessaire. En conséquence, dans ce cas, les conditions activer~Forme (Shape~enable) & activer~Forme~Chroma (Chroma~shape~enable) 105 et 115 deviennent 0 dans les figures 1A et 1B, et l'information de forme de la composante de chrominance (UV) n'est pas encodée.
<Desc/Clms Page number 37>
Lorsque le filtre de transformation par ondelettes est un filtre à symétrie impaire, les transformations par ondelettes 707,708, 709,713 et 714 entre les couches ne sont pas des opérations OU. En conséquence, lorsque l'information de forme 712 de la composante de chrominance (UV) de la couche la plus haute est échantillonnée par opérations OU à partir de l'information de forme 706 de la composante de luminance (Y) (étant donné que certaines valeurs des articles d'information de forme 710 et 711 de la composante de chrominance (UV) échantillonnée dans le rapport 4 : 1 peuvent ne pas exister dans les articles d'information de forme 704 et 705 de la composante de luminance (Y) ) , la composante de couleur de la limite de la forme diminue. Afin de réduire cet effet, lorsque l'image de la couche la plus haute de la composante de chrominance (UV) est obtenue, l'information de forme obtenue par échantillonnage de l'information de forme de la composante de luminance (Y) par opérations OU est étendue aux blocs grâce à le nombre de couches. La composante de texture est obtenue en effectuant un remplissage horizontal et vertical, et l'information de forme de la composante de chrominance (UV) est encodée.
Les figures 8A et 8B sont des organigrammes décrivant les formes évolutives d'encodage et de décodage dans les unités d'un bloc. En référence à la figure 8A, des données du bloc alpha binaire (BAB) 801 sont délimitées (phase 802). Un mode d'encodage est déterminé (phase 803). Lorsque le mode d'encodage est un mode ISL, le codage ISL est effectué (phase 804 ) . Lorsque le mode d'encodage n'est pas un mode ISL, le codage RSL est effectué (phase 805) . Dans
<Desc/Clms Page number 38>
le mode ISL, un pixel est encodé en utilisant la corrélation entre le pixel à encoder et les pixels gauche et droit ou supérieurs et inférieurs. Dans le mode RSL, la corrélation entre un pixel à encoder et les pixels des couches inférieures est utilisée. Après l'encodage des données du BAB, après que l'encodage du pixel ait été effectué à la fin de l'image, le codage du pixel se termine et le train binaire encodé 809 est sorti. Lorsque le codage du pixel n'a pas été effectué à la fin de l'image, les phases suivant la phase 802 sont effectuées à nouveau pour les données du BAB suivantes (phase 808).
La figure 8B montre les processus inverses de ceux indiqués sur la figure 8A. Une limite est établie autour des données du BAB à rétablir en recevant le train binaire 810 encodé sur la figure 8A, et une couche inférieure ou des données précédemment rétablies du BAB 811 (phase 812).
Le mode d'encodage est décodé (phase 813). Lorsque le mode d'encodage est un mode ISL, le décodage ISL est effectué (phase 814). Lorsque le mode d'encodage n'est pas un mode ISL, le mode RSL est mis en #uvre (phase 815). Après décodage des données du BAB, après que le décodage ait été effectué à la fin de l'image, le décodage se termine, et l'information de forme rétablie 817 est alors obtenue.
Lorsque le décodage n'a pas été effectué à la fin de l'image, les phases suivant la phase 812 sont répétées après réception du train binaire d'entrée suivant 810 (phase 816).
La figure 9 décrit en détail les processus de délimitation du BAB sur la figure 8. Afin d'encoder un pixel du BAB, l'information de contexte doit être obtenue
<Desc/Clms Page number 39>
en référence aux pixels autour du pixel à encoder. Cependant, le pixel sur la limite du BAB peut ne pas avoir de pixels pour obtenir l'information de contexte.
En conséquence, une région de délimitation est établie sur le BAB avant de décoder le pixel. Sur la figure 9A, la délimitation d'un bloc 8x8 d'une couche inférieure est montrée. Etant donné que tous les articles d'information de forme des couches inférieures existent, les valeurs des pixels autour du pixel sur la limite du BAB sont utilisées comme une limite supérieure-gauche lxl A902, une limite supérieure 8x1 B 903, limite supérieure-droite 1x1 C 904, une limite gauche 1x8 E 906, une limite inférieure-gauche 1x1 F907, une limite supérieure 8x1 G908, et une limite supérieure-droite 1x1 H 909 d'un BAB 901. A ce moment, lorsque les valeurs des pixels autour du pixel sur la limite du BAB sont à l'extérieur de la limite de l'image d'entrée, les valeurs sont déterminées à être 0.
La figure 9B décrit une forme d'établissement d'une région de délimitation d'un BAB 16x16 d'une couche courante pour le mode d'encodage ISL. Les valeurs des pixels rétablis dans le bloc de forme précédent sont utilisées comme une limite supérieure-gauche 1x2 A911, une limite supérieure 16x2 B912, une limite supérieure-droite 1x2 C 913, et une limite gauche 1x16 D 914 d'un BAB 910. Une limite droite 1x16 E 915 et une limite supérieure 16x1 G 917 du BAB 910 sont obtenues par échantillonnage de la limite droite 1x8 E 915 et de la limite inférieure 8x1 G 908 du BAB de la couche inférieure indiquée sur la figure 9A. Il faut savoir que les limites droites 1x16 E 915 et supérieures 16x1 G 917 du BAB sont obtenues par répétition
<Desc/Clms Page number 40>
d'un pixel à deux pixels lorsque les limites sont échantillonnées dans le rapport 1 :2. Les valeurs de la limite inférieure-gauche 1x1 F 907 et de la limite supérieure-droite lxl H 909 de la couche inférieure sont utilisées comme valeurs de la limite inférieure-gauche 1x1 F 916 et de la limite inférieure-droite lxl H 918 de la couche courante.
La figure 9C décrit une méthode d'établissement d'une région de délimitation d'un BAB 16x16 de la couche courante pour le mode d'encodage RSL. Les valeurs des pixels rétablis dans le BAB précédent sont utilisées comme une limite supérieure-gauche lxl A 920, une limite supérieure 16x1 B 921, une limite supérieure-droite 1x1 C 922, et une limite gauche 1x16 D 923 d'un BAB 919, comme dans le mode ISL de la figure 9B. Les tailles des régions de délimitation A 920, B921 et C 922 sur la figure 9C sont différentes de celles indiquées sur la figure 9B. Cela vient du fait que la position de l'information de contexte du mode ISL est différente de la position de l'information de contexte du mode RSL. Une limite droite 1x16 E 924 et une limite inférieure 16x1 G 926 du BAB 919 sont obtenues par échantillonnage de la limite droite 1x8 E 906 et de la limite inférieure 8x1 G 908 du BAB de la couche inférieure montrée sur la figure 9A. Les valeurs de la limite inférieure-gauche lxl F 907 et de la limite inférieuredroite lxl H 909 sont utilisées comme valeurs d'une limite inférieure-gauche lxl F 925, et d'une limite inférieuredroite 1x1 H 927.
La figure 10 indique les conditions de détermination du choix entre le mode d'encodage ISL et RSL dans la phase
<Desc/Clms Page number 41>
803 de la figure 8 pour un BAB. Les conditions doivent être vérifiées en utilisant les BAB et les régions de délimitation de deux couches comme entrées. Le pixel 1x1 P: 1001 du BAB fl (i, j) de la couche inférieure correspon 1002 au bloc de pixels 2x2 PO, Pl, P2, P3 1003 du BAB f: (i,j) de la couche courante. Les références 1007 et 100 qui indiquent les limites du BAB f2 (i, j) sont obtenues pa: échantillonnage répétitif des références 1004 et 1005 qu: indiquent les limites du BAB fl (i,j). La référence 100: qui indique la limite de la couche courante est obtenue a partir de la référence 1006 qui indique la limite de la couche inférieure. L'équation 1 est vérifiée afin de déterminer le mode d'encodage.
[Equation 1] conditionl = (f2 (2i, 2j) == f1 (i, j)) conndition2 = : ( ! (f2 (2i, 2j) ? f2 (2i+2,2j) & & (f2 (2i+1, 2j) ! = f2 (2i, 2j)) condition3 = ! ( ! (f2 (2i, 2j) ? f2 (2i, 2j+2) & & (f2 (2i, 2j+1) ! - f2 (2i, 2j)) condition4 = ! ( ! (f2 (2i+l, 2j) ? f2 (2i+l, 2j+2) & & (f2 (2i+1, 2j+l) ' = f2 (2i+1, 2j))
Ici, ? représente un opérateur OU exclusif et a la valeur de 1 lorsque deux opérandes sont différentes l'un( de l'autre (1 et 0 ou 0 et 1). L'opérateur && représente ur opérateur ET et l'opérateur ! représente un opérateur PAS Lorsque les quatre conditions de l'Equation 1 soni remplies, le BAB est encodé en mode ISL. Lorsque les quatre
<Desc/Clms Page number 42>
conditions de l'Equation 1 ne sont pas remplies, le BAB est encodé en mode RSL.
La condition 1 est remplie lorsque le pixel Pl est le même que le pixel PO. En conséquence, dans le cas d'un mode ISL, Pl n'est pas encodé. En général, dans le cas de l'information de forme, il y a une grande corrélation entre le pixel à encoder et les pixels gauches et droits ou supérieurs et inférieurs. En conséquence, lorsque les pixels gauches et droits du pixel à encoder ont la même valeur, ou que les pixels au-dessus et en dessous du pixel à encoder ont la même valeur, il y a une forte probabilité que les valeurs soient égales à la valeur du pixel à encoder. Les conditions 2,3 et 4 servent à vérifier que les deux pixels adjacents ont la même valeur et que la valeur du pixel à encoder dans le BAB à encoder est égale à la valeur des deux pixels adjacents. La condition 2 sert à vérifier si les pixels à gauche et à droite du pixel Pl à encoder ont la même valeur, et si la valeur est égale à celle du pixel à encoder. La condition 3 sert à vérifier si les pixels au-dessus et en dessous du pixel P2 à encoder ont la même valeur, et si la valeur est égale à celle du pixel à encoder. La condition 3 sert à vérifier si les pixels au-dessus et en dessous du pixel P3 à encoder ont la même valeur, et si la valeur est égale à celle du pixel à encoder. Le fait que les conditions 2,3 et 4 soient remplies signifie que Pl, P2 et P3 sont encodés seulement lorsque les pixels gauches et droits ou supérieurs et inférieurs ont des valeurs différentes. Il est possible d'améliorer l'efficacité du codage en mode ISL en réduisant le nombre de Pl, P2 et P3 à encoder, en utilisant la
<Desc/Clms Page number 43>
corrélation entre les lignes de balayage de trame entrelacées. Le mode d'encodage RSL est utilisé lorsque la position du pixel est changée dans la bande passante à basse fréquence pendant la transformation par ondelettes, et lorsqu'une ou plusieurs conditions ne sont pas remplies parmi les conditions 2,3 et 4. Dans ce cas, tous les pixels PO, Pl, P2 et P3 de la couche courante sont encodés en utilisant les valeurs des pixels des couches inférieures. L'information du mode d'encodage est encodée en utilisant le codage arithmétique comme dans le codage d'un pixel. La répartition statistique de l'encodeur arithmétique du mode d'encodage du BAB est la suivante.
Statique non-signé int prob~type~bab~évolutif[2] = (59808, 44651} [Static unsigned int scalable~bab~type~prob[2] = {59808, 44651}];
La figure 11 est un organigramme décrivant une méthode d'encodage en mode ISL. Lorsque les données du BAB 1101 délimité par la forme de la figure 9B sont reçues, les pixels respectifs dans le BAB sont balayés dans la commande d'encodage du mode ISL (phase 1102). La commande d'encodage du mode ISL est indiquée sur la figure 15A. En considérant la corrélation entre les pixels des différentes couches telle que la référence 1002 de la figure 10, PO n'est pas encodé étant donné que PO doit devenir Pl et que la valeur Pl est encodée en premier. Ensuite, P2 et P3 sont encodés de manière séquentielle. Il faut savoir que lorsque la valeur du pixel à encoder est celle de PO (phase 1103), le pixel n'est pas encodé. Lorsque la valeur du pixel à encoder n'est pas celle de PO, on vérifie si la valeur du
<Desc/Clms Page number 44>
pixel à encoder est celle de Pl (phase 1104). Lorsque la valeur du pixel à encoder est celle de Pl, on vérifie si les pixels à gauche et à droite du pixel à encoder ont la même valeur (phase 1105). Lorsque les pixels à gauche et à droite du pixel à encoder ont la même valeur, la valeur de Pl n'est pas encodée. Lorsque les pixels à gauche et à droite du pixel à encoder ont des valeurs différentes, l'information de contexte pour l'encodage du pixel et la valeur statistique pour le codage arithmétique sont calculés, et la valeur Pl est codée de manière arithmétique (phases 1106 et 1107) .
L'information de contexte pour l'encodage de la valeur du pixel Pl est indiquée sur la figure 16A. L'information de contexte est obtenue par l'équation 2 en utilisant 7 pixels autour du pixel à encoder.
[Equation 2]
Il est possible d'obtenir la répartition statistique de la valeur du pixel à encoder grâce à la valeur de l'information de contexte qui montre la disposition des pixels autour du pixel à encoder, et effectue le codage arithmétique sur le pixel en utilisant la répartition statistique comme une entrée. Si il y a plusieurs 1 autour du pixel à encoder, il y a une très grande probabilité que le pixel à encoder soit 1. En conséquence, il est possible de réduire le nombre de bits lorsque 1 est encodé. En outre, dans un autre type de contexte, il est possible de réduire efficacement le nombre de bits du pixel à encoder.
Répartition statistique grâce à l'information de contexte de la valeur de Pl utilisée en mode d'encodage ISL.
<Desc/Clms Page number 45>
<Probabilité 1> statique non-signé int prob~xor~évolutif~l[128]= (static unsigned int scalable~xor~prob~l[128])= {65476, 64428, 62211, 63560,52253, 58271,38098, 31981,
50087,41042, 54620,31532, 8382,10754, 3844,6917,
63834,50444, 50140,63043, 58093,45146, 36768, 13351,
17594,28777, 39830, 38719,9768, 21447,12340, 9786,
60461,41489, 27433,53893, 47246,11415, 13754, 24965,
51620,28011, 11973,29709, 13878,22794, 24385,1558,
57065,41918, 25259,55117, 48064,12960, 19929,5937,
25730,22366, 5204,32865, 3415,14814, 6634,1155,
64444,62907, 56337,63144, 38112,56527, 40247, 37088,
60326,45675, 51248,15151, 18868,43723, 14757, 11721,
62436,50971, 51738,59767, 49927,50675, 38182, 24724,
48447,47316, 56628,36336, 12264,25893, 24243,5358,
58717,56646, 48302,60515, 36497,26959, 43579, 40280,
54092,20741, 10891,7504, 8109,30840, 6772,4090,
59810,61410, 53216,64127, 32344,12462, 23132, 19270,
32232,24774, 9615,17750, 1714,6539, 3237, 152};
Lorsque la valeur du pixel à encoder est celle de P2 ou P3, on vérifie si les pixels au-dessus et en dessous du pixel à encoder ont la même valeur (phase 1108). Lorsque
<Desc/Clms Page number 46>
les pixels au-dessus et en dessous ont la même valeur, la valeur de P2 ou P3 n'est pas encodée. Lorsque les pixels au-dessus et en dessous ont des valeurs différentes, l'information de contexte pour l'encodage du pixel et la valeur statistique pour effectuer le codage arithmétique sur le pixel sont calculés, et le codage arithmétique est effectué sur la valeur de P2 ou P3 (phases 1109 et 1110) .
L'information de contexte pour l'encodage des valeurs de pixel P2 et P3 est obtenue par l'équation 2 en utilisant 7 pixels autour du pixel à encoder, comme indiqué sur la figure 16B. La répartition statistique grâce à l'information de contexte des valeurs P2 et P3 utilisées en mode d'encodage ISL est la suivante.
<Répartition statistique 2> statique non-signé int prob~xor~évolutif~1[128]= (static unsigned int scalable~xor~prob~23[128])= {65510, 63321,63851, 62223,64959, 62202,63637, 48019,
57072,33553, 37041,9527, 53190,50479, 54232,12855,
62779,63980, 49604,31847, 57591,64385, 40657,8402,
33878,54743, 17873,8707, 34470,54322, 16702,2192,
58325,48447, 7345,31317, 45687,44236, 16685,24144,
34327,18724, 10591,24965, 9247,7281, 3144,5921,
59349,33539, 11447,5543, 58082,48995, 35630,10653,
7123,15893, 23830,800, 3491,15792, 8930,905,
65209,63939, 52634,62194, 64937, 53948, 60081, 46851,
56157,50930, 35498,24655, 56331,59318, 32209,6872,
59172,64273, 46724,41200, 53619,59022, 37941, 20529,
<Desc/Clms Page number 47>
55026,52858, 26402,45073, 57740,55485, 20533,6288,
64286,55438, 16454,55656, 61175,45874, 28536, 53762,
58056,21895, 5482,39352, 32635,21633, 2137,4016,
58490,14100, 18724,10461, 53459,15490, 57992, 15128,
12034,4340, 6761,1859, 5794,6785, 2412, 35};
Lorsqu'une valeur de pixel est encodée, on vérifie si le pixel est le dernier des données du BAB (phase 1111). Lorsque la valeur du pixel est le dernier pixel, un train binaire encodé 1112 est obtenu. Lorsque le pixel n'est pas le dernier, les processus suivant la phase 1102 sont répétés pour chaque pixel.
La figure 12 est un organigramme décrivant la forme d'encodage du mode ISL dans des processus inverses de ceux de la figure 11. Lorsqu'un train binaire encodé 1201 et des données du BAB délimité 1202 sont introduits, le train binaire encodé 1201 et les données du BAB délimité 1202 sont balayés dans la commande d'encodage du mode ISL (phase 1203). Le décodage du mode d'encodage ISL est effectué dans la commande montrée sur la figure 15A. On vérifie si la valeur du pixel à rétablir est la valeur PO (phase 1204) .
Lorsque la valeur du pixel à rétablir est la valeur PO, la valeur du pixel est rétablie à la valeur du pixel PL de la couche inférieure (phase 1205). Lorsque la valeur du pixel à rétablir n'est pas la valeur PO, on vérifie si la valeur du pixel à rétablir est celle de Pl (phase 1206).
Lorsque la valeur du pixel à rétablir est celle de Pl, on vérifie si les valeurs du pixel gauche et droit (C3 et C2 sur la figure 16A) de la valeur du pixel sont égales
<Desc/Clms Page number 48>
(phase 1207). Lorsque C3 et C2 sont égales sur la figure 16A, Pl est rétabli aux valeurs du pixel gauche et droit C3 et C2 (phase 1208). Lorsque C3 est différent de C2, l'information de contexte pour le décodage du pixel et la valeur statistique po ur effectuer le décodage arithmétique sur la valeur du pixel sont calculés, et Pl est rétabli en effectuant le décodage arithmétique (phases 1209 et 1210). L'information de contexte pour le décodage de la valeur du pixel Pl est obtenue par l'équation 2 en utilisant 7 pixels montrés sur la figure 16A autour du pixel à décoder. La répartition statistique grâce à l'information de contexte de la valeur Pl utilisée dans le mode d'encodage ISL est la même que la <Répartition statistique 1>.Lorsque la valeur du pixel à rétablir est celle de P2 ou P3, on vérifie si les valeurs du pixel (Ci et C5 sur laigure 16B) au-dessus et en dessous de la valeur du pixel sont égales (phase 1211). Lorsque Cl est égal à C5 sur la figure 16B, la valeur de P2 ou P3 est rétablie en haut ou en bas de la valeur du pixel Clou C5 (phase 1212).
Lorsque Cl est différent de C5, l'information de contexte pour l'encodage du pixel et la valeur statistique pour effectuer le décodage arithmétique sur le pixel sont calculées, et la valeur de P2 ou P3 est rétablie en effectuant le décodage arithmétique (phases 1213 et 1214).
L'information de contexte pour le décodage des valeurs de P2 et P3 est obtenue par l'équation 2 en utilisant 7 pixels indiqués sur la figure 16B autour des pixels à décoder. La répartition statistique grâce à l'information de contexte des valeurs de P2 et P3 utilisées dans le mode d'encodage ISL est la même que la <Répartition statistique 2>.
<Desc/Clms Page number 49>
Lorsqu'un pixel est rétabli grâce aux processus de décodage ci-dessus, on vérifie si le pixel rétabli est le dernier pixel des données du BAB (phase 1215). Lorsque le pixel est le dernier pixel des données du BAB, les données du BAB rétabli 1216 sont obtenues. Lorsque le pixel n'est pas le dernier pixel des données du BAB, les processus suivant la phase 1203 sont répétés pour le nouveau pixel.
La figure 13 est un organigramme décrivant la forme d'encodage du mode RSL. Lorsque des données du BAB 1301 délimité par la forme de la figure 9C sont introduites, les pixels respectifs dans le BAB sont balayés dans la commande d'encodage du mode RSL (phase 1302). La commande d'encodage du mode RSL est indiquée sur la figure 15B. On vérifie si la valeur du pixel à encoder est celle de PO (phase 1303).
Lorsque la valeur du pixel est celle de PO, on vérifie si la valeur du pixel Pl de la couche inférieure correspondant à la position actuelle du pixel est 0 (phase 1304). Lorsque la valeur de Pl est 0, le pixel n'est pas encodé. Lorsque la valeur de Pl est 1, l'information de contexte pour l'encodage du pixel et la valeur statistique pour effectuer le codage arithmétique sur le pixel sont calculées, et le codage arithmétique est effectué sur la valeur de PO (phases 1305 et 1306).
Lorsque le filtre à symétrie impaire est utilisé dans la transformation par ondelettes de la couche supérieure à la couche inférieure, la position d'un point impair est changée dans la bande passante à basse fréquence. Lorsque le filtre à symétrie paire est utilisé, le premier pixel impair est changé dans la composante de basse fréquence.
Dans ces deux cas, étant donné que 0 est changé en 1 dans
<Desc/Clms Page number 50>
la région à basse fréquence de la couche inférieure, contrairement à l'encodage, il y a une possibilité que la valeur de PO soit changée seulement lorsque le pixel Pl de la couche à basse fréquence est 1 lorsque le pixel est rétabli. En conséquence, lorsque le pixel Pl est 0, le pixel n'est pas encodé.
L'information de contexte pour l'encodage RSL est montré sur la figure 16C. L'information de contexte est obtenue par l'équation 2 en utilisant 5 pixels (C4, C5, C6, C7 et C8 de la figure 16C) des couches inférieures, et quatre pixels (CO, Cl, C2 et C3 de la figure 16C) autour du pixel à encoder de la couche courante. La répartition statistique grâce à l'information de contexte du pixel à encoder pour l'encodage en mode RSL est la suivante.
<Répartition statistique 3> (probability distribution 3) statique non-signé int prob~plein~évolutif[512]= (static unsigned int scalable~full~prob[512])={
65524,65478, 65524, 32768,32768, 32768,65464, 32768,
32768,32768, 32768,32768, 32768,32768, 32768, 32768,
64349,21570, 65373,32768, 32768,32768, 64685, 32768,
32768,32768, 32768,32768, 32768,32768, 32768, 32768,
65246, 64528, 60948,64479, 26214, 32768, 16843, 32768,
32768,32768, 32768,32768, 32768,32768, 32768, 32768,
<Desc/Clms Page number 51>
63498,10078, 50130,4010, 16384,32768, 2773,1316,
32768,32768, 32768,32768, 32768,32768, 32768, 32768,
47058,21126, 35436,4626, 37137,24876, 27151,11722,
54032,43538, 25645,6858, 42976,36599, 44237,15996,
38096,25303, 21007,5307, 8618,19293, 3021,2416,
24740,35226, 4369,24858, 19920,12336, 11718,4390,
45487,5313, 26464,5354, 33556,19876, 33099,9713,
15749,7876, 40867,36223, 27065,10377, 42337,9907,
52230,2688, 20906,1269, 8507,8987, 2929,767,
23609,18238, 18787,32074, 24720,10786, 34351,1489,
65519,65524, 65363,32768, 32768,32768, 64171, 32768,
65524,65531, 32768,32768, 32768,32768, 32768, 32768,
65140,50762, 65102,32768, 32768,32768, 62415, 32768,
50218,41801, 32768,32768, 32768,32768, 32768, 32768,
64963,65368, 59158,64444, 32768,32768, 15320, 32768,
65432,65490, 65054,65216, 32768,32768, 32768, 32768,
61586,52398, 43664,16798, 4369,32768, 2261,8287,
46251,53036, 33737,26295, 32768,32768, 32768, 32768,
60268,31543, 25894,11546, 32094,35000, 19152, 15313,
60467,30803, 30501,22027, 55068,27925, 50009, 14617,
<Desc/Clms Page number 52>
62716,34972, 23572,13523, 5767,22408, 2297,7880,
48362,21477, 15490,21907, 46113,3403, 36430,2534,
46798,6086, 28318,13929, 16384,25405, 19032,14342,
31875,8303, 43054,27746, 30750,11592, 45209,6647,
49977,8979, 19805,3636, 7526,13793, 1726,874,
43735,10691, 21314,15586, 26597,1637, 46751,763,
65521,64662, 65522,32768, 65448,32768, 65519, 32768,
65519,32768, 65425,32768, 65518,32768, 65531, 32768,
64061,24926, 65438,32768, 65162,32768, 65439, 32768,
65387,32768, 65036,32768, 65414,32768, 65505, 32768,
65211,61440, 64686,63898, 31500,32768, 51716, 32768,
54459,32768, 50302,32768, 36409,32768, 39275, 32768,
62824,17179, 55885,9925, 36231,32768, 39442,5152,
44395,32768, 40960,32768, 31267,32768, 40015, 32768,
37767,21420, 58706,9997, 47907,16277, 31559,4134,
63689,53786, 29789,15490, 53468,24226, 25698, 10158,
24246,19795, 41227,10169, 15452,11259, 5422,1509,
42807,52609, 37449,27173, 20776,10504, 18256,3144,
40953,4656, 62176,6482, 35639,13355, 33765,4474,
44149,27748, 48824,31490, 40902,12039, 22817,2077,
46515,3789, 49266,5081, 15143,12674, 4434,337,
<Desc/Clms Page number 53>
43468,28306, 31069,29457, 37942,6798, 8863,280,
65500,65364, 65427,32768, 64860,32768, 65280, 32768,
65533,65529, 65379,32768, 65499,32768, 65510, 32768,
63851,34810, 65361,32768, 64111,32768, 65290, 32768,
63376,46390, 64746,32768, 65377,56174, 65475, 32768,
65130,65036, 61752,64444, 23546,32768, 37897, 32768,
64164,65499, 59443,65255, 36359,32768, 41795, 32768,
60451,46151, 49242,18561, 21845,32768, 24846, 11969,
55142,53590, 37926,25977, 41804,32768, 37615, 32768,
60289,26751, 45180,16830, 39394,34740, 24237,7623,
65005,61212, 31154,37511, 63413,31640, 57423,8360,
61019,31563, 47345,23577, 15308,13653, 17255,5024,
59892,49587, 26933,31950, 54850,8587, 41904,1255,
56552,9777, 52370,16762, 17118,35915, 33507,7744,
54902,34383, 54875,40718, 54047,22218, 48436,4431,
50112,7519, 24647,6361, 13569,6303, 5215,1078,
49640,21245, 39984,26286, 45900,4704, 23108, 206};
Lorsque la valeur du pixel à encoder n'est pas la valeur de PO, l'information de contexte pour l'encodage du pixel et la valeur statistique pour effectuer le codage arithmétique sur le pixel sont calculées, et le codage
<Desc/Clms Page number 54>
arithmétique est effectué sur les valeurs de Pl, P2 ou P3 (phases 1307 et 1308). Chaque fois qu'une valeur de pixel est encodée, on vérifie si le pixel est le dernier pixel des données du BAB (phase 1309). Lorsque la valeur du pixel est le dernier pixel, un train binaire encodé 1310 est obtenu. Lorsque le pixel n'est pas le dernier pixel, les processus suivant la phase 1302 sont répétés pour le nouveau pixel.
La figure 14 est un organigramme décrivant une méthode d'encodage du mode RSL dans le processus inverse de ceux de la figure 13. Lorsqu'un train binaire encodé 1401 et des données du BAB délimité 1402 sont introduits, le train binaire encodé 1401 est balayé dans la commande d'encodage du mode d'encodage RSL (phase 1403). Le décodage du mode d'encodage ISL est effectué dans la commande indiquée sur la figure 15B. On vérifie si la valeur du pixel rétabli est celle de PO (phase 1404). Lorsque la valeur du pixel à rétablir est celle de PO, on vérifie si la valeur du pixel de la couche inférieure Pl correspondant à la position actuelle du pixel est 0 (phase 1405) . Lorsque la valeur de Pl est 0, la valeur de PO est rétablie. Lorsque la valeur de Pl est 1, l'information de contexte pour rétablir le pixel et la valeur statistique pour effectuer le décodage arithmétique sur le pixel sont calculées, et le décodage arithmétique est effectué sur la valeur de PO (phases 1407 et 1408) .
L'information de contexte pour l'encodage RSL est indiquée sur la figure 16C. L'information de contexte est obtenue par l'équation 2 en utilisant 5 pixels (C4, C5, C6, C7 et C8 de la figure 16C) des couches inférieures, et
<Desc/Clms Page number 55>
quatre pixels (CO, Cl, C2 et C3 de la figure 16C) autour du pixel à encoder de la couche courante. La répartition statistique grâce à l'information de contexte du pixel à décoder pour l'encodage du mode RSL est la même que la <Répartition statistique 3>. Lorsque la valeur du pixel à décoder n'est pas la valeur de PO, l'information de contexte pour rétablir le pixel et la valeur statistique pour effectuer le décodage arithmétique sur le pixel sont calculées, et le décodage arithmétique est effectué sur les valeurs de Pl, P2 ou P3 (phases 1406 et 1410). Chaque fois qu'un pixel est rétabli grâce aux processus de décodage cidessus, on vérifie si le pixel est le dernier pixel des données du BAB (phase 1411). Lorsque le pixel est le dernier pixel des données du BAB, les données du BAB rétabli 1412 sont obtenues. Lorsque le pixel n'est pas le dernier pixel des données du BAB, les processus suivant la phase 1403 sont répétés pour le nouveau pixel.
La figure 17A indique la structure d'un encodeur d'image fixe d'un objet incluant une opération de mosaïque.
Un objet d'entrée 1700 est divisé en carreaux, et un signal de commande est encodé. Les carreaux respectifs (carreau 0, carreau 1, ..., et carreau M-1) sont encodés par l'encodeur d'image fixe 1703 comme indiqué sur la figure 1, et les trains binaires encodés sont connectés les uns aux autres par le multiplexeur inférieur 1704. Si il y a plus d'objets d'entrée à encoder (par exemple, un autre objet d'entrée 1710), les objets d'entrée sont encodés par la même forme, et les trains binaires encodés sont obtenus. Les trains binaires encodés sont connectés à un train binaire 1730 à transmettre par le multiplexeur supérieur 1720.
<Desc/Clms Page number 56>
La figure 17B est un diagramme de bloc montrant les processus d'obtention d'une image rétablie à partir du train binaire encodé 1730. Ces processus sont inverses de ceux de la figure 17A. Le train binaire d'entrée 1730 est divisé en objets encodés par un démultiplexeur supérieur 1740. Chaque objet est divisé en une composante de signal de commande et en une composante de carreau par un démultiplexeur inférieur 1750, et est rétabli. Une image rétablie pour chaque objet est obtenue en reconstruisant les composantes des carreaux respectifs (carreau 0, carreau 1, ..., carreau M-1). Les images rétablies respectives sont reconstruites en une image finale de sortie 1790 par un compositeur d'objet 1780, et l'image finale de sortie est diffusée.
La figure 17C indique le résultat d'une division en carreaux d'un objet de forme arbitraire. Lorsqu'une image d'entrée (C01) est divisée en carreaux, il y a des carreaux (C02) dans lesquels l'information de forme n'existe pas, des carreaux (C03) dans lesquels l'information de forme existe partiellement, et un carreau (C04) qui est à l'intérieur de l'objet. (C05) indique les carreaux devant être encodés. Chaque carreau est encodé de manière indépendante par un encodeur comme une image d'entrée. Un signal de commande nécessaire pour encoder les carreaux est encodé en plus afin de commander une image de sortie.
Les figures 18A à 18F indiquent les syntaxes de trains binaires montrant l'opération entière de l'encodeur évolutif pour une image fixe utilisant la transformation par ondelettes grâce à la présente invention. Ici, le train
<Desc/Clms Page number 57>
binaire montre des données compressées sous la forme de valeurs binaires de " 0 " et " 1 ".
ObjetTextureFixe (StillTextureObject) ( ) de la figure 18A inclut une syntaxe de train binaire montrant les processus de l'opération de l'encodeur. (L001) indique un code de déclenchement pour distinguer l'objet à encoder des autres objets. Lorsque plusieurs articles d'information d'objet existent dans l'information encodée, les articles d'information d'objet sont classés par le code de déclenchement. En conséquence, un nom unique est attribué à chaque objet afin de distinguer un objet d'un autre. EntêteTextureFixe (StillTextureHeader) ( ) de (L002), qui est décrit en détail sur la figure 18B, indique plusieurs articles d'information supplémentaires nécessaires pour effectuer l'encodage. (L003) à (L007) indiquent des informations sur la taille de l'image d'entrée lorsque l'information de forme d'entrée n'a pas de forme arbitraire. Lorsque l'image d'entrée a une forme arbitraire, les processus (L008) à (L019) sont effectués.
Les processus (L008) à (L019) incluent le point de début de trame et la taille d'une région de délimitation qui entoure l'information de forme, et les processus d'encodage de l'information de forme lorsque les carreaux ne sont pas utilisés. Le décodage de l'information de forme, décodage~objet~forme (shape~object~decoding) ( ), est décrit en détail sur la figure 18E. (L020) et (L021) indiqués sur la figure 18C indiquent plusieurs signaux de commande nécessaires pour l'opération de mosaïque.
L'encodage de l'information dans le carreau est effectué en
<Desc/Clms Page number 58>
CarreauTextureFixe (StillTextureTile) ( ) de (L022), qu: est décrit en détail sur la figure 18D.
En-têteTextureFixe (StillTextureHeader) ( ) de la figure 18B indique plusieurs articles d'information supplémentaires nécessaires pour effectuer l'encodage (L101) indique si l'opération de mosaïque est utilisée (L102) indique l'identificateur (ID) de l'objet à encoder bit~marqueur (marker~bit) de (L103) est une valeur pour empêcher le code de déclenchement d'exister dans d'autre: données encodées. (L104) à (L108) indiquent plusieurs articles d'information supplémentaires se rapportant à la transformation par ondelettes et à l'encodage. (L109; indique si l'objet d'entrée a une forme arbitraire et s: l'information de forme va être encodée. (L110) à (L128) SE rapportent à l'entrée d'informations supplémentaires relatives à la variation d'échelle et de coefficients dE filtrage.
CommandeCarreauTextureFixe (StillTextureTileControl) ) de la figure 18C indique plusieurs signaux de commande nécessaires à l'opération de mosaïque. (L201) à (L206; indiquent les tailles des carreaux à la verticale et l'horizontale, et le nombre de carreaux à encoder dans l'image d'entrée. Afin de rétablir directement un carreai désigné arbitrairement par un utilisateur dans le traii binaire, (L207) à (L215) indiquent la quantité de bits utilisés pour encoder les carreaux respectifs dans les unités d'un octet. Une valeur de 32 bits est exprimée par valeurs de 16 bits.
CarreauTextureFixe (StillTextureTile) ( ) de la figure 18D indique les processus d'encodage de l'information dE
<Desc/Clms Page number 59>
forme et de l'information de texture dans un carreau. (L303), qui indique le code de déclenchement de chaque article d'information de carreau, permet à l'utilisateur de distinguer les informations de carreau désirées d'un autre article d'information de carreau, et de rétablir les informations de carreau désirées avec l'identificateur (ID) de (L304). (L307) indique 3 types de carreaux comme indiqué sur la figure 17C. (L310) à (L312) montrent les processus d'encodage de l'information de forme dans un carreau en utilisant l'encodeur évolutif grâce à la présente invention, seulement dans le cas où l'information de forme existe partiellement dans un carreau. DécodageTextureFixe (StillTextureDecoding) ( ) de (L314) montré en détail sur la figure 18F indique les processus d'encodage de la composante de texture en utilisant l'information sur la position d'un coefficient de forme encodé.
DécodageTextureFixe (StillTextureDecoding) ( ) ne sera pas décrit en détail étant donné qu'il n'est pas directement lié au contenu de la présente invention.
Décodage~objet~forme (Shape~object~decoding) ( ) de la figure 18E indique les processus de décodage évolutif de l'information de forme. (L401) à (L417) indiquent les processus d'encodage de l'information de forme d'une couche de base. (L406) et (L407) indiquent le nombre de BAB à la verticale et à l'horizontale. Lorsque l'opération de mosaïque n'est pas utilisée (inactiver~Tuilage= = 1) (tiling~disable= = 1), largeur~objet (object~width) (L013) et hauteur~objet (object~height) (L015) de la figure 18A sont utilisés. Lorsque l'opération de mosaïque est utilisée, largeur~carreau (tile~width) et hauteur~carreau
<Desc/Clms Page number 60>
(tile~height) de (L201) et (L203) de la figure 18C sont utilisés. En outre, niveaux~décomposition~ondelette (wavelet~decomposition~levels) de (L106) de la figure 18B, qui indique le nombre de couches, est utilisé. Les processus d'encodage de l'information de forme de la couche de base sont les suivants.
<Desc/Clms Page number 61>
[Equation3] int shape~base~layer~height~blocks ( ) { int height; if (tiling~disable==1)
Figure img00610001

height= object- height wavelet- decompositioll ~levels)+ 15) / 16; else height= ((tile~height wavelet~decomposition~levels)+15) / 16; returnheight ; int shape~base~layer~width~blocks ( ) { intwidth; if (tiling~disable== 1 ) width= ((object~width wavelet~decomposition~levles)+15) / 16; else width= ((tile~width#wavelet~decomposition~levels)+15) / 16; returnwidth ; ici, représente un opérateur d'inversion.
(L417) à (L439) indiquent les processus d'encodage évolutif pour le codage de l'information de forme dans les couches supérieures. Dans ce cas, l'encodage est effectué par encodage ISL ou par décodage RSL grâce au mode d'encodage. (L421), (L422), (L434) et (L435) indiquent le nombre de BAB à encoder dans les couches supérieures à la verticale et à l'horizontale. largeur~objet (object~width) (L013) et hauteur~objet (object~height) (L015) de la figure 18A sont utilisés comme nombres de BAB à encoder dans les couches supérieures à la verticale et à l'horizontale
<Desc/Clms Page number 62>
lorsque l'opération de mosaïque n'est pas utilisée (inactiver~Tuilage==l) (tiling~disable= = 1) comme dans la couche de base. Largeur~carreau (tile~width) (L201) et hauteur~objet (tile~height) (L203) de la figure 18C sont utilisés comme nombres de BAB à encoder dans les couches supérieures à la verticale et à l'horizontale lorsque l'opération de mosaïque est utilisée. En outre, niveaux~décomposition~ondelette (wavelet~decomposition~levels) de (L106) de la figure 18B qui indique le nombre de couches de la transformation par ondelettes est utilisé. Les processus d'encodage évolutif pour le codage de l'information de forme dans les couches supérieures sont les suivants.
<Desc/Clms Page number 63>
[Equation 4]
Int shape~enhanced~layer~height~blocks( ) { intheight; if(tiling~disable==l) { height= ((object~height (wavelet~decomposition~levels-L+l))+bab~size-l) /bab~size; } else{ height= ((tile~height (wavelet~decomposition~levels-L+l))+bab~size-l) / bab~size; retumheight ; } int shape~enhanced~layer~width~blocks( ) { intwidth; if(tiling~disable==l) { width=
Figure img00630001

obj ect-width (wavelet-decomposition-levels-L+ 1 +bab~size- 1) / bab~size; } else { width=
Figure img00630002

((tile~width (wavelet~decomposition~levels-L+1 ))+bab~size-1 ) / bab~size; returnwidth ; ici, L indique à quelle couche numérotée appartient l'information de forme parmi les couches supérieures.
<Desc/Clms Page number 64>
taille~bab (bab~size) indique la taille du BAB de la couche supérieure à la verticale et à l'horizontale, ce qui peut être montré comme suit grâce à la taille de l'image d'entrée.
[Equation 5] if(tiling~disable==1) { layer~width= object~width (wavelet~decomposition~levels-L+l); layer~height= object~height (wavelet~decompositioon~levels-L+l); } else { layer~width = tile~width (wavelet~decomposition~levels-L+l); layerjheight tile~height (wavelet~decomposition~levels-L+l); } if(layer~width≥1024 # layer~height≥1024) bab~size = 64; else if(layer~width≥512# layer~height≥512) bab~size = 32 else bab size = 16
Cette équation est appliquée afin d'empêcher que l'efficacité de l'encodage se détériore en augmentant variablement la taille des blocs grâce à la taille de l'image d'entrée étant donné que l'efficacité d'encodage se détériore lorsqu'une grande image d'entrée est divisée en petits blocs et que les blocs sont encodés.
Décoder~arithmétique~binaire~évo (Enh~binary~arithmetic ~decode) () de (L424) et (L436) indiquent les processus d'encodage des pixels dans le BAB par l'encodeur évolutif en utilisant l'information de contexte des pixels autour du pixel à encoder et l'encodeur arithmétique. Une première valeur indique si le BAB est encodé en mode ISL ou en mode RSL. Les valeurs restantes incluent les processus de mise en #uvre du codage arithmétique sur les pixels d'une image
<Desc/Clms Page number 65>
incluant l'information de forme en utilisant l'information de contexte des pixels autour du pixel à encoder.
DécodageTextureFixe (StillTextureDecoding) ( ) de la figure 18F indique les processus d'encodage évolutif par ondelettes de l'information de texture en utilisant l'information de forme obtenue depuis la figure 18E. une description détaillée du processus sera omise étant donné que les processus n'ont pas de rapport avec la présente invention.
Grâce à l'encodeur évolutif d'image fixe utilisant des ondelettes, il est possible d'encoder efficacement les pixels en réduisant le nombre de pixels à encoder en utilisant les caractéristiques entre les pixels ISL de la couche à encoder, ou les pixels entre 2 couches lors de l'encodage de l'information de forme entre les couches respectives. En conséquence, il est possible de rétablir séquentiellement l'information de forme de l'image fixe ainsi que l'information de texture de l'image fixe en effectuant l'encodage évolutif grâce à la résolution de l'image, qui peut être efficacement appliquée à la recherche d'une image dans une base de données de grande capacité telle qu'une bibliothèque numérique. Il est possible de réduire le nombre de pixels à encoder et de simplifier les processus d'encodage par l'encodeur évolutif de l'information de forme grâce à la présente invention, en comparaison avec d'autres encodeurs.
En outre, grâce à la présente invention, il est possible de rétablir les parties désirées d'une image parmi les trains binaires encodés avec une petite quantité de calculs et à haute vitesse, en utilisant une opération de
<Desc/Clms Page number 66>
mosaïque à laquelle seulement les parties spécifiques de l'image d'entrée sont appliquées de manière indépendante.
Le champ d'application relatif à l'encodage de l'information de forme est étendu aux images fixes ayant une forme arbitraire en raison de l'opération de mosaïque.
En particulier, il est possible de rétablir les parties désirées en réduisant la capacité de mémoire et la quantité de calculs pour un objet dans une grande image. Une telle extension peut être efficacement appliquée à la communication visuelle telle que le terminal international de télécommunication mobile 2000 (IMT-2000). Etant donné que la résolution d'un terminal est restreinte par la bande passante d'un canal, il est préférable d'utiliser l'opération de mosaïque pour l'application d'une partie d'une grande image.
L'efficacité d'encodage de la présente invention est indiquée dans l'expérience suivante. Les tableaux 1 et 2 montrent respectivement la quantité d'information de forme dans les bits des couches respectives pour l'image d'un enfant et l'image de Fish & Logo (352x240, format SIF).
Lorsque le filtre à symétrie impaire et le filtre à symétrie paire ayant 5 couches sont utilisés, le nombre de bits de l'information de forme dans les couches respectives de l'encodeur évolutif grâce à la présente invention est comparé avec le nombre de bits de la forme entière d'un encodeur d'information de forme générale, tel que l'encodeur arithmétique de contexte (CAE). Dans le cas du filtre à symétrie impaire, l'information de forme de la composante de chrominance (UV) est encodée. Avec le filtre à symétrie paire, il est possible de rétablir l'information
<Desc/Clms Page number 67>
de forme de la composante de chrominance (UV) en encodant seulement l'information de forme de la composante de luminance (Y). Malgré cela, on remarque à partir des résultats de l'expérience que les 2 filtres ont des performances d'encodage semblables. Cela vient du fait que le nombre de pixels à encoder dans le filtre à symétrie paire est presque égal à celui du filtre à symétrie impaire, étant donné qu'il y a plus de modes d'encodage RSL dans le cas du filtre à symétrie paire. On remarque que le nombre de bits augmente d'environ 17 à 25% dans l'encodeur grâce à la présente invention, en comparaison avec le CAE.
Cependant, étant donné qu'il est possible de réduire le nombre de bits et la complexité pour l'information de forme dans les couches inférieures, il est possible de réaliser un encodeur évolutif de résolution efficace ainsi qu'un encodeur évolutif pour l'information de texture.
<Desc/Clms Page number 68>
[Tableau 1] Nombre de bits de l'information de forme de chaque couche de l'image de l'enfant
Figure img00680001
<tb>
<tb> Nombre <SEP> de <SEP> Filtre <SEP> à <SEP> symétrie <SEP> impaire <SEP> (évolutif) <SEP> Filtre <SEP> à <SEP> symétrie <SEP> impaire <SEP> CAE
<tb> couchess <SEP> (évolutif)
<tb> Forme <SEP> Y <SEP> Forme <SEP> Nombre <SEP> Forme <SEP> Y <SEP> Nombre <SEP> Nombre <SEP> de
<tb> UV <SEP> accumulé <SEP> de <SEP> accumulé <SEP> de <SEP> bits
<tb> bits <SEP> bits
<tb> Bande <SEP> 57 <SEP> 58 <SEP> 115 <SEP> 58 <SEP> 58
<tb> passante
<tb> basse
<tb> fréquence
<tb> (LL)
<tb> Couche <SEP> 0 <SEP> 113- <SEP> 228 <SEP> 72 <SEP> 130Couche <SEP> 1 <SEP> 184 <SEP> 43 <SEP> 455 <SEP> 169 <SEP> 299Couche <SEP> 2 <SEP> 298 <SEP> 58 <SEP> 811 <SEP> 313 <SEP> 612Couche <SEP> 3 <SEP> 526 <SEP> 85 <SEP> 1422 <SEP> 700 <SEP> 1312Couche <SEP> 4 <SEP> 904 <SEP> 141 <SEP> 2467 <SEP> 1325 <SEP> 2637Nombre <SEP> 2082 <SEP> 385 <SEP> 2467 <SEP> (17.2%) <SEP> 2637 <SEP> 2637(25%) <SEP> 2105
<tb> total <SEP> de
<tb> bits
<tb>
<Desc/Clms Page number 69>
[Tableau 2] Nombre de bits de l'information de forme de chaque couche de l'image de Fish & Logo
Figure img00690001
<tb>
<tb> Nombre <SEP> de <SEP> Filtre <SEP> à <SEP> symétrie <SEP> impaire <SEP> (évolutif) <SEP> Filtre <SEP> à <SEP> symétrie <SEP> impaire <SEP> CAE
<tb> couche <SEP> (évolutif)
<tb> Forme <SEP> Y <SEP> Forme <SEP> Nombre <SEP> Forme <SEP> Y <SEP> Nombre <SEP> Nombre <SEP> de
<tb> UV <SEP> accumulé <SEP> de <SEP> accumulé <SEP> de <SEP> bits
<tb> bits <SEP> bits
<tb> Bande <SEP> 80 <SEP> 45 <SEP> 125 <SEP> 45 <SEP> 45
<tb> pasante
<tb> basse
<tb> fréquence
<tb> (LL)
<tb> Couche <SEP> 0 <SEP> 125- <SEP> 250 <SEP> 70 <SEP> 115Couche <SEP> 1 <SEP> 1 <SEP> 323 <SEP> 40 <SEP> 613 <SEP> 222 <SEP> 337Couche <SEP> 2 <SEP> 763 <SEP> 56 <SEP> 1432 <SEP> 595 <SEP> 932
<tb> Couche <SEP> 3 <SEP> 1435 <SEP> 83 <SEP> 2950 <SEP> 1533 <SEP> 2465
<tb> Couche <SEP> 4 <SEP> 2262 <SEP> 138 <SEP> 5350 <SEP> 2955 <SEP> 5420Nombre <SEP> 4988 <SEP> 362 <SEP> 5350 <SEP> (23.8%) <SEP> - <SEP> 5420(25%) <SEP> 4321
<tb> total <SEP> de
<tb> bits
<tb>
Les figures 19A et 19B montrent les résultats du rétablissement de l'image de l'enfant dans la couche 3. Les
<Desc/Clms Page number 70>
figures 20A et 20B montrent les résultats du rétablissement de l'image de Fish & Logo dans la couche 3. Les figures 19A et 20A montrent les résultats de l'échantillonnage de l'information de forme sur la composante de luminance (Y) en effectuant l'opération OU lorsque l'information de forme sur la composante de chrominance (UV) est obtenue. On remarque que la couleur est diminuée dans la couche centrale de la structure évolutive de résolution étant donné que la valeur de l'image de chrominance (UV) correspondant à la limite de l'image de luminance (Y) n'existe pas. Les figures 19B et 20B montrant les résultats du rétablissement de la diminution de la couleur grâce aux processus de compensation de l'image de chrominance (UV) comme indiqué sur les figures 2 et 3.

Claims (7)

  1. Revendications : 1. Méthode de décodage d'un train binaire obtenue par encodage évolutif d'une image fixe utilisant la transformation par ondelettes, comprenant les phases de : (a) réception du train binaire encodé, division du train binaire encodé en objets, et classification d'une composante de commande provenant d'une pluralité de composantes de carreau dans des trains binaires pour les objets respectifs ; (b) décodage de la composante de commande ; (c) décodage évolutif de l'information de forme et de l'information de texture, et décodage de l'information d'objet dans un bloc, pour chaque composante du bloc ; (d) composition des articles d'information d'objet décodés pour les composantes du carreau respectives en utilisant la composante de commande décodée dans chaque objet ; et (e) composition d'une pluralité d'articles d'information d'objet sur un écran.
  2. 2. Méthode selon la revendication 1, dans laquelle, lorsque l'information de forme est décodée de manière évolutive dans l'étape (c), l'information de forme dans chaque carreau à décoder est divisée en un compartiment dans lequel le carreau est inclus dans l'objet, un compartiment où l'information de
    <Desc/Clms Page number 72>
    compartiment où l'information de forme n'existe pas dans le fichier, seule l'information de texture est décodée de manière évolutive lorsque le carreau est inclus dans l'objet, l'information de forme dans le carreau étant décodée de manière évolutive lorsque l'information de forme existe partiellement dans le carreau, et l'information de texture est décodée en utilisant l'information de forme et l'information de texture décodées de manière évolutive.
  3. 3. Méthode selon la revendication 1, dans laquelle, lorsque l'information de forme est décodée de manière évolutive dans l'étape (c), le nombre de blocs alpha binaires (BAB) MxN à décoder dans une couche de base à la verticale et à l'horizontale est obtenu par l'Equation 3 (lorsque M=N=16), le nombre de BAB à décoder dans les couches supérieures à la verticale et à l'horizontale étant obtenu par l'Equation 4, et la taille des BAB à décoder dans les couches supérieures est obtenu par l'Equation 5 grâce à la taille de l'objet d'entrée.
  4. 4. Méthode selon la revendication 1, dans laquelle, lorsque l'information de forme est décodée de manière évolutive dans l'étape (c), le décodage arithmétique est effectué sur le pixel à décoder par les valeurs statistiques de la Répartition statistique 1 grâce à la disposition des pixels autour du pixel à décoder lorsque la position du
    <Desc/Clms Page number 73>
    effectué sur les pixels à décoder par les valeurs statistiques de la Répartition statistique 2 grâce à la disposition des pixels autour du pixel à décoder lorsque les positions des pixels à décoder sont P2 et P3 lorsque le mode d'encodage est le mode ISL, le codage arithmétique étant effectué sur le pixel à décoder par les valeurs statistiques de la Répartition statistique 3 grâce à la disposition des pixels autour du pixel à décoder lorsque le mode d'encodage est le mode RSL.
  5. 5. Méthode d'encodage et de décodage évolutif d'une image fixe utilisant la transformation par ondelettes, dans laquelle les syntaxes du train binaire indiquées sur les figures 18A à 18F sont utilisées pour l'encodage et le décodage d'image fixe basé sur l'objet en utilisant une opération de mosaïque.
  6. 6. Appareil d'encodage évolutif d'image fixe utilisant la transformation par ondelettes, comprenant : un (ou plusieurs) diviseur de carreau divisant un objet d'entrée ayant une forme arbitraire en carreaux ayant une taille uniforme, et classification des composantes de commande ; un (ou plusieurs) encodeurs de signal de commande pour l'encodage de composantes de commande classifiés par les diviseurs de carreau ;
    <Desc/Clms Page number 74>
    de carreaux divisés par les diviseurs de carreau, pour la transformation par ondelettes de l'information de forme et de l'information de texture dans les carreaux, et encodage évolutif des valeurs des couches respectives ; et un multiplexeur pour la connexion séquentielle des trains binaires encodés aux carreaux respectifs.
  7. 7. Appareil pour le décodage d'un train binaire obtenu par encodage évolutif d'une image fixe utilisant la transformation par ondelettes, comprenant : un démultiplexeur pour la réception du train binaire encodé, pour la division du train binaire encodé en objets, pour la classification d'une composante de commande, et une pluralité de composantes de carreau dans le train binaire pour chaque objet ; une pluralité de décodeurs d'image fixe pour la réception d'une composante de carreau, et pour le décodage évolutif de l'information de forme dans le carreau ; un (ou plusieurs) compositeur de carreau pour la composition de la composante du carreau décodée dans chaque objet ; et un compositeur d'objet pour la composition d'une pluralité d'articles d'information d'objet composés par le compositeur de carreau sur l'écran.
FR9914183A 1999-11-10 1999-11-10 Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes Expired - Fee Related FR2800957B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9914183A FR2800957B1 (fr) 1999-11-10 1999-11-10 Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9914183A FR2800957B1 (fr) 1999-11-10 1999-11-10 Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes

Publications (2)

Publication Number Publication Date
FR2800957A1 true FR2800957A1 (fr) 2001-05-11
FR2800957B1 FR2800957B1 (fr) 2002-05-17

Family

ID=9552008

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9914183A Expired - Fee Related FR2800957B1 (fr) 1999-11-10 1999-11-10 Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes

Country Status (1)

Country Link
FR (1) FR2800957B1 (fr)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649032A (en) * 1994-11-14 1997-07-15 David Sarnoff Research Center, Inc. System for automatically aligning images to form a mosaic image
EP0790741A2 (fr) * 1995-10-27 1997-08-20 Texas Instruments Incorporated Procédé et système pour la compression vidéo
US5692063A (en) * 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
WO1999016249A1 (fr) * 1997-09-19 1999-04-01 Sharp Kabushiki Kaisha Codeur d'images et decodeur d'images
FR2788401A1 (fr) * 1998-09-17 2000-07-13 Samsung Electronics Co Ltd Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649032A (en) * 1994-11-14 1997-07-15 David Sarnoff Research Center, Inc. System for automatically aligning images to form a mosaic image
EP0790741A2 (fr) * 1995-10-27 1997-08-20 Texas Instruments Incorporated Procédé et système pour la compression vidéo
US5692063A (en) * 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
WO1999016249A1 (fr) * 1997-09-19 1999-04-01 Sharp Kabushiki Kaisha Codeur d'images et decodeur d'images
EP1017238A1 (fr) * 1997-09-19 2000-07-05 Sharp Kabushiki Kaisha Codeur d'images et decodeur d'images
FR2788401A1 (fr) * 1998-09-17 2000-07-13 Samsung Electronics Co Ltd Methodes evolutives et appareil d'encodage/de decodage pour la creation d'image fixe utilisant la transformation par ondelettes

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"INFORMATION TECHNOLOGY - CODING OF AUDIO-VISUAL ABJECTS: VISUAL ISO/IEC 14496-2", INTERNATIONAL ORGANIZATION FOR STANDARDIZATION - ORGANISATIONINTERNATIONALE DE NORMALISATION, XX, XX, no. N2202, 1 March 1998 (1998-03-01), XX, pages 01 - 329, XP000861689 *
EGGER O ET AL: "High-performance compression of visual information-a tutorial review. I. Still pictures", PROCEEDINGS OF THE IEEE, JUNE 1999, IEEE, USA, vol. 87, no. 6, pages 976 - 1011, XP002148000, ISSN: 0018-9219 *
HARIDASAN R ET AL: "Scalable coding of video objects", ISCAS '98. PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (CAT. NO.98CH36187), ISCAS '98 PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, MONTEREY, CA, USA, 31 MAY-3 JUNE 1998, 1998, New York, NY, USA, IEEE, USA, pages 289 - 292 vol.4, XP002147999, ISBN: 0-7803-4455-3 *
HIBI K ET AL: "MPEG-4 video coding techniques", SHARP TECHNICAL JOURNAL, AUG. 1998, SHARP CO, JAPAN, no. 71, pages 14 - 19, XP000938079, ISSN: 0285-0362 *
IRANI M ET AL: "VIDEO COMPRESSION USING MOSAIC REPRESENTATIONS", SIGNAL PROCESSING. IMAGE COMMUNICATION,NL,ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, vol. 7, no. 4/06, 1 November 1995 (1995-11-01), pages 529 - 552, XP000538027, ISSN: 0923-5965 *
LEE M -C ET AL: "A LAYERED VIDEO OBJECT CODING SYSTEM USING SPRITE AND AFFINE MOTIONMODEL", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,US,IEEE INC. NEW YORK, vol. 7, no. 1, 1 February 1997 (1997-02-01), pages 130 - 144, XP000678886, ISSN: 1051-8215 *

Also Published As

Publication number Publication date
FR2800957B1 (fr) 2002-05-17

Similar Documents

Publication Publication Date Title
FR2810492A1 (fr) Methodes evolutives et appareil d&#39;encodage/de decodage pour la creation d&#39;image fixe utilisant la transformation par ondelettes
US10445903B2 (en) System and method for encoding and decoding using texture replacement
US7545989B1 (en) System and method for encoding and decoding using texture replacement
US20020168105A1 (en) Method and apparatus for adaptive compression of scanned documents
FR2727817A1 (fr) Transmission d&#39;image progressive utilisant des transformations d&#39;ondelettes discretes
EP2304962B1 (fr) Procédé et dispositif de codage vidéo utilisant un nombre réduits de vecteurs de mouvement pour les blocs connectés
EP1721470A1 (fr) Procede de codage et de decodage d&#39;une sequence d&#39;images par analyse temporelle hierarchique
JPH07203435A (ja) 歪んだ図形情報の強調方法及び装置
CN110612722B (zh) 对数字光场图像编码和解码的方法和设备
US10827161B2 (en) Depth codec for 3D-video recording and streaming applications
WO2010043811A1 (fr) Procede et dispositif de codage d&#39;une sequence d&#39;image mettant en oeuvre des blocs de taille differente, signal, support de donnees, procede et dispositif de decodage, et programmes d&#39;ordinateur correspondants
KR20200044661A (ko) 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
CN112150400A (zh) 图像增强方法、装置和电子设备
KR100957473B1 (ko) 실시간 소프트웨어 비디오/오디오의 압축, 전송, 데이터복원 및 디스플레이를 위한 방법
FR2886787A1 (fr) Procede et dispositif de codage et de decodage d&#39;une sequence d&#39;images
WO2022129737A1 (fr) Procédé et dispositif de compression de données représentatives d&#39; une scène tridimensionnelle volumétrique en vue d&#39;une décompression en temps réel pour un visionnage en ligne
US20210092479A1 (en) Video processing apparatus
FR2800957A1 (fr) Methodes evolutives et appareil d&#39;encodage/de decodage pour la creation d&#39;image fixe utilisant la transformation par ondelettes
JP2006246351A (ja) 画像符号化装置および画像復号化装置
WO1994022267A1 (fr) Codage/decodage compatibles sous-bandes d&#39;images de television
EP1574068A1 (fr) Procede de codage d&#39;une image par ondelettes et procede de decodage correspondant
Rizkallah et al. Graph-based spatio-angular prediction for quasi-lossless compression of light fields
KR100304667B1 (ko) 웨이블릿 변환을 이용한 정지영상에 대한 스케일러블 부호화/복호화 방법 및 장치
KR102421719B1 (ko) 저복잡도 신경망을 이용한 영상의 ai 부호화 장치 및 방법, ai 복호화 장치 및 방법
Petrisor et al. Wavelet-based multiple description coding of images with iterative convex optimization techniques

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20100730