FR2817697A1 - Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques - Google Patents

Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques Download PDF

Info

Publication number
FR2817697A1
FR2817697A1 FR0015768A FR0015768A FR2817697A1 FR 2817697 A1 FR2817697 A1 FR 2817697A1 FR 0015768 A FR0015768 A FR 0015768A FR 0015768 A FR0015768 A FR 0015768A FR 2817697 A1 FR2817697 A1 FR 2817697A1
Authority
FR
France
Prior art keywords
level
sub
reconstructed
bands
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0015768A
Other languages
English (en)
Other versions
FR2817697B1 (fr
Inventor
Isabelle Amonou
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to FR0015768A priority Critical patent/FR2817697B1/fr
Publication of FR2817697A1 publication Critical patent/FR2817697A1/fr
Application granted granted Critical
Publication of FR2817697B1 publication Critical patent/FR2817697B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/207Analysis of motion for motion estimation over a hierarchy of resolutions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/619Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

La présente invention concerne un procédé de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un codeur, pour un sous-ensemble dit courant S (t) et un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N >= 1, le sous-ensemble de référence décomposé (CF DESSIN DANS BOPI) et la sous-bande basse (CF DESSIN DANS BOPI) du niveau de résolution i du sous-ensemble courant décomposé S (t) ayant été tous deux reconstruits au niveau du codeur, avec i <= N :- segmentation (E25) de la sous-bande basse reconstruite (CF DESSIN DANS BOPI) en au moins deux régions pour former une carte de segmentation de niveau i, (CS i ),- détermination (E27) d'un champ de mouvement (MV i ) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence.

Description

<Desc/Clms Page number 1>
La présente invention concerne un procédé de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps.
Le codage d'un signal numérique tel que, par exemple, une séquence vidéo qui se définit comme une succession d'images numériques, a pour but de réaliser une compression efficace des données constitutives de ce signal.
Pour réaliser une compression efficace d'une séquence vidéo, on tient compte de deux types de redondances qui sont présents dans une telle séquence, à savoir la redondance spatiale et la redondance temporelle.
Premièrement, la redondance spatiale trouve sa raison d'être dans chaque image de la séquence vidéo dans la mesure où, dans chaque image considérée comme fixe, il existe une forte corrélation entre l'une des données constitutives de l'image (pixel) et son voisinage.
La redondance spatiale pour son exploitation fait intervenir des techniques connues en imagerie fixe de transformations spatiales telles que, par exemple mais de façon non limitative, la transformée en odelettes discrète (connue en terminologie anglo-saxonne sous le terme"Discrete Wavelet Transform"et couramment appelée DWT) et la transformée en cosinus discrète (connue en terminologie anglo-saxonne sous le terme"Discrete Cosinus Tranform"et couramment appelée DCT).
<Desc/Clms Page number 2>
L'utilisation d'une transformation spatiale permet, par exemple, de décomposer une image en plusieurs sous-bandes de fréquence contenant chacune un spectre limité de fréquences.
Les sous-bandes peuvent être réparties selon un ou plusieurs niveaux de résolution, la résolution d'une sous-bande se définissant comme le nombre d'échantillons par unité de longueur utilisée pour représenter cette sous-bande.
Il est à noter que la décomposition d'une image en sous-bandes de fréquence ne crée aucune compression en elle-même, mais permet de décorréler l'image de manière à éliminer la redondance spatiale existant dans celle-ci avant que l'on ne procède à l'opération de compression proprement dite.
Les sous-bandes de fréquence obtenues sont alors compressées de manière plus efficace que l'image d'origine.
Lors du codage d'une image numérique, on met ainsi en oeuvre une opération de décomposition de l'image en sous-bandes de fréquence, comme mentionné ci-dessus, puis les coefficients des sous-bandes obtenues sont quantifiés en indices lors d'une opération de quantification et, en dernier lieu, les indices sont codés lors d'une opération de codage entropique sans perte.
Deuxièmement, la redondance temporelle trouve sa raison d'être entre les images de la séquence vidéo dans la mesure où la probabilité qu'un objet présent dans une image apparaisse dans l'image suivante est très élevée.
La notion d'objet revêt un caractère sémantique. On définit un objet comme étant un ensemble de régions. On définit une région d'une image comme correspondant à un ensemble de données (pixels) réunies selon un critère d'homogénéité.
La redondance temporelle pour son exploitation fait intervenir les notions d'estimation et de compensation de mouvement entre deux images successives de la séquence vidéo.
Il est connu, notamment pour coder une séquence d'images numériques, de réaliser une estimation de mouvement entre une image
<Desc/Clms Page number 3>
courante et une image précédente dans la séquence, puis de compenser le mouvement de manière à produire une prédiction de l'image courante.
La différence entre la prédiction de l'image courante et l'image courante elle-même est ensuite calculée. Cette différence est appelée erreur de prédiction. Plus l'erreur est faible, et plus elle sera compressée de manière efficace, c'est-à-dire avec un bon compromis débit/distorsion, ou de manière équivalente, avec un bon rapport taux de compression sur qualité de reconstruction.
L'estimation et la compensation de mouvement ainsi que le calcul de l'erreur de prédiction peuvent être réalisés de deux manières différentes.
Selon une première approche, il est possible de réaliser ces opérations dans le domaine original de l'image, c'est-à-dire dans le domaine spatial sans que celle-ci soit préalablement décomposée en sous-bandes de fréquence.
Selon une deuxième approche, Il est également possible de décomposer l'image en sous-bandes et ensuite de réaliser les opérations d'estimation, de compensation de mouvement et de calcul de l'erreur de prédiction dans le domaine transformé.
La deuxième approche nécessite que la méthode d'estimation et de compensation de mouvement soit bien adaptée au domaine transformé.
Par ailleurs, lors du codage d'images numériques, il est également connu de procéder à une segmentation de celles-ci et on connaît trois types de segmentation : - la segmentation spatiale qui travaille sur les données spatiales de l'image (luminance ou chrominance) en cherchant à regrouper des données ou pixels satisfaisant à un critère d'homogénéité ; - la segmentation du mouvement qui segmente un champ de mouvement en régions ou objets répondant à un critère d'homogénéité de mouvement ; et -la segmentation spatio-temporelle qui a pour but de définir une segmentation en régions au sens du mouvement, mais avec des contours
<Desc/Clms Page number 4>
placés au niveau des contours spatiaux de l'image et non plus des contours de mouvement.
En pratique, la notion de segmentation s'explique facilement en raisonnant sur la notion de segmentation spatiale, mais la démarche est la même pour la notion de segmentation du mouvement.
La segmentation est un processus de bas niveau non linéaire et non réversible, ayant pour but de réaliser une partition de l'image en un certain nombre d'éléments appelés régions. La partition est telle que les régions sont disjointes et que leur réunion constitue l'image. Les régions correspondent ou ne correspondent pas à des objets de l'image, le terme d'objet se référant à une information de nature sémantique. Bien souvent cependant, un objet correspond à une région ou un ensemble de régions. Chaque région peut être représentée par une information représentative de sa forme, de sa couleur ou de sa texture.
Classiquement, les méthodes de codage d'une image numérique basées sur une segmentation comportent une première étape dite de marquage, c'est-à-dire que l'on extrait de l'image l'intérieur des régions présentant une homogénéité locale. Ensuite, une étape de décision définit de manière précise les contours des zones contenant des données homogènes. A la fin de cette étape, chaque pixel de l'image est associé à un label identifiant la région à laquelle il appartient. L'ensemble de tous les labels de tous les pixels est classiquement appelé une carte de segmentation. Finalement, dans un tel codage, la dernière étape consiste à coder la carte de segmentation, généralement sous la forme des contours des régions, et des paramètres pertinents représentatifs de l'intérieur des régions, tels que la texture et la couleur.
On connaît plus particulièrement des méthodes de codage de séquences vidéo faisant intervenir à la fois une segmentation et un champ de mouvement hiérarchiques. La segmentation et le champ de mouvement hiérarchiques sont basés sur des représentations, à plusieurs niveaux de résolution, des images décomposées par des transformations, par exemple, de type DWT.
<Desc/Clms Page number 5>
Parmi les méthodes connues de codage vidéo que l'on peut qualifier de hiérarchique, on peut citer notamment : - Les méthodes utilisant les codeurs multi-résolution basés sur une décomposition bidimensionnelle et, parmi ceux-ci, plus particulièrement ceux pour lesquels l'estimation et la compensation de mouvement sont effectuées dans le domaine de l'image transformée (article de G. Conklin et S.
Hemani intitulé"Multi-resolution motion estimation", IEEE Conf. Acousties Speech Signal Process., Cornell University, Apr. 1997).
- Les méthodes utilisant les codeurs hiérarchiques basés sur des régions : de tels codeurs sont par exemple décrits dans l'article de J. W. Woods et S. C. Han intitulé"Spatio temporal subband/wavelet coding of video with object-based information", IEEE Int. Conf. on Image Process., volume 2, Santa Barbara CA, Oct. 1997 et proposent à la fois une segmentation et un mouvement hiérarchiques qui sont codés et transmis au décodeur.
Il serait par conséquent intéressant de remédier aux inconvénients de l'art antérieur en proposant un nouveau procédé et un nouveau dispositif de codage d'un signal numérique, et plus généralement d'un ensemble de données représentatives de grandeurs physiques composé de sous-ensembles de données décalés dans le temps, permettant de ne pas transmettre de carte de segmentation, ceci afin de réaliser un codage efficace du signal numérique.
La Demanderesse a trouvé un nouveau procédé et un nouveau dispositif de traitement de cet ensemble de données aboutissant au niveau d'un codeur à un champ de mouvement et à des informations sur la segmentation du signal qui permettent d'avoir au niveau du codeur tous les éléments qui sont déterminants pour le choix de la façon dont vont être codées, transmises et décodées les données. Ces nouveaux procédés et dispositifs de traitement servent, en outre, de base à l'élaboration du nouveau procédé et du nouveau dispositif de codage mentionnés ci-dessus.
La présente invention a ainsi pour objet un procédé de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau
<Desc/Clms Page number 6>
d'un codeur, pour un sous-ensemble dit courant S (t) et un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N > 1, le sous-ensemble de référence décomposé S (t-k) et la sous-bande basse LLj (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ayant été tous deux reconstruits au niveau du codeur, avec i < N : - segmentation de la sous-bande basse reconstruite LL (t) en au moins deux régions pour former une carte de segmentation de niveau i, CS,.
- détermination d'un champ de mouvement MV. entre les sousbandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence.
Corrélativement, l'invention vise un dispositif de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit dispositif comporte au niveau d'un codeur, pour un sousensemble dit courant S (t) et un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, le sousensemble de référence décomposé S (t-k) et la sous-bande basse LL, (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ayant été tous deux reconstruits au niveau du codeur, avec i < N : - des moyens de segmentation de la sous-bande basse
Figure img00060001

reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - des moyens de détermination d'un champ de mouvement (MV,) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence.
Le fait de prévoir que la sous-bande basse reconstruite soit segmentée et que le champ de mouvement puisse être déterminé à partir de sous-bandes basses reconstruites ou originales permet, avantageusement, de
<Desc/Clms Page number 7>
décider, d'une part, de la nature du champ de mouvement qui va être calculé par la suite et, d'autre part, de la transmission ou non de ce champ de mouvement au décodeur.
La décision de transmettre ou non le champ de mouvement dépend de la nature de ce champ.
En outre, la décision de transmettre ou non le champ de mouvement conditionne la façon dont les opérations de décodage vont se dérouler.
L'obtention, pour un niveau de résolution donné, d'un tel champ de mouvement et d'une carte de segmentation va servir de base pour déterminer ultérieurement des erreurs de prédiction par région pour ce niveau. Ces erreurs seront transmises au décodeur et permettront à ce dernier de restituer les informations strictement identiques à celles manipulées par le codeur, rendant ainsi inutile la transmission de la carte de segmentation.
Selon une caractéristique, le champ de mouvement est déterminé entre les sous-bandes basses reconstruites LL, (t) et LL, (t-1) des sousensembles courant et de référence.
Etant donné que le champ de mouvement est calculé à partir de données reconstruites à partir du codeur, il est avantageux que le champ de mouvement soit dense afin de disposer d'un maximum d'informations sur le mouvement considéré.
Par ailleurs, il est également possible que le champ de mouvement soit déterminé par région à partir des sous-bandes basses reconstruites et segmentées, ce qui permet de déterminer une information de mouvement par région. Cette information peut être dense, ou utiliser toute description connue du mouvement d'une région (mouvement de translation, mouvement affine...).
Lorsque le champ de mouvement est dense, ce champ de mouvement ne sera pas transmis au décodeur, compte tenu du trop grand nombre d'informations qu'il faudrait transmettre.
Le champ de mouvement peut également être déterminé par région entre les sous-bandes basses LL, (t) et LL, (t-1) segmentées des sous-
<Desc/Clms Page number 8>
ensembles courant et de référence, et non plus à partir des sous-bandes basses reconstruites.
En travaillant sur les données originales, on dispose ainsi d'une meilleure information sur le mouvement des régions que sur les données reconstruites.
Comme on manipule les données originales on transmet le champ de mouvement que l'on a déterminé.
Afin de ne pas dégrader les performances en termes de taux de compression, il est nécessaire de transmettre un champ de mouvement aussi compact que possible au décodeur.
Plus particulièrement, le champ de mouvement déterminé par région est représenté par un descripteur de mouvement qui définit le mouvement de la région considérée.
On peut par exemple se contenter de transmettre un vecteur de mouvement (2 paramètres) représentatif d'un mouvement de translation de la région considérée.
On peut également transmettre plus de deux paramètres pour définir le mouvement d'une région. Ainsi, par exemple, on peut transmettre six paramètres afin de décrire, par l'intermédiaire d'une équation affine, un mouvement complexe de la région qui prenne en compte, non seulement la translation, mais aussi la rotation et le zoom. Une telle description est détaillée par exemple dans l'article de Diehl, object oriented motion estimation and segmentation in image sequences paru dans Signal processing : image communication, volume 3,1991.
Par ailleurs, le fait de disposer au codeur d'un champ de mouvement par région permet notamment d'étudier le mouvement par région et de procéder à l'analyse structurelle du champ de mouvement.
En déterminant un champ de mouvement par région on obtient en outre les avantages suivants : - meilleure précision dans l'estimation du mouvement, - compacité du champ déterminé puisqu'à une région correspond un champ,
<Desc/Clms Page number 9>
- absence d'artefacts liés à une partition arbitraire du sousensemble de données, lors de la reconstruction du sous-ensemble (effets de blocs).
D'une manière générale, on remarquera que selon certaines applications, lorsque l'on considère toutes les régions de la carte de segmentation considérée, il peut être intéressant de disposer de ou des champ (s) de mouvement pour la ou les région (s) qui présentent un intérêt particulier, compte tenu d'un critère prédéterminé (par exemple l'importance de la région).
Toutefois, on choisit de déterminer un champ de mouvement pour toutes les régions de la carte de segmentation lorsque l'on souhaite que les informations transmises au décodeur soient complètes et permettent, au niveau de ce dernier, de reconstruire le sous-ensemble courant, niveau de résolution par niveau de résolution.
Selon une caractéristique, le procédé comporte les étapes suivantes : - compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le
Figure img00090001

champ de mouvement, afin d'obtenir les prédictions respectives CHP (t), HL (t) et HH (t) des sous-bandes hautes de niveau i, et - détermination des erreurs de prédictions respectives E (LH,), E (HL, ), E (HH,) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t), du sous-ensemble courant décomposé S (t).
Ainsi, on obtient une erreur de prédiction hiérarchique segmentée qui présente les avantages mentionnés ci-dessus.
Selon une autre caractéristique, on procède à un codage sélectif des erreurs de prédiction en fonction d'un ordre préalablement attribué aux régions de la carte de segmentation.
Ainsi, le codage peut être effectué sélectivement région par région.
<Desc/Clms Page number 10>
On pourra donc coder avec une très bonne qualité les erreurs relatives à une région importante de l'image, alors qu'un région moins importante (par exemple le fond) sera codée avec une qualité moins élevée, et donc un débit moins élevé, offrant par conséquent un taux de compression plus élevé.
Avantageusement, la compensation en mouvement est effectuée sur la sous-bande basse de niveau i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) et ladite sous-bande basse de niveau i-1 compensée est ensuite décomposée en sous-bandes de fréquence pour obtenir les prédictions des sous-bandes hautes de niveau i.
Une telle compensation de mouvement procure une très bonne efficacité de codage.
L'invention a également pour objet un procédé de transmission de données codées représentatives de grandeurs physiques codées, caractérisé en ce que, à partir d'un sous-ensemble dit courant S (t) et d'un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui sont des sousensembles de données décalés dans le temps parmi un ensemble de données représentatives de grandeurs physiques et qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N > 1, pour lesquels le sous-ensemble de référence décomposé S (t-k) et la sous-bande basse LL, (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ont été tous deux reconstruits au niveau d'un codeur, avec i N et ont donné lieu, au niveau du codeur, à des étapes de : - segmentation de la sous-bande basse reconstruite CL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - détermination d'un champ de mouvement (MV, ) entre les sous- bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence, - compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le
<Desc/Clms Page number 11>
Figure img00110001

champ de mouvement, afin d'obtenir des prédictions respectives LHI (t), HL (t) et HHi (t) des sous-bandes hautes de niveau i, - détermination des erreurs de prédictions respectives E (LH, E (HLi), E (HH) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t) du sous-ensemble courant décomposé S (t), et - codage des erreurs de prédiction, ledit procédé comporte une étape de transmission des erreurs de prédiction codées EC (LH,), EC (HL,), EC (HH,) sur les sous-bandes hautes de niveau i.
Corrélativement, l'invention vise un dispositif de transmission de données codées représentatives de grandeurs physiques codées, caractérisé en ce que, à partir d'un sous-ensemble dit courant S (t) et d'un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui sont des sousensembles de données décalés dans le temps parmi un ensemble de données représentatives de grandeurs physiques et qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, pour lesquels le sous-ensemble de référence décomposé S (t-k) et la sous-bande basse LL (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ont été tous deux reconstruits au niveau d'un codeur, avec i < N et ont donné lieu, au niveau du codeur, à : - une segmentation de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - une détermination d'un champ de mouvement (MV,) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence, - une compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives
Figure img00110002

LEZ (t), HL (t) et HEP (t) des sous-bandes hautes de niveau i, 1 1
<Desc/Clms Page number 12>
Figure img00120001

- une détermination des erreurs de prédictions respectives E (LHi), E (HLi), E (HH,) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HHi (t) du sous-ensemble courant décomposé S (t), et - un codage des erreurs de prédiction, ledit dispositif comporte des moyens de transmission des erreurs de prédiction codées EC (LH,), EC (HL, ), EC (HHi) sur les sous-bandes hautes de niveau i.
L'invention permet ainsi de transmettre des erreurs qui ont été codées sélectivement en fonction d'un ordre préalablement attribué aux régions.
L'invention permet également de transmettre des erreurs, codées sélectivement ou non en fonction d'un ordre préalablement attribué aux régions, de façon progressive en fonction de l'ordre précité.
Ainsi on recevra d'abord les régions importantes, puis les régions moins importantes. Ceci peut se révéler particulièrement utile dans le cadre par exemple d'une consultation de base de données par l'interne : on reçoit d'abord les régions principales, puis la réception s'arrête si l'utilisateur a reçu suffisamment d'informations, ou si, pour une raison quelconque, le réseau ne peut pas transmettre les autres régions (saturation du réseau, chute du débit disponible..).
L'invention permet également, lorsque le champ de mouvement est déterminé par région à partir de sous-bandes basses originales segmentées, de transmettre progressivement au décodeur les champs de mouvement, région par région, pour un niveau de résolution considéré et selon un ordre prédéterminé.
Cet ordre est le même que celui utilisé pour la transmission progressive des erreurs par région.
Un tel champ de mouvement par région est généralement représenté par un descripteur de mouvement qui définit le mouvement de la région considérée.
L'invention a en outre pour objet un procédé de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sous-ensembles de données décalés dans le temps,
<Desc/Clms Page number 13>
caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 2 : : 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LL, (t), d'un sous-ensemble dit courant en cours de
Figure img00130001

reconstruction S (t) et ladite sous-bande C Li (t) étant obtenue au décodeur, avec iN : - segmentation de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSj), - détermination d'un champ de mouvement (mi), entre les sous- bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence.
Corrélativement, l'invention vise un dispositif de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N > 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LL, (t), d'un sousensemble dit courant en cours de reconstruction S (t) et ladite sous-bande L L, (t) étant obtenue au décodeur, avec i < N : - des moyens de segmentation de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - des moyens de détermination d'un champ de mouvement (mi), entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence.
<Desc/Clms Page number 14>
Il est ainsi possible de manipuler au décodeur des données reconstruites qui sont également connues du codeur et manipulées parallèlement au codeur.
On peut obtenir au décodeur un champ de mouvement par région à partir de données reconstruites, sans avoir besoin de recevoir du codeur une carte de segmentation. Or, la carte de segmentation, codée généralement sans pertes, consomme un débit très élevé. La compression sera donc plus efficace si cette carte de segmentation n'est pas transmise.
Selon une caractéristique de l'invention, le procédé comporte les étapes suivantes : - compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence obtenu et décomposé S (t-k) avec le
Figure img00140001

champ de mouvement, afin d'obtenir des prédictions respectives, LHP (t), HL (t) et HH (t) des sous-bandes hautes de niveau i, - application d'erreurs de prédiction qui ont été reçues d'un codeur sous forme codées EC (LHi), EC (HLi), et EC (HHi) et qui ont décodées au niveau du décodeur Ê (LHj), Ê (HLi), Ê (HHi), aux prédictions respectives LH (t), HL ? (t) et HH (t) des sous-bandes hautes de niveau i, pour obtenir les sous- 1 1 bandes hautes reconstruites de niveau i du sous-ensemble courant S (t), LH, (t), HL, (t) et HHi (t), - reconstruction de la sous-bande basse de niveau i-1, LLI-1 (t), à partir de la sous-bande basse obtenue LL, (t) et des sous-bandes hautes reconstruites LH (t), HLj (t) et HHi (t).
On peut ainsi reconstruire au niveau du décodeur la sous-bande basse de niveau de résolution i-1 qui est également reconstruite au codeur.
Par ailleurs, on reçoit au niveau du décodeur les erreurs de prédiction qui ont été codées sélectivement en fonction d'un ordre préalablement attribué aux régions ou on reçoit des erreurs progressivement en
<Desc/Clms Page number 15>
fonction de cet ordre, que les erreurs aient été sélectivement codées suivant cet ordre ou non.
L'invention a aussi pour objet un procédé de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LLj (t), d'un sous-ensemble dit courant S (t) en cours
Figure img00150001

de reconstruction et ladite sous-bande L Lj (t) étant obtenue au décodeur, avec i < N : - segmentation de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, CS,, - réception des champs de mouvement MV, par région qui ont été déterminés au niveau d'un codeur, entre les sous-bandes basses LL, (t) et LL, (t- 1) segmentées des sous-ensembles courant et de référence disponibles au codeur, la réception étant effectuée progressivement en fonction d'un ordre préalablement attribué aux régions.
Corrélativement, l'invention vise aussi un dispositif de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit dispositif comporte au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 21, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LL, (t), d'un sous-ensemble dit courant S (t) en cours de reconstruction et ladite sousbande L L, (t) étant obtenue au décodeur, avec i N :
<Desc/Clms Page number 16>
Figure img00160001

- des moyens de segmentation de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - des moyens de réception des champs de mouvement (MVi) par région qui ont été déterminés au niveau d'un codeur, entre les sous-bandes basses LL, (t) et LLi (t-1) segmentées des sous-ensembles courant et de référence disponibles au codeur, la réception étant effectuée progressivement en fonction d'un ordre préalablement attribué aux régions.
L'invention vise aussi un appareil de traitement de signal numérique qui comporte un dispositif de traitement d'un ensemble de données ou un dispositif de traitement d'un ensemble codé de données, comme exposé brièvement ci-dessus.
L'invention vise en outre un appareil de traitement de signal numérique comportant un dispositif de transmission de données codées tel que brièvement exposé ci-dessus.
L'invention vise par ailleurs un moyen de stockage d'informations, éventuellement totalement ou partiellement amovible, lisible par un ordinateur ou un processeur contenant des instructions d'un programme d'ordinateur, caractérisé en ce qu'il permet la mise en oeuvre du procédé de traitement d'un ensemble de données ou du procédé de traitement d'un ensemble codé de données tel que brièvement exposé ci-dessus.
L'invention vise également un programme d'ordinateur ("computer program"en terminologie anglosaxonne) chargeable dans un appareil programmable, comportant des séquences d'instructions ou des portions de code logiciel pour mettre en oeuvre les étapes du procédé de traitement d'un ensemble de données ou du procédé de traitement d'un ensemble codé de données tel que brièvement exposé ci-dessus, lorsque ledit programme d'ordinateur est exécuté sur un appareil programmable.
Les avantages et caractéristiques propres aux procédé et dispositif de transmission de données codées, au dispositif de traitement d'un ensemble de données ou au dispositif de traitement d'un ensemble codé de données, à l'appareil de traitement de signal numérique comportant de tels dispositifs, ainsi
<Desc/Clms Page number 17>
qu'aux moyens de stockage d'informations et au programme d'ordinateur étant les mêmes que ceux exposés ci-dessus concernant le procédé selon l'invention, ils ne seront pas rappelés ici.
Les caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple non limitatif et faite en référence aux dessins annexés sur lesquels : - la figure 1 représente de manière schématique un appareil de traitement de données comportant un dispositif de codage de données selon l'invention, -la figure 2 représente de manière schématique un appareil de traitement de données comportant un dispositif de décodage de données selon l'invention, -la figure 3a représente un mode de réalisation d'un dispositif de codage de données selon l'invention incluant le dispositif 2 et les moyens utilisateurs 3 de la figure 1, - la figure 3b est un circuit de décomposition en sous-bandes de fréquence inclus dans le dispositif de la figure 3a, - la figure 3c est une image numérique à coder par le dispositif de codage selon la présente invention, - la figure 3d est une image numérique décomposée en sous-bandes par le circuit de la figure 3b, - la figure 4 représente un mode de réalisation d'un dispositif de décodage de données selon l'invention incluant le dispositif 5 et les moyens utilisateurs 4 de la figure 2, - la figure 5 représente un mode de réalisation d'un appareil programmable de mise en oeuvre de l'invention, - la figure 6 est un algorithme de codage selon la présente invention, -la figure 7 est un schéma mettant en évidence les étapes de codage selon la présente invention, - la figure 8 est un algorithme de décodage selon la présente invention.
<Desc/Clms Page number 18>
Selon un mode de réalisation représenté à la figure 1, un dispositif 2 de traitement de données selon l'invention, également appelé dispositif de codage, comporte une entrée 12 à laquelle est reliée une source 1 de données non codées. La source 1 comporte, par exemple, un moyen de mémoire, telle qu'une mémoire vive, un disque dur, une disquette, un disque compact, pour mémoriser des données non codées. Ce moyen de mémoire est associé à un moyen de lecture approprié pour y lire les données. Un moyen pour enregistrer les données dans le moyen de mémoire peut également être prévu.
La source 1 peut être par exemple une caméra vidéo dans le cas d'un signal d'image ou un microphone dans le cas d'un signal de son.
Le dispositif de codage 2 peut être intégré dans un appareil de traitement de données TD1, tel qu'un ordinateur par exemple.
Des moyens 3 utilisateurs de données codées sont reliés en sortie 13 du dispositif de codage 2.
Les moyens utilisateurs 3 comportent par exemple des moyens de mémorisation de données codées et/ou des moyens de transmission des données codées.
La figure 2 représente un dispositif 5 de traitement de données codées par le dispositif 2. Ce dispositif 5 est également appelé dispositif de décodage de données.
Des moyens 4 utilisateurs de données codées sont reliés en entrée 15 du dispositif de décodage 5. Les moyens 4 comportent par exemple des moyens de mémoire de données codées, et/ou des moyens de réception des données codées qui sont adaptés à recevoir les données codées transmises par les moyens de transmission 3.
Le dispositif de décodage 5 peut être intégré dans un appareil de traitement de données TD2, tel qu'un ordinateur par exemple.
Des moyens 6 utilisateurs de données décodées sont reliés en sortie 16 du dispositif de décodage 5. Les moyens utilisateurs 6 sont, par exemple, des moyens de visualisation d'images ou des moyens de restitution de sons, en fonction de la nature des données traitées.
<Desc/Clms Page number 19>
Le dispositif de codage et le dispositif de décodage peuvent être intégrés dans un même appareil de traitement de données numériques, par exemple une caméra numérique munie d'un écran de visualisation.
Un mode de réalisation de dispositif de codage de données incluant le dispositif 2 et les moyens utilisateurs de données codées 3, lorsque ceux-ci comportent des moyens de transmission, est représenté à la figure 3a. La source 1 fournit au dispositif 20 une séquence d'images numériques. La séquence toute entière peut être considérée comme un ensemble de données représentatives de grandeurs physiques et chaque image peut être considérée comme un sous-ensemble de données au sens de l'invention. Les différents sous-ensembles de données sont décalés dans le temps. Les images considérées ici sont des images à niveaux de gris.
Le dispositif 20 prévoit un traitement de sous-ensembles de données décalées dans le temps et, plus particulièrement, d'un sous-ensemble dit courant, noté S (t), et d'un sous-ensemble dit de référence, S (t-k), où k est un entier relatif non nul.
Il est en effet possible de s'intéresser à un sous-ensemble de référence qui ne correspond pas nécessairement au sous-ensemble précédent comme on a généralement l'habitude de le faire.
Dans le cas particulier où les sous-ensembles de données correspondent à des images, on peut en effet s'intéresser à une image qui précède de deux ou trois images, voire, plus l'image courante ou bien à une image suivant l'image courante de deux ou trois images, voire davantage.
Il convient toutefois de noter qu'il est important que l'ordre de décodage soit le même que l'ordre de codage, c'est-à-dire que l'image de référence S (t-k) soit reconstruite au niveau du décodeur avant que l'on commence à reconstruire l'image courante S (t).
Dans le but de simplifier l'exposé de l'invention on s'intéressera au cas fréquent où S (t-k) est le sous-ensemble précédent S (t-1).
Tout d'abord, il convient de noter que la première image de la séquence, dont le traitement n'est pas représenté sur la figure 3a, est codée en
<Desc/Clms Page number 20>
mode intra, en utilisant toute méthode de codage d'image fixe appropriée et connue de l'homme du métier.
Cette première image codée est ensuite transmise par l'intermédiaire des moyens de transmission 3 à un dispositif de décodage comme par exemple celui représenté sur la figure 4 et qui sera décrit ultérieurement.
La première image codée est, parallèlement, décodée au niveau du dispositif de la figure 3a, c'est-à-dire reconstruite au sens de l'invention, et est ensuite mémorisée.
L'image courante S (t) est introduite dans un circuit d'analyse ou de décomposition en sous-bandes de fréquence 60 dont la description sera faite ultérieurement en référence à la figure 3b.
La décomposition est effectuée suivant un nombre de niveaux de résolution N qui est égal à 2 dans l'exemple de réalisation. Comme on le verra par la suite lors de la description faite en référence à la figure 3b, la résolution la plus élevée dans la décomposition est notée RES, et la résolution la plus basse dans la décomposition est notée RES2.
On notera par ailleurs que l'image précédente et qui sert ici de référence, S (t-1), a également été décomposée en sous-bandes de fréquence suivant le même nombre N de niveaux de résolution et cette image a été reconstruite selon l'invention.
L'image précédente reconstruite et notée S (t-1) est, par exemple, déjà disponible au niveau du dispositif 20 (codeur) sous forme de sous-bandes de fréquence.
Le dispositif 20 de la figure 3a comporte en sortie du circuit 60 un circuit 62 dit de codage/décodage de la sous-bande basse de fréquence de la résolution la plus basse de l'image courante décomposée et qui est notée LL2 (t).
Le codage de cette sous-bande est effectué selon des techniques classiques telles que le codage DPCM (connu en terminologie anglosaxonne sous le terme"Differential Pulse Code Modulation"ou en français sous le terme Modulation par Codage d'Impulsion Différentiel) et qui est un codage par prédiction linéaire avec perte.
<Desc/Clms Page number 21>
Avec ce type de codage, chaque pixel de la sous-bande basse codée LL2 (t) est prédit en fonction de ses voisins, et cette prédiction est soustraite de la valeur du pixel considérée, dans le but de former une"image" différentielle qui présente moins de corrélation entre les pixels que l'image originale.
Figure img00210001
La sous-bande basse ainsi codée et notée LL (t) est ensuite 2 envoyée vers les moyens de transmission 3 en vue d'être transmise au dispositif représenté sur la figure 4.
La sous-bande basse LL2 (t) qui a subi un codage/décodage est considérée comme reconstruite au sens de l'invention au niveau du dispositif 20 et est ensuite transmise au circuit 64. Le circuit 64 effectue une opération de segmentation de la sous-bande basse reconstruite C L2 (t) en au moins deux régions distinctes et va générer une carte de segmentation CS2 de niveau de résolution 2, noté RES2.
Les régions définies plus haut sont homogènes, connexes et ne se recouvrent pas.
Après l'opération de segmentation, le circuit 64 peut également mettre en oeuvre un ordonnancement des régions de la carte de segmentation CS2 selon un critère prédéterminé.
A titre d'exemple non limitatif, le critère peut être : - la proximité de la région par rapport au centre de l'image, - la texture de la région (par exemple, si la texture révèle l'apparence d'une peau humaine, la région pourra être considérée comme plus importante qu'une autre région), - la taille de la région.
L'ordonnancement correspond à une analyse qui consiste à fournir un ordre de priorité pour les régions de la carte de segmentation au niveau de résolution considéré, ce qui ordonne les régions.
Une mise en oeuvre simple consiste par exemple à réaliser une spirale en partant du centre de l'image et en repérant les régions au fur et à mesure de leur rencontre.
Toutefois, cette étape d'ordonnancement n'est pas systématique.
<Desc/Clms Page number 22>
En effet, on peut transmettre des erreurs de prédiction codées en fonction d'un critère qui ne tient pas compte de cet ordonnancement préalable des régions.
Le circuit 64 est relié à un circuit 65 de détermination de champ de mouvement, de même que le circuit 62.
Le circuit 65 est également relié à un bloc 66 dans lequel est stockée l'image précédente reconstruite S (t-1).
Suivant une première approche, le circuit 65 effectue un calcul de champ de mouvement entre les sous-bandes basses reconstruites LL2 (t) et
Figure img00220001

L L2 (t-1) du niveau RES2, issues respectivement des circuits 62 et 66.
Dans ce cas, les informations de segmentation (carte de segmentation CS2) provenant du circuit 64 ne sont pas utilisées dans le circuit 65 mais ultérieurement, lors de la détermination des erreurs de prédiction par région, pour le niveau de résolution RES2 considéré.
Figure img00220002
Suivant une deuxième approche, le circuit 65 effectue un calcul de champ de mouvement entre les sous-bandes basses reconstruites LL2 (t) et L L2 (t-1) et segmentées du niveau RES2, issues respectivement des circuits 64 et 66.
On obtient ainsi en sortie du circuit 65 un champ de mouvement par région pour le niveau de résolution considéré RES2.
La segmentation permet ainsi de disposer d'un champ de mouvement plus homogène par région.
Le champ de mouvement déterminé selon l'une ou l'autre de deux approches mentionnées ci-dessus est de préférence un champ de mouvement appelé champ dense dans lequel un vecteur de mouvement correspond à chaque pixel.
De préférence, mais de manière non limitative, ce champ de mouvement est déterminé par une mise en correspondance de blocs sur chaque pixel.
Ainsi, on procède dans un premier temps à une division de la sousbande basse LL2 (t) de l'image courante S (t) en un nombre défini de blocs B, de pixels adjacents.
<Desc/Clms Page number 23>
Le nombre de blocs peut être prédéterminé ou peut correspondre à un paramètre réglé par l'utilisateur de l'algorithme.
Dans ce mode de réalisation, les blocs BI sont déplacés de manière à prendre toutes les positions possibles sur l'image.
Les blocs sont par exemple de forme carrée et de taille impaire.
De manière générale, un bloc est un ensemble de coefficients extraits de la sous-bande pour former un vecteur.
La sous-bande basse C L2 (t-1) de l'image précédente reconstruite S (t-1) est également divisée en blocs appelés blocs"source".
Pour chaque position d'un bloc BI, l'algorithme est le suivant : - On recherche dans la sous-bande basse de l'image précédente reconstruite le bloc source qui est le plus proche possible du bloc BI.
Cette recherche est effectuée en calculant une distance entre les niveaux de gris du bloc courant B, et les niveaux de gris du bloc source.
La distance peut être la valeur absolue de la somme des différences, ou l'erreur quadratique moyenne ou bien encore la valeur absolue de la plus grande différence, calculée entre le bloc à coder et le bloc source.
- Le déplacement entre la position du bloc source dans la sousbande basse de l'image précédente reconstruite et la position du bloc courant dans la sous-bande basse de l'image courante est appelé vecteur de mouvement.
Ce vecteur de mouvement unique est associé au pixel qui se trouve au centre du bloc B, et il est mémorisé.
- Les pixels qui sont situés au bord de l'image et pour lesquels un bloc ne peut pas être utilisé puisqu'il sortirait alors de l'image se voit affecter la valeur de mouvement d'un pixel voisin.
L'ensemble des vecteurs de mouvement constitue le champ de mouvement noté MV2 pour le niveau de résolution considéré, RES2.
Le champ de mouvement issu du circuit 65 est appliqué à un circuit 68 qui va effectuer une opération de compensation en mouvement sur une ou plusieurs sous-bandes de fréquence de l'un des niveaux de résolution RES1 et
<Desc/Clms Page number 24>
Figure img00240001

RES2 de l'image précédente reconstruite S (t-1) provenant du bloc 66, au moyen du champ de mouvement ainsi obtenu.
Le circuit 68 délivre en sortie des prédictions respectives des sousbandes hautes de fréquence de niveau de résolution RES2 et notées LH (t), 2 H L (t) etH H (t).
2 2
Cette opération de compensation en mouvement peut s'effectuer de deux manières.
La compensation en mouvement peut en effet être effectuée directement en appliquant le champ de mouvement aux sous-bandes hautes de
Figure img00240002

fréquence de niveau de résolution RES2 de l'image précédente reconstruite S (t-1).
Ceci constitue la manière la plus simple d'effectuer la compensation en mouvement.
Toutefois, étant donné que les sous-bandes hautes de fréquence provenant d'une décomposition de type DWT ne sont pas invariantes en translation, ces sous-bandes ne devraient pas être compensées directement.
Ainsi, il est plus avantageux de ce point de vue d'utiliser une autre méthode au cours de laquelle la compensation en mouvement est effectuée sur la sous-bande basse de niveau de résolution RES1 de l'image précédente reconstruite S (t-1).
Toutefois, il convient d'adapter la taille du champ de mouvement obtenu pour le niveau de résolution RES2 au niveau de résolution supérieur RES 1.
Ensuite, cette sous-bande basse de niveau de résolution REST compensée est décomposée en sous-bandes de fréquence en vue d'obtenir les prédictions des sous-bandes hautes de fréquence de niveau de résolution RES2 mentionnées plus haut.
Cette seconde méthode présente l'avantage de procurer une efficacité accrue lors du codage.
<Desc/Clms Page number 25>
Lorsque l'on dispose d'un champ de mouvement par région en sortie du circuit 65, la compensation en mouvement est elle aussi effectuée par région à l'intérieur d'une sous-bande considérée.
Le dispositif 20 de la figure 3a comporte également un circuit 70 qui prend en compte en entrée les prédictions des sous-bandes hautes de fréquence de niveau de résolution RES2 établies à partir de l'image précédente reconstruite S (t-1), ainsi que les informations de segmentation et d'ordonnancement issues du circuit 64. Le circuit 70 détermine les erreurs de prédiction ou résidus respectifs notées E (LH2), E (HL2), E (HH2) à partir des prédictions précitées et des sous-bandes hautes de fréquence de niveau de résolution RES2, notées LH2 (t), HL2 (t) et HH2 (t), de l'image courante décomposée S (t).
Un signal d'erreur résiduel est donc ainsi construit pour chaque région, à l'intérieur de chaque sous-bande haute de fréquence, par différence entre la prédiction et la sous-bande considérée.
On notera que, lorsque le circuit 65 fournit en sortie un champ de mouvement par région, le calcul des erreurs de prédiction sur les régions se fait également en faisant intervenir la liaison directe entre les circuits 64 et 70 qui fournit au circuit 70 les informations de segmentation (CS2).
Comme on l'a vu précédemment, un ordre a été établi sur les régions de la carte de segmentation CS2 lors de l'opération effectuée dans le circuit 64 précité. Il est donc possible d'ordonnancer les erreurs de prédiction ou résidus qui viennent d'être déterminés sur les sous-bandes hautes du niveau de résolution RES2, en fonction de cet ordre préalablement attribué aux régions.
Ceci va permettre d'effectuer un codage des erreurs de prédiction de manière sélective en fonction de l'ordre attribué aux régions.
Ainsi, il est possible de coder de manière plus efficace certaines régions qui apparaissent, selon un critère prédéterminé, plus importantes que d'autres régions.
Le codage sélectif par région permet également de coder certaines régions selon des méthodes différentes de celles utilisées pour d'autres régions.
<Desc/Clms Page number 26>
Figure img00260001
Ces résidus ou erreurs de prédiction codés sélectivement sont ensuite envoyés aux moyens de transmission 3 pour être transmises au dispositif représenté à la figure 4.
A titre de variante, il n'est pas nécessaire d'effectuer systématiquement un codage sélectif par région et l'on peut se contenter de transmettre par région les erreurs de prédiction ou résidus codés, EC (LH2), EC (HL2), EC (HH2), progressivement en fonction de l'ordre attribué aux régions.
Ainsi, on transmet d'abord l'information résiduelle la plus importante concernant, par exemple, une région notée 1 et, ensuite, l'information résiduelle concernant l'information la moins importante concernant, par exemple, une région notée 2, tout ceci indépendamment du codage.
Toutefois, il est également possible et avantageux d'envisager à la fois un codage sélectif par région et une transmission progressive des erreurs résiduelles par région.
On notera cependant que ce codage sélectif et/ou cette transmission progressive présupposent l'attribution préalable d'un ordre aux régions (circuit 64).
En l'absence de l'attribution d'un tel ordre on peut malgré tout transmettre progressivement les erreurs résiduelles par région selon un critère prédéterminé.
Par ailleurs, le dispositif 20 de la figure 3a comporte également un circuit 72 relié au circuit 70 précité, ainsi qu'au circuit 68 et qui a pour fonction d'obtenir les sous-bandes hautes reconstruites du niveau de résolution RES2 de
Figure img00260002

A A A l'image courante S (t) et qui sont notées L H2 (t), H Lz (t) et H H2 (t).
Pour ce faire, le circuit 72 effectue un décodage des erreurs de prédiction ou résidus codés EC (LH2), EC (HL2), EC (HH2) et applique ces erreurs de
Figure img00260003

prédiction décodées aux sous-bandes hautes prédites de niveau RES2 obtenues par compensation de l'image précédente reconstruite S (t-1), à savoir H2 (t), H L2 (t) etH H2 (t).
Le circuit 72 est également relié à un circuit de synthèse 74 qui permet d'effectuer la reconstruction de la sous-bande basse de niveau de
<Desc/Clms Page number 27>
Figure img00270001

résolution RES1, C L1 (t), à partir de la sous-bande basse reconstruite LL2 (t) et des sous-bandes hautes reconstruites issues du circuit 72 précité.
Ce circuit 74 est relié au circuit 64 décrit plus haut pour permettre ensuite, pour le niveau de résolution RES1, de segmenter la sous-bande basse de l'image courante qui vient d'être reconstruite, C L1 (t).
Les circuits 72 et 74 sont également reliés à des circuits respectifs notés 76 et 78 qui ont pour fonction de fournir, avec retard, au bloc 66 des sous-bandes de fréquence respectives obtenues dans ces circuits.
Le dispositif 20 permet ensuite, de manière identique à ce qui vient d'être décrit, de reconstruire les sous-bandes basses et hautes de niveau de résolution RESo, c'est-à-dire de restituer au codeur l'image courante reconstruite S (t).
Suivant une troisième approche, le champ de mouvement déterminé par le circuit 65 est calculé entre les sous-bandes basses originales et segmentées de l'image courante et de l'image précédente LL2 (t) et LL2 (t-1).
Dans ce cas, les sous-bande basses résultant de la décomposition effectuée dans le circuit 60 sont directement traitées dans le circuit de segmentation 64.
On obtient ainsi en sortie du circuit 65 un champ de mouvement par région qui sera envoyé aux moyens de transmission 3 pour transmission vers le dispositif de la figure 4.
Les champs de mouvement sont transmis progressivement par région pour chaque niveau de résolution considéré et dans un ordre prédéterminé.
A cet effet, il est nécessaire de transmettre aux moyens 3 les informations de segmentation fournies par le circuit 64.
Cet ordre peut être celui attribué aux régions dans le circuit 64, comme expliqué plus haut et, dans ce cas, le circuit 64 transmet également les informations d'ordonnancement aux moyens 3 ou bien un autre ordre.
Cependant, l'ordre choisi pour la transmission des champs de mouvement par région doit être le même que celui utilisé pour la transmission progressive des erreurs de prédiction sur les régions.
<Desc/Clms Page number 28>
En outre, cet ordre de transmission doit être le même au niveau des dispositifs de codage et de décodage.
Par ailleurs, les champs de mouvement doivent être transmis avant les erreurs pour que le décodage puisse avoir lieu.
Le mouvement d'une région dans une image à deux dimensions est représenté par un descripteur de mouvement qui définit le mouvement de la région considérée.
Un tel mouvement peut être décrit par un modèle, c'est-à-dire un jeu d'équations.
Les modèles diffèrent essentiellement par le nombre de paramètres décrivant le mouvement. De manière générale, plus il y a de paramètres, plus précise sera la description. Par exemple, un modèle affine dans une projection de type parallèle, et sous l'hypothèse d'une surface plane, décrit le mouvement d (x) en deux dimensions d'une région par 6 paramètres :
Figure img00280001

La description d'un modèle permettant d'obtenir un descripteur de
Figure img00280002

mouvement par région est par exemple donnée dans l'article de N. Diehl. "Object Oriented Motion Estimation and Segmentation In image sequences".
Signal Processing : Image Communication, vol. 3 : 23-56, 1991.
D'autres descriptions de modèles sont fournies dans les articles suivants : - Robert Forchheimer Haibo Li and Astrid Lundmark."Image Sequence Coding at Very Low Bitrates : A Review". IEEE Trans. on Image Process., sep. 1994.
- C. Stiller and J. Konrad."on models, criteria and search strategies for motion estimation in image sequences". IEEE Trans. on Signal Process., 1997. Submitted.
Selon un mode préféré de réalisation de l'invention, les circuits mentionnés ci-dessus peuvent être réalisés par un microprocesseur associé à des mémoires vives et mortes. La mémoire morte comporte un programme
<Desc/Clms Page number 29>
pour coder les données, et la mémoire vive comporte des registres adaptés à enregistrer des variables modifiées au cours de l'exécution du programme.
Selon la figure 3b, le circuit 60 comporte deux blocs successifs d'analyse pour décomposer l'image IM en des sous-bandes selon deux niveaux de résolution.
De manière générale, la résolution d'un signal est le nombre d'échantillons par unité de longueur utilisés pour représenter ce signal. Dans le cas d'un signal d'image, la résolution d'une sous-bande est liée au nombre d'échantillons par unité de longueur pour représenter cette sous-bande. La résolution dépend notamment du nombre de décimations effectuées.
Le premier bloc d'analyse reçoit le signal numérique d'image et l'applique à deux filtres numériques respectivement passe-bas et passe-haut 601 et 602 qui filtrent le signal d'image selon une première direction, par exemple horizontale dans le cas d'un signal d'image. Après passage par des décimateurs par deux 6100 et 6200, les signaux filtrés résultant sont respectivement appliqués à deux filtres passe-bas 603 et 605, et passe-haut 604 et 606, qui les filtrent selon une seconde direction, par exemple verticale dans le cas d'un signal d'image. Chaque signal filtré résultant passe par un décimateur par deux respectif 6300,6400, 6500 et 6600. Le premier bloc délivre en sortie quatre sous-bandes LL1, LHi, HLi et HHi de résolution RES1 la plus élevée dans le décomposition.
La sous-bande LL1 comporte les composantes, ou coefficients, de basse fréquence, selon les deux directions, du signal d'image. La sous-bande LHi comporte les composantes de basse fréquence selon une première direction et de haute fréquence selon une seconde direction, du signal d'image.
La sous-bande HLi comporte les composantes de haute fréquence selon la première direction et les composantes de basse fréquence selon la seconde direction. Enfin, la sous-bande HHi comporte les composantes de haute fréquence selon les deux directions.
Chaque sous-bande est une image construite à partir de l'image d'origine, qui contient de l'information correspondant à une orientation
<Desc/Clms Page number 30>
respectivement verticale, horizontale et diagonale de l'image, dans une bande de fréquence donnée.
La sous-bande LL1 est analysée par un bloc d'analyse analogue au précédent pour fournir quatre sous-bandes LL2, LH2, HL2 et HH2 de niveau de résolution finale RES2. La résolution RES2 est la résolution la plus faible dans la décomposition. La sous-bande LL2 comporte les composantes de basse fréquence selon les deux directions d'analyse, et est à son tour analysée par le troisième bloc d'analyse.
Chacune des sous-bandes de résolution RES2 correspond également à une orientation dans l'image.
La décomposition effectuée par le circuit 60 est telle qu'une sousbande d'une résolution donnée est découpée en quatre sous-bandes de résolution inférieure et a donc quatre fois plus de coefficients que chacune des sous-bandes de résolution inférieure.
Une image numérique IM en sortie de la source d'image 30 est représentée de manière schématique à la figure 3c, tandis que la figure 3d représente l'image IMD résultant de la décomposition de l'image IM, en sept sous-bandes selon deux niveaux de résolution (N = 2), par le circuit 60. L'image IMD comporte autant d'information que l'image d'origine IM, mais l'information est fréquentiellement découpée selon deux niveaux de résolution.
Le niveau de plus basse résolution RES2 comporte les sous-bandes LL2, HL2, LH2 et HH2, c'est-à-dire les sous-bandes de basse fréquence selon les deux directions d'analyse. Le niveau de plus haute résolution RES1 comporte les sous-bandes de plus haute fréquence HLi, LHi et HH1.
La sous-bande LL2 de plus basse fréquence est une réduction de l'image d'origine. Les autres sous-bandes sont des sous-bandes de détail.
Bien entendu, le nombre de niveaux de résolution, et par conséquent de sous-bandes, peut être choisi différemment, par exemple dix sous-bandes et trois niveaux de résolution, pour un signal bidimensionnel tel qu'une image. Le nombre de sous-bandes par niveau de résolution peut également être différent.
Les circuits d'analyse et de synthèse sont adaptés à la dimension du signal traité.
<Desc/Clms Page number 31>
Un mode de réalisation de dispositif de décodage de données incluant le dispositif 5 de la figure 2, les moyens utilisateurs de données codées 4 de cette figure, lorsque ceux-ci comportent des moyens de réception de données codées, est représenté à la figure 4.
En liaison avec la description faite en référence au dispositif représenté sur la figure 3a, la première image de la séquence vidéo a été codée en mode intra et transmise par l'intermédiaire des moyens de transmission 3 au dispositif de décodage noté 82 sur la figure 4. Cette image codée est reçue par le dispositif 82 dans les moyens de réception 4, puis décodée et enfin mémorisée.
Lors de la description qui va être faite, on va s'intéresser au traitement de l'image courante S (t) et de l'image précédente reconstruite S (t-1).
L'image précédente reconstruite S (t-1) mémorisée dans un bloc 84 est, par exemple, déjà disponible au niveau du dispositif 82 (décodeur) sous forme de sous-bandes de fréquence.
Comme on l'a vu lors de la description de la figure 3a, la sous-bande basse du dernier niveau de résolution, à savoir RES2, a été codée dans le circuit 62 et est transmise par l'intermédiaire des moyens de transmission 3 au dispositif 82 de la figure 4.
Figure img00310001
Ainsi, la sous-bande basse codée LL (t) est reçue par les moyens 2 de réception 4, puis transmise au circuit 86 qui a pour fonction d'effectuer un décodage de cette sous-bande basse.
Le circuit 86 délivre en sortie la sous-bande basse LL2 (t) à un circuit 88 dans lequel la sous-bande basse est segmentée en au moins deux régions distinctes et une carte de segmentation CS2 de niveau de résolution 2, noté RES2, est générée.
Les régions obtenues sont homogènes, connexes et ne se recouvrent pas.
Il est nécessaire de prévoir un ordonnancement des régions identique à celui sélectionné au codeur afin que le décodeur soit capable d'identifier la région correspondant à une erreur de prédiction reçue.
<Desc/Clms Page number 32>
Un tel ordonnancement est effectué par le circuit 88.
Le circuit 88 est relié à un circuit 90 de détermination d'un champ de mouvement, par exemple dense MV2, de même que le circuit 86.
Le circuit 90 est également relié au bloc 84 dans lequel est stockée l'image précédente reconstruite S (t-1).
Suivant une première approche qui doit également être celle qui a été choisie au dispositif de codage de la figure 3a, le circuit 90 effectue un calcul de champ de mouvement entre les sous-bandes basses reconstruites L L2 (t) et C L2 (t-1) du niveau RES2, issues respectivement des circuits 86 et 84.
Dans ce cas, les informations de segmentation (carte de segmentation CS2) provenant du circuit 88 ne sont pas utilisées dans le circuit 90 mais ultérieurement, lors de la détermination des erreurs de prédiction par région, pour le niveau de résolution RES2 considéré.
Suivant une deuxième approche qui doit également correspondre à celle adoptée au dispositif de codage de la figure 3a, le circuit 65 effectue un calcul de champ de mouvement entre les sous-bandes basses reconstruites LL2 (t) et C L2 (t-1) et segmentées du niveau RES2, issues respectivement des circuits 88 et 84.
On obtient ainsi en sortie du circuit 90 un champ de mouvement par région pour le niveau de résolution considéré RES2.
La segmentation permet ainsi de disposer d'un champ de mouvement plus homogène par région.
Quelle que soit l'approche adoptée, il faut que le champ de mouvement MV2 déterminé au décodeur soit identique au champ de mouvement MV2 déterminé au codeur.
Dans l'hypothèse où l'image courante en cours de reconstruction au décodeur se trouve être la deuxième image de la séquence vidéo, l'image précédente considérée est donc la première. Cette première image, comme on l'a vu précédemment, va être considérée comme reconstruite au sens de la présente invention, puisqu'elle a été transmise à partir du codeur sous forme codée, et décodée puis reconstruite au décodeur.
<Desc/Clms Page number 33>
Tout ce qui a été dit précédemment lors de la description faite en référence à la figure 3a reste valable ici concernant la segmentation, l'ordonnancement et le champ de mouvement, et ne sera donc pas repris plus en détail.
Il convient de noter que dans la description qui vient d'être faite le champ de mouvement MV2 a été calculé au codeur suivant l'une des deux approches et que la sous-bande basse LL2 (t) a été transmise du codeur au décodeur, afin que ce dernier puisse déterminer ce champ de mouvement MV2 suivant la même approche.
Le dispositif 82 de la figure 4 comporte un circuit 92 placé en sortie du circuit 90 précité. Ce circuit 92 va effectuer une opération de compensation en mouvement sur une ou plusieurs sous-bandes de fréquence de l'un des niveaux de résolution RES1 et RES2 de l'image S (t-1) provenant du bloc 84, au moyen du champ de mouvement déterminé.
Ce champ de mouvement est soit global soit déterminé par région.
Dans ce dernier cas, la compensation en mouvement est effectuée par région à l'intérieur de la sous-bande considérée.
Le circuit 92 délivre en sortie les prédictions respectives des sous-
Figure img00330001

bandes hautes de fréquence de niveau de résolution RES2 et notées LH (t), 2 H LP (t) et H H P (t).
2 2
Comme cela a été décrit en référence à la figure 3a, l'opération de compensation en mouvement peut s'effectuer de deux manières. Pour l'exemple de réalisation considéré, on ne retiendra que la méthode au cours de laquelle la compensation en mouvement est effectuée sur la sous-bande basse de niveau de résolution RES1 de l'image précédente reconstruite S (t-1).
Cette sous-bande basse compensée est ensuite décomposée en
Figure img00330002

sous-bandes de fréquence afin de d'obtenir les prédictions des sous-bandes hautes de niveau de résolution RES2 mentionnées plus haut.
Il convient de noter qu'il faut toutefois utiliser la même méthode de compensation au codeur et au décodeur.
<Desc/Clms Page number 34>
Le dispositif 82 comporte un circuit 94 qui reçoit, en provenance des moyens de réception 4, des erreurs de prédiction ou résidus qui ont été codés au codeur de la figure 3a et transmis par les moyens 3.
Les informations de segmentation (carte de segmentation CS2) et d'ordonnancement des régions sont fournies par le circuit 88 aux moyens 4 pour identifier les erreurs reçues par région.
Ces erreurs notées EC (LH2), EC (HL2) et EC (HH2) sont décodées dans le circuit 94 afin d'obtenir les erreurs de prédiction ou résidus notés Ê (LH2), Ê (HL2), Ê (HH2).
On notera que ces erreurs de prédiction ont pu être codées sélectivement au codeur de la figure 3a, en fonction d'un ordre attribué préalablement aux régions de la carte de segmentation CS2 et/ou transmises progressivement en fonction de cet ordre attribué aux régions.
Ainsi, il est possible que l'on ne reçoive pas au niveau du dispositif 82 de la figure 4 tous les éléments permettant de reconstruire intégralement la sous-bande basse de niveau de résolution RES1 de l'image courante.
Disposant d'informations partielles au niveau de résolution considéré, on ne peut reconstruire le niveau de résolution supérieur dans son intégralité.
Toutefois, en cas de réception même partielle des erreurs de prédiction sur certaines régions pour un niveau considéré, l'information reçue peut néanmoins être utilisée au niveau du dispositif de décodage 82, puisque l'information reçue est spécifique à une région de l'image pour ce niveau.
Dans l'hypothèse où l'on reçoit toutes les erreurs de prédiction du codeur, celles-ci sont décodées dans le circuit 94.
* Le dispositif 82 comporte également un circuit 95 relié au circuit 94, ainsi qu'au circuit 92 et qui a pour fonction d'obtenir les sous-bandes hautes reconstruites du niveau de résolution RES2 de l'image courante S (t) et qui sont notées L H2 (t), H L2 (t) et H H2 (t). Pour ce faire, les erreurs de prédiction décodées sont ajoutées aux prédictions des sous-bandes hautes de niveau de résolution RES2 obtenues en sortie du circuit 92.
<Desc/Clms Page number 35>
On notera que ces opérations de décodage et d'addition des erreurs de prédiction peuvent se faire sélectivement par région.
Ceci permet ainsi, par exemple, de ne s'intéresser qu'à la ou les régions reçues et de n'afficher que celles-ci.
Les informations de segmentation (carte de segmentation CS2) et d'ordonnancement des régions sont fournies par le circuit 88 au circuit 94.
Ces informations vont permettre d'associer une erreur de prédiction décodée à une région et vont utilisées pour l'ajout des erreurs aux prédictions.
Lorsque l'on dispose d'un champ de mouvement par région, la compensation en mouvement est faite par région et les prédictions sont aussi faites par région.
Le circuit 95 est également relié à un circuit de synthèse 96 qui permet d'effectuer la reconstruction de la sous-bande basse de niveau de résolution RES1, C Li (t), à partir de la sous-bande basse reconstruite L L2 (t), et des sous-bandes hautes reconstruites issues du circuit 95 précité.
Ce circuit 96 est relié au circuit 88 décrit plus haut pour permettre ensuite, pour le niveau de résolution RES1, de segmenter la sous-bande basse qui vient d'être reconstruite, C LI (t).
Les circuits 95 et 96 sont également reliés à des circuits respectifs notés 98 et 99 qui ont pour fonction de fournir, avec retard, au bloc 84 des sous-bandes de fréquence respectives obtenues dans ces circuits.
Le dispositif 82 permet ensuite, de manière identique à ce qui vient d'être décrit, de reconstruire les sous-bandes basses et hautes de niveau de résolution RESo, c'est-à-dire de restituer au décodeur l'image courante reconstruite S (t-1).
Suivant une troisième approche qui doit également être celle choisie au dispositif de codage de la figure 3a, le champ de mouvement MV2 n'est pas calculé dans le dispositif de décodage.
En effet, ce champ MV2 se décompose en plusieurs champs de mouvement qui ont été déterminés par région par le circuit 65 de la figure 3a. Chaque champ de mouvement par région a été déterminé entre les sousbandes basses originales et segmentées LL2 (t) et LL2 (t-1), transmis sous forme
<Desc/Clms Page number 36>
codée au dispositif de décodage 82, puis reçu et décodé par ce dernier. Le champ reçu et décodé est transmis au circuit 92.
La transmission s'est faite progressivement par région suivant l'ordre choisi au dispositif de codage et cet ordre est connu du dispositif de décodage pour pouvoir associer un champ de mouvement reçu à une région.
Cet ordre correspond par exemple à celui déterminé dans le circuit 88, à condition toutefois que ce soit le même ordre que celui défini dans le circuit 64 de la figure 3a.
Dans ce cas, les informations de segmentation et d'ordonnancement sont fournies aux moyens de réception 4 et au circuit 92 pour pouvoir associer un champ de mouvement à une région lors de la réception et lors de la compensation en mouvement.
Disposant d'un champ de mouvement par région, les opérations de compensation en mouvement des sous-bandes hautes et d'ajout des erreurs de prédiction aux prédictions s'effectuent également région par région, pour une même sous-bande.
Le reste de la description de la figure 3a et de la figure 4 reste valable par rapport à cette troisième approche.
Selon un mode préféré de réalisation de l'invention, les circuits mentionnés ci-dessus peuvent être réalisés par un microprocesseur associé à des mémoires vives et mortes.
La mémoire morte comporte un programme pour décoder les données, et la mémoire vive comporte des registres adaptés à enregistrer des variables modifiées au cours de l'exécution du programme.
Le dispositif de codage et/ou le dispositif de décodage peuvent être intégrés dans un appareil de traitement de données numériques, tel qu'un ordinateur, une imprimante, un télécopieur, un scanner ou un appareil photographique numérique, par exemple.
Le dispositif de codage et le dispositif de décodage peuvent être intégrés dans un même appareil numérique, par exemple un appareil photographique numérique.
<Desc/Clms Page number 37>
En référence à la figure 5, est décrit un exemple d'appareil programmable 100 mettant en oeuvre l'invention. Cet appareil est adapté à transformer un signal numérique, et à le synthétiser.
Selon le mode de réalisation choisi et représenté à la figure 3, un appareil de traitement de données mettant en oeuvre l'invention est par exemple un micro-ordinateur 100 connecté à différents périphériques, par exemple une caméra numérique 101 (ou un scanner, ou tout moyen d'acquisition ou de stockage d'image) reliée à une carte graphique et fournissant des données à coder ou à compresser selon l'invention.
L'appareil 100 comporte un bus de communication 102 auquel sont reliés : - une unité centrale 103 (microprocesseur), - une mémoire morte 104 (appelée ROM sur le dessin), - une mémoire vive 106 (appelée RAM sur le dessin), comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution des programmes précités, - un écran 108 permettant de visualiser les données à coder et à décoder ou de servir d'interface avec l'utilisateur qui pourra paramétrer certains modes de codage et de décodage, à l'aide d'un clavier 110 ou de tout autre moyen, tel que par exemple une souris, - un disque dur 112, - un lecteur de disquette 114 adapté à recevoir une disquette 116, - une interface de communication 118 avec un réseau de communication 120 apte à transmettre des données numériques à coder ou des données codées par l'appareil, - une carte d'entrée/sortie 122 reliée à un microphone 124 (les données à traiter selon l'invention constituent alors un signal audio).
Le bus de communication permet la communication entre les différents éléments inclus dans le micro-ordinateur 100 ou reliés à lui. La représentation du bus n'est pas limitative et, notamment, l'unité centrale est susceptible de communiquer des instructions à tout élément du micro-
<Desc/Clms Page number 38>
ordinateur 100 directement ou par l'intermédiaire d'un autre élément du microordinateur 100.
Les programmes d'ordinateur notés"Progr1"et"Progr2"permettant à l'appareil programmable de mettre en oeuvre l'invention, peuvent être stockés par exemple en mémoire morte 104 comme représenté sur la figure 5. Selon une variante, la disquette 116, tout comme le disque dur 112 peuvent contenir des données codées selon l'invention ainsi que le code de l'invention qui, une fois lu par l'appareil 100, sera stocké dans le disque dur 112. En seconde variante, les programmes pourront être reçus pour être stockés de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 120.
Les disquettes peuvent être remplacées par tout support d'information tel que, par exemple, un CD-ROM ou une carte mémoire. De manière générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non à l'appareil, éventuellement amovible, mémorise un ou plusieurs programmes mettant en oeuvre) le procédé selon l'invention.
De manière plus générale, le ou les programmes pourront être chargés dans un des moyens de stockage de l'appareil 100 avant d'être exécutés.
L'unité centrale 103 va exécuter les instructions relatives à la mise en oeuvre de l'invention, instructions stockées dans la mémoire morte 104 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes qui sont stockés dans une mémoire non volatile, par exemple la mémoire ROM 104, sont transférés dans la mémoire vive RAM 106 qui contiendra alors le code exécutable de l'invention, ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention.
L'appareil décrit en référence à la figure 5 est susceptible de contenir tout ou partie du dispositif de codage et de décodage selon l'invention.
La figure 6 est un algorithme comportant différentes instructions ou portions de code correspondant à des étapes du procédé de traitement du signal numérique d'image selon l'invention.
<Desc/Clms Page number 39>
Plus particulièrement, cet algorithme constitue un algorithme de codage du signal selon l'invention.
Le programme d'ordinateur"Progr1"qui est basé sur cet algorithme est stocké dans la mémoire morte 104 de la figure 5, à l'initialisation du système, et transféré dans la mémoire vive 106. Il est ensuite exécuté par l'unité centrale 103, ce qui permet ainsi de mettre en oeuvre le procédé selon l'invention dans l'appareil de la figure 5.
L'algorithme de codage d'une image IM comporte plusieurs étapes dont la première notée E20 qui traite le cas de la première image d'une séquence vidéo.
L'étape E20 prévoit de coder et de décoder la première image de la séquence au niveau du dispositif de codage et, parallèlement, de transmettre cette première image codée au dispositif de décodage représenté sur la figure 4.
Au cours de cette étape, un paramètre t représentatif de la position de l'image dans la séquence vidéo est initialisé à la valeur 2.
Les étapes suivantes de l'algorithme de la figure 6 vont décrire le traitement d'une image courante S (t) et d'une image précédente reconstruite S (t-1) au niveau du dispositif de codage.
Ces étapes suivantes sont illustrées sur la figure 7 dont la description sera faite en parallèle de celle de la figure 6.
L'étape suivante E21 de l'algorithme prévoit d'effectuer une lecture de l'image courante S (t) et de l'image précédente reconstruite S (t-1) qui sert de référence pour le traitement de données selon l'invention.
Figure img00390001
L'image S (t-1) est stockée dans le bloc 66 de la figure 3a.
Au cours de l'étape suivante, notée E22, on procède à une décomposition en sous-bandes de fréquence de type DWT de l'image courante S (t) sur un nombre N de niveaux de résolution, qui est égal à 2 dans l'exemple non limitatif considéré.
Dans l'hypothèse où le bloc 66 dans lequel l'image précédente reconstruite est mémorisée ne comporte pas cette image décomposée en sousbandes de fréquence, l'étape E22 prévoit également une décomposition de
<Desc/Clms Page number 40>
l'image précédente reconstruite S (t-1) suivant le même nombre de niveaux de résolution que pour l'image S (t).
Comme le montre la figure 7, l'image numérique IM est décomposée en deux jeux de sous-bandes de fréquence, l'un constitué des sous-bandes LHi, HLi, HH1, et l'autre constitué des sous-bandes LL2, LH2, HL2, HH2 et dont l'ensemble forme l'image décomposée IMD.
Cette décomposition est effectuée selon deux niveaux de résolution RES1 et RES2.
Au cours de l'étape suivante E23, on procède à un codage et à une transmission, en direction du dispositif de décodage de la figure 4, de la sousbande basse de résolution la plus basse RES2 de l'image courante décomposée.
On procède également à un décodage de cette sous-bande basse notée LL2 (t) afin d'obtenir la sous-bande basse reconstruite L L. 2 (t) au niveau du dispositif de codage.
Cette sous-bande basse reconstruite de l'image courante est notée LLD2 sur la figure 7.
L'étape E24 prévoit d'initialiser à N un paramètre i représentatif du niveau de résolution dans la décomposition, dans l'exemple de réalisation considéré.
L'étape suivante E25 prévoit d'effectuer une segmentation de la sous-bande reconstruite L L2 (t), par exemple, en trois régions homogènes et de générer une carte de segmentation de niveau i = 2 et notée CS2.
Les trois régions correspondent à la tête d'un personnage, à son buste et au fond de l'image.
Cette étape de segmentation est illustrée, sur la figure 7, par les blocs respectifs référencés 150 et 152 et issus des sous-bandes LLD2 et LLS2.
Chaque bloc représente les différentes régions de la sous-bande basse de fréquence segmentée considérée.
L'étape suivante E26 correspond à un ordonnancement des régions de la carte de segmentation CS2 selon un critère prédéterminé qui a été mentionné plus haut, en référence à la description du circuit 64 de la figure 3a.
<Desc/Clms Page number 41>
Suivant une deuxième approche, au cours de l'étape E27, le procédé prévoit de déterminer un champ de mouvement entre les sous-bandes basses reconstruites C L2 (t) et LL2 (t-1) et segmentées, permettant ainsi d'obtenir un champ de mouvement homogène par région pour le niveau de résolution considéré.
Ce champ sera par exemple dense par région.
Suivant une troisième approche, au cours de cette étape E27, le champ de mouvement est déterminé par région entre les sous-bandes basses originales et segmentées de l'image courante et de l'image précédente LL2 (t) et LL2 (t-1).
Au cours de cette même étape, les champs de mouvement déterminés par région pour les trois régions considérées sont transmis progressivement au dispositif de décodage de la figure 4, suivant le même ordre que celui utilisé pour la transmission des erreurs de prédiction sur les régions et qui sera décrite ultérieurement (étape E30).
Au cours de l'étape suivante E28, le procédé selon l'invention prévoit d'appliquer le champ de mouvement obtenu lors de l'étape E26 directement ou indirectement aux sous-bandes hautes de fréquence de niveau de résolution RES2 de l'image précédente reconstruite.
Cette étape de compensation permet d'obtenir les prédictions des
Figure img00410001

sous-bandes hautes de niveau de résolution RES2 notées LH (t), HL (t) et p H P (t).
2
Lorsque l'on dispose d'un champ de mouvement par région, la compensation en mouvement est réalisée par région.
Comme on l'a vu précédemment lors de la description du circuit 70 de la figure 3a, les sous-bandes hautes de fréquence de niveau de résolution RES2 peuvent être compensées directement en mouvement au moyen du champ de mouvement. Cependant, ceci ne constitue toutefois pas la manière la plus simple d'effectuer la compensation en mouvement.
En effet, il est plus avantageux que l'étape E28 prévoit, d'abord, d'effectuer une compensation en mouvement sur la sous-bande basse de
<Desc/Clms Page number 42>
Figure img00420001

niveau de résolution RES1 de l'image précédente reconstruite S (t-1) et ensuite, que cette sous-bande basse compensée soit décomposée en sous-bandes de fréquence, afin d'obtenir les prédictions mentionnées ci-dessus.
La taille du champ de mouvement est adaptée au niveau de résolution supérieur.
L'étape suivante E29 prévoit d'effectuer une détermination par calcul des erreurs de prédiction ou résidus respectivement notés E (LH2), E (HL2), E (HH2). Le calcul consiste respectivement pour chaque sous-bande, à effectuer la différence entre la prédiction précitée sur la sous-bande haute considérée et la sous-bande haute correspondante de l'image courante.
Compte tenu des informations de segmentation (carte de segmentation CS2) dont on dispose à l'étape E25, les erreurs de prédiction sont obtenues région par région pour une sous-bande du niveau de résolution considéré.
Au cours de l'étape E30, le procédé selon l'invention prévoit d'effectuer, de manière globale, un codage et une transmission des erreurs de prédiction ou résidus précédemment calculés en utilisant les informations sur la segmentation en régions du champ de mouvement et sur l'ordonnancement de ces régions selon un critère prédéterminé.
Plus particulièrement, au cours de cette étape, on prévoit d'ordonnancer les erreurs de prédiction ou résidus en fonction de l'ordre qui a été préalablement attribué aux régions lors de l'étape E26.
Ensuite, le procédé selon l'invention prévoit d'effectuer un codage de ces erreurs de prédiction sélectivement en fonction de l'ordre attribué aux régions.
Toutefois, on peut, alternativement, coder de la même façon toutes les erreurs de prédiction, mais par contre, transmettre ces erreurs codées de manière progressive en fonction de l'ordre attribué aux régions lors de l'étape E26.
On peut également de manière avantageuse effectuer à la fois un codage sélectif des erreurs suivant l'ordre attribué aux régions et une transmission progressive en fonction de cet ordre.
<Desc/Clms Page number 43>
Comme déjà mentionné, on peut également se passer de l'étape E26 et transmettre les erreurs codées progressivement par région, selon un critère prédéterminé.
Au cours de l'étape notée E31, un test est effectué sur le paramètre i afin de savoir si le niveau de résolution concerné est le premier, à savoir, le niveau noté RES1.
Dans l'exemple en cours de description, i est égal à 2, et par conséquent, l'étape E31 est suivie de l'étape E34 au cours de laquelle le procédé selon l'invention prévoit d'effectuer la reconstruction de la sous-bande basse du niveau de résolution RES1, notée L L1 (t), de l'image courante S (t).
Au cours de cette étape, on effectue dans un premier temps un décodage des erreurs de prédiction ou résidus codés lors de l'étape E30 et notée EC (LH2), EC (HL2), EC (HH2). On applique ensuite ces erreurs de prédiction décodées aux sous-bandes hautes prédites de niveau de résolution RES2 de l'image précédente reconstruite S (t-1).
Figure img00430001
On obtient ainsi les sous-bandes hautes reconstruites de niveau RES2 de l'image courante S (t), à savoir, les sous-bandes notées C H2 (t), A L2 (t) et H H2 (t).
Au cours de l'étape E34, il est ensuite prévu de reconstruire la sousbande basse de niveau RES1 à partir de la sous-bande basse reconstruite L2 (t), et des sous-bandes hautes reconstruites précédemment citées.
Ces différentes étapes de compensation en mouvement (E28), de
Figure img00430002

détermination de l'erreur de prédiction sur les sous-bandes hautes (E29), de codage et décodage de ces erreurs (E30) et de synthèse à un niveau de résolution (E34) sont résumées et illustrées par la flèche référencée 154 sur la figure 7 et qui pointe sur la sous-bande basse reconstruite C LI (t), repérée par la notation 156.
L'étape E34 est suivie d'une étape E35 au cours de laquelle on décrémente le paramètre i à la valeur i-1 afin que le procédé de traitement selon l'invention s'applique au niveau de résolution 1, c'est-à-dire au niveau noté RES1.
<Desc/Clms Page number 44>
L'étape E35 est suivie de l'étape E25 déjà décrite au cours de laquelle on procède à une segmentation de la sous-bande basse reconstruite de l'image courante, L Li (t), pour former une carte de segmentation Ces1.
Cette opération est illustrée, sur la figure 7, en ce qui concerne la segmentation, par les blocs respectifs 157 et 158 issus des sous-bandes basses de l'image courante et de l'image précédente reconstruites de niveau RES1, et qui sont repérées par les références respectives 156 et 159.
Les blocs référencés 157 et 158 illustrent respectivement les différentes régions des sous-bandes basses segmentées.
L'étape E26 prévoit un ordonnancement des régions selon un critère prédéterminé.
La flèche verticale en pointillés 160 reliant les sous-bandes basses notées 156 et 159 traduit l'estimation de mouvement entre ces sous-bandes déterminée à l'étape E27.
De façon identique à la description précédente qui a été faite pour le niveau de résolution RES2, les étapes de compensation en mouvement, de calcul des erreurs de prédiction sur les sous-bandes hautes de niveau RES1, à savoir LHi, HLi, HH1, et de codage et transmission de ces erreurs codées sont effectuées (E28 à E30).
Les étapes E28, E29 et E30 qui viennent d'être effectuées sont alors suivies de l'étape E31 au cours de laquelle le test pratiqué sur le paramètre i est positif et cette dernière étape est suivie de l'étape E32.
Au cours de cette nouvelle étape, un test est pratiqué sur la position de l'image concernée dans la séquence vidéo, représenté par le paramètre t qui est comparé à une valeur prédéterminée tmax.
Dans l'hypothèse où l'image traitée est la dernière image de la séquence vidéo, il est mis fin au codage.
Dans la négative, l'étape E32 est suivie d'une étape E33 au cours de laquelle la valeur du paramètre t est incrémentée d'une unité et cette étape est alors suivie de l'étape E21 précédemment décrite.
<Desc/Clms Page number 45>
La figure 8 est un algorithme comportant différentes instructions ou portions de code correspondant à des étapes du procédé de traitement de données numériques codées selon l'invention.
Plus particulièrement, cet algorithme constitue un algorithme de décodage du signal codé selon l'invention.
Le programme d'ordinateur"Progr2"qui est basé sur cet algorithme est stocké dans la mémoire morte 104 de la figure 5, à l'initialisation du système, et transféré dans la mémoire vive 106. Il est ensuite exécuté par l'unité centrale 103, ce qui permet ainsi de mettre en oeuvre le procédé selon l'invention dans l'appareil de la figure 5.
L'algorithme de décodage de données numériques codées provenant du dispositif 20 de la figure 3a comporte une première étape E39 de réception de ces données par les moyens de réception 4 de la figure 4.
Comme mentionné précédemment lors de l'étape E20 de l'algorithme de la figure 6 (codage), la première image codée de la séquence vidéo en provenance du dispositif de la figure 3a est reçue et décodée au cours d'une étape E40 au niveau du dispositif de décodage 82 de la figure 4.
Cette image décodée est mémorisée dans le bloc 84 de la figure 4.
Au cours de cette même étape E40, un paramètre t représentatif de la position de l'image dans la séquence vidéo est initialisé à la valeur 2.
Les étapes suivantes de la figure 8 vont décrire, au niveau du dispositif de décodage, le traitement d'une image courante S (t) en vue de sa reconstruction au dispositif de décodage, niveau de résolution par niveau de résolution, à partir d'une image précédente reconstruite S (t-1) et de la sousbande de plus faible résolution LL2 (t) de l'image courante.
L'image précédente reconstruite S (t-1) est mémorisée dans le circuit 84 de la figure 4 et sert de référence pour le traitement de données selon l'invention.
Comme indiqué plus haut en référence à la figure 6, la sous-bande basse de niveau de résolution RES2 qui a été codée au niveau du dispositif de
<Desc/Clms Page number 46>
Figure img00460001

codage, LL (t), et transmise au dispositif 82 de la figure 4, est décodée au 2 cours d'une étape E41.
La sous-bande basse courante décodée notée L L2 (t) obtenue au niveau du dispositif de décodage, est lue au cours de l'étape E41.
Figure img00460002
Au cours de cette même étape E41, on procède également à une lecture de l'image précédente reconstruite S (t-1) ou, dans le cas de la première image de la séquence vidéo, à une lecture de cette image codée qui a été transmise intégralement par le dispositif de codage.
Au cours de l'étape suivante, notée E42, on procède à une décomposition en sous-bandes de fréquence de type DWT de l'image précédente reconstruite S (t) sur un nombre N de niveaux de résolution qui est égal à 2 dans l'exemple non limitatif considéré.
On peut également, à titre d'alternative, prévoir que la décomposition a été effectuée préalablement avant la mémorisation de l'image précédente reconstruite.
Au cours de l'étape E43, le procédé prévoit d'initialiser à N, soit à la valeur 2, un paramètre i représentatif du niveau de résolution dans la décomposition, dans l'exemple de réalisation considéré.
L'étape suivante E44 prévoit d'effectuer une segmentation de la sous-bande reconstruite L L2 (t), par exemple, en trois régions homogènes et de générer une carte de segmentation de niveau i = 2 et notée CS2. Les régions sont les mêmes que celles définies lors du codage.
Au cours d'une étape E45, on prévoit d'ordonnancer les régions issues de la segmentation selon le même ordre que celui appliqué à l'étape E26 de l'algorithme de codage de la figure 6, ceci afin de pouvoir reconstruire les différents niveaux de résolution de l'image décomposée à partir des erreurs reçues sur les régions.
Au cours de l'étape suivante E46, le procédé prévoit, selon une première approche, de déterminer par le calcul un champ de mouvement dense noté MV2 entre la sous-bande basse L L2 (t) reconstruite de l'image courante et
<Desc/Clms Page number 47>
Figure img00470001

la sous-bande basse reconstruite L L2 (t-1) de l'image précédente reconstruite et décomposée S (t-1).
Suivant une deuxième approche, au cours de l'étape E27, le procédé prévoit de déterminer un champ de mouvement entre les sous-bandes basses A reconstruites LL2 (t) et LL. 2 (t-1) et segmentées, permettant ainsi d'obtenir un champ de mouvement homogène par région pour le niveau de résolution considéré.
Le champ de mouvement ainsi déterminé au cours de cette étape est le même que celui déterminé à l'étape E27 de l'algorithme de codage de la figure 6.
En effet, ceci est rendu possible étant donné que le procédé prévoit de ne pas transmettre ce champ de mouvement du codeur au décodeur.
Suivant une troisième approche qui a déjà été décrite plus haut en référence à la figure 4, le champ de mouvement a été déterminé par région au codage (étape E27) et transmis progressivement région par région sous forme codée.
Lors de l'étape E46, on reçoit et on décode ces champs de mouvement région par région, en utilisant, par exemple, l'ordre attribué aux régions à l'étape E45 qui est le même que celui utilisé au codage, et notamment pour la transmission progressive des erreurs de prédiction par région.
La réception et le décodage région par région sont effectués en utilisant les informations de segmentation obtenues à l'étape E44 (carte de segmentation CS2).
Au cours de l'étape E47, le procédé selon l'invention prévoit d'appliquer le champ de mouvement ainsi obtenu, directement ou indirectement aux sous-bandes hautes de fréquence de niveau de résolution RES2 de l'image précédente reconstruite S (t-1).
Figure img00470002
Cette étape de compensation permet d'obtenir les prédictions des sous-bandes hautes de niveau de résolution RES2 notées LH (t), HL (t) et 2 2
<Desc/Clms Page number 48>
Figure img00480001

H H (t). Lorsque l'on dispose d'un champ de mouvement par région, la 2 compensation en mouvement est réalisée par région.
Comme on l'a vu précédemment lors de la description du circuit 92 de la figure 4, les sous-bandes hautes de fréquence de niveau de résolution RES2 peuvent être compensées directement en mouvement au moyen du champ de mouvement.
Cependant, ceci ne constitue toutefois pas la manière la plus simple d'effectuer la compensation en mouvement.
En effet, il est plus avantageux que l'étape E47 prévoit d'abord d'effectuer une compensation en mouvement sur la sous-bande basse de niveau de résolution REST de l'image précédente reconstruite # (t-1), après avoir adapté la taille du champ de mouvement au niveau de résolution REST.
Ensuite, cette sous-bande compensée est décomposée en sous-bandes de fréquence, afin d'obtenir les prédictions mentionnées ci-dessus.
Toutefois, il est impératif de choisir la même méthode de compensation en mouvement que celle utilisée au codeur.
L'étape suivante E48 concerne la réception des erreurs de prédiction ou résidus codés notés EC (LH2), EC (HL2), EC (HH2).
Ces erreurs de prédiction codées ont été obtenues au niveau du
Figure img00480002

dispositif de codage (figure 3a) à partir des prédictions des sous-bandes hautes de niveau de résolution RES2, notées C H P (t), HL (t) et HH (t), et à partir 2 2 2 des sous-bandes hautes de niveau de résolution RES2 de l'image courante S (t), notées LH2 (t), HL2 (t) et HH2 (t), puis par codage de ces erreurs.
On notera que ces erreurs de prédiction ont pu être codées sélectivement en fonction d'un ordre préalablement attribué aux régions issues de la segmentation du champ de mouvement du niveau de résolution considéré.
On notera également, qu'indépendamment du codage sélectif précité, les erreurs de prédiction codées au niveau du dispositif de codage sont reçues au niveau du dispositif de décodage de la figure 4, progressivement en fonction d'un ordre préalablement attribué aux régions.
<Desc/Clms Page number 49>
Comme on a établi à l'étape E45 le même ordonnancement que celui de l'étape E26 lors du codage, on est en mesure d'associer une erreur de prédiction reçue à une région de la carte de segmentation.
On procède ensuite à un décodage des erreurs de prédiction pour
Figure img00490001

obtenir les erreurs de prédiction notées Ê (LH2), Ê (HL2), Ê (HH2).
Ces erreurs décodées sont ensuite appliquées aux prédictions respectives LH (t), H L (t) et HHP (t) des sous-bandes hautes de niveau de 2 2 2 résolution RES2, pour obtenir les sous-bandes hautes reconstruites de l'image courante S (t), et qui sont notées LH2 (t), H L2 (t) et H H2 (t) (étape E49).
Au cours de cette étape suivante E50, le procédé selon l'invention prévoit d'effectuer la reconstruction de la sous-bande basse du niveau de résolution RES1, notée LLi (t), de l'image courante reconstruite S (t).
Au cours de l'étape E50, on reconstruit la sous-bande basse Ê LI (t)
Figure img00490002

de l'image courante en cours de reconstruction S (t), à partir des sous-bandes hautes reconstruites de niveau de résolution RES2 de l'image courante, L H2 (t), L2 (t) et H H2 (t) et à partir de la sous-bande basse reconstruite L L2 (t).
La reconstruction de cette sous-bande est possible dans la mesure où le dispositif 82 de la figure 4 a reçu l'intégralité des erreurs de prédiction codées.
En effet, en cas de réception partielle de certaines de ces erreurs et/ou dans le cas où celles-ci auraient été transmises progressivement en fonction d'un ordre attribué aux régions, il ne serait pas possible de reconstruire la sous-bande de niveau de résolution supérieure dans son intégralité.
Par contre, il serait toutefois possible de reconstruire partiellement cette sous-bande basse pour certaines régions.
La reconstruction partielle au niveau du dispositif de décodage peut résulter d'un choix volontaire, de problèmes de transmission, de réception ou encore de capacité de stockage.
On notera que le caractère progressif de la transmission et de la réception des erreurs en termes de résolution, de région et de qualité est
<Desc/Clms Page number 50>
avantageux. En effet, cela permet d'obtenir une progressivité (granularité) très fine.
Au cours de l'étape suivante E51, un test est effectué sur le paramètre i afin de savoir si le niveau de résolution concerné est le premier, à savoir, le niveau noté RES.
Dans l'exemple en cours de description, i est égal à 2 et, par conséquent, l'étape E51 est suivie de l'étape E52.
Au cours de cette étape, on décrémente le paramètre i à la valeur i-1 afin que le procédé de traitement selon l'invention s'applique au niveau de résolution 1, c'est-à-dire au niveau noté RES1.
L'étape E52 est suivie de l'étape E44 déjà décrite, au cours de laquelle on procède à une segmentation de la sous-bande basse de l'image courante, LL1 (t), qui vient d'être reconstruite, pour former une carte de segmentation Ces1.
De façon identique à la description précédente qui a été faite pour le niveau de résolution RES2, les étapes d'ordonnancement (E45), de détermination de champ de mouvement ou de réception de champ de mouvement par région (E46), de compensation en mouvement (E47), de réception et décodage des erreurs de prédiction sur les sous-bandes hautes de niveau RES1 qui ont été transmises par le dispositif de codage de la figure 3a (E48), de reconstruction des sous-bandes hautes de niveau RES1, LH1 (t), HLi (t) et HHi (t) (E49) et de synthèse de la sous-bande basse LLo (t) correspondant à l'image reconstituée (E50) sont effectuées.
Les étapes qui viennent d'être effectuées sont alors suivies de l'étape E51 au cours de laquelle le test pratiqué sur le paramètre i est positif et cette dernière étape est suivie de l'étape E53.
Au cours de cette nouvelle étape, un test est pratiqué sur la position de l'image concernée dans la séquence vidéo, représentée par le paramètre t qui est comparé à une valeur prédéterminée tmax.
Dans l'hypothèse où l'image traitée est la dernière image de la séquence vidéo, il est mis fin au codage.
<Desc/Clms Page number 51>
Dans la négative, l'étape E53 est suivie d'une étape E54 au cours de laquelle la valeur du paramètre t est incrémentée d'une unité et cette étape est alors suivie de l'étape E41 précédemment décrite.
On s'intéresse alors au traitement d'une nouvelle image courante et, plus précisément, à sa reconstruction niveau de résolution par niveau de résolution.
On notera que les traitements d'images selon l'invention au codeur et au décodeur, sont particulièrement bien adaptées à la décomposition en sousbandes de type DWT (transformation en odelettes discrète).

Claims (54)

REVENDICATIONS
1. Procédé de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un codeur, pour un sousensemble dit courant S (t) et un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, le sousensemble de référence décomposé S (t-k) et la sous-bande basse LLj (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ayant été tous deux reconstruits au niveau du codeur, avec i N : - segmentation (E25) de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - détermination (E27) d'un champ de mouvement (MVI) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence.
2. Procédé selon la revendication 1, caractérisé en ce que le champ de mouvement est déterminé entre les sous-bandes basses reconstruites LLj (t) et LL, (t-1) des sous-ensembles courant et de référence.
3. Procédé selon la revendication 2, caractérisé en ce que le champ de mouvement est déterminé par région entre les sous-bandes basses reconstruites et segmentées des sous-ensembles courant et de référence.
4. Procédé selon la revendication 2 ou 3, caractérisé en ce que le champ de mouvement est dense.
<Desc/Clms Page number 53>
5. Procédé selon la revendication 1, caractérisé en ce que le champ de mouvement est déterminé par région entre les sous-bandes basses LL, (t) et LL, (t-1) segmentées des sous-ensembles courant et de référence.
6. Procédé selon la revendication 5, caractérisé en ce que le champ de mouvement déterminé par région est représenté par un descripteur de mouvement qui définit le mouvement de la région considérée.
7. Procédé selon l'une des revendications 1 à 6, caractérisé en ce qu'il comporte les étapes suivantes :
Figure img00530001
- compensation en mouvement (E28) sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le champ de mouvement afin d'obtenir les prédictions respectives, CHF (t), HL (t) et HHF (t) des sous-bandes hautes de niveau i, et - détermination (E29) des erreurs de prédictions respectives E (LH,), E (HL,), E (HH) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LHi (t), HL, (t) et HH, (t), du sous-ensemble courant décomposé S (t).
8. Procédé selon la revendication 7, caractérisé en ce que la compensation en mouvement est effectuée sur les sous-bandes hautes de niveau i du sous-ensemble de référence décomposé reconstruit S (t-k).
9. Procédé selon la revendication 7, caractérisé en ce que la compensation en mouvement est effectuée sur la sous-bande basse de niveau i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) et ladite sous-bande basse de niveau i-1 compensée est ensuite décomposée en sousbandes de fréquence pour obtenir les prédictions des sous-bandes hautes de niveau i.
<Desc/Clms Page number 54>
10. Procédé selon l'une des revendications 7 à 9, caractérisé en ce qu'il comporte une étape d'ordonnancement (E30) des erreurs de prédictions sur les sous-bandes hautes de niveau i en fonction d'un ordre préalablement attribué aux régions de la carte de segmentation (CSi).
11. Procédé selon la revendication 10, caractérisé en ce qu'il comporte une étape de codage (E30) des erreurs de prédiction E (LHi), E (HL, ) et E (HH, ) en vue de leur transmission à un décodeur.
12. Procédé selon la revendication 11, caractérisé en ce que le codage est effectué de manière sélective en fonction de l'ordre attribué aux régions.
13. Procédé de transmission de données codées représentatives de grandeurs physiques codées, caractérisé en ce que, à partir d'un sousensemble dit courant S (t) et d'un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui sont des sous-ensembles de données décalés dans le temps parmi un ensemble de données représentatives de grandeurs physiques et qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, pour lesquels le sous-ensemble de
Figure img00540001
référence décomposé S (t-k) et la sous-bande basse LLj (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ont été tous deux reconstruits au niveau d'un codeur, avec i : S ; N et ont donné lieu, au niveau du codeur, à des étapes de : - segmentation (E25) de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - détermination (E27) d'un champ de mouvement (MV, ) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence, - compensation en mouvement (E28) sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit
<Desc/Clms Page number 55>
S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives CHP (t), HELP (t) et HHP (t) des sous-bandes hautes de niveau i, - détermination (E29) des erreurs de prédictions respectives E (LH,), E (HL,), E (HH, ) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t) du sous-ensemble courant décomposé S (t), et - codage (E30) des erreurs de prédiction, ledit procédé comporte une étape de transmission (E30) des erreurs de prédiction codées EC (LHj), EC (HL,), EC (HH) sur les sous-bandes hautes de niveau i.
Figure img00550001
14. Procédé selon la revendication 13, caractérisé en ce que la transmission est effectuée sur des erreurs de prédictions qui ont été codées sélectivement en fonction d'un ordre préalablement attribué aux régions.
15. Procédé selon la revendication 13 ou 14, caractérisé en ce que l'étape de transmission (E30) donne lieu à une transmission des erreurs sur les régions qui est effectuée progressivement en fonction d'un ordre préalablement attribué aux régions.
16. Procédé selon l'une des revendications 13 à 15, caractérisé en ce que le champ de mouvement est déterminé entre les sous-bandes basses reconstruites LL, (t) et LLj (t-1) des sous-ensembles courant et de référence.
17. Procédé selon la revendication 16, caractérisé en ce que le champ de mouvement est déterminé par région entre les sous-bandes basses reconstruites et segmentées des sous-ensembles courant et de référence.
18. Procédé selon la revendication 16 ou 17, caractérisé en ce que le champ de mouvement est dense.
<Desc/Clms Page number 56>
19. Procédé selon l'une des revendications 13 à 15, caractérisé en ce que le champ de mouvement est déterminé par région entre les sous- bandes basses LLI (t) et LLj (t-1) segmentées des sous-ensembles courant et de référence.
20. Procédé selon la revendication 19, caractérisé en ce que le champ de mouvement déterminé par région est représenté par un descripteur de mouvement qui définit le mouvement de la région considérée.
21. Procédé selon la revendication 19 ou 20, caractérisé en ce qu'il comporte une étape de transmission progressive (E27) des champs de mouvement par région, en fonction d'un ordre préalablement attribué aux régions.
22. Procédé de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sousensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N > 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LL, (t), d'un sous-ensemble dit courant en cours de reconstruction S (t) et ladite sousbande L L, (t) étant obtenue au décodeur, avec i s ; N : - segmentation (E44) de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - détermination (E46) d'un champ de mouvement (MV,), entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence.
<Desc/Clms Page number 57>
23. Procédé selon la revendication 22, caractérisé en ce que le champ de mouvement est déterminé entre les sous-bandes basses reconstruites CLi (t) et CLi (t-1) des sous-ensembles courant et de référence.
24. Procédé selon la revendication 23, caractérisé en ce que le champ de mouvement est déterminé par région entre les sous-bandes basses reconstruites et segmentées des sous-ensembles courant et de référence.
25. Procédé selon la revendication 23 ou 24, caractérisé en ce que le champ de mouvement est dense.
26. Procédé selon l'une des revendications 22 à 25, caractérisé en ce qu'il comporte les étapes suivantes : - compensation en mouvement (E47) sur un des niveaux de résolution i et i-1 du sous-ensemble de référence obtenu et décomposé S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives
Figure img00570001
LH (t), HLi, (t) et HH (t) des sous-bandes hautes de niveau i, - application (E49) d'erreurs de prédiction qui ont été reçues (E48) d'un codeur sous forme codées EC (LHi), EC (HLi), et EC (HHi) et qui ont décodées A A au niveau du décodeur Ê (LH, Ê (HLj), É (HHj), aux prédictions respectives LEZ (t), HL (t) et HEP (t) des sous-bandes hautes de niveau i, pour obtenir les sous-bandes hautes reconstruites de niveau i du sous-ensemble courant en cours de reconstruction S (t), LHj (t), HLj (t) et HH, (t), - reconstruction (E50) de la sous-bande basse de niveau i-1, i~Lj1 (t), à partir de la sous-bande basse obtenue LL, (t) et des sous-bandes hautes reconstruites #Hi (t), #Hi (t) et HHi (t).
27. Procédé selon la revendication 26, caractérisé en ce que les erreurs de prédictions codées EC (LHi), Ec(HLi), Ec(HHi) ont été reçues d'un codeur où elles ont été obtenues par :
<Desc/Clms Page number 58>
S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives LHj (t), HL'j' (t) et HH (t) des sous-bandes hautes de niveau i, - détermination (E29) des erreurs de prédictions respectives E (LH,), E (HL,), E (HH) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HLi (t) et HHi (t) du sous-ensemble courant décomposé S (t), et - codage (E30) des erreurs de prédiction.
Figure img00580001
- segmentation (E25) de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - détermination (E27) d'un champ de mouvement (MVi) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence, - compensation en mouvement (E28) sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit
28. Procédé selon la revendication 27, caractérisé en ce que les erreurs de prédiction ont été codées sélectivement en fonction d'un ordre préalablement attribué aux régions.
29. Procédé selon l'une des revendications 26 à 28, caractérisé en ce que les erreurs de prédiction sont reçues progressivement en fonction d'un ordre préalablement attribué aux régions.
30. Procédé de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sousensembles de données décalés dans le temps, caractérisé en ce que ledit procédé comporte les étapes suivantes effectuées au niveau d'un décodeur, à partir, d'une part, d'un sous-ensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 2 1, et, d'autre
<Desc/Clms Page number 59>
part, d'une sous-bande basse de fréquence de niveau de résolution i, (Li (t), d'un sous-ensemble dit courant # (t) en cours de reconstruction et ladite sousbande C L, (t) étant obtenue au décodeur, avec i < N : - segmentation (E44) de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - réception (E46) des champs de mouvement (MV,) par région qui ont été déterminés au niveau d'un codeur, entre les sous-bandes basses LLi (t) et LLj (t-1) segmentées des sous-ensembles courant et de référence disponibles au codeur, la réception étant effectuée progressivement en fonction d'un ordre préalablement attribué aux régions.
Figure img00590001
31. Procédé selon la revendication 30, caractérisé en ce que le champ de mouvement déterminé par région est représenté par descripteur de mouvement qui définit le mouvement de la région considérée.
32. Procédé selon la revendication 30 ou 31, caractérisé en ce
Figure img00590002
qu'il comporte les étapes suivantes : - compensation (E47) en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence obtenu et décomposé S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives (Hi (t), HL (t) et HHF (t) des sous-bandes hautes de niveau i, - application (E49) d'erreurs de prédiction qui ont été reçues (E48) du codeur sous forme codées EC (LHi), EC (HLi), et EC (HHi) et qui ont décodées au niveau du décodeur Ê (LHi), Ê (HLi), Ê (HHi), aux prédictions respectives CHF (t), HL (t) et HHF (t) des sous-bandes hautes de niveau i, pour obtenir les 1 1 1 sous-bandes hautes reconstruites de niveau i du sous-ensemble courant en A A A cours de reconstruction S (t), LH, (t), HLi (t) et HHi (t),
<Desc/Clms Page number 60>
- reconstruction (E50) sous-bande basse de niveau i-1, L. Lj (t), à partir de la sous-bande basse obtenue LL, (t) et des sous-bandes hautes A reconstruites LH, (t), HLi (t) et HH, (t).
Figure img00600001
33. Procédé selon la revendication 32, caractérisé en ce que les erreurs de prédictions codées EC (LHi), EC (HLi), EC (HHj) ont été reçues du codeur où elles ont été obtenues par : - segmentation (E25) de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - détermination (E27) d'un champ de mouvement (MV,) par région entre les sous-bandes basses respectives de niveau i, LLi (t) et LL, (t-1) segmentées des sous-ensembles courant et de référence, - compensation en mouvement (E28) sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit
Figure img00600002
S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives LEZ (t), HL'j' (t) et HH (t) des sous-bandes hautes de niveau i, - détermination (E29) des erreurs de prédictions respectives E (LH,), E (HL,), E (HH) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HHi (t) du sous-ensemble courant décomposé S (t), et - codage (E30) des erreurs de prédiction.
34. Procédé selon la revendication 33, caractérisé en ce que les erreurs de prédiction ont été codées sélectivement en fonction d'un ordre préalablement attribué aux régions.
35. Procédé selon l'une des revendications 32 à 34, caractérisé en ce que les erreurs de prédiction sont reçues progressivement en fonction d'un ordre préalablement attribué aux régions.
<Desc/Clms Page number 61>
36. Dispositif de traitement d'un ensemble de données représentatives de grandeurs physiques et qui est composé de sous-ensembles de données décalés dans le temps, caractérisé en ce que ledit dispositif comporte au niveau d'un codeur, pour un sous-ensemble dit courant S (t) et un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 2 1, le sous-ensemble de référence décomposé S (t-k) et la sous-bande basse (Li (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ayant été tous deux reconstruits au niveau du codeur, avec i N : - des moyens de segmentation de la sous-bande basse reconstruite (Li (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - des moyens de détermination d'un champ de mouvement (MV,) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence.
37. Dispositif selon la revendication 36, caractérisé en ce qu'il comporte : - des moyens de compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit
Figure img00610001
A S (t-k) avec le champ de mouvement afin d'obtenir les prédictions respectives, LHP (t), HL'j' (t) et HHP (t) des sous-bandes hautes de niveau i, et - des moyens de détermination des erreurs de prédictions respectives E (LH,), E (HL, ), E (HH,) (HH, )à partir des prédictions précitées et des sous- bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t), du sous-ensemble courant décomposé S (t).
38. Dispositif selon la revendication 37, caractérisé en ce qu'il comporte des moyens d'ordonnancement des erreurs de prédictions sur les
<Desc/Clms Page number 62>
sous-bandes hautes de niveau i en fonction d'un ordre préalablement attribué aux régions de la carte de segmentation (CSj).
39. Dispositif selon la revendication 38, caractérisé en ce qu'il comporte des moyens de codage des erreurs de prédiction E (LHi), E (HL,) et E (HH,) en vue de leur transmission à un décodeur.
40. Dispositif de transmission de données codées représentatives de grandeurs physiques codées, caractérisé en ce que, à partir d'un sousensemble dit courant S (t) et d'un sous-ensemble dit de référence S (t-k), avec k entier relatif non nul, qui sont des sous-ensembles de données décalés dans le temps parmi un ensemble de données représentatives de grandeurs physiques et qui ont été décomposés chacun en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N rez 1, pour lesquels le sous-ensemble de référence décomposé S (t-k) et la sous-bande basse LL, (t) du niveau de résolution i du sous-ensemble courant décomposé S (t) ont été tous deux reconstruits au niveau d'un codeur, avec i < N et ont donné lieu, au niveau du codeur, à :
Figure img00620001
- une segmentation de la sous-bande basse reconstruite CL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - une détermination d'un champ de mouvement (MV,) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sousensembles courant et de référence, - une compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives
Figure img00620002
CHP (t), HLP. (t) et HHF (t) des sous-bandes hautes de niveau i, - une détermination des erreurs de prédictions respectives E (LH,), E (HL,), E (HH,) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t) du sous-ensemble courant décomposé S (t), et
<Desc/Clms Page number 63>
- un codage des erreurs de prédiction, ledit dispositif comporte des moyens de transmission des erreurs de prédiction codées ELHJ, E (HLJ, E (HH, ) sur les sous-bandes hautes de niveau i.
41. Dispositif selon la revendication 40, caractérisé en ce qu'il comporte des moyens de transmission progressive des champs de mouvement par région, en fonction d'un ordre préalablement attribué aux régions.
42. Dispositif de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sousensembles de données décalés dans le temps, caractérisé en ce que ledit dispositif comporte au niveau d'un décodeur, à partir, d'une part, d'un sousensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LLj (t), d'un sous-ensemble dit courant en cours de reconstruction S (t) et ladite sous-bande LL, (t) étant obtenue au décodeur, avec i N : - des moyens de segmentation de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - des moyens de détermination d'un champ de mouvement (MV,), entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence.
43. Dispositif selon la revendication 42, caractérisé en ce qu'il comporte : - des moyens de compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence obtenu et décomposé
<Desc/Clms Page number 64>
A sous-bandes hautes reconstruites LHj (t), HL, (t) et HHj (t).
Figure img00640003
respectives LHF' (t), HL (t) et HHi (t) des sous-bandes hautes de niveau i, pour obtenir les sous-bandes hautes reconstruites de niveau i du sous- ensemble courant en cours de reconstruction # (t), LH, (t), HLj (t) et HH, (t), - des moyens de reconstruction de la sous-bande basse de niveau i-1, LLi-1 (t), à partir de la sous-bande basse obtenue LLj (t) et des
Figure img00640002
S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives CHP (t), HELP (t) et HHi (t) des sous-bandes hautes de niveau i, - des moyens d'application d'erreurs de prédiction qui ont été reçues d'un codeur sous forme codées EC (LHi), EC (HLi), et EC (HHi) et qui ont décodées au niveau du décodeur Ê (LHYi), Ê (HLj), Ê (HHj), aux prédictions
Figure img00640001
44. Dispositif selon la revendication 43, caractérisé en ce que les erreurs de prédictions codées EC (LH,), EC (HL, ), EC (HHj) ont été reçues d'un codeur où elles ont été obtenues par : - des moyens de segmentation de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - des moyens de détermination d'un champ de mouvement (MVj) entre les sous-bandes basses respectives de niveau i, reconstruites ou non, des sous-ensembles courant et de référence, - des moyens de compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit
Figure img00640004
S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives LHP (t), HLPI (t) et HHP (t) des sous-bandes hautes de niveau i, - des moyens de détermination des erreurs de prédictions respectives E (LH,), E (HL,), E (HH,) à partir des prédictions précitées et des sous- bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t) du sous-ensemble courant décomposé S (t), et
<Desc/Clms Page number 65>
- des moyens de codage des erreurs de prédiction.
45. Dispositif selon l'une des revendications 43 à 44, caractérisé en ce qu'il comporte des moyens de réception progressive des erreurs de prédiction en fonction d'un ordre préalablement attribué aux régions.
46. Dispositif de traitement d'un ensemble codé de données représentatives de grandeurs physiques codées et qui est composé de sousensembles de données décalés dans le temps, caractérisé en ce que ledit dispositif comporte au niveau d'un décodeur, à partir, d'une part, d'un sousensemble dit de référence S (t-k), obtenu au décodeur, avec k entier relatif non nul, et décomposé en sous-bandes de fréquence suivant au moins N niveaux de résolution, avec N > 1, et, d'autre part, d'une sous-bande basse de fréquence de niveau de résolution i, LL (t), d'un sous-ensemble dit courant S (t) en cours de reconstruction et ladite sous-bande L Li (t) étant obtenue au décodeur, avec i c : ; N : - des moyens de segmentation de la sous-bande basse reconstruite LL, (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CS,), - des moyens de réception des champs de mouvement (MV,) par région qui ont été déterminés au niveau d'un codeur, entre les sous-bandes basses LL, (t) et LLj (t-1) segmentées des sous-ensembles courant et de référence disponibles au codeur, la réception étant effectuée progressivement en fonction d'un ordre préalablement attribué aux régions.
47. Dispositif selon la revendication 46, caractérisé en ce qu'il comporte : - des moyens de compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence obtenu et décomposé
<Desc/Clms Page number 66>
A S (t-k) avec le champ de mouvement, afin d'obtenir des prédictions respectives CHP (t), HOLD (t) et HH (t) des sous-bandes hautes de niveau i, - des moyens d'application d'erreurs de prédiction qui ont été reçues du codeur sous forme codées EC (LHi), EC (HLi), et EC (HHi) et qui ont décodées au niveau du décodeur Ê (LHj), Ê (HLj), Ê (HHj), aux prédictions respectives CHF (t), HLi, (t) et HHF (t) des sous-bandes hautes de niveau i, 1 1 1 pour obtenir les sous-bandes hautes reconstruites de niveau i du sousensemble courant en cours de reconstruction # (t), #Hi (t), #Li (t) et HH, (t), - des moyens de reconstruction de la sous-bande basse de niveau i-1, #Li-1 (t), à partir de la sous-bande basse obtenue L. L, (t) et des sousbandes hautes reconstruites LH, (t), HLj (t) et HHi (t).
Figure img00660001
48. Dispositif selon la revendication 47, caractérisé en ce que les erreurs de prédictions codées EC (LHi), EC (HL,), EC (HHj) ont été reçues du codeur où elles ont été obtenues par : - segmentation de la sous-bande basse reconstruite LLj (t) en au moins deux régions pour former une carte de segmentation de niveau i, (CSi), - détermination d'un champ de mouvement (MV,) par région entre les sous-bandes basses respectives de niveau i, LLj (t) et LLj (t-1) segmentées des sous-ensembles courant et de référence, - compensation en mouvement sur un des niveaux de résolution i et i-1 du sous-ensemble de référence décomposé reconstruit S (t-k) avec le
Figure img00660002
champ de mouvement, afin d'obtenir des prédictions respectives LH ? (t), HL ? (t) et HHF (t) des sous-bandes hautes de niveau i, - détermination des erreurs de prédictions respectives E (LH, E (HL,), E (HH,) à partir des prédictions précitées et des sous-bandes hautes de niveau i, LH, (t), HL, (t) et HH, (t) du sous-ensemble courant décomposé S (t), et - codage des erreurs de prédiction.
<Desc/Clms Page number 67>
49. Dispositif selon l'une des revendications 47 à 48, caractérisé en ce qu'il comporte des moyens de réception progressive des erreurs de prédiction en fonction d'un ordre préalablement attribué aux régions.
50. Dispositif de traitement selon l'une des revendications 36 à 39, caractérisé en ce que les moyens de segmentation, de détermination d'un champ de mouvement, de compensation en mouvement, de détermination des
Figure img00670001
erreurs et de codage sont incorporés dans : - un microprocesseur (103), - une mémoire morte (104) comportant un programme (Progr1) pour coder l'ensemble de données, et - une mémoire vive (106) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
51. Dispositif de traitement selon l'une des revendications 42 à 49, caractérisé en ce que les moyens de segmentation, de détermination d'un champ de mouvement, , de compensation en mouvement, de décodage d'erreurs de prédiction, d'application d'erreurs de prédiction décodées et de reconstruction sont incorporés dans : - un microprocesseur (103), - une mémoire morte (104) comportant un programme (Progr2) pour décoder les données, et - une mémoire vive (106) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
52. Appareil (100) de traitement de signal numérique, caractérisé en ce qu'il comporte un dispositif de traitement d'un ensemble de données selon l'une des revendications 36 à 39.
53. Appareil (100) de traitement de signal numérique, caractérisé en ce qu'il comporte un dispositif de transmission de données codées selon l'une des revendications 40 à 41.
<Desc/Clms Page number 68>
54. Appareil (100) de traitement de signal numérique, caractérisé en ce qu'il comporte un dispositif de traitement d'un ensemble codé de données selon l'une des revendications 42 à 49.
FR0015768A 2000-12-05 2000-12-05 Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques Expired - Fee Related FR2817697B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0015768A FR2817697B1 (fr) 2000-12-05 2000-12-05 Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0015768A FR2817697B1 (fr) 2000-12-05 2000-12-05 Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques

Publications (2)

Publication Number Publication Date
FR2817697A1 true FR2817697A1 (fr) 2002-06-07
FR2817697B1 FR2817697B1 (fr) 2003-02-14

Family

ID=8857264

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0015768A Expired - Fee Related FR2817697B1 (fr) 2000-12-05 2000-12-05 Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques

Country Status (1)

Country Link
FR (1) FR2817697B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11151731B2 (en) * 2019-08-06 2021-10-19 Samsung Electronics Co., Ltd. Apparatus and method for efficient regularized image alignment for multi-frame fusion

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0720373A1 (fr) * 1994-12-30 1996-07-03 Daewoo Electronics Co., Ltd Méthode et appareil pour le codage d'un signal vidéo employant des vecteurs de mouvement basés sur des régions
WO1997016028A1 (fr) * 1995-10-25 1997-05-01 Sarnoff Corporation Codeur d'image a ondlettes a arborescence nulle et a blocs se chevauchant

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0720373A1 (fr) * 1994-12-30 1996-07-03 Daewoo Electronics Co., Ltd Méthode et appareil pour le codage d'un signal vidéo employant des vecteurs de mouvement basés sur des régions
WO1997016028A1 (fr) * 1995-10-25 1997-05-01 Sarnoff Corporation Codeur d'image a ondlettes a arborescence nulle et a blocs se chevauchant

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CONKLIN G J ET AL: "MULTI-RESOLUTION MOTION ESTIMATION", MULTIDIMENSIONAL SIGNAL PROCESSING, NEURAL NETWORKS. MUNICH, APR. 21 - 24, 1997,LOS ALAMITOS,CA: IEEE COMP. SOC. PRESS,US, 21 April 1997 (1997-04-21), pages 2873 - 2876, XP000788015, ISBN: 0-8186-7920-4 *
DIEHL N: "OBJECT-ORIENTED MOTION ESTIMATION AND SEGMENTATION IN IMAGE SEQUENCES", SIGNAL PROCESSING. IMAGE COMMUNICATION,ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM,NL, vol. 3, no. 1, 1 February 1991 (1991-02-01), pages 23 - 56, XP000234779, ISSN: 0923-5965 *
SOO-CHUL HAN, JOHN W. WOODS: "Spatiotemporal Subband/Wavelet Coding of Video with Object-based Motion Information", IEEE INT. CONFERENCE ON IMAGE PROCESSING SANTA BARBARA, vol. 2, October 1997 (1997-10-01), pages 629 - 632, XP001014360 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11151731B2 (en) * 2019-08-06 2021-10-19 Samsung Electronics Co., Ltd. Apparatus and method for efficient regularized image alignment for multi-frame fusion

Also Published As

Publication number Publication date
FR2817697B1 (fr) 2003-02-14

Similar Documents

Publication Publication Date Title
EP1604529B1 (fr) PROCEDES ET DISPOSITIFS DE CODAGE ET DE DECODAGE D&amp;rsquo;UNE SEQUENCE D&amp;rsquo;IMAGES PAR DECOMPOSITION MOUVEMENT/TEXTURE ET CODAGE PAR ONDELETTES
US6597739B1 (en) Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
FR2889382A1 (fr) Procede et dispositif de filtrage d&#39;un signal numerique multidimensionnel et procedes et dispositifs de codage et decodage associes
FR2826823A1 (fr) Procede et dispositif de traitement d&#39;un signal numerique code
FR2724791A1 (fr) Appareil de compression de donnees utilisant des ondes elementaires implantees reversibles
FR2755818A1 (fr) Codage de signal numerique par decomposition en sous-bandes de frequence et quantification vectorielle a etats finis
EP0825556B1 (fr) Codeur par transformation de blocs pour segments d&#39;image de formes arbitraires
FR2792150A1 (fr) Procedes et dispositis de codage et de decodage de signaux numeriques, et systemes les mettant en oeuvre
EP0545475B1 (fr) Méthodes et dispositifs de synthèse de signaux de texture
EP1800263A2 (fr) Procede de decodage local d&#39;un train binaire de coefficients d&#39;ondelettes
FR2782861A1 (fr) Transcodage geometrique d&#39;un signal numerique
EP1181668B1 (fr) Procede de codage/decodage d&#39;images
FR2817697A1 (fr) Procede et dispositif de traitement d&#39;un ensemble de donnees representatives de grandeurs physiques
FR2872972A1 (fr) Procede et dispositif de transmission video entre un serveur et un client
EP3520416B1 (fr) Procédé de codage d&#39;une image, procédé de decodage, dispositifs, equipement terminal et programmes d&#39;ordinateurs associés
FR2817698A1 (fr) Procede et dispositif de traitement d&#39;un ensemble de donnees representatives de grandeurs physiques
FR2927745A1 (fr) Procede et dispositif de codage d&#39;un signal numerique.
FR2822331A1 (fr) Codage et decodage de signal numerique, avec segmentation hierarchique
WO2023247208A1 (fr) Procede de segmentation d&#39;une pluralite de donnees, procede de codage, procede de decodage, dispositifs, systemes et programme d&#39;ordinateur correspondants
FR2826225A1 (fr) Segmentation spatio-temporelle hierarchique d&#39;un signal numerique
FR2929431A1 (fr) Procede et dispositif de classification des echantillons representatifs d&#39;un signal numerique d&#39;image
FR2848765A1 (fr) Procede et dispositif de determination d&#39;une configuration de donnees d&#39;un signal numerique d&#39;image
FR2795274A1 (fr) Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation
FR2914467A1 (fr) Procedes et dispositifs de codage et de decodage de signaux numeriques multidimensionnels.
WO2024121107A1 (fr) Procédé et dispositif de codage et décodage d&#39;images.

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20140829