EP1636996A1 - Procede de codage et/ou de decodage de groupes d'images - Google Patents

Procede de codage et/ou de decodage de groupes d'images

Info

Publication number
EP1636996A1
EP1636996A1 EP04785573A EP04785573A EP1636996A1 EP 1636996 A1 EP1636996 A1 EP 1636996A1 EP 04785573 A EP04785573 A EP 04785573A EP 04785573 A EP04785573 A EP 04785573A EP 1636996 A1 EP1636996 A1 EP 1636996A1
Authority
EP
European Patent Office
Prior art keywords
images
image
sequence
determining
reference image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP04785573A
Other languages
German (de)
English (en)
Inventor
Edouard Francois
Dominique Thoreau
Guillaume Boisson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
THOMSON LICENSING
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of EP1636996A1 publication Critical patent/EP1636996A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/62Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Definitions

  • the present invention relates to a method of coding and / or decoding groups of images.
  • the invention applies in the context of video compression based on decomposition by 3D wavelets.
  • the movement is described by blocks, 16 pixels wide by 16 pixels high, for example.
  • the problem raised above is then returned to the boundaries of the blocks.
  • the trajectories of the pixels in the two directions of travel of the image sequence have also been taken into account: in the natural direction of the GOP image sequence and in the opposite direction. But then we double the amount of movement information compared to conventional techniques.
  • the present invention consists in choosing configuration data for each sequence and an optimizing criterion making it possible to reduce the number of unconnected pixels in each sequence of GOP images.
  • the number of unconnected pixels is significantly reduced without requiring more processing according to a 3D wavelet decomposition.
  • the present invention relates to a method of coding and / or decoding image sequences, on the basis of a 3D wavelet processing.
  • the method of the invention comprises a coding phase which includes: a step for determining at least one piece of configuration information for the 3D wavelet coding such as the selection of a reference image for a sequence of successive images, based on a predetermined optimizing criterion; then - a step for generating a unit of configuration information comprising the datum of the reference image for said sequence of images; and finally - a step for executing the 3D wavelet coding on the basis of said configuration information, so as to produce a coded data stream comprising the meeting for each sequence of images of a unit of configuration information and / or 3D wavelet coding data of the images in the image sequence.
  • the step for determining at least one configuration item of information comprises a wavelet decomposition step in at least one test image as a reference image, then a motion estimation step, then a step determining the image of the sequence of images for which the number of pixels not connected during the motion estimation step is minimal, as a reference image.
  • the step for determining at least one configuration item of information comprises a step of determining the amplitude of the movement in at least one test image, then a step of determining the image of the sequence images for which the amplitude of movement in the image is minimal, as a reference image,
  • the step for determining at least one configuration item of information comprises a step of determining texture information, by measuring the high-frequency components, in at least one test image, then a step of determination of the image of the sequence of images for which the texture information is the richest, as the reference image.
  • the step for determining at least one configuration item of information also includes determining the number of images in said sequence of images. According to one aspect of the invention, the step for determining at least one configuration item of information also comprises the determination of at least one direction of temporal decomposition for a sequence of images.
  • the step for determining at least one configuration item of information consists of:
  • the step for determining at least one configuration item of information consists of:
  • - in a first step to constitute a sequence of GOP images of a predetermined size
  • - in a second step to execute the choice of a reference image, and in that the direction of temporal decomposition is determined in the forward direction for the images of the sequence of images which follow the selected reference image and in the opposite direction for the images of the sequence of images which precede the selected reference image.
  • the step for determining at least one configuration item of information comprises:
  • a step of estimating the movement a step of constructing the trajectories of the points of movement in the estimation of direct movement and a step of calculating the number of pixels not connected during the step of construction of trajectories;
  • a step of estimation of the movement in the opposite direction between images a step of construction of the trajectories of the points of motion in the estimation of direct motion and a step of calculation of the number of unconnected pixels during the stage of construction of the trajectories; a step of choosing the best reference image on the basis of the lowest number of unconnected pixels.
  • the step for determining at least one configuration item of information comprises:
  • a loop is made for each image of the GOP sequence being adapted during which successively a step of constructing the trajectories is executed, then a step of calculating the number of unconnected pixels; then
  • a step of selecting the best reference image in the sequence of GOP images being adapted is carried out on the basis of the lowest number of unconnected points.
  • the method comprises a decoding phase which consists:
  • the method is integrated into a 3D wavelet video compressor-decompressor scheme.
  • the method is integrated into an MPEG TM coding-decoding scheme.
  • the selection of a reference image, from which the movement is calculated in a GOP, the direction of the temporal decomposition are carried out according to the number of pixels connected by this movement, information which can be combined with the data of texture or motion of the motion vector field.
  • the efficiency of the 2D + T wavelet decomposition is improved with the number of pixels connected in time.
  • FIG 1 there is shown an embodiment of a 3D wavelet compression scheme according to the prior art. It will be noted that this 3D wavelet compression scheme can also be used once the method of the invention has been executed. It will also be noted that what will be described in terms of method, could be implemented in the form of processing blocks in a computer for processing image sequences.
  • a step 1 the acquisition or the synthesis of a sequence of GOP images, comprising N successive images, is carried out.
  • the GOP sequence is then transmitted to a decomposition step by wavelets 2 and in parallel to a step 3 for estimating the movement between images.
  • the wavelet decomposition step includes a step 2a of analysis in the time domain and a step 2b of analysis in the space domain (pattern repetition frequencies, etc.)
  • the step of estimating the movement 3 begins with the choice of a basic image in the sequence of GOP images which is the last image of the sequence. By differences between images, between image_2 and image_1, then between image_3 and image_2, etc. an estimate of the movement is then made.
  • motion estimation information is transmitted by motion estimation information 8 in step 2a of analysis in the time domain for the wavelet decomposition to perform a one-dimensional decomposition in wavelets in the direction of movement.
  • a sequence of transformed images corresponding to different time frequencies is produced.
  • the sequence of images transformed into time frequencies is then processed during step 2b of spatial decomposition by a 2D wavelet transform.
  • the movement coefficients representative of the motion vectors in the sequence of images GOP is transmitted to a step of coding the vector fields representative of the movements in the sequence d 'GOP images.
  • coefficients representative of the spatial frequencies in each image of the sequence of images are transmitted to an input of an entropy coding circuit.
  • the entropy coding carried out in step 4 comprises two phases: preliminary modeling and coding proper. Modeling allows you to assign probabilities to each symbol in the data stream to be processed. The coding assigns to each symbol a binary word whose length depends on the associated probability. To this end, an encoding scheme such as the Huffman code or an arithmetic encoding is used.
  • the coding coefficients from the entropy coding 4 are transmitted to a first input of a data flow conformation processing circuit 6, a second input of which receives the components of the motion vector fields from step 3.
  • the set thus constitutes the data stream of the 3D wavelet coefficients, serialized so as to produce a binary data stream 7 to which any subsequent suitable processing can be applied, such as encryption, storage or transmission processing.
  • FIG. 2 a diagram has been shown which illustrates a one-dimensional transformation technique, in the case a sequence of GOP images of four images.
  • the temporal filtering is carried out along the trajectory of each point of the basic image which was chosen during step 3 of estimation of the movement.
  • Each image referenced in FIG. 2 in image_1, image_2 is represented in the serialized form of its pixels, which corresponds to the classic one-dimensional wavelet transformation scheme.
  • the trajectory considered therefore passes through the positions marked respectively x1 on image_1, x2 on image_2, etc.
  • the arrows F1, F2 and F3 represent the successive inter-image displacements and make it possible to identify the wavelet coefficients corresponding to the trajectory considered for the entire sequence of GOP images.
  • step of decomposing into one-dimensional wavelets is shown, mentioned in step 2 of FIG. 1.
  • a high-pass filtering step 11 and a sub-sampling by 2 are applied which produces a pair of high frequency coefficients [H1, H2].
  • a step 12 of low pass filtering and subsampling by 2 is again applied which produces a coefficient [LL] which represents the lowest time frequency component and in parallel, a step 13 of high-pass filtering and of sub-sampling by 2 which produces a coefficient [LH] which represents an intermediate frequency component.
  • the method of the invention mainly to associate a unit of configuration information for coding by 3D wavelets with the data stream described at output 7 of the conventional coder.
  • the coding configuration information ensures an optimal response to a cost criterion of the coding scheme.
  • Two modes can be implemented: - unidirectional mode, or "forward / backward" (direct / reverse).
  • the direction of motion compensation must be constant within a GOP.
  • the bidirectional mode for which all the images of the GOP are candidates for the choice of the reference image.
  • the two directions of compensation in motion can be used on either side of the reference image.
  • Figures 6 and 7 illustrate the unidirectional mode, or "forward / backward" (direct / reverse); Figures 8 and 9 illustrate the bidirectional mode.
  • FIG. 6 the decomposition of a flow of images in the unidirectional mode is shown, where only one direction of compensation is allowed per sequence of GOP images.
  • Each image is represented in the time domain by a vertical line.
  • the image stream is separated in the time sequence of the images from left to right into three sequences of GOP images which are designated successively in time by GOP1, GOP2 and GOP3.
  • the number of images in each sequence GOP1, GOP2, GOP3, ... is linked to an increase constraint in the number of pixels not connected by GOP.
  • the choice of the reference image R, marked by a strong line is carried out according to a given criterion. Several examples of criteria are given below.
  • a first criterion is the minimization of the number of pixels not connected in the GOP. In this case, we calculate the number pixels not connected in the GOP for each of the two directions of compensation in motion. We then choose the direction and the reference image which minimize the number of unconnected pixels for the entire GOP.
  • a second criterion is the minimization of the amplitude of the movement. In this case, the amplitude of the movement in the whole of the GOP is measured for each of the two directions, for example by calculating the sum of the squares of the components of each movement vector of each field. Then we choose the direction and the reference image which presents the minimum amplitude of movement.
  • a third criterion is the wealth of information in the reference image.
  • the texture information of the first and of the last image is measured by the amplitude of the high frequencies of their respective wavelet decomposition, and the richest is chosen as the reference image.
  • the image sequences in the image stream are defined as follows in the following table: Sequence Size Reference image Direction
  • GOP1 4 images Last image "backward”
  • GOP2 8 images Last image "backward"
  • GOP3 4 images First “forward” image
  • FIG. 7 an embodiment of the method of the invention has been represented, in the unidirectional mode, using the minimization of the number of unconnected pixels.
  • the identified steps can each be executed on an identifiable processor or part of an identifiable processor in the form of a process execution circuit and an implementation device is directly derived therefrom.
  • a stream of images is acquired and transmitted to a step 21 for estimating the movement in the positive direction between images and concurrently to a step 22 for estimating the movement in the negative direction between images. Then, the construction of the trajectories of the movement points is carried out during steps 24 for the estimation of direct movement 21 and 25 for the estimation of reverse movement 22.
  • step 26 the calculation of the number of unconnected pixels is carried out during a step 26 for the construction of trajectories of step 24 and 27 for the construction of trajectories of step 25.
  • step 28 the best direction of motion compensation is chosen in step 28 to produce in step 29 the bit stream representative of the spatial transform of the GOP image sequence thus adapted.
  • step 28 The choice of the best direction of motion compensation is carried out in step 28 by the smallest of the numbers of unconnected pixels noted in step 26 or in step 27. It is noted that if the positive direction is detected as minimizing the number of unconnected pixels, the reference image chosen is the last of the GOP image sequence being adapted. Conversely, if the negative direction is detected as minimizing the number of unconnected pixels, the reference image chosen is the first of the GOP image sequence being adapted.
  • the invention can be extended by allowing all the images of the GOP to be candidates for the choice of the reference image. It is the bidirectional mode. The two directions of temporal decomposition can then be retained for the same sequence of GOP images, on either side of the reference image.
  • each GOP sequence has one or two directions of decomposition S and S '.
  • the reference image is determined within the GOP sequence.
  • the choice of the reference image R can be made according to the same criteria as in the unidirectional mode, that is to say the minimization of the number of pixels not connected on the whole of the GOP, the minimization range of motion across the GOP, and the choice of image
  • an embodiment of the method of the invention is represented in the bidirectional mode, that is to say when all the images of the GOP are candidates for the choice of the reference image, with the criterion of minimization. the number of unconnected pixels.
  • the identified steps can each be executed on an identifiable processor or part of the identifiable processor in the form of a process execution circuit and an implementation device is directly derived therefrom.
  • a stream of images is acquired and transmitted to a step 31 of estimating the movement in the positive direction between images and concurrently to a step 32 of estimating the movement in the negative direction between images.
  • a loop 33 is performed for each image of the GOP sequence being adapted during which successively a step 34 of construction of the trajectories is executed, then a step 35 of calculation of the number of unconnected pixels.
  • a step of selecting the best reference image R in the sequence of GOP images being adapted is carried out.
  • the criterion for selecting the best reference image is that of the lowest number of unconnected points.
  • the method of the invention is integrated into a video compressor-decompressor diagram using 3D wavelets.
  • the method of the invention is implemented in three separate locations which can be: - a location in which the coding step is implemented; - a place in which the state in which the binary data stream comprising the configuration information unit and the 3D wavelet coding data exists in the form of a transmission signal or else of recorded data medium; and
  • the method is integrated into an MPEG TM coding-decoding scheme. This provision is particularly relevant in the context of the implementation of the MPEG-7 standard.
  • FIG 10 there is shown a block diagram detailing an embodiment of a 3D wavelet coding device implementing the method of the invention.
  • Such a device comprises an input terminal 100 of a video data stream 106, which is connected to the input of an image group analyzer circuit 101 of which a first output terminal 107 is connected to a terminal d 'entry 109' of a circuit
  • the circuit 101 finally includes a second output terminal for continuing the 3D wavelet processing on the 3D wavelet encoder 102 proper.
  • Output terminals 110 of the encoder 102 and 1 1 1 of the generator circuit 103 are connected to corresponding inputs of a circuit 104 realizing a binary data stream FDB presented at its output 105 and which comprises according to a protocol determined a sequence:
  • the data stream thus formed can be transmitted to a new processing circuit, to a recording device or even to a transmission line.
  • FIG. 1 there is shown a block diagram detailing an embodiment of a wavelet decoding device
  • Such a device comprises an input terminal 120 connected to a discrimination circuit 121 whose output terminals 126 and 127 are respectively connected respectively to a circuit generating information for 3D decoding configuration 122 and to a wavelet decoding circuit 3D 123.
  • the discriminator 121 When the flow of binary data from the circuit of FIG. 10 is transmitted to the input terminal 120, the data is analyzed by the discriminator 121 so that, on a first output terminal 126 of the discriminator 121, are presented information characteristic of the 3D wavelet coding applied to the binary data stream.
  • the latter is then presented at the output 127 of the discriminator and loaded into the decoder 123.
  • the latter includes a configuration input terminal which receives the configuration information from a terminal 128 of the configuration information generator circuit 122 on the base of the information contained in each unit of configuration information such as the datum of the reference image, the direction of decomposition and / or the number of images of the sequence of images represented in the data stream 120.
  • a the output terminal 124 presents the sequence of decoded GOP images.
  • the present invention finds application in the field of video compression based on decomposition by 3D wavelets. It can therefore be integrated into a 3D wavelet video compressor-decompressor scheme.
  • the present invention finds application in a conventional hybrid coding scheme, and particularly in an MPEG type scheme in which the type I images and the P type images serve as reference images. In this case, the method of the invention is integrated into an MPEG coding-decoding scheme.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

La présente invention concerne un procédé de codage et/ou de décodage de groupes d'images. Selon l'invention, lors de la décomposition temporelle d'un flux d'images dans le cadre d'un traitement en ondelettes 3D, pour minimiser le nombre de pixels non connectés on adapte le nombre d'images (GOP1, GOP2, ...), le choix de l'image de référence (R) et le sens de décomposition temporelle (S) pour chaque séquence d'images de type GOP.

Description

Procédé de codage et/ou de décodage de groupes d'images
La présente invention concerne un procédé de codage et/ou de décodage de groupes d'images. L'invention s'applique dans le contexte de la compression vidéo se basant sur la décomposition par ondelettes 3D.
Dans l'état de la technique, on a déjà proposé d'utiliser la technique de la décomposition d'images par ondelettes 3D dans laquelle un groupe d'images ou GOP est décomposé selon un processus qui applique à une image à deux dimensions ou 2D une décomposition par ondelettes. Sur cette base, on effectue ensuite une compression du flux de données le long de la dimension temporelle qui joue le rôle d'une troisième dimension.
Dans l'état de la technique, le point le plus délicat se situe lors de la décomposition temporelle par ondelettes. Quand la décomposition temporelle a été effectuée, on a repéré les pixels qui sont reliés par un vecteur de mouvement dans la séquence d'images GOP. Or, on s'est aperçu que des pixels par lesquels aucun vecteur de mouvement ne passe sont manques lorsque l'on effectuer l'opération de compression le long de la dimension temporelle.
Pour résoudre ce problème et éviter de perdre de l'information lors du traitement, il faut donc appliquer un traitement particulier à ces pixels, ce qui réduit l'efficacité du traitement en ondelettes.
Dans les schémas de codage vidéo usuels , on décrit le mouvement par des blocs, de 16 pixels de large par 16 pixels de haut, par exemple. Le problème soulevé ci-dessus est alors renvoyé aux frontières des blocs. Pour résoudre ce problème, on a aussi pris en compte les trajectoires des pixels dans les deux sens de défilement de la séquence d'images : dans le sens naturel de la séquence d'images GOP et dans le sens opposé. Mais on double alors la quantité d'information de mouvement par rapport aux techniques conventionnelles.
Pour apporter remède à ces inconvénients de l'état de la technique, la présente invention consiste à choisir des données de configuration de chaque séquence et un critère optimisant permettant de réduire le nombre de pixels non connectés dans chaque séquence d'images GOP.
Il en résulte que le nombre de pixels non connectés est notablement réduit sans nécessiter plus de traitements selon une décomposition en ondelettes 3D.
En effet, la présente invention concerne un procédé de codage et/ou de décodage de séquences d'images, sur la base d'un traitement en ondelettes 3D. Le procédé de l'invention comporte une phase de codage qui comporte : - une étape pour déterminer au moins une information de configuration du codage en ondelettes 3D comme la sélection d'une image de référence pour une séquence d'images successives, sur la base d'un critère optimisant prédéterminé ; puis - une étape pour générer une unité d'informations de configuration comportant la donnée de l'image de référence pour ladite séquence d'images ; et enfin - une étape pour exécuter le codage en ondelettes 3D sur la base des dites informations de configuration, de façon à produire un flux de données codées comportant la réunion pour chaque séquence d'images d'une unité d'informations de configuration et/ou des données de codage en ondelettes 3D des images de la séquence d'images.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de décomposition par ondelettes dans au moins une image de test comme image de référence, puis une étape d'estimation de mouvement, puis une étape de détermination de l'image de la séquence d'images pour laquelle le nombre de pixels non connectés lors de l'étape d'estimation de mouvement est minimal, comme image de référence.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de détermination de l'amplitude du mouvement dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'amplitude de mouvement dans l'image est minimale, comme image de référence,
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de détermination d'une information de texture, par mesure des composantes haute fréquence, dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'information de texture est la plus riche, comme image de référence.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte aussi la détermination du nombre d'images dans ladite séquence d'images. Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte aussi la détermination d'au moins un sens de décomposition temporelle pour une séquence d'images.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration consiste :
- dans une première étape : à constituer des séquences d'images GOP d'une taille prédéterminée,
- dans une seconde étape : pour chaque séquence d'images, à sélectionner la première image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens direct ou la dernière image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens inverse selon le choix qui minimise le nombre de pixels non connectés. Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration consiste :
- dans une première étape : à constituer une séquence d'images GOP d'une taille prédéterminée, - dans une seconde étape : à exécuter le choix d'une image de référence, et en ce que le sens de décomposition temporelle est déterminé dans le sens direct pour les images de la séquence d'images qui suivent l'image de référence sélectionnée et dans le sens inverse pour les images de la séquence d'images qui précèdent l'image de référence sélectionnée.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte :
- dans le sens direct entre images : une étape d'estimation du mouvement, une étape de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape de calcul du nombre de pixels non connectés lors de l'étape de construction des trajectoires ;
- dans le sens inverse entre images : une étape d'estimation du mouvement dans le sens inverse entre images, une étape de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape de calcul du nombre de pixels non connectés lors de l'étape de construction des trajectoires ; - une étape de choix de la meilleure image de référence sur la base du plus faible nombre de pixels non connectés.
Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte :
- une étape d'estimation du mouvement dans le sens direct entre images et concurremment à une étape d'estimation du mouvement dans le sens inverse entre images ; puis
- une boucle est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape de construction des trajectoires est exécutée, puis une étape de calcul du nombre des pixels non connectés ; puis
- une étape de sélection de la meilleure image de référence dans la séquence d'images GOP en cours d'adaptation est effectuée sur la base du plus faible nombre de points non connectés.
Selon un aspect de l'invention, le procédé comporte une phase de décodage qui consiste :
- à décoder une unité d'informations de configuration déterminant des caractéristiques du codage en ondelettes 3D effectué sur un flux de données binaires donné ; puis
- à effectuer une mise à jour des circuits de traitement de décodage en ondelettes 3D ; et enfin
- à effectuer le décodage du flux de données binaires représentatives d'une séquence d'images de façon à produire en sortie au moins une séquence d'images contenues dans le flux de données binaires donné.
Selon un aspect de l'invention, le procédé est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. Selon un aspect de l'invention, le procédé est intégré à un schéma de codage-décodage MPEG™ .
La sélection d'une image de référence, à partir de laquelle est effectué le calcul du mouvement dans un GOP, le sens de la décomposition temporelle sont réalisés en fonction du nombre de pixels connectés par ce mouvement, information qui peut être combinée aux données de texture ou de mouvement du champ de vecteurs mouvement. L'efficacité de la décomposition en ondelettes 2D + T est améliorée avec le nombre de pixels connectés temporellement.
D'autres caractéristiques et avantages de la présente invention seront mieux compris à l'aide de la description et des figures annexées parmi lesquelles :
- les figures 1 à 5 sont des figures représentant les solutions de l'état de la technique, - les figures 6 à 9 représentent les différentes étapes du procédé de l'invention ;
- les figures 10 et 11 représentent des modes de réalisation particuliers de dispositifs mettant en œuvre le procédé de l'invention.
A la figure 1 , on a représenté un mode de réalisation d'un schéma de compression par ondelettes 3D selon l'état de la technique. On remarquera que ce schéma de compression par ondelettes 3D peut aussi être utilisé une fois que le procédé de l'invention aura été exécuté. On remarquera aussi que ce qui va être décrit en termes de procédé, pourrait être implémenté sous forme de blocs de traitement dans un calculateur de traitement de séquences d'images.
Lors d'une étape 1 , on réalise l'acquisition ou la synthèse d'une séquence d'images GOP, comprenant N images successives. La séquence GOP est alors transmise à une étape de décomposition par ondelettes 2 et parallèlement à une étape 3 d'estimation du mouvement entre images.
L'étape de décomposition par ondelettes comporte une étape 2a d'analyse dans le domaine temporel et une étape 2b d'analyse dans le domaine spatial (fréquences de répétition de motifs, etc.)
En pratique, dans l'état de la technique, l'étape d'estimation du mouvement 3 débute par le choix d'une image de base dans la séquence d'images GOP qui est la dernière image de la séquence. Par différences entre images, entre image_2 et image_1 , puis entre image_3 et image_2, etc. on réalise ensuite une estimation du mouvement. Quand cette estimation de mouvement a été effectuée, une information d'estimation de mouvement est transmise par une information d'estimation de mouvement 8 à l'étape 2a d'analyse dans le domaine temporel pour la décomposition par ondelettes pour exécuter une décomposition monodimensionnelle en ondelettes dans le sens du mouvement. Lors de cette décomposition par ondelettes, une séquence d'images transformées correspondant à des fréquences temporelles différentes est produite. La séquence d'images transformées en fréquences temporelles est alors traitée lors de l'étape 2b de décomposition spatiale par une transformée en ondelettes 2D.
A la fin de l'étape d'estimation de mouvements de l'étape 3 des coefficients de mouvements représentatifs des vecteurs de mouvements dans la séquence d'images GOP est transmise à une étape de codage des champs vectoriels représentatifs des mouvements dans la séquence d'images GOP.
A la fin de l'étape 2b d'analyse spatiale, des coefficients représentatifs des fréquences spatiales dans chaque image de la séquence d'images sont transmis à une entrée d'un circuit de codage entropique.
Le codage entropique effectué à l'étape 4 comporte deux phases : modélisation préalable et codage proprement dit. La modélisation permet d'attribuer des probabilités à chaque symbole se trouvant dans le flot de données à traiter. Le codage attribue à chaque symbole un mot binaire dont la longueur dépend de la probabilité associée. A cette fin, on utilise un schéma d'encodage comme le code de Huffman ou un codage arithmétique.
Les coefficients de codage issus du codage entropique 4 sont transmis à une première entrée d'une circuit de traitement de conformation de flux de données 6 dont une seconde entrée reçoit les composantes des champ vectoriels de mouvements issus de l'étape 3. L'ensemble constitue ainsi le flux de données des coefficients d'ondelettes 3D, sérialisé de façon à produire un train de données binaires 7 auquel on peut appliquer tout traitement convenable ultérieur comme un traitement de cryptage, de stockage ou de transmission.
A la figure 2, on a représenté un diagramme qui illustre une technique de transformation monodimensionnelle, dans le cas d'une séquence d'images GOP de quatre images . Le filtrage temporel est effectué le long de la trajectoire de chaque point de l'image de base qui a été choisie lors de l'étape 3 d'estimation du mouvement. Chaque image référencée figure 2 en image_1 , image_2 est représentée sous la forme sérialisée de ses pixels qui correspond au schéma classique de transformation en ondelettes monodimensionnelle. A la figure 2, la trajectoire considérée passe donc par les positions repérées respectivement x1 sur image_1 , x2 sur image_2, etc. Les flèches F1 , F2 et F3 représentent les déplacements inter-images successifs et permettent d'identifier les coefficients ondelettes correspondant à la trajectoire considérée pour l'ensemble de la séquence d'images GOP.
A la figure 3, on a représenté l'étape de décomposition en ondelettes monodimensionnelles évoquée à l'étape 2 de la figure 1 . Dans cet exemple, on considère une décomposition en deux niveaux d'un GOP de longueur 4, avec un filtrage temporel de longueur 2. Si on applique à la séquence de coefficients [x1 , x2, x3, x4] une telle décomposition, on applique d'abord une étape 10 de filtrage passe-bas et un sous échantillonnage par 2 qui produit une paire de coefficients basse fréquence [L1 , L2]. Parallèlement, on applique une étape 11 de filtrage passe-haut et un sous échantillonnage par 2 qui produit une paire de coefficients haute fréquence [H1 , H2]. Puis, sur la paire de coefficients basse fréquence [L1 , L2], on applique à nouveau une étape 12 de filtrage passe-bas et de sous échantillonnage par 2 qui produit un coefficient [LL] qui représente la composante fréquentielle temporelle la plus basse et en parallèle une étape 13 de filtrage passe-haut et de sous échantillonnage par 2 qui produit un coefficient [LH] qui représente une composante fréquentielle intermédiaire. On a ainsi obtenu un lot de quatre coefficients de transformation fréquentielle temporelle en ondelettes [LL, LH, H 1 , H2j. De plus, dans la plupart des schémas actuels de compression d'images en ondelettes 3D, le champ F2 entre les i mages 2 et 3 n'est pas estimé, et c'est avec un champ estimé entre L1 et L2 que les filtrages 12 et 13 sont effectués.
Cette transformation est effectuée pour toute trajectoire issue de l'image de référence, ce qui permet de produire des images transformées en fréquences temporelles qui sont représentées à la figure 4 et qui sont respectivement image_H1 , image_H2, image_LH et image_LL. Les quatre coefficients correspondant au point de mouvement repéré dans les images image_1 , image_2, ... de la figure 2 se retrouvent sous formes de leurs transpositions fréquentielles temporelles respectivement H1 sur image_H1 , H2 sur image_H2, LH sur image_LH et LL sur image_LL. Il en résulte que la trajectoire considérée se retrouve sur le diagramme fréquentiel temporel de la figure 4. Comme indiqué dans le préambule de la présente demande de brevet, à l'issue de la décomposition temporelle illustrée à la figure 4, des pixels par lesquels aucun vecteur de mouvement ne passe ne se voient attribué aucune valeur dans le domaine fréquentiel temporel de la Figure 5. On les appelle dans l'état de la technique des pixels non connectés. Tous les autres pixels se trouvant affectés à des vecteurs de mouvement sont correctement traités. Cependant dans la transformée finale 8, si on ne rajoute pas d'information sur les pixels non connectés marqués « X » sur le diagramme à gauche référencé « image-1 » à la figure 5, où les vecteurs de mouvement représentés qui connectent les autres pixels des diagrammes de la séquence {image_1 , image_2, image_3, image_4} n'arrivent pas, la reconstruction d'une telle séquence sera faiblement fidèle à la séquence d'images GOP de départ. Le procédé de l'invention reprend exactement les éléments de l'état de la technique tel qu'il a été défini ci-dessus. Le flux de données consiste dans un flux d'images « naturelles » comme des images produites à l'aide d'une caméra, ou comme des images produites à l'aide d'un générateur d'images de synthèse. Le procédé de l'invention principalement à associer une unité d'informations de configuration du codage par ondelettes 3D au flux de données décrit à la sortie 7 du codeur classique. Les informations de configuration du codage assurent une réponse optimale à un critère de coût du schéma de codage. Deux modes peuvent être implémentés : - le mode unidirectionnel, ou « forward/backward » (direct/inverse). Dans ce mode, le sens de la compensation en mouvement doit être constant au sein d'un GOP. Dans ce mode, seules la première et la dernière image du GOP sont candidates au choix de l'image de référence - le mode bidirectionnel , pour lequel toutes les images du GOP sont candidates au choix de l'image de référence. Dans ce mode , les deux sens de compensation en mouvement peuvent être utilisés de part et d'autre de l'image de référence.
Les figures 6 et 7 illustrent le mode unidirectionnel, ou « forward/backward » (direct/inverse) ; les figures 8 et 9 illustrent le mode bidirectionnel.
A la figure 6, on a représenté la décomposition d'un flux d'images dans le mode unidirectionnel, où un seul sens de compensation est admis par séquence d'images GOP. Chaque image est représentée dans le domaine temporel par un trait vertical. Le flux d'images est séparé dans la séquence temporelle des images de la gauche vers la droite en trois séquences d'images GOP qui sont désignées successivement dans le temps par GOP1 , GOP2 et GOP3.
Selon l'invention, le nombre d'images de chaque séquence GOP1 , GOP2, GOP3, ... est lié à une contrainte de majoration du nombre de pixels non connectés par GOP. Selon l'invention, le choix de l'image de référence R, marquée par un trait fort, est conduit selon un critère donné. Plusieurs exemples de critères sont donnés ci-dessous.
Un premier critère est la minimisation du nombre de pixels non connectés dans le GOP. Dans ce cas, on calcule le nombre de pixels non connectés dans le GOP pour chacun des deux sens de compensation en mouvement. On choisit alors le sens et l'image de référence qui minimisent le nombre de pixels non connectés pour l'ensemble du GOP . Un second critère est la minimisation de l'amplitude du mouvement. Dans ce cas, on mesure, pour chacun des deux sens l'amplitude du mouvement dans l'ensemble du GOP, par exemple en calculant la somme des carrés des composantes de chaque vecteur mouvement de chaque champ. Puis on choisit le sens et l'image de référence qui présente l'amplitude de mouvement minimale.
Un troisième critère est la richesse en information de l'image de référence. Dans ce cas, on mesure I 'information de texture de la première et de la dernière image, par l'amplitude des hautes fréquences de leur décomposition en ondelettes respective, et on choisit la plus riche comme image de référence. Dans l'exemple représenté à la figure 6, on remarque que les séquences d'images dans le flux d'images sont définies de la manière suivante dans le tableau suivant : Séquence Taille Image de référence Sens
GOP1 4 images Dernière image « backward »
GOP2 8 images Dernière image « backward »
GOP3 4 images Première image « forward »
A la figure 7, on a représenté une réalisation du procédé de l'invention, dans le mode unidirectionnel, utilisant la minimisation du nombre de pixels non connectés, Les étapes identifiées peuvent être chacune exécutées sur un processeur identifiable ou partie de processeur identifiable sous forme d'un circuit d'exécution du procédé et un dispositif de mise en œuvre en est directement dérivé.
Lors d'une étape 20, un flux d'images est acquis et transmis à une étape 21 d'estimation du mouvement dans le sens positif entre images et concurremment à une étape 22 d'estimation du mouvement dans le sens négatif entre images. Puis, on exécute la construction des trajectoires des points de mouvements lors d'étapes 24 pour l'estimation de mouvement directe 21 et 25 pour l'estimation de mouvement inverse 22.
Puis, on exécute le calcul du nombre de pixels non connectés lors d'une étape 26 pour la construction de trajectoires de l'étape 24 et 27 pour la construction de trajectoires de l'étape 25.
Enfin on choisit le meilleur sens de compensation de mouvement dans l'étape 28 pour produire à l'étape 29 le flux binaire représentatif de la transformée spatiale de la séquence d'images GOP ainsi adaptée.
Le choix du meilleur sens de compensation de mouvement est réalisé à l'étape 28 par le plus petit des nombres de pixels non connectés relevés à l'étape 26 ou à l'étape 27. On remarque que si le sens positif est détecté comme minimisant le nombre de pixels non connectés, l'image de référence choisie est la dernière de la séquence d'images GOP en cours d'adaptation. Inversement, si le sens négatif est détecté comme minimisant le nombre de pixels non connectés, l'image de référence choisie est la première de la séq uence d'images GOP en cours d'adaptation.
On peut élargir l'invention en permettant à toutes les images du GOP d'être candidates au choix de l'image de référence. C'est le mode bidirectionnel Les deux sens de décomposition temporelle peuvent être alors retenus pour une même séquence d'images GOP, de part et d'autre de l'image de référence.
A la figure 8 ; on a représenté une partie de flux d'images séparées en trois séquences d'images GOP, qui reprennent les mêmes codages que ceux expliqués à l'aide de la figure 6. Seulement, chaque séquence GOP comporte un ou deux sens de décomposition S et S'. Quand deux sens de décomposition S et S' sont prévus, l'image de référence est déterminé à l'intérieur de la séquence GOP. Dans ce mode, le choix de l'image de référence R peut être effectué suivant les mêmes critères que dans le mode unidirectionnel, c'est-à-dire la minimisation du nombre de pixels non connectés sur l'ensemble du GOP, la minimisation de l'amplitude de mouvement dans l'ensemble du GOP, et le choix de l'image
A la figure 9, on a représenté une réalisation du procédé de l'invention dans le mode bidirectionnel, c'est-à-dire quand toutes les images du GOP sont candidates au choix de l'image de référence, avec le critère de minimisation du nombre de pixels non connectés. A nouveau, les étapes identifiées peuvent être chacune exécutée sur un processeur identifiable ou partie de processeur identifiable sous forme d'un circuit d'exécution du procédé et un dispositif de mise en œuvre en est directement dérivé.
Lors d'une étape 30, un flux d'images est acquis et transmis à une étape 31 d'estimation du mouvement dans le sens positif entre images et concurremment à une étape 32 d'estimation du mouvement dans le sens négatif entre images. Puis une boucle 33 est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape 34 de construction des trajectoires est exécutée, puis une étape 35 de calcul du nombre des pixels non connectés. Puis, une étape de sélection de la meilleure image de référence R dans la séquence d'images GOP en cours d'adaptation est effectuée. Dans la figure 9, le critère de sélection de la meilleure image de référence est celui du plus faible nombre de points non connectés. Le procédé de l'invention est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. Dans une telle application, le procédé de l'invention est mis en œuvre dans trois lieux distincts qui peuvent être : - un lieu dans lequel l'étape de codage est mise en œuvre ; - un lieu dans lequel l'état dans lequel le flux de données binaires comprenant l'unité d'informations de configuration et les données de codage en ondelettes 3D existe sous forme de signal de transmission ou encore de support de données enregistrées ; et
- un lieu dans lequel l'étape de décodage est mise en œuvre.
Selon un aspect de l'invention, le procédé est intégré dans un schéma de codage-décodage MPEG™ . Cette disposition est particulièrement pertinente dans le cadre de la mise en œuvre de la norme MPEG-7.
A la figure 10, on a représenté un schéma-bloc détaillant un mode de réalisation d 'un dispositif de codage en ondelettes 3D mettant en œuvre le procédé de l'invention.
Un tel dispositif comporte une borne d'entrée 100 d'un flux de données vidéo 106, qui est reliée à l'entrée d'un circuit analyseur de groupes d'images 101 dont une première borne de sortie 107 est connectée à une borne d'entrée 109' d'un circuit
103 générateur d'unités d'informations de configuration du codage en ondelettes 3D et à une borne d'entrée 109 d'un codeur en ondelettes 3D 102 proprement dit, pour leur fournir des données de configuration définissant le traitement en ondelettes 3D à appliquer, selon le procédé de l'invention décrit ci-dessus. Le circuit 101 comporte enfin une seconde borne de sortie pour poursuivre le traitement en ondelettes 3D sur le codeur en ondelettes 3D 102 proprement dit.
Des bornes de sortie 110 du codeur 102 et 1 1 1 du circuit générateur 103 sont connectées à des entrées correspondantes d'un circuit 104 réalisant une mise en forme d'un flux de données binaires FDB présenté à sa sortie 105 et qui comporte selon un protocole déterminé une séquence :
- d'une unité d'informations de configuration du codage en ondelettes 3D associée à une séquence d'images GOP ; et - d'un flux de données binaires correspondant au résultat du codage en ondelettes 3D de la séquence d'images GOP correspondante.
Le flux de données ainsi constitué peut être transmis à un nouveau circuit de traitement, à un dispositif d'enregistrement ou encore à une ligne de transmission.
A la figure 1 1 , on a représenté un schéma bloc détaillant un mode de réalisation d'un dispositif de décodage en ondelettes
3D mettant en œuvre le procédé de l'invention. Un tel dispositif comporte une borne d'entrée 120 connectée à un circuit de discrimination 121 dont des bornes de sortie 126 et 127 sont respectivement connectées respectivement à un circuit générateur d'informations de configuration de décodage 3D 122 et à un circuit de décodage en ondelettes 3D 123. Quand le flux de données binaires issues du circuit de la figure 10 est transmis à la borne d'entrée 120, les données sont analysées par le discriminateur 121 de sorte que, sur une première borne de sortie 126 du discriminateur 121 , soient présentées des informations caractéristiques du codage en ondelettes 3D appliqué au flux de données binaires.
Ce dernier est alors présenté à la sortie 127 du discriminateur et chargé dans le décodeur 123. Ce dernier comporte une borne d'entrée de configuration qui reçoit les informations de configuration issues d'une borne 128 du circuit générateur d'informations de configuration 122 sur la base des informations contenues dans chaque unité d'informations de configuration comme la donnée de l'image de référence, le sens de décomposition et/ou le nombre d'images de la séquence d'images représentée dans le flux de données 120. A la borne de sortie 124 est présente la séquence des images GOP décodées.
La présente invention trouve application dans le domaine de la compression vidéo se basant sur la décomposition par ondelettes 3D. Elle peut donc être intégrée à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. La présente invention trouve application dans un schéma de codage hybride classique, et particulièrement dans un schéma de type MPEG dans lequel les images de type I et les images de type P servent d'images de référence. Dans ce cas le procédé de l'invention est intégré dans un schéma de codage-décodage MPEG.

Claims

REVENDICATIONS 1 - Procédé de codage et/ou de décodage de séquences d'images, sur la base d'un traitement en ondelettes 3D, caractérisé en ce qu'il comporte une phase de codage qui comporte :
- une étape pour déterminer au moins une information de configuration du codage en ondelettes 3D comme la sélection d'une image de référence pour une séquence d'images successives, sur la base d'un critère optimisant prédéterminé ; puis
- une étape pour générer une unité d'informations de configuration comportant la donnée de l'image de référence pour ladite séquence d'images ; et enfin
- une étape pour exécuter le codage en ondelettes 3D sur la base des dites informations de configuration, de façon à produire un flux de données codées comportant la réunion pour chaque séquence d'images d'une unité d'informations de configuration et/ou des données de codage en ondelettes 3D des images de la séquence d'images. 2 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de décomposition par ondelettes dans au moins une image de test comme image de référence, puis une étape d'estimation de mouvement, puis une étape de détermination de l'image de la séquence d'images pour laquelle le nombre de pixels non connectés lors de l'étape d'estimation de mouvement est minimal, comme image de référence.
3 — Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de détermination de l'amplitude du mouvement dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'amplitude de mouvement dans l'image est minimale, comme image de référence,
4 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de détermination d'une information de texture, par mesure des composantes haute fréquence, dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'information de texture est la plus riche, comme image de référence.
5 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte aussi la détermination du nombre d'images dans ladite séquence d'images. 6 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte aussi la détermination d'au moins un sens de décomposition temporelle pour une séquence d'images.
7 — Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration consiste :
- dans une première étape : à constituer des séquences d'images GOP d'une taille prédéterminée,
- dans une seconde étape : pour chaque séquence d'images, à sélectionner la première image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens direct ou la dernière image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens inverse selon le choix qui minimise le nombre de pixels non connectés.
8 - Pro cédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration consiste : - dans une première étape : à constituer une séquence d'images GOP d'une taille prédéterminée,
- dans une seconde étape : à exécuter le choix d'une image de référence, et en ce que le sens de décomposition temporelle est déterminé dans le sens direct pour les images de la séquence d'images qui suivent l'image de référence sélectionnée et dans le sens inverse pour les images de la séquence d'images qui précèdent l'image de référence sélectionnée. 9 - Procédé selon la revendication 8, caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte :
- dans le sens direct entre images : une étape (21 ) d'estimation du mouvement, une étape (24) de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape (26) de calcul du nombre de pixels non connectés lors de l'étape (24) de construction des trajectoires ;
- dans le sens inverse entre images : une étape (22) d'estimation du mouvement dans le sens inverse entre images , une étape (25) de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape (27) de calcul du nombre de pixels non connectés lors de l'étape (25) de construction des trajectoires ;
- une étape (28) de choix de la meilleure image de référence sur la base du plus faible nombre de pixels non connectés.
10 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte :
- une étape (31 ) d'estimation du mouvement dans le sens direct entre images et concurremment à une étape (32) d'estimation du mouvement dans le sens inverse entre images ; puis
- une boucle (33) est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape (34) de construction des trajectoires est exécutée, puis une étape (35) de calcul du nombre des pixels non connectés ; puis
- une étape (36) de sélection de la meilleure image de référence (R) dans la séquence d'images GOP en cours d'adaptation est effectuée sur la base du plus faible nombre de points non connectés.
1 1 - Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comporte une phase de décodage qui consiste :
- à décoder une unité d'informations de configuration déterminant des caractéristiques du codage en ondelettes 3D effectué sur un flux de données binaires donné ; puis
- à effectuer une mise à jour des circuits de traitement de décodage en ondelettes 3D ; et enfin
- à effectuer le décodage du flux de données binaires représentatives d'une séquence d'images de façon à produire en sortie au moins une séquence d'images contenues dans le flux de données binaires donné. 1 2 - Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D.
13 - Procédé selon l'une quelconque des revendications 1 à 12, caractérisé en ce qu'il est intégré à un schéma de codage- décodage MPEG ™ .
EP04785573A 2003-05-23 2004-05-12 Procede de codage et/ou de decodage de groupes d'images Withdrawn EP1636996A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0306197A FR2855356A1 (fr) 2003-05-23 2003-05-23 Procede de codage et/ou de decodage de groupe d'images
PCT/FR2004/050190 WO2004107761A1 (fr) 2003-05-23 2004-05-12 Procede de codage et/ou de decodage de groupes d'images

Publications (1)

Publication Number Publication Date
EP1636996A1 true EP1636996A1 (fr) 2006-03-22

Family

ID=33396691

Family Applications (1)

Application Number Title Priority Date Filing Date
EP04785573A Withdrawn EP1636996A1 (fr) 2003-05-23 2004-05-12 Procede de codage et/ou de decodage de groupes d'images

Country Status (9)

Country Link
US (1) US7864863B2 (fr)
EP (1) EP1636996A1 (fr)
JP (1) JP4990622B2 (fr)
KR (1) KR101011894B1 (fr)
CN (1) CN100591127C (fr)
FR (1) FR2855356A1 (fr)
MY (1) MY135286A (fr)
TW (1) TWI339071B (fr)
WO (1) WO2004107761A1 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
WO2014205619A1 (fr) * 2013-06-24 2014-12-31 Intel Corporation Configuration de compression/décompression (codec) dynamique
US10846760B2 (en) * 2014-10-28 2020-11-24 Rakuten, Inc. Information processing device, information processing method, program and storage medium
KR102301232B1 (ko) 2017-05-31 2021-09-10 삼성전자주식회사 다채널 특징맵 영상을 처리하는 방법 및 장치
CN110876062B (zh) 2018-08-31 2024-07-12 三星电子株式会社 用于特征图的高速压缩处理的电子设备及其控制方法
US11996934B2 (en) * 2020-06-09 2024-05-28 Qualcomm Incorporated Broadcasting packets using network coding with feedback

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000295622A (ja) * 1999-04-02 2000-10-20 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置及びそれらのプログラムを記憶した記憶媒体
US6549673B1 (en) * 1999-10-28 2003-04-15 Lucent Technologies Inc. Wavelet-based compression of images for storage, transmission and reconstruction using hierarchical subband decomposition
CN1205818C (zh) * 2000-04-11 2005-06-08 皇家菲利浦电子有限公司 视频编码和解码方法
US6795504B1 (en) * 2000-06-21 2004-09-21 Microsoft Corporation Memory efficient 3-D wavelet transform for video coding without boundary effects
US20030202599A1 (en) * 2002-04-29 2003-10-30 Koninklijke Philips Electronics N.V. Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames
WO2004049723A1 (fr) * 2002-11-27 2004-06-10 Koninklijke Philips Electronics N.V. Procede de codage video
TWI255146B (en) * 2003-12-04 2006-05-11 Nec Corp Moving picture encoding method and device, and moving picture decoding method and device, and storage medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VAN DER SCHAAR M ET AL: "Unconstrained motion compensated temporal filtering (UMCTF) framework for wavelet video coding", PROCEEDINGS OF INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. 3, 6 April 2003 (2003-04-06) - 10 April 2003 (2003-04-10), pages III_81 - III_84, XP010639014, ISBN: 978-0-7803-7663-2 *

Also Published As

Publication number Publication date
CN100591127C (zh) 2010-02-17
WO2004107761A1 (fr) 2004-12-09
FR2855356A1 (fr) 2004-11-26
US20060233256A1 (en) 2006-10-19
JP2007503782A (ja) 2007-02-22
US7864863B2 (en) 2011-01-04
TW200509702A (en) 2005-03-01
TWI339071B (en) 2011-03-11
JP4990622B2 (ja) 2012-08-01
KR20060027796A (ko) 2006-03-28
CN1784906A (zh) 2006-06-07
MY135286A (en) 2008-03-31
KR101011894B1 (ko) 2011-02-01

Similar Documents

Publication Publication Date Title
US6597739B1 (en) Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
EP1721470A1 (fr) Procede de codage et de decodage d&#39;une sequence d&#39;images par analyse temporelle hierarchique
JP2005524352A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を用いたスケーラブルなウェーブレット・ベースの符号化
WO2006016029A1 (fr) Procede et dispositif de codage d’une sequence d’images video en coefficients de sous-bandes de frequence de differentes resolutions spatiales
WO2015059400A1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
FR2820255A1 (fr) Procedes de codage et de decodage d&#39;images, dispositifs, systemes, signaux et applications correspondants
JP2005515729A (ja) ビデオ符号化方法
FR2886787A1 (fr) Procede et dispositif de codage et de decodage d&#39;une sequence d&#39;images
FR2906093A1 (fr) Procedes et dispositifs de codage et de decodage, systeme de telecommunication et programme d&#39;ordinateur les mettant en oeuvre
EP1636996A1 (fr) Procede de codage et/ou de decodage de groupes d&#39;images
EP1600003B1 (fr) Procede de codage d&#39;une image video prenant en compte la parite relative a une composante du vecteur de mouvement
FR2887711A1 (fr) Procede de codage et decodage hierarchique
EP1766999B1 (fr) Procede et dispositif de codage d&#39;une sequence d&#39;images video
EP2920889B1 (fr) Procédé et système de transmission de données vidéo sur un canal de transmission par courants porteurs en ligne
EP1574068B1 (fr) Procede de codage d&#39;une image par ondelettes et procede de decodage correspondant
EP1202577B1 (fr) Procédé de traîtement de données vidéo
JP2006502677A (ja) 無制約及びリフティング型動き補償時間フィルタ処理のための効率的動きベクトル予測
JP2006501750A (ja) ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム
EP0762658B1 (fr) Procédé de codage de données numériques représentées par des vecteurs et procédé de décodage des données codées selon ledit procédé de codage
EP3854088A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
FR2873246A1 (fr) Procede d&#39;estimation du mouvement pour le codage d&#39;une sequence d&#39;images avec echelonnabilite spatiale et temporelle
GB2377575A (en) Tamper detection for video images
WO2007119021A2 (fr) Procede et dispositif de codage d &#39; une image
FR2891966A1 (fr) Dispositifs et procedes de codage et de decodage echelonnables de flux de donnees d&#39;images, signal, programme d&#39;ordinateur et module d&#39;adaptation de qualite d&#39;images correspondants
Bindulal et al. Adaptive scalable wavelet difference reduction method for efficient image transmission

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20051108

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: THOMSON LICENSING

17Q First examination report despatched

Effective date: 20101206

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: H04N 19/62 20140101ALI20160602BHEP

Ipc: H04N 19/61 20140101ALI20160602BHEP

Ipc: H04N 19/63 20140101AFI20160602BHEP

INTG Intention to grant announced

Effective date: 20160622

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20161103