WO2011131902A2 - Procédé d'enrichissement d'une information de mouvement et procédé de codage - Google Patents

Procédé d'enrichissement d'une information de mouvement et procédé de codage Download PDF

Info

Publication number
WO2011131902A2
WO2011131902A2 PCT/FR2011/050897 FR2011050897W WO2011131902A2 WO 2011131902 A2 WO2011131902 A2 WO 2011131902A2 FR 2011050897 W FR2011050897 W FR 2011050897W WO 2011131902 A2 WO2011131902 A2 WO 2011131902A2
Authority
WO
WIPO (PCT)
Prior art keywords
motion information
current
information
confidence
degree
Prior art date
Application number
PCT/FR2011/050897
Other languages
English (en)
Other versions
WO2011131902A3 (fr
Inventor
Joël JUNG
Julien Le Tanou
Jean-Marc Thiesse
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Publication of WO2011131902A2 publication Critical patent/WO2011131902A2/fr
Publication of WO2011131902A3 publication Critical patent/WO2011131902A3/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • a temporal prediction that is, with reference to a reference block or macroblock belonging to one or more other images.
  • the invention is based on a new and inventive approach to improve the coding of an image, allowing to take account of new information representative of a degree of confidence associated with a movement information relating to this image.
  • motion information is meant information (motion vectors or residuals) conventionally allowing the coding of an image by motion compensation from at least one reference image.
  • the current motion information corresponds to a given motion information among a set of motion information, namely the set of motion vectors or residues, available for encoding a current block, a residue corresponding to a difference between a motion vector and a predictor (the latter corresponding, for example, to a vector median motion vectors motion of the neighboring blocks of the current block, already coded).
  • the determination of the degree of confidence is carried out according to at least one predefined criterion aimed at obtaining predetermined encoding performances by the user.
  • a criterion depends on characteristics representative of the current motion information, such as:
  • the current block and a previously coded / decoded block between which the movement is performed the previously coded / decoded block belonging to the current picture or a previously coded / decoded picture.
  • the initialization value exceeds a predetermined value (for example 0.9) it is advisable to set the value of the degree of confidence to 1 in order to effectively signal the high probability of use. associated motion information.
  • a predetermined value for example 0.9
  • a criterion taking into account the proximity of at least one current image and / or at least one current block, and a number n of images and / or blocks having provided said current motion information of said current image and / or said current block; a criterion taking into account at least one motion information predictor of said current block of the current image;
  • a combination of the above criteria is implemented.
  • the step of updating the degree of confidence varies the value of the degree of confidence of the current movement information as a function of at least one criterion corresponding, for example, to the temporal activity of the sequence of images. For example, it is detected that between two successive images movement information is very different: For this purpose, it is possible to use a threshold of. temporal cohesion. Once this detection is carried out, it is then possible to reduce, in proportion to the coherence detected, the degree of confidence of the current information and also of temporally neighboring movement information, that is to say located in the images which preceded and / or will succeed the current image.
  • the motion vector (2.2) of the current motion information is consequently associated with a non-zero degree of confidence, equal to a predetermined value which may be, for example, median of the degrees of confidence associated with the motion vectors (1 , 1) and (3.3).
  • the motion information obtained for a precise encoding mode for example the inter "4x4" mode (using a coding refinement corresponding to square blocks of four pixels by four pixels), is preferred over the information of SKIP-encoded motion (for image areas with little or no motion).
  • the filtering according to a predetermined threshold consists in assigning a value of zero degree of confidence to the movement information whose occurrence frequency is for example less than three.
  • a predetermined threshold it is possible to consider a three-dimensional surface representation of the motion information, according to components (x, y) and for example a third parameter corresponding to the frequency of appearance defined above. This gives a representation with "peaks” and “hollows” whose height corresponds to the frequency of appearance.
  • the filtering thus makes it possible, depending on the performance of the encodings concerned, to reduce to zero (forming nodes) certain values of degree of motion information located in the hollow zones of the representation.
  • updating the confidence level of the current movement information automatically updates the degree of confidence of the motion information created at the periphery by expansion.
  • the determination of the confidence levels of the surrounding motion information is fine, that is to say that it is able to indicate a confidence level as one moves away from or approaches the center of the movement. structuring element.
  • said spatial transformation also takes account of at least one parameter belonging to the group comprising:
  • structuring elements of rectangular, square or diamond shape, etc., centered on said current movement information.
  • the shape and the size of the structuring element centered on the current movement information vary according to the resolution used for the estimation. movement of current motion information.
  • the structuring element chosen may have a resolution for example of the order of half or quarter of a pixel.
  • Such an enrichment device is particularly capable of implementing all the steps of the enrichment method described above.
  • such a device may furthermore comprise means for spatial expansion of the current motion information by a structuring element of given size and shape which is centered on said current motion information, delivering at least one motion information created.
  • the motion information created is spatially close to the current information.
  • the device according to the invention also comprises second determination means, according to at least one second predefined criterion, at least one degree of confidence for each created motion information and second means for association with the created motion information of information representative of the degree of confidence obtained by the second determining means.
  • such a method comprises the following steps:
  • the spatial distribution of the expected values can influence the dilation.
  • the shape and size of the structuring element centered on the current motion information varies as a function of the density, in the vicinity of the current motion information Imv c , of previously coded motion information.
  • the expansion will be all the more important, as shown in Figure 2b that the vicinity of the current motion information has a high density of previously encoded motion information.
  • the study of the temporal activity of the image sequence can also implement a representation of "temporal" motion information in the form of a histogram of "temporal" motion information.
  • a bi-prediction prediction using past and future images of the sequence as reference images
  • a filtering in the time axis, selecting information of "temporal" motion of the realized histogram.
  • L is enriched with a degree of confidence according to the enrichment method previously described in relation to FIG. gets a list of enriched movement information L e . .
  • an objective is to associate with each of the enriched motion information Imvj, including the motion information Imvi-a and Imvj-na, a unique motion information J'invi, presenting a priori an optimized coding cost.
  • each element of the starting list L that has not been associated during step 321 is processed, so that, at the end of this second association step 322, each movement information hmi from the start list L is associated with motion information to code the ⁇ m i .
  • the motion information processed during this second step is an unexpected motion information Imvfna that has not "served” an association during the first step 321.
  • the degree of confidence can also be used to optimize the coding by predictor competition described with reference to FIG.
  • the degree of confidence makes it possible to determine (421) for example the N best motion information predictors for a current block. These N motion information predictors correspond, for example, to N motion information predictors with the highest degree of confidence. It is also possible to add a motion information predictor such as the median or the centroid of N motion information predictors with the highest degree of confidence.
  • the degree of confidence also makes it possible, according to another variant illustrated in FIG. 5, to improve the coding using a fast motion estimation whose principle is based on the initialization of an intelligently chosen vector, or else the test of a number of vectors called candidate vectors.
  • the decoder decodes the information received from. the plurality of associations between Itnv motion information and information representative of degrees of confidence.
  • FIG. 6 illustrates an example of a simplified structure of an enrichment device according to one embodiment of the invention.
  • the enrichment device comprises a memory 61 constituted by a buffer memory, a processing unit 62, equipped for example with a microprocessor ⁇ , and driven by the computer program 63, implementing the method of decoding according to the invention.
  • the code instructions of the computer program 63 are for example loaded into a RAM before being executed by the processor of the processing unit 62.
  • the processing unit 62 receives as input at least a movement information.
  • the microprocessor of the processing unit 62 implements the steps of the method of enriching a motion information described above, according to the instructions of the computer program 63, to determine and associate with at least one motion information and a degree of confidence.
  • the enrichment device comprises, in addition to the buffer memory 61, a DET determination module which is adapted to determine at least one degree of confidence, said common degree of confidence, for motion information relating to a current image of an image sequence, called current motion information, according to at least one predefined feature-dependent criterion relating to said current motion information.
  • the foregoing enrichment device further comprises an ASS association module which is adapted to associate with said current movement information representative information of said current degree of confidence.

Abstract

L'invention concerne un procédé d'enrichissement (10) d'au moins une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante. Selon l'invention, un tel procédé comprend; une étape de détermination (11), d'au moins un degré de confiance pour ladite information de mouvement courante, dit degré de confiance courant, selon au moins nn critère prédéfini dépendant de caractéristiques relatives à ladite information de mouvement courante; une étape d'association (12) à ladite information de mouvement courante d'une information représentative dudit degré de confiance courant.

Description

Procédé d'enrichissement d'une information de mouvement, procédé de codage, dispositifs et programme d'ordinateur correspondants.
1. Domaine de l'invention
Le domaine de l'invention est celui du codage d'images, et notamment d'un flux vidéo constitué d'une série d'images successives.
Plus précisément, l'invention concerne les techniques de codage par prédiction mettant en œuvre le codage d'informations de mouvement relatives à une image, par exemple le codage de vecteurs mouvement, ou de résidus de mouvement.
L'invention peut notamment s'appliquer au codage vidéo mis en œuvre dans les codeurs vidéo actuels (MPEG, H.264, etc) ou à venir (ITU-T/VCEG (H.265) ou ISO/MPEG (HEVQ).
2. Art antérieur
On décrit ci-après l'art antérieur relatif à la prédiction d'images dans le domaine du codage de séquences d'images utilisant le codage de vecteurs mouvement, pour des blocs d'une image découpée en macroblocs, qui sont ensuite subdivisés en blocs. Un bloc est constitué d'un ensemble de points ou pixels, le bloc pouvant avoir une forme carrée, rectangulaire, triangle ou toutes autres formes géométriques.
Selon le standard H.264, par exemple, un macrobloc est un bloc carré de taille égale à 16x16 pixels, qui peut être redécoupé en blocs de taille 8x8, 16x8 ou 8x16, les blocs 8x8 pouvant ensuite être redécoupés en blocs de taille 4x4, 8x4 ou 4x8.
Selon les techniques connues, les macroblocs ou les blocs peuvent être codés par prédiction intra-images ou inter-images. En d'autres termes, un macrobloc ou bloc peut être codé par :
une prédiction temporelle, c'est-à-dire en référence à un bloc ou macrobloc de référence appartenant à une ou plusieurs autres images ; et/ou
une prédiction spatiale, en fonction des blocs ou macroblocs de l'image courante.
Dans le cas d'une prédiction temporelle, le standard ITU-T H.264 utilise un déplacement au sens du mouvement pour prédire un bloc ou un macrobloc à partir de son voisinage temporel. Le vecteur de mouvement est alors codé et transmis.
On connaît déjà des schémas de codage vidéo hybride, par lesquels les images sont codées en deux phases, la première étant une phase de prédiction par compensation en mouvement, suivie par une deuxième phase de codage de résidus de prédiction. L'étape de prédiction fournit des informations de mouvement utilisées pour le codage.
Cependant, un inconvénient des techniques de codage d'informations de mouvement issues de prédiction par compensation de mouvement réside dans la complexité du codage qui traite un nombre très important d'informations de mouvement.
ïï existe donc un besoin pour une nouvelle technique permettant d'offrir une optimisation du codage en termes d'organisation et de gestion de l'ensemble des informations de mouvement délivrées par les étapes de compensation de mouvement, sans dégrader les performances de codage.
3. Exposé de l'invention
L'invention propose une solution . nouvelle qui ne présente pas l'ensemble de ces inconvénients de l'art antérieur, sous la forme d'un procédé d'enrichissement d'au moins une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante.
Selon l'invention, un tel procédé comprend :
une étape de détermination, selon au moins un critère prédéfini, d'au moins un degré de confiance pour ladite information de mouvement courante, dit degré de confiance courant, selon au moins un critère prédéfini dépendant de caractéristiques relatives à l'information de mouvement courante ;
une étape d'association à ladite information de mouvement courante d'une information représentative dudit degré de confiance courant.
Ainsi, l'invention repose sur une approche nouvelle et inventive de l'amélioration du codage d'une image, permettant de tenir compte d'une information nouvelle représentative d'un degré de confiance associé à une information de mouvement relative à cette image.
Selon l'invention, ce degré de confiance est déterminé en fonction d'un critère prédéfini, et permet donc, à terme, d'améliorer la pertinence du codage.
Par « informations de mouvement », on entend des informations (vecteurs mouvement ou résidus) permettant classiquement le codage d'une image par compensation en mouvement à partir d'au moins une image de référence. Ainsi, l'information de mouvement courante correspond à une information de mouvement donnée parmi un ensemble d'informations de mouvement, à savoir l'ensemble des vecteurs mouvement ou des résidus, disponibles pour le codage d'un bloc courant, un résidu correspondant à une différence entre un vecteur mouvement et un prédicteur (ce dernier correspondant par exemple à un vecteur mouvement médian des vecteurs mouvement des blocs voisins du bloc courant, déjà codés).
Ainsi, pour un bloc courant, il y a plusieurs mformations de mouvement disponibles et le codeur selon des critères connus sélectionne une information de mouvement à coder. Chaque information de mouvement (ou au moins une d'entre elles) de l'ensemble des informations de mouvement, disponibles pour le codage d'un bloc courant, sont par exemple successivement enrichies et donc successivement considérées comme une information de mouvement courante. "
Par exemple, dans le cadre d'une estimation de mouvement ayant une fenêtre de recherche de taille .3*3 pixels, il y a, pour un bloc courant, neuf informations de mouvement, par exemple des vecteurs mouvement (0,0), (0,1), (0,2), (1,0), (1,1), (1,2), (2,0), (2,1), (2,2), chacun pouvant être enrichi selon l'invention.
Selon un autre mode de réalisation, seule une partie des informations de mouvement d'un bloc ou encore d'une image est enrichie (par exemple seulement les informations de mouvement présentant un fort mouvement selon un seuil prédéterminé).
Ainsi, dans un premier temps, le procédé selon l'invention détermine une information additionnelle pour chaque information de mouvement permettant d'établir une probabilité que ladite information de mouvement courante soit sélectionnée ou utilisée par différents modules d'un codeur vidéo. On établit en quelque sorte un « pronostic » pour une sélection ultérieure, lors du codage, d'une information de mouvement. Cette information additionnelle représentative d'un degré de confiance permet à terme une utilisation optimisée de chaque module du codeur. En effet, plus la valeur du degré de confiance sera grande, et plus le codeur sera informé de l'importance de l'information de mouvement considérée. Une information de mouvement avec un fort degré de confiance sera privilégiée par rapport à une information de mouvement associée à une valeur de degré de confiance moindre, c'est-à-dire ayant été pronostiquée comme rare.
La détermination du degré de confiance est effectuée selon au moins un critère prédéfini visant à obtenir des performances de codages prédéterminées par l'utilisateur. Un tel critère dépend de caractéristiques représentatives de l'information de mouvement courante, telles que :
la valeur de cette information de mouvement,
l'image courante et l'image précédemment codée/décodée entre lesquelles est effectué le mouvement,
le bloc courant et un bloc précédemment codé/décodé entre lesquels est effectué le mouvement, le bloc précédemment codé/décodé appartenant à l'image courante ou à une image précédemment codée/décodée.
En particulier, le critère prédéfini ne dépend pas des pixels de l'image courante, de l'image précédemment codée/décodée, du bloc courant ou du bloc précédemment codé/décodé.
Dans un deuxième temps, une fois le degré de confiance déterminé, celui-ci est associé à l'information de mouvement auquel il est relatif. En d'autres termes, chaque information de mouvement « portera » une information additionnelle avertissant chaque module de codage de sa probabilité d'utilisation. Une information représentative du degré de confiance est par exemple utilisée lorsque l'on associe un pourcentage correspondant à la probabilité d'apparition de chaque information de mouvement. Selon une variante de réalisation, un facteur multiplicatif, ou encore une information binaire correspondant au degré de confiance est utilisée.
Selon un mode de réalisation de l'invention, il est possible que seuls certains modules du codeur utilisent cette valeur de pronostic d'utilisation de l'information de mouvement. L'invention procure ainsi une information additionnelle permettant d'affiner, selon les performances désirées, le codage d'une image.
Selon un mode de réalisation de l'invention, l'étape de détermination d'un degré de confiance comprend :
une étape d'initialisation dudit degré de confiance à une valeur d'une information représentative du nombre de fois où ladite information de mouvement courante a été préalablement codée, lors du codage d'au moins une image de ladite séquence d'images et/ou d'au moins un bloc de ladite image de ladite séquence d'images, dite fréquence d'apparition ;
une étape de mise à jour dudit degré de confiance selon le ou lesdits critères prédéfinis. Ainsi, l'étape de détermination d'un degré de confiance met tout d'abord en œuvre une étape d'initialisation du degré de confiance, qui crée et donne une valeur d'initialisation au degré de confiance. Selon un mode de réalisation particulier de l'invention, on considère par exemple que la valeur d'initialisation est fonction d'une valeur représentative de la fréquence d'apparition de l'information de mouvement au cours des précédents codages effectués (codage des images précédant l'image courante et/ou codage des blocs précédant le bloc courant).
En d'autres termes, une fréquence d'apparition indique le nombre de fois où une information de mouvement a été préalablement codée, ou un ordre de grandeur du nombre de fois où elle a été préalablement codée.
On pourra par exemple considérer que la valeur d'initialisation d'un degré de confiance correspond à la fréquence d'apparition de l'information de mouvement courante divisée par la somme des fréquences d'apparition des informations de mouvement ayant été préalablement codées. On obtient ainsi selon ce mode de réalisation particulier un degré de confiance compris entre 0 et 1.
Selon ce cas particulier et en utilisant une fenêtre d'estimation de mouvement de taille 3*3 par exemple, et, pour un bloc courant, neuf vecteurs mouvement (0,0), (0,1), (0,2), (1,0), (1,1), (1,2), (2,0), (2,1), (2,2), on considère que les vecteurs mouvement (0,2), (1,0), (1,1) ont une fréquence d'apparition par exemple égale à deux car ils ont été préalablement codés deux fois, et que les autres vecteurs possibles (0,0), (0,1) (1,2), (2,0), (2,1), (2,2) ont une fréquence d'apparition nulle, car il n'ont pas encore été codés.
La fréquence d'apparition influence donc directement le degré de confiance associé à chaque information de mouvement.
Puis, dans un second temps, cette valeur du degré de confiance est mise à jour en fonction de critères prédéfinis dépendant notamment des performances de codages souhaitées.
Par exemple, selon un mode de réalisation particulier, si la valeur d'initialisation dépasse une valeur prédéterminée (par exemple 0,9) il est judicieux de fixer la valeur du degré de confiance à 1 afin de signaler efficacement la forte probabilité d'utilisation de l'information de mouvement associée.
Selon un mode de réalisation détaillé ultérieurement, la mise à jour du degré de confiance peut également prendre en compte les critères relatifs à la séquence d'images à coder, c'est-à-dire des critères étant basés, par exemple, sur l'analyse du contenu spatial et temporel de la séquence d'images et le mode de codage utilisé.
Le critère prédéfini, utilisé selon le procédé d'enrichissement de l'invention, appartient par exemple au groupe comprenant :
un critère tenant compte d'une information représentative d'une activité temporelle de ladite séquence d'images ;
un critère tenant compte d'une transformation spatiale de ladite information de mouvement courante ;
un critère tenant compte d'une information de mouvement obtenue par un calcul prédéterminé ;
un critère tenant compte de la proximité d'au moins une image courante et/ou d'au moins un bloc courant, et d'un nombre n d'images et/ou de blocs ayant fourni ladite information de mouvement courante de ladite image courante et/ou dudit bloc courant ; un critère tenant compte d'au moins un prédicteur d'information de mouvement dudit bloc courant de l'image courante ;
un critère tenant compte d'au moins un mode de codage d'au moins un bloc ayant fourni ladite information de mouvement courante de ladite image courante et/ou dudit bloc courant. Dans le cas où il est tenu compte de plusieurs critères prédéfinis, une combinaison des critères précédents est mise en œuvre.
Ainsi, selon l'invention, l'étape de mise à jour du degré de confiance fait varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'au moins un critère correspondant par exemple à l'activité temporelle de la séquence d'images. On détecte par exemple qu'entre deux images successives des informations de mouvements sont très différentes: A cet effet, on peut notamment utiliser un seuil de . cohésion temporelle. Une fois cette détection effectuée, il est alors possible de diminuer, proportionnellement à la cohérence détectée le degré de confiance de l'information courante et également des informations de mouvement temporellement voisines, c'est-à-dire situées dans les images qui ont précédé et/ou vont succéder à l'image courante.
H est également possible d'augmenter le degré de confiance des informations de mouvement spatialement voisines, c'est-à-dire d'augmenter le degré de confiance des informations de mouvement obtenues pour les blocs voisins du bloc courant, situé dans la zone en mouvement caractérisée par une faible cohésion temporelle.
Par ailleurs, l'étude de l'activité temporelle de la séquence d'images peut également mettre en œuvre une représentation des informations de mouvement temporelles sous la forme d'un histogramme des informations de mouvement temporelles. Sous cette forme, une interpolation utilisant une bi-prédiction (prédiction utilisant des images passées et futures de la séquence comme images de références) est par exemple mise en œuvre, de même qu'un filtrage, dans l'axe temporel, sélectionnant des informations de mouvement temporelles de l'histogramme réalisé.
Selon un autre mode de réalisation détaillé ultérieurement, il est possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte d'une transformation spatiale de l'information de mouvement courante.
Selon une autre variante de réalisation, il est également possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte d'une information de mouvement obtenue par un calcul prédéterminé. En d'autres termes, il est possible d'augmenter la valeur degré de confiance de l'information de mouvement courante initialisée à zéro, car n'ayant pas été préalablement codée, par une valeur de degré de confiance associée à une information de mouvement obtenue par un calcul prédéterminé. Ce calcul met par exemple en œuvre une estimation de mouvement appliquée aux blocs précédemment codés/décodés. Cette estimation de mouvement est reproductible au décodeur afin de garantir le décodage de la séquence d'images. Ce calcul peut aussi utiliser une fonction mathématique prédéterminée. Cette fonction mathématique correspond par exemple à un médian, une moyenne pondérée par la fréquence d'apparition, c'est-à-dire le barycentre, des informations de mouvement préalablement codées.
A l'issue d'un calcul mettant par exemple en œuvre une moyenne des informations de mouvement préalablement codées par rapport à l'information de mouvement courante, on obtient une information de mouvement calculée dont le degré de confiance est par exemple différent de zéro (du fait que la fréquence d'apparition de l'information de mouvement calculée est non nulle ou encore du fait que le degré de confiance a été préalablement augmenté lors du codage des images et/ou des blocs précédents). On augmente alors la valeur du degré de confiance de l'information de mouvement calculée, par une valeur prédéterminée.
Par exemple, on considère une fenêtre d'estimation de mouvement de taille 4x4 et deux vecteurs mouvement (1,1) et (3,3) ayant des fréquences d'apparition égale à deux, tous les autres vecteurs, y compris le vecteur de mouvement (2,2), ayant une fréquence d'apparition nulle. Par calcul, on obtient le vecteur mouvement (2,2) médian des vecteurs mouvement (1,1) et (3,3). Le vecteur mouvement (2,2) de l'information de mouvement courante est en conséquence associé à un degré de confiance non nul, égal à une valeur prédéterminée qui peut être, par exemple, médiane des degrés de confiance associés aux vecteurs mouvement (1,1) et (3,3).
Selon une autre variante de réalisation, il est également possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte de la proximité d'au moins une image courante et/ou d'au moins un bloc courant, et d'un nombre n d'images et/ou de blocs ayant fourni ladite information de mouvement courante dudit bloc courant. En d'autres termes, il est possible de paramétrer la taille de la « fenêtre » des informations de mouvement préalablement codées à prendre en compte. Par exemple, selon les performances visées, il est possible de se limiter à la prise en compte des informations de mouvement obtenues dans l'image précédente et dans l'image courante. A l'inverse, il est également possible de prendre en compte les informations de mouvements de dix images ou encore des dix blocs précédemment codés.
Ainsi, le degré de confiance courant est « influencé » par la proximité des informations de mouvement préalablement obtenues, et la détermination du nombre n d'images ou de blocs à prendre en compte correspond à un nombre de blocs situés à une distance maximale du bloc courant. Par exemple, si l'on retient les quatre blocs précédemment codés, ces quatre blocs correspondent aux quatre blocs les plus proches du bloc courant, selon l'ordre de codage utilisé (par exemple raster scan). Selon un autre exemple, si l'on retient l'image précédente, on utilise l'information de mouvement délivrée par le bloc « colocalisé » dans l'image précédente (c'est-à dire ayant une position correspondante au bloc courant dans l'image précédente) et ses huit blocs voisins.
Selon un autre mode de réalisation, il est également possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte d'au moins un prédicteur d'information de mouvement dudit bloc courant de l'image courante. On fera ainsi varier le degré de confiance de chaque information de mouvement suivant la distance entre chaque information de mouvement et le prédicteur du bloc courant. Cela sera aussi applicable dans le cas d'un codage par mise en compétition des prédicteurs.
Enfin, selon un autre mode de réalisation, il est possible de tenir compte du mode de codage, en faisant varier la valeur du degré de confiance de chaque information de mouvement suivant le mode de codage utilisé pour chaque bloc ayant fourni ladite information de mouvement. Ainsi l'information de mouvement obtenue pour un mode de codage précis, par exemple le mode inter « 4x4 » (utilisant un raffinement de codage correspondant à des blocs carrés de quatre pixels par quatre pixels), est privilégiée par rapport à l'information de mouvement relevant d'un codage selon un mode SKIP (pour les zones de l'image contenant peu ou pas de mouvement).
Par ailleurs, selon une autre variante de réalisation, il est également possible de prendre en compte une combinaison des critères précédemment décrits.
Selon un mode de réalisation particulier, ladite transformation spatiale de ladite information de mouvement courante appartient au groupe comprenant :
un filtrage de ladite information de mouvement courante selon un seuil prédéterminé ; une estimation d'une densité de probabilité des informations de mouvements de ladite séquence d'images ;
une transformation de morphologie mathématique de ladite information de mouvement courante mettant en œuvre:
o une dilatation de ladite information de mouvement courante, par un élément structurant de taille et de forme données qui est centré sur ladite mformation de mouvement courante, délivrant au moins une augmentation d'un degré de confiance d'une information de mouvement distincte de ladite mformation de mouvement courante, dite information de mouvement voisine, ; et/ou o une érosion de ladite information de mouvement courante, par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante, délivrant au moins une diminution d'un degré de confiance d'une information de mouvement distincte de ladite information de mouvement courante, dite information de mouvement voisine;
ladite augmentation et/ou ladite diminution du degré de confiance de ladite information . voisine tenant compte d'une proximité de ladite information de mouvement voisine avec ladite information de mouvement courante.
Les opérateurs de dilatation et d'érosion sont définis classiquement dans la théorie de la morphologie mathématique. Ils sont en particulier explicitement décris dans « Morphologie Mathématique » (Michel Schmitt, Juliette Mattioli, Masson, Paris, 1993).
Ainsi, selon cette variante, il est possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte d'une transformation spatiale de l'information de mouvement courante.
Selon une variante de réalisation, la transformation spatiale correspond à un filtrage des informations de mouvement contenues dans ladite information de mouvement courante selon un seuil prédéterminé.
Le filtrage selon un seuil prédéterminé consiste à attribuer une valeur de degré de confiance nulle aux informations de mouvement dont la fréquence d'apparition est par exemple inférieure à trois. Selon cette variante de réalisation particulière, on peut considérer une représentation surfacique tridimensionnelle des informations de mouvement, selon des composantes (x,y) et par exemple un troisième paramètre correspondant à la fréquence d'apparition définie précédemment. On obtient ainsi une représentation ayant des « pics » et des « creux », dont la hauteur correspond à la fréquence d'apparition. Le filtrage permet ainsi, selon les performances de codages visées, de diminuer jusqu'à zéro (formant des nœuds) certaines valeurs de degré d'information de mouvement situées dans les zones creuse de la représentation.
Selon une variante de réalisation, la transformation spatiale correspond à une estimation d'une densité de probabilité des informations de mouvement de ladite séquence d'images. Parmi les méthodes d'estimation de densité de probabilité connues, l'invention propose notamment de mettre en œuvre une technique statistique appelée estimation par noyau (ou encore méthode de Parzen-Rozenblatt). Cette méthode est une méthode non-paramétrique d'estimation de la densité de probabilité d'une variable aléatoire. Elle se base sur un échantillon d'une population statistique et permet d'estimer la densité en tout point du support. En ce sens, cette méthode généralise astucieusement la méthode d'estimation par un histogramme. Elle est décrite en détail dans le document « Pattem Classification » (R. Duda, P. E. Hart, D. G. Stork Wiley-Interscience; 2 édition (October 2000)). Selon une variante de réalisation, la transformation spatiale correspond à une transformation de morphologie mathématique.
. Selon un aspect particulier de ladite variante, ladite transformation de- morphologie mathématique met en œuvre une dilatation « spatiale » de l'information de mouvement courante, par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante. L'information de mouvement courante est propagée par augmentation des degrés de confiance d'informations de mouvement distinctes situées au voisinage de l'information de mouvement courante. Un tel voisinage est défini par les positions d'informations de mouvement issues de l'opération de dilatation de la position de l'information de mouvement courante par un élément structurant donné.
Ainsi, on peut considérer que l'augmentation des degrés de confiance des informations de mouvement voisines de l'information de mouvement courante est une « dérivation » du degré de confiance courant obtenu lors de l'étape de détermination décrite précédemment. En effet, l'invention vise ici à propager une valeur de degré de confiance de l'information de mouvement courante aux informations de mouvement autour de celle-ci. Cette étape permet donc de signaler à chaque module du codeur, une zone plus ou moins dilatée de confiance autour de l'information de mouvement courante.
Par exemple, selon un mode de réalisation particulier de l'invention, on peut considérer que plus l'information de mouvement voisine est proche de l'information de mouvement courante, centre de l'élément structurant, plus on augmente la valeur du degré de confiance initialisé préalablement. Cette valeur est augmentée par une fraction de la valeur de degré de confiance de l'information de mouvement courante.
Par ailleurs, la mise à jour du degré de confiance de l'information de mouvement courante entraîne automatiquement la mise à jour du degré de confiance des informations de mouvement créées en périphérie par dilatation.
En outre, la détermination des degrés de confiance des informations de mouvement environnantes est fine, c'est-à-dire qu'elle est apte à indiquer une intensité de confiance selon que l'on s'éloigne ou se rapproche du centre de l'élément structurant.
Cette dilatation procure un enrichissement supplémentaire des informations de mouvement voisines de l'information de mouvement courante, (elle-même étant préalablement associée à un degré de confiance) et permet au codeur de disposer de données concernant des zones d'informations de mouvement correspondant aux éléments structurants obtenus, dont la probabilité d'utilisation est importante ou non. A l'inverse de la dilatation, on peut considérer la transformation de morphologie mathématique mettant en œuvre une érosion qui propage une diminution de degré de confiance. Ainsi, on peut considérer que la diminution des degrés de confiance des informations de mouvement voisines de l'information de mouvement courante est une « isolation » du degré de confiance courant obtenu lors de l'étape de détermination décrite précédemment. En effet, l'invention vise ici à isoler et diminuer une valeur de degré de confiance de l'information de mouvement courante. Cette étape permet donc de signaler à chaque module du codeur, , une zone plus ou moins isolée autour de l'information de mouvement courante isolée.
A terme, le codage peut donc être optimisé, du fait de la signalisation de zones d'informations de mouvement à forte ou à faible probabilité d'utilisation.
Avantageusement, ladite transformation spatiale tient compte en outre d'au moins un paramètre appartenant au groupe comprenant : .
une valeur de degré de confiance associée à ladite information de mouvement courante ; une valeur de résolution utilisée pour obtenir ladite information de mouvement courante ;
une valeur de densité d'informations de mouvement préalablement codées, lors du codage d'une image de ladite séquence d'images et/ou d'un bloc de ladite image de ladite séquence d'images, à proximité de ladite information de mouvement courante ; une combinaison des paramètres précédents.
Ainsi, le procédé selon l'invention permet de déterminer et d'associer un degré de confiance à l'information de mouvement courante en tenant compte de la nature de l'image. On obtient ainsi un raffinement de l'information de mouvement qui permet un gain en précision du codage.
En effet, selon un mode de réalisation mettant par exemple en œuvre une transformation de morphologie mathématique de type dilatation, la forme et la taille de l'élément structurant centré sur l'information de mouvement courante varient en fonction du degré de confiance de l'information de mouvement courante. Par exemple, un point avec un fort degré de confiance va se dilater, ou « s'étaler », plus massivement qu'un point de faible degré de confiance.
Parmi les formes d'éléments structurants connues et potentiellement utilisées par le procédé selon l'invention, on peut citer un élément structurant de forme rectangulaire, carrée ou encore en diamant, etc., centré sur ladite information de mouvement courante.
Selon une variante de réalisation, la forme et la taille de l'élément structurant centré sur l'information de mouvement courante varient en fonction de la résolution utilisée pour l'estimation de mouvement de l'information de mouvement courante. Ainsi, l'élément structurant choisi peut avoir une résolution par exemple de l'ordre du demi ou du quart de pixel.
Selon une autre variante de réalisation, la forme et la taille de l'élément structurant centré sur l'information de mouvement courante varient en fonction de la densité, à proximité de ladite information de. mouvement courante, d'informations de mouvement préalablement codées, lors du codage d'une image de ladite séquence d'images et/ou d'un bloc de ladite image de ladite séquence d'images. La dilatation sera par exemple d'autant plus importante que le voisinage de l'information de mouvement courante présente une forte densité d'informations de mouvement préalablement codées. Selon cette variante, il est également possible de créer des -zones en fonction de la densité d'informations de mouvement, et d'appliquer systématiquement, en fonction de la zone, une forme d'élément structurant déterminée.
Une combinaison des modes de réalisation décrits précédemment est également envisageable.
Par ailleurs, les variantes de réalisation précédemment décrites sont également applicables aux autres formes de transformations spatiales précédemment citées, à savoir le filtrage ou encore l'estimation d'une densité de probabilité.
Un autre aspect de l'invention concerne un dispositif d'enrichissement d'au moins une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante. Selon l'invention un tel dispositif comprend :
des moyens de détermination d'au moins un degré de confiance pour ladite information de mouvement courante, dit degré de confiance courant, selon au moins un critère prédéfini dépendant de caractéristiques relatives à ladite information de mouvement courante ;
des moyens d'association à ladite information de mouvement courante d'une information représentative dudit degré de confiance courant.
Un tel dispositif d'enrichissement est notamment apte à mettre en œuvre l'ensemble des étapes du procédé d'enrichissement décrit précédemment.
En particulier, un tel dispositif peut en outre également comprendre des moyens de dilatation spatiale de l'information de mouvement courante par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante, délivrant au moins une information de mouvement créée. Les informations de mouvement créées sont voisines spatialement à l'information courante. En conséquence, le dispositif selon l'invention comprend également des deuxièmes moyens de détermination, selon au moins un deuxième critère prédéfini, d'au moins un degré de confiance pour chaque information de mouvement créée et des deuxièmes moyens d'association à l'information de mouvement créée d'une information représentative du degré de confiance obtenu par les deuxièmes moyens de détermination.
L'invention concerne également un procédé de codage d'au moins un bloc courant d'une . image courante d'une séquence d'images.
Selon l'invention, un tel procédé comprend les étapes suivantes :
r détermination d'au moins une information de mouvement pour ledit bloc courant ;
mise en œuvre des étapes du procédé d'enrichissement de ladite ou desdites informations de mouvement déterminées précédemment décrit, délivrant au moins une information de mouvement enrichie d'un degré de confiance ;
codage dudit bloc à partir de ladite au moins une information de mouvement enrichie. Ainsi, l'invention, selon ce mode de réalisation, permet de coder une information de mouvement de manière optimisée. En effet, l'information de mouvement porte une information nouvelle et supplémentaire indiquant sa probabilité d'être utilisée, ou sélectionnée, au moment du codage du bloc.
Ainsi, selon ce mode de réalisation de l'invention, le codage d'une image courante est optimisé car les modules du codeur ont connaissance de « l'importance » d'une information de mouvement, par rapport à Γ art antérieur.
En particulier, le degré de confiance permet notamment d'optimiser le codage utilisant le traitement d'une information de mouvement relative à une image d'une séquence d'images, de façon à délivrer au codeur, pour le codage de l'image, ou d'un bloc de l'image, une information de mouvement modifiée, dont le coût de codage est a priori optimisé par rapport à l'information de mouvement avant traitement.
Par ailleurs, le degré de confiance peut également être utilisé pour optimiser le codage par compétition de prédicteurs décrit ultérieurement.
Le degré de confiance permet également, selon une autre variante, d'améliorer le codage utilisant une estimation de mouvement rapide dont le principe est basé sur l'initialisation d'un vecteur choisi intelligemment, ou encore le test d'un certain nombre de vecteurs appelés vecteurs candidats. Une approche particulière de cette technique est notamment décrite en détail dans le document « Fast motion estimation within the H.264 codée » (H.-Y.C. Tourapis, A.M. Tourapis, Multimedia and Expo, IEEE International Conférence on, vol. 3, pp. 517-520, 2003 International Conférence on Multimedia and Expo - Volume 3 (ICME Ό3), 2003).
Selon l'invention, une autre approche de cette technique est proposée, dans laquelle le degré de confiance permet de réduire la taille de l'espace des vecteurs candidats aux N vecteurs ayant le degré de confiance le plus élevé. La valeur N sera d'autant plus faible que l'on souhaite avoir une estimation de mouvement plus rapide.
Selon un mode de réalisation particulier, le procédé de codage précédemment décrit met en œuvre les étapes suivantes :
- détermination d'une liste d'informations de mouvement contenant au moins une information de mouvement pour ledit bloc courant ;
enrichissement de chaque information de mouvement de ladite liste délivrant une liste d'informations de mouvement enrichies d'un degré de confiance ;
- détermination, à partir de ladite liste d'informations de mouvement enrichies, d'au moins deux prédicteurs d'information de mouvement selon un seuil prédéterminé dudit degré de confiance ;
codage par compétition desdits prédicteurs d'information de mouvement déterminés. Selon ce mode de codage, utilisant un codage par compétition de prédicteurs (MV- COMP) notamment décrit dans le document « RD Optimized Coding for Motion Vector Predictor Sélection » (G. Laroche, J. Jung, B. Pesquet-Popescu, ΓΕΕΕ Transactions on Circuits and Systems for Video Technology, Vol. 18, No. 9. 1247-1257 (September 2008)), le degré de confiance permet d'ajouter par exemple les N meilleurs prédicteurs d'information de mouvement pour un bloc courant. Ces N prédicteurs d'information de mouvement correspondent par exemple aux N prédicteurs d'information de mouvement ayant le degré de confiance le plus élevé. On peut également ajouter un prédicteur d'information de mouvement comme le médian ou encore le barycentre des N prédicteurs d'information de mouvement ayant le degré de confiance le plus élevé.
Par ailleurs, de manière classique, une information représentative du prédicteur d'information de mouvement utilisé pour le codage par compétition desdits prédicteurs d'information de mouvement déterminés grâce au degré de confiance, est insérée dans le signal codé à transmettre. Cette information représentative prend classiquement la forme d'un index.
Un autre aspect de l'invention concerne un dispositif de codage d'au moins un bloc courant d'une image courante d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :
des moyens de détermination d'au moins une information de mouvement pour ledit bloc courant ;
des moyens de mise en œuvre des étapes du procédé d'enrichissement de ladite ou desdites informations de mouvement déterminées précédemment décrit, délivrant au moins une information de mouvement enrichie ;
des moyens de codage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
Un tel dispositif de codage est notamment apte à mettre en œuvre le procédé de codage décrit précédemment.
L'invention concerne également un procédé de décodage d'au moins un bloc courant d'une image courante d'une séquence d'images.
Selon l'invention, un tel procédé comprend les étapes suivantes :
détermination d'au moins une information de mouvement pour ledit bloc courant ; mise en œuvre des étapes du procédé d'enrichissement, décrit précédemment, de ladite ou desdites informations de mouvement déterminées, délivrant au moins une information de mouvement enrichie d'un degré de confiance ;
décodage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
Ainsi, au décodage d'un bloc, le décodeur met en œuvre les mêmes étapes que celles mises en œuvre par le codeur, c'est-à-dire qu'il met notamment en œuvre les étapes du procédé d'enrichissement précédemment décrit.
Selon un mode de réalisation, le procédé de décodage précédemment décrit, met en œuvre les étapes suivantes :
détermination d'une liste d'informations de mouvement contenant au moins une information de mouvement pour ledit bloc courant ;
enrichissement de chaque information de mouvement de ladite liste délivrant une liste d'informations de mouvement enrichies d'un degré de confiance ;
détermination, à partir de ladite liste d'informations de mouvement enrichies, d'au moins deux prédicteurs d'information de mouvement selon un seuil prédéterminé dudit degré de confiance ;
décodage d'une information représentative du prédicteur d'information de mouvement utilisé pour le codage par compétition desdits prédicteurs d'information de mouvement déterminés ;
détermination du prédicteur d'information de mouvement dudit bloc courant à partir de ladite liste d'au moins deux prédicteurs déterminés et de ladite information représentative du prédicteur d'information de mouvement décodé.
L'invention concerne également un dispositif de décodage d'au moins un bloc courant d'une image courante d'une séquence d'images comprenant les étapes suivantes : des moyens de détermination d'au moins une information de mouvement pour ledit bloc courant ;
des moyens de. mise en œuvre des moyens du dispositif d'enrichissement, décrit précédemment, de ladite ou desdites informations de mouvement déterminées, délivrant au moins une information de mouvement enrichie ;
des moyens de décodage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
Enfin l'invention concerne un programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé d'enrichissement, de codage ou de décodage tels que décrits précédemment lorsque ce programme est exécuté par un processeur.
4. Liste des figures
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :
la figure 1, illustre les principales étapes du procédé de traitement d'une information de mouvement relative à une image selon un mode de réalisation de l'invention ;
les figures 2a et 2b décrivent différents exemples d'élément structurant utilisé pour l'opération de dilatation spatiale ;
- la figure 3 illustre une utilisation du degré de confiance selon un procédé de traitement d'une information de mouvement afin de délivrer une information de mouvement modifiée, dont le coût de codage est a priori optimisé par rapport à l'information de mouvement avant traitement ;
la figure 4 illustre l'utilisation du degré de confiance selon l'invention afin d'optimiser le codage utilisant la création de prédicteurs utilisés pour un codage par compétition de prédicteurs ;
la figure 5 illustre l'utilisation du degré de confiance selon l'invention afin d'améliorer le codage utilisant une estimation de mouvement rapide ;
la figure 6 illustre un exemple de structure simplifiée d'un dispositif d'enrichissement selon un mode de réalisation de l'invention.
5. Description d'un mode de réalisation de l'invention
5.1 Principe général
Le principe général de l'invention repose sur l'utilisation d'une information nouvelle représentative d'un degré de confiance associé à une information de mouvement relative à une image.
Ainsi, l'invention permet d'obtenir une utilisation optimisée de chaque module du codeur, pour le codage d'une image, ou d'un bloc d'une image, d'une séquence d'images. En effet, plus la valeur du degré de confiance associée à l'information de mouvement est grande, et plus le codeur est informé de l'importance de l'information de mouvement considérée. Une information de mouvement avec un fort degré de confiance sera privilégiée par rapport à une information de mouvement associée à une valeur de degré de confiance moindre, c'est-à-dire ayant été pronostiquée comme rare.
On considère une information de mouvement Imv comme étant une information permettant classiquement le codage d'une image par prédiction par compensation en mouvement à partir d'au moins une image de référence.
Ainsi, une information de mouvement est par exemple un vecteur mouvement, ou un résidu de mouvement, correspondant à une différence entre un vecteur mouvement et un prédicteur (ce dernier correspondant par exemple à un vecteur mouvement médian des vecteurs mouvement des blocs voisins du bloc courant, déjà codés).
Pour ce faire, dans un premier temps, le procédé selon l'invention détermine une information additionnelle pour chaque information de mouvement potentiellement utilisable pour le codage d'une image, ou d'un bloc d'une image, permettant d'établir une probabilité que ladite information de mouvement soit sélectionnée ou utilisée par différents modules d'un codeur vidéo. On établit en quelque sorte un « pronostic » pour une sélection ultérieure, lors du codage, d'une information de mouvement.
La détermination du degré de confiance est effectuée selon au moins un critère prédéfini visant à obtenir des performances de codage prédéterminées par l'utilisateur. Un tel critère dépend de caractéristiques représentatives de l'information de mouvement courante, telles que :
la valeur de cette information de mouvement,
l'image courante et l'image précédemment codée/décodée entre lesquelles est effectué le mouvement,
le bloc courant et un bloc précédemment codé/décodé entre lesquels est effectué le mouvement, le bloc précédemment codé/décodé appartenant à l'image courante ou à une image précédemment codée/décodée.
En particulier, le critère prédéfini ne dépend pas des pixels de l'image courante, de l'image précédemment codée/décodée, du bloc courant ou du bloc précédemment codé/décodé. Le critère prédéfini prend par exemple en compte une activité temporelle de la séquence d'images, une transformation spatiale, une information de mouvement obtenue par un calcul prédéterminé, la proximité par rapport à l'image courante. et/ou le bloc courant, d'un nombre n d'images et/ou de blocs ayant fourni ladite information de mouvement courante, de l'image courante et/ou du bloc courant, ou encore un prédicteur d'informations de mouvement dudit bloc courant de l'image courante.
Dans un deuxième temps, une fois le degré de confiance déterminé, celui-ci est associé à l'information de mouvement auquel il est relatif. En d'autres termes, chaque information de mouvement « portera » une information additionnelle avertissant chaque module de codage de sa probabilité d'utilisation.
Par ailleurs, au moment du décodage d'un bloc ou d'une image, le traitement par enrichissement de l'information de mouvement selon le principe de l'invention, est également mis en œuvre, afin de décoder efficacement l'information de mouvement relative au bloc, ou à l'image, en cours de reconstruction.
5.2 Description d'un mode de réalisation
On présente maintenant, en relation avec les figures 1, 2a et 2b, les principales étapes du procédé d'enrichissement et différentes formes d'éléments structurants utilisés selon un mode de réalisation de l'invention. Un tel procédé d'enrichissement est mis en œuvre au cours d'un procédé de codage et/ou de décodage, dont des modes de réalisation sont décrits ultérieurement.
On considère dans ce mode de réalisation qu'au moins une information de mouvement relative à une image courante, appelée Jmvc, est enrichie selon le procédé d'enrichissement de l'invention illustré en figure 1.
Comme illustré en Figure 1, le procédé d'enrichissement 10 selon l'invention comprend principalement deux étapes 11 et 12.
Lors d'une première étape 1 1 de détermination, on obtient une information additionnelle pour chaque information de mouvement, appelé degré de confiance, permettant d'établir une probabilité que l'information de mouvement soit sélectionnée ou utilisée par différents modules d'un codeur vidéo.
En outre, l'étape 11 de détermination d'un degré de confiance met également en œuvre des sous-étapes d'initialisation 111 et de mise à jour (« MAJ ») 112. L'étape d'initialisation du degré de confiance crée et donne une valeur d'initialisation au degré de confiance. On considère par exemple que la valeur d'initialisation est fonction d'une valeur représentative de la fréquence d'apparition de l'information de mouvement au cours des précédents codages effectués (codage des images précédant l'image courante et/ou codage des blocs précédant le bloc courant).
En d'autres termes, la fréquence d'apparition indique le nombre de fois où une information de mouvement a été préalablement codée, ou un ordre de grandeur du nombre de fois où elle a été préalablement codée.
On pourra par exemple considérer que la valeur d'initialisation d'un degré de confiance correspond à la fréquence d'apparition de l'information de mouvement courante Imvc divisée par la somme des fréquences d'apparition des informations de mouvement ayant été préalablement codées. On obtient ainsi selon ce mode de réalisation particulier un degré de confiance compris entre 0 et 1 selon l'expression suivante :
Figure imgf000021_0001
avec çmrc le degré de confiance courant. associé à l'information de mouvement courante
Imvc,
fmvc la fréquence d'apparition de l'information de mouvement courante Imvc, et
fi la fréquence d'apparition de chaque information de mouvement ayant été préalablement codées.
La fréquence d'apparition influence donc directement le degré de confiance associé à chaque information de mouvement, dès son initialisation.
Puis, dans un second temps, cette valeur d'initialisation du degré de confiance est mise à jour en fonction d'un ou plusieurs critères prédéfinis dépendant notamment des performances de codages souhaitées.
Le critère prédéfini prend par exemple en compte une activité temporelle de la séquence d'images, une transformation spatiale, une information de mouvement obtenue par un calcul prédéterminé, la proximité par rapport à l'image courante et/ou le bloc courant, d'un nombre n d'images et/ou de blocs ayant fourni ladite information de mouvement courante de l'image courante et/ou du bloc courant, ou encore un prédicteur d'informations de mouvement dudit bloc courant de l'image courante.
Ces critères sont, selon un mode de réalisation non représenté, appliqués en cascade afin de mettre à jour le plus finement possible le degré de confiance.
Selon le mode de réalisation ici décrit à titre d'exemple, on considère un critère prédéfini tenant compte d'une transformation spatiale. En particulier, cette transformation met en œuvre une opération de morphologie mathématique telle qu'une dilatation par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante. L'information de mouvement courante îmvc est propagée par augmentation des degrés de confiance d'informations de mouvement distinctes situées dans le voisinage de ladite information de mouvement courante. Un tel voisinage est défini par les positions d'informations de mouvement issues de l'opération de dilatation de la position de l'information de mouvement courante par un élément structurant donné..
L'élément structurant choisi pour la dilatation, dont deux exemples sont représentés sur les figures 2a et 2b, est centré sur l'information de mouvement courante.
La forme et la taille de l'élément structurant sont adaptées à la résolution pixellique de l'estimation de mouvement. Par exemple l'élément structurant de la figure 2a est choisi pour une résolution de l'ordre du demi pixel, tandis que l'élément structurant de la figure 2b est choisi pour une résolution de l'ordre du quart de pixel.
Ainsi, l'augmentation des degrés de confiance des informations de mouvement voisines de l'information de mouvement courante est une « dérivation » du degré de confiance courant obtenu lors de l'étape de détermination décrite précédemment. En effet, si l'on considère les figures 2a ou 2b, le degré de confiance de l'information de mouvement courante est modifié de la façon suivante :
pour l'information de mouvement courante représentée par un point noir, le degré de confiance courant reste inchangé par rapport à l'étape d'initialisation et est égal à çmvc , pour des informations de mouvement voisines de l'information de mouvement courante, issues de la dilatation de ladite information de mouvement courante par l'élément structurant donné et telles que représentées par des points hachurés, c'est-à-dire situées sur la première couronne entourant l'information de mouvement courante, le degré de confiance est modifié tel que :
Figure imgf000022_0001
pour des informations de mouvement voisines de l'information de mouvement courante, issues de la dilatation de ladite information de mouvement courante par l'élément structurant donné et telles que représentées par des points blancs, c'est-à-dire situées sur la deuxième couronne entourant l'information de mouvement courante, le degré de confiance est modifié tel que :
Ainsi, plus l'information de mouvement voisine est proche de l'information de mouvement courante, centre de l'élément structurant, plus on augmente la valeur du degré de confiance initialisé préalablement. Cette valeur est augmentée par une fraction de la valeur de degré de confiance de l'information de mouvement courante.
En conséquence, l'invention vise ici à propager une valeur de degré de confiance de l'information de mouvement courante aux informations de mouvement autour de celle-ci. Cette étape permet donc de signaler à chaque module du codeur, une zone plus ou moins dilatée de confiance autour de l'information de mouvement courante.
Par ailleurs, la mise à jour du degré de confiance de l'information de mouvement courante entraîne automatiquement la mise à jour du degré de confiance des informations de mouvement créées en périphérie par dilatation.
Selon le mode de réalisation ici décrit mettant en œuvre une dilatation spatiale, la taille et la forme de l'élément structurant varient également en fonction du degré de confiance courant de l'information de mouvement courante.
Une information de mouvement courante présentant un fort degré de confiance va en quelque sorte s'étaler plus massivement qu'une information de mouvement ayant un faible degré de confiance, c'est-à-dire une faible fréquence d'apparition, et donc augmenter plus fortement le degré de confiance des informations de mouvement voisines. Pour cela, des seuils sont définis. Par exemple, des éléments structurants illustrés sur la figure 2a sont utilisés en dessous d'un certain degré de confiance de l'information de mouvement courante, par exemple de valeur un demi, et des éléments structurants illustrés sur la figure 2b sont utilisés pour des informations de mouvement courantes présentant un degré de confiance supérieur.
Par ailleurs, la répartition spatiale des valeurs attendues peut influencer la dilatation. En effet, la forme et la taille de l'élément structurant centré sur l'information de mouvement courante varient en fonction de la densité, à proximité de l'information de mouvement courante Imvc, d'informations de mouvement préalablement codées. La dilatation sera par exemple d'autant plus importante, telle que représentée sur la figure 2b que le voisinage de l'information de mouvement courante présente une forte densité d'informations de mouvement préalablement codées. Selon cette variante, il est également possible de créer des zones en fonction de la densité d'informations de mouvement, et d'appliquer systématiquement, en fonction de la zone, une forme d'élément structurant déterminée.
Inversement, une information de mouvement courante Imvc isolée, c'est-à-dire entourée d'informations de mouvement de fréquence d'apparition nulle, ne sera pas (ou peu) dilatée.
Selon un mode de réalisation non représenté qui peut être mis en œuvre au cours d'un procédé de codage et/ou de décodage, dont des modes de réalisation sont décrits ultérieurement, les informations de mouvement peuvent également être représentées sous la forme d'un histogramme. La mise à jour des degrés de confiance de chaque information de mouvement ainsi représentée met alors par exemple en œuvre un filtrage spatial de l'histogramme. On peut notamment appliquer un filtre bi-linéaire classique.
Selon un autre mode de réalisation non représenté qui peut être mis en œuvre au cours d'un procédé de codage et/ou de décodage, dont des modes de réalisation sont décrits ultérieurement, il est également possible, en fonction de l'activité temporelle de la scène, de défavoriser certaines informations de mouvement dites « temporelles », c'est-à-dire issues du codage et/ou décodage d'images précédentes, au profit d'informations de mouvement dites « spatiales » (c'est-à-dire issues du codage et/ou décodage des blocs précédents dans l'image courante). Ainsi, si on détecte qu'entre deux images successives les informations de mouvement sont très différentes (cela pourra être donné par un seuil définissant la cohésion temporelle), on diminuera le degré de confiance des informations de mouvement « temporelles » voisines. Cette diminution du degré de confiance pourra être proportionnelle à la cohésion temporelle détectée.
Dans le même but, on peut également augmenter le degré de confiance des informations de mouvement « spatiales » dans le cas d'une faible cohésion temporelle, de la manière suivante :
Pour l'ensemble des degrés de confiance des informations de
Figure imgf000024_0001
mouvement héritées localement, dans le cas où la zone concernée est en mouvement.
L'étude de l'activité temporelle de la séquence d'images peut également mettre en œuvre une représentation des informations de mouvement « temporelles » sous la forme d'un histogramme des informations de mouvement « temporelles ». Sous cette forme, une interpolation utilisant une bi-prédiction (prédiction utilisant des images passées et futures de la séquence comme images de référence) est par exemple mise en œuvre, de même qu'un filtrage, dans l'axe temporel, sélectionnant des informations de mouvement « temporelles » de l'histogramme réalisé.
Selon une autre mode de réalisation non représenté qui peut être mis en œuvre au cours d'un procédé de codage et/ou de décodage, dont des modes de réalisation sont décrits ultérieurement, le degré de confiance est également « influencé » par la proximité des informations de mouvement préalablement obtenues, et la détermination du nombre n d'images ou de blocs à prendre en compte correspond à un nombre de blocs situés à une distance maximale du bloc courant. Par exemple, si l'on retient les quatre blocs précédemment codés et/ou décodés, ces quatre blocs correspondent aux quatre blocs les plus proches du bloc courant, selon l'ordre de codage et/ou décodage utilisé (par exemple « raster scan »). Ainsi, dans le cas d'une scène à fort mouvement, on privilégie l'augmentation du degré de confiance des informations de mouvement des blocs voisins, en appliquant une pondération de ce degré de confiance : avec
Figure imgf000024_0002
Figure imgf000024_0003
Selon un autre mode de réalisation non représenté qui peut être mis en œuvre au cours d'un procédé de codage et/ou de décodage, dont des modes de réalisation sont décrits ultérieurement, il est également possible de faire varier la valeur du degré de confiance de l'information de mouvement courante en fonction d'un critère tenant compte d'au moins un prédicteur d'information de mouvement dudit bloc courant de l'image courante. Ainsi, il est possible de tenir compte du mode de codage et/ou de décodage, utilisant par exemple un codage et/ou décodage selon un mode SKIP (pour les zones de l'image contenant peut ou pas de mouvement) ou encore un codage et/ou décodage utilisant une mise en compétition des prédicteurs.
Lors d'une deuxième étape 12 d'association, on associe le degré de confiance dc initialisé et mis à jour lors de la première étape à l'information de mouvement courante Imvc.
5.3 Description de modes de réalisation de codage
On présente maintenant, en relation avec les figures 3, 4 et 5, différents modes de réalisation d'un procédé de codage utilisant des informations de mouvement enrichies selon le procédé d'enrichissement précédemment décrit en relation avec la figure 1.
De manière générale, le procédé de codage comprend trois étapes, à savoir : la détermination
(30) d'au moins une information de mouvement L pour un bloc courant, la mise en œuvre (31) des étapes du procédé d'enrichissement RÇL) de la ou des informations de mouvement L déterminées précédemment décrit, délivrant au moins une information de mouvement enrichie Le d'un degré de confiance, le codage (32) dudit bloc à partir de ladite au moins une information de mouvement enrichie Le.
En particulier, le degré de confiance permet notamment d'optimiser le codage utilisant le traitement d'une information de mouvement relative à une image d'une séquence d'images, de façon à délivrer au codeur, pour le codage de l'image, ou d'un bloc de l'image, une information de mouvement modifiée, dont le coût de codage est a priori optimisé par rapport à l'information de mouvement avant traitement, comme illustré selon la figure 3.
Cette technique de modification d'une information de mouvement, dans l'objectif de réduction du coût de codage, est notamment décrite plus en détail dans la demande de brevet n° 1053060 , déposée le même jour que la présente demande, au nom du même demandeur.
Lors d'une première étape 30 de construction d'une liste L, on répertorie toutes les informations de mouvement précédemment sélectionnées et codées lors du codage d'une ou plusieurs images précédant l'image courante et/ou lors du codage de blocs précédant le bloc courant. Ces informations de mouvement sont appelées par la suite informations de mouvement attendues, et notées Imvi-a. On intègre également dans la liste L, lors de l'étape 30, toutes les informations de mouvement potentiellement sélectionnables par le codeur, différentes des informations de mouvement hnvca, appelées informations de mouvement théoriques ou informations de mouvement non attendues, et notées îmvi-na.
Selon une étape d'enrichissement R(L) (31), chaque information dé mouvement de la liste
L est enrichie d'un degré de confiance selon le procédé d'enrichissement précédemment décrit en relation avec la figure 1. On. obtient une liste d'informations de mouvement enrichies Le. .
A partir de cette liste enrichie Le, un objectif est d'associer à chacune des informations de mouvement enrichies Imvj, comprenant les informations de mouvement Imvi-a .et Imvj-na, une unique information de mouvement J'invi, présentant a priori un coût de codage optimisé.
Ainsi, lorsque, au codage C (323), une information de mouvement hnvt est sélectionnée pour le bloc courant, selon des critères de codage connus, c'est l'information de mouvement à coder I'vmi associée selon ce mode de réalisation de l'invention qui est codée par le codeur, permettant ainsi d'optimiser le coût de codage du bloc.
Pour ce faire, une première étape d'association 321 consiste à associer, lorsque cela est possible, à toutes les informations de mouvement attendues Ivm;-a de la liste L une information de mouvement I'vmi, choisie parmi les informations de mouvement non attendues Ινmi-ηα de la liste L, ou parmi des informations de mouvement attendues Ivmr- a déjà associées lors d'une précédente itération de cette première étape d'association, de sorte que le coût de codage de I'vmi soit a priori inférieur à celui de Ινιη-ι-α. Cette optimisation du coût de codage est définie selon une première règle.
Une fois cette première étape 321 d'association effectuée, une deuxième étape 322 d'association est mise en œuvre, à partir de la liste modifiée ΖΛ
Lors de cette étape, chaque élément de la liste de départ L n'ayant pas été associé lors de l'étape 321 est traité, de façon à ce que, à la fin de cette deuxième étape d'association 322, chaque information de mouvement hmi de la liste de départ L soit associée à une information de mouvement à coder l'νmi.
Par exemple, les informations de mouvement traitées lors de cette deuxième étape sont des informations de mouvement non attendues Imvfna n'ayant pas « servi » à une association, lors de la première étape 321.
La première étape d'association 321 met en œuvre une sous-étape de sélection qui consiste tout d'abord à sélectionner, selon un critère de priorité de traitement, une information de mouvement Imvi-a de la liste L à traiter en premier. L'objectif de cette première étape d'association 321 étant une optimisation du coût de codage, il est préférable de traiter en priorité des informations de mouvement Imvi-a considérées comme présentant un plus fort potentiel d'être sélectionnées au moment du codage. Ainsi, l'information de mouvement qui sera effectivement, choisie au codage est bien associée à une information de mouvement à coder dont le coût de codage est optimisé. ,
Le critère de priorité de traitement est basé sur l'information représentative d'un degré de confiance associé aux informations de mouvement de la. liste L lors de l'étape d'enrichissement (31) précédemment effectuée. Ainsi, les informations de mouvement de la liste L ayant un fort degré de confiance peuvent être traitées en priorité, ce qui permet de leur associer des informations de mouvement à coder /'mvi optimales en terme de coût de codage.
Par ailleurs, le degré de confiance peut également être utilisé pour optimiser le codage par compétition de prédicteurs décrit en relation avec la figure 4.
Selon ce mode de réalisation, les étapes de détermination (40) et d'enrichissement R(L) (41) sont identiques au mode de réalisation décrit précédemment. Par ailleurs, l'information de mouvement correspond selon ce mode de réalisation uniquement à un vecteur mouvement.
Dans l'étape de codage 42, le degré de confiance permet de déterminer (421) par exemple les N meilleurs prédicteurs d'information de mouvement pour un bloc courant. Ces N prédicteurs d'information de mouvement correspondent par exemple aux N prédicteurs d'information de mouvement ayant le degré de confiance le plus élevé. On peut également ajouter un prédicteur d'information de mouvement comme le médian ou encore le barycentre des N prédicteurs d'information de mouvement ayant le degré de confiance le plus élevé.
Les N prédicteurs d'information de mouvement sélectionnés sont ensuite classiquement mis en compétition ( « C comp » 422), et une information représentative du prédicteur d'information de mouvement utilisé pour le codage par compétition est insérée dans le signal codé à transmettre. Cette information représentative prend classiquement la forme d'un index.
Le degré de confiance permet également, selon une autre variante illustrée par la figure 5, d'améliorer le codage utilisant une estimation de mouvement rapide dont le principe est basé sur l'initialisation d'un vecteur choisi intelligemment, ou encore le test d'un certain nombre de vecteurs appelés vecteurs candidats.
Selon ce mode de réalisation, les étapes de détermination (50) et d'enrichissement R(L)
(51) sont identiques au mode de réalisation décrit précédemment.
Le degré de confiance permet ensuite de réduire la taille de l'espace des vecteurs candidats aux Ν vecteurs ayant le degré de confiance le plus élevé utilisé par un codage C (52) utilisant une estimation de mouvement rapide (« EMR » 521). La valeur N sera d'autant plus faible que l'on souhaite avoir une estimation de mouvement plus rapide. L'objectif étant de conserver une efficacité d'estimation de mouvement acceptable tout en réalisant un gain de temps de calcul par rapport à une estimation utilisant l'ensemble des prédicteurs d'informations de mouvement (estimation «full-search »). Une fois l'estimation de mouvement rapide (« EMR » 521) effectuée, le codage C (522) du résidu de mouvement est effectué selon des critères de codage connus.
5.4 Description d'un mode de réalisation de décodage
Au décodage d'un bloc (non représenté), le décodeur met en œuvre les mêmes étapes que celle mises en œuvre par le. codeur, c'est-à-dire qu'il met en œuvre les étapes du procédé d'enrichissement décrit précédemment, de façon à obtenir une pluralité d'associations entre des informations de mouvement Imv et des informations représentatives de degrés de confiance.
Ensuite, le décodeur décode l'information reçue à partir de. la pluralité d'associations entre des informations de mouvement Itnv et des informations représentatives de degrés de confiance.
Selon un mode de réalisation utilisant un décodage d'une information préalablement codée par compétition de prédicteurs, le procédé de décodage met également en œuvre le décodage d'une information représentative du prédicteur d'information de mouvement utilisé pour le codage par compétition desdits prédicteurs d'information de mouvement déterminés grâce au degré de confiance.
5.5 Structure d'un dispositif d'enrichissement selon l'invention
La figure 6 illustre un exemple de structure simplifiée d'un dispositif d'enrichissement selon un mode de réalisation de l'invention.
Par exemple, le dispositif d'enrichissement comprend une mémoire 61 constituée d'une mémoire tampon, une unité de traitement 62, équipée par exemple d'un microprocesseur μΡ, et pilotée par le programme d'ordinateur 63, mettant en œuvre le procédé de décodage selon l'invention.
A l'initialisation, les instructions de code du programme d'ordinateur 63 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 62. L'unité de traitement 62 reçoit en entrée au moins une information de mouvement. Le microprocesseur de l'unité de traitement 62 met en œuvre les étapes du procédé d'enrichissement d'une information de mouvement décrit précédemment, selon les instructions du programme d'ordinateur 63, pour déterminer et associer à au moins une information de mouvement et un degré de confiance. Pour cela, le dispositif d'enrichissement comprend, outre la mémoire tampon 61, un module de détermination DET qui est adapté pour déterminer au moins un degré de confiance, dit degré de confiance courant, pour une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante, selon au moins un critère prédéfini dépendant de caractéristiques, relatives à ladite information de mouvement courante. Le dispositif d'enrichissement précité comprend en outre un module d'association ASS qui est adapté pour associer à ladite information de mouvement courante une information représentative dudit degré de confiance courant. Ces modules sont pilotés par le microprocesseur de l'unité de traitement 62.

Claims

REVENDICATIONS
1. Procédé d'enrichissement (10) d'au moins une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante Imvc, caractérisé en ce qu'il comprend :
une étape de détermination (11) d'au moins un degré de confiance pour ladite information de mouvement courante Imvc, dit degré de confiance courant, selon au moins un critère prédéfini dépendant de caractéristiques relatives à ladite information de mouvement courante ;
une étape d'association (12) à ladite information de mouvement courante Imvc d'une information représentative dudit degré de confiance courant.
2. Procédé d'enrichissement selon la revendication 1, caractérisé en ce que ladite étape de détermination d'un degré de confiance comprend :
une étape d'initialisation (111) dudit degré de confiance à une valeur d'une information représentative du nombre de fois où ladite information de mouvement courante Imvc a été préalablement codée, lors du codage d'au moins une image de ladite séquence d'images et/ou d'au moins un bloc de ladite image de ladite séquence d'images, dite fréquence d'apparition ;
une étape de mise à jour (112) dudit degré de confiance selon le ou lesdits critères prédéfinis.
3. Procédé selon la revendication 1, caractérisé en ce que ledit au moins un critère prédéfini appartient au groupe comprenant :
un critère tenant compte d'une information représentative d'une activité temporelle de ladite séquence d'images ;
un critère tenant compte d'une transformation spatiale de ladite information de mouvement courante ;
un critère tenant compte d'une information de mouvement obtenue par un calcul prédéterminé ;
un critère tenant compte de la proximité d'au moins une image courante et/ou d'au moins un bloc courant, et d'un nombre n d'images et/ou de blocs ayant fourni ladite information de mouvement courante Imvc de ladite image courante et/ou dudit bloc courant ;
un critère tenant compte d'au moins un prédicteur d'information de mouvement dudit bloc courant de l'image courante ; un critère tenant compte d'au moins un mode de codage d'au moins un bloc ayant fourni ladite information de mouvement courante Imvc de ladite image courante et/ou dudit bloc courant.
4. Procédé d'enrichissement selon la revendication 3, caractérisé en ce que ladite transformation spatiale de ladite information de mouvement courante lmvc appartient au groupe comprenant :
- un filtrage de ladite information de mouvement courante selon un seuil prédéterminé ; une estimation d'une densité de probabilité des informations de mouvements de ladite séquence d'images ;
une transformation de morphologie mathématique de ladite information de mouvement courante mettant en œuvre :
o une dilatation de ladite information de mouvement courante, par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante, délivrant au moins une augmentation d'un degré de confiance d'une information de mouvement distincte de ladite information de mouvement courante Itnvc, dite information de mouvement voisine ;et/ou o une érosion de ladite information de mouvement courante par un élément structurant de taille et de forme données qui est centré sur ladite information de mouvement courante, délivrant au moins une diminution d'un degré de confiance d'une information de mouvement distincte de ladite information de mouvement courante Imvc, dite information de mouvement voisine ;
ladite augmentation et/ou ladite diminution du degré de confiance de ladite information voisine tenant compte d'une proximité de ladite information de mouvement voisine avec ladite information de mouvement courante.
5. Procédé d'enrichissement selon la revendication 4, caractérisé en ce que ladite transformation spatiale tient compte en outre d'au moins un paramètre appartenant au groupe comprenant :
une valeur de degré de confiance associée à ladite information de mouvement courante ; une valeur de résolution utilisée pour obtenir de ladite information de mouvement courante ;
une valeur de densité d'informations de mouvement préalablement codées, lors du codage d'une image de ladite séquence d'images et/ou d'un bloc de ladite image de ladite séquence d'images, à proximité de ladite information de mouvement courante ; une combinaison des paramètres précédents.
6. Dispositif d'enrichissement d'au moins une information de mouvement relative à une image courante d'une séquence d'images, dite information de mouvement courante, caractérisé en ce qu'il comprend :
- des moyens (DET) de détermination d'au moins un degré de confiance pour ladite information de mouvement courante, dit degré de confiance courant, selon au moins un critère prédéfini dépendant de caractéristiques relatives à ladite information de mouvement courante ;
des moyens (ASS) d'association à ladite information de mouvement courante d'une information représentative dudit degré de confiance courant.
7. Procédé de codage d'au moins un bloc courant d'une image courante d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :
détermination (30) d'au moins une information de mouvement pour ledit bloc courant ; mise en œuvre (31) des étapes du procédé d'enrichissement de ladite ou desdites informations de mouvement déterminées selon la revendication 1, délivrant au moins une information de mouvement enrichie d'un degré de confiance ;
codage (32) dudit bloc à partir de ladite au moins une information de mouvement enrichie.
8. Procédé de codage selon la revendication 7, caractérisé en ce qu'il met en œuvre les étapes suivantes :
détermination (40) d'une liste d'information de mouvement contenant au moins une information de mouvement pour ledit bloc courant ;
enrichissement (41) de chaque information de mouvement de ladite liste délivrant une liste d'informations de mouvement enrichies d'un degré de confiance ;
- détermination (421), à partir de ladite liste d'information de mouvement enrichie, d'au moins deux prédicteurs d'information de mouvement selon un seuil prédéterminé dudit degré de confiance ;
codage par compétition (422) desdits prédicteurs d'information de mouvement déterminés.
9. Dispositif de codage d'au moins un bloc courant d'une image courante d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :
des moyens de détermination d'au moins une information de mouvement pour ledit bloc courant ; des moyens de mise en œuvre des étapes du procédé d'enrichissement de ladite ou desdites informations de mouvement déterminées selon la revendication 1, délivrant au moins une information de mouvement enrichie ;
des moyens de codage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
10. Procédé de décodage d'au moins un bloc courant d'une image courante d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :
détermination d'au moins une information de mouvement pour ledit bloc courant ;
mise en œuvre des étapes du procédé d'enrichissement, selon la revendication 1 , de ladite ou desdites informations de mouvement déterminées, délivrant au moins une information de mouvement enrichie d'un degré de confiance ;
décodage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
11. Procédé de décodage selon la revendication 10, caractérisé en qu'il met en œuvre les étapes suivantes :
détermination d'une liste d'informations de mouvement contenant au moins une information de mouvement pour ledit bloc courant ;
enrichissement de chaque information de mouvement de ladite liste délivrant une liste d'informations de mouvement enrichies d'un degré de confiance ;
détermination, à partir de ladite liste d'information de mouvement enrichie, d'au moins deux prédicteurs d'information de mouvement selon un seuil prédéterminé dudit degré de confiance ;
décodage d'une information représentative du prédicteur d'information de mouvement utilisé pour le codage par compétition desdits prédicteurs d'information de mouvement, déterminés ;
détermination du prédicteur d'information de mouvement dudit bloc courant à partir de ladite liste d'au moins deux prédicteurs déterminés et de ladite information représentative du prédicteur d'information de mouvement décodé.
12. Dispositif de décodage d'au moins un bloc courant d'une image courante d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :
des moyens de détermination d'au moins une information de mouvement pour ledit bloc courant ;
des moyens de mise en œuvre des moyens du dispositif d'enrichissement, selon la revendication 6, de ladite ou desdites informations de mouvement déterminées, délivrant au moins une information de mouvement enrichie ;
- des moyens de décodage dudit bloc à partir de ladite au moins une information de mouvement enrichie.
13. Programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé selon la revendication 1, 7 ou 10 lorsque ce programme est exécuté par un processeur.
PCT/FR2011/050897 2010-04-22 2011-04-19 Procédé d'enrichissement d'une information de mouvement et procédé de codage WO2011131902A2 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1053061 2010-04-22
FR1053061 2010-04-22

Publications (2)

Publication Number Publication Date
WO2011131902A2 true WO2011131902A2 (fr) 2011-10-27
WO2011131902A3 WO2011131902A3 (fr) 2012-01-12

Family

ID=43086459

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2011/050897 WO2011131902A2 (fr) 2010-04-22 2011-04-19 Procédé d'enrichissement d'une information de mouvement et procédé de codage

Country Status (1)

Country Link
WO (1) WO2011131902A2 (fr)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2449887A (en) * 2007-06-06 2008-12-10 Tandberg Television Asa Replacement of spurious motion vectors for video compression
WO2009032255A2 (fr) * 2007-09-04 2009-03-12 The Regents Of The University Of California Procédé, logiciel et dispositifs de traitement de vecteur de mouvement hiérarchique
JP4748191B2 (ja) * 2008-07-30 2011-08-17 ソニー株式会社 動きベクトル検出装置、動きベクトル検出方法及びプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
G. LAROCHE, J. JUNG, B. PESQUET-POPESCU: "RD Optimized Coding for Motion Vector Predictor Selection", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 18, no. 9, September 2008 (2008-09-01), pages 1247 - 1257, XP011231739, DOI: doi:10.1109/TCSVT.2008.928882
H.-Y.C. TOURAPIS, A.M. TOURAPIS: "Fast motion estimation within the H.264 codec", MULTIMEDIA AND EXPO, IEEE INTERNATIONAL CONFERENCE, vol. 3, 2003, pages 517 - 520, XP010651134
INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, vol. 3, 2003

Also Published As

Publication number Publication date
WO2011131902A3 (fr) 2012-01-12

Similar Documents

Publication Publication Date Title
EP2446628B1 (fr) Procédé de décodage d'images, dispositifs de décodage et programme d'ordinateur correspondants
EP0547696B1 (fr) Système de transmission et/ou stockage de signaux correspondant à des images texturées
Chen et al. An efficient general data hiding scheme based on image interpolation
EP0675652B1 (fr) Procédé et circuit d'estimation de mouvement entre images à deux trames entrelacées, et dispositif de codage de signaux numériques comprenant un tel circuit
EP2172024A2 (fr) Procedes et dispositifs de codage et de decodage d'une sequence d'images representee a l'aide de tubes de mouvement, produits programme d'ordinateur et signal correspondants
EP2449784A1 (fr) Prédiction d'un vecteur mouvement d'une partition d'image courante de forme géometrique ou de taille différente de celle d'au moins une partition d'image de référence voisine, codage et décodage utilisant une telle prédiction
FR3023112A1 (fr) Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes
EP2347590B1 (fr) Prediction d'une image par compensation en mouvement en avant
WO2009147224A1 (fr) Procede de codage d ' image avec synthese de texture
EP2446630B1 (fr) Codage et décodage d'une séquence d'images vidéo par zones d'image
FR2963190A1 (fr) Procede et dispositif de codage d'une sequence d'images
EP3852371A1 (fr) Prediction d'un vecteur mouvement d'une partition d'image courante pointant sur une zone de référence qui recouvre plusieurs partitions d'image de référence, codage et decodage utilisant une telle prediction
EP3490255A1 (fr) Compression intelligente de contenus vidéo grainés
EP2443835B1 (fr) Codage de vecteurs mouvement par compétition de prédicteurs
EP2377323A2 (fr) Prédiction d'images par repartionnement d'une portion de zone causale de référence, codage et decodage utilisant une telle prédiction
EP1333680A2 (fr) Procédé de traitement d'une image numérique
EP3637765A1 (fr) Optimisation d'un sous-échantillonnage intervenant avant le codage d'images en compression
EP3479572A1 (fr) Procédé de codage intra d'une image numérique et procédé de décodage correspondant
WO2011131902A2 (fr) Procédé d'enrichissement d'une information de mouvement et procédé de codage
FR2628864A1 (fr) Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images
EP1261209A2 (fr) Procédé de détection de bruit dans un flux de données vidéo codées
FR2955995A1 (fr) Procede et dispositif de traitement d'une sequence video
FR2864865A1 (fr) Procede de codage d'une sequence d'images
WO2011131903A1 (fr) Procede de traitement d'une information de mouvement et procedes de codage
EP1202577A9 (fr) Procédé de traítement de données vidéo

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11731020

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11731020

Country of ref document: EP

Kind code of ref document: A2