WO1991003797A1

WO1991003797A1 - Procede et dispositif d'estimation et de codage hierarchise du mouvement de sequences d'images

Info

Publication number: WO1991003797A1
Application number: PCT/FR1990/000628
Authority: WO
Inventors: Michel Kerdranvat
Original assignee: Thomson Consumer Electronics S.A.
Priority date: 1989-08-29
Filing date: 1990-08-24
Publication date: 1991-03-21
Also published as: JPH04501648A; FR2651399A1; DE69025392T2; US5351095A; KR920701916A; EP0441941A1; EP0441941B1; DE69025392D1; JP2968838B2; FR2651399B1; ATE134274T1; ES2084035T3

Abstract

Le procédé d'estimation de mouvement suivant l'invention calcule a priori pour l'image courante un premier champ de mouvement pour des blocs d'un premier niveau résultant d'une partition de l'image en blocs de taille dite ''maximale'', à partir d'un algorithme d'estimation symétrique, utilisant les images précédente et suivante dans la séquence pour calculer les différences intertrames déplacées, puis un second champ de mouvement pour des blocs résultant de la partition d'un bloc du premier niveau et ainsi de suite jusqu'à un niveau de blocs de taille minimale. Le champ de mouvement final résulte de la sélection des vecteurs mouvement les plus adaptés parmi ceux des différents niveaux et est directement associé à un arbre de codage ''quadtree''. L'invention s'applique aux chaînes de transmission d'images, notamment en haute définition.

Description

Procédé et dispositif d'estimation et de codage hiérarchisé du mouvement de séquences d'images

L'invention se rapporte au domaine du traitement d'images, et plus particulièrement à l'estimation de mouvement utilisée dans les chaînes de transmission d'images notamment en vue de réduire le débit d'informations, et a pour objet un procédé et, le dispositif correspondant, d'estimation et de codage hiérarchi¬ sé et du mouvement de séquences d'images.

L'information d'estimation de mouvement est de plus en plus utilisée dans toute les parties d'une chaîne de transmis¬ sion de télévision en haute définition : - au stade de la production des images ;

- au stade de la transmission des images ;

- et au stade de la réception de ces mêmes images.

Ainsi l'estimation de mouvement devient une fonction impor¬ tante dans la chaîne de transmission d'images notamment en haute définition.

Actuellement chaque équipement de la chaîne de transmis¬ sion a son propre estimateur de mouvement. Il semble donc très intéressant de prévoir un seul estimateur de mouvement, dans le studio de production, qui soit capable d'alimenter chaque équipe - ment de la chaîne de télévision haute définition. Mais comme chaque équipement ne requiert pas les mêmes caractéristiques pour l'information de mouvement, l'estimateur de mouvement uni¬ que doit avoir plusieurs sorties possibles, ou être paramétrable. L'invention a pour objet un procédé et le dispositif cor- respondant, d'estimation et de codage du mouvement, développé pour permettre le codage de séquences d'images de manière sim¬ ple, cette information de mouvement étant exactement adaptée à un codage de type "quadtree" auquel, en outre, une régulation de débit est aisément applicable. De plus, dans le but d'éviter une opération d'estimation de mouvement à la réception qui augmenterait la complexité du récepteur, cette information de mouvement peut être transmise, notamment sur une voie auxiliaire de transmission de données numériques d'assistance au décodage de séquences d'images. Plusieurs avantages résultent d'une estimation de mouvement au studio de production :

- le premier est que la complexité et donc les performan¬ ces du système d'estimation de mouvement peuvent être plus grandes au studio de production qu'elles ne pourraient l'être dans un équipement de réception ; ainsi un estimateur de mouve- ment performant et solide peut être construit ;

- le second est que, au studio de production, toutes les informations de la séquence d'images à coder sont disponibles et que l'estimation de mouvement est donc plus performante ;

- de plus, une estimation de mouvement qui serait effec- tuée à la réception serait perturbée par le bruit de transmission.

Selon l'invention, un procédé d'estimation et de codage hiérarchisé du mouvement de séquences d'images, est caractérisé en ce qu'il consiste :

- à un premier niveau, à découper l'image courante en macroblocs de 2^P .2^P pixels et à déterminer un premier champ de vecteurs mouvement, associé à cette partition en macroblocs, en utilisant un algorithme d'estimation itératif et recursif initialise par des vecteurs mouvement estimés pour l'image précédente, - puis, à un deuxième niveau, à découper en quadrants chacun des macroblocs et à déterminer, pour les blocs qui en résultent, un second champ de vecteur de mouvement en utili¬ sant le même algorithme d'estimation mais initialise par des vecteurs du champ de mouvement estimé au niveau précédent, ètllΘ - puis à un i niveau, i = 3 à p, à découper chacun des blocs considérés au niveau i-1 en quadrants et à déterminer, pour les blocs qui en résultent, un i champ de vecteurs de mouvement en utilisant le même algorithme d'estimation initia¬ lise par des vecteurs du champ de mouvement estimés au niveau précédent, les blocs de taille minimale étant des blocs de 2 .1+1.2 ,,1+1 pi .xel ,s,

- et à déterminer un champ de vecteurs de mouvement final à partir des p champs de vecteurs de mouvement résultants en choisissant le niveau de partition le moins élevé pour lequel le vecteur mouvement associé au bloc correspondant conduit à la minimisation d'un critère traduisant les différences de luminance entre blocs se correspondant dans les images successi¬ ves par les vecteurs de déplacement estimés. L'invention sera mieux comprise et d'autres caractéristi¬ ques apparaîtront à l'aide de la description qui suit en réfé¬ rence aux figures annexées.

- La figure 1 illustre les informations utilisées classi¬ quement pour estimer un champ de mouvement ; - La figure 2 illustre les informations utilisées pour estimer un champ de mouvement selon l'invention ;

- La figure 3 illustre la décomposition d'un macrobloc en blocs plus petits suivant 5 niveaux hiérarchisés ;

- La figure 4 illustre l'enchaînement des étapes du procé- dé d'estimation de mouvement selon l'invention ;

- Les figures 5a, 5b, 5c et 5d illustrent les vecteurs déplacements des blocs du niveau supérieur retenus comme va¬ leurs initiales pour un bloc de niveau donné, selon les quatre positions possibles de ce dernier ; - La figure 6 détaille les étapes de l'estimation de mouve¬ ment à un niveau donné ;

- La figure 7 détaille les tests mis en oeuvre pour la détermination du champ de vecteurs mouvement final ;

- La figure 8 illustre l'arbre de codage associé à la décomposition illustrée par la figure 3.

Une méthode d'estimation de mouvement dans une séquence d'images précédemment décrite et utilisée est rappelée ci-après succinctement pour la commodité de la description ultérieure de l'estimation de mouvement selon l'invention. L'algorithme d'estimation de mouvement utilisé a été dé¬ crit notamment par A.N NETRAVALI et J.D. ROBBINS dans un article intitulé "Motion Compensated Télévision Coding, part. 1" tiré de "The Bell System Technical Journal", Vol. 58, n°3, March 1979.

Cet algorithme suppose que tous les éléments d'images élémentaires ou "pixels" d'un même bloc ont le même déplace¬ ment. Cet algorithme est recursif, et utilise le champ de mouve¬ ment calculé à l'itération précédente pour l'itération suivante à partir du développement de Taylor d'une quantité qui est la somme sur un bloc des différences de luminance des pixels de deux blocs de deux trames consécutives se correspondant par le déplacement estimé à l'itération précédente.

Soient : - z(x,y) les coordonnées d'un pixel z de la trame courante à l'instant t,

- I(z,t) , la valeur de luminance d'un pixel z à l'instant t,

- Grad (z,t) et Grad^(z,t) les composantes respectivement horizontale et verticale du gradient de luminance au pixel z à l'instant t,

D, . et D. les vecteurs de mouvement à deux composantes D.x et D.y, D. -x et D. ,y pour un bloc de pixels, respectivement à l'itération i et à l'itération précédente i-1 ;

- DFD(z-D._.. ,t-l) la différence inter-trames déplacée pour le pixel z, c'est-à-dire la différence entre la luminance du pixel z dans la trame courante à l'instant t, et la luminance du pixel déplacé correspondant à z dans la trame précédente (à l'instant t-1) , c'est-à-dire z déplacé du vecteur mouvement D, . calculé à l'itération précédente : DFD(z-D₁_₁, t-l)=I(z,t) -I(z-D_i_₁,t-l)

Compte-tenu de ces notations telles qu'illustrées par la figure 1, le vecteur de mouvement d'un pixel z à l'itération i,

D i.,' est déduit du vecteur de mouvement D i.-1 , à l'itération précédente i-1 par les formules suivantes où les signes de sommation ^ s'appliquent à l'ensemble des pixels z d'un bloc

D »1¹ = D rχ; il-1 _l DFDtz-D .1¹-1 ,t-l)sg(grad (z,t)) ^x ^ *2_ \ grad* (z,t) )

L'algorithme utilisé selon l'invention est dérivé de cet 5 algorithme spatio-temporel pour permettre une estimation de mouvement dite "symétrique" . En effet, comme indiqué ci-dessus, les formules rappelées conduisent à l'estimation du mouvement des blocs de la trame courante à l'itération i à partir des mouvements estimés pour les mêmes blocs à l'itération i-1 et en

10 calculant les différences de luminance entre le bloc courant et le bloc correspondant après déplacement dans la trame précé¬ dente . . _

Une estimation de mouvement "symétrique" selon l'invention utilise, pour l'estimation du mouvement dans une trame courante

15 à l'itération i, la trame précédant la trame courante et la trame suivante. Les gradients sont calculés dans les trames précédente et suivante et le vecteur de déplacement à l'itéra¬ tion i est alors calculé à partir du vecteur déplacement du bloc courant estimé à l'itération précédente i-1 par les équations

20 suivantes (qui tiennent compte des différences de luminance entre les pixels du bloc courant et les pixels des blocs corres¬ pondants, déplacés de ce vecteur estimé précédemment, d'une part dans la trame précédente et d'autre part dans la trame sui¬ vante) :

i _ _Di-1 llÔFD(z-D¹~¹ ,t-l).sg(grad^y(z-D^1"1 ,t-l))-DFD(z+D¹~¹ ,t-_t-l)sg(grad^y(z-_t-D^{i" 1},t+l ^{Y Y} grad^y(z-D ,t-l)+ grad^y(z+D^{i- 1},t+ir] où sg( . . . ) est la notation pour "signe de" la quantité qui suit.

Les composantes des vecteurs peuvent être des composan¬ tes non entières et une interpolation est nécessaire pour calcu- 1er la différence inter-trame déplacée, DFD, et les gradients.

Pour cela les quatre éléments d'images les plus proches de l'élé¬ ment d'image courant z sont utilisés.

La figure 2 montre la position des blocs déplacés dans la trame précédente et dans la trame suivante, correspondant à un bloc courant pour lequel le vecteur déplacement estimé à l'itéra¬ tion précédente est D de la trame précédente à la trame courante et donc -D de la trame suivante à la trame courante si l'on suppose des déplacements symétriques.

Un détail du voisinage de z-D montre que, en général le vecteur déplacement conduit à un pixel déplacé z-D (ou z+D ) ayant une position qui ne correspond pas. à des valeurs entières de x et y. En conséquence les valeurs de luminance des quatre points du voisinage de z-D (ou z+D ) , I- , I„, I„ et I . sont prises en compte pour les calculs de luminance des pixels déplacés et pour le calcul des gradients.

L'interpolation de la luminance I est bilinéaire, c'est-à-dire qu'elle est une somme pondérée de I, , I , I, et I„ .

Soient : ( = d(χ-D ) et β = d(y-D^1- ) les parties décimales y «- i des composantes selon x et y du vecteur déplacement D : I(z-D^i_1) = (l-ûC) (l-β)I₁+o((l-β)I₂+(l-o()βI₃Λ(βI₄

La même formule est appliquée pour le calcul de la luminance du pixel déplacé dans l'image suivante II((z+D ) à partir des valeurs de luminance du voisinage de z+D i-1 Les gradients sont donnés par :

avec L, , I„, I_g et I . à t-1 et de même pour les gradients en z+D à t+1. Il faut donc accéder à 4 points dans les mémoires d'image précédente (t-1) et d'image suivante (t+1) pour calculer la luminance des points déplacés et les gradients correspondants . A titre de simplification dans les notations ultérieures :

I(z-D^1_1) sera noté I(t-l) et I(z+Dⁱ⁺¹) sera noté I(t+1) et de même grad^x(z-D^i_1, t-l) sera noté grad^x(t-l) , grad^x(z+D^i_1,t+l) sera noté grad (t+1) , les composantes selon y étant notées de la même manière, et les différences intertrames déplacées étant notées DED(t-l) et DFD(t+l) .

Ce type d'algorithme d'estimation de mouvement a deux paramètres critiques : le nombre d'itérations permettant d'obte¬ nir les valeurs finales, et la taille de la fenêtre de mesure ou"bloc" : - dans le but de diminuer le nombre d'itérations nécessai¬ res pour obtenir le bon vecteur de déplacement, on utilise géné¬ ralement une récursivité spatiale ou temporelle : pour une récur- sivité spatiale, les déplacements calculés dans le voisinage causal d'un bloc courant sont les valeurs initiales pour l'itéra- tion suivante ; une récursivité spatiale nécessite donc que les calculs des déplacements utilisés comme valeurs initiales soient terminés, ce qui conduit à des difficultés dans l'implantation. Une récursivité temporelle n'est pas bien adaptée pour les fron¬ tières d'objets. En conséquence la récursivité . mise en oeuvre selon l'invention est une récursivité temporelle seulement pour l'initialisation de l'estimation de mouvement pour l'image cou¬ rante et une récursivité spatiale particulière qui permet d'envi¬ sager une parallélisation des calculs d'estimation de mouvement de l'image courante. L'algorithme d'estimation de mouvement suppose qu'une translation constante intervient pour tous les pixels compris à l'intérieur d'une fenêtre de mesure. Une solution idéale serait d'avoir une fenêtre de taille variable en fonction de la taille des zones d'images considérées : de larges fenêtres pourraient être utilisées pour des déplacements globaux, du type panorami- ^* ques ou basculements par exemple, tandis que de petites fenê^¬ tres seraient utilisées pour des éléments d'objets de tailles plus réduites.

Ce principe de classement des déplacements de manière hiérarchisée en fonction de la taille des zones en mouvement a été étudié par plusieurs auteurs, par exemple par H. BIERLING et R. THOMA dans un article intitulé "Motion compensating field interpolation using a hierachically structured displacement estimator" dans la revue -Signal Processing, 11, 1986 -387-404. En résumé, les caractéristiques principales en sont :

- au premier niveau, des fenêtres de mesure de grande taille sont utilisées pour les grands déplacements ou pour les déplacements constants de grande surface.

- d'un niveau à l'autre la taille de la fenêtre décroît et les vecteurs déplacements sont mis à jour.

- la plus petite fenêtre correspond au champ de mouvement le plus précis.

Une telle structure hiérarchisée est intéressante car elle permet d'affiner l'estimation de mouvement là où les informa- tions de mouvement ont la plus grande densité.

Généralement le champ de vecteurs mouvement résultant d'une estimation de mouvement selon l'un des algorithmes connus est formé de zones à déplacement constant ayant des tailles différentes quelconques, seulement liées au contenu de l'image. Une estimation de mouvement de type hiérarchisée classique telle que décrite ci-dessus génère des champs de mouvement correspon¬ dant donc à des blocs de tailles quelconques et le problème est alors de réunir ces différentes informations de mouvement dans le but d'obtenir pour chaque trame un champ de mouvement associé à des blocs de tailles aussi grandes que possible, cor¬ respondant à des zones à mouvement constant. En fait cette appro¬ che est proche de celle utilisée pour la construction d'un arbre de codage notamment pour un codage par quadrant ou "quad¬ tree" tel que décrit dans un article de C.A. SHAFFER et H. SAMET intitulé "Optimal quadtree construction algorithm" dans -Computer vision graphies and image processing, vol. 37, 402-419 de 1987- .

En conséquence, selon l'invention, la méthode d'estimation de mouvement hiérarchisée est utilisée pour augmenter la conver- gence de l'algorithme d'estimation de mouvement recursif, mais elle est adaptée à la décomposition en quadrants de façon à obtenir simultanément l'estimation de mouvement et le codage correspondant de cette information de mouvement, de façon opti¬ male . Pour adapter au mieux l'algorithme d'estimation de mouve- ment au codage de type "quadtree" qui sera fait ultérieurement du champ de mouvement résultant, les blocs d'un niveau sont le résultat du partage en quatre d'un bloc du niveau immédiatement supérieur comme représenté sur la figure 3 qui illustre les différentes tailles de blocs résultant de la partition. De plus la récursivité est obtenue en utilisant le champ de mouvement obtenu à un niveau donné de la hiérarchie pour calculer le champ de mouvement du niveau immédiatement inférieur ; ainsi pour les calculs à l'Intérieur d'un niveau donné, l'estimation de mouvement pour un bloc est indépendante de celle des autres blocs du voisinage au même niveau.

Ainsi un critère "a priori" est mis en oeuvre pour le calcul des vecteurs de déplacement, avec des valeurs initiales, et comme il va être expliqué plus en détails ci-après l'organisa¬ tion des niveaux et les choix des calculs effectués sont détermi- nés pour être adaptés dans toute la mesure du possible au co¬ dage ultérieur du champ de mouvement résultant. La description qui suit, faite en référence à la figure 4, précise l'enchaîne¬ ment des différentes étapes de l'estimation de mouvement et du codage associé, dans un mode de réalisation de l'invention. La taille maximale des blocs d'éléments d'image reconnue pour le codage étant 128x128 pixels et la taille minimale étant 8x8 par partages successifs de chaque bloc en 4 quadrants, le calcul a priori des vecteurs déplacement est effectué selon l'invention d'abord pour des blocs de 128.128 pixels (niveau 1) , puis de 64.64 (niveau 2) puis de 32.32 (niveau 3) , puis 16.16 (niveau 4) et enfin 8.8 pixels (niveau 5) , indépendamment du contenu de l'image. Pour l'initialisation de l'estimation pour l'image courante, les quatre valeurs initiales pour les blocs les plus grands, au premier niveau (128.128) sont nulles ou quelconques pour la première image de la séquence, puis égales aux vecteurs de mouvement des blocs 64.64 (résultant de la partition en 4 des blocs 128.128) de l'image précédente de la séquence, pour les images suivantes. Puis les quatre valeurs initiales recueillies pour un bloc de taille n.n proviennent du niveau précédent, donc à une taille de bloc 2n.2n. Ces valeurs sont les déplacements estimés pour les quatre blocs les plus proches de taille supérieure, comme représenté sur les figures 5a, 5b, 5c et 5d où les quatre vecteurs de déplacement DI, D2, D3, D4 sont retenus lors d'un partage de blocs pour le passage au niveau suivant, selon la position de ce bloc dans le bloc de taille supérieure dont il est issu ; ces positions sont marquées respectivement N pour Nord-Ouest figure 5a, NE pour Nord-Est figure 5b, S pour Sud- Ouest figure 5c et SE pour Sud-Est sur la figure 5d. Une étape du procédé d'estimation de mouvement à un niveau n est décrite plus en détails ci-après en référence à la figure 6 où on a représenté les trois mémoires (ou zones mé¬ moire) d'images (ou de trames) respectivement pour l'image sui¬ vant, M_j, (à t+1) , l'image courante M_* (à t) , et l'image précédente, M„ (à t-1) , ainsi que les valeurs de luminance des 4 pixels entourant le pixel déplacé z+D i-1 à la sortie de M. , la valeur de luminance I(t) = I(z,t) à la sortie de M„, et les valeurs de luminance des 4 pixels entourant le pixel déplacé z-D^{i_ 1} à la sortie de Mg. Une première étape de calcul par point donne les valeurs des différences intertrames déplacées et des gradients à partir des valeurs de luminance issues des mémoires et des vecteurs déplacement initiaux, par rapport à l'image précédente t-1, et par rapport à l'image suivante à t+1. L'étape suivante consiste alors à calculer les composantes du vecteur déplacement selon les formules itératives données ci-dessus, D et D après avoir calculé les sommes partielles x y des différences telles que C-A et D-B sur l'ensemble du bloc correspondant de niveau n.

Les quatre valeurs initiales pour chaque bloc courant, correspondant à des blocs du voisinage de ce bloc courant mais d'un niveau différent, c'est-à-dire de taille immédiatement supé¬ rieure, permettent d'initialiser quatre estimations de mouvement séparées pour ce bloc (une seule a été représentée) et donnent lorsque les formules itératives de l'algorithme ont convergé quatre valeurs de vecteurs mouvement mises à jour, indépendan¬ tes, qui complètent les valeurs des vecteurs des niveaux précé¬ dents . Les carrés des différences intertrames DFD intermédiaires utilisés pour les mises à jour sont calculées, stockées en mémoire et additionnées pour l'ensemble du bloc, de façon à choisir pour chaque bloc à l'issue des 4 calculs, le "meilleur" déplacement parmi les quatre nouveaux vecteurs de déplacement mis à jour, c'est-à-dire celui pour lequel la somme S des diffé- rences intertrames élevées au carré pour ce bloc est minimale. Ce meilleur vecteur constitue alors l'un des vecteurs du champ de mouvement calculé au niveau n.

A l'issue de cette phase de détermination a priori, effec¬ tuée pour chacun des blocs des différents niveaux, un champ de vecteurs de mouvement différent correspondant à chaque niveau, c'est-à-dire à chaque taille de bloc, est disponible pour déter¬ miner le champ de mouvement final adapté à la construction de l'arbre de codage, "quadtree" (voir figure 4) .

Quand la taille des blocs diminue, quelques divergences peuvent intervenir si la taille des blocs est trop petite par rapport à l'information de luminance ou à la taille de l'objet. Mais à l'inverse pour de petits objets ou des objets non rectan¬ gulaires qui ne sont pas adaptés à la décomposition initiale en gros blocs, le décomposition devient de plus en plus adaptée lorsque la taille du bloc diminue. Ainsi le vecteur déplacement correct de chaque zone peut être trouvé parmi les cinq champs de mouvement disponibles pour des tailles de blocs variant entre 128.128 et 8.8.

A ce stade, le problème est de trouver le critère qui permet de déterminer le champ de mouvement final, étape 6 fi¬ gure 4, à partir des cinq champs de mouvement ainsi calculés, avec des blocs de tailles aussi grandes que possibles, pour diminuer le débit de codage lors du codage effectué ensuite.

Comme indiqué ci-dessus à chaque niveau, la somme S sur un bloc des différences intertrames déplacées (élevées au carré) est stockée en mémoire. Ainsi pour un macrobloc de 128.128 pixels, cinq zones mémoires contiennent les différences de luminance intertrames déplacées élevées au carré, avec les vec¬ teurs de déplacement associés DV(2) à deux composantes : Au premier niveau, c'est-à-dire au niveau des macroblocs de 128.128 pixels, une valeur de somme des différences intertrames déplacées au carré S.. „_Q est stockée pour chaque bloc, ainsi que le vecteur déplacement correspondant, à 2 compo¬ santes, DV ₂g au niveau 2, chaque macrobloc ayant été partagé en 4 blocs de 64.64 pixels, 4 valeurs de sommes de différences déplacées au carré S_fi . et quatre vecteurs de dépla¬ cement correspondant à deux composantes DV_fi. sont stockés pour chacun des macroblocs ; etc . . . ; au niveau 5 , un macrobloc ayant été partagé en 256 blocs de 8.8. pixels, une valeur de somme de différences déplacées au carré, S„ et un vecteur déplacement DV_R à 2 composantes correspondant à chacun des blocs élémentaires sont stockés en mémoire, soit 256 valeurs de S„ et 256 vecteurs DV_fl à deux composantes pour un macrobloc . La détermination du champ de mouvement résultant à partir des 5 champs de mouvement calculés à ces 5 niveaux est effec¬ tuée de la manière suivante, illustrée par la figure 7 :

- Le vecteur déplacement DV.-n est affecté au macrobloc 128.128 si S_12g est plus petit ou égal à la somme des S_β4, à la somme des S„„, à la somme des S._R et à la somme des S_fl pour l'ensemble du macrobloc.

- Lorsque le vecteur mouvement DV.,„_R n'est pas alloué, l'allocation est essayée sur la base des blocs 64.64 pixels : un vecteur de déplacement V_g4 est alloué à un bloc 64.64 si la valeur S_g4 est plus petite ou égale à la somme des S„„, à somme des S_lg, et à la somme des S_Q, sommées sur le bloc correspondant 64.64.

- Si un vecteur de déplacement DV_g4 n'est pas alloué à un bloc 64.64, les vecteurs de déplacement des blocs correspondants de 32.32 éléments sont essayés et un vecteur de déplacement DV₃₂ est alloué à un bloc 32.32 pixels, si S₃„ est plus petit ou égal à la somme des S. ~ et à la somme des S_fi, respectivement sommés sur le bloc correspondant 32.32. - Si un bloc 32.32 n'a pas eu de vecteur alloué, les vec¬ teurs de déplacement des blocs 16.16 correspondants, DV--, sont essayés. Un vecteur de déplacement DVA lb est alloué à un bloc 16.16 si la valeur S_lg associée est plus petite ou égale à la somme des quatre valeurs correspondantes de niveau inférieur, S_g.

- Si un bloc 16.16 n'a pas eu de vecteur alloué, les vec¬ teurs de déplacement DV₈ du dernier niveau sont alloués aux blocs 8.8 qui le composent.

La dernière étape alors mise en oeuvre est l'étape du codage "quadtree", 7, et de régulation du débit 8 (si néces¬ saire) , comme représenté sur la figure 4. La connaissance des informations diminue le temps d'exécution de la construction de l'arbre de codage qui peut ainsi être moins coûteux si les vec¬ teurs mouvement de blocs élémentaires sont connus. De plus la régulation du débit de codage de l'information de mouvement peut être aisément faite.

Un histogramme du champ de vecteurs de déplacement résultant de l'étape précédente est établi. Les vecteurs de déplacement correspondants à- des pics de l'histogramme supé- rieurs à un seuil donné (ce seuil correspondant à une estimation de mouvement jugée correcte) sont sélectionnés . Ces vecteurs sont transmis pour chaque trame et leur nombre détermine le nombre de bits nécessaire pour qu'un mot de code puisse être affecté à chacun d'eux. Le codage "quadtree" est effectué sur la base des macroblocs 128x128, et un arbre caractérise la décomposition de chacun de ces macroblocs telle qu'elle résulte du champ de mou¬ vement final correspondant. Dans l'arbre, un noeud peut être une racine ou une feuille. Un mot de code spécial indique une ra- cine, et une feuille correspond à un vecteur de déplacement. Le débit de codage pour un arbre est égal au nombre de noeuds multiplié par le nombre de bits des mots de code : pour une image haute définition constituée de 1152 lignes ayant chacune 1440 éléments d'image ou pixels, 108 macroblocs permettent de couvrir l'ensemble de l'image.

Une procédure de régulation du débit de codage peut être aisément effectuée en éliminant les vecteurs de mouvement les moins probables ou de manière plus brutale en stoppant la divi¬ sion des blocs à la dimension minimale 16x16 par exemple. La figure 8 représente l'arbre de codage correspondant à un macrobloc décomposé comme représenté sur la figure 3. Si 15 vecteurs de déplacement différents ont été sélectionnés, il y a 16 noeuds différents, avec un mot de code spécial pour les racines ; donc 4 bits sont nécessaires ; en conséquence l'arbre, qui a 17 noeuds conduit à un nombre de bits, 17x4 = 68 bits .

La demande de brevet français n° 89 08547 au nom de la Demanderesse décrit plus en détails une procédure d'analyse du champ de mouvement et d'allocation de codes correspondant à partir des arbres de codage correspondant à la décomposition en quadrants et la régulation correspondante lorsque le débit re¬ quis est dépassé, également applicable au codage et à la régula¬ tion du champ de mouvement tel qu'il résulte du procédé d'estima¬ tion décrit ci-dessus.

Les résultats obtenus en suivant un tel procédé d'estima- tion de mouvement hiérarchisé associé à une technique de codage "quadtree" ont été évalués pour des signaux de télévision résul¬ tant d'une analyse entrelacée. L'estimation de mouvement est effectuée pour chaque trame paire, et cette information de mouve¬ ment est codée et transmise pour les trames impaires . A la récep- tion, après le décodage de l'information de mouvement, les tra¬ mes impaires sont interpolées à partir des trames paires et des informations de mouvement.

Trois types de séquences ont été testés, l'une correspon¬ dant au mouvement très rapide d'un élément d'image, une autre correspondant à une séquence d'images incluant des éléments ayant des mouvements variés, mouvements rapides et mouvements plus lents, et une séquence d'images correspondant à un zoom sur un dessin très fin. Les résultats obtenus sont compatibles avec les débits prévus dans les chaînes de télévision assistées numériquement.

Les avantages importants qui résultent du procédé d'estima¬ tion et de codage du mouvement de séquences d'images sont les suivants :

A un niveau donné le traitement d'un bloc est indépendant de celui des autres blocs et seuls les vecteurs de déplacement du voisinage défini au niveau précédent sont utilisés comme valeurs initiales. De plus la décomposition en arbres du champ de mouvement peut être construite rapidement car elle utilise une structure déjà existante à l'issue de l'estimation de mouve- ment.

Ce procédé d'estimation de mouvement est paramétrable comme requis pour être adapté aux différentes fonctions de la chaîne de transmission: En effet la taille du bloc de dimension minimale et le débit maximal sont des paramètres variables. La possibilité d'obtenir un vecteur de déplacement pour chaque pixel, c'est-à-dire un champ de vecteurs mouvement ponctuel, a même été testée. Pour cela on suppose que tous les vecteurs mouvement du champ de mouvement réel de l'image appartiennent au champ de mouvement final résultant de l'estimateur après détermination a priori des champs de mouvement des différents niveaux, c'est-à-dire qu'on n'effectue pas l'estimation à un niveau plus fin que celui des blocs 8.8. Puis, pour chaque pixel, on sélectionne dans ce champs de mouvement le vecteur qui conduit à la différence intertrames la plus faible. Ce vec- teur est alors un élément du champ de mouvement ponctuel.

Le dispositif d'estimation selon l'invention, à la portée de l'homme de l'art, n'est pas représenté puisqu'il comporte principalement des mémoires d'images de la séquence, des moyens de calcul et des mémoires de stockage pour les résultats intermé- diaires et pour les résultats finaux. Il faut cependant remar¬ quer que l'implémentation du procédé d'estimation de mouvement selon l'invention est facilitée par le fait que les calculs, pour les différents macroblocs d'une trame (typiquement 108) , puis à chaque niveau intermédiaire, peuvent être effectuées en parallèle puisque, comme indiqué ci- dessus, les calculs pour un bloc à un niveau donné n'utilisent que les valeurs déjà calcu¬ lées au niveau précédent. De même, dans un niveau donné les quatre estimations séparées effectuées pour chacun des blocs à partir de quatre valeurs initiales différentes peuvent être effectuées en parallèle puisqu'elles sont indépendantes. La parallélisation du dispositif d'estimation peut donc être impor¬ tante pourvu que les moyens de calcul le permettent.

Enfin l'estimateur de mouvement peut alimenter chaque équipement du studio qui nécessite l'information de mouvement ou l'information de mouvement codée.

Claims

REVENDICATIONS

1. Procédé d'estimation et de codage hiérarchisé du mouve¬ ment de séquences d'images, caractérisé en ce qu'il consiste :

- à un premier niveau, à découper l'image courante en macroblocs de 2^P .2^P pixels et à déterminer un premier champ de vecteurs mouvement, associé à cette partition en macroblocs, en utilisant un algorithme d'estimation itératif et recursif initialise par des vecteurs mouvement estimés pour l'image précédente,

- puis, à un deuxième niveau, à découper en quadrants chacun des macroblocs et à déterminer, pour les blocs qui en résultent, un second champ de vecteurs de mouvement en utili¬ sant le même algorithme d'estimation mais initialise par des vecteurs du champ de mouvement estimé au niveau précédent, ème -

- puis à un i niveau, i = 3 à p, à découper chacun des blocs considérés au niveau i-1 en quadrants et à déterminer, pour les blocs qui en résultent, un i^eme champ de vecteurs de mouvement en utilisant le même algorithme d'estimation initia¬ lise par des vecteurs du champ de mouvement estimés au niveau précédent, les blocs de taille minimale étant des blocs de 2¹⁺¹.2¹⁺¹ pixels,

- et à déterminer un champ de vecteurs de mouvement final à partir des p champs de vecteurs de mouvement résultants en choisissant le niveau de partition le moins élevé pour lequel le vecteur mouvement associé au bloc correspondant conduit à la minimisation d'un critère traduisant les différences de luminance entre blocs se correspondant dans les images successi¬ ves par les vecteurs de déplacement estimés.

2. Procédé selon la revendication 1, caractérisé en ce que l'algorithme d'estimation de mouvement utilisé est symétrique et utilise, pour la détermination d'un vecteur mouvement à un rang d'itération i, le vecteur mouvement déterminé à l'itération i-1 diminué de quantités fonction de différences de luminance intertrames déplacées, c'est-à-dire des sommes de différences de luminance entre les pixels du bloc courant et les pixels des blocs correspondant au bloc courant déplacés du vecteur mouve¬ ment, respectivement dans la trame précédente et dans la trame suivante de la séquence.

3. Procédé selon l'une des revendications 1 et 2, caracté¬ risé en ce que, pour chaque bloc, l'algorithme d'estimation de mouvement est mis en oeuvre quatre fois, initialise par quatre vecteurs de mouvement respectivement associés - à la première étape, aux quatre blocs de niveau infé¬ rieur constituant chaque macrobloc, pris dans le champ de mouve¬ ment de deuxième niveau de l'image précédente,

- dans les étapes suivantes, à quatre blocs du niveau précédent appartenant à un voisinage du bloc courant, dans la même image, et en ce que le vecteur choisi parmi les quatre vecteurs résultats pour former l'un des vecteurs du champ de mouvement correspondant est celui qui conduit à la minimisation du critère traduisant les différences de luminance entre blocs se correspon- dant dans les images successives par les vecteurs de déplace¬ ment estimés correspondants.

4. Procédé selon la revendication 3, caractérisé en ce que les quatre vecteurs mouvement d'initialisation des blocs du niveau précédent utilisés comme valeurs initiales pour l'estima- tion d'un bloc courant sont le vecteur associé au bloc de niveau précédent dont il est issu, et les trois vecteurs associés aux blocs du niveau précédent contigus à ce bloc courant.

5. Procédé selon l'une des revendications 1 à 4, caractéri¬ sé en ce que le champ de mouvement final, hiérarchisé est direc- tement associé à un arbre de codage, de type "quadtree", corres¬ pondant à la hiérarchie des blocs et des vecteurs de mouvement correspondants des différents niveaux sélectionnés pour le champ de mouvement final, et en ce qu'une régulation du débit de co¬ dage résultant est effectuée par sélection du champ de mouve¬ ment final adapté au débit requis.

6. Procédé selon la revendication 5, caractérisé en ce que la régulation est effectuée, lorsque le débit requis est dépas¬ sé, en éliminant du champ de vecteurs de mouvement final les vecteurs les moins fréquents et en les remplaçant par les vec¬ teurs les plus proches, de fréquence plus grande.

7. Procédé selon la revendication 5, caractérisé en ce que la régulation est effectuée, lorsque le débit requis est dépas¬ sé, en écartant les vecteurs du champ de mouvement associé aux blocs de taille minimale de la sélection du champ de mouvement final.

8. procédé selon la revendication 1, caractérisé en ce que les calculs itératifs mis en oeuvre à un niveau donné sont effec¬ tués en parallèle, les calculs d'un niveau donné prenant leurs valeurs d'initialisation à un niveau précédent.

9. Procédé selon l'une des revendications 3 et 4, caracté¬ risé en ce que les quatre calculs de vecteurs mouvement effec- tués pour chaque bloc sont effectués en parallèle, ces calculs prenant leurs valeurs d'initialisation à un niveau précédent.

10. Procédé selon la revendication 1, caractérisé en ce que p est choisi égal à 5 et 1 égal à 2, les macroblocs étant des blocs de 128.128 pixels et les blocs de taille minimale étant des blocs de 8.8. pixels, le procédé d'estimation étant hiérarchisé en 5 niveaux.

11. Procédé selon la revendication 1, caractérisé en ce qu'un champ de mouvement ponctuel est établi à partir du champ de mouvement final, en allouant à chaque pixel le vecteur de mouvement du champ final pour lequel une différence de luminance intertrames entre ce pixel et le pixel déplacé du vecteur mouvement correspondant dans la trame précédente est ininimisée .

12. Dispositif d'estimation et de codage hiérarchisé du mouvement de séquences d'images, destiné à la mise en oeuvre du procédé selon l'une des revendications précédentes caractéri¬ sé en ce qu'il comporte une mémoire d'images, des moyens de calcul et des mémoires de travail, les moyens de calcul étant prévus pour effectuer des calculs en parallèle.