EP1636996A1

EP1636996A1 - Procede de codage et/ou de decodage de groupes d'images

Info

Publication number: EP1636996A1
Application number: EP04785573A
Authority: EP
Inventors: Edouard Francois; Dominique Thoreau; Guillaume Boisson
Original assignee: Thomson Licensing SAS
Current assignee: THOMSON LICENSING
Priority date: 2003-05-23
Filing date: 2004-05-12
Publication date: 2006-03-22
Also published as: KR20060027796A; CN1784906A; JP4990622B2; WO2004107761A1; KR101011894B1; CN100591127C; JP2007503782A; US7864863B2; TW200509702A; MY135286A; FR2855356A1; US20060233256A1; TWI339071B

Abstract

La présente invention concerne un procédé de codage et/ou de décodage de groupes d'images. Selon l'invention, lors de la décomposition temporelle d'un flux d'images dans le cadre d'un traitement en ondelettes 3D, pour minimiser le nombre de pixels non connectés on adapte le nombre d'images (GOP1, GOP2, ...), le choix de l'image de référence (R) et le sens de décomposition temporelle (S) pour chaque séquence d'images de type GOP.

Description

Procédé de codage et/ou de décodage de groupes d'images

La présente invention concerne un procédé de codage et/ou de décodage de groupes d'images. L'invention s'applique dans le contexte de la compression vidéo se basant sur la décomposition par ondelettes 3D.

Dans l'état de la technique, on a déjà proposé d'utiliser la technique de la décomposition d'images par ondelettes 3D dans laquelle un groupe d'images ou GOP est décomposé selon un processus qui applique à une image à deux dimensions ou 2D une décomposition par ondelettes. Sur cette base, on effectue ensuite une compression du flux de données le long de la dimension temporelle qui joue le rôle d'une troisième dimension.

Dans l'état de la technique, le point le plus délicat se situe lors de la décomposition temporelle par ondelettes. Quand la décomposition temporelle a été effectuée, on a repéré les pixels qui sont reliés par un vecteur de mouvement dans la séquence d'images GOP. Or, on s'est aperçu que des pixels par lesquels aucun vecteur de mouvement ne passe sont manques lorsque l'on effectuer l'opération de compression le long de la dimension temporelle.

Pour résoudre ce problème et éviter de perdre de l'information lors du traitement, il faut donc appliquer un traitement particulier à ces pixels, ce qui réduit l'efficacité du traitement en ondelettes.

Dans les schémas de codage vidéo usuels , on décrit le mouvement par des blocs, de 16 pixels de large par 16 pixels de haut, par exemple. Le problème soulevé ci-dessus est alors renvoyé aux frontières des blocs. Pour résoudre ce problème, on a aussi pris en compte les trajectoires des pixels dans les deux sens de défilement de la séquence d'images : dans le sens naturel de la séquence d'images GOP et dans le sens opposé. Mais on double alors la quantité d'information de mouvement par rapport aux techniques conventionnelles.

Pour apporter remède à ces inconvénients de l'état de la technique, la présente invention consiste à choisir des données de configuration de chaque séquence et un critère optimisant permettant de réduire le nombre de pixels non connectés dans chaque séquence d'images GOP.

Il en résulte que le nombre de pixels non connectés est notablement réduit sans nécessiter plus de traitements selon une décomposition en ondelettes 3D.

En effet, la présente invention concerne un procédé de codage et/ou de décodage de séquences d'images, sur la base d'un traitement en ondelettes 3D. Le procédé de l'invention comporte une phase de codage qui comporte : - une étape pour déterminer au moins une information de configuration du codage en ondelettes 3D comme la sélection d'une image de référence pour une séquence d'images successives, sur la base d'un critère optimisant prédéterminé ; puis - une étape pour générer une unité d'informations de configuration comportant la donnée de l'image de référence pour ladite séquence d'images ; et enfin - une étape pour exécuter le codage en ondelettes 3D sur la base des dites informations de configuration, de façon à produire un flux de données codées comportant la réunion pour chaque séquence d'images d'une unité d'informations de configuration et/ou des données de codage en ondelettes 3D des images de la séquence d'images.

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de décomposition par ondelettes dans au moins une image de test comme image de référence, puis une étape d'estimation de mouvement, puis une étape de détermination de l'image de la séquence d'images pour laquelle le nombre de pixels non connectés lors de l'étape d'estimation de mouvement est minimal, comme image de référence.

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de détermination de l'amplitude du mouvement dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'amplitude de mouvement dans l'image est minimale, comme image de référence,

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte une étape de détermination d'une information de texture, par mesure des composantes haute fréquence, dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'information de texture est la plus riche, comme image de référence.

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte aussi la détermination du nombre d'images dans ladite séquence d'images. Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte aussi la détermination d'au moins un sens de décomposition temporelle pour une séquence d'images.

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration consiste :

- dans une première étape : à constituer des séquences d'images GOP d'une taille prédéterminée,

- dans une seconde étape : pour chaque séquence d'images, à sélectionner la première image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens direct ou la dernière image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens inverse selon le choix qui minimise le nombre de pixels non connectés. Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration consiste :

- dans une première étape : à constituer une séquence d'images GOP d'une taille prédéterminée, - dans une seconde étape : à exécuter le choix d'une image de référence, et en ce que le sens de décomposition temporelle est déterminé dans le sens direct pour les images de la séquence d'images qui suivent l'image de référence sélectionnée et dans le sens inverse pour les images de la séquence d'images qui précèdent l'image de référence sélectionnée.

Selon un aspect de l'invention, l'étape pour déterminer au moins une information de configuration comporte :

- dans le sens direct entre images : une étape d'estimation du mouvement, une étape de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape de calcul du nombre de pixels non connectés lors de l'étape de construction des trajectoires ;

- dans le sens inverse entre images : une étape d'estimation du mouvement dans le sens inverse entre images, une étape de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape de calcul du nombre de pixels non connectés lors de l'étape de construction des trajectoires ; - une étape de choix de la meilleure image de référence sur la base du plus faible nombre de pixels non connectés.

- une étape d'estimation du mouvement dans le sens direct entre images et concurremment à une étape d'estimation du mouvement dans le sens inverse entre images ; puis

- une boucle est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape de construction des trajectoires est exécutée, puis une étape de calcul du nombre des pixels non connectés ; puis

- une étape de sélection de la meilleure image de référence dans la séquence d'images GOP en cours d'adaptation est effectuée sur la base du plus faible nombre de points non connectés.

Selon un aspect de l'invention, le procédé comporte une phase de décodage qui consiste :

- à décoder une unité d'informations de configuration déterminant des caractéristiques du codage en ondelettes 3D effectué sur un flux de données binaires donné ; puis

- à effectuer une mise à jour des circuits de traitement de décodage en ondelettes 3D ; et enfin

- à effectuer le décodage du flux de données binaires représentatives d'une séquence d'images de façon à produire en sortie au moins une séquence d'images contenues dans le flux de données binaires donné.

Selon un aspect de l'invention, le procédé est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. Selon un aspect de l'invention, le procédé est intégré à un schéma de codage-décodage MPEG™ .

La sélection d'une image de référence, à partir de laquelle est effectué le calcul du mouvement dans un GOP, le sens de la décomposition temporelle sont réalisés en fonction du nombre de pixels connectés par ce mouvement, information qui peut être combinée aux données de texture ou de mouvement du champ de vecteurs mouvement. L'efficacité de la décomposition en ondelettes 2D + T est améliorée avec le nombre de pixels connectés temporellement.

D'autres caractéristiques et avantages de la présente invention seront mieux compris à l'aide de la description et des figures annexées parmi lesquelles :

- les figures 1 à 5 sont des figures représentant les solutions de l'état de la technique, - les figures 6 à 9 représentent les différentes étapes du procédé de l'invention ;

- les figures 10 et 11 représentent des modes de réalisation particuliers de dispositifs mettant en œuvre le procédé de l'invention.

A la figure 1 , on a représenté un mode de réalisation d'un schéma de compression par ondelettes 3D selon l'état de la technique. On remarquera que ce schéma de compression par ondelettes 3D peut aussi être utilisé une fois que le procédé de l'invention aura été exécuté. On remarquera aussi que ce qui va être décrit en termes de procédé, pourrait être implémenté sous forme de blocs de traitement dans un calculateur de traitement de séquences d'images.

Lors d'une étape 1 , on réalise l'acquisition ou la synthèse d'une séquence d'images GOP, comprenant N images successives. La séquence GOP est alors transmise à une étape de décomposition par ondelettes 2 et parallèlement à une étape 3 d'estimation du mouvement entre images.

L'étape de décomposition par ondelettes comporte une étape 2a d'analyse dans le domaine temporel et une étape 2b d'analyse dans le domaine spatial (fréquences de répétition de motifs, etc.)

En pratique, dans l'état de la technique, l'étape d'estimation du mouvement 3 débute par le choix d'une image de base dans la séquence d'images GOP qui est la dernière image de la séquence. Par différences entre images, entre image_2 et image_1 , puis entre image_3 et image_2, etc. on réalise ensuite une estimation du mouvement. Quand cette estimation de mouvement a été effectuée, une information d'estimation de mouvement est transmise par une information d'estimation de mouvement 8 à l'étape 2a d'analyse dans le domaine temporel pour la décomposition par ondelettes pour exécuter une décomposition monodimensionnelle en ondelettes dans le sens du mouvement. Lors de cette décomposition par ondelettes, une séquence d'images transformées correspondant à des fréquences temporelles différentes est produite. La séquence d'images transformées en fréquences temporelles est alors traitée lors de l'étape 2b de décomposition spatiale par une transformée en ondelettes 2D.

A la fin de l'étape d'estimation de mouvements de l'étape 3 des coefficients de mouvements représentatifs des vecteurs de mouvements dans la séquence d'images GOP est transmise à une étape de codage des champs vectoriels représentatifs des mouvements dans la séquence d'images GOP.

A la fin de l'étape 2b d'analyse spatiale, des coefficients représentatifs des fréquences spatiales dans chaque image de la séquence d'images sont transmis à une entrée d'un circuit de codage entropique.

Le codage entropique effectué à l'étape 4 comporte deux phases : modélisation préalable et codage proprement dit. La modélisation permet d'attribuer des probabilités à chaque symbole se trouvant dans le flot de données à traiter. Le codage attribue à chaque symbole un mot binaire dont la longueur dépend de la probabilité associée. A cette fin, on utilise un schéma d'encodage comme le code de Huffman ou un codage arithmétique.

Les coefficients de codage issus du codage entropique 4 sont transmis à une première entrée d'une circuit de traitement de conformation de flux de données 6 dont une seconde entrée reçoit les composantes des champ vectoriels de mouvements issus de l'étape 3. L'ensemble constitue ainsi le flux de données des coefficients d'ondelettes 3D, sérialisé de façon à produire un train de données binaires 7 auquel on peut appliquer tout traitement convenable ultérieur comme un traitement de cryptage, de stockage ou de transmission.

A la figure 2, on a représenté un diagramme qui illustre une technique de transformation monodimensionnelle, dans le cas d'une séquence d'images GOP de quatre images . Le filtrage temporel est effectué le long de la trajectoire de chaque point de l'image de base qui a été choisie lors de l'étape 3 d'estimation du mouvement. Chaque image référencée figure 2 en image_1 , image_2 est représentée sous la forme sérialisée de ses pixels qui correspond au schéma classique de transformation en ondelettes monodimensionnelle. A la figure 2, la trajectoire considérée passe donc par les positions repérées respectivement x1 sur image_1 , x2 sur image_2, etc. Les flèches F1 , F2 et F3 représentent les déplacements inter-images successifs et permettent d'identifier les coefficients ondelettes correspondant à la trajectoire considérée pour l'ensemble de la séquence d'images GOP.

A la figure 3, on a représenté l'étape de décomposition en ondelettes monodimensionnelles évoquée à l'étape 2 de la figure 1 . Dans cet exemple, on considère une décomposition en deux niveaux d'un GOP de longueur 4, avec un filtrage temporel de longueur 2. Si on applique à la séquence de coefficients [x1 , x2, x3, x4] une telle décomposition, on applique d'abord une étape 10 de filtrage passe-bas et un sous échantillonnage par 2 qui produit une paire de coefficients basse fréquence [L1 , L2]. Parallèlement, on applique une étape 11 de filtrage passe-haut et un sous échantillonnage par 2 qui produit une paire de coefficients haute fréquence [H1 , H2]. Puis, sur la paire de coefficients basse fréquence [L1 , L2], on applique à nouveau une étape 12 de filtrage passe-bas et de sous échantillonnage par 2 qui produit un coefficient [LL] qui représente la composante fréquentielle temporelle la plus basse et en parallèle une étape 13 de filtrage passe-haut et de sous échantillonnage par 2 qui produit un coefficient [LH] qui représente une composante fréquentielle intermédiaire. On a ainsi obtenu un lot de quatre coefficients de transformation fréquentielle temporelle en ondelettes [LL, LH, H 1 , H2j. De plus, dans la plupart des schémas actuels de compression d'images en ondelettes 3D, le champ F2 entre les i mages 2 et 3 n'est pas estimé, et c'est avec un champ estimé entre L1 et L2 que les filtrages 12 et 13 sont effectués.

Cette transformation est effectuée pour toute trajectoire issue de l'image de référence, ce qui permet de produire des images transformées en fréquences temporelles qui sont représentées à la figure 4 et qui sont respectivement image_H1 , image_H2, image_LH et image_LL. Les quatre coefficients correspondant au point de mouvement repéré dans les images image_1 , image_2, ... de la figure 2 se retrouvent sous formes de leurs transpositions fréquentielles temporelles respectivement H1 sur image_H1 , H2 sur image_H2, LH sur image_LH et LL sur image_LL. Il en résulte que la trajectoire considérée se retrouve sur le diagramme fréquentiel temporel de la figure 4. Comme indiqué dans le préambule de la présente demande de brevet, à l'issue de la décomposition temporelle illustrée à la figure 4, des pixels par lesquels aucun vecteur de mouvement ne passe ne se voient attribué aucune valeur dans le domaine fréquentiel temporel de la Figure 5. On les appelle dans l'état de la technique des pixels non connectés. Tous les autres pixels se trouvant affectés à des vecteurs de mouvement sont correctement traités. Cependant dans la transformée finale 8, si on ne rajoute pas d'information sur les pixels non connectés marqués « X » sur le diagramme à gauche référencé « image-1 » à la figure 5, où les vecteurs de mouvement représentés qui connectent les autres pixels des diagrammes de la séquence {image_1 , image_2, image_3, image_4} n'arrivent pas, la reconstruction d'une telle séquence sera faiblement fidèle à la séquence d'images GOP de départ. Le procédé de l'invention reprend exactement les éléments de l'état de la technique tel qu'il a été défini ci-dessus. Le flux de données consiste dans un flux d'images « naturelles » comme des images produites à l'aide d'une caméra, ou comme des images produites à l'aide d'un générateur d'images de synthèse. Le procédé de l'invention principalement à associer une unité d'informations de configuration du codage par ondelettes 3D au flux de données décrit à la sortie 7 du codeur classique. Les informations de configuration du codage assurent une réponse optimale à un critère de coût du schéma de codage. Deux modes peuvent être implémentés : - le mode unidirectionnel, ou « forward/backward » (direct/inverse). Dans ce mode, le sens de la compensation en mouvement doit être constant au sein d'un GOP. Dans ce mode, seules la première et la dernière image du GOP sont candidates au choix de l'image de référence - le mode bidirectionnel , pour lequel toutes les images du GOP sont candidates au choix de l'image de référence. Dans ce mode , les deux sens de compensation en mouvement peuvent être utilisés de part et d'autre de l'image de référence.

Les figures 6 et 7 illustrent le mode unidirectionnel, ou « forward/backward » (direct/inverse) ; les figures 8 et 9 illustrent le mode bidirectionnel.

A la figure 6, on a représenté la décomposition d'un flux d'images dans le mode unidirectionnel, où un seul sens de compensation est admis par séquence d'images GOP. Chaque image est représentée dans le domaine temporel par un trait vertical. Le flux d'images est séparé dans la séquence temporelle des images de la gauche vers la droite en trois séquences d'images GOP qui sont désignées successivement dans le temps par GOP1 , GOP2 et GOP3.

Selon l'invention, le nombre d'images de chaque séquence GOP1 , GOP2, GOP3, ... est lié à une contrainte de majoration du nombre de pixels non connectés par GOP. Selon l'invention, le choix de l'image de référence R, marquée par un trait fort, est conduit selon un critère donné. Plusieurs exemples de critères sont donnés ci-dessous.

Un premier critère est la minimisation du nombre de pixels non connectés dans le GOP. Dans ce cas, on calcule le nombre de pixels non connectés dans le GOP pour chacun des deux sens de compensation en mouvement. On choisit alors le sens et l'image de référence qui minimisent le nombre de pixels non connectés pour l'ensemble du GOP . Un second critère est la minimisation de l'amplitude du mouvement. Dans ce cas, on mesure, pour chacun des deux sens l'amplitude du mouvement dans l'ensemble du GOP, par exemple en calculant la somme des carrés des composantes de chaque vecteur mouvement de chaque champ. Puis on choisit le sens et l'image de référence qui présente l'amplitude de mouvement minimale.

Un troisième critère est la richesse en information de l'image de référence. Dans ce cas, on mesure I 'information de texture de la première et de la dernière image, par l'amplitude des hautes fréquences de leur décomposition en ondelettes respective, et on choisit la plus riche comme image de référence. Dans l'exemple représenté à la figure 6, on remarque que les séquences d'images dans le flux d'images sont définies de la manière suivante dans le tableau suivant : Séquence Taille Image de référence Sens

GOP1 4 images Dernière image « backward »

GOP2 8 images Dernière image « backward »

GOP3 4 images Première image « forward »

A la figure 7, on a représenté une réalisation du procédé de l'invention, dans le mode unidirectionnel, utilisant la minimisation du nombre de pixels non connectés, Les étapes identifiées peuvent être chacune exécutées sur un processeur identifiable ou partie de processeur identifiable sous forme d'un circuit d'exécution du procédé et un dispositif de mise en œuvre en est directement dérivé.

Lors d'une étape 20, un flux d'images est acquis et transmis à une étape 21 d'estimation du mouvement dans le sens positif entre images et concurremment à une étape 22 d'estimation du mouvement dans le sens négatif entre images. Puis, on exécute la construction des trajectoires des points de mouvements lors d'étapes 24 pour l'estimation de mouvement directe 21 et 25 pour l'estimation de mouvement inverse 22.

Puis, on exécute le calcul du nombre de pixels non connectés lors d'une étape 26 pour la construction de trajectoires de l'étape 24 et 27 pour la construction de trajectoires de l'étape 25.

Enfin on choisit le meilleur sens de compensation de mouvement dans l'étape 28 pour produire à l'étape 29 le flux binaire représentatif de la transformée spatiale de la séquence d'images GOP ainsi adaptée.

Le choix du meilleur sens de compensation de mouvement est réalisé à l'étape 28 par le plus petit des nombres de pixels non connectés relevés à l'étape 26 ou à l'étape 27. On remarque que si le sens positif est détecté comme minimisant le nombre de pixels non connectés, l'image de référence choisie est la dernière de la séquence d'images GOP en cours d'adaptation. Inversement, si le sens négatif est détecté comme minimisant le nombre de pixels non connectés, l'image de référence choisie est la première de la séq uence d'images GOP en cours d'adaptation.

On peut élargir l'invention en permettant à toutes les images du GOP d'être candidates au choix de l'image de référence. C'est le mode bidirectionnel Les deux sens de décomposition temporelle peuvent être alors retenus pour une même séquence d'images GOP, de part et d'autre de l'image de référence.

A la figure 8 ; on a représenté une partie de flux d'images séparées en trois séquences d'images GOP, qui reprennent les mêmes codages que ceux expliqués à l'aide de la figure 6. Seulement, chaque séquence GOP comporte un ou deux sens de décomposition S et S'. Quand deux sens de décomposition S et S' sont prévus, l'image de référence est déterminé à l'intérieur de la séquence GOP. Dans ce mode, le choix de l'image de référence R peut être effectué suivant les mêmes critères que dans le mode unidirectionnel, c'est-à-dire la minimisation du nombre de pixels non connectés sur l'ensemble du GOP, la minimisation de l'amplitude de mouvement dans l'ensemble du GOP, et le choix de l'image

A la figure 9, on a représenté une réalisation du procédé de l'invention dans le mode bidirectionnel, c'est-à-dire quand toutes les images du GOP sont candidates au choix de l'image de référence, avec le critère de minimisation du nombre de pixels non connectés. A nouveau, les étapes identifiées peuvent être chacune exécutée sur un processeur identifiable ou partie de processeur identifiable sous forme d'un circuit d'exécution du procédé et un dispositif de mise en œuvre en est directement dérivé.

Lors d'une étape 30, un flux d'images est acquis et transmis à une étape 31 d'estimation du mouvement dans le sens positif entre images et concurremment à une étape 32 d'estimation du mouvement dans le sens négatif entre images. Puis une boucle 33 est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape 34 de construction des trajectoires est exécutée, puis une étape 35 de calcul du nombre des pixels non connectés. Puis, une étape de sélection de la meilleure image de référence R dans la séquence d'images GOP en cours d'adaptation est effectuée. Dans la figure 9, le critère de sélection de la meilleure image de référence est celui du plus faible nombre de points non connectés. Le procédé de l'invention est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. Dans une telle application, le procédé de l'invention est mis en œuvre dans trois lieux distincts qui peuvent être : - un lieu dans lequel l'étape de codage est mise en œuvre ; - un lieu dans lequel l'état dans lequel le flux de données binaires comprenant l'unité d'informations de configuration et les données de codage en ondelettes 3D existe sous forme de signal de transmission ou encore de support de données enregistrées ; et

- un lieu dans lequel l'étape de décodage est mise en œuvre.

Selon un aspect de l'invention, le procédé est intégré dans un schéma de codage-décodage MPEG™ . Cette disposition est particulièrement pertinente dans le cadre de la mise en œuvre de la norme MPEG-7.

A la figure 10, on a représenté un schéma-bloc détaillant un mode de réalisation d 'un dispositif de codage en ondelettes 3D mettant en œuvre le procédé de l'invention.

Un tel dispositif comporte une borne d'entrée 100 d'un flux de données vidéo 106, qui est reliée à l'entrée d'un circuit analyseur de groupes d'images 101 dont une première borne de sortie 107 est connectée à une borne d'entrée 109' d'un circuit

103 générateur d'unités d'informations de configuration du codage en ondelettes 3D et à une borne d'entrée 109 d'un codeur en ondelettes 3D 102 proprement dit, pour leur fournir des données de configuration définissant le traitement en ondelettes 3D à appliquer, selon le procédé de l'invention décrit ci-dessus. Le circuit 101 comporte enfin une seconde borne de sortie pour poursuivre le traitement en ondelettes 3D sur le codeur en ondelettes 3D 102 proprement dit.

Des bornes de sortie 110 du codeur 102 et 1 1 1 du circuit générateur 103 sont connectées à des entrées correspondantes d'un circuit 104 réalisant une mise en forme d'un flux de données binaires FDB présenté à sa sortie 105 et qui comporte selon un protocole déterminé une séquence :

- d'une unité d'informations de configuration du codage en ondelettes 3D associée à une séquence d'images GOP ; et - d'un flux de données binaires correspondant au résultat du codage en ondelettes 3D de la séquence d'images GOP correspondante.

Le flux de données ainsi constitué peut être transmis à un nouveau circuit de traitement, à un dispositif d'enregistrement ou encore à une ligne de transmission.

A la figure 1 1 , on a représenté un schéma bloc détaillant un mode de réalisation d'un dispositif de décodage en ondelettes

3D mettant en œuvre le procédé de l'invention. Un tel dispositif comporte une borne d'entrée 120 connectée à un circuit de discrimination 121 dont des bornes de sortie 126 et 127 sont respectivement connectées respectivement à un circuit générateur d'informations de configuration de décodage 3D 122 et à un circuit de décodage en ondelettes 3D 123. Quand le flux de données binaires issues du circuit de la figure 10 est transmis à la borne d'entrée 120, les données sont analysées par le discriminateur 121 de sorte que, sur une première borne de sortie 126 du discriminateur 121 , soient présentées des informations caractéristiques du codage en ondelettes 3D appliqué au flux de données binaires.

Ce dernier est alors présenté à la sortie 127 du discriminateur et chargé dans le décodeur 123. Ce dernier comporte une borne d'entrée de configuration qui reçoit les informations de configuration issues d'une borne 128 du circuit générateur d'informations de configuration 122 sur la base des informations contenues dans chaque unité d'informations de configuration comme la donnée de l'image de référence, le sens de décomposition et/ou le nombre d'images de la séquence d'images représentée dans le flux de données 120. A la borne de sortie 124 est présente la séquence des images GOP décodées.

La présente invention trouve application dans le domaine de la compression vidéo se basant sur la décomposition par ondelettes 3D. Elle peut donc être intégrée à un schéma de compresseur-décompresseur vidéo par ondelettes 3D. La présente invention trouve application dans un schéma de codage hybride classique, et particulièrement dans un schéma de type MPEG dans lequel les images de type I et les images de type P servent d'images de référence. Dans ce cas le procédé de l'invention est intégré dans un schéma de codage-décodage MPEG.

Claims

REVENDICATIONS 1 - Procédé de codage et/ou de décodage de séquences d'images, sur la base d'un traitement en ondelettes 3D, caractérisé en ce qu'il comporte une phase de codage qui comporte :

- une étape pour déterminer au moins une information de configuration du codage en ondelettes 3D comme la sélection d'une image de référence pour une séquence d'images successives, sur la base d'un critère optimisant prédéterminé ; puis

- une étape pour générer une unité d'informations de configuration comportant la donnée de l'image de référence pour ladite séquence d'images ; et enfin

- une étape pour exécuter le codage en ondelettes 3D sur la base des dites informations de configuration, de façon à produire un flux de données codées comportant la réunion pour chaque séquence d'images d'une unité d'informations de configuration et/ou des données de codage en ondelettes 3D des images de la séquence d'images. 2 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de décomposition par ondelettes dans au moins une image de test comme image de référence, puis une étape d'estimation de mouvement, puis une étape de détermination de l'image de la séquence d'images pour laquelle le nombre de pixels non connectés lors de l'étape d'estimation de mouvement est minimal, comme image de référence.

3 — Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de détermination de l'amplitude du mouvement dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'amplitude de mouvement dans l'image est minimale, comme image de référence,

4 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte une étape de détermination d'une information de texture, par mesure des composantes haute fréquence, dans au moins une image de test, puis une étape de détermination de l'image de la séquence d'images pour laquelle l'information de texture est la plus riche, comme image de référence.

5 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte aussi la détermination du nombre d'images dans ladite séquence d'images. 6 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte aussi la détermination d'au moins un sens de décomposition temporelle pour une séquence d'images.

7 — Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration consiste :

- dans une seconde étape : pour chaque séquence d'images, à sélectionner la première image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens direct ou la dernière image de la séquence d'images comme image de référence et un sens de décomposition temporelle dans le sens inverse selon le choix qui minimise le nombre de pixels non connectés.

8 - Pro cédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration consiste : - dans une première étape : à constituer une séquence d'images GOP d'une taille prédéterminée,

- dans une seconde étape : à exécuter le choix d'une image de référence, et en ce que le sens de décomposition temporelle est déterminé dans le sens direct pour les images de la séquence d'images qui suivent l'image de référence sélectionnée et dans le sens inverse pour les images de la séquence d'images qui précèdent l'image de référence sélectionnée. 9 - Procédé selon la revendication 8, caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte :

- dans le sens direct entre images : une étape (21 ) d'estimation du mouvement, une étape (24) de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape (26) de calcul du nombre de pixels non connectés lors de l'étape (24) de construction des trajectoires ;

- dans le sens inverse entre images : une étape (22) d'estimation du mouvement dans le sens inverse entre images , une étape (25) de construction des trajectoires des points de mouvements dans l'estimation de mouvement directe et une étape (27) de calcul du nombre de pixels non connectés lors de l'étape (25) de construction des trajectoires ;

- une étape (28) de choix de la meilleure image de référence sur la base du plus faible nombre de pixels non connectés.

10 - Procédé selon la revendication 1 , caractérisé en ce que l'étape pour déterminer au moins une information de configuration comporte :

- une étape (31 ) d'estimation du mouvement dans le sens direct entre images et concurremment à une étape (32) d'estimation du mouvement dans le sens inverse entre images ; puis

- une boucle (33) est effectuée pour chaque image de la séquence GOP en cours d'adaptation au cours de laquelle successivement une étape (34) de construction des trajectoires est exécutée, puis une étape (35) de calcul du nombre des pixels non connectés ; puis

- une étape (36) de sélection de la meilleure image de référence (R) dans la séquence d'images GOP en cours d'adaptation est effectuée sur la base du plus faible nombre de points non connectés.

1 1 - Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comporte une phase de décodage qui consiste :

- à effectuer le décodage du flux de données binaires représentatives d'une séquence d'images de façon à produire en sortie au moins une séquence d'images contenues dans le flux de données binaires donné. 1 2 - Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il est intégré à un schéma de compresseur-décompresseur vidéo par ondelettes 3D.

13 - Procédé selon l'une quelconque des revendications 1 à 12, caractérisé en ce qu'il est intégré à un schéma de codage- décodage MPEG ™ .