FR2795274A1 - Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation - Google Patents

Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation Download PDF

Info

Publication number
FR2795274A1
FR2795274A1 FR9907585A FR9907585A FR2795274A1 FR 2795274 A1 FR2795274 A1 FR 2795274A1 FR 9907585 A FR9907585 A FR 9907585A FR 9907585 A FR9907585 A FR 9907585A FR 2795274 A1 FR2795274 A1 FR 2795274A1
Authority
FR
France
Prior art keywords
sub
segmentation
bands
coding
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR9907585A
Other languages
English (en)
Inventor
Isabelle Amonou
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Research Center France SAS
Original Assignee
Canon Research Center France SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Research Center France SAS filed Critical Canon Research Center France SAS
Priority to FR9907585A priority Critical patent/FR2795274A1/fr
Priority to EP00401680A priority patent/EP1079625A3/fr
Priority to US09/593,695 priority patent/US6711298B1/en
Publication of FR2795274A1 publication Critical patent/FR2795274A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/649Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention concerne un procédé de codage d'un ensemble de données (IM) représentatives de grandeurs physiques, caractérisée en ce qu'il comporte les étapes de :- décomposition (E20) de l'ensemble de données en une pluralité de sous bandes de fréquence sur au moins un niveau de résolution,puis, pour chaque niveau de résolution,- segmentation ( (E23, E26) d'au moins une sous bande en au moins deux régions homogènes, pour former une carte de segmentation,- ordonnancement (E30, E33) des régions selon un critère prédéterminé,- codage (E21) des sous bandes du niveau de résolution considéré,- ordonnancement (E31, E34) des données de codage des sous bandes en fonction de l'ordre des régions.

Description

La présente invention concerne de manière générale le codage de signal numérique et propose à cette fin un dispositif et un procédé de codage d'un signal numérique par décomposition en sous bandes de fréquence du signal, et segmentation de certaines sous bandes de fréquence. Elle concerne également une méthode et un dispositif de décodage correspondant au dispositif et au procédé de codage.
Le codage a pour but de compresser le signal, permettant ainsi de transmettre le signal numérique ou de le stocker en réduisant la quantité de symboles binaires nécessaires à la représentation de celui-ci. Le codage peut être sans perte, c'est-à-dire qu'il préserve la totalité des informations contenues dans le signal numérique ou au contraire avec pertes c'est-à-dire que certaines informations contenues dans le signal numérique peuvent être dégradées.
La présente invention est applicable dans chacun des deux types précédents de codage de signal numérique. Dans la suite, on s'intéressera plus particulièrement au codage d'images numériques ou de séquences vidéo. Une séquence vidéo est définie comme une succession d'images numériques. Elle est particulièrement adaptée au stockage d'images dans des bases de données ainsi qu'à leur transmission à travers un réseau vers de multiples équipements distants.
II est connu de décomposer un signal numérique en sous bandes de fréquence avant de le compresser. La décomposition consiste à créer, à partir du signal numérique, un jeu de sous bandes contenant chacune un spectre limité de fréquences. Les sous bandes peuvent être de différentes résolutions, la résolution d'une sous bande étant le nombre d'échantillons par unité de longueur utilisé pour représenter cette sous bande. Dans le cas d'un signal numérique d'image, une sous bande de fréquence de ce signal peut être considérée comme une image, c'est-à-dire un tableau bidimensionel de valeurs numériques. II est à noter que la décomposition d'un signal en sous bandes de fréquence ne crée aucune compression en elle-même, mais permet de décorréler le signal de manière à éliminer la redondance existant dans l'image numérique préalablement à la compression proprement dite. Les sous bandes sont alors compressées de manière plus efficace que le signal d'origine.
De façon classique, le codage de signal numérique, en l'occurrence d'une image numérique, comporte trois étapes. L'image est tout d'abord décomposée par une transformation en sous-bandes de fréquence, les coefficients de celle-ci sont quantifiés en indices et enfin ces indices sont codés par un codage entropique sans perte.
Ce type de compression permet d'obtenir un taux de compression relativement élevé du signal mais ne permet pas d'accéder au contenu de l'image. En d'autres termes, la décomposition du signal reste purement fréquentielle, et ne donne aucune indication sur les objets qui peuvent être contenus dans l'image. Par objet, on entend une entité de l'image correspondant à une unité sémantique, par exemple le visage d'une personne.
Le codage utilisant une décomposition en sous bandes du signal est par nature progressif par sous bande, et permet donc une transmission des données codées progressive par sous bande.
Il existe d'autres techniques de compression d'images basées sur la segmentation de celles-ci. Dans ce contexte, l'image est considérée comme constituée d'objets à deux dimensions. La segmentation est un processus de bas niveau ayant pour but de réaliser une partition de l'image en un certain nombre de sous éléments appelés régions. La partition est telle que les régions sont disjointes et que leur réunion constitue l'image. Les régions correspondent ou ne correspondent pas à des objets de l'image, le terme d'objet référant à une information de nature sémantique. Bien souvent cependant, un objet correspond à une région ou un ensemble de régions. Chaque région peut être représentée par une information représentative de sa forme, sa couleur ou de sa texture.
Classiquement, les méthodes de compression d'une image numérique basées sur une segmentation comportent une première étape dite de marquage, c'est-à-dire que l'on extrait de l'image l'intérieur des régions présentant une homogénéité locale. Ensuite, une étape de décision définit de manière précise les contours des zones contenant des données homogènes. A la fin de cette étape, chaque pixel de l'image est associé à un label identifiant la région à laquelle il appartient. L'ensemble de tous les labels de tous les pixels est classiquement appelé une carte de segmentation. Finalement, dans un tel codage, la dernière étape consiste à coder la carte de segmentation, généralement sous la forme des contours des régions, et des paramètres pertinents représentatifs de l'intérieur des régions, tels que la texture et la couleur.
Ce type de technique permet, pour une image donnée, d'obtenir un taux de compression plus grand qu'avec la technique précédemment décrite. En effet, avec la segmentation, la compression peut être effectuée sélectivement sur les objets ou régions jugés les plus importants, au détriment des autres. Ainsi, pour un taux de compression donné, c'est-à-dire pour un nombre d'éléments binaires autorisé, un objet précis (typiquement le visage d'une personne dans une image de type "tête et épaules") pourra être codé de manière précise en utilisant un maximum de bits, au détriment du fond qui lui sera codé avec un minimum de bits.
La segmentation permet un codage progressif par régions, et par conséquent une transmission des données codées progressive par région.
Ce type de technique ne permet cependant pas de disposer d'une information multi-résolution comme le permettent les méthodes avec décomposition en sous-bandes.
D'autres techniques combinent les deux méthodes de compression précédemment décrites, comme par exemple la norme dite MPEG4 (d'après l'anglais "Motion Picture Expert Group"), qui est en cours de normalisation à l'ISOIIEC. Dans le codeur MPEG4, et plus particulièrement dans le cas du codage d'images fixes, la décomposition de l'image en sous- bandes de fréquence est utilisée conjointement avec une segmentation de l'image. Une étape préalable au codeur (non normalisée) est chargée d'isoler les objets de l'image (Video objects) et de représenter chacun de ces objets par un masque. Dans le cas d'un masque binaire, le support spatial du masque a la même taille que l'image originale et un point du masque à la valeur 1 (respectivement 0) indique que le pixel à la même position dans l'image appartient à l'objet, (respectivement est à l'extérieur de l'objet).
Pour chaque objet, le masque est alors transmis à un décodeur de forme tandis que la texture pour chaque objet est décomposée en sous bandes, et les sous bandes sont ensuite transmises à un décodeur de texture.
Cette méthode comporte un certain nombre d'inconvénients. En effet, il est nécessaire de coder le masque pour chaque objet à son niveau de résolution le plus élevé (dans la version une de MPEG4) ou dans certains cas à deux niveaux de résolution (version deux de MPEG4). Pour un taux de compression donné, ceci pénalise la qualité de l'image reconstruite, puisqu'il faut réserver du débit pour les masques des objets, qui sont â une résolution élevée. Par ailleurs, le nombre d'objets manipulés est a priori le même à tous les niveaux, alors qu'il peut être plus intéressant d'avoir un nombre d'objets croissant avec la résolution (spatiale), c'est-à-dire une véritable scalabilité conjointe entre la résolution et le nombre d'objets.
La présente invention vise à remédier aux inconvénients de la technique antérieure, en fournissant un procédé et un dispositif de compression de signal numérique qui offre un rapport de compression élevé tout en permettant une transmission progressive du contenu de l'image, tant en résolution, que par objet.
A cette fin, l'invention propose un procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisée en ce qu'il comporte les étapes de - décomposition de l'ensemble de données en une pluralité de sous bandes de fréquence sur au moins un niveau de résolution, puis, pour chaque niveau de résolution, - segmentation d'au moins une sous bande en au moins deux régions homogènes, pour former une carte de segmentation, - ordonnancement des régions selon un critère prédéterminé, - codage des sous bandes du niveau de résolution considéré, - ordonnancement des données de codage des sous bandes en fonction de l'ordre des régions.
Corrélativement, l'invention concerne un dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisée en ce qu'il comporte - des moyens de décomposition de l'ensemble de données en une pluralité de sous bandes de fréquence sur au moins un niveau de résolution, - des moyens de segmentation, pour chaque niveau de résolution, d'au moins une sous bande en au moins deux régions homogènes, pour former une carte de segmentation, - des moyens d'ordonnancement des régions selon un critère prédéterminé, - des moyens de codage des sous bandes du niveau de résolution considéré, - des moyens d'ordonnancement des données de codage des sous bandes en fonction de l'ordre des régions.
Grâce à l'invention, le rapport de compression est élevé. En effet, la décomposition en sous bandes permet de décorréler le signal, la segmentation sur une sous bande particulière est ainsi plus efficace. En outre, il est possible d'effectuer une transmission progressive du contenu de l'image, tant en résolution, que par objet.
Selon une caractéristique préférée, l'invention comporte le codage de la carte de segmentation d'au moins un niveau de résolution, de préférence du niveau de résolution le plus faible dans la décomposition.
Cette carte de segmentation codée est jointe aux données codées, et sert lors du décodage pour ordonner les données.
Selon une caractéristique préférée, les sous bandes sont codées puis décodées préalablement à la segmentation. Ainsi, dans le cas d'un codage avec perte, le codage et le décodage ultérieur sont effectués sur les mêmes données.
Selon une autre caractéristique préférée, la segmentation est effectuée sur la sous bande de plus basse fréquence du niveau de résolution considéré. Cette sous bande contient plus d'information que les autres sous bandes et permet une segmentation plus pertinente des données. La carte de segmentation est réduite par rapport à une segmentation à pleine résolution. Elle est par conséquent plus rapide à déterminer, et nécessite un débit plus réduit si elle doit être transmise.
Selon une caractéristique préférée, le critère d'ordonnancement dépend d'une analyse de la segmentation. Ainsi, les régions sont ordonnées en fonction de leur importance.
Selon une caractéristique préférée, l'invention comporte en outre la transmission de la carte de segmentation déterminée au niveau de résolution le plus faible et des données de codage de toutes les sous bandes, pour tous les niveaux de résolution.
En effet, selon l'invention, seule la carte de segmentation du niveau de résolution le plus faible doit être transmise, les autres cartes de segmentation, nécessaires pour les niveaux de résolution supérieurs s'ils existent, sont calculées lors du décodage.
L'invention concerne aussi un procédé de décodage de données représentatives de grandeurs physiques codées par le procédé de codage selon l'invention, caractérisé en ce que, pour un niveau de résolution donnée, il comporte les étapes de - analyse de la segmentation pour classer les régions selon un critère prédéterminé, - décodage des données de codage des sous bandes du niveau de résolution considéré en fonction du résultat de l'étape précédente, - reconstruction des sous bandes, - synthèse des sous bandes reconstruites.
L'invention concerne encore un dispositif de décodage comportant des moyens de mise en ceuvre des caractéristiques précédentes.
Le procédé et le dispositif de décodage permettent de reconstruire le signal, par exemple dans un appareil récepteur correspondant à un appareil émetteur dans lequel le signal a été codé selon l'invention.
L'invention concerne aussi un appareil numérique incluant le dispositif de codage, respectivement de décodage ou des moyens de mise en #uvre du procédé de codage, respectivement de décodage. Les avantages du dispositif et de l'appareil numérique sont identiques à ceux précédemment exposés.
Un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en #uvre le procédé de codage, respectivement de décodage.
Les caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture d'un mode préféré de réalisation illustrée par les dessins ci-joints, dans lesquels - la figure 1 est un mode de réalisation d'un dispositif mettant en #uvre l'invention, - la figure 2 représente un algorithme de codage selon la présente invention, <B>-</B>la figure 3 est un algorithme de mise en #uvre de l'étape de segmentation incluse dans l'algorithme de codage de la figure 2, - la figure 4a est un schéma mettant en évidence les étapes de codage selon la présente invention, - la figure 4b est un schéma montrant le flux binaire à la sortie de codeur, - la figure 5 représente un algorithme de décodage selon la présente invention, <B>-</B>la figure 6 est un schéma mettant en évidence les étapes de codage selon la présente invention, - la figure 7 est un mode de réalisation d'un dispositif de codage de signal numérique selon la présente invention, <B>-</B>la figure 8 est un circuit de décomposition en sous bandes de fréquence inclus dans le dispositif de la figure 7, - la figure 9 est une image numérique à coder par le dispositif de codage selon la présente invention, - la figure 10 est une image décomposée en sous-bandes par le circuit de la figure 8, - la figure 11 est un mode de réalisation d'un dispositif de décodage de signal numérique selon la présente invention.
Selon le mode de réalisation choisi et représenté à la figure 1, un dispositif mettant en oeuvre l'invention est par exemple un micro-ordinateur 10 connecté à différents périphériques, par exemple une caméra numérique 107 (ou un scanner, ou tout moyen d'acquisition ou de stockage d'image) reliée à une carte graphique et fournissant des informations â compresser selon l'invention. Le dispositif 10 comporte une interface de communication 112 reliée à un réseau 113 apte à transmettre des données numériques à compresser ou à transmettre des données compressées par le dispositif. Le dispositif 10 comporte également un moyen de stockage 108 tel que par exemple un disque dur. II comporte aussi un lecteur de disquette 109. La disquette 110 comme le disque 108 peuvent contenir des données compressées selon l'invention ainsi que le code de l'invention qui, une fois lu par le dispositif 10, sera stocké dans le disque dur 108. Selon une variante, le programme permettant au dispositif de mettre en ceuvre l'invention, pourra être stocké en mémoire morte 102 (appelée ROM sur le dessin). En seconde variante, le programme pourra être reçu pour être stocké de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 113.
Le dispositif 10 est relié à un micro 111 par l'intermédiaire de la carte d'entré/sortie 106. Les données à compresser selon l'invention seront dans ce cas du signal audio.
Ce même dispositif possède un écran 104 permettant de visualiser les données à compresser ou de servir d'interface avec l'utilisateur qui pourra paramétrer certains modes de compression, à l'aide du clavier 114 ou de tout autre moyen (souris par exemple).
L'unité centrale 100 (appelée CPU sur le dessin) va exécuter les instructions relatives à la mise en ceuvre de l'invention, instructions stockées dans la mémoire morte 102 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de compression stockés dans une mémoire non volatile, par exemple la ROM 102, sont transférés dans la mémoire vive RAM 103 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en aeuvre de l'invention.
Bien entendu, les disquettes peuvent être remplacées par tout support d'information tel que CD-ROM ou carte mémoire. De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé de codage, respectivement de décodage.
Le bus de communication 101 permet la communication entre les différents éléments inclus dans le micro-ordinateur 10 ou reliés à lui. La représentation du bus 101 n'est pas limitative et notamment l'unité centrale 100 est susceptible de communiquer des instructions à tout élément du micro- ordinateur 10 directement ou par l'intermédiaire d'un autre élément du micro- ordinateur 10.
Le dispositif 10 a été plus particulièrement détaillé en supposant qu'il effectue le codage de données. Cependant, le dispositif 10 peut également effectuer le décodage de données.
En référence à la figure 2, un mode de réalisation du procédé de codage selon l'invention d'une image IM comporte des étapes E20 à E36 qui sont parcourues par l'unité centrale du dispositif 10 précédemment décrit. Le procédé comporte globalement la décomposition de l'image en sous bandes de fréquence, ici selon trois résolutions, le codage de chacune de ces sous bandes, et la segmentation des sous bandes de basse fréquence pour chaque niveau de résolution. L'étape E20 est la décomposition de l'image IM en sous bandes de fréquence, comme il sera détaillé dans la suite en référence à la figure 9. L'étape E20 a pour résultat des sous bandes LL3, HL3, LH3 et HH3 de plus faible résolution RES3, les sous bandes HL2, LH2 et HH2 de résolution intermédiaire RES2, et les sous bandes HL,, LH, et HH, de plus haute résolution RIES,.
L'étape suivante E21 est le codage des sous bandes de la décomposition. La sous bande de plus basse fréquence LL3 est par exemple codée selon un codage DPCM (Modulation par codage d'impulsion différentielle, d'après l'anglais Differential Pulse Coded Modulation), et a pour résultat la sous bande codée LLC3 qui est mémorisée. Les autres sous bandes, dites sous bandes de détail, sont par exemple codées par une quantification scalaire ou vectorielle des données. Ces sous bandes codées sont également mémorisées.
L'étape E21 est suivie de l'étape E22 qui est le décodage des sous bandes préalablement codées. Le mode de décodage utilisé correspond bien sûr au mode de codage utilisé à l'étape précédente. L'étape E22 a pour résultat des sous bandes reconstruites, notamment la sous bande LLD3 qui résulte du décodage de la sous bande LLC3. II n'est pas nécessaire de décoder les sous bandes du niveau de résolution le plus élevé, puisque, ainsi qu'il apparaîtra dans la suite, ces sous bandes décodées ne sont pas utiles.
On travaille dans la suite sur des sous bandes codées puis décodées, ce qui permet d'avoir les mêmes données que lors du décodage, qui sera exposé dans la suite. Cependant, dans le cas d'une compression sans perte, on peut aussi travailler sur les sous bandes telles que produites à l'étape E20.
L'étape E22 est suivie de l'étape E23 qui est la segmentation de la sous bande de plus basse fréquence reconstruite LLD3. Cette étape de segmentation est détaillée dans la suite en référence à la figure 3. Le résultat de la segmentation est une carte de segmentation S3 contenant au moins deux régions distinctes couvrant la totalité de la sous bande segmentée.
Au cours de l'étape suivante E24, un paramètre i est initialisé à la valeur 1. Le paramètre i indique le niveau de résolution courant N-i, où N correspond au nombre total de niveaux de décomposition, ici trois. Cet indicateur sera remis à jour parla suite.
L'étape E24 est suivie de l'étape E25 au cours de laquelle une synthèse est effectuée sur les sous bandes du niveau de résolution immédiatement inférieur au niveau courant N-i précédemment considéré. L'étape de synthèse a pour résultat une sous bande basse reconstruite, de résolution immédiatement supérieure aux sous bandes qui ont servi à la synthèse. Ainsi, à partir des sous bandes LLD3, LHD3, HLD3 et HHD3 on reconstruit une sous bande basse LLS2 de niveau 2. La synthèse sera décrite plus en détail dans la suite.
L'étape suivante E26 est la segmentation de la sous bande basse LLSN_; synthétisée à l'étape précédente pour fournir une carte de segmentation de niveau (N-i) ; cette étape est identique à l'étape E23 précédemment décrite. Le résultat de la segmentation est une carte de segmentation SN_; contenant au moins deux régions distinctes couvrant la totalité de la sous bande segmentée.
L'étape suivante E27 est un test afin de déterminer si tous les niveaux de la décomposition ont été traités, c'est-à-dire si le paramètre i est égal à N-1. Si le test est négatif, il reste encore au moins un niveau à traiter, et dans ce cas l'étape E27 est suivie de l'étape E28, qui incrémente le paramètre i de une unité. L'étape E28 est suivie de l'étape E25 précédemment décrite.
Si le test de l'étape E27 est positif, cette étape est suivie de l'étape E29, au cours de laquelle la carte de segmentation SN de niveau de résolution maximum est codée sans perte et transmise. La segmentation pourra être codée partout procédé de codage sans perte connu de l'homme du métier, par exemple un codage de Freeman sur les contours. Le code de Freeman associe à chaque déplacement élémentaire vers un des voisins sur le contour un code entier suivant une convention préétablie. Pour plus de détails, on pourra se reporter à l'ouvrage collectif: "Analyse d'images : filtrage et segmentation, Editions Masson, 1995".
L'étape E29 est suivie de l'étape E30 qui réalise une analyse de la segmentation SN. Cette analyse consiste à fournir un ordre de priorité pour les régions de la carte de segmentation à ce niveau de résolution, ce qui ordonne les régions. Une mise en oeuvre simple consiste par exemple à parcourir la segmentation à partir du milieu de l'image, en décrivant une spirale, et à classer par ordre d'importance les régions rencontrées au fur et à mesure de la progression. Selon cette démarche, les régions les plus importantes se trouvent au centre de l'image, et les moins importantes en périphérie. Cet ordre d'importance sera généralement adéquat pour une image de type 'tête et épaules '. Pour des types différents d'images, des méthodes plus complexes pourront être mises en aeuvre.
L'étape E30 est suivie de l'étape E31, au cours de laquelle les coefficients des sous bandes de plus basse résolution LLCN, LHCN, HLCN et HHCN sont transmis région par région. L'ordre de transmission des régions est déterminé par l'ordre d'importance issu de l'étape E30 précédente. Ainsi, si deux régions R1 et R2 ont été identifiées et classées dans cet ordre d'importance, les coefficients de la région R1 (à l'intérieur de la zone de segmentation déterminée pour la région R1) sont transmis avant les coefficients correspondant à la région R2.
Au cours de l'étape suivante E32, le paramètre i est initialisé à la valeur 1, pour indiquer le niveau de résolution courant N-i. Cet indicateur sera remis à jour par la suite.
L'étape E32 est suivie de l'étape E33 qui réalise une analyse de la segmentation S(N-i). Cette analyse consiste à fournir un ordre de priorité pour les régions de la carte de segmentation à ce niveau. Cette étape est identique à l'étape E30 précédemment décrite.
L'étape E33 est suivie de l'étape E34 au cours de laquelle les régions des sous bandes codées de détail de niveau de résolution N-i vont être transmises progressivement. Cette étape est identique à l'étape E31 précédemment décrite, mais ne s'applique qu'aux sous bandes de détail, et non à la sous bande de basse fréquence du niveau de résolution considéré.
L'étape suivante E35 est un test afin de déterminer si tous les niveaux de la décomposition ont été traités. Si le test est négatif, il reste au moins un niveau à traiter, et dans ce cas l'étape E35 est suivie de l'étape E36, qui incrémente le compteur de niveaux de une unité. L'étape E36 est suivie de l'étape E33 précédemment décrite. Si le test de l'étape E35 est positif, le codage de l'image numérique et la transmission progressive de l'image codée sont terminés. Bien entendu, si la décomposition de l'image est effectuée sur une unique niveau de résolution, il n'y a pas d'itération, et le traitement est effectué sur ce seul niveau.
L'étape E23 de segmentation d'une sous bande est détaillée à la figure 3 et comporte les sous étapes E90 à E92.
L'étape E90 est une simplification de la sous bande. Une version simplifiée de la sous bande, plus généralement d'une image, sera par exemple obtenue en appliquant à cette dernière un opérateur morphologique d'ouverture/fermeture, suivi d'une reconstruction morphologique. Une description complète de ce procédé peut être trouvée dans l'article de Philippe Salembier intitulé "Morphological multiscale segmentation for image coding" paru dans le magazine "Signal Processing" numéro 38 de 1994. Ce type de traitement élimine les objets plus petits qu'une certaine taille, et restaure les contours des objets qui n'ont pas été supprimés. A l'issue de cette étape on dispose donc d'une version simplifiée de la sous bande, qui va être plus facile à traiter par les étapes suivantes.
L'étape suivante E91 est le marquage, ou extraction des marqueurs, de la sous bande simplifiée. Cette étape identifie la présence des régions homogènes de la sous bande simplifiée, en utilisant un critère qui peut être par exemple un critère d'homogénéité de l'intensité de la région (régions plates). Concrètement, on utilise ici par exemple un algorithme de croissance de régions : la sous bande est balayée dans sa totalité (par exemple de haut en bas et de droite a gauche). On recherche un "germe" c'est-à-dire un point, ici un coefficient, représentatif d'une nouvelle région (le premier coefficient de la sous bande en sera automatiquement un). La caractéristique de cette région (valeur moyenne) est calculée sur la base de ce point. Puis tous les voisins de ce point sont alors examinés, et pour chacun des voisins s'offrent deux possibilités - si le point rencontré possède une intensité proche de la valeur moyenne de la région considérée, il est affecté à la région courante, et les statistiques de cette région sont remises à jour en fonction de ce nouvel élément, -si le point rencontré possède une intensité différente (au sens d'un critère de proximité) de la valeur moyenne de la région, il n'est pas affecté à la région (il pourra par la suite être considéré comme un nouveau "germe" représentatif d'une nouvelle région).
Tous les voisins affectés à la région courante sont alors eux- mêmes soumis à examen, c'est à dire que tous leurs voisins sont examinés (phase de croissance).
Le traitement de la région continue ainsi jusqu'à ce que tous les points voisins des points appartenant à la région aient été examinés. A l'issue de ce traitement, la région est considérée bonne ou mauvaise. Si elle est mauvaise (typiquement, trop petite), c'est l'étape de décision qui traitera les points de la région en question. Si elle est bonne, le traitement est terminé pour elle. Un label ou identifiant unique est alors affecté à tous les points de la région. Le traitement global se poursuit alors par la recherche d'un nouveau germe.
L'étape suivante E92 est la décision. Elle consiste à rattacher à une région tous les points qui n'ont pas de label à l'issue de l'étape de marquage E91 (typiquement, les points qui ont été rattachés à des régions trop petites). Cette étape peut être effectuée simplement en considérant chacun des points qui ne possède pas de label, et en l'affectant à la région voisine dont il est le plus proche (au sens d'un critère de proximité).
Selon l'exemple de réalisation choisi et représenté à la figure 4a, une image numérique IM est décomposée en sous bandes, segmentée puis codée de manière progressive avant transmission.
L'image IM est décomposée en sous bandes (étape E20). Trois blocs successifs d'analyse décomposent l'image successivement en trois jeux de sous bandes 31, 32 et 33, selon trois niveaux de résolution RES,, RES2 et RES3.
Toutes les sous bandes LL3, ..., HH, issues de la décomposition sont alors codées, ce qui forme des sous bandes codées LLC3, ..., HHC1, conformément à l'étape E21. La structure résultante 34 est alors décodée (étape E22), en utilisant des moyens de décodage correspondant au codage utilisé à l'étape précédente. On obtient alors la structure 35 contenant toutes les sous bandes décodées LLD3, ..., HHD2, sauf celles qui correspondent au niveau de résolution le plus élevé.
L'étape suivante consiste à effectuer une segmentation sur la sous bande de plus basse fréquence décodée LLD3. Cette segmentation S3 contient par exemple deux régions R31 et R32, où R32 représente le fond et R31 la tête d'un personnage.
L'étape suivante est une synthèse sur un niveau des sous bandes de résolution la plus basse RES1. Le résultat de la synthèse est une sous bande reconstruite LLS2 sur laquelle une seconde segmentation est effectuée. On obtient une carte de segmentation S2 contenant par exemple trois régions R21 (tête), R2'2(corps) et R2'3 (fond). On utilise la notation R' lorsque une région d'un niveau de résolution donné se divise en deux régions au niveau de résolution supérieur. Par exemple, le fond R32 de la carte de segmentation S3 se divise en deux objets R2'2 et R2'3 (corps et fond) dans la carte de segmentation S2.
L'étape suivante est une synthèse sur un niveau des sous bandes de résolution immédiatement supérieure RES2. Le résultat de la synthèse est une sous bande reconstruite LLS, sur laquelle une troisième segmentation est effectuée. On obtient une carte de segmentation S1 contenant les régions Rj1 (Tête), Rl'2(Corps), Ri"3(Lune) et Ri"4(Fond).
L'étape ultime du codage, non représentée sur cette figure, va consister à ordonner les régions (typiquement tête, corps, lune, fond par ordre décroissant d'importance), et transmettre les coefficients correspondant à ces régions, niveau par niveau et région par région. Dans cet exemple, on aboutit alors à la structure de flux binaire représentée à la figure 4b.
La figure 4b représente le flux binaire correspondant à l'exemple de la figure 4a.
Selon cet exemple, une image numérique IM a été décomposée en sous bandes, chacune des sous bandes codées. Une segmentation hiérarchique constituée des cartes de segmentation S3, S2, S1 (carte de segmentation à chaque niveau) a été calculée. Cette segmentation hiérarchique contient au total quatre objets R1(téte), R2(corps), R3(croissant de lune), R4(fond) que l'on peut retrouver dans S3 (R31, R32), dans S2 (R21, R2'2 et R2'3) et dans S1 (R11, Rl'2, Ri"3 et Ri"4).
La construction du flux binaire va être réalisée de manière totalement hiérarchique, tant en résolution qu'en nombre d'objets. Pour ce faire, le codeur range les données codées dont il dispose de manière croissante en résolution (de RES3 vers RES,) et en objets (de R1 vers R4).
La première étape consiste à mettre dans le flux binaire la carte de segmentation de niveau de plus basse résolution, S3. En effet, cette segmentation doit impérativement être transmise au décodeur si l'on veut lui transmettre les régions associées les unes après les autres.
Dans une seconde étape, les coefficients des sous bandes codées LLC3,..., LHC3 sont insérés dans le flux binaire, par ordre d'importance des régions qui leurs sont associés. Ainsi, on transmettra d'abord les coefficients correspondant à R31, puis à R32.
Dans une troisième étape, les coefficients des sous bandes LHC2, ..., HHC2 sont insérés dans le flux binaire, par ordre d'importance des régions. Ainsi, on transmettra d'abord les coefficients correspondant à R21, puis à R2'2, puis à R2'3.
Dans une quatrième étape, les coefficients des sous bandes LHC,, ..., HHC, sont insérés dans le flux binaire, par ordre d'importance des régions. Ainsi, on transmettra d'abord les coefficients correspondant à Rit, puis à Rl'2, puis à Rl" 3, puis à Rl"4.
Le résultat est que les données sont rangées par ordre d'importance (au sens des objets) et par ordre de résolution croissante.
En référence à la figure 5, un mode de réalisation du procédé de décodage selon l'invention d'une image IM codée selon le procédé de codage précédemment exposé comporte des étapes E400 à E412 qui sont parcourues par l'unité centrale du dispositif 10 précédemment décrit. Le procédé de décodage comporte globalement la réception ou le calcul de la segmentation à chaque niveau de résolution, l'analyse de cette segmentation, la réception et le décodage de chacune des régions de coefficients sous bandes dans l'ordre d'analyse, et la synthèse de la sous bande basse de niveau supérieur et pour le dernier niveau, la synthèse de l'image originale.
L'étape E400 est la réception et le décodage de la carte de segmentation SN de plus bas niveau de résolution. On suppose que cette segmentation a été codée par une méthode sans perte, on récupère donc la segmentation sans perte. La méthode de décodage correspond bien entendu à la méthode de codage qui a été utilisée au codeur (étape E29).
L'étape E400 est suivie de l'étape E401 au cours de laquelle la segmentation est analysée, par un procédé identique à celui qui a été décrit lors de l'étape E30 du procédé de codage. A l'issue de cette analyse, on dispose d'un classement des régions par ordre d'importance correspondant à l'ordre de transmission, et par conséquent de réception, de ces régions.
Connaissant la forme des régions et l'ordre de réception, on peut au cours de l'étape E402 recevoir progressivement les coefficients sous bandes des régions en question. Au cours de cette même étape E402, ces régions sont décodées par un procédé de décodage correspondant au procédé de codage utilisé au moment du codage, et décrit dans l'étape E22 de la figure 2.
L'étape E402 est suivie de l'étape E403 au cours de laquelle les sous bandes de plus bas niveau de résolution sont reconstituées en additionnant sous bande par sous bande les coefficients reçus pour chaque région. Comme, par définition, il n'existe pas de recouvrement entre les régions définies par la segmentation, l'addition se résume à une superposition de tous les coefficients de toutes les régions.
Au cours de l'étape suivante E404, un paramètre i est initialisé à la valeur 1. Le paramètre i est un indicateur de niveau pour indiquer le niveau de résolution courant N-i. Cet indicateur sera remis à jour par la suite.
L'étape E404 est suivie de l'étape E405 au cours de laquelle une synthèse est effectuée sur le niveau de résolution immédiatement inférieur au niveau courant. L'étape de synthèse a pour résultat une sous bande basse reconstruite de résolution immédiatement supérieure aux sous bandes qui ont servi à la synthèse. Cette étape est identique à l'étape E25 du procédé de codage. Elle fournit en sortie la sous bande basse synthétisée LLSN_;. Au cours de l'étape E406, cette sous bande est segmentée pour fournir la carte de segmentation S(N-i). L'étape E406 est identique à l'étape E26 du codeur.
L'étape E406 est suivie de l'étape E407, au cours de laquelle la segmentation S(N-i) est analysée. Cette étape est identique à l'étape E33 du codeur. A l'issue de cette analyse, on dispose d'un classement des régions par ordre d'importance qui, comme précédemment correspond à l'ordre de transmission, et donc de réception de ces régions.
Connaissant la forme des régions et l'ordre de réception, on peut au cours de l'étape E408 recevoir progressivement les coefficients sous bandes des régions en question, et les décoder par un procédé de décodage correspondant au procédé de codage utilisé dans le procédé de codage. L'étape E408 est suivie de l'étape E409 au cours de laquelle les sous bandes du niveau de résolution courant sont reconstituées en additionnant sous bande par sous bande les coefficients reçus pour chaque région.
L'étape suivante E410 est un test afin de déterminer si tous les niveaux de la décomposition souhaités ont été traités, c'est-à-dire si le paramètre i est égal à N-1. Si le test est négatif, il reste au moins un niveau à traiter, et dans ce cas l'étape E410 est suivie de l'étape E411, qui incrémente le paramètre i de une unité. L'étape E411 est suivie de l'étape E405 précédemment décrite.
Si le test de l'étape E410 est positif, alors cette étape est suivie de l'étape E412 qui est la synthèse des sous bandes du niveau de résolution le plus élevé dans la décomposition. Cette synthèse a pour résultat l'image reconstruite.
II est à remarquer que pour des raisons telles que suffisance de la qualité de l'image reçue, temps d'attente trop élevé, l'utilisateur du dispositif de décodage peut, par exemple par l'intermédiaire du clavier, interrompre le décodage dudit signal.
Pour cela, par exemple, L'unité centrale lit périodiquement l'état du clavier et lorsque une information représentative de l'interruption de la réception est générée, l'unité centrale met une variable d'interruption STOP au niveau 1. Lorsque l'étape E410 est ensuite parcourue, la variable STOP étant au niveau 1, le test sera positif et l'étape E410 sera suivie de l'étape E412 qui fournira l'image synthétisée à partir des données disponibles à ce moment là.
Selon l'exemple de réalisation choisi et représenté à la figure 6, une image numérique codée comme précédemment décrit est reçue par transmission progressive, décodée puis reconstruite sur 3 niveaux de résolution RES1, RES2 et RES3.
Cette figure illustre les étapes de décodage correspondant aux étapes de codage de la figure 4a, et au flux binaire de la figure 4b.
Au niveau de résolution le plus faible RES3, le décodeur reçoit tout d'abord la carte de segmentation S3de niveau 3. Cette segmentation est décodée et analysée, conformément aux étapes décrites dans la figure 5. L'analyse de cette segmentation permet dans cet exemple de détecter deux régions R31 (tête) et R32 (fond), dans cet ordre.
Les coefficients correspondant à la région R31 dans les sous bandes LLC3, LHC3, HLC3 et HHC3 sont alors reçus et décodés, puis les coefficients de ces mêmes sous bandes correspondant à la région R32 sont reçus et décodés. Les deux jeux de sous bandes correspondants à R31 et R32 sont additionnés (sous bande par sous bande), afin de reconstruire les sous bandes LLC3,...., HHC3 dans leur intégralité (structure 500). On effectue alors une synthèse sur un niveau, afin de synthétiser la sous bande basse de niveau supérieur, LLS2. Cette sous bande basse (identique à la sous bande basse LLS2 formée lors du codage) est alors segmentée pour produire la carte de la segmentation S2 qui est identique à la segmentation S2 déterminée lors du codage.
Au second niveau de résolution, l'analyse de la segmentation S2 va permettre de contrôler la réception des régions les unes après les autres dans notre exemple, l'analyse de la segmentation S2 permet en effet de classer les trois régions du niveau 2 par ordre de priorité, et donc de réception : R21 (tête), R2'2(corps), puis R2'3(fond). Lorsque toutes les régions du niveau 2 ont été reçues, ces régions sont additionnées les unes aux autres pour produire les sous bandes HHC2, LHC2, HLC2 du niveau 2.
Comme on dispose par ailleurs de la sous bande basse LLS2 synthétisée à l'étape précédente, la synthèse sur un niveau des sous bandes du niveau 2 est maintenant possible, qui va produire la sous bande LLS, du niveau 1. Cette sous bande basse (identique â la sous bande basse LLS, formée lors du codage) est alors segmentée pour produire la segmentation S1 (identique à la segmentation S1 déterminée lors du codage).
Au niveau de résolution le plus élevé RES,, l'analyse de la segmentation S1 va permettre de contrôler la réception des régions les unes après les autres. Dans cet exemple, l'analyse de S1 permet en effet de classer les quatre régions du niveau 1 par ordre de priorité, et donc de réception : R,1 (tête), Ri" 2 (corps), R," 3(croissant de lune), et enfin R,"4(fond). Lorsque toutes les régions du niveau 1 ont été reçues, ces régions sont additionnées les unes aux autres pour produire les sous bandes HHC,, LHC,, HLC, du niveau 1. Comme on dispose par ailleurs de la sous bande basse LLS, synthétisée à l'étape précédente, on peut entamer une procédure de synthèse sur un niveau des sous bandes du niveau 1, qui va produire l'image reconstruite IM'. Le décodage est terminé.
II est important de noter qu'il est possible d'interrompre le décodage à n'importe laquelle des étapes mentionnées ci-dessus. II sera tout de même possible de fournir au moins une partie de l'image IM reconstruite (à une résolution réduite, avec un nombre d'objets réduit...). On a ainsi réalisé une véritable scalabilité, tant spatiale qu'en nombre d'objets.
Conformément à la figure 7, le signal numérique à compresser SI est dans ce mode particulier de réalisation une suite d'échantillons numériques représentant une image.
Le dispositif comporte une source de signal 30, ici de signal d'image qu'il soit une image fixe ou une séquence d'image. De manière générale, la source de signal soit contient le signal numérique, et comporte par exemple une mémoire, un disque dur ou un CD-ROM, soit convertit un signal analogique en signal numérique, et est par exemple un caméscope analogique associé à un convertisseur analogique-numérique. La source d'image 30 génère une suite d'échantillons numériques représentant une image IM. Le signal d'image IM est une suite de mots numériques, par exemple des octets. Chaque valeur d'octet représente un pixel de l'image IM, ici à 256 niveaux de gris ou en couleur.
Une sortie de la source de signal 30 est reliée à un circuit d'analyse, ou de décomposition en sous-bandes 60. Le circuit 60 a une première sortie 60, reliée à un circuit de codage 61. Ce circuit de codage 61 reçoit la sous-bande de plus basse fréquence et code les données selon des techniques classiques telles que codage DPCM (Differential Pulse Code Modulation, ou en Français, Modulation par codage d'impulsion différentielle), qui est un codage par prédiction linéaire, avec perte. Chaque pixel de la sous- bande à coder LL3 est prédit en fonction de ses voisins, et cette prédiction est soustraite de la valeur du pixel considéré, dans le but de former une "image" différentielle qui présente moins de corrélation entre pixels que l'image originale.
Ce circuit de codage 61 est relié à un circuit de segmentation 62 qui va générer une carte de segmentation contenant au moins deux régions distinctes couvrant la totalité de la sous bande segmentée. II est également relié à un circuit de décodage et de synthèse 65, de manière à fournir à celui-ci la sous bande de plus basse fréquence. Le circuit de codage 61 est enfin relié à un circuit de transmission 68.
La sous bande de plus basse fréquence ainsi segmentée est codée par le bloc 63 selon un codage sans perte, c'est à dire un codage n'entraînant aucune dégradation de l'information, typiquement un codage de Freeman sur les contours. Le circuit 63 est relié à un circuit de transmission 68 pour lui fournir le résultat du codage de la carte de segmentation de la sous bande de plus basse fréquence.
Des secondes sorties 602 du circuit de décomposition 60 sont reliées à un circuit de codage des coefficients de la décomposition 64. Le circuit 64 a sa sortie reliée au bloc 68 de transmission des informations. Le circuit 64 est relie au circuit de décodage et de synthèse 65 qui va effectuer, si les coefficients ont été codés selon une méthode DPCM précédemment décrite un décodage sous forme de DPC M inverse, et l'inverse d'une décomposition (synthèse d'un niveau) en sous bande sur un niveau, c'est à dire la recomposition du niveau supérieur au niveau courant, sous la forme de la sous bande basse de ce niveau supérieur. Classiquement, une étape de synthèse comporte des opérations de sur-échantillonnage et de filtrage, les filtrages étant les inverses de ceux utilisés lors de l'analyse.
Si le codage est restreint à une étape de quantification, on peut effectuer directement l'inverse d'une décomposition en sous bande sur un niveau.
Le bloc de synthèse 65 fournit l'image ainsi recréée au circuit de segmentation 66, identique dans cet exemple au bloc 62. Le circuit 66 effectue une segmentation des sous bandes de basse fréquence de chaque niveau de résolution.
Le circuit 66 est relié à un circuit d'analyse 67. Ce dernier reçoit le résultat de la segmentation et analyse le contenu de la segmentation pour déterminer l'ordre des régions pour chaque niveau de résolution. Le circuit 67 est relié au circuit 68 de transmission.
Les sous-bandes codées LHC3, HLC3 et HHC3, ainsi que les sous- bandes codées de résolution supérieure HLC2, LHC2, HHC2, HLC,, LHC, et HHC, sont fournies au circuit de transmission 68, selon les résolutions croissantes. Conformément à l'analyse effectuée par le circuit 67, les coefficients sous bande d'un niveau de résolution donné sont ordonnés par région tel que représenté à la figure 4a.
Selon un mode préféré de réalisation de l'invention, les circuits mentionnés ci dessus peuvent être réalisés par un microprocesseur associé à des mémoires vives et mortes. La mémoire morte comporte un programme pour décoder les données, et la mémoire vive comporte des registres adaptés à enregistrer des variables modifiées au cours de l'exécution du programme.
Le circuit de décomposition en sous-bandes 60, ou circuit d'analyse, est un ensemble classique de filtres, respectivement associés à des décimateurs par deux, qui filtrent le signal d'image selon deux directions, en sous-bandes de hautes et basses fréquences spatiales. Selon la figure 8, le circuit 60 comporte trois blocs successifs d'analyse pour décomposer l'image IM en des sous-bandes selon trois niveaux de résolution.
De manière générale, la résolution d'un signal est le nombre d'échantillons par unité de longueur utilisés pour représenter ce signal. Dans le cas d'un signal d'image, la résolution d'une sous-bande est liée au nombre d'échantillons par unité de longueur pour représenter cette sous-bande. La résolution dépend notamment du nombre de décimations effectuées.
Le premier bloc d'analyse reçoit le signal numérique d'image et l'applique à deux filtres numériques respectivement passe-bas et passe-haut 601 et 602 qui filtrent le signal d'image selon une première direction, par exemple horizontale dans le cas d'un signal d'image. Après passage par des décimateurs par deux 6100 et 6200, les signaux filtrés résultant sont respectivement appliqués à deux filtres passe-bas 603 et 605, et passe-haut 604 et 606, qui les filtrent selon une seconde direction, par exemple verticale dans le cas d'un signal d'image. Chaque signal filtré résultant passe par un décimateur par deux respectif 6300, 6400, 6500 et 6600. Le premier bloc délivre en sortie quatre sous-bandes LL,, LH,, HL, et HH, de résolution RES, la plus élevée dans la décomposition.
La sous-bande LL, comporte les composantes, ou coefficients, de basse fréquence, selon les deux directions, du signal d'image. La sous-bande LH, comporte les composantes de basse fréquence selon une première direction et de haute fréquence selon une seconde direction, du signal d'image. La sous-bande HL, comporte les composantes de haute fréquence selon la première direction et les composantes de basse fréquence selon la seconde direction. Enfin, la sous-bande HH, comporte les composantes de haute fréquence selon les deux directions.
Chaque sous-bande est une image construite à partir de l'image d'origine, qui contient de l'information correspondant à une orientation respectivement verticale, horizontale et diagonale de l'image, dans une bande de fréquence donnée.
La sous-bande LL, est analysée par un bloc d'analyse analogue au précédent pour fournir quatre sous-bandes LL2, LH2, HL2 et HH2 de niveau de résolution RES2 intermédiaire dans la décomposition. La sous-bande LL2 comporte les composantes de basse fréquence selon les deux directions d'analyse, et est à son tour analysée par le troisième bloc d'analyse analogue aux deux précédents. Le troisième bloc d'analyse fournit des sous-bandes LL3, LH3, HL3 et HH3, de résolution RES3 la plus faible dans la décomposition, résultant du découpage en sous-bandes de la sous-bande LL2.
Chacune des sous-bandes de résolution RES2 et RES3 correspond également à une orientation dans l'image.
La décomposition effectuée par le circuit 60 est telle qu'une sous- bande d'une résolution donnée est découpée en quatre sous-bandes de résolution inférieure et a donc quatre fois plus de coefficients que chacune des sous-bandes de résolution inférieure.
Une image numérique IM en sortie de la source d'image 30 est représentée de manière schématique à la figure 9, tandis que la figure 10 représente l'image IMD résultant de la décomposition de l'image IM, en dix sous-bandes selon trois niveaux de résolution, par le circuit 60. L'image IMD comporte autant d'information que l'image d'origine IM, mais l'information est fréquentiellement découpée selon trois niveaux de résolution. Le niveau de plus basse résolution RES3 comporte les sous- bandes LL3, HL3, LH3 et HH3, c'est-à-dire les sous-bandes de basse fréquence selon les deux directions d'analyse. Le second niveau de résolution RES2 comporte les sous-bandes HL2, LH2 et HH2 et le niveau de plus haute résolution RES, comporte les sous-bandes de plus haute fréquence HL,, LH, et HH,.
La sous-bande LL3 de plus basse fréquence est une réduction de l'image d'origine. Les autres sous-bandes sont des sous-bandes de détail.
Bien entendu, le nombre de niveaux de résolution, et par conséquent de sous-bandes, peut être choisi différemment, par exemple 13 sous-bandes et quatre niveaux de résolution, pour un signal bi-dimensionnel tel qu'une image. Le nombre de sous-bandes par niveau de résolution peut également être différent. Les circuits d'analyse et de synthèse sont adaptés à la dimension du signal traité. En référence à la figure 11, le dispositif de décodage 11 réalise globalement des opérations inverses de celles du dispositif de codage. Le dispositif de décodage est intégré dans un appareil de traitement et visualisation numérique, qui est par exemple un lecteur d'image numérique, ou de séquence vidéo numérique, ou un système de gestion de base de données, ou encore un ordinateur.
Un même appareil peut comporter à la fois le dispositif de codage et le dispositif de décodage selon l'invention, de manière à effectuer des opérations de codage et de décodage.
Le dispositif de décodage comporte une source de données codées 1106 qui comporte par exemple un circuit de réception associé à une mémoire tampon. La source 1106 fournit un train binaire d'informations reçues qui contient tout d'abord la carte de segmentation codée du niveau de résolution le plus faible, puis les coefficients des sous bandes décomposées et codées par le codeur.
La sortie 1106, du circuit 1106 est reliée à un circuit 1107 de décodage de la carte de segmentation. Ce circuit est relié à un circuit 1100 d'analyse de la carte de segmentation.
La sortie 1106, du circuit 1106 est également reliée à un circuit 1101 de décodage des coefficients. La source 1106 fournit ainsi au circuit 1101 les coefficients des sous bandes décomposées et codées par le codeur, pour que le circuit 1101 les décode.
Les circuits 1100 et 1101 sont reliés au circuit 1102 de reconstruction des sous bandes. Ce dernier reçoit la carte de segmentation décodée ainsi que les coefficients des sous bandes décodés et reconstruit avec les deux types d'information la sous bande transmise.
Comme détaillé en référence aux figures 5 et 6, le décodeur reçoit tout d'abord la carte de segmentation du niveau 3, l'utilise pour déterminer les régions, et reçoit alors dans l'ordre les coefficients sous bandes correspondant aux régions. Lorsque toutes les régions ont été reçues, les sous bandes du niveau de résolution considéré ont été reçues et peuvent être reconstruites.
Le circuit 1102 est relié à un circuit de synthèse 1103 qui reçoit les sous bandes reconstruites et effectue une synthèse sur un niveau de ces dernières. Le circuit 1103 est relié à un circuit de segmentation 1104 et à un circuit d'exploitation 1105. Lorsque l'image n'a pas été complètement reconstruite, les données en cours de décodage sont transmises au circuit 1104 qui effectue une segmentation de celles-ci. En effet selon l'invention, seule la carte de segmentation sur un niveau et plus particulièrement la carte de segmentation de la sous bande basse de plus bas niveau de décomposition est transmise. II est donc nécessaire pour le décodeur de recréer pour chacun des autres niveaux de décomposition la carte de segmentation associée. Avantageusement et selon l'invention, comme la segmentation au niveau du codeur a été effectuée après le codage ou de manière plus simple la quantification, le décodeur disposera des même informations que le codeur et pourra reconstruire une carte de segmentation identique.
Le circuit 1104 est reliée au bloc d'analyse de la carte de segmentation 1100 précédemment décrit pour lui fournir cette carte de segmentation. Les coefficients des sous bandes du niveau supérieur ayant été reçus et décodés par le bloc 1101, une reconstruction de la sous bande basse de niveau supérieur pourra être effectuée par le circuit 1102, le dispositif de décodage disposant des deux informations nécessaires a la reconstruction de celle-ci. Ces itérations seront effectuées autant de fois qu'il existe de niveaux de décomposition.
Lorsque tous les niveaux de résolution ont été parcourus, le circuit 1103 synthétise l'image reconstruite et la fournit au circuit d'exploitation 1105.
Selon une variante, les étapes de reconstruction pourront être interrompues à tout instant par l'utilisateur par l'intermédiaire du clavier 114 (figure 1).
Selon un mode préféré de réalisation de l'invention, les circuits mentionnés ci dessus peuvent être réalisés par un microprocesseur associé à des mémoires vives et mortes. La mémoire morte comporte un programme pour décoder les données, et la mémoire vive comporte des registres adaptés à enregistrer des variables modifiées au cours de l'exécution du programme.
Bien entendu, la présente invention n'est nullement limitée aux modes de réalisation décrits et représentés, mais englobe, bien au contraire, toute variante à la portée de l'homme du métier.

Claims (22)

<U>REVENDICATIONS</U>
1. Procédé de codage d'un ensemble de données (1M) représentatives de grandeurs physiques, caractérisée en ce qu'il comporte les étapes de - décomposition (E20) de l'ensemble de données en une pluralité de sous bandes de fréquence sur au moins un niveau de résolution, puis, pour chaque niveau de résolution, - segmentation ((E23, E26) d'au moins une sous bande en au moins deux régions homogènes, pour former une carte de segmentation, - ordonnancement (E30, E33) des régions selon un critère prédéterminé, - codage (E21) des sous bandes du niveau de résolution considéré, - ordonnancement (E31, E34) des données de codage des sous bandes en fonction de l'ordre des régions.
2. Procédé de codage selon la revendication 1, caractérisé en ce qu'il comporte le codage (E29) de la carte de segmentation d'au moins un niveau de résolution.
3. Procédé de codage selon la revendication 1, caractérisé en ce qu'il comporte le codage (E29) de la carte de segmentation du niveau de résolution le plus faible dans la décomposition.
4. Procédé de codage selon l'une quelconque des revendications 1 à 3, caractérisé en ce que les sous bandes sont codées puis décodées (E21, E22) préalablement à la segmentation.
5. Procédé de codage selon l'une quelconque des revendications 1 à 4, caractérisé en ce que la segmentation (E23, E26) est effectuée sur la sous bande de plus basse fréquence du niveau de résolution considéré.
6. Procédé de codage selon l'une quelconque des revendications 1 à 5, caractérisé en ce que le critère d'ordonnancement dépend d'une analyse de la segmentation.
7. Procédé de codage selon l'une quelconque des revendications 1 à 6, caractérisé en ce qu'il comporte en outre la transmission (E29) de la carte de segmentation déterminée au niveau de résolution le plus faible et des données de codage de toutes les sous bandes, pour tous les niveaux de résolution.
8. Procédé de décodage de données représentatives de grandeurs physiques codées par le procédé de codage selon l'une quelconque des revendications 1 à 7, caractérisé en ce que, pour un niveau de résolution donnée, il comporte les étapes de - analyse (E401, E407) de la segmentation pour classer les régions selon un critère prédéterminé, - décodage (E402, E408) des données de codage des sous bandes du niveau de résolution considéré en fonction du résultat de l'étape précédente, - reconstruction ((E403, E409) des sous bandes, - synthèse (E405, E412) des sous bandes reconstruites.
9. Dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisée en ce qu'il comporte - des moyens (60) de décomposition de l'ensemble de données en une pluralité de sous bandes de fréquence sur au moins un niveau de résolution, - des moyens (62, 66) de segmentation, pour chaque niveau de résolution, d'au moins une sous bande en au moins deux régions homogènes, pour former une carte de segmentation, - des moyens (67) d'ordonnancement des régions selon un critère prédéterminé, - des moyens (61, 64) de codage des sous bandes du niveau de résolution considéré, - des moyens (67) d'ordonnancement des données de codage des sous bandes en fonction de l'ordre des régions.
10. Dispositif de codage selon la revendication 9, caractérisé en ce qu'il comporte des moyens (63) de codage de la carte de segmentation d'au moins un niveau de résolution.
11. Dispositif de codage selon la revendication 9, caractérisé en ce qu'il comporte des moyens (63) de codage de la carte de segmentation du niveau de résolution le plus faible dans la décomposition.
12. Dispositif de codage selon l'une quelconque des revendications 9 à 11, caractérisé en ce qu'il comporte des moyens de codage et de décodage (64, 65) des sous bandes en amont des moyens de segmentation.
13. Dispositif de codage selon l'une quelconque des revendications 9 à 12, caractérisé en ce que les moyens de segmentation (62, 66) effectuent une segmentation de la sous bande de plus basse fréquence du niveau de résolution considéré.
14. Dispositif de codage selon l'une quelconque des revendications 9 à 13, caractérisé en ce qu'il est adapté à mettre en oeuvre un critère d'ordonnancement qui dépend d'une analyse de la segmentation.
15. Dispositif de codage selon l'une quelconque des revendications 9 à 14, caractérisé en ce qu'il comporte en outre des moyens (68) de transmission de la carte de segmentation déterminée au niveau de résolution le plus faible et des données de codage de toutes les sous bandes, pour tous les niveaux de résolution.
16. Dispositif de codage selon l'une quelconque des revendications 9 à 15, caractérisé en ce que les moyens de segmentation, d'ordonnancement, de codage et d'ordonnancement sont incorporés dans - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour coder l'ensemble de données, et - une mémoire vive (103) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
17. Dispositif de décodage de données représentatives de grandeurs physiques codées par le dispositif de codage selon l'une quelconque des revendications 1 à 16, caractérisé en ce qu'il comporte -des moyens (1100) d'analyse de la segmentation, pour un niveau de résolution considéré, pour classer les régions selon un critère prédéterminé, -des moyens (1101) de décodage des données de codage des sous bandes du niveau de résolution considéré en fonction du résultat de l'étape précédente, - des moyens (1102) de reconstruction des sous bandes, - des moyens (1103) de synthèse des sous bandes reconstruites.
18. Dispositif de décodage selon la revendication 17, caractérisé en ce que les moyens d'analyse, de décodage, de reconstruction et de synthèse sont incorporés dans <B>-</B>un microprocesseur (100), - une mémoire morte (102) comportant un programme pour décoder les données, et -une mémoire vive (103) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
19. Appareil (10) de traitement de signal numérique, caractérisé en ce qu'il comporte des moyens adaptés à mettre en ceuvre le procédé de codage selon l'une quelconque des revendications 1 à 7.
20. Appareil (10) de traitement de signal numérique, caractérisé en ce qu'il comporte des moyens adaptés à mettre en ceuvre le procédé de décodage selon la revendication 8.
21. Appareil (10) de traitement de signal numérique, caractérisé en ce qu'il comporte le dispositif de codage selon l'une quelconque des revendications 9 à 16.
22. Appareil (10) de traitement de signal numérique, caractérisé en ce qu'il comporte le dispositif de décodage selon l'une quelconque des revendications 17 à 18.
FR9907585A 1999-06-15 1999-06-15 Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation Withdrawn FR2795274A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR9907585A FR2795274A1 (fr) 1999-06-15 1999-06-15 Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation
EP00401680A EP1079625A3 (fr) 1999-06-15 2000-06-14 Codage, décodage et transmission du signal avec décomposition en sous-bandes de fréquence et segmentation
US09/593,695 US6711298B1 (en) 1999-06-15 2000-06-15 Digital signal coding, decoding and transmission, with decomposition into frequency sub-bands and segmentation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9907585A FR2795274A1 (fr) 1999-06-15 1999-06-15 Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation

Publications (1)

Publication Number Publication Date
FR2795274A1 true FR2795274A1 (fr) 2000-12-22

Family

ID=9546837

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9907585A Withdrawn FR2795274A1 (fr) 1999-06-15 1999-06-15 Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation

Country Status (1)

Country Link
FR (1) FR2795274A1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997015145A1 (fr) * 1995-10-18 1997-04-24 Philips Electronics N.V. Procede de codage et de decodage de la texture par regions, et systemes correspondants
WO1997016030A1 (fr) * 1995-10-25 1997-05-01 Philips Electronics N.V. Procede et systeme de codage d'images segmentees, et procede et systeme de decodage correspondants

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997015145A1 (fr) * 1995-10-18 1997-04-24 Philips Electronics N.V. Procede de codage et de decodage de la texture par regions, et systemes correspondants
WO1997016030A1 (fr) * 1995-10-25 1997-05-01 Philips Electronics N.V. Procede et systeme de codage d'images segmentees, et procede et systeme de decodage correspondants

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CALVAGNO G ET AL: "LOW BIT RATE VIDEO CODING BASED ON GENERALIZED PREDICTION OF THE PYRAMID SUBBAND DECOMPOSITION", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING. (ICIP),US,LOS ALAMITOS, IEEE COMP. SOC. PRESS, 23 October 1995 (1995-10-23), pages 422-425, XP000623997, ISBN: 0-7803-3122-2 *
CASAS J R ET AL: "A REGION-BASED SUBBAND CODING SCHEME", SIGNAL PROCESSING. IMAGE COMMUNICATION,NL,ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, vol. 10, no. 1/03, July 1997 (1997-07-01), pages 173-200, XP000691765, ISSN: 0923-5965 *
LU C S ET AL: "UNSUPERVISED TEXTURE SEGMENTATION VIA WAVELET TRANSFORM", PATTERN RECOGNITION,US,PERGAMON PRESS INC. ELMSFORD, N.Y, vol. 30, no. 5, May 1997 (1997-05-01), pages 729-742, XP000686640, ISSN: 0031-3203 *
OEHLER K L: "REGION-BASED WAVELET COMPRESSION FOR VERY LOW BITRATE VIDEO CODING", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP),US,NEW YORK, IEEE, 16 September 1996 (1996-09-16), pages 573-576, XP000733306, ISBN: 0-7803-3259-8 *
SALARI E ET AL: "TEXTURE SEGMENTATION USING HIERARCHICAL WAVELET DECOMPOSITION", PATTERN RECOGNITION,US,PERGAMON PRESS INC. ELMSFORD, N.Y, vol. 28, no. 12, December 1995 (1995-12-01), pages 1819-1824, XP000542193, ISSN: 0031-3203 *

Similar Documents

Publication Publication Date Title
FR2889382A1 (fr) Procede et dispositif de filtrage d&#39;un signal numerique multidimensionnel et procedes et dispositifs de codage et decodage associes
FR2724791A1 (fr) Appareil de compression de donnees utilisant des ondes elementaires implantees reversibles
FR2826823A1 (fr) Procede et dispositif de traitement d&#39;un signal numerique code
FR2826227A1 (fr) Procede et dispositif de traitement d&#39;un signal numerique code
FR2817440A1 (fr) Insertion de messages dans des donnees numeriques
FR2790173A1 (fr) Dispositif et procede de transformation de signal numerique
FR2755818A1 (fr) Codage de signal numerique par decomposition en sous-bandes de frequence et quantification vectorielle a etats finis
FR2906093A1 (fr) Procedes et dispositifs de codage et de decodage, systeme de telecommunication et programme d&#39;ordinateur les mettant en oeuvre
FR2792150A1 (fr) Procedes et dispositis de codage et de decodage de signaux numeriques, et systemes les mettant en oeuvre
FR2825224A1 (fr) Procede et dispositif de compression et ou d&#39;indexation d&#39;images numeriques
FR2927744A1 (fr) Procede et dispositif de filtrage d&#39;un signal numerique.
FR2792151A1 (fr) Procedes et dispositifs de codage et de decodage de signaux numeriques, et systemes les mettant en oeuvre
FR2795274A1 (fr) Codage et decodage de signal numerique, avec decomposition et sous bandes de frequence et segmentation
FR2927745A1 (fr) Procede et dispositif de codage d&#39;un signal numerique.
FR3068556A1 (fr) Procede de decodage d&#39;une image, procede de codage, dispositifs, equipement terminal et programmes d&#39;ordinateurs associes
FR2929431A1 (fr) Procede et dispositif de classification des echantillons representatifs d&#39;un signal numerique d&#39;image
FR2817697A1 (fr) Procede et dispositif de traitement d&#39;un ensemble de donnees representatives de grandeurs physiques
FR2914467A1 (fr) Procedes et dispositifs de codage et de decodage de signaux numeriques multidimensionnels.
FR2778039A1 (fr) Codage et decodage de signal numerique
WO2022175419A1 (fr) Procédé de fourniture d&#39;un contenu comportant au moins une image, format de fichier
FR2778038A1 (fr) Codage de signal numerique
FR2826225A1 (fr) Segmentation spatio-temporelle hierarchique d&#39;un signal numerique
FR2822331A1 (fr) Codage et decodage de signal numerique, avec segmentation hierarchique
FR2817698A1 (fr) Procede et dispositif de traitement d&#39;un ensemble de donnees representatives de grandeurs physiques
EP4014494A1 (fr) Procédé de fourniture d&#39;un contenu comportant au moins une image, format de fichier

Legal Events

Date Code Title Description
ST Notification of lapse