FR2822331A1 - Codage et decodage de signal numerique, avec segmentation hierarchique - Google Patents
Codage et decodage de signal numerique, avec segmentation hierarchique Download PDFInfo
- Publication number
- FR2822331A1 FR2822331A1 FR0103692A FR0103692A FR2822331A1 FR 2822331 A1 FR2822331 A1 FR 2822331A1 FR 0103692 A FR0103692 A FR 0103692A FR 0103692 A FR0103692 A FR 0103692A FR 2822331 A1 FR2822331 A1 FR 2822331A1
- Authority
- FR
- France
- Prior art keywords
- coding
- regions
- resolution
- level
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/20—Contour coding, e.g. using detection of edges
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/649—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
L'invention concerne un procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte les étapes de : - décomposition (El) de l'ensemble de données sur une pluralité de niveaux de résolution, et, pour chaque niveau de résolution, - segmentation (E2) des données du niveau de résolution considéré en au moins deux régions homogènes, - classement (E4) des régions selon un critère de priorité, et, pour chaque région, - décision (E4) de codage de la région, en fonction de son classement et d'un critère de codage prédéterminé.
Description
<Desc/Clms Page number 1>
La présente invention concerne de manière générale le codage d'un signal numérique et propose à cette fin un dispositif et un procédé de codage d'un signal numérique qui comporte une décomposition en une pluralité de niveaux de résolution, et une segmentation.
L'invention concerne aussi un dispositif et un procédé de décodage correspondant.
La présente invention est applicable plus particulièrement au codage et au décodage d'un signal numérique. Dans la suite, on s'intéressera plus particulièrement à des images numériques ou des séquences vidéo. Une séquence vidéo est définie comme une succession d'images numériques.
La segmentation d'une image numérique permet de réaliser une partition de l'image en régions homogènes, connexes et ne se recouvrant pas.
Dans ce contexte, l'image est considérée comme constituée d'objets à deux dimensions. La segmentation est un processus de bas niveau ayant pour but de réaliser une partition de l'image en un certain nombre de sous éléments appelés régions. La partition est telle que les régions sont disjointes et que leur réunion constitue l'image. Les régions correspondent ou ne correspondent pas à des objets de l'image, le terme d'objet référant à une information de nature sémantique. Bien souvent cependant, un objet correspond à une région ou un ensemble de régions. Chaque région peut être représentée par une information représentative de sa forme, sa couleur ou de sa texture. L'homogénéité de la région dépend bien sur d'un critère particulier d'homogénéité : proximité des valeurs moyennes, conservation du contraste, de la couleur, par exemple.
<Desc/Clms Page number 2>
Par objet, on entend une entité de l'image correspondant à une unité sémantique, par exemple le visage d'une personne. Un objet peut être constitué d'une ou plusieurs régions contenues dans l'image. Par la suite nous utiliserons indifféremment le terme d'objet ou de région.
De façon classique, la segmentation de l'image numérique est réalisée sur un seul niveau de résolution, qui est la résolution de l'image ellemême. Classiquement, les méthodes de segmentation comportent une première étape dite de marquage, c'est-à-dire que l'on extrait de l'image l'intérieur des régions présentant une homogénéité locale. Ensuite, une étape de décision définit de manière précise les contours des zones contenant des données homogènes. A la fin de cette étape, chaque pixel de l'image est associé à un label identifiant la région à laquelle il appartient. L'ensemble de tous les labels de tous les pixels est appelé une carte de segmentation.
D'autre part, il existe plusieurs manières connues d'effectuer la décomposition d'un signal sur plusieurs niveaux de résolution ; on peut par exemple utiliser des pyramides Gaussiennes/Laplaciennes, ou décomposer le signal en sous bandes de fréquences à plusieurs niveaux de résolution.
Dans la suite, on s'intéressera à ce second cas, mais il est important de noter que la présente invention s'applique à toutes les décompositions multirésolution connues.
Dans le cas particulier d'une décomposition en sous bandes de fréquence, la décomposition consiste à créer, à partir du signal numérique, un jeu de sous bandes contenant chacune un spectre limité de fréquences. Les sous bandes peuvent être de différentes résolutions, la résolution d'une sous bande étant le nombre d'échantillons par unité de longueur utilisé pour représenter cette sous bande. Dans le cas d'un signal numérique d'image, une sous bande de fréquence de ce signal peut être considérée comme une image, c'est-à-dire un tableau bidimensionel de valeurs numériques.
La décomposition d'un signal en sous bandes de fréquence permet de décorréler le signal de manière à éliminer la redondance existant dans l'image numérique préalablement à la compression proprement dite. Les sous bandes peuvent être alors compressées de manière plus efficace que le signal
<Desc/Clms Page number 3>
d'origine. Par ailleurs, la sous bande basse d'une telle décomposition est une reproduction fidèle à une résolution plus faible, de l'image d'origine. Elle est donc particulièrement bien adaptée à une segmentation.
Une segmentation hiérarchique du signal permet d'accéder aux objets ou régions présents dans une image, à plusieurs niveaux de résolution, avec plusieurs niveaux de détail possibles. L'accès aux objets d'une image peut être utilisé à différentes fins : - codage sélectif des objets de l'image, en accordant une plus grande qualité de codage aux objets importants de l'image, - transmission progressive des données de l'image, avec transmission des objets les plus importants avant les autres, - extraction d'un objet particulier de l'image, en vue de sa manipulation, de sa transmission, de son codage, de son stockage.
Les techniques connues pour coder un signal numérique, par exemple une image, qui permettent un codage sélectif par régions, à plusieurs niveaux de résolution, reposent généralement sur une optimisation débitdistorsion.
L'optimisation peut être indépendante sur les régions. Par exemple, selon la norme MPEG-4 (d'après l'anglais Motion Picture Expert Group), un débit total, fixe, est distribué entre les objets d'une trame vidéo. Le nombre de bits alloués à chaque objet est proportionnel notamment à son mouvement et à sa taille.
L'optimisation peut être globale, il faut alors disposer d'une information relative à l'importance de chaque objet.
Dans tous les cas, ces techniques sont complexes à mettre en oeuvre.
La présente invention vise à fournir un procédé et un dispositif qui permettent le codage par régions de données numériques, à plusieurs niveaux de résolution, ce codage étant efficace tout en demeurant simple à mettre en oeuvre.
<Desc/Clms Page number 4>
A cette fin, l'invention concerne un procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte les étapes de : - décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, et, pour chaque niveau de résolution, - segmentation des données du niveau de résolution considéré en au moins deux régions homogènes, - classement des régions selon un critère de priorité, et, pour chaque région, - décision de codage de la région, en fonction de son classement et d'un critère de codage prédéterminé.
L'invention concerne aussi un procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte les étapes de : - décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, et, pour chaque niveau de résolution, - segmentation des données du niveau de résolution considéré en au moins deux régions homogènes, - classement des régions selon un critère de priorité, - décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé, - codage des régions en fonction du résultat de la décision, - décodage des régions codées, - synthèse des régions décodées sur un niveau de résolution, les étapes de segmentation, classement, décision, codage décodage et synthèse étant réalisées sur les données du niveau de résolution la plus faible pour la première itération puis sur le résultat de l'étape de synthèse de l'itération précédente, à partir de la seconde itération.
<Desc/Clms Page number 5>
Ainsi, ces deux modes de réalisation de l'invention permettent de coder les données selon un codage par régions de données numériques, à plusieurs niveaux de résolution, ce codage étant efficace tout en demeurant simple à mettre en oeuvre.
Selon une caractéristique préférée, le critère de codage consiste à sélectionner les K premières régions classées, où K est un entier prédéterminé.
Ce critère de codage est particulièrement simple et rapide à mettre en oeuvre.
En variante, l'entier K est déterminé en fonction du débit de transmission des données codées. Ainsi, le nombre de régions codées est adapté au débit de transmission.
Selon une caractéristique préférée, le classement des régions est effectué en décrivant une spirale à partir du centre de la zone comportant les régions à classer.
Ce classement est plus particulièrement adapté aux images de type tête-épaules .
Selon une caractéristique préférée, le classement des régions comporte l'élimination d'au moins une région.
Cette région, qui est considérée comme l'arrière-plan, ne sera pas codée, ce qui économise les ressources de codage et de décodage ultérieur.
Selon une caractéristique préférée, la décision de codage d'une région consiste à décider si la région est à coder ou non.
La décision de codage est binaire, et a pour résultat de ne coder que les régions jugées les plus importantes, les autres régions n'étant pas codées.
Ainsi, les ressources de codage et de décodage ultérieur sont économisées.
Selon une caractéristique préférée, le résultat de la décision de codage d'un niveau de résolution est un masque binaire représentatif du résultat de la décision de codage des régions du niveau considéré.
Le masque binaire est un moyen simple pour indiquer le résultat de la décision de codage.
<Desc/Clms Page number 6>
Selon une caractéristique préférée, le masque binaire d'au moins le niveau de résolution la plus faible est codé. Le masque binaire fait ainsi partie des données codées.
Selon une caractéristique préférée, la décomposition de l'ensemble
de données est une décomposition en odelettes discrètes.
de données est une décomposition en odelettes discrètes.
Ce type de décomposition est bien connu, particulièrement dans le domaine des images numériques.
L'invention concerne aussi un procédé de décodage d'un ensemble de données codées selon le procédé précédemment présenté, caractérisé en ce qu'il comporte les étapes de : - décodage d'un masque binaire représentatif du résultat de la décision de codage des régions d'au moins un niveau de résolution, déterminé lors du codage, - décodage des coefficients codés des régions d'au moins un niveau de résolution, en fonction du résultat de la décision de codage, - synthèse des coefficients décodés sur au moins un niveau de résolution.
L'invention concerne encore un procédé de décodage d'un ensemble de données codées selon le procédé précédemment présenté, caractérisé en ce qu'il comporte les étapes de : - décodage d'un masque binaire représentatif du résultat de la décision de codage des régions du niveau de résolution la plus faible, déterminé lors du codage, - décodage des coefficients codés des régions du niveau de résolution la plus faible, - synthèse des données décodées sur un niveau de résolution, - segmentation des données synthétisées en au moins deux régions homogènes, - classement des régions selon un critère de priorité,
<Desc/Clms Page number 7>
- décision de décodage de chaque région, en fonction de son classement et du critère de codage prédéterminé, les étapes de synthèse, segmentation, classement et décision étant réitérées sur au moins un niveau de résolution.
Les deux modes de réalisation du procédé de décodage, correspondant respectivement aux deux modes de réalisation du procédé de codage, présentent des avantages analogues à ceux précédemment présentés.
Corrélativement, l'invention a trait à un dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte : - des moyens de décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, - des moyens de segmentation des données de chaque niveau de résolution en au moins deux régions homogènes, - des moyens de classement des régions de chaque niveau de résolution selon un critère de priorité, - des moyens de décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé.
L'invention concerne aussi un dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte : - des moyens de décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, - des moyens de segmentation des données de chaque niveau de résolution en au moins deux régions homogènes, - des moyens de classement des régions de chaque niveau de résolution selon un critère de priorité, - des moyens de décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé, - des moyens de codage des régions en fonction du résultat de la décision,
<Desc/Clms Page number 8>
- des moyens de décodage des régions codées, - des moyens de synthèse des régions décodées sur un niveau de résolution, les moyens de segmentation, classement, décision, codage décodage et synthèse étant adaptés à traiter les données du niveau de résolution la plus faible puis le résultat de la synthèse précédente, de manière itérative.
L'invention concerne aussi un dispositif de décodage d'un ensemble de données codées par le dispositif précédemment exposé, caractérisé en ce qu'il comporte : - des moyens de décodage d'un masque binaire représentatif du résultat de la décision de codage des régions d'au moins un niveau de résolution, déterminé lors du codage, - des moyens de décodage des coefficients codés des régions d'au moins un niveau de résolution, en fonction du résultat de la décision de codage, - des moyens de synthèse des coefficients décodés sur au moins un niveau de résolution.
L'invention a aussi trait à un dispositif de décodage d'un ensemble de données codées par le dispositif précédemment exposé, caractérisé en ce qu'il comporte : - des moyens de décodage d'un masque binaire représentatif du résultat de la décision de codage des régions du niveau de résolution la plus faible, déterminé lors du codage, - des moyens de décodage des coefficients codés des régions du niveau de résolution la plus faible, - des moyens de synthèse des données décodées sur un niveau de résolution, - des moyens de segmentation des données synthétisées en au moins deux régions homogènes, - des moyens de classement des régions selon un critère de priorité,
<Desc/Clms Page number 9>
- des moyens de décision de décodage de chaque région, en fonction de son classement et du critère de codage prédéterminé, les moyens de synthèse, segmentation, classement et décision étant adaptés à réitérer leur fonctionnement sur au moins un niveau de résolution.
L'invention concerne aussi un appareil numérique incluant le dispositif de codage ou de décodage selon l'invention, ou des moyens de mise en oeuvre du procédé de codage ou de décodage selon l'invention. Cet appareil numérique est par exemple un appareil photographique numérique, un caméscope numérique ou un scanner. Les avantages des dispositifs et de l'appareil numérique sont identiques à ceux précédemment exposés.
L'invention peut être mise en oeuvre par un programme d'ordinateur.
Un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise le programme mettant en oeuvre le procédé selon l'invention.
Un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise le programme mettant en oeuvre le procédé selon l'invention.
Les caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture d'un mode préféré de réalisation illustré par les dessins ci-joints, dans lesquels : - la figure 1 est un mode de réalisation d'un dispositif de codage selon l'invention,
- la figure 2 est un mode de réalisation d'un dispositif de décodage selon l'invention, - la figure 3 est un mode de réalisation d'un dispositif selon l'invention, - la figure 4 est un premier mode de réalisation d'un procédé de codage selon l'invention, - la figure 5 illustre une segmentation hiérarchique effectuée sur une image, - la figure 6 est un second mode de réalisation d'un procédé de codage selon l'invention,
- la figure 2 est un mode de réalisation d'un dispositif de décodage selon l'invention, - la figure 3 est un mode de réalisation d'un dispositif selon l'invention, - la figure 4 est un premier mode de réalisation d'un procédé de codage selon l'invention, - la figure 5 illustre une segmentation hiérarchique effectuée sur une image, - la figure 6 est un second mode de réalisation d'un procédé de codage selon l'invention,
<Desc/Clms Page number 10>
- la figure 7 est un mode de réalisation d'un procédé de construction d'un masque de codage, - les figure 8a, 8b et8c illustrent une image segmentée et deux exemples de masques de codage associés, - la figure 9 est un premier mode de réalisation d'un procédé de décodage selon l'invention, - la figure 10 est un second mode de réalisation d'un procédé de décodage selon l'invention, - la figure 11 est un schéma bloc d'un dispositif de codage mettant en oeuvre l'invention, - la figure 12 est un circuit de décomposition en sous bandes de fréquence inclus dans le dispositif de la figure 11, - la figure 13 est une image numérique à coder selon la présente invention, - la figure 14 est une image décomposée en sous-bandes selon la présente invention, - la figure 15 est un schéma bloc d'un dispositif de décodage mettant en oeuvre l'invention.
Selon un mode de réalisation choisi et représenté à la figure 1, un dispositif de traitement de données selon l'invention est un dispositif 2 de codage de données qui comporte une entrée 12 à laquelle est reliée une source 1 de données non codées.
La source 1 comporte par exemple un moyen de mémoire, telle que mémoire vive, disque dur, disquette, disque compact, pour mémoriser des données non codées, ce moyen de mémoire étant associé à un moyen de lecture approprié pour y lire les données. Un moyen pour enregistrer les données dans le moyen de mémoire peut également être prévu.
On considérera plus particulièrement dans la suite que les données à coder sont une suite d'échantillons numériques représentant une image IM.
La source 1 fournit un signal numérique d'image SI à l'entrée du circuit de codage 2. Le signal d'image SI est une suite de mots numériques, par
<Desc/Clms Page number 11>
exemple des octets. Chaque valeur d'octet représente un pixel de l'image IM, ici à 256 niveaux de gris, ou image noir et blanc. L'image peut être une image multispectrale, par exemple une image en couleur ayant des composantes dans trois bandes de fréquence, de type rouge-vert-bleu ou luminance et chrominances. Chaque bande est alors traitée de manière analogue à l'image monospectrale. En variante, pour une image en couleur, la segmentation hiérarchique calculée sur la luminance sera appliquée aux composantes de chrominance.
Des moyens 3 utilisateurs de données codées sont reliés en sortie 25 du dispositif de codage 2.
Les moyens utilisateurs 3 comportent par exemple des moyens de mémorisation de données codées, et/ou des moyens de transmission des données codées.
La figure 2 représente un autre dispositif de traitement de données selon l'invention, sous la forme d'un dispositif 5 de décodage de données codées par le dispositif 2.
Des moyens 4 utilisateurs de données codées sont reliés en entrée 54 du dispositif de décodage 5. Les moyens 4 comportent par exemple des moyens de mémoire de données codées, et/ou des moyens de réception des données codées qui sont adaptés à recevoir les données codées transmises par les moyens de transmission 3.
Des moyens 6 utilisateurs de données décodées sont reliés en sortie 55 du dispositif de décodage 5. Les moyens utilisateurs 6 sont par exemple des moyens de visualisation d'images, ou des moyens de restitution de sons, en fonction de la nature des données traitées.
Le dispositif de décodage 5 effectue globalement des opérations inverses de celles du dispositif de codage 2.
Le dispositif de codage et le dispositif de décodage peuvent être respectivement intégrés dans des appareils numériques TD1 et TD2, tel qu'un ordinateur, une imprimante, un télécopieur, un scanner ou un appareil photographique numérique, par exemple.
<Desc/Clms Page number 12>
Le dispositif de codage et le dispositif de décodage peuvent être intégrés dans un même appareil numérique, par exemple un appareil photographique numérique.
Le fonctionnement des dispositifs de codage et de décodage sera exposé dans la suite.
En référence à la figure 3, est décrit un exemple de dispositif 10 mettant en oeuvre l'invention. Ce dispositif est adapté à coder et/ou décoder un signal numérique selon l'invention.
Le dispositif est par exemple un micro-ordinateur 10 connecté à différents périphériques, par exemple une caméra numérique 107 (ou un scanner, ou tout moyen d'acquisition ou de stockage d'image) reliée à une carte graphique et fournissant des informations à traiter selon l'invention.
Le dispositif 10 comporte une interface de communication 112 reliée à un réseau 113 apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif. Le dispositif 10 comporte également un moyen de stockage 108 tel que par exemple un disque dur. Il comporte aussi un lecteur 109 de disque 110. Ce disque 110 peut être une disquette, un CD-ROM, ou un DVD-ROM, par exemple. Le disque 110 comme le disque 108 peuvent contenir des données traitées selon l'invention ainsi que le ou les programmes mettant en oeuvre l'invention qui, une fois lu par le dispositif 10, sera stocké dans le disque dur 108. Selon une variante, le programme permettant au dispositif de mettre en oeuvre l'invention, pourra être stocké en mémoire morte 102 (appelée ROM sur le dessin). En seconde variante, le programme pourra être reçu pour être stocké de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 113.
Le dispositif 10 est relié à un microphone 111. Les données à traiter selon l'invention seront dans ce cas du signal audio.
Ce même dispositif possède un écran 104 permettant de visualiser les données à traiter ou de servir d'interface avec l'utilisateur qui peut ainsi paramétrer certains modes de traitement, à l'aide du clavier 114 ou de tout autre moyen (souris par exemple).
<Desc/Clms Page number 13>
L'unité centrale 100 (appelée CPU sur le dessin) exécute les instructions relatives à la mise en oeuvre de l'invention, instructions stockées dans la mémoire morte 102 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de traitement stockés dans une mémoire non volatile, par exemple la ROM 102, sont transférés dans la mémoire vive RAM 103 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention.
De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé selon l'invention.
Le bus de communication 101 permet la communication entre les différents éléments inclus dans le micro-ordinateur 10 ou reliés à lui. La représentation du bus 101 n'est pas limitative et notamment l'unité centrale 100 est susceptible de communiquer des instructions à tout élément du microordinateur 10 directement ou par l'intermédiaire d'un autre élément du microordinateur 10.
Un premier mode de réalisation de codage d'un signal numérique selon l'invention est maintenant détaillé en référence à la figure 4, sous la forme d'un algorithme comportant des étapes E1 à E8 qui sont parcourues par l'unité centrale du dispositif 10 précédemment décrit. Le procédé comporte globalement la décomposition de l'image sur une pluralité de niveaux de résolution, puis, pour chaque niveau de résolution, la segmentation des données du niveau de résolution considéré en au moins deux régions homogènes, le classement des régions selon un critère de priorité, et, pour chaque région, la décision de codage de la région, en fonction de son classement et d'un critère de codage prédéterminé.
L'étape E1 est une décomposition de l'image IM à coder sur au moins deux niveaux de résolution. Le signal est décomposé en sous-bandes de
<Desc/Clms Page number 14>
fréquence à plusieurs niveaux de résolution par une transformation en odelettes discrètes dite DWT (d'après l'anglais Discrete Wavelet Transform).
D'autres types de décomposition peuvent être utilisés, par exemple des pyramides Gaussiennes/Laplaciennes. Dans la suite, on considère plus particulièrement le cas de la transformation en odelettes discrètes à N niveaux de résolution.
L'étape suivante E2 est une segmentation hiérarchique des données obtenues à l'étape précédente. Un exemple de segmentation hiérarchique est décrit dans la demande de brevet français no 99 15293 déposée par la demanderesse.
La segmentation hiérarchique comporte tout d'abord une segmentation initiale effectuée sur la sous-bande basse issue de la décomposition odelettes. La segmentation initiale est par exemple une segmentation pour les images fixes du type de celle proposée dans l'article de Philippe Salembier intitulé"Morphological multiscale segmentation for image coding"paru dans le magazine"Signal Processing"numéro 38 de septembre 1994, pages 359-386.
Pour les niveaux de résolution supérieure, la segmentation disponible à un niveau de résolution donnée (N-i), où i est un entier compris entre zéro et (N-1) est utilisée pour assister la segmentation du niveau de résolution supérieure (N-i-1) ; cette méthode, dont l'algorithme est résumé cidessous, comporte trois étapes principales : - Projection de la segmentation de niveau inférieur. La segmentation étant disponible au niveau de résolution (N-i), on la projette au niveau de résolution supérieure par élargissement (zoom d'un facteur 2 dans chaque dimension) et interpolation des points manquants.
- Définition d'une zone d'incertitude. L'opération de sous- échantillonnage subie par la sous-bande basse de la décomposition en odelettes entraîne une indécision sur la position des contours. Pour repositionner correctement les contours d'un niveau à l'autre, il faut définir une zone d'incertitude (zone dans laquelle se trouvent les contours recherchés). La zone d'incertitude est définie de la manière suivante : elle inclut tous les pixels
<Desc/Clms Page number 15>
qui ont au moins un voisin appartenant à une région différente. La zone d'incertitude correspond à des contours élargis de la segmentation initiale.
- Segmentation du niveau courant. La sous-bande basse de niveau courant est segmentée en prenant en compte la zone d'incertitude définie cidessus. La segmentation est effectuée uniquement à l'intérieur des régions délimitées par les zones d'incertitude. Les zones d'incertitudes servent de murs à la nouvelle segmentation. Ainsi, à la résolution (N-i), de nouveaux objets peuvent apparaître à l'intérieur d'un objet de résolution (N-i-1), mais un nouvel objet ne peut apparaître en chevauchant deux régions définies au niveau (N-i-1) ; en d'autres termes, on s'assure ici de la cohérence (ou continuité) de la segmentation.
La figure 5 illustre une segmentation hiérarchique cohérente sur trois niveaux de résolution.
Lorsque la résolution croit, du niveau (N-i) au niveau (N-i-1), puis du niveau (N-i-1 au niveau (N-i-2), le nombre d'objets croit également ou éventuellement reste constant. Les contours sont conservés d'un niveau sur l'autre.
Au cours de l'étape suivante E3, un paramètre i est initialisé à la valeur 0. Le paramètre i indique le niveau de résolution courant N-i, où N correspond au nombre total de niveaux de décomposition, ici trois. Cet indicateur sera par la suite remis à jour à chaque itération.
L'étape suivante E4 est un classement des régions du niveau de résolution courant. Le classement est effectué en fonction de l'importance de chaque région. Un masque de codage MSN-, est déterminé en fonction du classement et d'un critère de codage. Le critère de codage permet de déterminer pour chaque région si elle sera codée ou non. Le critère consiste à coder les K premières régions. Le nombre K peut être prédéterminé, ou en variante modifiable en fonction du débit de transmission des données codées.
Dans la suite, un même nombre K est utilisé pour tous les niveaux de
<Desc/Clms Page number 16>
résolution. Il est cependant possible de déterminer un nombre K spécifique pour chaque niveau de résolution.
Le masque de codage est un ensemble de valeurs binaires correspondant au support de l'image à la résolution considérée ; une valeur à 1 indique (par exemple) que tous les coefficients correspondant à cette position spatiale doivent être codés, une valeur à 0 indique que les coefficients ne seront pas codés.
L'étape E4 sera détaillée dans la suite.
L'étape suivante E5 est le codage du masque de codage MSN-i calculé pour la résolution courante (N-i). L'étape E5 comporte également la transmission du masque de codage codé MSCN-i. Le codage du masque est réalisé par tout mode de codage approprié aux images binaires, par exemple par un codage de type JBIG (d'après l'anglais Joint Bilevel Image expert Group) qui est une norme conçue pour coder des images à deux niveaux.
L'étape suivante E6 est le codage des régions de résolution courante en fonction du masque. Les K régions les plus importantes sont codées. Le mode de codage est choisi en fonction de la décomposition multirésolution (étape E1). Pour une décomposition en odelettes discrètes, un mode de codage approprié pour coder des coefficients odelettes sur un support de taille et de forme arbitraires est choisi. Par exemple, une quantification scalaire uniforme est alors utilisée.
L'étape E6 comporte également la transmission des coefficients codés des K régions.
L'étape suivante E7 est un test pour déterminer si tous les niveaux de la décomposition ont été traités, c'est-à-dire si le paramètre i est égal à N-1.
Si la réponse est négative, il reste encore au moins un niveau à traiter, et dans ce cas l'étape E7 est suivie de l'étape E8, qui incrémente le paramètre i de une unité. L'étape E8 est suivie de l'étape E4 précédemment décrite.
Si la réponse est positive à l'étape E7, alors le codage est terminé.
<Desc/Clms Page number 17>
Un second mode de réalisation de codage selon l'invention est maintenant détaillé en référence à la figure 6 sous la forme d'un algorithme comportant des étapes E20 à E30.
Par rapport au premier mode de réalisation, seul le masque de codage du niveau de résolution la plus faible N est transmis au décodeur. Les masques de codage pour les autres niveaux de résolution ne sont pas transmis au décodeur, qui devra par conséquent les recalculer, pour chaque niveau de résolution. Pour que le codage et le décodage soient effectués sur des données identiques, les données sont codées puis décodées au cours du codage.
L'étape E20 est une décomposition multirésolution de l'image IM.
Cette étape est analogue à l'étape E1 précédemment décrite.
Au cours de l'étape suivante E21, un paramètre i est initialisé à la valeur 0. Le paramètre i indique le niveau de résolution courant N-i, où N correspond au nombre total de niveaux de décomposition, ici trois. Cet indicateur sera par la suite remis à jour à chaque itération.
L'étape suivante E22 est la segmentation des données du niveau de résolution courant.
Dans l'exemple choisi où la décomposition multirésolution est une décomposition en sous-bandes de fréquence, la segmentation est effectuée sur la sous-bande de basse fréquence LLSN-I.
L'étape suivante E23 est un classement des régions du niveau de résolution courant et la détermination du masque de codage MSN-i. Cette étape est analogue à l'étape E4 précédemment décrite.
L'étape suivante E24 est le codage des régions du niveau de résolution courant, en fonction du masque et du critère de codage. Cette étape est analogue à l'étape E6 précédemment décrite.
A l'étape suivante E25, les données codées sont d'une part mémorisées et d'autre part transmises vers le décodeur.
L'étape suivante E26 est le décodage des données précédemment codées.
Les données décodées sont ensuite synthétisées sur un niveau de résolution à l'étape E27. Le résultat est une sous bande basse LLSN-i+i de
<Desc/Clms Page number 18>
niveau de résolution immédiatement supérieure au niveau courant. C'est cette sous bande qui est utilisée au cours d'une itération suivante, tant que tous les niveaux de résolution n'ont pas été parcourus.
L'étape suivante E28 est un test pour déterminer si tous les niveaux de la décomposition ont été traités, c'est-à-dire si le paramètre i est égal à N-1.
Si la réponse est négative, il reste encore au moins un niveau à traiter, et dans ce cas l'étape E28 est suivie de l'étape E29, qui incrémente le paramètre i de une unité. L'étape E28 est suivie de l'étape E22 précédemment décrite.
Si la réponse est positive à l'étape E28, alors cette étape est suivie de l'étape E30 à laquelle le masque de codage de niveau de résolution la plus faible N est codé puis transmis vers le décodeur. Comme pour le précédent mode de réalisation, le mode de codage utilisé est par exemple de type JBIG.
L'étape E4 ou E23 de classement des régions d'un niveau de résolution (N-i) et de construction du masque de codage MSNI est maintenant détaillée en référence à la figure 7, sous la forme d'un algorithme comportant des étapes E40 à E46.
L'étape E40 est le classement des régions du niveau de résolution considéré.
Cette étape comporte tout d'abord la détermination du fond, ou arrière-plan de la scène. Par exemple, pour une image de type tête- épaules la région la plus grande en nombre de pixels est considérée comme le fond, les autres régions sont assimilées à l'avant-plan. Le fond est ensuite éliminé du traitement, seul l'avant-plan est considéré dans la suite.
Pour classer les régions, on décrit par exemple une spirale à partir du centre de la sous bande. Les régions sont classées par ordre décroissant d'importance au fur et à mesure que l'on s'éloigne du centre de l'image. En variante, il est possible que l'utilisateur effectue un classement manuel des régions.
L'étape suivante E41 est une initialisation à laquelle un paramètre j est mis à la valeur un, pour considérer la région classée en premier. Le
<Desc/Clms Page number 19>
paramètre j représente l'ordre de la région courante dans les régions précédemment classées.
L'étape suivante E42 est un test pour déterminer si le paramètre j est inférieur ou égal à un entier K prédéterminé.
Si la réponse est positive, alors l'étape E42 est suivie de l'étape E43 à laquelle les coefficients du masque correspondant à la région courante sont tous mis à la valeur un.
Si la réponse est négative à l'étape E42, alors cette étape est suivie de l'étape E44 à laquelle les coefficients du masque correspondant à la région courante sont tous mis à la valeur zéro.
Ainsi, les K premières régions sont associées à des uns dans le masque de codage, et les régions suivantes sont associées à des zéros . De cette manière, le masque de codage indique quelles sont les K régions les plus importantes qui seront à coder, les autres régions n'étant pas codées.
L'étape E43 ou l'étape E44 est suivie de l'étape E45 qui est un test pour déterminer si toutes les régions du niveau de résolution courant ont été traitées.
Si la réponse est négative, alors l'étape E45 est suivie de l'étape E46 à laquelle le paramètre j est incrémenté de une unité pour considérer une région suivante.
Si la réponse est positive à l'étape E45, alors le masque de codage est entièrement déterminé pour le niveau de résolution courant.
Les figures 8a, 8b et 8c illustrent le fonctionnement de l'étape E4 de la figure 4.
A la figure 8a, une image est segmentée et comporte six régions qui sont : le fond à extraire, puis tête, corps, oeil, oeil et lune, selon l'ordre défini par la méthode de la spirale.
La figure 8b représente le masque de segmentation de l'image pour K = 2. Il y a donc deux régions (la tête et le corps) associées à la valeur un dans le masque de segmentation. La valeur un est représentée en grisé.
<Desc/Clms Page number 20>
La figure 8c représente le masque de segmentation de l'image pour K = 4. Il y a donc quatre régions (la tête, le corps et chacun des deux yeux) associées à la valeur un dans le masque de segmentation. La valeur un est représentée en grisé.
Le premier mode de réalisation de décodage selon l'invention est maintenant détaillé en référence à la figure 9, sous la forme d'un algorithme comportant des étapes E100 à E107. Ce décodage correspond au codage décrit en référence à la figure 4.
L'étape E100 est une initialisation à laquelle le paramètre i est mis à la valeur zéro pour considérer le niveau N de résolution le plus élevé dans la décomposition.
L'étape suivante E101 est la réception et le décodage du masque de codage MSN- ! pour ie niveau de résolution courant N-i.
L'étape suivante E102 est la réception et le décodage des données de codage des régions du niveau de résolution courant. Le décodage dépend du codage qui a été effectué à l'étape E6 (figure 4). Les régions à décoder sont celles qui ont été codées et sont indiquées par le masque de codage. Les autres régions sont remplies par une valeur arbitraire, par exemple zéro.
L'étape suivante E103 est la reconstitution des sous bandes du niveau de résolution courant, à partir des régions décodées.
L'étape suivante E104 est la synthèse des sous bandes formées à l'étape précédente, sur un niveau, de manière à former une sous bande basse au niveau de résolution immédiatement supérieure (N-i+1).
L'étape suivante E105 est un test pour déterminer si tous les niveaux de la décomposition ont été traités, c'est-à-dire si le paramètre i est égal à N-1. L'étape E105 comporte également une possibilité d'interruption par une commande Stop de l'utilisateur. La commande Stop permet d'interrompre le traitement à un niveau de résolution intermédiaire.
Si la réponse est négative, il reste encore au moins un niveau à traiter, et dans ce cas l'étape E105 est suivie de l'étape E106, qui incrémente le
<Desc/Clms Page number 21>
paramètre i de une unité. L'étape E106 est suivie de l'étape E101 précédemment décrite.
Si la réponse est positive à l'étape E105, alors cette étape est suivie de l'étape E107 à laquelle les sous bandes du niveau de résolution courant N-1 sont synthétisées sur un niveau pour fournir une image IM'.
Un second mode de réalisation de décodage selon l'invention est représenté à la figure 10 sous la forme d'un algorithme comportant des étapes E200 à E211.
Ce mode de réalisation correspond au seconde mode de réalisation de codage (figure 6). Le masque de codage n'est transmis que pour le niveau de résolution la plus faible N et il est donc nécessaire de le calculer au cours du décodage pour les autres niveaux de résolution.
L'étape E200 est la réception et le décodage du masque de niveau de résolution la plus élevée N.
L'étape suivante E201 est la réception et le décodage des données de codage des régions du niveau de résolution la plus faible N. Le décodage dépend du codage qui a été effectué à l'étape E6 (figure 4). Les régions à décoder sont celles qui ont été codées et sont indiquées par le masque de codage. Les autres régions sont remplies par une valeur arbitraire, par exemple zéro.
L'étape suivante E202 est la reconstitution des sous bandes du niveau de résolution N, à partir des régions décodées.
L'étape suivante E203 est une initialisation à laquelle le paramètre i est mis à la valeur un. On considère dans la suite le niveau de résolution courant (N-i).
L'étape suivante E204 est la synthèse sur un niveau de résolution des sous bande de niveau de résolution (N-i+1), de manière à former une sous bande basse reconstruite LLSN- ! de niveau de résolution (N-i).
L'étape suivante E205 est la segmentation de la sous bande basse
LLSN-i précédemment reconstruite. Cette étape est identique à l'étape E22 précédemment décrite.
LLSN-i précédemment reconstruite. Cette étape est identique à l'étape E22 précédemment décrite.
<Desc/Clms Page number 22>
L'étape suivante E206 est le classement des régions formées à l'étape précédente et le calcul du masque MSN-"Cette étape est identique à l'étape E23 précédemment décrite.
L'étape suivante E207 est la réception et le décodage des données codées des régions du niveau de résolution courant. Le décodage correspond au codage effectué à l'étape E24.
L'étape suivante E208 est la reconstitution des sous bandes du niveau de résolution courant, à partir des régions décodées.
L'étape suivante E209 est un test pour déterminer si tous les niveaux de la décomposition ont été traités, c'est-à-dire si le paramètre i est égal à N-1.
L'étape E209 comporte également une possibilité d'interruption par une commande Stop de l'utilisateur. La commande Stop permet d'interrompre le traitement à un niveau de résolution intermédiaire.
Si la réponse est négative, il reste encore au moins un niveau à traiter, et dans ce cas l'étape E209 est suivie de l'étape E210, qui incrémente le paramètre i de une unité. L'étape E210 est suivie de l'étape E204 précédemment décrite.
Si la réponse est positive à l'étape E209, alors cette étape est suivie de l'étape E211 à laquelle les sous bandes du niveau de résolution courant N-1 sont synthétisées sur un niveau pour fournir une image IM'.
Conformément à la figure 11, le dispositif de codage selon l'invention, comporte : - des moyens de décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, - des moyens de segmentation des données de chaque niveau de résolution en au moins deux régions homogènes, - des moyens de classement des régions de chaque niveau de résolution selon un critère de priorité, - des moyens de décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé.
<Desc/Clms Page number 23>
Un mode de réalisation de dispositif selon l'invention comporte une source de signal 30, ici de signal d'image IM qu'il soit une image fixe ou une séquence d'image. De manière générale, la source de signal soit contient le signal numérique, et comporte par exemple une mémoire, un disque dur ou un CD-ROM, soit convertit un signal analogique en signal numérique, et est par exemple un caméscope analogique associé à un convertisseur analogiquenumérique. La source d'image 30 génère une suite d'échantillons numériques représentant une image IM. Le signal d'image IM est une suite de mots numériques, par exemple des octets. Chaque valeur d'octet représente un pixel de l'image IM, ici à 256 niveaux de gris ou en couleur.
Une sortie de la source de signal 30 est reliée à un circuit 60 de décomposition de l'image IM en sous bandes de fréquence comme il sera détaillé dans la suite en référence à la figure 12. Par exemple la décomposition sera réalisée sur trois niveaux de résolution fournissant ainsi des sous bandes LL3, HL3, LH3 et HH3 de plus faible résolution RES3, les sous bandes HL2, LH2 et HH2 de résolution intermédiaire RES2, et les sous bandes HL1, LH, et HH1 de plus haute résolution RES1.
Le circuit 60 est relié à un circuit 61 de segmentation hiérarchique 61.
Le circuit 61 est relié à un circuit 62 de calcul de masque de codage qui est lui-même relié un circuit 63 de codage du masque de codage.
Les circuits 60 et 62 sont reliés à un circuit 64 de codage des coefficients qui code les coefficients des différents niveaux de résolution en fonction du masque de codage.
Les circuits 63 et 64 sont reliés à un circuit de transmission 68.
Il est à noter que le dispositif de codage précédemment décrit peut mettre en oeuvre aussi bien le premier mode de réalisation du procédé de codage que le second.
Selon la figure 12, le circuit 60 comporte trois blocs successifs d'analyse pour décomposer l'image IM en des sous-bandes selon trois niveaux de résolution.
<Desc/Clms Page number 24>
De manière générale, la résolution d'un signal est le nombre d'échantillons par unité de longueur utilisés pour représenter ce signal. Dans le cas d'un signal d'image, la résolution d'une sous-bande est liée au nombre d'échantillons par unité de longueur pour représenter cette sous-bande. La résolution dépend notamment du nombre de décimations effectuées.
Le premier bloc d'analyse reçoit le signal numérique d'image et l'applique à deux filtres numériques respectivement passe-bas et passe-haut 601 et 602 qui filtrent le signal d'image selon une première direction, par exemple horizontale dans le cas d'un signal d'image. Après passage par des décimateurs par deux 6100 et 6200, les signaux filtrés résultant sont respectivement appliqués à deux filtres passe-bas 603 et 605, et passe-haut 604 et 606, qui les filtrent selon une seconde direction, par exemple verticale dans le cas d'un signal d'image. Chaque signal filtré résultant passe par un décimateur par deux respectif 6300,6400, 6500 et 6600. Le premier bloc délivre en sortie quatre sous-bandes LL1, LH1, HL1 et HH1 de résolution RES1 la plus élevée dans la décomposition.
La sous-bande LL1 comporte les composantes, ou coefficients, de basse fréquence, selon les deux directions, du signal d'image. La sous-bande LH1 comporte les composantes de basse fréquence selon une première direction et de haute fréquence selon une seconde direction, du signal d'image. La sous-bande HL1 comporte les composantes de haute fréquence selon la première direction et les composantes de basse fréquence selon la seconde direction. Enfin, la sous-bande HH1 comporte les composantes de haute fréquence selon les deux directions.
Chaque sous-bande est une image construite à partir de l'image d'origine, qui contient de l'information correspondant à une orientation respectivement verticale, horizontale et diagonale de l'image, dans une bande de fréquence donnée.
La sous-bande LL1 est analysée par un bloc d'analyse analogue au précédent pour fournir quatre sous-bandes LL2, LH2, HL2 et HH2 de niveau de résolution RES2 intermédiaire dans la décomposition. La sous-bande LL2 comporte les composantes de basse fréquence selon les deux directions
<Desc/Clms Page number 25>
d'analyse, et est à son tour analysée par le troisième bloc d'analyse analogue aux deux précédents. Le troisième bloc d'analyse fournit des sous-bandes LL3, LH3, HL3 et HH3, de résolution RES3 la plus faible dans la décomposition, résultant du découpage en sous-bandes de la sous-bande LL2.
Chacune des sous-bandes de résolution RES2 et RES3 correspond également à une orientation dans l'image.
La décomposition effectuée par le circuit 60 est telle qu'une sousbande d'une résolution donnée est découpée en quatre sous-bandes de résolution inférieure et a donc quatre fois plus de coefficients que chacune des sous-bandes de résolution inférieure.
Une image numérique IM en sortie de la source d'image 30 est représentée de manière schématique à la figure 13, tandis que la figure 14 représente l'image IMD résultant de la décomposition de l'image IM, en dix sousbandes selon trois niveaux de résolution, par le circuit 60. L'image IMD comporte autant d'information que l'image d'origine IM, mais l'information est fréquentiellement découpée selon trois niveaux de résolution.
Le niveau de plus basse résolution RES3 comporte les sous-bandes LL3, HL3, LH3 et HH3, c'est-à-dire les sous-bandes de basse fréquence selon les deux directions d'analyse. Le second niveau de résolution RES2 comporte les sous-bandes HL2, LH2 et HH2 et le niveau de plus haute résolution RES comporte les sous-bandes de plus haute fréquence HL1, LH1 et HH1.
La sous-bande LL3 de plus basse fréquence est une réduction de l'image d'origine. Les autres sous-bandes sont des sous-bandes de détail.
Bien entendu, le nombre de niveaux de résolution, et par conséquent de sous-bandes, peut être choisi différemment, par exemple 13 sous-bandes et quatre niveaux de résolution, pour un signal bi-dimensionnel tel qu'une image. Le nombre de sous-bandes par niveau de résolution peut également être différent.
Les circuits d'analyse et de synthèse sont adaptés à la dimension du signal traité.
Conformément à la figure 15, le dispositif de décodage selon l'invention, comporte : - des moyens de décodage des coefficients codés des régions d'au moins un niveau de résolution, en fonction du résultat de la décision de codage,
<Desc/Clms Page number 26>
- des moyens de synthèse des coefficients décodés sur au moins un niveau de résolution.
Un circuit 70 de réception de données codées reçoit les données précédemment codées par le dispositif de codage.
Le circuit 70 est relié à un circuit 71 de décodage de masque et à un circuit 72 de décodage de coefficients.
Le circuit 72 est relié à un circuit 73 de synthèse des données décodées.
Il est à noter que le dispositif de décodage peut mettre en oeuvre les deux modes de réalisation du procédé de décodage précédemment décrits.
Bien entendu, la présente invention n'est nullement limitée aux modes de réalisation décrits et représentés, mais englobe, bien au contraire, toute variante à la portée de l'homme du métier.
Claims (28)
1. Procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte les étapes de : - décomposition (E1) de l'ensemble de données sur une pluralité de niveaux de résolution, et, pour chaque niveau de résolution, - segmentation (E2) des données du niveau de résolution considéré en au moins deux régions homogènes, - classement (E4) des régions selon un critère de priorité, et, pour chaque région, - décision (E4) de codage de la région, en fonction de son classement et d'un critère de codage prédéterminé.
2. Procédé de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte les étapes de : - décomposition (E20) de l'ensemble de données sur une pluralité de niveaux de résolution, et, pour chaque niveau de résolution, - segmentation (E22) des données du niveau de résolution considéré en au moins deux régions homogènes, - classement (E23) des régions selon un critère de priorité, - décision (E23) de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé, - codage (E24) des régions en fonction du résultat de la décision, - décodage (E26) des régions codées, - synthèse (E27) des régions décodées sur un niveau de résolution, les étapes de segmentation, classement, décision, codage décodage et synthèse étant réalisées sur les données du niveau de résolution la plus
<Desc/Clms Page number 28>
faible pour la première itération puis sur le résultat de l'étape de synthèse de l'itération précédente, à partir de la seconde itération.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que le critère de codage consiste à sélectionner les K premières régions classées, où K est un entier prédéterminé.
4. Procédé selon la revendication 1 ou 2, caractérisé en ce que le critère de codage consiste à sélectionner les K premières régions classées, où K est un entier déterminé en fonction d'un débit de transmission des données codées.
5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que le classement (E4) des régions est effectué en décrivant une spirale à partir du centre de la zone comportant les régions à classer.
6. Procédé selon l'une quelconque des revendications 1 à 5, caractérisé en ce que le classement (E4) des régions comporte l'élimination d'au moins une région.
7. Procédé selon l'une quelconque des revendications 1 à 6, caractérisé en ce que la décision (E4, E23) de codage d'une région consiste à décider si la région est à coder ou non.
8. Procédé selon l'une quelconque des revendications 1 à 7, caractérisé en ce que le résultat de la décision de codage d'un niveau de résolution est un masque binaire (MSN-i) représentatif du résultat de la décision de codage des régions du niveau considéré.
9. Procédé selon la revendication 8, caractérisé en ce que le masque binaire d'au moins le niveau de résolution la plus faible est codé (E5).
<Desc/Clms Page number 29>
10. Procédé selon l'une quelconque des revendications 1 à 9, caractérisé en ce que la décomposition (E1) de l'ensemble de données est une décomposition en odelettes discrètes.
11. Procédé de décodage d'un ensemble de données codées selon le procédé selon l'une quelconque des revendications 1 à 10, caractérisé en ce qu'il comporte les étapes de : - décodage (E101) d'un masque binaire représentatif du résultat de la décision de codage des régions d'au moins un niveau de résolution, déterminé lors du codage, - décodage (E102) des coefficients codés des régions d'au moins un niveau de résolution, en fonction du résultat de la décision de codage,
- synthèse (E104) des coefficients décodés sur au moins un niveau de résolution.
12. Procédé de décodage d'un ensemble de données codées selon le procédé selon l'une quelconque des revendications 2 à 10, caractérisé en ce qu'il comporte les étapes de : - décodage (E200) d'un masque binaire représentatif du résultat de la décision de codage des régions du niveau de résolution la plus faible, déterminé lors du codage, - décodage (E201) des coefficients codés des régions du niveau de résolution la plus faible, - synthèse (E204) des données décodées sur un niveau de résolution, - segmentation (E205) des données synthétisées en au moins deux régions homogènes, - classement (E206) des régions selon un critère de priorité, - décision (E206) de décodage de chaque région, en fonction de son classement et du critère de codage prédéterminé, les étapes de synthèse, segmentation, classement et décision étant réitérées sur au moins un niveau de résolution.
<Desc/Clms Page number 30>
13. Dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte : - des moyens (60) de décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, - des moyens (61) de segmentation des données de chaque niveau de résolution en au moins deux régions homogènes, - des moyens (62) de classement des régions de chaque niveau de résolution selon un critère de priorité, - des moyens (62) de décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé.
14. Dispositif de codage d'un ensemble de données représentatives de grandeurs physiques, caractérisé en ce qu'il comporte : - des moyens (60) de décomposition de l'ensemble de données sur une pluralité de niveaux de résolution, - des moyens (61) de segmentation des données de chaque niveau de résolution en au moins deux régions homogènes, - des moyens (62) de classement des régions de chaque niveau de résolution selon un critère de priorité, - des moyens (62) de décision de codage de chaque région, en fonction de son classement et d'un critère de codage prédéterminé, - des moyens (64) de codage des régions en fonction du résultat de la décision, - des moyens (64) de décodage des régions codées, - des moyens (64) de synthèse des régions décodées sur un niveau de résolution, les moyens de segmentation, classement, décision, codage décodage et synthèse étant adaptés à traiter les données du niveau de résolution la plus faible puis le résultat de la synthèse précédente, de manière itérative.
<Desc/Clms Page number 31>
15. Dispositif selon la revendication 13 ou 14, caractérisé en ce qu'il est adapté à mettre en oeuvre un critère de codage qui consiste à sélectionner les K premières régions classées, où K est un entier prédéterminé.
16. Dispositif selon la revendication 13 ou 14, caractérisé en ce qu'il est adapté à mettre en oeuvre un critère de codage qui consiste à sélectionner les K premières régions classées, où K est un entier déterminé en fonction d'un débit de transmission des données codées.
17. Dispositif selon l'une quelconque des revendications 13 à 16, caractérisé en ce qu'il est adapté à effectuer le classement des régions en décrivant une spirale à partir du centre de la zone comportant les régions à classer.
18. Dispositif selon l'une quelconque des revendications 13 à 17, caractérisé en ce qu'il est adapté à éliminer au moins une région au cours du classement des régions.
19. Dispositif selon l'une quelconque des revendications 13 à 18, caractérisé en ce que les moyens de décision de codage d'une région sont adaptés à décider si la région est à coder ou non.
20. Dispositif selon l'une quelconque des revendications 13 à 19, caractérisé en ce que les moyens de décision sont adaptés à former un masque binaire par niveau de résolution, représentatif du résultat de la décision de codage des régions du niveau considéré.
22. Dispositif selon l'une quelconque des revendications 13 à 21, caractérisé en ce que les moyens (60) de décomposition de l'ensemble de données sont adaptés à mettre en oeuvre une décomposition en odelettes discrètes.
23. Dispositif de décodage d'un ensemble de données codées par le dispositif selon l'une quelconque des revendications 13 à 22, caractérisé en ce qu'il comporte : - des moyens (71) de décodage d'un masque binaire représentatif du résultat de la décision de codage des régions d'au moins un niveau de résolution, déterminé lors du codage, - des moyens (72) de décodage des coefficients codés des régions d'au moins un niveau de résolution, en fonction du résultat de la décision de codage, - des moyens (73) de synthèse des coefficients décodés sur au moins un niveau de résolution.
24. Dispositif de décodage d'un ensemble de données codées par le dispositif selon l'une quelconque des revendications 14 à 22, caractérisé en ce qu'il comporte : - des moyens de décodage d'un masque binaire représentatif du résultat de la décision de codage des régions du niveau de résolution la plus faible, déterminé lors du codage, - des moyens de décodage des coefficients codés des régions du niveau de résolution la plus faible, - des moyens de synthèse des données décodées sur un niveau de résolution, - des moyens de segmentation des données synthétisées en au moins deux régions homogènes, - des moyens de classement des régions selon un critère de priorité, - des moyens de décision de décodage de chaque région, en fonction de son classement et du critère de codage prédéterminé,
<Desc/Clms Page number 33>
les moyens de synthèse, segmentation, classement et décision étant adaptés à réitérer leur fonctionnement sur au moins un niveau de résolution.
25. Dispositif de codage (10) selon l'une quelconque des revendications 13 à 21, caractérisé en ce que les moyens de décomposition, segmentation, classement et décision sont incorporés dans : - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
26. Dispositif de décodage (10) selon la revendication 23 ou 24, caractérisé en ce que les moyens de décodage et synthèse sont incorporés dans : - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à enregistrer des variables modifiées au cours de l'exécution dudit programme.
27. Appareil de traitement de signal numérique, caractérisé en ce qu'il comporte des moyens adaptés à mettre en oeuvre le procédé selon l'une quelconque des revendications 1 à 12.
28. Appareil de traitement de signal numérique, caractérisé en ce qu'il comporte le dispositif selon l'une quelconque des revendications 13 à 26.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0103692A FR2822331B1 (fr) | 2001-03-19 | 2001-03-19 | Codage et decodage de signal numerique, avec segmentation hierarchique |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0103692A FR2822331B1 (fr) | 2001-03-19 | 2001-03-19 | Codage et decodage de signal numerique, avec segmentation hierarchique |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2822331A1 true FR2822331A1 (fr) | 2002-09-20 |
FR2822331B1 FR2822331B1 (fr) | 2003-07-04 |
Family
ID=8861283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0103692A Expired - Fee Related FR2822331B1 (fr) | 2001-03-19 | 2001-03-19 | Codage et decodage de signal numerique, avec segmentation hierarchique |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR2822331B1 (fr) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2846121A1 (fr) * | 2002-10-17 | 2004-04-23 | Commissariat Energie Atomique | Procede de reconstruction d'une image a partir d'un jeu de projections par application d'une transformee en ondelette |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997016030A1 (fr) * | 1995-10-25 | 1997-05-01 | Philips Electronics N.V. | Procede et systeme de codage d'images segmentees, et procede et systeme de decodage correspondants |
WO1998019273A1 (fr) * | 1996-10-28 | 1998-05-07 | Commonwealth Scientific And Industrial Research Organisation | Transmission d'image |
WO2000004721A1 (fr) * | 1998-07-15 | 2000-01-27 | Digital Accelerator Corporation | Codage d'image agrandissable base sur la region |
EP1079625A2 (fr) * | 1999-06-15 | 2001-02-28 | Canon Research Centre France S.A. | Codage, décodage et transmission du signal avec décomposition en sous-bandes de fréquence et segmentation |
-
2001
- 2001-03-19 FR FR0103692A patent/FR2822331B1/fr not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997016030A1 (fr) * | 1995-10-25 | 1997-05-01 | Philips Electronics N.V. | Procede et systeme de codage d'images segmentees, et procede et systeme de decodage correspondants |
WO1998019273A1 (fr) * | 1996-10-28 | 1998-05-07 | Commonwealth Scientific And Industrial Research Organisation | Transmission d'image |
WO2000004721A1 (fr) * | 1998-07-15 | 2000-01-27 | Digital Accelerator Corporation | Codage d'image agrandissable base sur la region |
EP1079625A2 (fr) * | 1999-06-15 | 2001-02-28 | Canon Research Centre France S.A. | Codage, décodage et transmission du signal avec décomposition en sous-bandes de fréquence et segmentation |
Non-Patent Citations (2)
Title |
---|
AMONOU I ET AL: "Iterative backward segmentation for hierarchical wavelet image coding", PROCEEDINGS 2000 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING. ICIP 2000. VANCOUVER, CANADA, SEPT. 10 - 13, 2000, INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, NEW YORK, NY: IEEE, US, vol. 1 OF 3. CONF. 7, 10 September 2000 (2000-09-10), pages 641 - 644, XP002177703, ISBN: 0-7803-6298-5 * |
AMONOU I ET AL: "NON REDUNDANT REPRESENTATION OF IMAGES ALLOWING OBJECT BASED AND MULTIRESOLUTION SCALABLE CODING", PROCEEDINGS OF THE SPIE, SPIE, BELLINGHAM, VA, US, vol. 4067, 2000, pages 598 - 608, XP001009489 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2846121A1 (fr) * | 2002-10-17 | 2004-04-23 | Commissariat Energie Atomique | Procede de reconstruction d'une image a partir d'un jeu de projections par application d'une transformee en ondelette |
WO2004036288A2 (fr) * | 2002-10-17 | 2004-04-29 | Commissariat A L'energie Atomique | Procede de reconstruction d'une image a partir d'un jeu de projections par application d'une transformee en ondelette. |
WO2004036288A3 (fr) * | 2002-10-17 | 2004-07-08 | Commissariat Energie Atomique | Procede de reconstruction d'une image a partir d'un jeu de projections par application d'une transformee en ondelette. |
Also Published As
Publication number | Publication date |
---|---|
FR2822331B1 (fr) | 2003-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2826823A1 (fr) | Procede et dispositif de traitement d'un signal numerique code | |
FR2785426A1 (fr) | Procede et dispositif d'insertion et de detection d'une marque dans des donnees numeriques | |
JP4416613B2 (ja) | カラー画像情報を白黒画像に埋め込むための方法 | |
FR2724792A1 (fr) | Procede de compression de donnees utilisant des ondes elementaires implantees reversibles | |
FR2889382A1 (fr) | Procede et dispositif de filtrage d'un signal numerique multidimensionnel et procedes et dispositifs de codage et decodage associes | |
FR2835366A1 (fr) | Procede et dispositif de formation d'un signal numerique compresse reduit | |
FR2842983A1 (fr) | Transcodage de donnees | |
FR2817440A1 (fr) | Insertion de messages dans des donnees numeriques | |
FR2816154A1 (fr) | Insertion d'information supplementaire dans des donnees numeriques | |
FR2755818A1 (fr) | Codage de signal numerique par decomposition en sous-bandes de frequence et quantification vectorielle a etats finis | |
EP1107185A1 (fr) | Segmentation hiérarchique d'une image numérique avec décomposition en ondelettes et projection de contours | |
Siddeq et al. | A novel Hexa data encoding method for 2D image crypto-compression | |
FR2825224A1 (fr) | Procede et dispositif de compression et ou d'indexation d'images numeriques | |
EP1588563B1 (fr) | Protection adaptative et progressive d'images fixes codees en ondelettes | |
FR2850515A1 (fr) | Procede et systeme adaptatif et progressif de distribution securisee d'images fixes codees en ondelettes | |
FR2822331A1 (fr) | Codage et decodage de signal numerique, avec segmentation hierarchique | |
WO2018083266A1 (fr) | Procédé et dispositif de restauration d'image numérique | |
EP1574068A1 (fr) | Procede de codage d'une image par ondelettes et procede de decodage correspondant | |
FR2817697A1 (fr) | Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques | |
FR2826225A1 (fr) | Segmentation spatio-temporelle hierarchique d'un signal numerique | |
FR2825223A1 (fr) | Segmentation spatio-temporelle hierarchique d'un signal numerique | |
FR2782223A1 (fr) | Procede et dispositif d'insertion et de decodage d'une marque dans des donnees numeriques | |
FR2848765A1 (fr) | Procede et dispositif de determination d'une configuration de donnees d'un signal numerique d'image | |
FR2817698A1 (fr) | Procede et dispositif de traitement d'un ensemble de donnees representatives de grandeurs physiques | |
FR2786647A1 (fr) | Codage de donnees utilisant une compensation de mouvement dans le domaine des transformees en ondelettes discretes, et decodage correspondant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ST | Notification of lapse |
Effective date: 20141128 |