FR2909474A1 - Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees - Google Patents

Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees Download PDF

Info

Publication number
FR2909474A1
FR2909474A1 FR0655303A FR0655303A FR2909474A1 FR 2909474 A1 FR2909474 A1 FR 2909474A1 FR 0655303 A FR0655303 A FR 0655303A FR 0655303 A FR0655303 A FR 0655303A FR 2909474 A1 FR2909474 A1 FR 2909474A1
Authority
FR
France
Prior art keywords
image
images
coded
resolution
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0655303A
Other languages
English (en)
Other versions
FR2909474B1 (fr
Inventor
Leannec Fabrice Le
Patrice Onno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to FR0655303A priority Critical patent/FR2909474B1/fr
Priority to US11/949,399 priority patent/US8630343B2/en
Publication of FR2909474A1 publication Critical patent/FR2909474A1/fr
Application granted granted Critical
Publication of FR2909474B1 publication Critical patent/FR2909474B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention concerne un procédé de codage d'images numériques, caractérisé en ce que le procédé comporte une étape de codage vidéo (E8) d'une pluralité d'images successives, la pluralité d'images successives correspondant à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale.

Description

1 L'invention est relative à un procédé de codage d'images numériques et
de décodage d'images numériques ainsi codées. On connaît des systèmes de navigation interactive dans des images ayant une multitude de niveaux de résolution successifs. De tels systèmes tels que ceux connus sous les dénominations Zoomify, Zoomview, Kakadu, ont recours à des formats de compression multirésolutions dans lesquels le facteur d'échelle spatiale entre deux niveaux de résolution successifs est systématiquement égal à deux. Un utilisateur de ces systèmes peut procéder à des opérations de zoom avant et de zoom arrière en passant d'un niveau de résolution d'une image à un autre niveau de résolution qui lui est inférieur ou supérieur. Cependant, l'opération de zoom avant ou de zoom arrière n'est possible que pour des niveaux de résolution dyadiques, ce qui rend impossible une navigation spatiale dans l'image à un niveau de résolution intermédiaire quelconque.
Par ailleurs, les opérations de zoom avant et de zoom arrière dans ces systèmes nécessitent un traitement postérieur aux opérations de décodage des images avant de procéder à l'affichage de ces images. Plus particulièrement, des opérations de sous-échantillonnage ou de sur-échantillonnage postérieures aux opérations de décompression des images sont en effet nécessaires pour pouvoir naviguer de façon interactive dans ces images multi-résolutions pour des niveaux de résolution intermédiaires quelconques. La présente invention prévoit de remédier à au moins un des inconvénients présentés ci-dessus en proposant un procédé de codage d'images numériques, caractérisé en ce que le procédé comporte une étape de codage vidéo d'une pluralité d'images successives, la pluralité d'images successives correspondant à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale. 2909474 2 On effectue selon l'invention un codage vidéo le long de l'axe des résolutions spatiales dans un ensemble d'images représentant une image fixe donnée à des résolutions spatiales différentes, alors que le codage vidéo s'applique traditionnellement le long de l'axe temporel. On notera que les 5 différentes versions de l'image initiale ne sont pas nécessairement ordonnées. Le non ordonnancement permet un accès rapide à certains niveaux de résolution particuliers, ce qui peut s'avérer intéressant pour certains types d'applications. L'utilisation d'un codage vidéo fait intervenir une étape de prédiction à 10 base de compensation en mouvement entre différents niveaux de résolution d'une même image. On obtient ainsi une pluralité d'images successives compressées représentant une même image suivant différents niveaux de résolution spatiale dont le nombre n'est pas limité. 15 L'image initiale est compressée dans un format ayant une multitude de résolutions non nécessairement dyadiques. En effet, grâce à l'invention c'est l'utilisateur qui peut choisir, lors de la génération de l'image compressée, le facteur d'échelle entre les différents niveaux de résolution, offrant ainsi une souplesse d'utilisation du procédé. 20 Lorsque les résolutions spatiales sont ordonnées (niveaux de résolution spatiale successifs) l'invention permet, par exemple, d'élaborer un fichier d'image compressée avec des résolutions croissantes. L'ordonnancement des différentes résolutions spatiales est réalisé de manière appropriée en fonction du but poursuivi. 25 Ainsi, l'ordonnancement peut être effectué dans le but d'optimiser le rapport débit/distorsion. L'ordonnancement peut également être effectué pour atteindre des fonctionnalités bien précises souhaitées par un utilisateur comme, par exemple, la navigation au sein des différents niveaux de résolution. 30 L'invention est particulièrement simple puisqu'il n'est pas nécessaire d'effectuer de traitement après le décodage pour pouvoir naviguer de façon interactive parmi la multitude de niveaux de résolutions spatiales ordonnés et, plus 2909474 3 particulièrement, pour pouvoir effectuer des opérations de zoom avant et arrière de façon continue entre différents niveaux de résolution. Par ailleurs, un codeur vidéo existant, éventuellement conforme à un standard de compression vidéo numérique, peut être utilisé pour générer de façon 5 simple un fichier compressé facilitant une navigation interactive. On peut ainsi mettre facilement en oeuvre l'invention dans des systèmes existants. Selon une caractéristique, les résolutions spatiales de la pluralité d'images successives sont inférieures à la résolution de l'image initiale. 10 On obtient ainsi, à partir de l'image initiale, des images intermédiaires de bonne qualité. Par ailleurs, le fait de choisir une ou plusieurs résolutions spatiales supérieures à celle de l'image initiale permet d'effectuer des opérations d'agrandissement de cette dernière pour obtenir des versions dilatées. 15 Selon une caractéristique, l'image initiale ayant une taille spatiale initiale, préalablement à l'étape de codage vidéo, le procédé comporte une étape d'augmentation des bords de chacune des images de la pluralité d'images successives, ces images dites utiles ayant une taille inférieure à celle de l'image de taille maximale obtenue à partir de cette pluralité d'images, chaque image de 20 taille ainsi augmentée ayant la même taille spatiale que celle de l'image de taille maximale. Dans le cas particulier où les résolutions spatiales de la pluralité d'images successives sont inférieures à la résolution de l'image initiale, chaque image de taille ainsi augmentée a alors la taille spatiale initiale de l'image initiale. 25 L'opération d'augmentation de taille des images de tailles inférieures consiste ainsi en la création d'une bordure ou d'un cadre autour de l'image. L'avantage de cette caractéristique est qu'elle permet de fournir au codeur vidéo une séquence d'images qui ont toutes les mêmes dimensions et donc d'éviter de modifier le codeur vidéo utilisé pour mettre en oeuvre l'invention. En 30 effet, un codeur vidéo travaille généralement sur des séquences qui ont des images de mêmes dimensions. Selon une caractéristique, le procédé comporte une étape préalable d'obtention de la pluralité d'images successives, à partir de l'image initiale. 2909474 4 On part ainsi de l'image originale à sa pleine résolution pour créer ces images successives qui sont à coder. Ensuite, on effectue un codage vidéo des images ainsi créées. La multitude de niveaux de résolution différents obtenus sont, par exemple, sélectionnés par un utilisateur qui spécifie le facteur d'échelle entre les niveaux. Pour ce faire, ce dernier choisit, par exemple, la résolution la plus basse de l'image initiale, la résolution maximale souhaitée et le nombre de niveaux de résolution intermédiaires souhaités. 10 Selon une caractéristique, le procédé comporte une étape d'insertion de données d'en-tête dans le signal comprenant la pluralité d'images codées, les données d'en-tête comprenant la taille de l'image de plus basse résolution et le nombre de niveaux de résolution contenus dans le signal. Selon une caractéristique alternative, le procédé comporte une étape 15 d'insertion de données d'en-tête dans le signal comprenant la pluralité d'images codées, les données d'en-tête comprenant, pour chaque image de taille augmentée, la taille de l'image utile. En disposant de ces informations dans les données d'en-tête on réduit ainsi les opérations de calcul de taille d'image au niveau du décodeur, ce qui 20 permet de diminuer sa complexité. On notera que l'on effectue un choix entre les deux alternatives précédentes selon le but recherché : diminuer la taille du fichier compressé ou réduire la complexité du décodeur. Selon une autre caractéristique, les données d'en-tête comprennent 25 pour chaque image de taille augmentée, la position de l'image utile dans l'image de taille augmentée. Ainsi, il est possible de retrouver l'image utile quelle que soit sa position dans l'image augmentée. On notera cependant que, si chaque image est centrée ou, d'une manière plus générale, placée à une position fixe connue du décodeur 30 (par exemple en haut à gauche), cette information de position n'est pas nécessaire. Selon une caractéristique, l'étape d'obtention des images est une étape de sous-échantillonnage de l'image initiale. 2909474 5 Le fait d'effectuer un sous-échantillonage de l'image originale pour générer chaque image réduite fournit des images réduites de meilleure qualité que si l'on déduit les images réduites successives les unes des autres. En effectuant en outre un filtrage des images ainsi sous- 5 échantillonnées, par exemple un filtrage passe-bas, on améliore la qualité de ces images. Selon une caractéristique, le codage vidéo de la pluralité d'images à des résolutions successives inférieures à celle de l'image initiale comprend une étape de codage vidéo de l'image de plus basse résolution comme pour une 10 image INTRA d'une séquence vidéo. L'avantage de cette caractéristique est notamment de permettre un accès rapide à la représentation de plus basse résolution de l'image considérée. Cette représentation, appelée imagette ( thumbnail en terminologie anglosaxonne), constitue généralement la version de prévisualisation d'une image 15 multi-résolution dans une application de navigation interactive. Le deuxième avantage de cette caractéristique est lié aux performances de compression qu'elle procure. En effet, la version de plus basse résolution est la moins coûteuse à coder en INTRA. Les images de tailles supérieures peuvent alors être prédites via des techniques de prédiction temporelle connues en codage vidéo. 20 Selon une caractéristique, le codage vidéo comprend également, pour au moins certaines des images successives de résolutions supérieures à celle de l'image de plus basse résolution, une étape de codage vidéo prédictif de chacune de ces images. L'avantage de cette caractéristique réside dans le fait que les 25 redondances existant entre les différentes images de la séquence à coder sont exploitées via des techniques de prédiction temporelle connues dans le domaine du codage vidéo, dans le but de fournir une représentation compressée de la pyramide multi-résolution considérée. Selon une caractéristique, le procédé comporte une étape de codage 30 d'au moins une image de permutation et une étape d'insertion de ladite au moins une image de permutation codée parmi la pluralité d'images successives codées. 2909474 6 Une ou plusieurs images de permutation ainsi codées et insérées dans le fichier codé permettent de réaliser une opération de zoom arrière dans l'image multi-résolution codée. Selon une caractéristique, le procédé comporte, en outre, une étape de 5 codage vidéo hiérarchique de la pluralité d'images successives. Le codage vidéo de la pluralité d'images successives à des résolutions spatiales différentes associé au codage vidéo hiérarchique de cette même pluralité d'images permet à l'utilisateur d'accéder rapidement à des résolutions spatiales de son choix sans avoir nécessairement à décoder toutes les images de résolution 10 spatiale inférieure. L'invention a également pour objet un procédé de décodage d'au moins une partie d'une pluralité d'images numériques successives codées par codage vidéo, caractérisé en ce que la pluralité d'images successives correspond à une pluralité de versions d'une même image initiale à des résolutions spatiales 15 différentes de celle de l'image initiale, le procédé comprenant une étape de décodage vidéo d'au moins une partie de cette pluralité d'images codées. Ainsi, après avoir effectué le décodage de tout ou partie de la pluralité d'images codées, il n'est pas nécessaire de procéder à une étape de post-traitement pour pouvoir effectuer des opérations de navigation interactive, 20 notamment, de zoom avant et arrière de façon continue sur l'image multirésolution. Si un codeur vidéo existant, éventuellement conforme à un standard de compression vidéo numérique, a été utilisé pour le codage de l'image multirésolution, alors un décodeur vidéo existant, éventuellement conforme à un 25 standard de compression vidéo numérique, peut être utilisé pour procéder aux opérations de décodage. Des opérations graphiques de zoom avant et de zoom arrière sur l'image multi-résolution ainsi décompressée sont alors très faciles à réaliser dans un appareil disposant d'un décodeur vidéo standard. 30 Selon une caractéristique, le procédé de décodage comprend les étapes suivantes : 2909474 7 - détermination, parmi la pluralité d'images successives codées, d'une image codée ayant une résolution correspondant à une taille spatiale sélectionnée par un utilisateur, -décodage vidéo des images successives codées à partir de l'image 5 codée de plus basse résolution jusqu'à l'image codée ainsi déterminée. Ainsi, un utilisateur choisit un niveau de résolution spatiale parmi une multitude de niveaux de résolution possibles et un décodage vidéo des images successives nécessaires est effectué pour afficher l'image dans la résolution souhaitée. 10 Selon une caractéristique, les résolutions spatiales sont ordonnées. Selon une caractéristique, les résolutions spatiales sont inférieures à celle de l'image initiale. Selon une caractéristique, le procédé comporte une étape de lecture de données d'en-tête du signal comprenant la pluralité d'images codées, les 15 données d'en-tête comprenant la taille de l'image de plus basse résolution et le nombre de niveaux de résolution contenus dans le signal. Selon une caractéristique, chacune des images codées est une image dont la taille a été augmentée par rapport à la taille inférieure de l'image utile afin d'atteindre, pour chaque image, la taille maximale de l'image obtenue à partir de 20 la pluralité d'images successives, le procédé comportant une étape de lecture de données d'en-tête du signal comprenant la pluralité d'images codées, les données d'en-tête comprenant pour chaque image codée, la taille de l'image utile. Selon une caractéristique, les données d'en-tête comprennent pour 25 chaque image codée, la position de l'image utile dans l'image de taille augmentée. Selon une caractéristique, la pluralité d'images successives ayant également subi un codage vidéo hiérarchique, le procédé comporte une étape de décodage vidéo hiérarchique d'au moins une partie de la pluralité d'images 30 successives ainsi codées. 2909474 8 Corrélativement, l'invention a également pour objet un dispositif de codage d'images numériques, caractérisé en ce que le dispositif comporte des moyens de codage vidéo d'une pluralité d'images successives, la pluralité d'images successives correspondant à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale. L'invention a en outre pour objet un dispositif de décodage d'au moins une partie d'une pluralité d'images numériques successives codées par codage vidéo, caractérisé en ce que la pluralité d'images successives correspond à une pluralité de versions d'une même image initiale à des résolutions spatiales 10 différentes de celle de l'image initiale, le dispositif comprenant des moyens de décodage vidéo d'au moins une partie de cette pluralité d'images codées. Selon une caractéristique, le dispositif de décodage comprend des moyens de détermination, parmi la pluralité d'images successives codées, d'une image codée ayant une résolution correspondant à une taille spatiale 15 sélectionnée par un utilisateur, les moyens de décodage vidéo étant aptes à effectuer le décodage vidéo des images successives codées à partir de l'image codée de plus basse résolution jusqu'à l'image codée ainsi déterminée. L'invention vise aussi un programme d'ordinateur chargeable dans un système informatique, ledit programme contenant des instructions permettant la 20 mise en oeuvre du procédé de codage brièvement exposé ci-dessus et/ou la mise en oeuvre du procédé de décodage brièvement exposé ci-dessus, lorsque ce programme est chargé et exécuté par un système informatique. D'autres caractéristiques et avantages apparaîtront au cours de la description qui va suivre, donnée uniquement à titre d'exemple non limitatif et 25 faite en référence aux dessins annexés, sur lesquels : la figure 1 illustre de façon schématique un dispositif intégrant les moyens de mise en oeuvre de l'invention ; - la figure 2 illustre de façon schématique le principe de codage multirésolution spatiale selon l'invention ; 30 - la figure 3 illustre de façon schématique un exemple de réalisation des différents blocs fonctionnels mis en oeuvre selon l'invention 2909474 9 - la figure 4 illustre de façon schématique un algorithme de codage selon un exemple de réalisation de l'invention ; - la figure 5 illustre de façon schématique une pluralité d'images successives codées selon un exemple de réalisation de l'invention 5 - la figure 6 illustre de façon schématique un algorithme de décodage selon un exemple de réalisation de l'invention ; - la figure 7 illustre une variante de réalisation de l'invention fournissant une fonctionnalité de zoom arrière rapide dans une image fixe multirésolution compressée ; 10 - la figure 8 illustre de façon schématique une autre variante de réalisation de l'invention mettant en oeuvre le codage vidéo hiérarchique SVC ; - la figure 9 illustre un exemple pratique de la variante de la figure 8. La figure 1 illustre un mode particulier de réalisation du dispositif objet de la présente invention, codeur et/ou décodeur, 100 et différents 15 périphériques adaptés à implémenter chaque aspect de la présente invention. Dans le mode de réalisation illustré en figure 1, le dispositif 100 est un micro-ordinateur de type connu connecté, dans le cas du codeur, par le biais d'une carte graphique, à un moyen d'acquisition ou de stockage d'images 101, par exemple une caméra numérique ou un scanner, adapté 20 à fournir des informations d'images à coder. Le dispositif 100 comporte une interface de communication 118 reliée à un réseau 134 apte à transmettre, en entrée, des données numériques à coder ou à décoder et, en sortie, des données codées ou décodées par le dispositif. Le dispositif 100 comporte également un moyen de stockage 25 112, par exemple un disque dur, et un lecteur 114 de disquette 116. La disquette 116 et le moyen de stockage 112 peuvent contenir des données à coder ou à décoder, des données codées ou décodées et un programme informatique adapté à mettre en oeuvre le procédé de codage ou de décodage objets de la présente invention. 30 Selon une variante, le programme permettant au dispositif de mettre en oeuvre la présente invention est stocké en mémoire morte ROM 2909474 10 (acronyme de read only memory pour mémoire non réinscriptible) 104. Selon une autre variante, le programme est reçu par l'intermédiaire du réseau de communication 134 avant d'être stocké. Le dispositif 100 est, optionnellement, relié à un microphone 124 par 5 l'intermédiaire d'une carte d'entré/sortie 122. Ce même dispositif 100 possède un écran 108 permettant de visualiser les données à coder ou qui sont décodées ou servant d'interface avec l'utilisateur pour paramétrer certains modes d'exécution du dispositif 100, à l'aide d'un clavier 110 et/ou d'une souris par exemple. 10 Une unité centrale CPU (acronyme de central processing unit ) 103 exécute les instructions du programme informatique et de programmes nécessaires à son fonctionnement, par exemple un système d'exploitation. Lors de la mise sous tension du dispositif 100, les programmes stockés dans une mémoire non volatile, par exemple la mémoire morte 104, le 15 disque dur 112 ou la disquette 116, sont transférés dans une mémoire vive RAM (acronyme de random access memory pour mémoire à accès aléatoire) 106 qui contiendra alors le code exécutable du programme objet de la présente invention ainsi que des registres pour mémoriser les variables nécessaires à sa mise en oeuvre. 20 Bien entendu, la disquette 116 peut être remplacée par tout support d'information amovible, tel que disque compact, clé ou carte mémoire. De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme objet de la présente 25 invention. Un bus de communication 102 permet la communication entre les différents éléments inclus dans le dispositif 100 ou reliés à lui. La représentation, en figure 1, du bus 102 n'est pas limitative et notamment l'unité centrale 103 est susceptible de communiquer des instructions à tout élément du dispositif 100 directement ou par l'intermédiaire d'un autre 30 élément du dispositif 100. Le dispositif décrit ici et, particulièrement, l'unité centrale 103, sont susceptibles d'implémenter tout ou partie des traitements décrits en regard des 2909474 11 figures suivantes pour mettre en oeuvre chaque procédé objet de la présente invention et constituer chaque dispositif objet de la présente invention. La figure 2 illustre de façon schématique le principe de l'invention. En partie haute de cette figure, on a représenté une série d'images 200 5 constituant une séquence vidéo qui se déroule suivant un axe temporel (dimension temporelle). De façon connue, un codeur vidéo appliqué à la séquence vidéo 200 exploite notamment les redondances existant au sein de cette séquence suivant la dimension temporelle, afin d'obtenir de bonnes performances de compression. 10 La partie basse de la figure 2 illustre une série d'images 210 représentant une même image originale qui a été réduite suivant différents niveaux de résolution spatiale ordonnés de la plus petite résolution à la plus grande résolution (représentation pyramidale multi-résolution). Cette pluralité de niveaux de résolution non limités est obtenue à partir 15 de l'image d'origine, par exemple, par l'intermédiaire d'une opération de sous-échantillonnage et ensuite d'une éventuelle opération de filtrage passe-bas pour améliorer la qualité des images réduites. L'invention prévoit d'effectuer un codage vidéo dans une représentation pyramidale multi-résolution d'une image fixe donnée telle que celle illustrée en 20 partie basse de la figure 2. On notera que dans cet exemple les résolutions spatiales des différentes images sont ordonnées suivant des résolutions croissantes. Cependant, l'invention s'applique également lorsque les images obtenues à partir de l'image initiale ne sont pas ordonnées. 25 La figure 3 représente de façon schématique le codage et le décodage d'images selon un exemple de réalisation de l'invention. Une image initiale 1 en pleine résolution est fournie en entrée d'une unité de traitement 212 qui reçoit également des données d'entrée 213, par exemple, fournies par un utilisateur. 30 Ces données fournies, par exemple, avec une requête utilisateur indiquent les spécificités souhaitées par l'utilisateur, à savoir, par exemple, le nombre de niveaux de résolution pour la pluralité d'images qui vont être générées ainsi qu'éventuellement la taille de l'image de plus basse résolution. 2909474 12 On notera que ces deux paramètres définissent sans ambiguïté la pyramide multi-résolution qui va être créée. En utilisant ces deux paramètres on détermine le facteur d'échelle qui est, par exemple, le rapport additif liant, en termes de dimensions, deux images 5 successives de cette pyramide multi-résolution. On obtient en sortie de l'unité de traitement 212 une pluralité d'images successives 210 correspondant à une pluralité de versions de l'image I à des résolutions successives inférieures à celles de cette image I. La série d'images 210 à de multiples niveaux de résolution ainsi 10 générée est fournie en entrée d'un codeur vidéo 214. Dans ce codeur, la série d'images générée à de multiples niveaux de résolution est compressée par des techniques connues de compression vidéo. Ces dernières incluent, notamment, des étapes d'estimation et de compensation en mouvement qui sont appliquées aux blocs de pixels des 15 différentes images de la série d'images multi-résolution à compresser. La pluralité d'images ainsi codées par codage vidéo sont transmises par l'intermédiaire d'un moyen de transmission 216 (par exemple un réseau de communication) à un décodeur vidéo 218. Ce décodeur reçoit également des données d'entrée, de la part de 20 l'application de visualisation d'image, qui définissent l'une des images de la pluralité d'images codées, ou encore les dimensions auxquelles l'utilisateur souhaite voir l'image affichée. Par exemple, l'utilisateur peut sélectionner la taille spatiale d'une image ou sa résolution. 25 Un décodage vidéo approprié de tout ou partie de la pluralité d'images codées est ainsi effectué et génère une série d'images décodées allant de l'image de plus basse résolution jusqu'à l'image dont la résolution (ou taille) correspond à celle demandée par l'utilisateur. Cette dernière image 1' demandée par l'utilisateur est affichée par une 30 unité 222. La figure 4 représente un algorithme général de codage d'images multirésolution selon un exemple de réalisation de l'invention. L'algorithme utilise les données d'entrée suivantes : 2909474 13 - l'image originale I à compresser avec sa taille (origX, origY), - les paramètres de codage, à savoir le nombre de niveaux de résolution spatiale (NbRes) que devra contenir le signal compressé en sortie du codeur, ce nombre étant spécifié par l'utilisateur, ainsi que la taille de l'image de 5 plus basse résolution (minX, minY) indiquée par l'utilisateur et qui correspond à la version d'image réduite la plus petite (également appelée imagette ou thumbnail en terminologie anglo-saxonne) de l'image originale l à coder. A titre de variante, on indique en entrée de l'algorithme la taille minimum et les facteurs additifs (en largeur et en hauteur) liant deux niveaux de 10 résolution successifs. Selon une autre variante, des facteurs multiplicatifs entre niveaux de résolutions successifs sont considérés. Selon encore une autre variante, les tailles des niveaux de résolutions visés sont explicitement spécifiés, si une progression non nécessairement régulière 15 est souhaitée. On notera que la sélection par l'utilisateur est un mode de mise en oeuvre de l'invenion. Alternativement, le nombre de niveaux de résolution peut être prédéterminé en fonction de l'application visée. L'algorithme comporte une première étape El d'initialisation du premier 20 niveau de résolution r=0 (résolution la plus basse de l'image) à traiter par l'algorithme. Au premier niveau de résolution r=0, l'image réduite a une taille correspondante définie par les paramètres rX, rY qui sont déterminés à l'étape suivante E2 par les formules mathématiques illustrées sur la figure 4. 25 Pour le premier niveau de résolution (r=0) la taille de l'image réduite considérée est celle de l'image de plus basse résolution définie par les valeurs minX et minY. Au cours de l'étape suivante E3, on procède de façon connue pour générer, par des opérations conventionnelles de sous-échantillonnage et de filtrage 30 passe-bas, une image réduite de largeur rX et de hauteur rY à partir de l'image originale I. L'étape suivante E4 consiste à conférer à l'image réduite ainsi générée la taille de l'image originale (origX, origY). 2909474 14 En effet, le codeur vidéo 214 de la figure 3 n'est adapté à fonctionner qu'avec des images de dimensions identiques. Ainsi, on complète l'image de taille réduite en ajoutant (cet ajout est connu en terminologie anglo-saxonnesous le terme "padding") à la périphérie de 5 celle-ci, par exemple, des pixels noirs. On remplit de cette façon les bords de l'image afin d'atteindre la taille de l'image originale I. L'image ainsi réduite et complétée aux bords est ensuite ajoutée (étape E5) à la pluralité d'images en cours d'élaboration et qui sont destinées à 10 représenter une pyramide multi-résolution de l'image originale. Pour le dernier niveau de résolution (r=NbRes) l'image réduite qui vient d'être traitée est la première de cette séquence d'images et il n'y a donc aucun pixel à lui ajouter en périphérie. Au cours de l'étape suivante E6 un test est pratiqué afin de déterminer 15 si la taille de l'image réduite qui vient d'être traitée est celle de l'image originale I. Dans la négative (tel est le cas lorsque l'on traite le premier niveau de résolution r=O), cette étape est suivie d'une étape E7 d'incrémentation du niveau de résolution courant d'une unité. Les étapes précitées E2 à E5 sont alors de nouveau exécutées pour le niveau de résolution suivant (r=l). 20 Pour ce nouveau niveau, la taille de l'image réduite à ce niveau de résolution est ainsi calculée (E2), puis générée à partir de l'image I (E3), complétée (E4) et ajoutée à la séquence en cours d'élaboration et qui contient déjà la version d'image réduite pour le niveau de résolution le plus bas. De retour à l'étape E6, lorsque tous les niveaux de résolution spatiale 25 fixés au préalable ont été traités et que l'on a ainsi construit une succession d'images à de multiples niveaux de résolution inférieure au niveau de résolution maximale de l'image I, on procède au codage vidéo suivant l'axe des résolutions spatiales de cette séquence d'images à l'étape E8. Dans l'exemple de réalisation, le codeur vidéo 214 de la figure 3 30 effectue un codage selon le standard de codage vidéo H.264/AVC. Bien entendu, d'autres types de codage vidéo peuvent être utilisés sans sortir du cadre de l'invention. 2909474 15 L'algorithme de la figure 4 génère ainsi une pluralité d'images successives codées qui constituent un train binaire compressé (fichier compressé) compatible avec le standard de codage vidéo utilisé. Ensuite, au cours d'une étape E9, des données d'en-tête sont ajoutées 5 en en-tête du signal comprenant les différentes images codées de la séquence codée. Ces données indiquent, d'une part, la taille de l'image de la séquence représentant l'image originale au plus bas niveau de résolution et, d'autre part, le nombre total de niveaux de résolution contenus dans le signal compressé. Par exemple, dans le cas de l'utilisation du standard vidéo H264/AVC, ces données 10 d'en-tête peuvent être codées dans un message de type SEI (connu en terminologie anglosaxonne sous le terme Supplemental Enhancement Information ) que l'on définit spécifiquement à cet effet. On notera que dans le fichier élaboré grâce à l'algorithme de la figure 4 les différentes résolutions spatiales successives de l'image initiale I sont classées 15 par ordre croissant depuis la résolution la plus basse jusqu'à la résolution maximale, comme l'illustre d'ailleurs la partie basse de la figure 2. On notera que le calcul des tailles des différentes versions de l'image en cours de codage (étape E2) fait intervenir une progression affine des tailles des différents niveaux de résolution intermédiaires sélectionnés par l'utilisateur, entre 20 l'image originale I de taille maximale et l'image de plus basse résolution. Toutefois, au lieu d'utiliser une fonction affine pour définir les différents niveaux de résolution spatiale intermédiaires, un facteur multiplicatif constant non nécessairement égal à 2 peut être appliqué entre deux niveaux de résolution successifs de l'image. 25 Selon encore une autre variante, on peut utiliser une suite de valeurs de dimensions explicitement spécifiées en entrée de l'algorithme de la figure 2 pour chaque niveau de résolution. On a représenté sur la figure 5 un exemple de structure de codage vidéo appliquée sur une séquence d'images représentant une pyramide muftirésolution spatiale d'une même image initiale I (image I sur la figure 3). La pluralité d'images représentées à la figure 5 est obtenue par application des étapes successives E3 à E5 de l'algorithme de la figure 4 pour tous les niveaux de résolution définis par l'utilisateur. 2909474 16 La première image 250 parmi cette pluralité d'images successives correspond à l'image de plus basse résolution et un codage en mode INTRA est appliqué sur cette image. Une structure de groupe d'images ou GOP (connue en terminologie 5 anglo-saxonne sous le terme "Group Of Pictures") de taille 4 est, par exemple, définie. Le premier groupe GOPO est défini par les images successives suivantes 250, 252, 254, 256, le deuxième groupe GOP1 par les images 258, 260, 262 et 264 et le dernier groupe GOP2 par les images 266 et 268. On notera que la première image de chaque groupe à l'exception du premier groupe est une image de type P (images 258 et 266), c'est-à-dire que cette image est prédite à partir d'une ou de plusieurs autres images de type I ou P. Cette prédiction est symbolisée par les flèches situées au dessus des images représentées sur la figure 5. On notera que les images 258 et 266 sont dupliquées chacune sur deux lignes différentes de la figure pour des raisons de clarté de présentation de la prédiction. Par ailleurs, les images de chaque groupe suivant la première image de type P sont des images de type B (images 260 et 268), c'est-à-dire qu'elles sont 20 prédites par estimation de mouvement et compensation en mouvement de façon bidirectionnelle à l'aide d'image (s) de référence passée(s) et future (s). Un tel codage vidéo prédictif conforme au standard H.264/AVC est plus particulièrement détaillé dans le document suivant : "text of ISO/IEC 14496 10 Advanced Video Coding 3' Edition", ISO/IEC JTC11SC29/WG 11 N6540, Joint 25 Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, July 2004, Redmond USA. On notera que sur la figure 5 toutes les images de la séquence ont la même taille ou dimension (hauteur et largeur en nombre de pixels), suite au remplissage de chacune de ces images à l'étape E4 de la figure 4. La figure 6 illustre un algorithme de décodage d'une image mufti- 30 résolution selon l'invention. Les données fournies en entrée de l'algorithme de la figure 6 sont les suivantes : 10 15 2909474 17 - l'image multi-résolution qui était compressée par exécution de l'algorithme de la figure 4 et qui doit être décompressée, - les paramètres de décodage qui sont, par exemple, indiqués par l'application de visualisation d'image qui comprennent, notamment, la taille spatiale 5 (largeur et hauteur) de l'image décompressée que souhaite l'utilisateur. Cette taille est par exemple définie par des paramètres targetX et targetY. Selon une variante, l'utilisateur peut indiquer la résolution et non la taille de l'image souhaitée. Ainsi, l'utilisateur spécifie un facteur de zoom via l'interface 10 graphique de l'application de navigation dans des images. Un tel facteur de zoom peut alors être fourni au décodeur qui en déduit l'image de la pyramide multirésolution qu'il faut décoder et restituer à l'interface graphique. L'algorithme de la figure 6 débute par une étape EIO au cours de laquelle on décode et on lit les données d'en-tête qui sont contenues dans le train 15 binaire compressé représentant l'image multi-résolution compressée. La lecture de ces données d'en-tête fournit notamment les dimensions de l'image 1 à son niveau de résolution maximal (origX, origY), ainsi que les dimensions de l'image à son niveau de résolution minimal (minX, minY) et le nombre total de niveaux de résolution. 20 Dans la suite de l'algorithme on détermine, parmi la pluralité d'images successives codées, celle qui correspond le mieux aux indications fournies par l'utilisateur, notamment les dimensions targetX et targetY de l'image souhaitée. Pour ce faire, on examine les niveaux de résolution successifs de l'image multi-résolution compressée jusqu'à trouver celui sélectionné par 25 l'utilisateur. On débute ainsi par l'étape Ell qui prévoit l'initialisation du niveau de résolution courant à la valeur minimale r=0. On calcule ensuite, à l'étape E12, la taille de l'image correspondant au niveau de résolution considéré, de façon identique à ce qui a été effectué à l'étape 30 E2 de la figure 4. Ce calcul est nécessaire lorsque les dimensions de l'image représentée aux différents niveaux de résolution spatiale contenus dans le signal compressé ne sont pas codées comme données d'en-tête à l'étape E9 de la figure 4. 2909474 18 Un test est ensuite pratiqué à l'étape suivante E13 afin de déterminer si la taille de l'image qui vient d'être calculée est supérieure aux dimensions requises par l'utilisateur (targetX, targetY). Dans la négative, l'étape E13 est suivie de l'étape E14 qui prévoit 5 d'incrémenter d'une unité le niveau de résolution courant pour effectuer le calcul de la taille de l'image suivante (image de niveau de résolution r=1 dans l'exemple considéré) à l'étape E12 déjà décrite. Cette boucle est effectuée jusqu'à ce que les dimensions de l'image du niveau de résolution courant qui viennent d'être déterminées à l'étape E12 soient 10 supérieures aux dimensions requises (targetX, targetY) et donc que le résultat du test de l'étape E13 soit positif. Dans cette hypothèse, l'étape E13 est suivie de l'étape E15 au cours de laquelle le niveau de résolution courant est décrémenté d'une unité. En effet, le niveau de résolution recherché et qui correspond à la taille 15 requise par l'utilisateur n'est pas celui pour lequel la taille de l'image est supérieure aux dimensions requises mais le précédent. Alternativement, on peut éviter la boucle itérative décrite ci-dessus et calculer directement l'indice du niveau de résolution concerné par les tailles targetX et targetY de la façon suivante : 20 t arg etX ù min X x NbRes origX min Xt arg etY ù min Y x NbRes origY ù min Y _ j) Les dimensions ainsi déterminées du niveau de résolution courant r défini à l'étape E15 sont notées Xr et Yr. Au cours de l'étape suivante E16 on initialise l'image courante de la 25 séquence en vue du décodage (indice d'image i=0). On parcourt, au cours des étapes suivantes, la pluralité des images successives codées, depuis l'image de plus basse résolution jusqu'à l'image codée correspondant au niveau de résolution r susvisé. Ainsi, plus particulièrement, l'étape E17 prévoit d'effectuer un décodage 30 vidéo conforme au standard H.264/AVC correspondant au codage effectué à l'étape E8 de la figure 4. 2909474 19 L'image d'indice i ayant été ainsi décodée, l'étape suivante E18 prévoit d'effectuer un test sur les valeurs des dimensions de l'image du niveau de résolution courant considéré par rapport aux valeurs Xr et Yr. Tant que les valeurs ne sont pas égales, l'étape E18 est suivie de 5 l'étape E19 qui prévoit d'incrémenter d'une unité l'indice d'image parmi la pluralité d'images successives du fichier compressé, afin de procéder au décodage de l'image suivante de résolution supérieure. Cette boucle est effectuée tant que l'égalité n'est pas constatée à l'étape E18. 10 Dès que les dimensions de l'image i courante qui vient d'être décodée correspondent à celles du niveau de résolution r susvisé, alors la dernière image décodée représente la version reconstruite de l'image désirée I' de la figure 3. Cette image est donc à même d'être affichée. Il est ensuite mis fin à l'algorithme de la figure 6 à l'étape E20. 15 On notera que le mode de réalisation illustré par les algorithmes des figures 4 et 6 fait appel à un algorithme prédéterminé qui est commun au codeur 214 et au décodeur 218 de la figure 3. Cet algorithme permet de déterminer les dimensions spatiales ou tailles des versions successives de l'image multirésolution en cours de codage et de décodage à chaque niveau de résolution. 20 Selon une variante de réalisation, l'étape E12 de calcul de la taille de l'image de niveau de résolution courant est supprimée de l'algorithme de décodage de la figure 6. Dans cette variante, le codeur 214 insère la taille effective de l'image (taille de l'image utile) calculée à l'étape E2 de la figure 4 dans les données d'en- 25 tête du train binaire compressé à l'étape E9. Ainsi, pour chaque image de taille augmentée par l'étape de remplissage E4 on dispose d'une information sur la taille de l'image utile. Le décodeur 218 peut, après réception du signal d'image codé, lire après leur éventuel décodage les données d'en-tête pour retrouver ces 30 informations. On simplifie ainsi les opérations effectuées au décodeur. On notera que les informations sur les tailles des images des différents niveaux de résolution successifs de l'image multi-résolution compressée 2909474 20 permettent, au décodeur, de déterminer, pour chaque niveau de résolution examiné (étapes E13 et E14), les pixels d'image ajoutés à la périphérie de l'image (étape E4 de la figure 4) en vue de les supprimer avant l'affichage. On notera que l'insertion de telles informations dans le fichier 5 compressé peut être réalisée en générant des champs d'en-tête spécifiques dans le train binaire conforme au standard H.264 comme indiqué à l'étape E9 de la figure 4. Selon une autre variante, les images représentatives des différents niveaux de résolution inférieurs au niveau de résolution maximum de l'image I sont 10 telles que la zone ajoutée autour de la partie "utile"
ou "effective" de l'image considérée n'est pas centrée par rapport au centre de l'image comme c'est le cas sur les images 250 à 268 de la figure 5. Selon cette variante, des données d'en-tête particulières sont ajoutées par le codeur dans le train binaire compressé pour indiquer, en regard de chaque 15 image de niveau de résolution intermédiaire, la position de l'image utile ou effective dans l'image de taille augmentée. Cette position correspond, par exemple, aux coordonnées du point haut gauche de l'image utile (par exemple les coordonnées du point haut gauche de l'image utile par rapport à l'image augmentée 252 sur la figure 5).
20 On notera que cette variante peut être combinée à la variante précédente dans laquelle le train binaire compressé comporte également des données d'en-tête spécifiant la taille de chaque image utile de niveau de résolution intermédiaire. Sur la figure 7, on a représenté une succession de versions de 25 résolutions spatiales différentes d'une image donnée obtenues en conformité avec le principe de l'invention exposé ci-dessus. Dans cet exemple de réalisation, les différentes résolutions spatiales de la pluralité d'images sont classées de la résolution la plus faible (image I sur la gauche de la figure) à la résolution la plus grande (image P sur la droite de la 30 figure). Cette pluralité d'images, constituée de l'image I, de deux images de type B, d'une image de type P, de deux images B et enfin d'une image de type P, 2909474 21 est particulièrement adaptée à des opérations de zoom avant progressif mais se révèle moins bien adaptée au zoom arrière. A cet égard, des images de permutation de type SP (connu en terminologie anglosaxonne sous le terme Switching Pictures ) qui sont définies 5 dans le standard exposé dans le document suivant Text of ISO/IEC 14496 10 Advanced Video Coding 3'd Edition , ISO/IEC JTC11SC29ANG1 1 N6540, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, July 2004, Redmond, USA, ont été codées et insérées dans l'image multi-résolution compressée définie ci-dessus, dans le but de permettre la réalisation rapide d'opération de zoom arrière 10 dans l'image compressée. Cette fonctionnalité de retour arrière rapide des images SP dans une séquence vidéo compressée est connue du standard de compression H.264/AVC. Cette fonctionnalité est appliquée ici en remplaçant la dimension temporelle par l'axe des résolutions spatiales grâce à la présence des images SP.
15 Ainsi, en partant de l'image P sur la droite de la figure 7, on retrouve, en utilisant l'image SPI, l'image P du milieu de la séquence d'images de la figure 7. Grâce à ces deux images P, on retrouve aisément les images B encadrées par ces dernières par simple prédiction. De même, à partir de l'image P du milieu de la séquence de la figure 7 20 en utilisant l'image intermédiaire SP2, on retrouve l'image I sur la gauche de la figure 7. Là encore, les images B encadrées par l'image I et l'image P sont aisément déductibles de ces dernières par simple prédiction. La fonctionnalité introduite par la présence des images de type SP 25 permet ainsi de passer rapidement d'un niveau de résolution à un niveau de résolution inférieure éloigné du premier niveau. Ceci permet également de gérer plus aisément l'espace mémoire disponible puisqu'à l'aide de quelques images SP on retrouve aisément la plupart des autres images, de la séquence d'images multi-résolution, voire la totalité.
30 Les figures 8 et 9 illustrent une autre variante de mise en oeuvre de l'invention qui fait intervenir le standard SVC (acronyme signifiant en terminologie anglosaxonne Scalable Video Coding ) en cours de définition et qui constitue 2909474 22 une extension de la norme H.264/AVC au codage vidéo hiérachique (connu en terminologie anglosaxonne sous le terne de Scalable ). Selon le standard SVC ( Joint Draft 6 , Joint Video Team (JVT) of ISOIIEC MPEG & ITU-T VCEG, 19th JVT Meeting, Geneva, Switzerland, 5 April 2006) on effectue un codage d'une séquence vidéo d'une façon compatible avec le standard non hiérarchique H.264/AVC à un niveau de résolution spatiale de base. Des couches d'amélioration spatiales peuvent en outre être codées au dessus de la couche de base, afin de fournir une représentation compressée 10 progressive en résolution spatiale de la séquence vidéo. On notera que la granularité spatiale offerte par le standard SVC est toutefois limitée, ainsi que les rapports géométriques entre les différentes couches (couches de base et d'amélioration). La variante illustrée sur la figure 8 combine le codage multi-résolution 15 spatiale exposé ci-dessus avec la hiérarchie spatiale du standard SVC. Ainsi, on code au sein de chaque couche spatiale SVC des versions à des niveaux de résolutions spatiales successifs de l'image fixe considérée. La figure 8 illustre une telle organisation du train binaire compressé et montre une couche de base ainsi que deux couches d'amélioration spatiale codées 20 au dessus de cette dernière. Ainsi, on obtient, pour chaque couche spatiale SVC, une très fine granularité spatiale lorsque le décodage s'opère au sein de ladite couche, le long de l'axe temporel, qui est ici utilisé comme un axe supplémentaire de résolution spatiale.
25 En outre, cette variante peut permettre d'accéder rapidement au niveau de résolution spatiale du train binaire compressé souhaité par l'utilisateur. Pour ce faire, on utilise un chemin de décodage passant d'abord à travers les couches de hiérarchie spatiale du standard SVC, puis le long de l'axe temporel, afin d'atteindre précisément le niveau de résolution spatiale souhaité par 30 l'utilisateur. A titre d'exemple, pour atteindre le niveau de résolution de l'image EB situé sur la première couche d'amélioration spatiale de la figure 8 (deuxième image de la deuxième ligne sur cette figure), si la prédiction entre couches spatiales est 2909474 23 désactivée pour les images autres que la première image, il est seulement nécessaire de décoder l'image I située sur la couche de base, ainsi que les images El et EP situées sur la première couche d'amélioration (première et dernière images de la deuxième ligne sur cette figure), avant d'atteindre l'image EB 5 considérée. Grâce à cette variante, on peut ainsi accéder rapidement à un niveau de résolution situé sur une couche d'amélioration spatiale sans avoir besoin de décoder toute la couche de base, ainsi que toutes les images des couches d'amélioration spatiale précédant celle où se trouve l'image de résolution 10 souhaitée. En effet, si l'on considère la pluralité d'images représentée à la figure 5 (où le codage vidéo hiérarchique de cette pluralité d'images n'a pas été effectué conformément au standard SVC), pour afficher l'image 266 de cette séquence d'images, il est nécessaire de décoder toutes les images précédentes depuis 15 l'image de plus basse résolution 250. La figure 9 illustre de façon pratique un exemple de combinaison de la hiérarchie spatiale du standard SVC avec la présente invention. Sur cette figure, apparaissent une couche de base située en bas et une pluralité de couches d'amélioration spatiale situées au dessus de cette dernière 20 avec, indiqués sur la gauche, les facteurs d'échelle spatiale entre les différentes couches de hiérarchie spatiale. Cette figure illustre ainsi des exemples de dimensions d'images qu'il est possible d'obtenir rapidement grâce à cette variante. On notera en outre que, selon cette variante, il est possible d'obtenir un 25 plus grand nombre de couches d'amélioration spatiale que dans le standard SVC et que les rapports géométriques ou facteurs d'échelle entre deux couches peuvent être sélectionnés de façon plus libre que dans le standard SVC. 30

Claims (26)

REVENDICATIONS
1. Procédé de codage d'images numériques, caractérisé en ce que le procédé comporte une étape de codage vidéo (E8) d'une pluralité d'images successives, la pluralité d'images successives correspondant à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale.
2. Procédé selon la revendication 1, caractérisé en ce que les résolutions spatiales sont ordonnées.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que les résolutions spatiales sont inférieures à celle de l'image initiale.
4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce que, l'image initiale ayant une taille spatiale initiale, préalablement à l'étape de codage vidéo, le procédé comporte une étape (E4) d'augmentation des bords de chacune des images de la pluralité d'images successives, ces images dites utiles ayant une taille inférieure à celle de l'image de taille maximale obtenue à partir de cette pluralité d'images, chaque image de taille ainsi augmentée ayant la même taille spatiale que celle de l'image de taille maximale.
5. Procédé selon l'une des revendications 1 à 4, caractérisé en ce qu'il comporte une étape (E9) d'insertion de données d'en-tête dans le signal comprenant la pluralité d'images codées, les données d'en-tête comprenant la taille de l'image de plus basse résolution et le nombre de niveaux de résolution contenus dans le signal.
6. Procédé selon la revendication 4, caractérisé en ce qu'il comporte une étape d'insertion de données d'en-tête dans le signal comprenant la pluralité d'images codées, les données d'en-tête comprenant, pour chaque image de taille augmentée, la taille de l'image utile.
7. Procédé selon la revendication 6, caractérisé en ce que les données d'en-tête comprennent, pour chaque image de taille augmentée, la position de l'image utile dans l'image de taille augmentée. 2909474 25
8. Procédé selon l'une des revendications 1 à 7, caractérisé en ce qu'il comporte une étape préalable (E3) d'obtention de la pluralité d'images successives à partir de l'image initiale.
9. Procédé selon la revendication 8, caractérisé en ce que l'étape 5 d'obtention comprend une étape de sous-échantillonnage de l'image initiale.
10. Procédé selon la revendication 9, caractérisé en ce que l'étape d'obtention comprend, en outre, une étape de filtrage des images souséchantillonées.
11. Procédé selon l'une des revendications 1 à 10, caractérisé en ce 10 que le codage vidéo de la pluralité d'images à des résolutions successives inférieures à celle de l'image initiale comprend une étape de codage vidéo de l'image de plus basse résolution comme pour une image INTRA d'une séquence vidéo.
12. Procédé selon la revendication 11, caractérisé en ce que le 15 codage vidéo comprend également, pour au moins certaines des images successives de résolutions supérieures à celle de l'image de plus basse résolution, une étape de codage vidéo prédictif de chacune de ces images.
13. Procédé selon l'une des revendications 1 à 12, caractérisé en ce qu'il comporte une étape de codage d'au moins une image de permutation (SPI, 20 SP2) et une étape d'insertion de ladite au moins une image de permutation codée parmi la pluralité d'images successives codées.
14. Procédé selon l'une des revendications 1 à 13, caractérisé en ce qu'il comporte en outre une étape de codage vidéo hiérarchique de la pluralité d'images successives. 25
15. Procédé de décodage d'au moins une partie d'une pluralité d'images numériques successives codées par codage vidéo, caractérisé en ce que la pluralité d'images successives correspond à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale, le procédé comprenant une étape de décodage vidéo (E17) d'au 30 moins une partie de cette pluralité d'images codées.
16. Procédé selon la revendication 15, caractérisé en ce que le procédé comprend les étapes suivantes : 2909474 26 - détermination, parmi la pluralité d'images successives codées, d'une image codée ayant une résolution correspondant à une taille spatiale sélectionnée par un utilisateur, - décodage vidéo des images successives codées à partir de l'image 5 codée de plus basse résolution jusqu'à l'image codée ainsi déterminée.
17. Procédé selon la revendication 15 ou 16, caractérisé en ce que les résolutions spatiales sont ordonnées.
18. Procédé selon l'une des revendications 15 à 17, caractérisé en ce que les résolutions spatiales sont inférieures à celle de l'image initiale. 10
19. Procédé selon l'une des revendications 15 à 18, caractérisé en ce qu'il comporte une étape de lecture de données d'en-tête du signal comprenant la pluralité d'images codées, les données d'en-tête comprenant la taille de l'image de plus basse résolution et le nombre de niveaux de résolution contenus dans le signal. 15
20. Procédé selon l'une des revendications 15 à 18, caractérisé en ce que chacune des images codées est une image dont la taille a été augmentée par rapport à la taille inférieure de l'image utile afin d'atteindre, pour chaque image, la taille maximale de l'image obtenue à partir de la pluralité d'images successives, le procédé comportant une étape de lecture de données d'en-tête 20 du signal comprenant la pluralité d'images codées, les données d'en-tête comprenant pour chaque image codée, la taille de l'image utile.
21. Procédé selon la revendication 20, caractérisé en ce que les données d'en-tête comprennent pour chaque image codée, la position de l'image utile dans l'image de taille augmentée. 25
22. Procédé selon l'une des revendications 15 à 21, caractérisé en ce que la pluralité d'images successives ayant également subi un codage vidéo hiérarchique, le procédé comporte une étape de décodage vidéo hiérarchique d'au moins une partie de la pluralité d'images successives ainsi codées.
23. Dispositif de codage d'images numériques, caractérisé en ce que 30 le dispositif comporte des moyens de codage vidéo d'une pluralité d'images successives, la pluralité d'images successives correspondant à une pluralité de 2909474 27 versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale.
24. Dispositif de décodage d'au moins une partie d'une pluralité d'images numériques successives codées par codage vidéo, caractérisé en ce 5 que la pluralité d'images successives correspond à une pluralité de versions d'une même image initiale à des résolutions spatiales différentes de celle de l'image initiale, le dispositif comprenant des moyens de décodage vidéo d'au moins une partie de cette pluralité d'images codées.
25. Dispositif selon la revendication 24, caractérisé en ce que le 10 dispositif comprend des moyens de détermination, parmi la pluralité d'images successives codées, d'une image codée ayant une résolution correspondant à une taille spatiale sélectionnée par un utilisateur, les moyens de décodage vidéo étant aptes à effectuer le décodage vidéo des images successives codées à partir de l'image codée de plus basse résolution jusqu'à l'image codée ainsi 15 déterminée.
26. Programme d'ordinateur chargeable dans un système informatique, ledit programme contenant des instructions permettant la mise en oeuvre du procédé de codage selon l'une des revendications 1 à 14 et/ou la mise en oeuvre du procédé de décodage selon l'une des revendications 15 à 22, 20 lorsque ce programme est chargé et exécuté par un système informatique.
FR0655303A 2006-12-04 2006-12-04 Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees Expired - Fee Related FR2909474B1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR0655303A FR2909474B1 (fr) 2006-12-04 2006-12-04 Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees
US11/949,399 US8630343B2 (en) 2006-12-04 2007-12-03 Method and device for coding digital images and method and device for decoding coded digital images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0655303A FR2909474B1 (fr) 2006-12-04 2006-12-04 Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees

Publications (2)

Publication Number Publication Date
FR2909474A1 true FR2909474A1 (fr) 2008-06-06
FR2909474B1 FR2909474B1 (fr) 2009-05-15

Family

ID=38421192

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0655303A Expired - Fee Related FR2909474B1 (fr) 2006-12-04 2006-12-04 Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees

Country Status (2)

Country Link
US (1) US8630343B2 (fr)
FR (1) FR2909474B1 (fr)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2895172A1 (fr) * 2005-12-20 2007-06-22 Canon Kk Procede et dispositif de codage d'un flux video code suivant un codage hierarchique, flux de donnees, procede et dispositif de decodage associes
FR2907575B1 (fr) * 2006-10-18 2009-02-13 Canon Res Ct France Soc Par Ac Procede et dispositif de codage d'images representant des vues d'une meme scene
US8712139B2 (en) * 2008-03-21 2014-04-29 General Electric Company Methods and systems for automated segmentation of dense cell populations
FR2931025B1 (fr) * 2008-05-07 2010-05-21 Canon Kk Procede de determination d'attributs de priorite associes a des conteneurs de donnees, par exemple dans un flux video, procede de codage, programme d'ordinateur et dispositifs associes
FR2932637B1 (fr) * 2008-06-17 2010-08-20 Canon Kk Procede et dispositif de codage d'une sequence d'images
FR2939593B1 (fr) * 2008-12-09 2010-12-31 Canon Kk Procede et dispositif de codage video
EP2257073A1 (fr) * 2009-05-25 2010-12-01 Canon Kabushiki Kaisha Procédé et dispositif pour transmettre des données vidéo
EP2265026A1 (fr) * 2009-06-16 2010-12-22 Canon Kabushiki Kaisha Procédé et dispositif pour débloquer le filtrage de flux vidéo de type SVC pendant le décodage
EP2285122B1 (fr) * 2009-07-17 2013-11-13 Canon Kabushiki Kaisha Procédé et dispositif pour reconstruire une séquence de données vidéo après la transmission dans un réseau
EP2285112A1 (fr) * 2009-08-07 2011-02-16 Canon Kabushiki Kaisha Procédé pour l'envoi de données compressées représentant une image numérique et dispositif correspondant
FR2951345B1 (fr) 2009-10-13 2013-11-22 Canon Kk Procede et dispositif de traitement d'une sequence video
FR2955995B1 (fr) * 2010-02-04 2012-02-17 Canon Kk Procede et dispositif de traitement d'une sequence video
US20160345009A1 (en) * 2015-05-19 2016-11-24 ScaleFlux Accelerating image analysis and machine learning through in-flash image preparation and pre-processing
WO2017199149A1 (fr) * 2016-05-16 2017-11-23 Numeri Ltd. Nouvel algorithme pyramidal destiné à la compression vidéo et à l'analyse vidéo
EP3499886A1 (fr) 2017-12-18 2019-06-19 Canon Kabushiki Kaisha Procédé et dispositif de codage de données vidéo
EP3499885A1 (fr) 2017-12-18 2019-06-19 Canon Kabushiki Kaisha Procédé et dispositif de codage de données vidéo

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969204A (en) * 1989-11-29 1990-11-06 Eastman Kodak Company Hybrid residual-based hierarchical storage and display method for high resolution digital images in a multiuse environment

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6501860B1 (en) 1998-01-19 2002-12-31 Canon Kabushiki Kaisha Digital signal coding and decoding based on subbands
FR2792433A1 (fr) 1999-04-15 2000-10-20 Canon Kk Dispositif et procede de transformation de signal numerique
FR2815748B1 (fr) * 2000-10-20 2003-01-24 Canon Kk Procede et dispositif de traitement et de decodage d'un signal numerique code
AUPR110400A0 (en) 2000-10-30 2000-11-23 Canon Kabushiki Kaisha Image transfer optimisation
FR2816154A1 (fr) 2000-10-31 2002-05-03 Canon Kk Insertion d'information supplementaire dans des donnees numeriques
FR2826227B1 (fr) 2001-06-13 2003-11-28 Canon Kk Procede et dispositif de traitement d'un signal numerique code
FR2826823B1 (fr) 2001-06-27 2003-10-10 Canon Kk Procede et dispositif de traitement d'un signal numerique code
US20030067627A1 (en) * 2001-08-30 2003-04-10 Tomoe Ishikawa Image processing method and its data cache method
FR2831728B1 (fr) 2001-10-25 2004-03-12 Canon Kk Procede et dispositif de formation d'un signal numerique derive a partir d'un signal numerique compresse
FR2835366B1 (fr) 2002-01-29 2004-06-18 Canon Kk Procede et dispositif de formation d'un signal numerique compresse reduit
FR2842378B1 (fr) 2002-07-15 2005-02-04 Canon Kk Procede et dispositif de traitement d'une requete ou de donnees numeriques compressees
FR2842691B1 (fr) 2002-07-18 2005-01-14 Canon Kk Procede et dispositif de transformation d'un signal numerique
FR2842983B1 (fr) 2002-07-24 2004-10-15 Canon Kk Transcodage de donnees
FR2867328A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de decodage d'une sequence d'images codee avec echelonnabilite spatiale et temporelle
FR2869442A1 (fr) 2004-04-23 2005-10-28 Canon Kk Procede et dispositif de decodage d'une image.
CN1969559A (zh) * 2004-06-11 2007-05-23 日本电气株式会社 移动图像编码装置和移动图像译码装置、其方法和程序
US7489825B2 (en) * 2005-07-13 2009-02-10 Ge Medical Systems Method and apparatus for creating a multi-resolution framework for improving medical imaging workflow
FR2889004B1 (fr) * 2005-07-22 2007-08-24 Canon Kk Procede et dispositif de traitement d'une sequence d'images numeriques a scalabilite spatiale ou en qualite
JP2007142614A (ja) * 2005-11-16 2007-06-07 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2007174634A (ja) * 2005-11-28 2007-07-05 Victor Co Of Japan Ltd 階層符号化装置、階層復号化装置、階層符号化方法、階層復号方法、階層符号化プログラム及び階層復号プログラム
FR2894421B1 (fr) 2005-12-07 2008-01-18 Canon Kk Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
FR2896371B1 (fr) 2006-01-19 2008-11-07 Canon Kk Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible
US8340179B2 (en) 2006-03-21 2012-12-25 Canon Kabushiki Kaisha Methods and devices for coding and decoding moving images, a telecommunication system comprising such a device and a program implementing such a method
JP4951257B2 (ja) * 2006-03-28 2012-06-13 ユニ・チャーム株式会社 パンツ型おむつ
FR2903556B1 (fr) 2006-07-04 2008-10-03 Canon Kk Procedes et des dispositifs de codage et de decodage d'images, un systeme de telecommunications comportant de tels dispositifs et des programmes d'ordinateur mettant en oeuvre de tels procedes
FR2904494B1 (fr) 2006-07-26 2008-12-19 Canon Kk Procede et dispositif de compression d'image, systeme de telecommunication comportant un tel dispositif et programme mettant en oeuvre un tel procede
FR2906433B1 (fr) 2006-09-22 2009-02-27 Canon Kk Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969204A (en) * 1989-11-29 1990-11-06 Eastman Kodak Company Hybrid residual-based hierarchical storage and display method for high resolution digital images in a multiuse environment

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BURT P J ET AL: "THE LAPLACIAN PYRAMID AS A COMPACT IMAGE CODE", IEEE TRANSACTIONS ON COMMUNICATIONS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. COM 31, no. 4, 1 April 1983 (1983-04-01), pages 532 - 540, XP000570701, ISSN: 0090-6778 *
CIVANLAR M R ET AL: "EFFICIENT MULTI-RESOLUTION MULTI-STREAM VIDEO SYSTEMS WITH STANDARDCODECS", JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL, IMAGE, AND VIDEO TECHNOLOGY, SPRINGER, NEW YORK, NY, US, vol. 17, no. 2/3, 1 November 1997 (1997-11-01), pages 269 - 278, XP000724584, ISSN: 0922-5773 *
MR. RICHARD A. CLARK: "Digital compression and coding of continuous-tone still images: Extensions", ITU-T REC. T.84 (1996) ISO/IEC 10918-3:1997, 1 May 1997 (1997-05-01), XP002451507 *
SCHWARZ H ET AL: "Constrained Inter-Layer Prediction for Single-Loop Decoding in Spatial Scalability", IMAGE PROCESSING, 2005. ICIP 2005. IEEE INTERNATIONAL CONFERENCE ON GENOVA, ITALY 11-14 SEPT. 2005, PISCATAWAY, NJ, USA,IEEE, 11 September 2005 (2005-09-11), pages 870 - 873, XP010851192, ISBN: 0-7803-9134-9 *

Also Published As

Publication number Publication date
US8630343B2 (en) 2014-01-14
US20080131011A1 (en) 2008-06-05
FR2909474B1 (fr) 2009-05-15

Similar Documents

Publication Publication Date Title
FR2909474A1 (fr) Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees
FR2903556A1 (fr) Procedes et des dispositifs de codage et de decodage d'images, un systeme de telecommunications comportant de tels dispositifs et des programmes d'ordinateur mettant en oeuvre de tels procedes
EP1839442B1 (fr) Dispositifs et procedes de codage et de decodage echelonnables de flux de donnees d'images, signal, programme d'ordinateur et module d'adaptation de qualite d'image correspondants
FR2931610A1 (fr) Procede et un dispositif de transmission de donnees d'images
FR2906433A1 (fr) Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre
FR2894421A1 (fr) Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique
EP2700226B1 (fr) Procedes et appareils de production et de traitement de representations de scenes multimedias
FR2826823A1 (fr) Procede et dispositif de traitement d'un signal numerique code
FR2932637A1 (fr) Procede et dispositif de codage d'une sequence d'images
FR2898757A1 (fr) Procede et dispositif d'adaptation d'une frequence temporelle d'une sequence d'images video
FR2931025A1 (fr) Procede de determination d'attributs de priorite associes a des conteneurs de donnees, par exemple dans un flux video, procede de codage, programme d'ordinateur et dispositifs associes
FR2889017A1 (fr) Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
FR2959636A1 (fr) Procede d'acces a une partie spatio-temporelle d'une sequence video d'images
EP1969854A1 (fr) Procede de codage et de decodage d'une image ou d'une sequence d'images, dispositifs, programmes d'ordinateur, et signal correspondants
FR2849982A1 (fr) Decodage d'une image numerique codee selon plusieurs niveaux de resolution
FR2893470A1 (fr) Procede et dispositif de creation d'une sequence video representative d'une sequence video numerique et procedes et dispositifs de transmission et reception de donnees video associes
FR2913163A1 (fr) Procede et dispositif de transmission de donnees video
EP3360328B1 (fr) Codage et décodage multi-vues
FR2955995A1 (fr) Procede et dispositif de traitement d'une sequence video
WO2021214395A1 (fr) Procédés et dispositifs de codage et de décodage d'une séquence vidéo multi-vues
FR2872972A1 (fr) Procede et dispositif de transmission video entre un serveur et un client
EP3918798A1 (fr) Procédé et dispositif de codage et de décodage de données correspondant à une séquence vidéo
FR2956789A1 (fr) Procede et dispositif de traitement d'une sequence video
EP2364552B1 (fr) Dispositif d'encodage d'un flux d'images numeriques et dispositif de decodage correspondant avec approximation du voisinage d'un bloc par le voisinage élargi du bloc
FR2957744A1 (fr) Procede de traitement d'une sequence video et dispositif associe

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20140829