FR2891966A1

FR2891966A1 - Dispositifs et procedes de codage et de decodage echelonnables de flux de donnees d'images, signal, programme d'ordinateur et module d'adaptation de qualite d'images correspondants

Info

Publication number: FR2891966A1
Application number: FR0510390A
Authority: FR
Inventors: Isabelle Amonou; Stephane Pateux; Sylvain Kervadec
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2005-10-11
Filing date: 2005-10-11
Publication date: 2007-04-13
Also published as: WO2007042539A1

Abstract

L'invention concerne un procédé de codage d'une image ou d'une séquence d'images, générant un flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit procédé comprenant une étape de codage d'au moins l'une desdites couches, de niveau n+1, par prédiction, au moins à partir de ladite couche de niveau n. Selon l'invention, ce procédé de codage est tel que, pour au moins un bloc d'image de différence de la couche de niveau n+1, ladite étape de codage est effectuée selon un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+1.

Description

Dispositifs et procédés de codage et de décodage échelonnables de flux de

données d'images, signal, programme d'ordinateur et module d'adaptation de qualité d'image correspondants. 1. DOMAINE DE L'INVENTION Le domaine de l'invention est celui du codage et du décodage d'images ou de séquences vidéo d'images. Plus précisément, l'invention concerne une technique de codage et de décodage d'images échelonnable (en anglais "scalable"), c'est-à-dire à qualité adaptable et/ou résolution spatio-temporelle variable et/ou complexité variable. 2. SOLUTIONS DE L'ART ANTÉRIEUR De nombreux systèmes de transmission de données sont aujourd'hui hétérogènes, en ce sens qu'ils desservent une pluralité de clients disposant de types d'accès aux données très divers. Ainsi, le réseau mondial Internet par exemple, est accessible aussi bien à partir d'un terminal de type ordinateur personnel (PC) que d'un radiotéléphone. Plus généralement, la bande passante pour l'accès au réseau, les capacités de traitement des terminaux clients, la taille de leurs écrans varient fortement d'un utilisateur à l'autre. Ainsi, un premier client peut par exemple accéder au réseau Internet à partir d'un PC puissant, et disposer d'un débit ADSL ("Asymmetric Digital Subscriber Line" pour "Ligne d'abonné numérique à structure asymétrique") à 1024 kbits/s alors qu'un deuxième client cherche à accéder aux mêmes données au même instant à partir d'un terminal de type PDA ("Personal Digital Assistant" pour "assistant numérique personnel") connecté à un modem de faible débit. Il est donc nécessaire de proposer à ces divers utilisateurs un flux de données qui soit adapté tant en terme de débit que de résolution des images à leurs différents besoins. Cette nécessité s'impose plus largement pour toutes les applications accessibles à des clients disposant de capacités d'accès et de traitement très diverses, et notamment les applications de : - VOD ("Video On Demand" pour "vidéo à la carte"), accessibles aux terminaux de radiocommunication de type UMTS ("Universal Mobile Telecommunication Service" pour "service de télécommunication mobile universel"), aux PC ou aux terminaux de télévision avec accès ADSL, etc. ; - mobilité de session (par exemple reprise sur un PDA d'une session vidéo commencée sur un téléviseur, ou, reprise sur un mobile GPRS ("General Packet Radio Service" pour "service général de radiocommunication par paquets") d'une session commencée sur UMTS) ; - continuité de session (dans un contexte de partage de la bande passante avec une nouvelle application) ; - télévision haute définition, dans laquelle un encodage vidéo unique doit permettre de servir aussi bien des clients disposant d'une définition standard SD que des clients disposant d'un terminal à haute définition HD ; - visioconférence, dans laquelle un encodage unique doit répondre aux besoins de clients disposant d'un accès UMTS et d'un accès Internet ; - etc. Pour répondre à ces différents besoins, on a développé des algorithmes de codage d'images échelonnables, ou "scalables", qui permettent une qualité adaptable et une résolution spatio-temporelle variable. Le codeur génère un flux compressé présentant une structure hiérarchique de couches, dans laquelle chacune des couches est emboîtée dans une couche de niveau supérieur. Par exemple, une première couche de données véhicule un flux à 256kbits/s, qui pourra être décodé par un terminal de type PDA, et une deuxième couche de données complémentaire véhicule un flux de résolution supérieure à 256kbits/s qui pourra être décodé, en complément du premier, par un terminal plus puissant de type PC. Le débit nécessaire pour le transport de ces deux couches emboîtées est dans cet exemple de 512 kbits/s. Certains de ces algorithmes de codage vidéo échelonnables sont aujourd'hui en cours d'adoption par la norme MPEG ("Moving Picture Expert Group" pour "Groupe d'experts en codage d'images"), dans le cadre du groupe de travail MPEG-4 SVC. Notamment, le modèle qui a été retenu récemment dans MPEG-4 SVC ("Scalable Video Coding" pour "codage vidéo échelonnable") est appelé SVM ("Scalable Video Model" pour "modèle vidéo échelonnable"), et est fondé sur un codeur échelonnable basé sur des solutions de type AVC ("Advanced Video Coding" pour "codage vidéo avancé"). Ce modèle est décrit plus en détails dans le document "Joint Scalable Video Model JSVM-3", J. Reichel, M. Wien, H. Schwarz, JVTP202, Juillet 2005, Poznan. L'amendement MPEG-4 SVC de MPEG-4 AVC a pour objectif de proposer une norme de fourniture de flux échelonnables à grain moyen dans les dimensions temporelle, spatiale et en qualité. 2.1 Le codeur S VM MPEG 2.1.1 Principales caractéristiques du codeur La figure 1 illustre la structure d'un tel codeur, qui présente une structure pyramidale. Les composantes d'entrée vidéo 10 subissent un sous-échantillonnage dyadique (décimation 2D par 2 référencée 11, décimation 2D par 4 référencée 12).

Chacun des flux sous-échantillonnés subit ensuite une décomposition temporelle 13 de type MCTF ("Motion Compensated Temporal Filtering" pour "filtrage temporel compensé en mouvement"). Une version basse résolution de la séquence vidéo est codée 14 jusqu'à un débit donné qui correspond au débit maximum décodable pour la résolution spatiale basse (ce niveau de base est compatible AVC).

Les niveaux supérieurs sont ensuite codés 19 par soustraction du niveau précédent reconstruit et sur-échantillonné et codage des résidus sous forme : - d'un niveau de base ; - éventuellement d'un ou plusieurs niveaux de rehaussement obtenus par codage multipasse de plans de bits (appelé par la suite FGS pour "Fine Grain Scalability", échelonnabilité à grain fin). Selon cette approche, on distingue les informations de mouvement 17 et les informations de texture 18. Afin de réaliser une adaptation en débit, les informations de texture 18 sont codées à l'aide d'un schéma progressif : -codage d'un premier niveau de qualité minimale (appelé Base Layer en 25 anglais, ou Couche de Base) ; - codage de niveaux de raffinement progressif (appelés Enhancement Layer en anglais, ou Couche de Réhaussement). En référence à la figure 1, les informations de texture 18 alimentent un module de codage de la couche de base de quantification 19. Les données codées, en sortie du 30 module 19 servent à alimenter un bloc 21 de transformation spatiale et de codage20 entropique, qui travaille sur les niveaux de raffinement du signal. Les données en sortie du module 21 alimentent une interpolation 20 depuis le niveau de base. Cette interpolation est utilisée comme prédiction dans le module de codage 19. Un module de multiplexage 22 ordonne les différents sous-flux générés dans un flux de données compressé global 23. Le flux compressé 23, en sortie du codeur, est donc structuré en unités de données élémentaires appelées NALU ( Network Abstraction Layer Unit en anglais). Chaque NALU est associée à une image issue de la décomposition spatio-temporelle, un niveau de résolution spatiale, et un niveau de quantification. Cette structuration en unités élémentaires permet de réaliser une adaptation en débit et/ou résolution spatio-temporelle en supprimant les NALUs de résolution spatiale trop grande, ou de fréquence temporelle trop grande ou bien encore de qualité d'encodage trop grande. La figure 2 illustre les résultats obtenus au moyen du codeur échelonnable de la figure 1, sous la forme de courbes débit-distorsion, représentées pour des résolutions spatiales (CIF/QCIF pour "Common Interface Format/Quarter Common Interface Format", où le CIF correspond à un format proche d'un demi format standard TV, et le QCIF à un demi format CIF) ou temporelles (7.5-30 Hz, nombre d'images par seconde) différentes. En ordonnée, on a représenté le PSNR ("Peak Signal to Noise Ratio" pour "rapport signal à bruit crête") et en abscisse, le débit exprimé en kbits/s. Ainsi, la courbe référencée 23 correspond à une résolution spatiale QCIF à une fréquence temporelle de 7,5 Hz, la courbe référencée 24 à une résolution QCIF à 15 Hz, la courbe référencée 25 à une résolution CIF à 15 Hz, et la courbe référencée 26 à une résolution CIF à 30 Hz. 2.1.2 Génération des couches d'informations au codeur La figure 3 illustre le mécanisme de prédiction/extraction des informations mis en oeuvre par le codeur SVM. On présente ci-après plus en détail la prédiction mise en oeuvre au codage, qui consiste à coder une couche de résolution spatiale de niveau n donné par prédiction à partir des données de couches de résolution spatiale de niveaux inférieurs.

On notera que l'on se place ici dans le cas de MPEG-4 SVC, dans lequel le flux de données codé est constitué de couches de données de niveaux de résolution n successifs. MPEG-4 SVC prévoit un cas, appelé CGS (pour "Coarse Grain Scalability"), dans lequel les niveaux n successifs peuvent présenter la même résolution (par exemple QCIF), mais des qualités différentes. MPEG-4 SVC prévoit également un cas complémentaire, appelé FGS (déjà discuté ci-dessus), dans lequel une couche de niveau n est codée de façon progressive. Plus précisément, la figure 3 présente l'exemple de la génération de deux couches successives de résolutions spatiales au format QCIF et CIF, associées respectivement aux courbes de débit-distorsion référencées 30 (format QCIF) et 31 (format CIF). L'Homme du Métier étendra sans difficulté cet exemple au cas plus général de n>2 couches spatiales. Comme précédemment, on a représenté en abscisse le débit exprimé en kbits/s et en ordonnée le PSNR en dB. Pour chaque couche de résolution spatiale, le codeur code les informations en deux sous-flux : un sous-flux (ou sous-couche) de base (appelée BL (pour "Base Layer" en anglais)) et un sous-flux (ou sous-couche) de rehaussement progressive (appelée EL (pour "Enhancement Layer" en anglais)). Le format QCIF est d'abord encodé sur toutes les plages de valeurs de fréquences temporelles et de débit. On dispose d'un niveau de base (BL) 301 et de deux niveaux possibles de raffinement (EL), notés FGS1 302 et FGS2 303 (FGS pour "Fine Grain Scalable" en anglais). La couche de rehaussement EL comprend donc les deux passes FGS1 302 et FGS2 303. Des points de raffinement intermédiaires peuvent être obtenus au décodage par coupure des paquets de données entre FGS 1 et FGS2. Le format QCIF est encodé jusqu'à un point de débit maximal 304 qui est ensuite utilisé comme référence pour la prédiction lors du codage du format CIF. Ce point doit être le meilleur qui puisse être défini pour un fonctionnement globalement optimal du système. Le format CIF est ensuite codé en utilisant le point le plus haut de la courbe QCIF 304 (i.e. le point de débit maximal de cette courbe) comme prédicteur. Les informations CIF sont également codées en deux sous-flux : un sous-flux de base (BL) et un sous-flux de rehaussement (EL), constitué de deux passes (FGS1 et FGS2).

Sur la figure 3, on constate qu'en partant du point de débit maximum QCIF 304 et en ajoutant la couche de base (BL) 311 du niveau de résolution spatiale CIF, on aboutit au point de référence CIF 312, qui n'est pas le point de débit minimal 313 que l'on peut atteindre au décodage. A partir de ce point de référence 312, les couches de rehaussement EL 314 (FGS 1) et 315 (FGS2) permettent d'accéder à d'autres points de débits CIF supérieurs, jusqu'à un débit maximal CIF 316. 2.2 Prédiction inter-couches Comme indiqué ci-dessus en relation avec la figure 3, le principe de la prédiction inter-couches consiste à utiliser un niveau bas (par exemple le niveau QCIF dans une configuration FGS) pour prédire le niveau directement supérieur (par exemple CIF dans une configuration FGS), que l'on appellera "niveau haut". Une telle prédiction inter-couches est couramment appelée prédiction "inter-layer". Un niveau correspond à au moins un des éléments parmi la liste suivante : une résolution prédéterminée des images, un pas de quantification des images et une fréquence temporelle des images.

Trois modes de prédiction inter-couches sont utilisées dans le modèle JSVM (encore appelé SVM MPEG) de MPEG-4 SVC : 1. Le premier de ces modes, appelé "Inter layer motion prediction", repose sur une prédiction de mouvement. Dans ce mode, le vecteur de mouvement d'une image de niveau haut peut être prédit à partir du vecteur de mouvement correspondant du niveau bas. Par exemple, le mouvement du niveau CIF est prédit à partir de l'estimation de mouvement calculée en QCIF, en doublant la taille des vecteurs mouvement du niveau bas QCIF. Lorsque la prédiction est activée, deux sous-modes peuvent être envisagés : - un premier sous-mode, appelé "Base layer mode", dans lequel le bloc d'image du niveau haut prend la même information de mouvement que le bloc d'image correspondant du niveau de base ; - un second sous-mode, appelé " Quarter pel refinement mode", dans lequel on transmet en outre un vecteur de raffinement 1/4 de pel (pour "picture element", encore appelé pixel). 25 2. Le deuxième de ces modes, appelé "Inter layer intra texture prediction", repose sur une prédiction des blocs Intra, qui peuvent se trouver dans les images I/P (Intra/Prédites) ("key pictures") et dans les images B (Bidirectionnelles) (ou H). La prédiction intra est effectuée pour les blocs d'image dans le mode Intra_Base (plus couramment désigné sous le nom intra_BL). Un filtre de deblocking est alors utilisé pour les blocs Intra avant interpolation. 3. Le troisième mode est appelé "Inter layer residual prediction" (ou encore Macroblocks Inter (residual)), et repose sur une prédiction des blocs d'image de type inter. Dans ce troisième mode, les blocs résiduels des images de différence issues de la transformation temporelle sont prédits à partir des blocs résiduels correspondant du niveau inférieur (voir ci-dessus la définition du terme niveau). Ce mode de prédiction peut être, ou non, adaptatif. Lorsque le mode est non-adaptatif, il est ou non activé pour l'ensemble des blocs d'images. En d'autres termes, soit tous les blocs sont codés en mode prédictif, soit aucun bloc n'est codé en mode prédictif. En revanche, lorsque ce mode de prédiction est adaptatif, on teste pour chaque bloc la qualité de l'estimation obtenue avec ou sans prédiction résiduelle, et l'on autorise ou non cette prédiction résiduelle, de façon à obtenir le meilleur résultat d'estimation. 2.3 Prédiction inter-couches résiduelle On décrit ci-après plus en détail le principe de fonctionnement adaptatif du mode de prédiction inter-couches résiduelle présenté ci-dessus. Dans cette configuration, le codeur JSVM de MPEG-4 AVC fonctionne alors de la manière suivante. Pour chaque bloc d'image (par bloc on entend ici et dans la suite de la description soit un bloc élémentaire d'image, soit un groupe de blocs élémentaires d'image, un tel groupe étant appelé macrobloc selon la terminologie MPEG) : - tous les modes de prédiction inter-couches possibles sont testés (à savoir les modes de prédiction Intra, IntraBL, Inter sans résidus, inter avec résidus... présentés au 2.2 ci-dessus) ; - le "meilleur" mode (au sens du meilleur compromis débit-distorsion) est conservé pour le codage du bloc considéré ; - dans le cas où ce "meilleur mode" est le mode de prédiction inter résiduelle (Inter layer texture prediction), le bloc de l'image de différence du niveau bas est interpolé avant de servir de candidat à la prédiction. En prenant pour exemple le cas où le niveau bas est un niveau QCIF et où le niveau haut est un niveau CIF, le calcul suivant est donc effectué : ENCcIF = REScIF ù PRED_RESc,F, Où: ENCcIF représente les données à encoder pour le niveau haut CIF ; REScIF = ORIGcIF - PREDcIF est le résidu du niveau haut CIF, correspondant à la 10 différence entre : ORIGc,F, qui est l'image originale du niveau haut CIF, et PREDcIF qui est l'image prédite du niveau haut CIF ; Dans le cas présent d'un mode de prédiction inter-couches résiduelle, REScIF désigne donc l'image résiduelle de niveau CIF obtenue après compensation de 15 mouvement, et PREDcIF désigne la prédiction du niveau CIF après compensation de mouvement = MVcIF(REFcIF). PRED_REScIF est l'image de prédiction du résidu, c'est-à-dire en l'espèce le résidu QCIF sur-échantillonné (UP(RESQcIF)) PRED_REScIF = UP(Encoded(ORIGQCIF ù PREDQCIF)) = UP (Encoded(ORIGQcIF 20 - MVQCIF(REFQCIF))) On obtient donc l'expression suivante : ENCCIF = RESc,F ù UP(Encoded(RESQc,F)) Que l'on peut mettre aussi sous la forme : ENCcIF = RESc,F ù UP(RESQc,F) + UP(RESQc,F-Encoded(RESQc,F)) 25 La valeur CIF de l'image à encoder ENCcIF est donc composée de deux termes : - la différence RESc,F ù UP(RESQc,F) entre les signaux originaux (différence inter-couches optimale) formée de deux termes : - des hautes fréquences spatiales, qui sont présentes dans RESc,F et qui ne peuvent pas être prédites par un suréchantillonnage ("upsampling") ;5 - des erreurs autres, liées au biais, du fait que le mouvement diffère entre les deux séquences des niveaux CIF et QCIF (ces erreurs se situent a priori plutôt dans les informations basses fréquence de la valeur CIF de l'image à encoder ENCc,F) ; - un biais UP(RESQCIF-Encoded(RESQCIF)) lié à la quantification. Selon la syntaxe actuellement utilisée dans le modèle JSVM, deux indicateurs (encore appelés "flags") sont insérés pour signaler le mode de prédiction résiduelle : - un indicateur adaptive_prediction_flag: cet élément de syntaxe se trouve dans l'en-tête (i.e. le header) de slice (on rappelle qu'un slice est une partie d'image).

Si ce flag est à 1 (et si le mode de prédiction n'est pas une prédiction de type Intra) l'indicateur residual_prediction_flag ci- dessous est pris en compte dans la syntaxe ; - un indicateur residual_prediction_flag : cet élément de syntaxe se trouve dans les données de chacun des macroblocs (MB). Si ce bit est à 1, le signal résiduel est prédit à partir du niveau bas sur-échantillonné, sinon aucune prédiction de résidu n'est utilisée. 3. INCONVÉNIENTS DE L'ART ANTÉRIEUR Comme exposé ci-dessus, le modèle JSVM de MPEG-4 AVC prévoit un mode de fonctionnement adaptatif de la prédiction inter-couche résiduelle. En effet, il a été constaté qu'il pouvait ne pas être bénéfique d'utiliser une telle prédiction inter-couches résiduelle dans le cas où le(s) vecteur(s) de mouvement d'un bloc d'une couche de niveau haut n'est (ne sont) pas similaire(s) au(x) vecteur(s) de mouvement d'un bloc correspondant de la couche de niveau inférieur. Dans ce mode adaptatif, on étudie, bloc par bloc, le bien-fondé de l'utilisation d'un tel mode de prédiction inter-couches résiduelle, en fonction du rapport débit-distorsion obtenu avec ou sans utilisation de ce mode prédictif. Si cette approche adaptative permet d'obtenir de meilleurs résultats, sur toute la gamme de débit considérée, qu'une approche non-adaptative (mode tout ou rien pour l'ensemble des blocs considérés), ces résultats n'en demeurent pas moins insuffisants.

En effet, les inventeurs de la présente demande de brevet ont constaté que le codage inter-couches par prédiction résiduelle n'était pas efficace, même en mode adaptatif. Ils ont en effet analysé que le biais (voir 2.3 ci-dessus) introduit des composantes haute-fréquence (c'est-à-dire du bruit) dans le signal qui sert de prédicteur, ce qui rend la prédiction inefficace. Plus généralement, l'efficacité de la plupart des modes de prédiction inter- couches, et notamment la prédiction de type intra, est compromise par la présence de bruit dans le signal du niveau bas qui sert de prédicteur pour les couches de niveau supérieur. 4. OBJECTIFS DE L'INVENTION L'invention a notamment pour objectif de pallier ces inconvénients de l'art antérieur. Plus précisément, un objectif de l'invention est de fournir une technique de codage et de décodage d'images et/ou de séquences vidéo échelonnable, reposant sur une organisation du flux de données par couches, avec prédiction inter-couches, qui constitue une amélioration de la technique du modèle JSVM proposé par le groupe de travail MPEG-4 SVC dans le document "Joint Scalable Video Model JSVM-3", J. Reichel, M. Wien, H. Schwarz, JVTP202, Juillet 2005, Poznan. Notamment, un objectif de l'invention est de fournir une telle technique qui permette d'améliorer l'efficacité des techniques de prédiction inter-couches de ce modèle JSVM. L'invention a ainsi pour objectif de proposer une telle technique qui permette d'améliorer l'efficacité des techniques de prédiction inter-couches de type intra et des techniques de prédiction inter-couches résiduelle. Dans ce dernier cas notamment, un objectif de l'invention est de simplifier les traitements à effectuer par le codeur, et ainsi réduire sa complexité par rapport au codeur de l'art antérieur. En corollaire, un objectif de l'invention est de simplifier les traitements effectués par le décodeur. Un autre objectif de l'invention est de proposer une telle technique qui n'induise pas ou peu de complexité supplémentaire de la syntaxe utilisée. L'invention a encore pour objectif de fournir une telle technique qui soit simple à implémenter et peu coûteuse en termes de ressources (bande passante, capacités de traitement, etc.).

Un autre objectif de l'invention est de proposer une telle technique qui permette une compression efficace des données, tout en permettant une reconstruction de bonne qualité des images. 5. EXPOSÉ DE L'INVENTION Ces différents objectifs, ainsi que d'autres qui apparaîtront par la suite, sont atteints selon l'invention à l'aide d'un procédé de codage d'une image ou d'une séquence d'images, générant un flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit procédé comprenant une étape de codage d'au moins l'une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n. Selon l'invention, ce procédé de codage est tel que, pour au moins un bloc d'image de différence de la couche de niveau n+1, ladite étape de codage est effectuée selon un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

Le principe général de l'invention consiste donc à proposer au moins un mode de codage par prédiction inter-couche supplémentaire (appelé par la suite mode de codage par prédiction inter-couche partiel), dans lequel le bloc de l'image de différence (aussi appelée signal résiduel ou encore image résiduelle) de la couche de niveau n est filtré avant d'être utilisé pour la prédiction du bloc de l'image de différence de la couche de niveau n+l. Ce filtrage a pour but d'améliorer le bloc de l'image de différence de la couche de niveau n, afin d'effectuer la prédiction inter-couche dans les meilleures conditions possibles, et ce de manière adaptative en fonction du signal à coder. Comme détaillé par la suite, l'invention s'applique avec différents types de filtrage (notamment, mais non exclusivement, un filtrage des coefficients DCT hautes fréquences).

Ainsi, dans le cas d'une mise en ceuvre du codage sous une forme adaptative (avec sélection, pour chaque bloc d'image de différence de la couche de niveau n+l, d'un mode de codage parmi une pluralité de modes de codage possibles), la présente invention aboutit à un meilleur résultat de codage sur toute la gamme de débit que la solution adaptative de l'art antérieur. On rappelle que dans la solution adaptative de l'art antérieur, le choix du mode de codage se fait seulement entre deux modes de codage possibles : un mode de codage sans prédiction inter-couche et un mode de codage par prédiction inter-couche utilisant tous les coefficients associés au bloc d'image de différence de la couche de niveau n (appelé par la suite mode de codage par prédiction inter-couche total). Par bloc on entend ici et dans la suite de la description soit un bloc élémentaire d'image, soit un groupe de blocs élémentaires d'image, un tel groupe étant appelé macrobloc selon la terminologie MPEG. Il est à noter que dans la solution adaptative de l'invention, la pluralité de modes de codage possibles comprend : - obligatoirement un ou plusieurs modes de codage par prédiction inter-couche partiels (au sens de la présente invention, comme indiqué ci-dessus) ; et - éventuellement l'un des deux, ou bien les deux, modes de codage de la solution adaptative de l'art antérieur, à savoir le mode de codage sans prédiction inter- couche et le mode de codage par prédiction inter-couche total). Par ailleurs, on entend par coefficients associé à un bloc d'image de différence des coefficients représentatifs du signal de description de ce bloc ou d'une transformation de ce signal dans un espace (par exemple une transformée DCT). Dans un premier mode de réalisation particulier de l'invention, chaque bloc d'image de différence de la couche de niveau n+l résulte de la différence entre un bloc d'origine de la couche de niveau n+l et une prédiction de type Inter dudit bloc d'origine de la couche de niveau n+l. En outre, chaque bloc d'image de différence de la couche de niveau n résulte de la différence entre un bloc d'origine de la couche de niveau n et une prédiction de type Inter dudit bloc d'origine de la couche de niveau n. Dans un second mode de réalisation particulier de l'invention, chaque bloc d'image de différence de la couche de niveau n+l résulte de la différence entre un bloc d'origine de la couche de niveau n+l et une prédiction de type Intra dudit bloc d'origine de la couche de niveau n+l. En outre, chaque bloc d'image de différence de la couche de niveau n résulte de la différence entre un bloc d'origine de la couche de niveau n et une prédiction de type Intra dudit bloc d'origine de la couche de niveau n. Préférentiellement, pour chaque bloc d'image de différence de la couche de niveau n+l, ladite étape de codage est adaptative et comprend une étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprenant au moins un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

De façon avantageuse, ledit au moins un mode de codage par prédiction inter- couche partiel appartient au groupe comprenant : - des premiers modes de codage par prédiction inter-couche partiels utilisant un jeu de coefficients résultant d'une sélection par conservation d'un pourcentage P prédéterminé des coefficients associés audit bloc d'image de différence de la 15 couche de niveau n ; - des deuxièmes modes de codage par prédiction inter-couche partiels utilisant un jeu de coefficients résultant d'une sélection par seuillage de certains des coefficients associés audit bloc d'image de différence de la couche de niveau n ; - des troisièmes modes de codage par prédiction inter-couche partiels utilisant un 20 jeu de coefficients résultant d'une sélection par conservation d'un pourcentage P prédéterminé des coefficients associés audit bloc d'image de différence de la couche de niveau n, puis d'une sélection par seuillage, ou inversement. Avantageusement, pour lesdits premiers modes de codage par prédiction inter- couche partiels, ladite sélection consiste à conserver, parmi lescoefficients classés par 25 ordre croissant de fréquence, les P pourcents de coefficients possédant les plus basses fréquences. Selon une caractéristique avantageuse, ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend les étapes suivantes, pour chaque bloc d'image de différence de la couche de niveau n+l : 30 analyse dudit bloc d'image de différence de la couche de niveau n+l et/ou de données associées audit bloc d'image de différence de la couche de niveau n+l ; - sélection de M modes de codage parmi lesdits N modes de codage, en fonction du résultat de ladite étape d'analyse, avec M>_1. Avantageusement, si M>_2, ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend en outre les étapes suivantes, pour chaque 5 bloc d'image de différence de la couche de niveau n+l : - traitement, avec chacun des M modes de codage, du bloc d'image de différence de la couche de niveau n correspondant audit bloc d'image de différence de la couche de niveau n+l, permettant d'obtenir M résultats de codage ; - évaluation d'un paramètre de qualité pour chacun des M résultats de codage ; 10 - sélection du meilleur mode de codage parmi les M modes de codage, en fonction dudit paramètre de qualité. De façon avantageuse, ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend, pour chaque bloc d'image de différence de la couche de niveau n+l, une étape de détection d'une autorisation de codage par 15 prédiction inter-couche. En outre, en cas de détection négative, le mode de codage sélectionné pour ledit bloc d'image de différence de la couche de niveau n+l est un mode de codage sans prédiction inter-couche. Dans un mode de réalisation avantageux de l'invention, le procédé de codage comprend en outre les étapes suivantes : 20 - insertion, dans un en-tête d'une entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l, d'au moins une information indiquant un ensemble de modes de codage effectivement utilisés pour coder lesdits blocs à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l ; - pour chaque bloc à coder appartenant audit ensemble de blocs à coder de la 25 couche de niveau n+l, insertion, dans un en-tête d'une entité d'information associée audit bloc à coder, d'au moins une information indiquant le mode de codage effectivement utilisé pour coder ledit bloc à coder parmi ledit ensemble de modes de codage effectivement utilisés. Dans une variante, l'en-tête de l'entité d'information associée à chaque bloc à 30 coder (d'un ensemble de blocs à coder de la couche de niveau n+l) reçoit une information indiquant le mode de codage effectivement utilisé pour coder ce bloc parmi tous les modes de codage possibles (et non pas uniquement parmi ceux d'un ensemble indiqué par ailleurs). En d'autres termes, dans cette variante, aucune information n'est insérée dans l'en-tête de l'entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l. On notera que cette variante est plus coûteuse en terme de bande passante car plus de bits sont nécessaires pour coder les informations dans les en-têtes des entités d'information associées aux blocs à coder. Avantageusement, le procédé de codage de l'invention comprend en outre l'étape suivante : insertion, dans ledit en-tête de l'entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l, d'au moins une information supplémentaire indiquant la valeur d'un seuil utilisé dans au moins un desdits deuxièmes et troisièmes modes de codage. L'invention concerne également un dispositif de codage d'une image ou d'une séquence d'images, générant un flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit dispositif comprenant des moyens de codage d'au moins l'une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n.

Selon l'invention un tel dispositif de codage est tel que, pour au moins un bloc d'image de différence de la couche de niveau n+l, lesdits moyens de codage mettent en oeuvre un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l. Plus généralement, le dispositif de codage selon l'invention comprend des moyens de mise en oeuvre du procédé de codage tel que décrit précédemment (dans l'un quelconque de ses différents modes de réalisation). L'invention concerne aussi un procédé de décodage d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit procédé comprenant une étape de décodage d'au moins une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n. Selon l'invention, un tel procédé de décodage est tel que, pour au moins un bloc d'image de différence de la couche de niveau n+l, ladite étape de décodage est effectuée selon un mode de décodage associé à un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l. Plus généralement, le procédé de décodage selon l'invention permet de décoder le signal codé selon le procédé de codage tel que décrit précédemment (dans l'un quelconque de ses différents modes de réalisation) et comprend donc certaines ou la totalité des caractéristiques de ce procédé de codage. L'invention concerne encore un dispositif de décodage d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit dispositif comprenant des moyens de décodage d'au moins une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n. Selon l'invention, ledit dispositif de décodage est tel que, pour au moins un bloc d'image de différence de la couche de niveau n+l, lesdits moyens de décodage mettent en oeuvre un mode de décodage associé à un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

Plus généralement, le dispositif de décodage selon l'invention comprend des moyens de mise en oeuvre du procédé de décodage tel que décrit précédemment (dans l'un quelconque de ses différents modes de réalisation). L'invention concerne également un signal de transmission d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, l'une au moins l'une desdites couches, de niveau n+l, ayant été codée par prédiction au moins à partir de ladite couche de niveau n. Selon l'invention, un tel signal véhicule également, pour au moins un bloc d'image de différence de la couche de niveau n+l, une information indiquant que ledit bloc a été codé selon un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l. Plus généralement, le signal selon l'invention est issu du procédé de codage tel que décrit précédemment (dans l'un quelconque de ses différents modes de réalisation) et comprend donc certaines ou la totalité des caractéristiques de ce procédé de codage. Avantageusement, ledit signal étant structuré en entités d'informations au sein desquelles est véhiculé ledit flux de données, chacune desdites entités d'information comprenant un en-tête, renseignant sur un type de ladite entité d'information, et un champ de données utiles, ledit signal véhicule également : - dans un en-tête d'une entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l, au moins une information indiquant un ensemble de modes de codage effectivement utilisés pour coder lesdits blocs à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l ; - pour chaque bloc à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l, insertion, dans un en-tête d'une entité d'information associée audit bloc à coder, au moins une information indiquant le mode de codage effectivement utilisé pour coder ledit bloc à coder parmi ledit ensemble de modes de codage effectivement utilisés. L'invention concerne aussi un produit Programme d'ordinateur téléchargeable depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur et/ou exécutable par un processeur, ce produit programme d'ordinateur comprenant des instructions de code de programme pour l'exécution des étapes du procédé de codage de l'invention précité, lorsque ledit programme est exécuté sur un ordinateur. L'invention concerne également un produit Programme d'ordinateur téléchargeable depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur et/ou exécutable par un processeur, ce produit programme d'ordinateur comprenant des instructions de code de programme pour l'exécution des étapes du procédé de décodage de l'invention précité, lorsque ledit programme est exécuté sur un ordinateur. 6. LISTE DES FIGURES D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description suivante d'un mode de réalisation préférentiel de l'invention, donné à titre d'exemple indicatif et non limitatif, et des dessins annexés, dans lesquels : les figures 1 à 3, déjà décrites en relation avec l'art antérieur, sont relatives au modèle SVM du groupe de travail MPEG-4 SVC. Plus précisément : * la figure 1 présente un synoptique du codeur SVM retenu par le groupe de travail précité ; * la figure 2 illustre les différentes courbes débit-distorsion obtenues à partir du codeur de la figure 1 ; * la figure 3 décrit le mécanisme de prédiction/extraction mis en oeuvre par le codeur SVM, à partir des courbes débit/distorsion du type de celles de la figure 2 ; la figure 4 présente un organigramme d'un mode de réalisation particulier du procédé de codage selon l'invention ; la figure 5 illustre un exemple d'entité d'information associée à un ensemble de blocs à coder et un exemple d'entité d'information associée à un bloc à coder, 25 30 véhiculant des informations (relatives aux modes de codage) insérées dans le flux selon l'invention ; - la figure 6 présente un schéma simplifié d'un dispositif de codage selon l'invention; et - la figure 7 présente un schéma simplifié d'un dispositif de décodage selon l'invention. 7. DESCRIPTION DÉTAILLÉE L'invention concerne donc une technique de codage d'une image ou d'une séquence d'images, générant un flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun des niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée des images, un pas de quantification des images et une fréquence temporelle des images.. On suppose que cette technique de codage comprend une étape de codage d'au moins l'une des couches, de niveau n+1, par prédiction, au moins à partir de la couche de niveau n. Le principe général de l'invention consiste à proposer au moins un mode de codage par prédiction inter-couche partiel, dans lequel le bloc de l'image de différence de la couche de niveau n est filtré avant d'être utilisé pour la prédiction du bloc de l'image de différence de la couche de niveau n+l.

Dans la suite de la description, on s'intéresse au cas particulier du codage des images à deux formats de résolution emboîtés QCIF et CIF. En d'autres termes, les niveaux n et n+l précités sont appelés par la suite niveau QCIF et niveau CIF respectivement. L'Homme du Métier étendra sans difficulté cet enseignement au cas plus général de n niveaux de résolution successifs (par exemple (voir définitions ci-dessus) : QCIF, CIF, SD, HD, etc.) ou encore au cas de n niveaux de qualité successifs pour un niveau de résolution donné (par exemple QCIF-qualité haute et QCIF-qualité basse). Dans la suite de la description, on se place également dans le cas particulier où ledit au moins un mode de codage par prédiction inter-couche partiel est tel qu'un bloc donné d'une image CIF (appelé bloc d'origine de la couche CIF) est codé comme la différence entre : un bloc résiduel de la couche CIF, résultant lui-même de la différence entre le bloc d'origine de la couche CIF et une prédiction de type Inter de ce bloc d'origine de la couche CIF ; et un bloc résiduel de la couche QCIF, résultant lui-même de la différence entre un bloc d'origine de la couche QCIF et une prédiction de type Inter de ce bloc d'origine de la couche QCIF. Il est clair que l'invention n'est nullement limitée à ce cas particulier et s'applique quel que soit le type de prédiction utilisée, pour chacune des couches CIF et QCIF, pour prédire le bloc d'origine de cette couche. Notamment, mais non exclusivement, la prédiction de type Inter (c'est-à-dire entre des images différentes) peut être remplacée par une prédiction de type Intra (c'est-à-dire au sein d'une même image). On présente maintenant, en relation avec l'organigramme de la figure 4, un mode de réalisation particulier du procédé de codage selon l'invention. Dans une étape référencée 41, on lance le codage d'une partie d'une image de différence CIF comprenant une pluralité de blocs d'image de différence de la couche CIF (aussi appelés blocs résiduels de la couche CIF). On rappelle que selon la terminologie MPEG, une partie d'image est appelée slice (ou bien unité à coder ). Dans une étape référencée 42, on sélectionne l'un des blocs résiduels de la couche CIF et on décide (dans une étape référencée 43) s'il peut être codé par prédiction inter-couche. On utilise par exemple le même algorithme d'autorisation du mode de prédiction inter-couche résiduelle que celui du JSVM, à savoir : un bloc d'un niveau haut est autorisé pour la prédiction inter-couche résiduelle si le bloc correspondant du niveau bas n'est pas nul (par nul on entend tous les coefficients à 0) et si la prédiction adaptative est autorisée (les indicateurs (flags) correspondants sont valides, par exemple le bloc n'est pas en mode de prédiction Intra). Si le bloc résiduel de la couche CIF ne peut pas être codé par prédiction inter-couche, on passe à l'étape référencée 415, dans laquelle le mode de codage sélectionné pour ce bloc est un mode de codage sans prédiction inter-couche.

Si le bloc résiduel de la couche CIF peut être codé par prédiction inter-couche, on passe à l'étape référencée 44, dans laquelle on lit les N modes de codage possibles.

Selon l'invention, au moins un de ces N modes de codage est un mode de codage par prédiction inter-couche partiel (au sens précité). Par exemple, on se donne les modes de codage suivants (N=7) (en appelant bloc de base le bloc résiduel de la couche QCIF (aussi appelé résidu QCIF sur-échantillonné) utilisé pour prédire le bloc résiduel de la couche CIF) : -mode 0 : pas de prédiction inter-couche résiduelle (ce mode de codage est déjà présent dans le JSVM) ; - mode 1 : prédiction inter- couche résiduelle avec tout le bloc de base, c'est-à-dire tous les coefficients DCT du bloc de base (ce mode de codage est déjà présent dans le JSVM) ; mode 2 : prédiction inter-couche résiduelle avec conservation uniquement du coefficient DC du bloc de base (valeur moyenne) ; - mode 3 : prédiction inter-couche résiduelle avec conservation de 33% des coefficients DCT de plus basses fréquences du bloc de base (suppression de 66% des coefficients DCT de plus hautes fréquences (donc parmi les coefficients AC) (un autre pourcentage peut bien sûr être retenu) ; - mode 4 : prédiction inter-couche résiduelle avec conservation de 66% des coefficients DCT de plus basses fréquences du bloc de base (un autre pourcentage peut bien sûr être retenu) ; - mode 5 : prédiction inter-couche résiduelle avec méthode de seuillage adaptatif des coefficients du bloc de base (en fonction de l'énergie des coefficients). On définit alors un seuil (ou plusieurs seuils si l'on utilise une classification des coefficients par rapport par exemple à leur position fréquentielle) qui sera utilisé pour filtrer les coefficients : si Icoeff]<seuil, le coefficient est gardé, sinon, il est mis à la valeur 0 ; - mode 6 : prédiction inter-couche résiduelle avec méthode de suppression des coefficients AC du bloc de base associée à un seuillage (c'est-à-dire combinaison du mode 3 ou 4 avec le mode 5). En d'autres termes, dans les modes 2, 3 et 4, on propose de conserver un certain pourcentage des coefficients DCT associés au bloc de base, afin de supprimer partiellement le bruit. Les coefficients non conservés sont mis à la valeur O. Il s'agit d'un filtrage linéaire. Dans le mode 5, on propose d'utiliser une méthode de seuillage. Il s'agit d'un traitement non linéaire permettant de filtrer le signal de manière à le débruiter tout en conservant ses caractéristiques haute-fréquence (voir le document "David L. Donoho, De-noising by soft-thresholding, IEEE Trans. Inform. Theory (1994)"). On utilise par exemple les étapes suivantes : - transformer le signal du bloc de base ; - effectuer un filtrage par seuil (soft thresholding) des coefficients DCT ; le seuil dépend de la variance du bruit du signal du bloc de base ou d'un ensemble de bloc de base (slice). Si Icoeffl>seuil, le coeff est laissé intact. Si Icoeffl< seuil, le coeff est mis à 0; - reconstruire le signal du bloc de base. Dans le mode 6, les deux méthodes (selection des coefficients et seuillage des coefficients) sont associées. Les coefficients conservés sont soumis à seuillage (ou les coefficients seuillés sont soumis à sélection). Tout type de variante peut être envisagée pour filtrer les coefficients DCT (on pourra utiliser toute méthode de débruitage connue). Dans une étape référencée 45, on lit le bloc résiduel de la couche QCIF.

Puis, dans une étape référencée 46, on analyse le bloc résiduel de la couche CIF et/ou des données associées à ce bloc), et en fonction du résultat de cette analyse, on sélectionne M modes de codage (parmi les N possibles précités), avec M>_l, dans une étape référencée 47. Cette heuristique peut être utilisée pour limiter le nombre de tests coté décodeur et donc ainsi de limiter la complexité de ce dernier.

En d'autres termes, dans l'étape d'analyse (46), on propose de réaliser une analyse du bloc et/ou des données associées afin de dégager un certain nombre de caractéristiques du bloc résiduel de la couche CIF avant de le soumettre à la prédiction inter résiduelle. En particulier on examinera : - l'énergie du bloc résiduel de la couche CIF et celle bloc résiduel de la couche QCIF (le cas "nul" a déjà été traité dans l'étape précédente) ; -la "ressemblance" du bloc résiduel de la couche QCIF avec le bloc résiduel de la couche CIF (REScIF û PRED_RESc,F) que l'on cherche à coder ; - le mouvement du bloc résiduel de la couche CIF, et en particulier la "similitude" (à un facteur d'échelle près) entre le mouvement du bloc résiduel de la couche QCIF et celui du bloc résiduel de la couche CIF ; -... (cette liste de critères possibles n'est pas exhaustive). Dans une étape référencée 47, on traite, avec chacun des M modes de codage, le bloc résiduel de la couche QCIF, permettant d'obtenir M résultats de codage. Puis, dans une étape référencée 48, on évalue un paramètre de qualité (par exemple calcul d'une métrique débit-distorsion du type R+XD, comme utilisé dans le JVSM) pour chacun des M résultats de codage. Dans une étape référencée 49, on sélectionne le meilleur mode de codage parmi les M modes de codage, en fonction de ce paramètre de qualité. Dans un mode de mise en oeuvre particulier, ce choix peut être fait au niveau de macroblocs rassemblant des blocs. dans une variante, ce choix peut être fait au niveau de chaque bloc. Après l'étape référencée 49 ou celle référencée 415, on passe à l'étape référencée 410, dans laquelle on détecte si le meilleur mode de codage, retenu pour le bloc résiduel de la couche CIF, est un mode de codage par prédiction inter-couche résiduelle. En cas de détection positive à l'étape référencée 410, on passe à l'étape référencée 411 dans laquelle on insère dans le flux à transmettre des informations (un exemple est décrit en détail ci-après, en relation avec la figure 5) permettant au décodeur de savoir quel mode de codage a été utilisé par le codeur pour coder ce bloc résiduel de la couche CIF. A l'issue de l'étape référencée 411, ou bien directement après l'étape référencée 410 en cas de détection négative à cette dernière, on passe à l'étape référencée 412, dans laquelle le bloc résiduel de la couche CIF est codé selon le meilleur mode de codage (voir étape 49). Puis, on passe à l'étape référencée 413, dans laquelle on détecte si tous les blocs résiduels de la couche CIF compris dans l'unité à coder (slice) ont été traités : - si ce n'est pas le cas, on passe à l'étape référencée 416, dans laquelle on sélectionne le bloc résiduel de la couche CIF suivant, puis on revient à l'étape référencée 42, pour traiter ce bloc suivant ; - si c'est le cas, on passe à l'étape référencée 414, dans laquelle on insère dans le flux à transmettre des informations supplémentaires relatives à la valeur du seuil utilisé dans les modes 5 et 6 de codage (si l'un de ces modes a effectivement été utilisé pour cette unité à coder), puis on revient à l'étape référencée 41 pour traiter une autre unité à coder. La figure 5 illustre un exemple d'une première entité d'information 51 associée à une unité à coder (slice), c'est-à-dire à un ensemble de blocs à coder, ainsi qu'un exemple de seconde entité d'information 55 associée à un bloc à coder. Selon l'invention, ces entités 51 et 55 véhiculent des informations relatives aux modes de codage effectivement utilisés par le codeur. De façon classique, chaque entité d'information 51, 55 comprend un en-tête 52, 56 et une partie utile 53, 57.

Dans un mode de réalisation particulier de l'invention, on insère : - dans l'en-tête 52 ("slice header") de la première entité d'information 51 les informations suivantes 54 : * l'ensemble des modes de codage effectivement utilisés pour coder les blocs de cette unité à coder. Cette information est donc valable pour tous les blocs de l'unité à coder (slice). Par exemple, on utilisera un champ de sept bits comme masque pour indiquer si les modes sont actifs ou non (une valeur du masque binaire à 0100100 indiquera par exemple l'utilisation des modes 1 et 4 pour coder l'unité à coder ; * la valeur du seuil dans les modes 5 et 6, si l'un de ces modes est 25 effectivement actif. Par exemple, on utilisera un entier. Il est à noter qu'on peut réutiliser l'élément de syntaxe disponible adaptive_prediction_flag pour définir le masque d'utilisation ou non des différents modes de codage. - dans l'en-tête 56 ("MB header") de la seconde entité d'information 55 30 l'information suivante 58 : le mode effectivement choisi pour ce bloc s'il a été codé en prédiction inter-couche résiduelle. Par exemple, si le mode 3 est indiqué, la prédiction a été réalisé après filtrage du bloc de base par suppression de 66% des coefficients disponibles. Il est à noter qu'on peut réutiliser l'élément de syntaxe disponible residual_prediction_flag, en le complétant par d'autres bits pour se donner la possibilité d'avoir plus de deux modes. La figure 6 présente la structure simplifiée d'un dispositif de codage de l'invention, qui comprend une mémoire 63, une unité de traitement 61, équipée par exemple d'un microprocesseur, et pilotée par un programme d'ordinateur 62 mettant en oeuvre le procédé de codage selon l'invention (par exemple le mode de réalisation particulier décrit ci-dessus en relation avec la figure 4). A l'initialisation, les instructions de code du programme d'ordinateur 62 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 61. L'unité de traitement 61 reçoit en entrée un contenu vidéo à coder 60. Le microprocesseur de l'unité de traitement 61 code la séquence vidéo 60 sous la forme d'un flux compressé 64 comprenant une pluralité de couches emboîtées de niveaux de résolution spatiale n successifs, selon les instructions du programme 62. L'unité de traitement 61 délivre en sortie le flux de données compressé 64. Dans le contexte ci-dessus, le procédé de décodage selon l'invention est tel que chaque bloc résiduel de la couche QCIF est décodé selon un mode de décodage associé au mode de codage utilisé par le codeur. Comme expliqué ci-dessus (en relation avec la figure 5), le flux véhicule des informations permettant au décodeur de retrouver le mode de codage utilisé par le codeur pour chaque bloc résiduel de la couche QCIF. La figure 7 présente la structure simplifiée d'un dispositif de décodage de l'invention, qui comprend une mémoire 73, une unité de traitement 71, équipée par exemple d'un microprocesseur, et pilotée par un programme d'ordinateur 72 mettant en oeuvre le procédé de décodage selon l'invention. A l'initialisation, les instructions de code du programme d'ordinateur 72 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 71. L'unité de traitement 71 reçoit en entrée en ensemble de paquets de données 70, ou entités d'information à décoder, par exemple un ensemble de NALs tronquées au point de débit optimal, en fonction de la qualité de reconstruction que l'on souhaite atteindre. Le microprocesseur de l'unité de traitement 71 décode les entités d'information reçues 70, selon les instructions du programme 72. L'unité de traitement 71 délivre en sortie une séquence vidéo reconstruite 74, adaptée aux capacités de traitement du terminal de visualisation du client.

On notera que l'invention, au codage comme au décodage, ne se limite pas àune implantation purement matérielle mais qu'elle peut aussi être mise en oeuvre sous la forme d'une séquence d'instructions d'un programme informatique ou toute forme mixant une partie matérielle et une partie logicielle. Dans le cas où l'invention est implantée partiellement ou totalement sous forme logicielle, la séquence d'instructions correspondante pourra être stockée dans un moyen de stockage amovible (tel que par exemple une disquette, un CD-ROM ou un DVD-ROM) ou non, ce moyen de stockage étant lisible partiellement ou totalement par un ordinateur ou un microprocesseur.

Claims

REVENDICATIONS

1. Procédé de codage d'une image ou d'une séquence d'images, générant un flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit procédé comprenant une étape de codage d'au moins l'une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n, caractérisé en ce que, pour au moins un bloc d'image de différence de la couche de niveau n+l, ladite étape de codage est effectuée selon un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

2. Procédé de codage selon la revendication 1, caractérisé en ce que chaque bloc d'image de différence de la couche de niveau n+l résulte de la différence entre un bloc d'origine de la couche de niveau n+l et une prédiction de type Inter dudit bloc d'origine de la couche de niveau n+l, et en ce que chaque bloc d'image de différence de la couche de niveau n résulte de la différence entre un bloc d'origine de la couche de niveau n et une prédiction de type Inter dudit bloc d'origine de la couche de niveau n.

3. Procédé de codage selon la revendication 1, caractérisé en ce que chaque bloc d'image de différence de la couche de niveau n+l résulte de la différence entre un bloc d'origine de la couche de niveau n+l et une prédiction de type Intra dudit bloc d'origine de la couche de niveau n+1, et en ce que chaque bloc d'image de différence de la couche de niveau n résulte de la différence entre un bloc d'origine de la couche de niveau n et une prédiction de type Intra dudit bloc d'origine de la couche de niveau n.

4. Procédé de codage selon l'une quelconque des revendications 1 à 3, caractérisé en ce que, pour chaque bloc d'image de différence de la couche de niveau n+l, ladite étape de codage est adaptative et comprend une étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprenant au moins un mode de codage parprédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

5. Procédé de codage selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit au moins un mode de codage par prédiction inter-couche partiel appartient au groupe comprenant : - des premiers modes de codage par prédiction inter-couche partiels utilisant un jeu de coefficients résultant d'une sélection par conservation d'un pourcentage P prédéterminé des coefficients associés audit bloc d'image de différence de la couche de niveau n ; - des deuxièmes modes de codage par prédiction inter-couche partiels utilisant un jeu de coefficients résultant d'une sélection par seuillage de certains des coefficients associés audit bloc d'image de différence de la couche de niveau n ; - des troisièmes modes de codage par prédiction inter-couche partiels utilisant un jeu de coefficients résultant d'une sélection par conservation d'un pourcentage P prédéterminé des coefficients associés audit bloc d'image de différence de la couche de niveau n, puis d'une sélection par seuillage, ou inversement.

6. Procédé de codage selon la revendication 5, caractérisé en ce que, pour lesdits premiers modes de codage par prédiction inter-couche partiels, ladite sélection consiste à conserver, parmi les coefficients classés par ordre croissant de fréquence, les P pourcents de coefficients possédant les plus basses fréquences.

7. Procédé de codage selon l'une quelconque des revendications 4 à 6, caractérisé en ce que ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend les étapes suivantes, pour chaque bloc d'image de différence de la couche de niveau n+l : analyse dudit bloc d'image de différence de la couche de niveau n+l et/ou de données associées audit bloc d'image de différence de la couche de niveau n+l ; - sélection de M modes de codage parmi lesdits N modes de codage, en fonction du résultat de ladite étape d'analyse, avec M>_l.

8. Procédé de codage selon la revendication 7, caractérisé en ce que, si M>_2, ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend en outre les étapes suivantes, pour chaque bloc d'image de différence de la couche de niveau n+l : - traitement, avec chacun des M modes de codage, du bloc d'image de différence de la couche de niveau n correspondant audit bloc d'image de différence de la couche de niveau n+l, permettant d'obtenir M résultats de codage ; évaluation d'un paramètre de qualité pour chacun des M résultats de codage ; sélection du meilleur mode de codage parmi les M modes de codage, en fonction 10 dudit paramètre de qualité.

9. Procédé de codage selon l'une quelconque des revendications 4 à 8, caractérisé en ce que ladite étape de sélection d'un mode de codage parmi un ensemble de N modes de codage comprend, pour chaque bloc d'image de différence de la couche de niveau n+l, une étape de détection d'une autorisation de codage par prédiction inter-couche, 15 et en ce que, en cas de détection négative, le mode de codage sélectionné pour ledit bloc d'image de différence de la couche de niveau n+l est un mode de codage sans prédiction inter-couche.

10. Procédé de codage selon l'une quelconque des revendications 1 à 9, caractérisé en ce qu'il comprend en outre les étapes suivantes : 20 -insertion, dans un en-tête d'une entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l, d'au moins une information indiquant un ensemble de modes de codage effectivement utilisés pour coder lesdits blocs à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l ; - pour chaque bloc à coder appartenant audit ensemble de blocs à coder de la 25 couche de niveau n+l, insertion, dans un en-tête d'une entité d'information associée audit bloc à coder, d'au moins une information indiquant le mode de codage effectivement utilisé pour coder ledit bloc à coder parmi ledit ensemble de modes de codage effectivement utilisés.

11. Dispositif de codage d'une image ou d'une séquence d'images, générant un flux 30 de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moinsun des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit dispositif comprenant des moyens de codage d'au moins l'une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n, caractérisé en ce que, pour au moins un bloc d'image de différence de la couche de niveau n+l, lesdits moyens de codage mettent en oeuvre un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

12. Procédé de décodage d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, ledit procédé comprenant une étape de décodage d'au moins une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n, caractérisé en ce que, pour au moins un bloc d'image de différence de la couche de niveau n+l, ladite étape de décodage est effectuée selon un mode de décodage associé à un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

13. Dispositif de décodage d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images,ledit dispositif comprenant des moyens de décodage d'au moins une desdites couches, de niveau n+l, par prédiction, au moins à partir de ladite couche de niveau n, caractérisé en ce que, pour au moins un bloc d'image de différence de la couche de niveau n+l, lesdits moyens de décodage mettent en oeuvre un mode de décodage associé à un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

14. Signal de transmission d'un flux de données représentatif d'une image ou d'une séquence d'images, ledit flux de données présentant une structure hiérarchique de couches de données emboîtées de niveaux n successifs, où n est entier, chacun desdits niveaux n correspondant à au moins un des éléments parmi la liste suivante : une résolution prédéterminée desdites images, un pas de quantification desdites images et une fréquence temporelle desdites images, l'une au moins l'une desdites couches, de niveau n+l, ayant été codée par prédiction au moins à partir de ladite couche de niveau n, caractérisé en ce que ledit signal véhicule également, pour au moins un bloc d'image de différence de la couche de niveau n+l, une information indiquant que ledit bloc a été codé selon un mode de codage par prédiction inter-couche partiel, n'utilisant qu'une partie d'un ensemble de coefficients associés à un bloc d'image de différence de la couche de niveau n servant à ladite prédiction et correspondant audit au moins un bloc d'image de différence de la couche de niveau n+l.

15. Signal selon la revendication 14, ledit signal étant structuré en entités d'informations au sein desquelles est véhiculé ledit flux de données, chacune desdites entités d'information comprenant un en-tête, renseignant sur un type de ladite entité d'information, et un champ de données utiles, caractérisé en ce que ledit signal véhicule également : -dans un en-tête d'une entité d'information associée à un ensemble de blocs à coder de la couche de niveau n+l, au moins une information indiquant un ensemble de modes de codage effectivement utilisés pour coder lesdits blocs à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l ;- pour chaque bloc à coder appartenant audit ensemble de blocs à coder de la couche de niveau n+l, insertion, dans un en-tête d'une entité d'information associée audit bloc à coder, au moins une information indiquant le mode de codage effectivement utilisé pour coder ledit bloc à coder parmi ledit ensemble de modes de codage effectivement utilisés.

16. Produit Programme d'ordinateur téléchargeable depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur et/ou exécutable par un processeur caractérisé en ce qu'il comprend des instructions de code de programme pour l'exécution des étapes du procédé de codage d'au moins une des revendications 1 à 10 10, lorsque ledit programme est exécuté sur un ordinateur.

17. Produit Programme d'ordinateur téléchargeable depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur et/ou exécutable par un processeur caractérisé en ce qu'il comprend des instructions de code de programme pour l'exécution des étapes du procédé de décodage de la revendication 12, lorsque ledit 15 programme est exécuté sur un ordinateur.5