FR2896371A1 - Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible - Google Patents
Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible Download PDFInfo
- Publication number
- FR2896371A1 FR2896371A1 FR0650194A FR0650194A FR2896371A1 FR 2896371 A1 FR2896371 A1 FR 2896371A1 FR 0650194 A FR0650194 A FR 0650194A FR 0650194 A FR0650194 A FR 0650194A FR 2896371 A1 FR2896371 A1 FR 2896371A1
- Authority
- FR
- France
- Prior art keywords
- images
- level
- output
- filtering
- output images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/615—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
- H04N19/426—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Le procédé de traitement d'une séquence d'images numériques, dans le cadre d'un codage selon un train binaire comportant des images de sortie, compressées, et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé, comporte les étapes suivantes :- obtenir (E1) et mémoriser des images d'origine (E2), et- générer (E3) des images de sortie, par transformation d'images d'origine et/ou d'images intermédiaires, et/ou d'images de sortie, dans un premier ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation des images d'origine en images de sortie, soit minimal.Application du traitement d'une séquence d'images numériques au format extensible conforme à la norme SVC.
Description
La présente invention se rapporte au traitement d'une séquence d'images
numériques compressée selon un format extensible appelé encore scalable et plus particulièrement à la réduction du temps de traitement d'une telle séquence vidéo selon un tel format extensible, ainsi qu'à la réduction de la taille mémoire utilisée dans le cadre du codage d'une telle séquence vidéo selon un tel format extensible. La propriété d'une séquence vidéo au format extensible est de pouvoir, à partir d'un train binaire unique, extraire et décoder des vidéos selon des caractéristiques différentes en termes de qualité, de fréquence temporelle et/ou de taille de l'image.
La future norme SVC, Codage Vidéo Extensible ( Scalable Video Coding en anglais) décrit le processus de codages de séquences vidéo pour la représenter sous un format extensible. En pratique, la norme SVC est développée par le groupe JVT (Joint Video Team), qui réunit les experts de la compression vidéo du groupe MPEG ( Moving Picture Expert Group ) du comité ISO/IEC et les experts vidéo de l'UIT, Union Internationale des Télécommunications. Cette future norme SVC est un amendement de la norme de compression vidéo H.264 destinée à offrir davantage d'extensibilité, ou de scalabilité , aux images numériques d'une séquence vidéo. Plus précisément, la norme SVC fournit une représentation compressée permettant de supporter une extensibilité (scalabilité) selon trois axes différents : scalabilité temporelle, scalabilité spatiale et scalabilité en qualité. En pratique, le nouveau format vidéo SVC permet d'être décodé de manière différente en fonction des capacités et des possibilités du décodeur et des caractéristiques du réseau. Ainsi, à partir d'une vidéo de moyenne résolution (par exemple, de résolution 704x576 pixels, à une fréquence de 60Hz), il est possible de décoder un train binaire correspondant à celui d'un téléphone mobile (par exemple, de résolution 176x144 pixels, à une fréquence de 15hz). De même, à partir d'une image d'une taille donnée et de fréquence temporelle donnée, il est possible de décoder une séquence vidéo en sélectionnant la qualité souhaitée en fonction de la capacité du réseau.
Aujourd'hui, la propriété d'extensibilité d'un format vidéo est une propriété qui est de plus en plus importante et répandue dans le domaine du traitement des images d'une séquence vidéo. Toutefois, les procédés de traitement d'images actuels utilisent des techniques qui ont l'inconvénient d'être consommatrices en temps de traitement d'une part et/ou en taille mémoire d'autre part. Le Demandeur s'est posé le problème de fournir un traitement des images numériques d'une séquence vidéo selon un format extensible ayant l'avantage de réduire la taille mémoire utilisée et/ou de réduire le temps de décodage dès la réception des images au niveau du décodeur.
La présente invention apporte justement une solution à ce problème. Elle porte ainsi sur un procédé de traitement d'une séquence d'images numériques, dans le cadre d'un codage selon un train binaire comportant des images de sortie, compressées, et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé. Selon une définition générale de l'invention, le procédé comprend les étapes suivantes : - obtenir et mémoriser des images d'origine ; - générer des images de sortie, par transformation des images d'origine et/ou d'images intermédiaires et/ou d'images de sortie, dans un premier ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation des images d'origine en images de sortie, soit minimal. Un tel procédé permet ainsi de minimiser la mémoire requise pour le traitement d'un groupe d'images d'origine au niveau de l'encodeur par rapport aux procédés de traitement de l'art antérieur.
En pratique, le traitement entremêle simultanément des images de différents niveaux de hiérarchie temporelle. En pratique, une image de sortie est générée dès que la ou les images du niveau de hiérarchie temporelle inférieur nécessaires à sa génération par transformation sont disponibles, ce qui réduit la taille mémoire et le temps de latence au niveau de l'encodeur. Selon une réalisation, le procédé comprend, après l'étape de génération, une étape de codage des images de sortie. Selon une autre réalisation, l'étape de codage des images de sortie commence avant la fin de l'étape d'obtention de toutes les images d'origine de la séquence, ce qui réduit encore les temps de latence au niveau de l'encodeur. Selon encore une autre réalisation, le procédé comporte en outre une étape d'ordonnancement des images de sortie selon un second ordre choisi.
De préférence, le second ordre choisi est adapté à minimiser le délai de décodage ultérieur des images. Selon encore une autre réalisation, la transformation consiste en des opérations de filtrage de type prédiction temporelle et/ou mises à jour. La présente invention a également pour objet un procédé de traitement d'une séquence d'images numériques, dans le cadre d'un décodage d'un train binaire comportant des images de sortie compressées et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé. Selon un autre aspect de l'invention, le procédé comprend les étapes suivantes : -décoder des images de sortie compressées selon ledit format extensible et mémoriser les images de sortie ainsi décodées, - générer des images reconstruites de la séquence d'images, par transformation inverse d'images de sortie décodées et/ou d'images intermédiaires, et/ou d'images reconstruites, traitées dans un troisième ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation inverse des images de sortie en images reconstruites soit minimal. Un tel procédé de traitement permet ainsi de minimiser la mémoire requise pour le traitement d'un groupe d'images de sortie compressées selon un format extensible prédéterminé au niveau du décodeur. Le troisième ordre appliqué pour le traitement dépend de l'ordre des images de sortie compressées à l'entrée du décodeur. Selon une réalisation, le procédé de traitement d'une séquence d'images numériques dans le cadre du décodage comporte une étape préalable d'ordonnancement des images de sortie compressées selon un quatrième ordre choisi. Le quatrième ordre est avantageusement choisi pour minimiser le délai de décodage des images. Cet ordonnancement peut être effectué au niveau du codage sur le dispositif qui effectue le codage, ou par un traitement spécifique du fichier sur un dispositif intermédiaire, ou encore au moment du décodage sur le dispositif qui effectue le décodage. II est particulièrement avantageux de choisir le quatrième ordre identique au second ordre évoqué ci-dessus. De préférence, la génération d'images reconstruites entremêle simultanément des images de différents niveaux de hiérarchie temporelle. Selon une autre réalisation, une image reconstruite est générée dès que la ou les images du niveau de hiérarchie temporelle supérieur nécessaires à sa génération par transformation inverse sont disponibles, ce qui permet de réduire le temps de latence au niveau du décodeur.
Selon encore une autre réalisation, l'étape de génération des images reconstruites commence avant la fin de l'étape d'obtention de toutes les images de sortie compressées de la séquence. En pratique, le train binaire est codé selon le format extensible du type SVC.
La présente invention a également pour objet un dispositif de traitement pour la mise en oeuvre du procédé de traitement, côté encodeur.
Selon un autre aspect de l'invention, le dispositif de traitement, côté encodeur, comprend : - des moyens pour obtenir et mémoriser des images d'origine, et - des moyens pour générer des images de sortie, par transformation d'images d'origine et/ou d'images intermédiaires, et/ou d'images de sortie, dans un premier ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation des images d'origine en images de sortie, soit minimal. La présente invention a également pour objet un dispositif de traitement pour la mise en oeuvre du procédé de traitement, côté décodeur. Selon un autre aspect de l'invention, le dispositif de traitement, côté décodeur, comprend : - des moyens pour décoder des images de sortie compressées selon ledit format extensible et mémoriser les images de sortie ainsi décodées, - des moyens pour générer des images reconstruites de la séquence d'images, par transformation inverse d'images de sortie décodéeset/ou d'images intermédiaires, et/ou d'images reconstruites, traitées dans un troisième ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation inverse des images de sortie en images reconstruites soit minimal. La présente invention a également pour objet un support d'informations lisible par un système informatique, éventuellement amovible, totalement ou partiellement, notamment CD-ROM ou support magnétique, tel un disque dur ou une disquette, ou support transmissible, tel un signal électrique ou optique, caractérisé en ce qu'il comporte des instructions d'un programme d'ordinateur permettant la mise en oeuvre du procédé mentionné ci-avant, lorsque ce programme est chargé et exécuté par un système informatique. La présente invention a enfin pour objet un programme d'ordinateur stocké sur un support d'informations, ledit programme comportant des instructions permettant la mise en oeuvre du procédé mentionné ci-avant, lorsque ce programme est chargé et exécuté par un système informatique.
La présente invention confère de nombreux avantages. En premier lieu, la taille mémoire peut être minimisée à la fois à l'encodage et au décodage lors de l'obtention des différentes versions temporelles de la séquence vidéo. Par exemple, pour un groupe d'images de taille 16, 8 images peuvent suffire dans la mémoire tampon pour traiter/compresser les différentes versions temporelles de ces 16 images. En second lieu, les images dans le train binaire de la vidéo sont organisées de telle manière que le décodage d'un groupe d'images peut démarrer sans attendre le décodage de toutes les images dudit groupe d'images. Ainsi, l'invention permet de réduire les délais entre le décodage et l'affichage. Cette réduction est notamment opérationnelle au niveau des délais entre l'encodage et le décodage induits par le traitement d'un groupe d'images dans les applications temps réel comme la visioconférence ou la vidéosurveillance. L'invention permet également de réduire la complexité calculatoire constatée dans les décodages de l'art antérieur selon lesquels aucun traitement n'est entrepris tant que la dernière image du dernier niveau n'est pas calculée. D'autres caractéristiques et avantages de l'invention apparaîtront à la lumière de la description détaillée ci-après et des dessins dans lesquels : - la figure 1 représente schématiquement un organigramme illustrant les étapes principales du procédé selon l'invention ; - la figure 2 représente schématiquement les différentes versions temporelles et spatiales d'une séquence vidéo ; - la figure 3 représente schématiquement la génération des versions temporelles pour une résolution spatiale donnée selon la technique de filtrage temporel compensé en mouvement au niveau de l'encodeur ; - les figures 4A et 4B représentent schématiquement des ordres d'arrangement du train binaire vidéo selon l'art antérieur et selon l'invention ; - la figure 5 illustre la technique de filtrage temporel compensé en mouvement inverse réalisée au niveau du décodage selon l'invention ; - les figures 6A et 6B représentent respectivement l'ordre K des images au niveau de l'encodage et l'ordre M des images nécessaires au niveau du décodage selon l'invention ; et - la figure 7 représente schématiquement les éléments du dispositif permettant de mettre en oeuvre le procédé selon l'invention. En référence à la figure 1, on a décrit les différentes étapes du procédé selon l'invention. Dans un premier temps (étape El), des images d'origine de la séquence d'images numériques sont mises dans une mémoire tampon (étape E2). On note que c'est cette mémoire tampon que l'on minimise pour le traitement au niveau de l'encodeur. Les images des différents niveaux de hiérarchie temporelle sont ensuite générées lors de l'étape E3. La figure 3, décrite ci-après, donne un exemple détaillé de la méthode pour la génération, selon l'invention, des images des différents niveaux hiérarchiques temporels. Cette méthode met en oeuvre un traitement selon un premier ordonnancement qui permet de minimiser le nombre d'images nécessaires simultanément dans la mémoire tampon. Les images ainsi produites sont ensuite codées lors de l'étape E4. Les moyens de codage sont classiques et font appel aux techniques de filtrage temporel compensé en mouvement couplées à des codages d'erreur de prédiction largement connues de l'homme du métier. Le procédé consiste ensuite à réorganiser l'ordre des images du train binaire vidéo ( bitstream ) lors de l'étape E5, selon un second ordre choisi pour minimiser le délai de traitement au décodeur. A noter que cette étape E5 peut être mise en oeuvre au niveau de l'encodeur, au niveau du décodeur ou encore au niveau d'un noeud du réseau situé entre le codeur et le décodeur. L'étape E6 consiste ensuite à faire le décodage des images dans l'ordre imposé lors de l'étape E5. L'étape E8 permet de restituer les différentes versions hiérarchiques temporelles de la séquence vidéo en utilisant une mémoire tampon (étape E7). L'une des méthodes de génération des images reconstruites est décrite en référence à la figure 5. Lors de l'étape E9, on affiche la séquence vidéo ainsi obtenue après décodage. Au niveau de l'affichage, l'utilisateur peut sélectionner la résolution temporelle qu'il souhaite visualiser. En référence à la figure 2, on a représenté schématiquement différentes versions hiérarchiques temporelles et spatiales que l'on peut obtenir 5 avec la norme SVC. Par exemple, à partir d'une séquence vidéo SV au format de télévision, c'est-à-dire originellement composée de 60 images (704x576 pixels) par seconde. Il est possible de construire (et par la suite d'extraire), pour une même résolution spatiale RS1 égale à 704x576, différentes versions 10 temporelles dyadiques : 30 Hz (RS1-30), 15 Hz, 7, 5 Hz. Le nombre de versions est choisi par l'utilisateur au moment de l'encodage. De la même manière, il est possible de choisir un certain nombre de versions spatiales représentées par RS2 et RS3. A partir de la résolution RS1 (704x576 pixels), il est ainsi possible de construire les résolutions spatiales 15 inférieures suivantes: RS2 (352x288 pixels), RS3 (176x144 pixels). De la même manière, la détermination du nombre de versions temporelles se fait au moment de l'encodage. Les techniques utilisées dans SVC permettent ainsi de combiner les aspects spatiaux et temporels pour fournir, par exemple, au niveau de 20 l'encodage une vidéo 352x288 à 7,5 Hz. En référence à la figure 3, on a décrit la génération des versions temporelles pour une résolution spatiale donnée. La figure 3 représente de façon schématique un outil permettant de générer les versions temporelles d'une résolution spatiale donnée. L'outil mis 25 en oeuvre ici est le filtrage temporel compensé en mouvement, appelé encore MCTF pour Motion Compensated Temporal Filtering en anglais et largement connu par l'homme du métier. D'autres techniques similaires et connues de l'homme de l'art pourraient être aussi utilisées pour la construction de ces versions temporelles comme la technique des images B 30 hiérarchiques Le principe général du filtrage MCTF comporte deux étapes : la prédiction et la mise à jour. Le filtrage MCTF est une représentation multi- résolution dans la dimension temporelle d'un groupe d'images. Une transformation en ondelettes dans la direction temporelle est effectuée. Chaque étage de décomposition consiste en un filtrage passe-haut, puis un filtrage passe-bas d'un groupe d'images. Le filtrage MCTF fournit donc un ensemble d'images de détail temporel passe-haut Hns et un ensemble d'images d'approximation passe-bas Ln,X La succession de ces niveaux (dans l'exemple de la figure 3, le nombre de niveaux est égal à 4) ou étapes de décomposition fournit donc une représentation multi-résolution au sens temporel du groupe d'images considéré.
L'étape de génération des images passe-haut est appelée prédiction (prediction step en anglais), et l'étape de génération des images passe-bas est appelée mise à jour (update step en anglais). Cette méthode de filtrage en ondelettes est représentée ici par un schéma en lifting bien connu par l'homme du métier. Cette implémentation permet d'effectuer les opérations de filtrage en place , c'est-à-dire que les pixels traités remplacent les pixels précédents dans les différentes images. Aucune mémoire additionnelle n'est donc nécessaire pour faire les calculs de filtrage. En référence à la figure 3, les images d'origine du groupe d'images numériques appelé aussi Group Of Picture (GOP) sont schématiquement représentées par les notations I1 à 116. Sur la figure 3 est également représentée l'image 10, qui fait partie du groupe d'images précédent. On l'utilise pour référence de traitement, mais elle n'est pas modifiée. Dans l'étape de prédiction (H), les images impaires sont d'abord compensées en mouvement en considérant l'image immédiate future et l'image immédiate passée. Par exemple, pour chaque bloc Bi de l'image Il, on recherche le meilleur bloc dans les images IO et 12 qui correspond le mieux selon une mesure d'erreur choisie. Le filtrage MCTF consiste ensuite à remplacer les valeurs du bloc Bi par l'erreur entre le bloc Bi initial et la moyenne des deux blocs retenus dans les images 10 et 12. De cette manière, sur l'ensemble du groupe d'images (GOP), les images H1,; représentent des images d'erreur après compensation de mouvement effectué sur tous les blocs des images impaires. Ces images d'erreur, considérées ici comme des images de sortie, par rapport aux images d'origine, sont ensuite codées. Ensuite, c'est l'étape de mise à jour (L). Dans cette étape, les images paires sont filtrées également par bloc. Les blocs correspondant selon la compensation de mouvement inverse, servent au filtrage pour l'étape de mise à jour. Les images ainsi mises à jour peuvent être assimilées à une moyenne des images d'origine sur une fenêtre temporelle donnée. Les images ainsi mises à jour correspondent aux images L1,21 .On remarque que leur fréquence temporelle est divisée par 2 par rapport aux images originales.
Une nouvelle itération du processus de filtrage MCTF peut alors être réalisée sur les images L1,; précédentes, que l'on considère ici comme des images intermédiaires par rapport aux images d'origine et aux images de sortie pour obtenir de nouvelles versions temporelles. On peut continuer ainsi jusqu'à obtenir une seule image L4,16 comme illustré sur la figure 3.
Dans l'art antérieur (figure 4A), le traitement des images se fait par niveau temporel N en mémorisant les 16 images du groupe d'images (GOP) dès le début. Cela veut dire que les images Ll,; et H1,; sont traitées dans un premier temps (niveau N = 1), puis ensuite les images L2,; et H2,; (niveau N = 2) et ainsi de suite.
Les images de sortie sont ainsi générées classiquement par niveau temporel N : niveau N = 4 : L4,0 ; L4,16 ; H4,8. niveau N = 3 : H3,4 ; H3,12 ; niveau N = 2 : H2,2 ; H2,6 ;H2,10 ;H2,14 ; niveau N = 1 : H1,1 ; H1,3 ; H1,5 ; H1,7 ; H1,9 ; H1,11 ; H1,13 ; H1,15. Selon l'invention, le traitement des différentes versions temporelles du groupe d'images (GOP) est réalisé, au contraire de l'art antérieur, de façon simultanée afin que le nombre nécessaire d'image dans la mémoire soit minimal. Ainsi, dans l'exemple présenté, il est possible de n'utiliser que 8 images en mémoire pour produire les différentes versions temporelles de cette séquence ayant des groupes d'images (GOP) de 16 images. Il est donc possible d'optimiser la mémoire pour traiter un groupe d'images. Ceci a pour conséquence de traiter les images dans un premier ordre particulier (ici RI à R16, figure 4B) afin de minimiser la mémoire. L'ordre de traitement préconisé au niveau de l'encodage est celui représenté par les références R accolées aux images (allant de manière croissante de RI à R17, figure 4B). Cet ordonnancement R a pour conséquence de faire des traitements mêlant les images des différents niveaux de hiérarchie temporelle N. Le principe est de commencer les traitements aussi vite que possible dès que l'on dispose d'une image d'un niveau inférieur afin de réduire la mémoire utile. Par exemple, comme illustré à la figure 3, dès que l'on dispose des images H1,1 H1,3 et H1,5 du niveau de hiérarchie N=1, on peut procéder à la génération de l'image de sortie H2,2 du niveau de hiérarchie N=2. Un des avantages de l'ordre de traitement R proposé est la possibilité de commencer les étapes de codage d'images avant de terminer le processus de génération des différentes versions temporelles. Cela permet de réduire le délai entre les entrées des images dans le codeur et la sortie des images ainsi codées. Comme explicité plus haut sur un exemple, le filtrage est opéré sur tous les blocs de l'image I1 et les blocs correspondant dans l'image IO et dans l'image 12 au sens de la compensation de mouvement. Afin de pouvoir libérer de la mémoire au plus vite, l'opération de filtrage pour une image donnée est décomposée en 2 étapes que l'on nomme coté gauche et coté droit dans les opérations ci-dessous. Ainsi en reprenant l'exemple du filtrage de l'image I1, on effectue d'abord les opérations de filtrage seulement avec l'image 10 ( coté gauche ) : le résultat du filtrage est mis dans l'image I1 et dans un second temps, on filtre à nouveau l'image Il ( coté droit ) avec l'image 12 dont le résultat final est mis dans l'image I1. C'est dans la suite du traitement que la séparation en 2 étapes et le traitement des images dans un certain ordre permet de minimiser l'espace mémoire requis pour traiter un groupe d'images (GOP).
Pour mieux comprendre le schéma de la figure 3, on a listé ci-après les différentes opérations de filtrage et d'écriture dans la mémoire tampon. Cette liste d'opérations, en annexe Al, donne également les mouvements d'entrée et de sortie des images dans cette mémoire tampon ainsi que l'évolution de sa taille. Les figures 4A et 4B illustrent deux ordres d'arrangement du train binaire vidéo. Le premier ordre d'arrangement, figure 4A, est celui classiquement fournit par un codeur SVC de l'art antérieur. Comme vu ci-avant, l'ordre tel que décrit en référence à la figure 4A montre que dans l'art antérieur chaque niveau temporel N est traité de façon indépendante, les uns à la suite des autres, ce qui nécessite la mise en mémoire de toutes les images du groupe d'images (GOP). Le second ordre d'arrangement R allant de RI à R17 (rangé par ordre croissant), figure 4B, est celui fourni par le procédé selon l'invention tel que décrit en référence à la figure 3. Les images de sortie des niveaux temporels N sont entremêlées de la manière suivante : RI = H1,1 ; R2 = H1,3 ; R3=HI,5;R4=H2,2;R5=H1,7;R6=H1,9;R7=H2,6;R8=H1,11;R9= H1,13; RIO=H2,10; R11 =H1,15; R12=H3,4; R13=H2,14; R14=H3,12; R15=L4,0; R16 = H4,8 ; R17=L4,16.
Comme il est nécessaire d'avoir certaines images du niveau inférieur pour encoder une image du niveau supérieur, le procédé consiste à générer les images dès que les images nécessaires (intermédiaires ou de sorties) du niveau inférieur sont traitées et donc disponibles pour être à nouveau traitées. Après génération des images temporelles de sortie, il ne reste plus ensuite qu'à encoder ces images. En référence à la figure 5, on a illustré la transformation MCTF inverse au niveau du décodage. La transformation MCTF inverse consiste à appliquer le processus inverse de la transformation MCTF directe. Les opérations de filtrage inverse sont alors entreprises sur les images décodées.
La première étape consiste à faire l'opération de mise à jour inverse, puis l'opération de prédiction inverse.
De la même manière que le procédé décrit en référence à la figure 3, il est possible de minimiser la mémoire utile pour réaliser le traitement inverse pour restituer les différentes versions temporelles. Cela a pour conséquence de traiter les images au niveau du décodeur dans un ordre particulier afin de satisfaire cette contrainte. Le principe consiste à traiter les images le plus tôt possible comme au niveau de l'encodeur. Pour cela, l'ordre de traitement indiqué par les références K accolées aux images sur la figure 5 allant de KI à K17 représente le meilleur ordre pour la génération des images décodées. L'ordre K correspond aux images suivantes ; KI = L4,16 ; K2 = H4,8 : K3 = L4,0 ; K4 = H3,4 ; K5= H3,12 ; K6 = H2,2;K7=H2,6;K8=H1,1;K9=H1,3;K10=H1,5;K11 =H2,10;K12= H1,7;K13=H1,9;K14=H2,14; K15=H1,11 ; K16 = H1,13; K17 = H1,15. II est à noter que ce second ordre de décodage K ne correspond pas à l'ordre de sortie des images encodées. Il existe alors au moins deux possibilités pour ordonner le train binaire vidéo sortant du codeur de façon à ce que son ordre soit adapté à l'ordre optimal pour le décodage. Cet ordonnancement correspond à l'étape E5 de la figure 1. Selon la première possibilité, les images encodées au niveau de l'encodeur sont mémorisées sous leur forme compressée. Ainsi dès que cela est possible, une opération d'ordonnancement des images est entreprise afin de générer l'ordre des images correspondant au décodeur. La suite des images dans le train binaire vidéo est alors conforme à l'ordre de décodage. Selon la seconde possibilité, les images dans le train binaire vidéo sont organisées telles que le codeur les fournit. Une mémoire tampon au niveau du décodeur permet de les arranger préalablement dans l'ordre préconisé pour le décodage. De la même manière que pour le codeur, une séparation des opérations de filtrage en 2 étapes est réalisée. C'est la séparation en 2 étapes et le traitement selon un ordre particulier des images qui permet de minimiser la taille de la mémoire tampon On a listé, en annexe A2, les actions qui précisent les opérations de filtrages et de mouvement en mémoires pour la transformation MCTF inverse.
En référence aux figures 6A et 6B, on a représenté l'ordre K allant de KI à K17 et non rangé par ordre croissant des images au niveau de l'encodage (figure 6A) et l'ordre M allant de MI à M17 rangé par ordre croissant des images nécessaires au niveau du décodage (figure 6B). L'ordre M correspond aux images suivantes : MI = L4,16 ; M2 = H4,8 ; M3 = L4,0 ; M4 = H3,4 ; M5= H3,12 ; M6 = H2,2 ; M7 = H2,6 ; M8 = H1,1 ; M9 = H1,3 ; M10 = H1,5 ; M11 = H2,10 ; M12 = H1,7 ; M13 = H1,9 ; M14 = H2,14 ; M15 = H1,11 ; M16 = H1,13; M17 = H1,15. Les flèches symbolisent ici la modification de l'ordre des images à effectuer au niveau du train binaire vidéo lors de l'étape E5 de réorganisation décrite en référence à la figure 1 pour passer de l'ordre K à l'ordre M selon l'invention. En référence à la figure 7, on a représenté les moyens essentiels et constitutifs d'un dispositif permettant de mettre en oeuvre les procédés de traitement selon l'invention. Le dispositif est par exemple un micro-ordinateur 100 connecté à différents périphériques, par exemple une caméra numérique 101(ou un scanner, ou tout moyen d'acquisition ou de stockage d'image) reliée à une carte graphique et fournissant des informations à compresser selon l'invention. Le dispositif 100 comporte une interface de communication 118 reliée à un réseau 120 apte à transmettre des données numériques à compresser ou à transmettre des données compressées par le dispositif. Le dispositif 100 comporte également un moyen de stockage 112 tel que par exemple un disque dur. Il comporte aussi un lecteur de disquette 114. La disquette 116 comme le disque 112 peut contenir des données compressées selon l'invention ainsi que le code de l'invention qui, une fois lu par le dispositif 100, sera stocké dans le disque dur 112. Selon une variante, le programme (Progl ou Prog2) permettant au dispositif de mettre en oeuvre l'invention pourra être stocké en mémoire morte 104 (appelée ROM sur le dessin).
En seconde variante, le programme pourra être reçu pour être stocké de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 120. Le dispositif 100 est relié à un microphone 122. Les données à transmettre selon l'invention seront dans ce cas du signal audio. Ce même dispositif possède un écran 108 permettant de visualiser les données à compresser ou à décompresser ou de servir d'interface avec l'utilisateur qui pourra paramétrer certaines options du format de compression par exemple, à l'aide du clavier 110 ou de tout autre moyen (souris par exemple). L'unité centrale 103 (appelée CPU sur le dessin) va exécuter les instructions relatives à la mise en oeuvre de l'invention, instructions stockées dans la mémoire morte 104 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de compression et/ou de décompression stockés dans une mémoire non volatile, par exemple la ROM 104, sont transférés dans la mémoire vive RAM 106 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention. Bien entendu, les disquettes peuvent être remplacées par tout support d'information tel que CD-ROM ou carte mémoire. De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé de traitement pour le codage ou pour le décodage selon l'invention. Le bus de communication 102 permet la communication entre les différents éléments inclus dans le micro- ordinateur 100 ou reliés à lui. La représentation du bus 102 n'est pas limitative et notamment l'unité centrale 103 est susceptible de communiquer des instructions à tout élément du micro-ordinateur 100 directement ou par l'intermédiaire d'un autre élément du micro-ordinateur 100.
16 Annexe Al Entrée image [0] dans mémoire tampon - Taille mémoire: 1 images Entrée image [1] dans mémoire tampon - Taille mémoire: 2 images 1: niveau n=1 - filtrage de Il avec IO (coté gauche) Entrée image [2] dans mémoire tampon - Taille mémoire: 3 images 2: niveau n=1 - filtrage de Il avec I2 (coté droit) Entrée image [3] dans mémoire tampon - Taille mémoire: 4 images 3: niveau n=1 - filtrage de I3 avec I2 (coté gauche) 4: niveau n=1 - filtrage de I2 avec Il (coté gauche) Sortie image [1] de la mémoire tampon - Taille mémoire: 3 images Entrée image [4] dans mémoire tampon - Taille mémoire: 4 images 5: niveau n=1 - filtrage de I3 avec I4 (coté droit) 6: niveau n=1 - filtrage de I2 avec I3 (coté droit) 7: niveau n=2 - filtrage de I2 avec IO (coté gauche) Entrée image [5] dans mémoire tampon - Taille mémoire: 5 images 8: niveau n=1 filtrage de I5 avec I4 (coté gauche) 9: niveau n=1 - filtrage de I4 avec 13 (coté gauche) Sortie image [3] de la mémoire tampon - Taille mémoire: 4 images 20 Entrée image [6] dans mémoire tampon - Taille mémoire: 5 images 10: niveau n=1 - filtrage de I5 avec I6 (coté droit) 11: niveau n=1 -filtrage de I4 avec I5 (coté droit) 12: niveau n=2 - filtrage de I2 avec 14 (coté droit) Entrée image [7] dans mémoire tampon - Taille mémoire: 6 images 25 13: niveau n=1 - filtrage de I7 avec I6 (coté gauche) 14: niveau n=1 - filtrage de I6 avec I5 (coté gauche) Sortie image [5] de la mémoire tampon - Taille mémoire: 5 images Entrée image [8] dans mémoire tampon -Taille mémoire: 6 images 15: niveau n=1 - filtrage de I7 avec I8 (coté droit) 30 16: niveau n=1 - filtrage de I6 avec I7 (coté droit) 17: niveau n=2 - filtrage de I6 avec I4 (coté gauche) 18: niveau n=2 - filtrage de I4 avec I2 (coté gauche) Sortie image [2] de la mémoire tampon - Taille mémoire: 5 images Entrée image [9] dans mémoire tampon - Taille mémoire: 6 images 35 19: niveau n=1 - filtrage de I9 avec I8 (coté gauche) 20: niveau n=1 - filtrage de 18 avec I7 (coté gauche) Sortie image [7] de la mémoire tampon - Taille mémoire: 5 images Entrée image [10] dans mémoire tampon -Taille mémoire: 6 images 21: niveau n=1 - filtrage de I9 avec I10 (coté droit) 22: niveau n=1 - filtrage de I8 avec I9 (coté droit) 23: niveau n=2 - filtrage de 16 avec I8 (coté droit) 24: niveau n=2 - filtrage de 14 avec I6 (coté droit) 25: niveau n=3 - filtrage de I4 avec IO (coté gauche) Entrée image [11] dans mémoire tampon - Taille mémoire: 7 images 26: niveau n=1 - filtrage de I11 avec I10 (coté gauche) 27: niveau n=1 -filtrage de 110 avec 19 (coté gauche) Sortie image [9] de la mémoire tampon - Taille mémoire: 6 images Entrée image [12] dans mémoire tampon -Taille mémoire: 7 images 28: niveau n=1 - filtrage de 111 avec I12 (coté droit) 29: niveau n=1 - filtrage de 110 avec I11 (coté droit) 30: niveau n=2 - filtrage de 110 avec I 8 (coté gauche) 31: niveau n=2 - filtrage de I8 avec I6 (coté gauche) Sortie image [6] de la mémoire tampon - Taille mémoire: 6 images Entrée image [13] dans mémoire tampon - Taille mémoire: 7 images 32: niveau n=1 - filtrage de 113 avec 112 (coté gauche) 33: niveau n=1 - filtrage de 112 avec I11 (coté gauche) Sortie image [11] de la mémoire tampon - Taille mémoire: 6 images Entrée image [14] dans mémoire tampon - Taille mémoire: 7 images 34: niveau n=1 - filtrage de 113 avec 114 (coté droit) 35: niveau n=1 - filtrage de 112 avec 113 (coté droit) 36: niveau n=2 - filtrage de 110 avec 112 (coté droit) 37: niveau n=2 - filtrage de I 8 avec I10 (coté droit) 38: niveau n=3 - filtrage de 14 avec I 8 (coté droit) Entrée image [15] dans mémoire tampon - Taille mémoire: 8 images 39: niveau n=1 - filtrage de I15 avec I14 (coté gauche) 40: niveau n=1 - filtrage de 114 avec I13 (coté gauche) Sortie image [13] de la mémoire tampon - Taille mémoire: 7 images Entrée image [16] dans mémoire tampon - Taille mémoire: 8 images 41: niveau n=1 - filtrage de I15 avec I16 (coté droit) 42: niveau n=1 - filtrage de I14 avec I15 (coté droit) 43: niveau n=2 - filtrage de I14 avec I12 (coté gauche) 44: niveau n=2 - filtrage de 112 avec I10 (coté gauche) Sortie image [10] de la mémoire tampon - Taille mémoire: 7 images 45: niveau n=1 - filtrage de I16 avec 115 (coté gauche) Sortie image [15] de la mémoire tampon - Taille mémoire: 6 images 46: niveau n=2 - filtrage de I14 avec I16 (coté droit) 47: niveau n=2 - filtrage de 112 avec I14 (coté droit) 48: niveau n=3 -filtrage de I12 avec I 8 (coté gauche) 49: niveau n=3 - filtrage de I8 avec I4 (coté gauche) Sortie image [ 4] de la mémoire tampon - Taille mémoire: 5 images 50: niveau n=2 - filtrage de I16 avec I14 (coté gauche) Sortie image [14] de la mémoire tampon - Taille mémoire: 4 images 51: niveau n=3 - filtrage de I12 avec I16 (coté droit) 52: niveau n=3 -filtrage de I8 avec I12 (coté droit) 53: niveau n=4 - filtrage de I8 avec IO (coté gauche) 54: niveau n=3 - filtrage de I16 avec I12 (coté gauche) Sortie image [12] de la mémoire tampon - Taille mémoire: 3 images 55: niveau n=4 - filtrage de I8 avec I16 (coté droit) Sortie image [0] de la mémoire tampon - Taille mémoire: 2 images 56: niveau n=4 - filtrage de I16 avec 18 (coté gauche) Sortie image [8] de la mémoire tampon - Taille mémoire: 1 images Sortie image [16] de la mémoire tampon - Taille mémoire: 0 images 19 Annexe A2 Entrée image [16] dans mémoire tampon - Taille mémoire: 1 image Entrée image [8] dans mémoire tampon - Taille mémoire: 2 images 1: niveau n=4 - filtrage de I16 avec 18 (coté gauche) Entrée image [0] dans mémoire tampon - Taille mémoire: 3 images 2: niveau n=4 filtrage de I8 avec IO (coté gauche) 3: niveau n=4 - filtrage de I8 avec I16 (coté droit) Entrée image [4] dans mémoire tampon - Taille mémoire: 4 images 4: niveau n=3 - filtrage de I8 avec I4 (coté gauche) 5: niveau n=3 - filtrage de I4 avec IO (coté gauche) Entrée image [12] dans mémoire tampon - Taille mémoire: 5 images 6: niveau n=3 - filtrage de I8 avec I12 (coté droit) 7: niveau n=3 - filtrage de I4 avec I8 (coté droit) Entrée image [2] dans mémoire tampon - Taille mémoire: 6 images 8: niveau n=2 -filtrage de I4 avec I2 (coté gauche) 9: niveau n=2 - filtrage de I2 avec IO (coté gauche) Entrée image [6] dans mémoire tampon - Taille mémoire: 7 images 10: niveau n=2 - filtrage de I4 avec I6 (coté droit) 11: niveau n=2 - filtrage de 12 avec I4 (coté droit) Entrée image [1] dans mémoire tampon - Taille mémoire: 8 images 12: niveau n=1 - filtrage de I2 avec 11 (coté gauche) 13: niveau n=1 - filtrage de Il avec IO (coté gauche) Sortie image [0] de la mémoire tampon - Taille mémoire: 7 images Entrée image [3] dans mémoire tampon - Taille mémoire: 8 images 14: niveau n=1 - filtrage de I2 avec I3 (coté droit) 15: niveau n=1 - filtrage de Il avec I2 (coté droit) Sortie image [1] de la mémoire tampon - Taille mémoire: 7 images 16: niveau n=3 - filtrage de I16 avec I12 (coté gauche) 17: niveau n=3 -filtrage de I12 avec I8 (coté gauche) 18: niveau n=2 - filtrage de I8 avec I6 (coté gauche) 19: niveau n=2 - filtrage de I6 avec I4 (coté gauche) 20: niveau n=1 - filtrage de I4 avec I3 (coté gauche) 21: niveau n=1 -filtrage de I3 avec 12 (coté gauche) Sortie image [2] de la mémoire tampon - Taille mémoire: 6 images Entrée image [5] dans mémoire tampon Taille mémoire: 7 images 22: niveau n=1 - filtrage de I4 avec I5 (coté droit) 23: niveau n=1 - filtrage de 13 avec 14 (coté droit) Sortie image [3] de la mémoire tampon - Taille mémoire: 6 images Entrée image [10] dans mémoire tampon - Taille mémoire: 7 images 24: niveau n=2 - filtrage de I8 avec 110 (coté droit) 25: niveau n=2 - filtrage de I6 avec I8 (coté droit) 26: niveau n=1 - filtrage de I6 avec I5 (coté gauche) 27: niveau n=1 -filtrage de I5 avec I4 (coté gauche) Sortie image [4] de la mémoire tampon - Taille mémoire: 6 images Entrée image [7] dans mémoire tampon Taille mémoire: 7 images 28: niveau n=1 - filtrage de I6 avec I7 (coté droit) 29: niveau n=1 - filtrage de I5 avec I6 (coté droit) Sortie image [5] de la mémoire tampon - Taille mémoire: 6 images 30: niveau n=3 filtrage de 112 avec I16 (coté droit) 31: niveau n=2 - filtrage de I12 avec I10 (coté gauche) 32: niveau n=2 - filtrage de I10 avec I8 (coté gauche) 33: niveau n=1 - filtrage de 18 avec I7 (coté gauche) 34: niveau n=1 - filtrage de I7 avec I6 (coté gauche) Sortie image [6] de la mémoire tampon - Taille mémoire: 5 images Entrée image [9] dans mémoire tampon Taille mémoire: 6 images 35: niveau n=1 - filtrage de I8 avec I9 (coté droit) 36: niveau n=1 - filtrage de 17 avec 18 (coté droit) Sortie image [7] de la mémoire tampon - Taille mémoire: 5 images Entrée image [14] dans mémoire tampon -Taille mémoire: 6 images 37: niveau n=2 - filtrage de 112 avec I14 (coté droit) 38: niveau n=2 - filtrage de I10 avec I12 (coté droit) 39: niveau n=1 - filtrage de I10 avec I9 (coté gauche) 40: niveau n=1 - filtrage de I9 avec I8 (coté gauche) Sortie image [8] de la mémoire tampon - Taille mémoire: 5 images Entrée image [11] dans mémoire tampon Taille mémoire: 6 images 41: niveau n=1 - filtrage de I10 avec Iii (coté droit) 42: niveau n=1 - filtrage de I9 avec I10 (coté droit) Sortie image [9] de la mémoire tampon - Taille mémoire: 5 images 43: niveau n=2 filtrage de 116 avec I14 (coté gauche) 44: niveau n=2 - filtrage de 114 avec I12 (coté gauche) 45: niveau n=1 - filtrage de I12 avec I11 (coté gauche) 46: niveau n=1 -filtrage de I11 avec I10 (coté gauche) Sortie image [10] de la mémoire tampon - Taille mémoire: 4 images Entrée image [13] dans mémoire tampon -Taille mémoire: 5 images 47: niveau n=1 filtrage de 112 avec 113 (coté droit) 48: niveau n=1 - filtrage de I11 avec I12 (coté droit) Sortie image [11] de la mémoire tampon - Taille mémoire: 4 images 49: niveau n=2 -filtrage de 114 avec 116 (coté droit) 50: niveau n=1 - filtrage de 114 avec 113 (coté gauche) 51: niveau n=1 filtrage de 113 avec 112 (coté gauche) Sortie image [12] de la mémoire tampon - Taille mémoire: 3 images Entrée image [15] dans mémoire tampon Taille mémoire: 4 images 52: niveau n=1 - filtrage de I14 avec I15 (coté droit) 53: niveau n=1 -filtrage de 113 avec I14 (coté droit) Sortie image [13] de la mémoire tampon - Taille mémoire: 3 images 54: niveau n=1 filtrage de 116 avec I15 (coté gauche) 55: niveau n=1 - filtrage de 115 avec 114 (coté gauche) Sortie image [14] de la mémoire tampon - Taille mémoire: 2 images 56: niveau n=1 - filtrage de 115 avec 116 (coté droit) Sortie image [15] de la mémoire tampon - Taille mémoire: 1 image Sortie image [16] de la mémoire tampon - Taille mémoire: 0 image15
Claims (20)
1. Procédé de traitement d'une séquence d'images numériques, dans le cadre d'un codage selon un train binaire comportant des images de sortie, compressées, et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé, caractérisé en ce qu'il comporte les étapes suivantes : - obtenir (E1) et mémoriser des images d'origine (E2), et - générer (E3) des images de sortie, par transformation d'images d'origine et/ou d'images intermédiaires, et/ou d'images de sortie, dans un premier ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation des images d'origine en images 15 de sortie, soit minimal.
2. Procédé selon la revendication 1, dans lequel le traitement entremêle simultanément des images de différents niveaux de hiérarchie temporelle.
3. Procédé selon la revendication 2, dans lequel une image de sortie est générée dès que la ou les images du niveau de hiérarchie temporelle inférieur nécessaires à sa génération par transformation sont disponibles. 25
4. Procédé selon l'une des revendications préalables, caractérisé en ce qu'il comprend, après l'étape de génération (E3), une étape de codage (E4) des images de sortie.
5. Procédé selon la revendication 4, dans lequel l'étape de codage 30 (E4) des images de sortie commence avant la fin de l'étape d'obtention (E1) de toutes les images d'origine de la séquence. 20
6. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte en outre une étape d'ordonnancement (E5) des images de sortie selon un second ordre choisi.
7. Procédé selon la revendication 6, dans lequel le second ordre choisi est adapté à minimiser le délai de décodage ultérieur des images.
8. Procédé selon l'une quelconque des revendications précédentes, dans lequel la transformation consiste en des opérations de filtrage de type prédiction temporelle et/ou mises à jour.
9. Procédé de traitement d'une séquence d'images numériques, dans le cadre d'un décodage d'un train binaire comportant des images de sortie compressées et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé selon l'une quelconque des revendications 1 à 8, caractérisé en ce qu'il comprend les étapes suivantes : - décoder (E6) des images de sortie compressées selon ledit format extensible et mémoriser (E7) les images de sortie ainsi décodées, - générer (E8) des images reconstruites de la séquence d'images, par transformation inverse d'images de sortie décodées et/ou d'images intermédiaires, et/ou d'images reconstruites, traitées dans un troisième ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation inverse des images de sortie en images reconstruites soit 25 minimal.
10. Procédé selon la revendication 9, caractérisé en ce qu'il comporte une étape préalable d'ordonnancement des images compressées selon un quatrième ordre choisi. 30
11. Procédé selon la revendication 9 ou la revendication 10, dans lequel la génération d'images reconstruites entremêle simultanément des images de différents niveaux de hiérarchie temporelle.
12. Procédé selon la revendication 11, dans lequel une image reconstruite est générée dès que la ou les images du niveau de hiérarchie temporelle supérieur nécessaires à sa génération par transformation inverse sont disponibles.
13. Procédé selon l'une quelconque des revendications 9 à 12, dans lequel l'étape de génération (E8) des images reconstruites commence avant la fin de l'étape d'obtention (E7) de toutes les images de sortie compressées de la séquence.
14. Procédé selon l'une quelconque des revendications précédentes caractérisé en ce que le train binaire est codé selon le format SVC.
15. Dispositif de traitement d'une séquence d'images numériques, dans le cadre d'un codage selon un train binaire comportant des images de sortie, compressées, et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible prédéterminé, caractérisé en ce qu'il comporte : - des moyens pour obtenir et mémoriser des images d'origine, et - des moyens pour générer des images de sortie, par transformation d'images d'origine et/ou d'images intermédiaires, et/ou d'images de sortie, dans un premier ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation des images d'origine en images de sortie, soit minimal.
16. Dispositif selon la revendication 15, caractérisé en ce qu'il comprend, en outre, des moyens de codage des images de sortie.
17. Dispositif selon l'une des revendications 15 et 16, caractérisé en ce qu'il comporte en outre des moyens d'ordonnancement des images de sortie selon un second ordre choisi.
18. Dispositif de traitement d'une séquence d'images numériques, dans le cadre d'un décodage d'un train binaire comportant des images de sortie compressées, et organisées selon au moins deux niveaux de hiérarchie temporelle conformément à un format extensible selon l'une quelconque des revendications 15 à 17, caractérisé en ce qu'il comprend : - des moyens pour décoder des images de sortie compressées selon ledit format extensible et mémoriser les images de sortie ainsi décodées, - des moyens pour générer des images reconstruites de la séquence d'images, par transformation inverse d'images de sortie décodées et/ou d'images intermédiaires, et/ou d'images reconstruites, traitées dans un troisième ordre choisi de sorte que le nombre d'images à mémoriser, simultanément nécessaire pour la transformation inverse des images de sortie en images reconstruites soit minimal.
19. Support d'informations lisible par un système informatique, éventuellement amovible, totalement ou partiellement, notamment CD-ROM ou support magnétique, tel un disque dur ou une disquette, ou support transmissible, tel un signal électrique ou optique, caractérisé en ce qu'il comporte des instructions d'un programme d'ordinateur permettant la mise en oeuvre d'un procédé selon l'une quelconque des revendications 1 à 14, lorsque ce programme est chargé et exécuté par un système informatique.
20. Programme d'ordinateur stocké sur un support d'informations, ledit programme comportant des instructions permettant la mise en oeuvre d'un procédé selon l'une quelconque des revendications 1 à 14, lorsque ce programme est chargé et exécuté par un système informatique.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0650194A FR2896371B1 (fr) | 2006-01-19 | 2006-01-19 | Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible |
US11/655,804 US8482758B2 (en) | 2006-01-19 | 2007-01-19 | Method and device for processing a sequence of digital images with a scalable format |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0650194A FR2896371B1 (fr) | 2006-01-19 | 2006-01-19 | Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2896371A1 true FR2896371A1 (fr) | 2007-07-20 |
FR2896371B1 FR2896371B1 (fr) | 2008-11-07 |
Family
ID=37309471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0650194A Expired - Fee Related FR2896371B1 (fr) | 2006-01-19 | 2006-01-19 | Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible |
Country Status (2)
Country | Link |
---|---|
US (1) | US8482758B2 (fr) |
FR (1) | FR2896371B1 (fr) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2889004B1 (fr) * | 2005-07-22 | 2007-08-24 | Canon Kk | Procede et dispositif de traitement d'une sequence d'images numeriques a scalabilite spatiale ou en qualite |
FR2895172A1 (fr) * | 2005-12-20 | 2007-06-22 | Canon Kk | Procede et dispositif de codage d'un flux video code suivant un codage hierarchique, flux de donnees, procede et dispositif de decodage associes |
FR2907575B1 (fr) * | 2006-10-18 | 2009-02-13 | Canon Res Ct France Soc Par Ac | Procede et dispositif de codage d'images representant des vues d'une meme scene |
FR2909474B1 (fr) | 2006-12-04 | 2009-05-15 | Canon Kk | Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees |
FR2931025B1 (fr) * | 2008-05-07 | 2010-05-21 | Canon Kk | Procede de determination d'attributs de priorite associes a des conteneurs de donnees, par exemple dans un flux video, procede de codage, programme d'ordinateur et dispositifs associes |
FR2932637B1 (fr) * | 2008-06-17 | 2010-08-20 | Canon Kk | Procede et dispositif de codage d'une sequence d'images |
FR2939593B1 (fr) * | 2008-12-09 | 2010-12-31 | Canon Kk | Procede et dispositif de codage video |
EP2257073A1 (fr) * | 2009-05-25 | 2010-12-01 | Canon Kabushiki Kaisha | Procédé et dispositif pour transmettre des données vidéo |
EP2265026A1 (fr) * | 2009-06-16 | 2010-12-22 | Canon Kabushiki Kaisha | Procédé et dispositif pour débloquer le filtrage de flux vidéo de type SVC pendant le décodage |
EP2285122B1 (fr) * | 2009-07-17 | 2013-11-13 | Canon Kabushiki Kaisha | Procédé et dispositif pour reconstruire une séquence de données vidéo après la transmission dans un réseau |
EP2285112A1 (fr) * | 2009-08-07 | 2011-02-16 | Canon Kabushiki Kaisha | Procédé pour l'envoi de données compressées représentant une image numérique et dispositif correspondant |
FR2951345B1 (fr) | 2009-10-13 | 2013-11-22 | Canon Kk | Procede et dispositif de traitement d'une sequence video |
FR2955995B1 (fr) * | 2010-02-04 | 2012-02-17 | Canon Kk | Procede et dispositif de traitement d'une sequence video |
US9307262B2 (en) * | 2011-01-13 | 2016-04-05 | Texas Instruments Incorporated | Methods and systems for facilitating multimedia data encoding utilizing configured buffer information |
JP5754264B2 (ja) * | 2011-06-24 | 2015-07-29 | 富士ゼロックス株式会社 | プログラム実行装置、画像処理装置およびプログラム |
EP3499886A1 (fr) | 2017-12-18 | 2019-06-19 | Canon Kabushiki Kaisha | Procédé et dispositif de codage de données vidéo |
EP3499885B1 (fr) | 2017-12-18 | 2024-07-17 | Canon Kabushiki Kaisha | Procédé et dispositif de codage de données vidéo |
JP7457503B2 (ja) * | 2019-12-27 | 2024-03-28 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004004355A1 (fr) * | 2002-06-28 | 2004-01-08 | Koninklijke Philips Electronics N.V. | Procede et dispositif de decodage de sous-bandes video |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5418570A (en) * | 1992-03-03 | 1995-05-23 | Kabushiki Kaisha Toshiba | Motion picture coding apparatus |
US6501860B1 (en) | 1998-01-19 | 2002-12-31 | Canon Kabushiki Kaisha | Digital signal coding and decoding based on subbands |
FR2792433A1 (fr) | 1999-04-15 | 2000-10-20 | Canon Kk | Dispositif et procede de transformation de signal numerique |
EP1114555A1 (fr) | 1999-07-20 | 2001-07-11 | Koninklijke Philips Electronics N.V. | Procede de codage destine a la compression d'une sequence video |
US6907075B2 (en) * | 2000-06-30 | 2005-06-14 | Koninklijke Philips Electronics N.V. | Encoding method for the compression of a video sequence |
FR2815748B1 (fr) | 2000-10-20 | 2003-01-24 | Canon Kk | Procede et dispositif de traitement et de decodage d'un signal numerique code |
AUPR110400A0 (en) | 2000-10-30 | 2000-11-23 | Canon Kabushiki Kaisha | Image transfer optimisation |
FR2816154A1 (fr) | 2000-10-31 | 2002-05-03 | Canon Kk | Insertion d'information supplementaire dans des donnees numeriques |
US6907070B2 (en) * | 2000-12-15 | 2005-06-14 | Microsoft Corporation | Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding |
US6898323B2 (en) * | 2001-02-15 | 2005-05-24 | Ricoh Company, Ltd. | Memory usage scheme for performing wavelet processing |
FR2826227B1 (fr) | 2001-06-13 | 2003-11-28 | Canon Kk | Procede et dispositif de traitement d'un signal numerique code |
FR2826823B1 (fr) | 2001-06-27 | 2003-10-10 | Canon Kk | Procede et dispositif de traitement d'un signal numerique code |
FR2831728B1 (fr) | 2001-10-25 | 2004-03-12 | Canon Kk | Procede et dispositif de formation d'un signal numerique derive a partir d'un signal numerique compresse |
CN1606880A (zh) * | 2001-12-20 | 2005-04-13 | 皇家飞利浦电子股份有限公司 | 视频编码和解码方法及设备 |
FR2835366B1 (fr) | 2002-01-29 | 2004-06-18 | Canon Kk | Procede et dispositif de formation d'un signal numerique compresse reduit |
FR2842378B1 (fr) | 2002-07-15 | 2005-02-04 | Canon Kk | Procede et dispositif de traitement d'une requete ou de donnees numeriques compressees |
FR2842691B1 (fr) | 2002-07-18 | 2005-01-14 | Canon Kk | Procede et dispositif de transformation d'un signal numerique |
FR2842983B1 (fr) | 2002-07-24 | 2004-10-15 | Canon Kk | Transcodage de donnees |
KR100597402B1 (ko) * | 2003-12-01 | 2006-07-06 | 삼성전자주식회사 | 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치 |
FR2869442A1 (fr) | 2004-04-23 | 2005-10-28 | Canon Kk | Procede et dispositif de decodage d'une image. |
KR20060059774A (ko) * | 2004-11-29 | 2006-06-02 | 엘지전자 주식회사 | 시간적 분해레벨이 다른 픽처의 모션벡터를 이용하는영상신호의 엔코딩/디코딩 방법 및 장치 |
US7110605B2 (en) * | 2005-02-04 | 2006-09-19 | Dts Az Research, Llc | Digital intermediate (DI) processing and distribution with scalable compression in the post-production of motion pictures |
US8228994B2 (en) * | 2005-05-20 | 2012-07-24 | Microsoft Corporation | Multi-view video coding based on temporal and view decomposition |
FR2886787A1 (fr) * | 2005-06-06 | 2006-12-08 | Thomson Licensing Sa | Procede et dispositif de codage et de decodage d'une sequence d'images |
FR2887711A1 (fr) * | 2005-06-23 | 2006-12-29 | Thomson Licensing Sa | Procede de codage et decodage hierarchique |
FR2889004B1 (fr) | 2005-07-22 | 2007-08-24 | Canon Kk | Procede et dispositif de traitement d'une sequence d'images numeriques a scalabilite spatiale ou en qualite |
FR2903556B1 (fr) | 2006-07-04 | 2008-10-03 | Canon Kk | Procedes et des dispositifs de codage et de decodage d'images, un systeme de telecommunications comportant de tels dispositifs et des programmes d'ordinateur mettant en oeuvre de tels procedes |
FR2906433B1 (fr) | 2006-09-22 | 2009-02-27 | Canon Kk | Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre |
-
2006
- 2006-01-19 FR FR0650194A patent/FR2896371B1/fr not_active Expired - Fee Related
-
2007
- 2007-01-19 US US11/655,804 patent/US8482758B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004004355A1 (fr) * | 2002-06-28 | 2004-01-08 | Koninklijke Philips Electronics N.V. | Procede et dispositif de decodage de sous-bandes video |
Non-Patent Citations (3)
Title |
---|
MRAK M ET AL: "An overview of basic techniques behind scalable video coding", ELECTRONICS IN MARINE, 2004. PROCEEDINGS ELMAR 2004. 46TH INTERNATIONAL SYMPOSIUM ZADAR, CROATIA 16-18 JUNE 2004, PISCATAWAY, NJ, USA,IEEE, 16 June 2004 (2004-06-16), pages 597 - 602, XP010739927, ISBN: 953-7044-02-5 * |
OHM J-R: "Complexity and Delay Analysis of MCTF Interframe Wavelet Structures", ISO/IEC JTC1/SC29/WG11 MPEG02/M8520, July 2002 (2002-07-01), pages 1 - 16, XP002282535 * |
PAU G ET AL: "Delay-performance Trade-offs in Motion-compensated Scalable Subband Video Compression", PROCEEDINGS OF ACIVS: ADVANCED CONCEPTS FOR INTELLIGENT VISION SYSTEMS, XX, XX, September 2004 (2004-09-01), pages 1 - 5, XP002329594 * |
Also Published As
Publication number | Publication date |
---|---|
US20070223033A1 (en) | 2007-09-27 |
US8482758B2 (en) | 2013-07-09 |
FR2896371B1 (fr) | 2008-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2896371A1 (fr) | Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible | |
FR2932637A1 (fr) | Procede et dispositif de codage d'une sequence d'images | |
FR2826823A1 (fr) | Procede et dispositif de traitement d'un signal numerique code | |
EP3490258A1 (fr) | Procédé et support d'enregistrement mémorisant un flux de données d'images codées | |
EP2724536A1 (fr) | Procédé de codage et décodage d'images, dispositif de codage et décodage et programmes d'ordinateur correspondants | |
FR2909474A1 (fr) | Procede et dispositif de codage d'images numeriques et procede et dispositif de decodage d'images numeriques codees | |
WO2015059400A1 (fr) | Procédé de codage et de décodage d'images, dispositif de codage et de décodage d'images et programmes d'ordinateur correspondants | |
EP3075155B1 (fr) | Procédé de codage et de décodage d'images, dispositif de codage et de décodage d'images et programmes d'ordinateur correspondants | |
FR2886787A1 (fr) | Procede et dispositif de codage et de decodage d'une sequence d'images | |
EP3198876B1 (fr) | Génération et codage d'images intégrales résiduelles | |
EP2633686B1 (fr) | Codage video echelonnable a partir d'un epitome hierarchique | |
FR2955995A1 (fr) | Procede et dispositif de traitement d'une sequence video | |
WO2012001257A1 (fr) | Procedes et dispositifs de codage et de decodage d'au moins une image mettant en oeuvre une estimation dans le domaine transforme, signal et programme d'ordinateur correspondants | |
WO2014049224A1 (fr) | Procédé de codage et décodage d'images, dispositif de codage et décodage et programmes d'ordinateur correspondants | |
FR2872972A1 (fr) | Procede et dispositif de transmission video entre un serveur et un client | |
FR2927758A1 (fr) | Procede et dispositif de codage-decodage d'images video successives selon un flux video principal en pleine resolution et selon un flux video secondaire en qualite reduite | |
EP1952630A1 (fr) | Systeme de transmission d'images de dynamique elevee, unites et procedes de codage et de decodage pour ce systeme | |
FR2956789A1 (fr) | Procede et dispositif de traitement d'une sequence video | |
FR2927745A1 (fr) | Procede et dispositif de codage d'un signal numerique. | |
FR3042368A1 (fr) | Procede de codage et de decodage multi-vues, dispositif de codage et de decodage multi-vues et programmes d'ordinateur correspondants | |
WO2012056147A1 (fr) | Codage et décodage vidéo a partir d'un épitome | |
WO2024121109A1 (fr) | Procédé et dispositif de codage et décodage d'images | |
FR3033115A1 (fr) | Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants | |
WO2024121110A1 (fr) | Procédé et dispositif de codage et décodage de séquences d'images | |
FR2956552A1 (fr) | Procede de codage ou de decodage d'une sequence video, dispositifs associes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ST | Notification of lapse |
Effective date: 20140930 |