FR2843252A1 - Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes - Google Patents

Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes Download PDF

Info

Publication number
FR2843252A1
FR2843252A1 FR0209639A FR0209639A FR2843252A1 FR 2843252 A1 FR2843252 A1 FR 2843252A1 FR 0209639 A FR0209639 A FR 0209639A FR 0209639 A FR0209639 A FR 0209639A FR 2843252 A1 FR2843252 A1 FR 2843252A1
Authority
FR
France
Prior art keywords
sprite
coding
data
sequence
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0209639A
Other languages
English (en)
Inventor
Edouard Francois
Dominique Thoreau
Jean Kypreos
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority to FR0209639A priority Critical patent/FR2843252A1/fr
Priority to US10/522,521 priority patent/US20060093030A1/en
Priority to CNB03818155XA priority patent/CN100499811C/zh
Priority to EP03766406A priority patent/EP1535472A1/fr
Priority to MXPA05001204A priority patent/MXPA05001204A/es
Priority to PCT/EP2003/050331 priority patent/WO2004014081A1/fr
Priority to JP2004525425A priority patent/JP4729304B2/ja
Priority to AU2003262536A priority patent/AU2003262536A1/en
Priority to KR1020057001595A priority patent/KR20050030641A/ko
Publication of FR2843252A1 publication Critical patent/FR2843252A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Le procédé est caractérisé en ce qu'il comporte les étapes suivantes :- une segmentation (1) de la séquence en plans alternés vidéo,- une classification (2) de ces plans en fonction de points de vue pour obtenir des classes,- une construction d'un sprite (3) ou plan objet video pour une classe qui est une image correspondant à l'arrière plan relatif à cette classe,- un regroupement (5) d'au moins deux sprites sur un même sprite ou plan objet vidéo pour former une image appelée grand sprite,- une extraction (4), pour les plans correspondant au grand sprite, d'objets d'avant-plan d'images de la séquence relatives à ces plans,- un codage séparé du grand sprite et des objets d'avant-plan extraits.Application à la transmission et au stockage de données vidéo.

Description

L'invention concerne un procédé de compression de données numériques d'une
séquence vidéo composée de plans alternés, à partir de "sprites", et un dispositif pour sa mise en oeuvre. Elle se situe dans le contexte général de la compression vidéo, en particulier dans celui de la
norme MPEG-4 vidéo.
Le terme "sprite" est défini par exemple dans la norme MPEG 4. Il s'agit d'un objet vidéo (VOP, acronyme de l'anglais Video Object Plane), généralement de dimension supérieure à la vidéo affichée, et persistant avec le temps. Il est utilisé pour représenter des zones plus ou moins statiques, telles que des arrières-plans. Il est codé à partir d'un découpage par macroblocs. Par la transmission d'un sprite représentant l'arrière-plan panoramique et par le codage des paramètres de mouvement décrivant le mouvement de la caméra, paramètres représentant par exemple la transformée affine du sprite, il est possible de reconstruire des images
consécutives d'une séquence à partir de ce sprite unique.
L'invention concerne en particulier les séquences vidéo comprenant une succession de plans générés de façon alternative à partir de points de vue similaires. Il peut par exemple s'agir d'une séquence d'interview, o l'on voit de façon alternative l'interviewer et l'interviewé, chacun sur un arrière-plan différent mais en grande partie statique. Cette alternance n'est pas limitée à deux points de vue différents. La séquence
peut être composée de N plans, issus de Q points de vue différents.
Les codages de type classique ne prennent pas en compte ce type de séquence et le cot de codage ou le taux de compression est donc équivalent à celui d'autres séquences. L'approche classique consiste en effet, en chaque début de plan, à coder une image en mode intra, à laquelle succèdent des images en mode prédictif. Si un plan issu d'un premier point de vue apparaît une première fois, suivi d'un plan issu d'un autre point de vue, suivi d'un plan issu du premier point de vue, la première image de ce plan est codée intégralement en mode intra même si une grande partie, constituée de l'arrière-plan de la scène filmée, est similaire aux images du
premier plan. Ceci induit un cot de codage important.
Une solution connue à ce problème de ré-encodage d'un arrière-plan déjà apparu antérieurement consiste à mémoriser, à chaque détection de changement de plan, la dernière image d'un plan. Au début d'un nouveau plan, la première image est codée par prédiction temporelle ayant pour référence, parmi les images mémorisées, celle qui lui ressemble le plus et qui correspond donc à un même point de vue. Une telle solution peut être considérée comme s'inspirant directement d'un outil connu sous le nom anglais de "multi-frame referencing", disponible par exemple dans le standard MPEG-4 partie 10 en cours de développement. Une telle solution est cependant consommatrice en mémoire, difficile de mise en oeuvre et coteuse. L'invention a pour but de pallier les inconvénients précités. Elle a pour objet un procédé de compression de données numériques d'une séquence vidéo, caractérisé en ce qu'il comporte les étapes suivantes: une segmentation de la séquence en plans alternés vidéo, - une classification de ces plans en fonction de points de vue pour obtenir des classes, - une construction d'un sprite ou plan objet video pour une classe qui est une image composée correspondant à l'arrière plan relatif à cette classe, - un regroupement d'au moins deux sprites sur un même sprite ou plan objet vidéo pour former une image appelée grand sprite, - une extraction, pour les plans correspondant au grand sprite, d'objets d'avant-plan d'images de la séquence relatives à ces plans, - un codage séparé du grand sprite et des objets d'avant-plan extraits. Selon une mise en oeuvre particulière, les sprites sont placés
l'un sous l'autre pour construire le grand sprite.
Selon une mise en oeuvre particulière, le positionnement des
sprites est calculé en fonction du cot de codage du grand sprite.
Le codage exploité est par exemple le codage MPEG-4, le grand sprite étant alors codé conformément aux sprites définis dans la norme
MPEG-4.
Selon une mise en oeuvre particulière, le procédé réalise une opération de multiplexage (8) des données relatives aux objets d'avant-plan extraits et des données relatives au grand sprite pour fournir un flux de données. L'invention concerne également le flux de données comprimées pour le codage d'une séquence d'images selon le procédé précédemment décrit, caractérisé en ce qu'il comporte des données de codage du grand sprite associées à des paramètres de déformation applicables au grand
sprite et des données de codage des objets d'avant-plan extraits.
L'invention concerne également un codeur pour le codage des données selon le procédé précédemment décrit, caractérisé en ce qu'il comporte un circuit de traitement pour la classification des séquence en plans, la construction d'un sprite pour chaque classe et la composition d'un grand sprite par concaténation de ces sprites, un circuit d'extraction d'objets d'avant-plan d'images de la séquence relatives au grand sprite et un circuit
de codage pour le codage du grand sprite et des objets d'avant-plan extraits.
L'invention concerne également un décodeur pour le décodage de données vidéo d'une séquence vidéo comportant des plans alternés selon le procédé précédemment décrit, caractérisé en ce qu'il comporte un circuit de décodage de données relatives à un grand sprite et de données relatives à des objets d'avant-plan et un circuit de construction d'images à partir des
données décodées.
Le sprite est utilisé pour décrire l'arrière-plan de l'ensemble des
plans vidéo issus d'un même point de vue. Ce sprite est codé une seule fois.
Ensuite, pour chaque image de ces plans vidéo, le processus consiste à coder les paramètres de déformation à appliquer au sprite pour reconstruire ce qui est perçu de l'arrière-plan dans l'image. Les objets de premier-plan sont, quant à eux, codés comme des objets vidéo ou VOPs (Video Object Plan) non rectangulaires. Au décodage, ces VOPs sont composés avec l'image de l'arrière-plan pour obtenir l'image finale. Comme la séquence comporte des plans issus de plusieurs points de vue, plusieurs sprites sont nécessaires. Une mise en oeuvre particulière de l'invention consiste à concaténer ces différents sprites en un seul grand sprite qui résume alors les
différents arrière-plans de la séquence vidéo complète.
Grâce à l'invention, le ré-encodage de l'arrière-plan, à chaque réapparition de cet arrière-plan, est évité. Le cot de compression de ce type de séquences vidéo est réduit par rapport à un schéma de codage classique
de type MPEG-2 ou H.263.
D'autres particularités et avantages apparaîtront clairement
dans la description suivante donnée à titre d'exemple non limitatif, et faite en
regard des figures annexées qui représentent: - la figure 1, un organigramme d'un procédé de codage selon l'invention,
- la figure 2, l'intégration d'un sprite dans un grand sprite.
- la figure 3, des blocs d'un sprite en bordure haute et basse d'un grand sprite, - la figure 4, un bloc courant dans son environnement pour le
codage par prédiction DC/AC.
La figure 1 représente un organigramme simplifié d'un procédé de codage selon l'invention. Ce procédé se scinde en deux phases
principales: une phase d'analyse et une phase de codage.
La phase d'analyse comprend une première étape 1 qui est une étape de segmentation de la séquence vidéo en plans. Une deuxième étape
2 réalise une classification des plans selon le point de vue dont ils sont issus.
Une classe est définie comme un sous-ensemble de plans issus d'un même point de vue. La troisième étape effectue la construction d'un sprite "résumant" l'arrière-plan visible dans les plans du sous-ensemble, ceci pour chacun des sous-ensembles. Pour chaque image de chaque plan du sous25 ensemble, des paramètres de déformation, permettant de reconstruire à partir du sprite ce qui est perçu de l'arrière-plan, sont aussi calculés. Une étape de segmentation d'image 4 effectue une segmentation pour chaque image des différents plans, segmentation dans le but de distinguer l'arrièreplan de l'avant-plan. Cette étape permet d'extraire des objets d'avant-plan de chaque image. L'étape 5 est effectuée parallèlement à l'étape 4 et succède donc à l'étape 3. Elle consiste en une concaténation des différents sprites en un seul grand sprite, avec mise à jour des paramètres de déformation
prenant en compte la position de chaque sprite dans le grand sprite.
La phase de codage succède à la phase d'analyse. Les étapes 6 et 7 succèdent respectivement aux étapes 4 et 5 et génèrent respectivement un train binaire vidéo codant l'avant-plan et un train binaire vidéo codant le grand sprite. Ces trains binaires sont ensuite multiplexés à
l'étape 8 pour fournir le train de codage vidéo.
L'étape 1 de segmentation en plans effectue une découpe de la séquence en plans vidéo en comparant les images successives, par exemple en exploitant un algorithme de détection de changement de plans. L'étape 2 de classification compare les différents plans obtenus, à partir de leur contenu, et regroupe dans une même classe les plans similaires, c'est à dire
issus d'un point de vue identique ou proche.
L'étape 4 réalise une extraction des objets d'avant-plan. Des masques binaires successifs sont calculés distinguant, pour chaque image de la séquence vidéo, l'arrière-plan de l'avant-plan. A l'issue de cette étape 4, on dispose donc, pour chaque plan, d'une succession de masques, binaires ou non, indiquant les parties de l'avant-plan et de l'arrièreplan. Dans le cas d'un traitement non binaire, le masque correspond en fait à une carte
de transparence.
La concaténation des sprites en un grand sprite effectuée à l'étape 5 peut être réalisée de manière à minimiser le cot de codage de ce grand sprite comme proposé ci-dessous. Les informations de codage sont,
entre autres, les informations de texture et les informations de déformation.
Ces dernières informations sont par exemple les paramètres de déformation successifs qui sont applicables sur le grand sprite, en fonction du temps, et qui sont mises à jour lors de la génération du grand sprite. Ce sont en effet ces paramètres de transformation qui, appliqués au grand sprite, permettront de construire et mettre à jour les fonds nécessaires aux différents plans. Ces 25 informations de codage sont transmises à l'étape 7 pour permettre la
génération du train binaire grand sprite.
Dans notre réalisation, deux trains binaires sont générés, l'un codant le grand sprite et l'autre codant l'ensemble des objets de l'avant-plan regroupés en un seul objet. Ces trains binaires sont ensuite multiplexés à l'étape 8. Dans la norme MPEG-4, un flux élémentaire est généré par objet. Il est donc tout aussi envisageable de transmettre plusieurs flux élémentaires ou de ne pas effectuer de multiplexage avec le flux relatif au grand sprite
pour la transmission des données codées.
On remarquera que l'étape 4 d'extraction des objets est en fait très corrélée à l'étape précédente de construction d'un sprite, aussi peut-elle
être effectuée simultanément, voire même antérieurement, à la précédente.
Egalement, les opérations aux étapes 5 et 7 qui sont décrites en parallèle des opérations aux étapes 4 et 6, peuvent être effectuées successivement ou antérieurement à ces étapes 4 et 6. D'autre part, certaines étapes d'analyse, par exemple celle d'extraction des objets, peuvent être évitées
dans le cas ou l'on dispose d'une description de contenu de type MPEG-7 du
document vidéo à coder.
Comme indiqué précédemment, la concaténation peut se faire en cherchant à minimiser le cot de codage du grand sprite. Cela peut porter sur trois points: la texture, la forme, si elle existe, les paramètres de déformation successifs. Cependant le critère prépondérant est le cot de
codage de la texture.
Une méthode de minimisation de ce cot est donnée ci-après dans un mode de réalisation exploitant la norme MPEG-4 et effectuant un assemblage des sprites de manière simple, c'est à dire en les superposant horizontalement, méthode qui s'appuie sur le fonctionnement de l'outil de prédiction spatiale DC/AC de MPEG-4. Dans le cadre de la norme MPEG-4, la prédiction spatiale se fait horizontalement ou verticalement. Elle porte de façon systématique sur le premier coefficient DCT de chaque bloc (mode "DC prédiction" en anglais dans la norme) et peut aussi, de manière optionnelle, porter sur les autres coefficients DCT de la première ligne ou première colonne de chaque bloc (mode "AC prédiction"). Il s'agit de déterminer la position optimale de concaténation, c'est à dire de rechercher le minimum de cot de codage de la texture par un assemblage de sprites
voisins présentant sur leurs bords mutuels une continuité de texture.
Le grand sprite est initialisé par le sprite le plus large. Ensuite, un nouveau grand sprite est calculé intégrant le sprite le plus large parmi les sprites restants, c'est à dire le deuxième sprite le plus large. La figure 2 représente un grand sprite 9 et un deuxième grand sprite 10 à intégrer pour obtenir le nouveau grand sprite, c'est à dire à positionner par rapport au
sprite 9.
La figure 3 représente le sprite 10 de forme rectangulaire et plus particulièrement la succession de macroblocs 11 en bordure haute et la succession de macroblocs 12 en bordure basse du sprite. Les macroblocs du sprite pris en compte sont les macroblocs non vides adjacents de la bordure haute lorsque le sprite est placé sous le grand sprite puis de la bordure basse lorsque le sprite est placé au dessus du grand sprite. Dans le cas o le sprite n'est pas rectangulaire, seuls les macroblocs non vides en bordure haute et basse du rectangle englobant ce sprite sont pris en compte. Les
macroblocs vides sont ignorés.
Une transformation cosinus discrète DCT est effectuée sur les macroblocs pris en compte (ou blocs luminance des macroblocs), c'est à dire les macroblocs ou blocs non vides en bordure haute et basse des différents sprites. Les positions haute et basse optimales sont ensuite calculées en minimisant un critère de continuité des textures à la frontière des deux sprites. Pour une position donnée (X,Y) du sprite 10 à intégrer dans le grand sprite 9 précédemment calculé, position définie par des coordonnées (X,Y), une mesure d'un critère global C(X,Y) est calculée. Les positions (X,Y) sont par exemple les coordonnées du coin inférieur gauche du sprite supérieur à intégrer ou les coordonnées du coin supérieur gauche du sprite inférieur à intégrer, l'origine étant définie à partir d'un point prédéterminé du grand sprite. Les coordonnées (X,Y) sont limitées dans la mesure o l'on
n'autorise pas le sprite à déborder du grand sprite.
Pour cette position donnée (X,Y) et pour toutes les positions testées, on va avoir N blocs voisins avec le grand sprite, soit situés au20 dessus, soit en-dessous. De ces 2 lignes de blocs voisins, c'est à dire celle appartenant au grand sprite et celle appartenant au sprite à intégrer, on considère la ligne des N blocs du dessous. Pour chaque bloc Bk de ces N blocs, on détermine d'abord quelle sera la direction probable de la prédiction
DC/AC.
La figure 4 représente un bloc courant et les blocs environnants, bloc A à sa gauche, bloc B au dessus de A et bloc C au dessus du bloc courant. Comme le fait un outil de prédiction spatiale DC/AC classique, on détermine les gradients des coefficients DC entre les blocs A et B, | DCADCB |, et entre les blocs C et B, | DCc-DCB |. S'il n'y a pas de bloc
voisin A, B ou C, le coefficient DC est pris par défaut égal à 1024.
- Si | DCA-DCB | < | DCc-DCB |, la prédiction DC/AC s'effectuera probablement dans le sens vertical. On va donc déterminer pour le bloc courant le résidu de sa première ligne correspondant à la prédiction verticale à partir de la première ligne du bloc du dessus C. - Si | DCADCB I 2 | DCc-DCB |, la prédiction DC/AC s'effectuera probablement dans le sens horizontal. On va donc déterminer pour le bloc courant le résidu de sa première colonne correspondant à la prédiction horizontale à partir de la première colonne du bloc de gauche A. On calcule ensuite l'énergie des coefficients AC résiduels, c'est à dire avec prédiction, de la première ligne ou première colonne, selon la direction de prédiction probable: EAU pred (AACJ2 î=1 AACi correspondant au résidu, c'est à dire à la différence entre les 7 coefficients AC de la première ligne ou première colonne du bloc courant et les 7 coefficients AC de la première ligne ou colonne
respectivement du bloc supérieur ou du bloc à gauche du bloc courant.
On calcule également l'énergie des coefficients AC bruts, c'està-dire avant prédiction:
EAU. _I,,,, = XC^2
i=l ACG correspondant aux 7 coefficients AC de la première ligne ou
première colonne du bloc courant.
On cherche à déterminer la position, pour un bloc courant, qui permet d'avoir la plus faible énergie. L'énergie, pour la partie qui varie en fonction de la position du bloc, dépend de ADC et éventuellement des AAC s'il y a prédiction. Elle est égale à: - lorsqu'il y a prédiction DC/AC, c'est à dire si EAC pred < EACbrut,: E(B k)=ADC2 + E(AAC)2 i=l
-lorsqu'il n'y a pas prédiction DCIAC, c'est à dire si EACpred > EAC_brut, .
E(Bk) = ADC2 Le calcul est effectué pour chacun des blocs N de la ligne et le critère C, pour une position donnée, est alors égal à: N C(X, Y) = LE(Bk) k =I La position optimale (XptY0pt) est celle qui minimise C(X,Y) sur
l'ensemble des positions testées.
Une fois déterminé le sprite à intégrer et sa position dans le grand sprite, les paramètres de déformation du sprite à intégrer sont mis à jour. Pour ce faire, il est ajouté à la composante translationnelle de ses paramètres de déformation, les coordonnées (XptYopt) du point à partir duquel le nouveau sprite est intégré dans le grand sprite. Dans le cas d'un modèle affine, on a 6 paramètres de déformation (a,b,c,d,e,f), dont 2, a et b,
caractérisent la composante translationnelle ou constante de la déformation.
Il faut donc transformer a en a+X0pt, et b en b+Yopt. Les nouveaux paramètres de déformation sont insérés dans la liste des paramètres de déformation du grand sprite, à l'endroit o
temporellement le plan correspondant s'insère dans la séquence vidéo.
Une fois la concaténation terminée, on dispose - d'un grand sprite au lieu de plusieurs sprites - d'une seule liste de paramètres de déformation, au lieu de plusieurs listes correspondant aux différents plans de la séquence
vidéo.
Les paramètres de déformation successifs permettent de reconstruire, pour chaque image de la séquence vidéo, ce qui est perçu de
l'arrière-plan à partir du grand sprite.
Le codage peut être effectué en réalisant une passe de préanalyse de la séquence vidéo suivie d'une passe de codage s'appuyant sur
cette analyse.
Dans le cas spécifique de la norme MPEG-4, le codage 25 consiste à générer un train binaire en utilisant l'outil de codage sprite (cf. partie 7.8 du document ISO/IEC JTC 1/SC 29/WG 11 N 2502, p.189 à 195).
Le second train binaire se base sur les outils de codage d'objets non rectangulaires, en particulier l'outil de codage de la forme binaire (cf. partie 7.5 du document ISO/IEC JTC 1/SC 29/WG 11 N 2502, p.147 à 158), et éventuellement en plus l'outil de codage de la transparence (" grey shape " en anglais, cf. partie 7.5.4 du document ISO/IEC JTC 1/SC 29NVG 11 N
2502, p.160 à 162) si les masques ne sont pas binaires.
L'invention concerne également les flux de données comprimées résultant du codage d'une séquence d'images selon le procédé précédemment décrit. Ce flux comporte des données de codage du grand sprite associées à des paramètres de déformation applicables au grand sprite et des données de codage des objets des avant-plans pour la
reconstruction des scènes.
L'invention concerne également les codeurs et décodeurs exploitant un tel procédé. Il s'agit par exemple d'un codeur comportant un circuit de traitement pour la classification des séquence en plans, la construction d'un sprite pour chaque classe et la composition d'un grand sprite par concaténation de ces sprites. Il s'agit aussi d'un décodeur comportant un circuit de construction d'images de plans alternés d'une séquence vidéo à partir du décodage de grands sprites et d'objets d'avant plans. Les applications de l'invention concernent la transmission et le stockage d'images numériques utilisant des normes de codage vidéo avec
exploitation de sprites, en particulier la norme MPEG4.
il

Claims (6)

REVENDICATIONS
1 Procédé de compression de données numériques d'une séquence vidéo, caractérisé en ce qu'il comporte les étapes suivantes - une segmentation (1) de la séquence en plans alternés vidéo, - une classification (2) de ces plans en fonction de points de vue pour obtenir des classes, - une construction d'un sprite (3) ou plan objet video pour une classe qui est une image composée correspondant à l'arrière plan relatif à cette classe, - un regroupement (5) d'au moins deux sprites sur un même sprite ou plan objet vidéo, pour former une image appelée grand sprite, - une extraction (4), pour les plans correspondant au grand sprite, d'objets d'avant-plan d'images de la séquence relatives à ces plans, - un codage séparé du grand sprite et des objets d'avant-plan extraits. 2 Procédé selon la revendication 1, caractérisé en ce que les
sprites sont placés l'un sous l'autre (5) pour construire le grand sprite.
3 Procédé selon la revendication 2, caractérisé en ce que le positionnement des sprites est calculé en fonction du cot de codage du
grand sprite.
4 Procédé selon la revendication 1, caractérisé en ce que le
grand sprite est un sprite tel que défini et codé dans la norme MPEG4.
Procédé selon la revendication 1, caractérisé en ce qu'il réalise une opération de multiplexage (8) des données relatives aux objets d'avantplan extraits et des données relatives au grand sprite pour fournir un
flux de données.
6 Flux de données comprimées pour le codage d'une séquence d'images selon le procédé de la revendication 1, caractérisé en ce qu'il comporte des données de codage du grand sprite associées à des paramètres de déformation applicables au grand sprite et des données de
codage des objets d'avant-plan extraits.
7 Codeur pour le codage des données selon le procédé de la revendication 1, caractérisé en ce qu'il comporte un circuit de traitement pour la classification des séquence en plans, la construction d'un sprite pour chaque classe et la composition d'un grand sprite par concaténation de ces sprites, un circuit d'extraction d'objets d'avant-plan d'images de la séquence relatives au grand sprite et un circuit de codage pour le codage du grand
sprite et des objets d'avant-plan extraits.
8 Décodeur pour le décodage de données vidéo d'une séquence vidéo comportant des plans alternés selon le procédé de la revendication 1, caractérisé en ce qu'il comporte un circuit de décodage de données relatives à un grand sprite et de données relatives à des objets d'avantplan et un circuit de construction d'images à partir des données décodées.
FR0209639A 2002-07-30 2002-07-30 Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes Pending FR2843252A1 (fr)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FR0209639A FR2843252A1 (fr) 2002-07-30 2002-07-30 Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes
US10/522,521 US20060093030A1 (en) 2002-07-30 2003-07-23 Method for compressing digital data of a video sequence comprising alternated shots
CNB03818155XA CN100499811C (zh) 2002-07-30 2003-07-23 压缩包括交替镜头的视频序列的数字数据的方法
EP03766406A EP1535472A1 (fr) 2002-07-30 2003-07-23 Procede de compression de donnees numeriques d une sequence video comportant des plans alternes
MXPA05001204A MXPA05001204A (es) 2002-07-30 2003-07-23 Metodo para comprimir datos digitales de una secuencia de video que comprende planos alternados.
PCT/EP2003/050331 WO2004014081A1 (fr) 2002-07-30 2003-07-23 Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes
JP2004525425A JP4729304B2 (ja) 2002-07-30 2003-07-23 交互に入れ替わるビデオショットからなるビデオシーケンスのデジタルデータを圧縮する方法
AU2003262536A AU2003262536A1 (en) 2002-07-30 2003-07-23 Method for compressing digital data of a video sequence comprising alternated shots
KR1020057001595A KR20050030641A (ko) 2002-07-30 2003-07-23 교대되는 샷을 포함하는 비디오 시퀀스의 디지털 데이터를압축하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0209639A FR2843252A1 (fr) 2002-07-30 2002-07-30 Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes

Publications (1)

Publication Number Publication Date
FR2843252A1 true FR2843252A1 (fr) 2004-02-06

Family

ID=30129520

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0209639A Pending FR2843252A1 (fr) 2002-07-30 2002-07-30 Procede de compression de donnees numeriques d'une sequence video comportant des plans alternes

Country Status (9)

Country Link
US (1) US20060093030A1 (fr)
EP (1) EP1535472A1 (fr)
JP (1) JP4729304B2 (fr)
KR (1) KR20050030641A (fr)
CN (1) CN100499811C (fr)
AU (1) AU2003262536A1 (fr)
FR (1) FR2843252A1 (fr)
MX (1) MXPA05001204A (fr)
WO (1) WO2004014081A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1832114A1 (fr) * 2004-12-14 2007-09-12 LG Electronics, Inc. Procede de codage et de decodage d'une image

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9058402B2 (en) 2012-05-29 2015-06-16 Limelight Networks, Inc. Chronological-progression access prioritization
US8495171B1 (en) 2012-05-29 2013-07-23 Limelight Networks, Inc. Indiscriminate virtual containers for prioritized content-object distribution
US20110029899A1 (en) * 2009-08-03 2011-02-03 FasterWeb, Ltd. Systems and Methods for Acceleration and Optimization of Web Pages Access by Changing the Order of Resource Loading
US8346784B1 (en) 2012-05-29 2013-01-01 Limelight Networks, Inc. Java script reductor
US9015348B2 (en) 2013-07-19 2015-04-21 Limelight Networks, Inc. Dynamically selecting between acceleration techniques based on content request attributes
EP3016066A1 (fr) 2014-10-30 2016-05-04 Thomson Licensing Procédé de traitement d'une séquence vidéo, dispositif correspondant, programme informatique et support lisible par ordinateur non transitoire

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998002844A1 (fr) * 1996-07-17 1998-01-22 Sarnoff Corporation Procede et dispositif pour realisation d'images en mosaique
WO2000008858A1 (fr) * 1998-08-05 2000-02-17 Koninklijke Philips Electronics N.V. Procede et dispositif de generation d'image statique

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1042736B1 (fr) * 1996-12-30 2003-09-24 Sharp Kabushiki Kaisha Systeme de codage video oriente images-objets
JP4272771B2 (ja) * 1998-10-09 2009-06-03 キヤノン株式会社 画像処理装置、画像処理方法及びコンピュータ読み取り可能な記憶媒体
JP4224748B2 (ja) * 1999-09-13 2009-02-18 ソニー株式会社 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、記録媒体、並びに画像処理装置
US6738424B1 (en) * 1999-12-27 2004-05-18 Objectvideo, Inc. Scene model generation from video for use in video processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998002844A1 (fr) * 1996-07-17 1998-01-22 Sarnoff Corporation Procede et dispositif pour realisation d'images en mosaique
WO2000008858A1 (fr) * 1998-08-05 2000-02-17 Koninklijke Philips Electronics N.V. Procede et dispositif de generation d'image statique

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GRAMMALIDIS N ET AL: "Sprite generation and coding in multiview image sequences", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, MARCH 2000, IEEE, USA, vol. 10, no. 2, pages 302 - 311, XP002242024, ISSN: 1051-8215 *
OHM J -R ET AL: "Incomplete 3D for multiview representation and synthesis of video objects", MULTIMEDIA APPLICATIONS, SERVICES AND TECHNIQUES - ECMAST'98. THIRD EUROPEAN CONFERENCE. PROCEEDINGS, MULTIMEDIA APPLICATIONS, SERVICES AND TECHNIQUES - ECMAST '98 THIRD EUROPEAN CONFERENCE PROCEEDINGS, BERLIN, GERMANY, 26-28 MAY 1998, 1998, Berlin, Germany, Springer-Verlag, Germany, pages 26 - 41, XP002242025, ISBN: 3-540-64594-2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1832114A1 (fr) * 2004-12-14 2007-09-12 LG Electronics, Inc. Procede de codage et de decodage d'une image
EP1832114A4 (fr) * 2004-12-14 2010-10-20 Lg Electronics Inc Procede de codage et de decodage d'une image

Also Published As

Publication number Publication date
CN1672420A (zh) 2005-09-21
MXPA05001204A (es) 2005-05-16
CN100499811C (zh) 2009-06-10
US20060093030A1 (en) 2006-05-04
AU2003262536A1 (en) 2004-02-23
EP1535472A1 (fr) 2005-06-01
WO2004014081A1 (fr) 2004-02-12
KR20050030641A (ko) 2005-03-30
JP4729304B2 (ja) 2011-07-20
JP2005535194A (ja) 2005-11-17

Similar Documents

Publication Publication Date Title
Liu et al. Image compression with edge-based inpainting
US6249613B1 (en) Mosaic generation and sprite-based coding with automatic foreground and background separation
US6597738B1 (en) Motion descriptor generating apparatus by using accumulated motion histogram and a method therefor
US6735253B1 (en) Methods and architecture for indexing and editing compressed video over the world wide web
US20060039617A1 (en) Method and assembly for video encoding, the video encoding including texture analysis and texture synthesis, and corresponding computer program and corresponding computer-readable storage medium
Liu et al. Three-dimensional point-cloud plus patches: Towards model-based image coding in the cloud
TW200401569A (en) Method and apparatus for motion estimation between video frames
Ndjiki-Nya et al. Improved H. 264/AVC coding using texture analysis and synthesis
JP2001526859A (ja) ワールドワイドウェブ上の圧縮映像の指示及び編集方法及びアーキテクチュア
CN103069802A (zh) 重构图像的当前块的方法和对应的编码方法、对应的装置以及承载在比特流中编码的图像的存储介质
Fernando et al. A unified approach to scene change detection in uncompressed and compressed video
FR2941581A1 (fr) Codage et decodage d&#39;une sequence d&#39;images video par zones d&#39;images
EP2446630A1 (fr) Codage et décodage d&#39;une séquence d&#39;images vidéo par zones d&#39;image
FR2843252A1 (fr) Procede de compression de donnees numeriques d&#39;une sequence video comportant des plans alternes
KR20060048735A (ko) 비디오 압축용 장치 및 프로세스
WO2013163197A1 (fr) Partitionnement de macrobloc et estimation de mouvement à l&#39;aide d&#39;une analyse d&#39;objets pour une compression vidéo
Ndjiki-Nya et al. Perception-oriented video coding based on texture analysis and synthesis
JPH1032830A (ja) 画像情報の再符号化方法及び装置
JPH1032829A (ja) 画像情報の再符号化方法及び装置
CN102244826A (zh) 一种基于视频内容的视频水印方法和系统
Lyu et al. Apron surveillance video coding based on compositing virtual reference frame with object library
Krutz et al. Content-adaptive video coding combining object-based coding and h. 264/avc
JP4662169B2 (ja) プログラム、検出方法、及び検出装置
Krutz et al. Automatic object segmentation algorithms for sprite coding using MPEG-4
KR20060127022A (ko) 코딩 방법 및 대응하는 코딩된 신호