WO2009130425A2

WO2009130425A2 - Procédé d'insertion, de suppression, support d'enregistrement et codeur

Info

Publication number: WO2009130425A2
Application number: PCT/FR2009/050434
Authority: WO
Inventors: Vincent Bottreau; Philippe Bordes; Yannick Olivier; Olivier Le Meur; Edouard Francois
Original assignee: Thomson Licensing
Priority date: 2008-04-23
Filing date: 2009-03-17
Publication date: 2009-10-29
Also published as: FR2930702A1; WO2009130425A3

Abstract

L'invention concerne un procédé d'insertion de données (14, 16) d'une première séquence vidéo (6) dans des données (18, 20) d'une seconde séquence vidéo (10), une portion (34) de l'image (14, 16) de la première séquence vidéo (6) étant destinée à recouvrir une portion (34) de l'image (18, 20) de la seconde séquence vidéo (10). Le procédé comprend une étape de génération d'un flux codé (23) selon une norme de codage vidéo scalable de type SVC, le flux généré (23) comprenant une couche de base (26) transportant des données compressées (25) de seconde séquence vidéo (10), une couche d'amélioration (28) transportant des données compressées (27) de la première séquence vidéo (6), et des informations de reconstruction (30) d'une séquence vidéo à partir des données compressées de la couche de base (26) et de la couche d'amélioration (28). L'invention concerne également un procédé de suppression, un support d'enregistrement et un codeur.

Description

Procédé d'insertion, de suppression, support d'enregistrement et codeur

La présente invention concerne l'insertion de données d'une séquence vidéo sur une portion d'image d'une autre séquence vidéo.

En particulier, l'invention concerne l'insertion d'un logo dans une portion d'image d'une séquence vidéo.

Généralement, le logo est inséré dans une séquence vidéo avant compression de celle-ci par exemple selon la norme H.264 / AVC. Pour supprimer le logo, le flux compressé contenant le logo est décodé. Puis, le logo est détecté dans les images reconstruites et enfin, le logo est supprimé à l'aide d'une technique de propagation spatiale et/ou temporelle de l'information de macroblocs voisins.

Par ailleurs, il est connu une norme de codage vidéo scalable appelée SVC qui génère un train binaire hiérarchique comportant différentes couches superposées correspondant à différentes qualités d'images, différentes fréquences d'images et/ou différentes résolutions.

Le décodage des couches inférieures du train binaire hiérarchique permet d'obtenir des images à faible résolution et/ou faible qualité et/ou faible fréquence d'images. Le décodage de l'ensemble des couches du train binaire hiérarchique permet d'obtenir des images à résolution supérieure et/ou qualité supérieure et/ou fréquence d'images supérieure.

La norme SVC permet ainsi d'assurer l'interopérabilité entre différents services, de supporter des récepteurs présentant des capacités d'affichage distincts et de distribuer des séquences vidéo sur des réseaux à bande passante variable. L'invention a pour but de fournir un procédé permettant d'insérer et de supprimer facilement une séquence vidéo recouvrant une portion d'image d'une autre séquence vidéo.

A cet effet, l'invention a pour objet un procédé d'insertion de données d'une première séquence vidéo dans des données d'une seconde séquence vidéo, le contenu de la première séquence vidéo étant différent du contenu de la seconde séquence vidéo, une portion de la ou chaque image de la première séquence vidéo étant destinée à recouvrir une portion de la ou de chaque image de la seconde séquence vidéo, le procédé comprend une étape de génération d'un flux codé selon une norme de codage vidéo scalable de type SVC, le flux généré comprenant une couche de base transportant des données compressées de seconde séquence vidéo, une couche d'amélioration transportant des données compressées de la première séquence vidéo, et des informations de reconstruction d'une séquence vidéo à partir des données compressées de la couche de base et de la couche d'amélioration.

Suivant des modes particuliers de mise en œuvre, le procédé d'insertion comporte une ou plusieurs des caractéristiques suivantes, prises isolément ou en combinaison : - les données de la première séquence vidéo sont des données représentatives d'un logo fixe ou animé,

- l'étape de génération comprend une étape de création d'informations de reconstruction comportant des éléments syntaxiques indiquant que les données de la couche d'amélioration représentant une portion d'image de la première séquence vidéo non destinée à recouvrir une portion d'image de la seconde séquence vidéo sont une copie des données de la couche de base représentant une portion d'image de la seconde séquence vidéo non destinée à être recouverte,

- les données de la première séquence vidéo sont codées sans codage des données de la seconde séquence vidéo,

- les données de la première séquence vidéo sont des données binaires provenant d'un codage SVC des images de la première séquence vidéo, les données de la seconde séquence vidéo sont des données binaires provenant de la compression des images de la seconde séquence vidéo, l'étape de génération comprenant une étape de multiplexage des données binaires de la première séquence vidéo et des données binaires de la seconde séquence vidéo,

- les données de la première séquence vidéo comprennent au moins une image, l'étape de génération comprenant une étape de codage SVC de ou de chaque image de la première séquence vidéo, les données de la seconde séquence vidéo étant des données binaires provenant d'une compression des images de la seconde séquence vidéo, ladite compression étant préalable à l'étape de codage SVC, - l'étape de génération comprend une étape de création d'informations de reconstruction comportant des éléments syntaxiques indiquant que les images à reconstruire à partir des données de la couche de base sont stockées dans une mémoire tampon après reconstruction, et que lesdites images à reconstruire sont utilisées comme images de prédiction temporelle pour reconstruire la ou chaque image suivante à la place des images reconstruites à partir des données de la couche d'amélioration,

- chaque image de la première séquence vidéo est agencée en au moins une tranche, la ou chaque tranche étant définie par un type parmi les types El, EP et EB, la ou chaque tranche comportant plusieurs macroblocs propres à être codés en fonction de leur type dans les modes intra, les modes inter monodirectionnels et les modes inter bidirectionnels ; et dans lequel l'étape de codage SVC comporte les étapes suivantes :

- codage en mode « I_PCM » de la norme SVC de chaque premier macrobloc de chaque tranche de type El de la portion de la ou de chaque image de la première séquence vidéo destinée à recouvrir une portion de la ou de chaque image de la seconde séquence vidéo ;

- codage dans l'un des modes intra de la norme SVC de chaque macrobloc suivant ledit premier macrobloc de chaque tranche de type El de chaque image de la première séquence vidéo ;

- codage dans l'un des modes inter monodirectionnels et les modes inter bidirectionnels de la norme SVC de chaque macrobloc de chaque tranche de type EP ou EB de chaque image de la première séquence vidéo,

- les données de la première séquence vidéo comprennent au moins une image, les données de la seconde séquence vidéo comprenant plusieurs images, l'étape de génération comportant une étape de compression des images de la seconde séquence vidéo, et une étape de codage SVC de ou de chaque image de la première séquence vidéo,

- les vecteurs de mouvement (V) des données de la couche de base représentatives d'une première portion d'image d'une image ne peuvent pointer vers des données de la couche de base représentatives d'une seconde portion d'image d'une image codée précédemment, lorsque la première portion d'image est destinée à ne pas être recouverte d'une portion d'image de la couche d'amélioration et que la seconde portion d'image est destinée à être recouverte d'une portion d'image de la couche d'amélioration.

L'invention concerne également un procédé de suppression de la ou de chaque image d'une première séquence vidéo recouvrant une portion de chaque image d'une seconde séquence vidéo dans un flux codé comprenant une couche de base transportant des données compressées de la première séquence vidéo, une couche d'amélioration transportant des données compressées de la seconde séquence vidéo, et des informations de reconstruction d'une séquence vidéo à partir des données compressées de la couche de base et de la couche d'amélioration, caractérisé en ce que le procédé comporte une étape de suppression des informations de reconstruction et de la couche d'amélioration.

Par ailleurs, l'invention concerne également un support d'enregistrement d'informations comportant des instructions qui, lorsqu'elles sont exécutées par un calculateur électronique, produisent l'exécution d'un procédé d'insertion conforme à l'invention, ou d'un procédé de suppression conforme à l'invention.

Enfin, l'invention concerne un codeur apte à coder des données selon une norme de codage vidéo scalable de type SVC caractérisé en ce que le codeur comprend :

- une première entrée apte à recevoir des données d'une première séquence vidéo ;

- une seconde entrée apte à recevoir au moins une image d'une seconde séquence vidéo ; et

- une unité de codage apte à générer un flux codé comprenant une couche de base transportant des données compressées de la seconde séquence vidéo, une couche d'amélioration transportant des données compressées de la première séquence vidéo, et des informations de reconstruction permettant de reconstruire une séquence d'images à partir des données compressées de la couche de base et de la couche d'amélioration.

L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple et fait en se référant aux dessins annexés, sur lesquels :

- la figure 1 est une représentation schématique d'un codeur selon un premier mode de réalisation de l'invention ; - la figure 2 est un diagramme d'un procédé d'insertion selon le premier mode de réalisation de l'invention ;

- la figure 3 est une représentation schématique d'une image reconstruite après insertion d'un logo selon le procédé d'insertion de l'invention ; - la figure 4 est une représentation schématique de deux images reconstruites à partir des données de la couche de base et de deux images reconstruites uniquement à partir des données de la couche d'amélioration ;

- la figure 5 est un diagramme du procédé de suppression selon l'invention ;

- la figure 6 est une représentation schématique d'un codeur selon un second mode de réalisation de l'invention ;

- la figure 7 est un diagramme du procédé d'insertion selon un second mode de réalisation de l'invention ; et

- la figure 8 est une représentation schématique d'un multiplexeur illustrant le procédé d'insertion selon un troisième mode de réalisation de l'invention. En référence à la figure 1 , le codeur 2 selon un premier mode de réalisation de l'invention comprend une première entrée 4 apte à recevoir une première séquence vidéo 6, une deuxième entrée 8 apte à réceptionner une seconde séquence vidéo 10, et une unité 12 de codage selon la norme H.264 / AVC reliée à la deuxième entrée 8. La première séquence vidéo 6 comprend une ou plusieurs images 14, 16 représentatives d'un premier contenu vidéo, tel que par exemple une émission télévisée ou un logo 17 fixe ou animé.

Lorsque cette première séquence vidéo 6 représente un logo animé, elle comprend plusieurs images. Lorsque cette première séquence vidéo 6 représente un logo fixe, elle comprend une seule image, dont les données image sont répétées un nombre de fois correspondant au nombre d'images de la séquence vidéo 8.

Dans la suite de la description, il est considéré que la séquence vidéo 6 représente un logo animé. La seconde séquence vidéo 10 est constituée de plusieurs images 18, 20 représentatives d'un second contenu vidéo tel que par exemple une émission télévisée ou un film. Le contenu de la première séquence vidéo 6 est différent du contenu de la seconde séquence vidéo 10. Le codeur 2 comprend en outre une unité de codage 22 connectée à l'unité de codage 12 et à la première entrée 4, et une sortie 24 reliée à l'unité de codage 22.

L'unité de codage 22 est apte à coder des images selon la norme de codage vidéo scalable appelée SVC pour générer un flux codé SVC 23.

Cette norme SVC permet de générer un flux vidéo scalable par couches. La norme SVC est l'extension scalable de MPEG-4 AVC, telle que définie dans le document ISO/IEC 14496-10 amendement 3. Cette extension scalable a également été publiée sous la référence JVT-X201 lors de la réunion du groupe de travail JVT commun à l'ISO/lEC MPEG et à NTU-T VCEG qui a eu lieu à Genève du 29 juin au 5 juillet 2007.

Cette norme SVC contient notamment des extensions des éléments de codage de la norme H.264/AVC tels que l'agencement en tranches d'une image, chaque tranche comportant plusieurs macroblocs à coder selon le même mode de codage, les modes de codage intra, les modes de codage inter monodirectionnels et inter bidirectionnels et les types El, EP et EB des tranches à coder selon ces modes de codage.

Selon l'invention, l'unité de codage 22 est apte à générer des données compressées 25 dans une couche de base 26 à partir de la seconde séquence vidéo 10, des données compressées 27 dans une couche d'amélioration 28 à partir de la première séquence vidéo 6 et des informations de reconstruction 30. Les données 25, 27, la couche de base 26, la couche d'amélioration 28 et les informations de reconstruction 30 sont représentées schématiquement sur la figure 1. Les informations de reconstruction 30 sont des syntaxes de haut niveau de la couche de base 26 et de la couche d'amélioration 28. Elles sont codées dans la couche de base et dans la couche d'amélioration.

Selon le mode de réalisation de l'invention décrit, l'unité de codage 22 code la première séquence vidéo 6 selon le mode de codage CGS (de l'anglais « Square Gain Scability »). La couche d'amélioration 28 est une couche d'amélioration de la qualité selon ce mode de codage CGS.

En référence à la figure 2, le procédé d'insertion selon le premier mode de réalisation de l'invention débute par une étape 32 au cours de laquelle les unités de codage 12, 22 déterminent trois zones à partir des séquences vidéo 6 et 10 et à partir de données saisies par un opérateur sur le codeur 2.

L'opérateur saisit notamment le positionnement d'une portion de la première séquence vidéo 6 par rapport à la seconde séquence vidéo 10. Par exemple, une portion de la première séquence vidéo 6 recouvre une portion en bas à gauche de la seconde séquence vidéo 10.

En variante, une portion de la première séquence vidéo recouvre une moitié d'image de la seconde séquence vidéo 10.

Comme visible sur la figure 3, la première zone 34 comprend des macroblocs 36, 38 recouverts par une partie opaque du logo 17. La deuxième zone 40 comprend des macroblocs 42, 44 non recouverts par une partie opaque ou transparente du logo.

La troisième zone 46 comprend des macroblocs 48, 50 partiellement recouverts par une partie opaque du logo 17. En variante, cette troisième zone 46 comprend également des macroblocs recouverts par une partie transparente du logo.

Au cours d'une étape 52, l'unité de codage 12 code selon la norme H.264/AVC les images 18, 20 de la séquence vidéo 10.

Selon l'invention, l'unité de codage 12 est adaptée pour interdire de coder selon des modes inter monodirectionnels ou des modes inter bidirectionnels un macrobloc 42, 44 de la deuxième zone 40 d'une image 20 ayant un vecteur de mouvement V (visible sur la figure 4) pointant vers la première 34 ou la troisième

46 zone d'une image 18 codée précédemment, par exemple en excluant ses zones de la zone de recherche du module d'estimation de mouvement de l'unité de codage 12.

Ainsi, l'unité de codage 12 interdit la reconstruction par prédiction temporelle d'un macrobloc de la deuxième zone 40 à partir d'un macrobloc recouvert par le logo 17 d'une image précédemment codée.

Au cours d'une étape 54, l'unité de codage 22 génère des informations de reconstruction permettant d'identifier dans le flux codé SVC, les données 25 de la couche de base 26 et les données 27 de la couche d'amélioration 28.

A cet effet, l'unité de codage 22 associe aux macroblocs des images 18, 20 de la séquence vidéo 10, un élément de syntaxe du type « dependency_id » égal à 0. Cet élément de syntaxe signifie que les images 18, 20 de la séquence vidéo 10 sont codées dans la couche de base 26. De même, l'élément de syntaxe « dependency_id » égal à 1 est associé aux macroblocs des images 14, 16 de la séquence vidéo 6 pour indiquer que ceux-ci sont codés dans la couche d'amélioration 28.

Lorsque l'unité de codage 22 ne code pas la séquence vidéo 6 selon le mode de codage CGS mais selon le mode de codage dit MGS (de l'anglais « Médium Gain Scability »), la couche de base 26 et la couche d'amélioration 28 ont une même valeur de l'élément de syntaxe « dependency_id » mais ont deux valeurs distinctes d'un élément de syntaxe « quality id ». Dans ce cas, la couche de base est rattachée à un élément de syntaxe de type « quality_id » égal à 0 et la couche d'amélioration 28 est rattachée à un élément de syntaxe de type « quality_id » égal à 1.

Lorsque la séquence vidéo 10 est elle-même constituée de plusieurs couches codées selon la norme SVC, la couche de base 26 est identifiée soit par un élément de syntaxe « dependency_id » non nul, soit par un élément de syntaxe « quality_id » non nul.

D'une manière générale et quel que soit le mode de codage utilisé, les macroblocs des images de la séquence vidéo 10 sont associés à un élément de syntaxe du type « dependency_id » ou à un élément de syntaxe du type « quality_id » égal à N, tandis que les macroblocs des images 14, 16 de la séquence vidéo 6 sont associées à un élément de syntaxe « dependency_id » ou à un élément de syntaxe du type « quality_id » égal à N+1.

Au cours d'une étape 56, l'unité de codage 22 génère des informations de reconstruction qui comportent des éléments syntaxiques de type « base_mode_flag ».

En particulier, comme visible sur la figure 4, tous les macroblocs 42, 44 de la deuxième zone 40 de la couche d'amélioration 28 sont associés à un élément syntaxique « base_mode_flag » égal à 1 , ce qui signifie que ces macroblocs 42, 44 sont une recopie exacte des macroblocs 42, 44 localisés au même emplacement dans la couche de base 26. Les macroblocs 36, 38 de la première zone 34 sont associés à l'élément syntaxique « base_mode_flag » égal à 0, ce qui signifie que ces macroblocs sont codés par les données 27 de la couche d'amélioration.

Au cours d'une étape 58, les macroblocs 36, 38 de la première zone 34 des images 14, 16 de la séquence vidéo 6 sont codés par l'unité de codage 22 selon l'un quelconque des modes non scalables proposés par la norme H.264/AVC.

A cet effet, les macroblocs de la première zone 34 sont considérés par tranches.

De façon classique, les macroblocs des tranches de type El sont codés selon les modes intra de la norme H.264/AVC. Les macroblocs des tranches de type EP et EB sont codés selon les modes inter monodirectionnels et respectivement les modes inter bidirectionnels de la norme H.264/AVC.

En variante, lorsque la position du logo dans la vidéo 6 est fixe, les macroblocs des tranches de type EP et EB sont codés selon les modes « P_Skip » et « B_Skip » afin d'optimiser le coût débit/distorsion du codage.

Au cours d'une étape 60, les macroblocs 48, 50 de la troisième zone 46 sont obtenus selon des méthodes de l'état de la technique permettant de réaliser une combinaison entre la texture du logo 17 et celle des images de la séquence vidéo originale 10 recouverte par celui-ci. Par exemple, une technique de combinaison linéaire des deux textures peut être utilisée.

Lorsque la nouvelle texture est obtenue pour ces macroblocs, ces derniers sont codés par l'unité de codage 12 selon un mode de codage de type scalable ou non scalable.

En référence à la figure 5, le procédé de suppression du logo inséré selon le procédé d'insertion décrit ci-dessus débute par une étape 62 de réception du flux SVC 23, suivi par une étape 64 de suppression des informations de reconstruction 30 et de la couche d'amélioration 28.

A cet effet, le décodeur recherche les macroblocs associés à un élément de syntaxe de type « dependency_id » égal à 1. Ainsi, une simple manipulation de la couche d'amélioration 28 et des informations de reconstruction 30 codées selon la norme SVC est nécessaire pour supprimer le logo 17. Avantageusement, la séquence vidéo 10 n'a pas perdu de qualité visuelle après insertion et suppression du logo. La séquence vidéo 10 est reconstruite de la même manière et avec la même qualité que si cette séquence vidéo 10 avait été codée uniquement selon la norme H.264/AVC. En référence à la figure 6, le codeur 66 selon le deuxième mode de réalisation de l'invention est décrit.

Seules les séquences vidéo ne comportant pas de portion transparente et ayant une taille leur permettant de recouvrir exactement un nombre entier de macroblocs peuvent être codées selon ce deuxième mode de réalisation de l'invention.

Ainsi, dans ce mode de réalisation, les images de la première 6 et de la seconde 10 séquence vidéo sont agencées uniquement selon une première 34 et une deuxième 40 zones.

Ce codeur 66 permet d'insérer des images 14, 16 de la première séquence vidéo 6 dans un flux de données binaires 76 représentatives de la seconde séquence vidéo 10.

Les images 14, 16 de la séquence vidéo 6 sont codées selon la norme SVC indépendamment du flux de données binaires 76.

En conséquence, les images 14, 16 de la séquence vidéo 6 peuvent être reconstruites sans décompression des données du flux 76. De même, des images 18, 20 provenant du flux de données binaires 76 peuvent être reconstruites sans décodage de la séquence vidéo 6 codée par l'unité de codage du codeur 66.

Le codeur 66 comprend une première entrée 68, une deuxième entrée 70, une unité de codage 72 reliée à la première 68 et à la deuxième 70 entrées, et enfin, une sortie 74 connectée à l'unité de codage 72.

La première entrée 68 est apte à recevoir une ou plusieurs images 14, 16 de la séquence vidéo 6.

La deuxième entrée 70 est propre à recevoir un flux de données binaires 76 provenant de la compression selon la norme H.264/AVC de la séquence vidéo 10. L'unité de codage 72 est propre à générer des informations de reconstruction 30 définissant que le flux de données binaires 76 appartient à la couche de base 26 et à coder les images 14, 16 de la séquence vidéo 6, de façon à ce que les données compressées 27 issues de celles-ci appartiennent à la couche d'amélioration 28.

En référence à la figure 7, le procédé d'insertion selon le second mode de réalisation de l'invention débute par une étape 32 de détermination des première 34 et deuxième 40 zones des images à coder.

Au cours de l'étape 54, l'unité de codage 72 crée des informations de reconstruction 30 associant au flux de données binaires 76 un élément de syntaxe « dependency_id » égal à 0 signifiant que ce flux de données binaires constitue la couche de base 26 du flux SVC 23 et associant aux macroblocs des images 14, 16 de la séquence vidéo 6 un élément de syntaxe « dependency_id » égal à 1 de sorte que les données compressées 27 représentant ces macroblocs constituent la couche d'amélioration 28.

L'étape 54 est suivie d'une étape 56 identique à l'étape 56 illustrée sur les figures 2 et 4. Au cours d'une étape 78, l'unité de codage 72 crée des informations de reconstruction 30 comportant des éléments syntaxiques de type « store_ref_base_pic_flag » indiquant que les images à reconstruire à partir du flux de données binaires 76 de la couche de base 26 sont stockées dans une mémoire tampon après reconstruction par le décodeur ; et des éléments syntaxiques de type « use_ref_base_pic_flag » indiquant que les images à reconstruire à partir des données de la couche de base 26 sont utilisées comme images de prédiction temporelle pour reconstruire la ou chaque image suivante.

Ainsi, en référence à la figure 4, lorsqu'un macrobloc 79 de la couche de base 26 codé en mode inter monodirectionnel ou inter bidirectionnel est associé à un vecteur de mouvement V qui pointe dans la première zone, c'est-à-dire dans la zone recouverte par le logo 17, la prédiction se fait à partir des macroblocs 36, 38 de la couche de base et non pas à partir des macroblocs 36, 38 de la couche d'amélioration 28 qui comprennent le logo 17.

Toutefois, lorsque l'élément de syntaxe « store_ref_base_pic_flag » est utilisé, le flux de données binaires 76 ne doit pas contenir d'unité de couche, généralement appelée unité NAL appartenant à l'unité de codage dont l'élément de syntaxe « nal_ref_idc » est égal à 0. Cette restriction interdit notamment l'insertion d'un logo sur les tranches B dites hiérarchiques de dernier niveau temporel non référencées.

Au cours d'une étape 80, les macroblocs des images 14, 16 de la première séquence vidéo 6 sont codées. En particulier, les macroblocs 42, 44 de la deuxième zone 40 de la couche d'amélioration 28 sont codées. A cet effet, le premier macrobloc de la deuxième zone 40 d'une tranche El est codé selon le mode « I_PCM » de la norme H.264/AVC.

Les macroblocs suivants de la même tranche de type El sont codés selon les modes intra de la norme H.264/AVC. Ces macroblocs ne prennent pas comme candidat à l'intra prédiction des macroblocs en dehors de la deuxième zone 40.

Les macroblocs des tranches de type EP, EB de la deuxième zone 40 sont codés selon l'un quelconque des modes non scalables de la norme H.264/AVC.

De préférence, lorsque la position du logo dans la vidéo 6 est fixe, les modes « P_Skip » et « B_Skip » sont utilisés pour optimiser le coût débit- distorsion du codage.

En variante, les macroblocs de la deuxième zone 40 et de la première zone 34 sont regroupés en deux groupes de tranches (de l'anglais « slice groups »). Chaque groupe de tranches est associé à l'élément syntaxique « base_mode_flag » égal à 1 avec un seul élément syntaxique « slice skip flag »

L'élément syntaxique « slice_skip_flag » attribue la valeur de l'élément syntaxique « base_mode_flag » égal à 1 à tous les macroblocs constituant le groupe de tranches.

Avantageusement, la deuxième zone 40 non recouverte par le logo des images 14, 16 de la première séquence vidéo 6 est codée quel que soit le contenu de la seconde séquence vidéo 10, et la première zone 34 recouverte par le logo 17 est codée indépendamment du contenu de la seconde vidéo 10.

En conséquence, il n'est pas nécessaire de décoder même partiellement le flux de données binaires 76 compressé selon la norme H.264/AVC afin d'insérer la première séquence vidéo 6. Seules les dimensions de ce flux 76 sont nécessaires à l'insertion d'un logo opaque aligné sur les grilles de macroblocs.

Avantageusement, ce mode de réalisation permet d'insérer la séquence vidéo 6 dans le flux de données binaires 76 à la volée. Le procédé de suppression des images 14, 16 de la première séquence vidéo 6 recouvrant la portion 34 des images 18, 20 de la seconde séquence vidéo 10 est identique au procédé décrit en liaison avec la figure 5.

En référence à la figure 8, un troisième mode de réalisation de l'invention est illustré.

Selon ce mode de réalisation, les images 14, 16 de la séquence vidéo 6 ont été préalablement codées selon la norme SVC pour former un flux de données binaires 82 et des informations de reconstruction 30 ont été établies et codées selon la norme SVC. La séquence vidéo 10 a été préalablement compressée selon la norme

H.264/AVC de manière à former un flux de données binaires 76.

Le flux 76 et le flux 82 sont multiplexes par un multiplexeur 84 pour générer un flux SVC comprenant une couche de base 26 transportant le flux 76 représentant les images de la séquence vidéo 10, une couche d'amélioration 28 transportant le flux 82 représentant les images de la séquence vidéo 6 et des informations de reconstruction 30.

Comme pour le codeur 66, seules les séquences vidéo ne comportant pas de portion transparente et ayant une taille leur permettant de recouvrir un nombre entier de macroblocs peuvent être codées selon ce troisième mode de réalisation à l'aide du multiplexeur 84.

Le procédé de suppression des images recouvrant une portion de la seconde séquence vidéo construite à partir de ce troisième mode de réalisation est identique au procédé de suppression illustré sur la figure 5.

Avantageusement, selon ce mode de réalisation, le flux 82 peut être associé de façon simple à n'importe quelle séquence vidéo. Le flux 82 est inséré dans le flux 76 à la volée par simple re-multiplexage du flux 76 et du flux 82, et ce, indépendamment du contenu du flux 76.

Le flux compressé 82 représentatif du logo peut être facilement réutilisé par multiplexage avec un flux contenant un autre contenu. A cet effet, il suffit que les dimensions des images du flux contenant l'autre contenu soient identiques aux dimensions des images du flux 76.

Ce mode de réalisation permet à l'ayant-droit ou au diffuseur de la vidéo souhaitant insérer un logo de réaliser des gains importants d'exploitation. Selon d'autres termes, l'invention consiste à utiliser une norme de codage vidéo scalable SVC pour insérer des données d'une première séquence vidéo dans des données d'une seconde séquence vidéo de telle manière que lorsque les données sont décodées, une portion de la ou chaque image de la première séquence vidéo recouvre une portion de la ou de chaque image de la seconde séquence vidéo.

Avantageusement, le flux comportant le logo est facilement et directement identifiable grâce à son élément syntaxique « dependency_id » ou « quality_id » supérieur à celui du flux comportant la vidéo 10. Il peut donc être protégé au niveau du système et/ou du transport indépendamment du flux vidéo. Cette indépendance permet de garantir à l'ayant-droit et/ou au diffuseur une meilleure protection du logo face à des attaques sur le contenu.

Avantageusement, ce procédé permet d'insérer un logo fixe ou animé dans une séquence vidéo compressée, sans nécessiter le décodage de celle-ci.

Claims

REVENDICATIONS

1.- Procédé d'insertion de données (14, 16 ; 82) d'une première séquence vidéo (6) dans des données (18, 20 ; 76) d'une seconde séquence vidéo (10), le contenu de la première séquence vidéo (6) étant différent du contenu de la seconde séquence vidéo (10), une portion (34) de la ou de chaque image (14, 16) de la première séquence vidéo (6) étant destinée à recouvrir une portion (34) de la ou de chaque image (18, 20) de la seconde séquence vidéo (10), caractérisé en ce que le procédé comprend une étape de génération (52,

56 ; 56, 78, 80) d'un flux codé (23) selon une norme de codage vidéo scalable de type SVC, le flux généré (23) comprenant une couche de base (26) transportant des données compressées (25 ; 76) de seconde séquence vidéo (10), une couche d'amélioration (28) transportant des données compressées (27; 82) de la première séquence vidéo (6), et des informations de reconstruction (30) d'une séquence vidéo à partir des données compressées de la couche de base (26) et de la couche d'amélioration (28).

2.- Procédé d'insertion selon la revendication 1 , dans lequel les données (14, 16, 82) de la première séquence vidéo (6) sont des données représentatives d'un logo (17) fixe ou animé.

3.- Procédé d'insertion selon l'une quelconque des revendications précédentes, dans lequel l'étape de génération (52, 56 ; 56, 78, 80) comprend une étape de création (56) d'informations de reconstruction (30) comportant des éléments syntaxiques indiquant que les données (27 ; 82) de la couche d'amélioration (28) représentant une portion d'image (40) de la première séquence vidéo (6) non destinée à recouvrir une portion d'image de la seconde séquence vidéo (10) sont une copie des données (25 ; 76) de la couche de base (26) représentant une portion d'image de la seconde séquence vidéo (10) non destinée à être recouverte.

4.- Procédé d'insertion selon l'une quelconque des revendications précédentes, dans lequel les données de la première séquence vidéo (6) sont codées sans codage des données de la seconde séquence vidéo (10).

5.- Procédé d'insertion selon l'une quelconque des revendications précédentes, dans lequel les données (14, 16 ; 82) de la première séquence vidéo (6) sont des données binaires (82) provenant d'un codage SVC des images (14, 16) de la première séquence vidéo (6), les données (18, 20 ; 76) de la seconde séquence vidéo (10) sont des données binaires (76) provenant de la compression des images (18, 20) de la seconde séquence vidéo (10), l'étape de génération (56, 78, 80) comprenant une étape de multiplexage des données binaires (82) de la première séquence vidéo (6) et des données binaires (76) de la seconde séquence vidéo (10).

6.- Procédé selon l'une quelconque des revendications 1 à 4, dans lequel les données (14, 16 ; 82) de la première séquence vidéo (6) comprennent au moins une image (14, 16), l'étape de génération (56, 78, 80) comprenant une étape de codage SVC (80) de ou de chaque image (14, 16) de la première séquence vidéo (6), les données (18, 20 ; 76) de la seconde séquence vidéo (10) étant des données binaires (76) provenant d'une compression des images (18, 20) de la seconde séquence vidéo (10), ladite compression étant préalable à l'étape de codage SVC (80).

7.- Procédé d'insertion selon la revendication 6, dans lequel l'étape de génération (56, 78, 80) comprend une étape de création (78) d'informations de reconstruction (30) comportant des éléments syntaxiques indiquant que les images à reconstruire à partir des données (25 ; 76) de la couche de base (26) sont stockées dans une mémoire tampon après reconstruction, et que lesdites images à reconstruire sont utilisées comme images de prédiction temporelle pour reconstruire la ou chaque image suivante à la place des images reconstruites à partir des données de la couche d'amélioration (28).

8.- Procédé d'insertion selon la revendication 6 ou 7, dans lequel chaque image (14, 16) de la première séquence vidéo (6) est agencée en au moins une tranche, la ou chaque tranche étant définie par un type parmi les types El, EP et EB, la ou chaque tranche comportant plusieurs macroblocs propres à être codés en fonction de leur type dans les modes intra, les modes inter monodirectionnels et les modes inter bidirectionnels ; et dans lequel l'étape de codage SVC (80) comporte les étapes suivantes : - codage (80) en mode « I_PCM » de la norme SVC de chaque premier macrobloc de chaque tranche de type El de la portion (34) de la ou de chaque image (14, 16) de la première séquence vidéo (6) destinée à recouvrir une portion de la ou de chaque image de la seconde séquence vidéo (10) ; - codage (80) dans l'un des modes intra de la norme SVC de chaque macrobloc suivant ledit premier macrobloc de chaque tranche de type El de chaque image (14, 16) de la première séquence vidéo (6) ;

- codage (80) dans l'un des modes inter monodirectionnels et les modes inter bidirectionnels de la norme SVC de chaque macrobloc de chaque tranche de type EP ou EB de chaque image (14, 16) de la première séquence vidéo (6).

9.- Procédé d'insertion selon l'une quelconque des revendications 1 à 3, dans lequel les données (14, 16 ; 82) de la première séquence vidéo (6) comprennent au moins une image (14, 16), les données (18, 20 ; 76) de la seconde séquence vidéo (10) comprenant plusieurs images (18, 20), l'étape de génération (52, 56, 78, 80) comportant une étape de compression (52) des images (18, 20) de la seconde séquence vidéo (10), et une étape de codage SVC (80) de ou de chaque image (14, 16) de la première séquence vidéo (6).

10.- Procédé d'insertion selon la revendication 9, dans lequel les vecteurs de mouvement (V) des données de la couche de base (26) représentatives d'une première portion d'image (40) d'une image (20) ne peuvent pointer vers des données de la couche de base (26) représentatives d'une seconde portion d'image (34) d'une image codée précédemment (18), lorsque la première portion d'image (40) est destinée à ne pas être recouverte d'une portion d'image de la couche d'amélioration (28) et que la seconde portion d'image (34) est destinée à être recouverte d'une portion d'image de la couche d'amélioration (28).

11.- Procédé de suppression de la ou de chaque image (14, 16) d'une première séquence vidéo (6) recouvrant une portion (34, 46) de chaque image (18, 20) d'une seconde séquence vidéo (10) dans un flux codé comprenant une couche de base (26) transportant des données compressées (27 ; 82) de la première séquence vidéo (6), une couche d'amélioration (28) transportant des données compressées (25 ; 76) de la seconde séquence vidéo (10), et des informations (30) de reconstruction d'une séquence vidéo à partir des données compressées (25, 76 ; 27, 82) de la couche de base (26) et de la couche d'amélioration (28), caractérisé en ce que le procédé comporte une étape de suppression (64) des informations de reconstruction (30) et de la couche d'amélioration (28).

12. Support d'enregistrement d'informations, caractérisé en ce qu'il comporte des instructions qui, lorsqu'elles sont exécutées par un calculateur électronique, produisent l'exécution d'un procédé d'insertion conforme à l'une quelconque des revendications 1 à 10, ou d'un procédé de suppression conforme à la revendication 11.

13.- Codeur (2 ; 66) apte à coder des données selon une norme de codage vidéo scalable de type SVC caractérisé en ce que le codeur (2 ; 66) comprend :

- une première entrée (4 ; 68) apte à recevoir des données (14, 16 ; 82) d'une première séquence vidéo (6) ; - une seconde entrée (8 ; 70) apte à recevoir au moins une image (18, 20) d'une seconde séquence vidéo (10) ; et

- une unité de codage (22 ; 72) apte à générer un flux codé comprenant une couche de base (26) transportant des données compressées (25 ; 76) de la seconde séquence vidéo (10), une couche d'amélioration (28) transportant des données compressées (27 ; 82) de la première séquence vidéo (6), et des informations (30) de reconstruction permettant de reconstruire une séquence d'images à partir des données compressées de la couche de base (26) et de la couche d'amélioration (28).