WO2010076269A1

WO2010076269A1 - Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage

Info

Publication number: WO2010076269A1
Application number: PCT/EP2009/067804
Authority: WO
Inventors: Patrice Alexandre; Philippe Daubigne; Guillame Le Neindre
Original assignee: Thomson Licensing
Priority date: 2008-12-31
Filing date: 2009-12-22
Publication date: 2010-07-08
Also published as: FR2940737A1

Abstract

Selon la demande, on rajoute dans le flux d'images codées H264 une information, dite d'accélération, renseignant sur les vitesses d'accélération (x2,x4,x8,x16... ) supportées par chaque image du flux à décoder. Cette information d'accélération est introduite dans l' en-tête d'au moins un des paquets de données vidéo de l'image. Lorsque le décodeur reçoit ce flux de paquets de données vidéo, les informations d'accélération contenues dans les paquets des images lui permettent d'obtenir directement, sans décodage préalable des images, les vitesses d'avance ou de retour rapide possibles pour décoder le flux ainsi que les images à décoder pour chacune des vitesses. L'objet de la demande est plus particulièrement destinée à améliorer le fonctionnement des décodeurs numériques vidéo ne disposant pas de capacité de décodage plus rapide que le temps réel.

Description

GENERATION DE FLUX DE PAQUETS DE DONNEES VIDEO CONTENANT DES INFORMATIONS D'ACCELERATION POUR LE

DECODAGE

Domaine de l'invention

La présente invention concerne un procédé de traitement d'une séquence d'images vidéo dans un codeur vidéo pour générer un flux de paquets de données vidéo destiné à être décodé par un décodeur numérique. L'invention est destinée à améliorer le fonctionnement des décodeurs numériques vidéo ne disposant pas de capacité de décodage plus rapide que le temps réel.

Arrière-plan technologique

Les décodeurs numériques vidéo sont couramment équipés de disque de stockage, ce qui permet une relecture ultérieure des données vidéo. Pour cela, le flux vidéo codé est stocké dès réception sur le disque de stockage puis relu pour être décodé lors du visionnage. La lecture à partir d'un disque de stockage apporte la possibilité de fonctions avancées comme l'avance rapide (AR) et le retour rapide (RR). Cependant, ces fonctions AR/RR ne sont possibles qu'à condition de pouvoir décoder très rapidement les images du flux vidéo. Deux solutions sont envisageables pour cela: soit le décodeur dispose d'une capacité de décodage plus rapide que le temps réel et il peut alors décoder toutes les images pour n'en afficher que le nombre requis pour la vitesse d'affichage demandée par l'utilisateur, soit le décodeur ne dispose pas d'une capacité de décodage plus rapide que le temps réel et il ne décode qu'une partie des images du flux vidéo codé.

La présente invention est destinée aux décodeurs ne disposant pas de capacité de décodage plus rapide que le temps réel et s'applique tout particulièrement au flux vidéo codé selon la norme H264 (AVC/MPEG4).

Un flux vidéo H264 introduit des relations d'interdépendance dans le codage, et par là- même dans le décodage, des images. Ces relations permettent de réduire considérablement la quantité d'informations nécessaires à la transmission ou au stockage d'images successives fortement corrélées temporellement. Ce codage basé sur des techniques dites de prédiction avec compensation de mouvement permet de déduire avec un minimum d'informations additionnelles la plupart des images vidéo à partir de ses voisines. Il existe donc une interdépendance des images qui permet de les hiérarchiser.

Dans la suite de la présente description, on considérera une hiérarchie comportant 4 types d'images:

- les images I (pour Intra) qui n'ont aucune dépendance avec les autres images et qui, de ce fait, constituent des points d'accès au décodage d'un flux vidéo; ces images servent généralement de référence aux autres images du flux vidéo;

- les images P (pour Prédites) dont le décodage se fait en référence à des images I ou P précédemment décodées du le flux vidéo; - les images Br (pour Bidirectionnelles références) dont le décodage se fait en référence à des images I ou P ou Br du flux vidéo; elles sont dites bidirectionnelles car elles s'appuient sur des images situées en amont et en aval dans le flux vidéo et servent de référence pour le décodage d'autres images; - les images B (pour Bidirectionnelles) dont le décodage se fait en référence à des images I, P ou Br du flux vidéo; elles sont dites bidirectionnelles car elles s'appuient sur des images situées en amont et en aval dans le flux vidéo mais ne servent pas de référence pour le décodage des autres images du flux. Ces relations d'interdépendance sont montrées sur la figure

1 pour un groupe d'images successives comportant 16 images. Dans cette figure, les flèches indiquent les relations de dépendance prédictive entre les images. Une image pointant sur une autre image indique que le décodage (ou codage) de l'image qui pointe dépend temporellement de l'image pointée. Dans cette figure, les images sont représentées dans l'ordre temporel. Dans l'exemple de la figure 1, deux niveaux hiérarchiques sont définis pour les images de type Br: le décodage des images Br de niveau 2, notées Br2, se fait uniquement en référence à des images I ou P et le décodage des images Br de niveau 1 , notées BrI , se fait uniquement en référence à des images I, P ou Br2. A noter que les dernières images Br2, BrI et B du groupe d'images se réfèrent à une image I du groupe d'images suivant.

Cette figure 1 montre que cette organisation hiérarchique des prédictions entre images présente un intérêt pour réaliser des applications de décodage accéléré. En effet, un décodage des images I et P uniquement permet un décodage accéléré de rapport 8 par rapport à un décodage temps réel. De la même façon, un décodage des images I, P et Br2 uniquement permet un décodage accéléré de rapport 4 par rapport à un décodage temps réel. Enfin, un décodage des images I, P, Br2 et BrI uniquement permet un décodage accéléré de rapport 2 par rapport à un décodage temps réel.

Si cette organisation hiérarchique constitue un apport évident pour la réalisation de fonctions d'avance rapide dans le décodeur numérique, il convient néanmoins de noter que le choix de l'organisation hiérarchique, c'est-à-dire le nombre de niveaux hiérarchiques, a un impact sensible sur la performance du codage en termes de qualité de rendu des images, les solutions de codage les plus performantes consistant à rendre dynamique la structure du groupe d'images (ou GOP en langue anglaise pour Group of Pictures) en l'ajustant au mieux au contenu des images à coder.

En effet, d'un point de vue purement intuitif, il est compréhensible d'imaginer qu'une baisse de la fréquence des images I et P rend l'apport de la prédiction temporelle moins efficace pour le codage. En effet, l'éloignement des images I ou P entre elles augmente les distorsions spatiales liées aux déplacements des objets et/ou de la caméra dans la scène. Ainsi, plus les scènes présentent des mouvements complexes et importants, plus il convient de réduire la période entre images I ou P lorsque l'on cherche à optimiser la performance de codage.

Les figures 2A à 2D montrent différentes structures de GOP définies en fonction du contenu vidéo des images de ce GOP.

La figure 2A montre une première structure de GOP comprenant 32 images et 6 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, une image P, 2 images Br3 (images Br de niveau 3), quatre images Br2 (images Br de niveau 2), huit images BrI (images Br de niveau 1) et seize images B. Une image I ou P apparaît toutes les 16 images. Cette structure est adaptée pour les mouvements très lents et peu complexes.

La figure 2B montre une deuxième structure de GOP comprenant 16 images et 5 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, deux images P, deux images Br2 (images Br de niveau 2), quatre images BrI (images Br de niveau 1) et huit images B. Une image I ou P apparaît dans le GOP toutes les 8 images. Cette structure est adaptée pour les mouvements lents et moyennement complexes.

La figure 2C montre une troisième structure de GOP comprenant 16 images et 4 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, quatre images P, quatre images BrI (images Br de niveau 1) et huit images B. Une image I ou P apparaît dans le GOP toutes les 8 images. Cette structure est adaptée pour les mouvements moyens et/ou complexes.

La figure 2D montre une quatrième structure de GOP comprenant 16 images et 4 niveaux de hiérarchie. Le GOP comprend plus précisément une image I, huit images P et huit images B. Une image I ou P apparaît dans le GOP toutes les 4 images. Cette structure est adaptée pour les mouvements forts et/ou très complexes.

En référence à ces figures, on remarque que le nombre de niveaux hiérarchiques se réduit au fur et à mesure que la complexité et/ou l'amplitude du mouvement des objets et/ou de la caméra dans la scène filmée s'intensifie(nt).

Si l'utilisation de structures dynamiques de GOP hiérarchique adaptées au contenu vidéo permet d'améliorer la performance du codage, elle rend la gestion des fonctions de décodage accéléré difficile à gérer. En effet, les dépendances entre les images du GOP étant variables, la norme H264 ne permet pas actuellement au décodeur de disposer d'informations pertinentes et facilement accessibles pour déterminer à tout instant les images qu'il doit décoder pour atteindre la vitesse d'accélération demandée par l'utilisateur. La seule solution consiste à effectuer un décodage d'au moins une partie du flux vidéo pour accéder à ces informations pertinentes. Ce décodage est coûteux en ressources, notamment si un cryptage est réalisé sur les données lors de leur transport et/ou stockage. Pour remédier à ce problème, la norme DVB ETSI TS 101154 a défini une structure de données appelée AU_information. Cette structure de données est placée sur une couche non cryptée de la paquétisation (section utilisateur de la couche de transport MPEG2 ISO/IEC 13181-1) et fournit des informations au décodeur pour faciliter l'accès aux images. Mais, avec la norme DVB ETSI TS 101154 telle qu'elle existe actuellement, le décodeur est uniquement en mesure de connaître le type des images IfPfB et de savoir si l'image sert de référence (champ AU_ref_pic_idc de la structure AU_information) à une autre image. Ce champ permet simplement de distinguer une image Br (champ AU_ref_pic_idc non nul) d'une image B (champ AU_ref_pic_idc nul). A partir de ces informations, le décodeur n'est pas en mesure de déterminer les relations d'interdépendance entre les images du GOP, surtout si les images bidirectionnelles comportent plusieurs niveaux hiérarchiques et si la structure du GOP est variable.

Résumé de l'invention

Un objet de l'invention est de proposer une solution permettant au décodeur de connaître à tout instant les accélérations de décodage couvertes par chacune des images codées. Selon l'invention, on introduit, pour chaque image du flux vidéo H264, une information dite d'accélération renseignant sur les vitesses d'accélération (x2,x4,x8,xl6,...) pour lesquelles cette image est à décoder. Cette information est introduite par le codeur dans les paquets du flux vidéo. Aussi la présente invention a pour objet un procédé de traitement d'au moins un groupe d'images consécutives d'une séquence d'images vidéo dans un codeur vidéo destiné à générer un flux de paquets de données vidéo en vue de leur stockage ou de leur transport, caractérisé en ce qu'il comprend les étapes suivantes: - analyser ledit groupe d'images consécutives de manière à attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe, - coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,

- déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et

- générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet se rapportant à l'image vidéo correspondante.

Lorsque le décodeur reçoit ce flux de paquets de données vidéo, les informations d'accélération contenues dans les paquets des images lui permettent d'obtenir directement, sans décodage préalable des images, les vitesses d'avance ou de retour rapide possibles pour décoder le flux ainsi que les images à décoder pour chacune des vitesses.

Selon une particularité de l'invention, l'information d'accélération de chaque image vidéo est déterminée à partir de son type d'image.

Selon un mode de réalisation particulier, les images vidéo sont codées conformément à la norme H264 et le type des images vidéo est sélectionné parmi les types I, P, Br (avec plusieurs niveaux hiérarchiques possibles BrI, Br2...) et B.

Selon un mode de réalisation avantageux, l'information d'accélération d'une image vidéo est en outre déterminée en fonction de l'écart minimum entre deux images de type I ou P consécutives dans le groupe d'images pour tenir compte des cas où la période entre deux images I ou P varie au sein du GOP.

Selon un mode de réalisation particulier, les paquets générés sont conformes à la norme ISO/IEC 13818-1 et l'information d'accélération est introduite dans la structure AU_information définie par la norme DVB ETSI TS 101154. L'invention concerne également un procédé de décodage d'un flux de paquets de données vidéo généré selon le procédé de traitement décrit précédemment, caractérisé en ce qu'il comprend les étapes suivantes:

- recevoir une consigne de vitesse d'avance ou de retour rapide;

- extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et

- décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, en l'absence de telles images, décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.

L'invention concerne également un encodeur vidéo destiné à traiter au moins un groupe d'images consécutives d'une séquence d'images vidéo et à générer un flux de paquets de données vidéo, caractérisé en ce qu'il comprend:

- un module d'analyse pour analyser ledit groupe d'images consécutives et attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,

- un module de codage pour coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,

- un module de détermination pour déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et - un module de génération pour générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en- tête d'au moins un paquet de données vidéo de ladite image vidéo.

Enfin, l'invention concerne un décodeur vidéo apte à décoder un flux de paquets de données vidéo généré par l'encodeur vidéo défini précédemment, caractérisé en ce qu'il comprend:

- un module de réception pour recevoir une consigne de vitesse d'avance ou de retour rapide;

- un module d'extraction pour extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et

- un module de décodage pour décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, en l'absence de telles images, pour décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.

Brève description des figures

L'invention sera mieux comprise, et d'autres buts, détails, caractéristiques et avantages apparaîtront plus clairement au cours de la description explicative détaillée qui va suivre de modes de réalisation particuliers actuellement préférés de l'invention, en référence aux figures annexées, parmi lesquels :

- la figure 1 illustre une première structure hiérarchique de groupe d'images;

- les figures 2 A à 2D illustrent d'autres structures hiérarchiques de groupe d'images dont la composition varie en fonction de la complexité et de l'amplitude du mouvement dans le groupe d'images; - la figure 3 représente un organigramme des étapes du procédé de l'invention ; - la figure 4 illustre une structure hiérarchique de groupe d'images dans laquelle la période entre images I ou P à l'intérieur du groupe d'images varie ; et

- la figure 5 représente schématiquement un codeur apte à mettre en œuvre le procédé de l'invention.

Description détaillée de l'invention

L'invention propose de rajouter dans le flux d'images codées H264 une information, dite d'accélération, renseignant sur les vitesses d'accélération supportées par l'image à décoder. Du fait de la structure hiérarchique des images entre elles dans le GOP, ces vitesses d'accélération sont dichotomiques : x2, x4, x8, xl6 dans le cas de la figure 1. On rajoute à ces vitesses d'accélération, les vitesses rendues possible par le décodage des images I uniquement et qui correspondent à toutes les tailles de GOP, à savoir dans notre exemple toutes les vitesses multiples de 8: x24, x32, x40 .... Dans le tableau qui suit, on s'arrête à la vitesse d'accélération x32.

Le tableau qui suit représente l'information d'accélération associée à chaque image de la structure de GOP de la figure 1.

Une telle information d'accélération est introduite, pour chaque image du GOP, dans le flux d'images codées (flux H264). Comme montré dans le tableau précédent, cette information se présente par exemple sous la forme d'un train binaire, chaque bit du train binaire étant associé à une vitesse d'accélération possible. Lorsque, dans ce train binaire, un bit est à 1, cela signifie que l'image doit être décodée pour obtenir la vitesse d'accélération associée à ce bit lors du décodage. Les informations d'accélération contenues dans le tableau précédent indiquent que l'image I du GOP de la figure 1 doit être décodée pour les vitesses d'accélération x2, x4, x8 et xl6, que l'image P doit être décodée pour les vitesses d'accélération x2, x4 et x8, que les images Br2 doivent être décodées pour les vitesses d'accélération x2 et x4, et que les images BrI doivent être décodées pour la vitesse d'accélération x2. L'information d'accélération est de préférence associée à une couche de transport non cryptée et est introduite dans l' en-tête des paquets de données, par exemple dans la structure AU_information définie par la norme DVB ETSI TS 101154.

La figure 3 représente un organigramme des étapes du procédé de l'invention mise en œuvre dans un codeur.

Selon une première étape El, le codeur analyse un groupe d'images consécutives et détermine, pour celui-ci, une structure hiérarchique adaptée au contenu des images. Le codeur détermine en particulier un type d'image pour chacune d'entre elles. Pour cela, le codeur réalise sur les images vidéo à coder des mesures de corrélation entre images (accumulation des différences absolues entre pixels de mêmes positions géographiques sur des images espacées de 1, 2 et 3 images). A partir de ces mesures, il sélectionne un type d'image, parmi les types I, P, Br3, Br2, BrI, B, pour chaque image. Selon une deuxième étape E2, les images à coder sont codées selon leur type d'image I, P, Br3, Br2, BrI, B conformément à la norme H264. Cette étape de codage comprend une étape préalable de réarrangement des images en fonction de leur type pour que les images servant de référence à au moins une autre image soient disposées avant cette image dans le flux. Cette étape de codage avec réarrangement des images est bien connue de l'homme du métier et ne sera donc pas décrite en détail ici.

Selon une troisième étape E3, qui peut être effectuée parallèlement à l'étape E2, on détermine une information d'accélération pour chaque image. Cette information d'accélération est déterminée à partir du type de l'image. Le principe de base de cette étape est le suivant pour une structure de GOP comportant des images I, P, Br2, BrI et B: les images BrI sont à décoder pour obtenir une vitesse d'accélération x2, les images Br2 sont à décoder pour obtenir les vitesses d'accélération x2 et x4, les images P sont à décoder pour obtenir les vitesses d'accélération x2, x4 et x8 et l'image I est à décoder pour obtenir les vitesses d'accélération x2, x4, x8 et xl6. Ce cas correspond au tableau défini précédemment pour la structure de la figure 1. Dans le cas d'une structure de GOP comportant des images I, P, Br3, Br2, BrI et B: les images BrI sont à décoder pour obtenir une vitesse d'accélération x2, les images Br2 sont à décoder pour obtenir les vitesses d'accélération x2 et x4, les images Br3 sont à décoder pour obtenir les vitesses d'accélération x2, x4 et x8, l'image P est à décoder est pour obtenir les vitesses d'accélération x2, x4, x8 et xl6 et l'image I est à décoder pour obtenir les vitesses d'accélération x2, x4, x8, xl6 et x32.

Pour tenir compte des structures de GOP dans lesquelles la période p entre deux images I ou P consécutives varie au sein du GOP, l'information d'accélération dépend en outre avantageusement de l'écart minimum entre deux images I ou P consécutives au sein du GOP. Dans ce cas, les valeurs de vitesses d'accélération définies précédemment pour les images I, P, Br3, Br2, BrI et B sont ensuite corrigées en fonction de cet écart minimum. Plus précisément, le nombre de vitesses d'accélération est réduit si cet écart minimum est faible. Si cet écart vaut 2, alors seule la vitesse x2 est maintenue pour les images I, P et Br2. Si cet écart vaut 4, seules les vitesses x2 et x4 sont maintenues pour les images I et P, et si cet écart vaut 8, seules les vitesses x2, x4 et x8 sont maintenues.

Ce cas où la période p entre deux images I ou P consécutives varie au sein du GOP est illustré par la figure 4. Cette structure comporte des images I, P, Br2, BrI et B. L'écart minimum entre deux images I ou P consécutives est égal à 4. Les valeurs de vitesse d'accélération sont alors corrigées comme indiqué précédemment. On obtient alors les informations d'accélération suivantes pour cette structure de GOP:

Dans cet exemple, les vitesses d'accélération pour les images P et Br2 se limitent à x2 et x4 et, pour l'image I, elles se limitent à x2, x4 et x24.

Selon une quatrième étape E4, les images vidéo codées sont encapsulées dans des paquets selon la norme MPEG2 System, ISO/IEC13818-1. Pour chaque image codée, on introduit dans l'en-tête d'au moins un paquet de données se rapportant à cette image codée l'information d'accélération déterminée pour cette image. Avantageusement, on introduit cette information d'accélération dans la section utilisateur de l'en-tête du premier paquet de l'image. Comme indiqué précédemment, cette information d'accélération est par exemple introduite dans la structure AU_information définie à chaque image par la norme DVB ETSI TS 101154.

Ainsi, selon l'invention, un décodeur recevant un flux de paquets de données générés selon le procédé décrit précédemment est en mesure d'identifier immédiatement lors du décodage de l'image I les vitesses d'accélération possibles pour décoder ce flux. Il est aussi capable de définir, à partir de l'ensemble des informations d'accélération des images du GOP, les images à décoder pour satisfaire au mieux l'accélération demandée par l'utilisateur.

En mode opératoire, le décodeur peut ainsi à chaque image I définir la vitesse d'accélération la plus proche de celle demandée par l'utilisateur car, du fait de l'aspect dynamique de la structure du GOP, il se peut que toutes les vitesses d'accélération demandées par l'utilisateur ne soient pas accessibles dans le flux vidéo.

L'exemple qui suit, qui correspond à la structure de GOP de la figure 2D, est un cas où le codeur a choisi une structure de GOP adaptée à un contenu vidéo à mouvements forts et/ou complexes.

Dans ce cas, si l'utilisateur demande une vitesse d'accélération x4 à l'affichage, le décodeur doit choisir soit de la limiter à x2, soit de passer à xl6. Si le décodeur choisit la vitesse d'accélération la plus proche de la vitesse demandée par l'utilisateur, il choisit la vitesse x2. Le décodeur peut également choisir d'alterner entre la vitesse x2 et la vitesse xl6 pour obtenir une vitesse d'accélération moyenne égale à la vitesse demandée par l'utilisateur.

A noter que cette limitation de qualité de service est la conséquence d'un choix de la part l'opérateur qui émet le flux de privilégier la performance de codage. Si l'opérateur souhaite privilégier à tout instant le nombre de vitesses d'accélérations du mode spécial (ou trick mode en langue anglaise) du décodeur, il peut demander à ce que le codeur réalisant l'organisation en GOP emploie des structures de GOP permettant un plus grand nombre d'accélérations. La contrepartie de ce grand nombre de vitesses d'accélérations est la réduction du nombre de structures de GOP possibles.

La figure 5 représente le schéma d'un codeur vidéo (appelé également encodeur vidéo) apte à mettre en œuvre le procédé de l'invention décrit précédemment. Dans ce schéma, les modules représentés sont des unités fonctionnelles, qui peuvent ou non correspondre à des unités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant, ou constituer des fonctionnalités d'un même logiciel. A contrario, certains modules peuvent être éventuellement composés d'entités physiques séparées. La plupart de ces modules ont une mémoire interne ou externe (non représentée) pour stocker temporairement des données.

L'encodeur vidéo comprend un premier module d'analyse 10 d'images vidéo reçues en bande de base. Ce module d'analyse réalise des mesures de corrélation entre les images d'un premier groupe d'images et détermine, à partir de ces mesures de corrélation, une structure hiérarchique de GOP et donc un type d'image pour chacune des images du groupe.

Un module 20 est ensuite prévu pour réarranger les images en fonction de leur type de manière à ce que les images servant de référence à une autre image soient disposées avant cette image dans le flux.

Le flux des images réarrangées est ensuite retardé par un module 30 de retard. Le retard appliqué est égal au nombre d'images du GOP. Ce retard est nécessaire pour calculer l'écart minimum entre deux images I ou P consécutives au sein du GOP.

Le flux d'images retardé est ensuite traité par un module 40 destiné à coder pour les images selon leur type conformément à la norme H264. Un module 50 est prévu pour déterminer l'information d'accélération pour chacune des images du GOP. Cette information d'accélération est déterminée pour chaque image à partir de son type et éventuellement de l'écart minimum entre deux images I ou P dans le GOP. Enfin, un module 60 de paquetisation est prévu pour encapsuler les images codées dans des paquets de données vidéo conformément à la norme MPEG2 System, ISO/IEC13818-1. Ce module introduit également dans la section utilisateur de l'en-tête du premier paquet de rapportant à chaque image l'information d'accélération déterminée précédemment pour cette image.

A noter que le module de retard 30 peut être disposé à d'autres positions entre le module 10 d'analyse et le module 60 de paquetisation. Il peut être placé entre les modules 10 et 20 ou entre les modules 40 et 60. Bien que l'invention ait été décrite en liaison avec différents exemples de structures de GOP, il est bien évident qu'elle n'y est nullement limitée et qu'elle est applicable à tout type de structure de GOP.

Claims

REVENDICATIONS

1. Procédé de traitement d'au moins un groupe d'images consécutives d'une séquence d'images vidéo dans un codeur vidéo destiné à générer un flux de paquets de données vidéo en vue de leur stockage ou de leur transport, caractérisé en ce qu'il comprend les étapes suivantes:

- analyser (El) ledit groupe d'images consécutives de manière à attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,

- coder (E2) lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,

- déterminer (E3) une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et

- générer (E4), à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet de données vidéo de ladite image vidéo.

2. Procédé selon la revendication 1, caractérisé en ce que l'information d'accélération d'une image vidéo est déterminée à partir du type d'image de ladite image vidéo.

3. Procédé selon la revendication 1 ou 2, caractérisé en ce que les images vidéo sont codées conformément à la norme H264.

4. Procédé selon la revendication 3, elle-même dépendante de la revendication 2, caractérisé en ce que l'information d'accélération d'une image vidéo est en outre déterminée en fonction de l'écart minimum entre deux images de type I ou P consécutives dans le groupe d'images.

5. Procédé selon l'une des revendications précédentes, caractérisé en ce que les paquets générés sont conformes à la norme ISO/IEC 13818-1.

6. Procédé selon la revendication 5, caractérisé en ce que l'information d'accélération de chaque image est introduite dans la structure AU_information définie par la norme DVB ETSI TS 101154.

7. Procédé de décodage d'un flux de paquets de données vidéo généré selon le procédé de traitement selon l'une des revendications 1 à 6, caractérisé en ce qu'il comprend les étapes suivantes:

- recevoir une consigne de vitesse d'avance ou de retour rapide; - extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et

- décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, à défaut, décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.

8. Encodeur vidéo destiné à traiter au moins un groupe d'images consécutives d'une séquence d'images vidéo et à générer un flux de paquets de données vidéo, caractérisé en ce qu'il comprend:

- un module d'analyse (10) pour analyser ledit groupe d'images consécutives et attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,

- un module de codage (20, 30, 40) pour coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées, - un module de détermination (50) pour déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et

- un module de génération (60) pour générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet de données vidéo de ladite ima *g&e"- vidéo.

9. Décodeur vidéo apte à décoder un flux de paquets de données vidéo généré par l'encodeur vidéo selon la revendication 8, caractérisé en ce qu'il comprend: - un module de réception pour recevoir une consigne de vitesse d'avance ou de retour rapide;

- un module d'extraction pour extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et - un module de décodage pour décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, à défaut, pour décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.