WO2010076269A1 - Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage - Google Patents

Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage Download PDF

Info

Publication number
WO2010076269A1
WO2010076269A1 PCT/EP2009/067804 EP2009067804W WO2010076269A1 WO 2010076269 A1 WO2010076269 A1 WO 2010076269A1 EP 2009067804 W EP2009067804 W EP 2009067804W WO 2010076269 A1 WO2010076269 A1 WO 2010076269A1
Authority
WO
WIPO (PCT)
Prior art keywords
images
video
image
group
acceleration information
Prior art date
Application number
PCT/EP2009/067804
Other languages
English (en)
Inventor
Patrice Alexandre
Philippe Daubigne
Guillame Le Neindre
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of WO2010076269A1 publication Critical patent/WO2010076269A1/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Definitions

  • the present invention relates to a method of processing a video image sequence in a video encoder to generate a stream of video data packets to be decoded by a digital decoder.
  • the invention is intended to improve the operation of video digital decoders having no decoding capability faster than real time.
  • Digital video decoders are commonly equipped with a storage disk, which allows a subsequent replay of the video data. For this, the coded video stream is stored upon reception on the storage disk and then read again to be decoded during viewing. Playback from a storage disk provides the possibility of advanced functions such as fast forward (AR) and fast reverse (RR). However, these AR / RR functions are only possible if the images of the video stream can be decoded very quickly. Two solutions are possible for this: either the decoder has a faster decoding capacity than the real time and it can then decode all the images to display only the number required for the display speed requested by the user, or the decoder does not have a faster decoding capacity than real time and it decodes only part of the images of the encoded video stream.
  • AR fast forward
  • RR fast reverse
  • the present invention is intended for decoders having no decoding capacity faster than real time and particularly applies to the video stream encoded according to the H264 standard (AVC / MPEG4).
  • An H264 video stream introduces interdependence relationships into the encoding, and hence into the decoding, of images. These relationships can significantly reduce the amount information necessary for the transmission or storage of successive images strongly correlated temporally.
  • This coding based on so-called motion-compensated prediction techniques, makes it possible to deduce, with a minimum of additional information, most of the video images from its neighbors. There is thus an interdependence of the images which makes it possible to hierarchize them.
  • images I for Intra which have no dependence on the other images and which, therefore, constitute access points to the decoding of a video stream; these images are generally used as reference to the other images of the video stream;
  • the images P for Predicted
  • the images Br for Bidirectional references
  • images I or P or Br of the video stream they are bidirectional because they rely on images located upstream and downstream in the video stream and serve as a reference for decoding other images
  • images B for Bidirectional
  • I, P or Br images of the video stream they are said bidirectional because they rely on images located upstream and downstream in the video stream but do not serve as a reference for the decoding of the other images of the stream.
  • FIG. 1 shows that this hierarchical organization of predictions between images is of interest for making accelerated decoding applications.
  • a decoding of I and P images only allows an accelerated decoding of ratio 8 with respect to a real-time decoding.
  • decoding I, P and Br2 images only allows accelerated decoding of ratio 4 with respect to real-time decoding.
  • a decoding of the images I, P, Br2 and BrI only allows an accelerated decoding of ratio 2 with respect to a real-time decoding.
  • Figures 2A to 2D show different GOP structures defined according to the video content of the images of this GOP.
  • Figure 2A shows a first GOP structure comprising 32 images and 6 hierarchical levels.
  • the GOP includes more precisely an image I, a picture P, two pictures Br3 (Br pictures of level 3), four pictures Br2 (pictures Br of level 2), eight pictures BrI (pictures Br of level 1) and sixteen pictures B.
  • An image I or P appears every 16 images. This structure is suitable for very slow and uncomplicated movements.
  • Figure 2B shows a second GOP structure comprising 16 images and 5 hierarchical levels.
  • the GOP includes more precisely one I-image, two P-images, two Br2 images (Br-level 2 images), four BrI-images (Br-level 1 images), and eight B-images.
  • An I or P image appears in the GOP every 8 images. This structure is suitable for slow and moderately complex movements.
  • Figure 2C shows a third GOP structure comprising 16 images and 4 hierarchical levels.
  • the GOP further includes an I-frame, four P-frames, four BrI-frames (Br-Level 1 images), and eight B-frames.
  • An I or P-frame appears in the GOP every 8 frames. This structure is suitable for medium and / or complex movements.
  • Figure 2D shows a fourth GOP structure with 16 images and 4 levels of hierarchy.
  • the GOP includes more precisely an I-frame, eight P-frames, and eight B-frames.
  • An I or P-frame appears in the GOP every 4 frames. This structure is suitable for strong and / or very complex movements.
  • the number of hierarchical levels is reduced as the complexity and / or the amplitude of the movement of the objects and / or the camera in the filmed scene intensifies. .
  • This data structure is placed on an unencrypted layer of the packetization (user section of the ISO / IEC 13181-1 MPEG2 transport layer) and provides information to the decoder to facilitate access to the images.
  • the decoder is only able to know the type of the IfPfB images and to know if the image serves as a reference (AU_ref_pic_idc field of the AU_information structure) to another picture.
  • This field makes it possible to simply distinguish a picture Br (non-zero field AU_ref_pic_idc) of a picture B (field AU_ref_pic_idc null). From this information, the decoder is unable to determine the interdependence relationships between the GOP images, especially if the bidirectional images have multiple hierarchical levels and if the GOP structure is variable.
  • An object of the invention is to propose a solution enabling the decoder to know at any time the decoding accelerations covered by each of the coded images.
  • a so-called acceleration information providing information on the acceleration rates (x2, x4, x8, x16, ...) for which this image is to be decoded is introduced. This information is introduced by the coder into the packets of the video stream.
  • the present invention therefore relates to a method of processing at least one group of consecutive images of a sequence of video images in a video encoder intended to generate a stream of video data packets for storage or their transport, characterized in that it comprises the following steps: analyzing said group of consecutive images so as to assign an image type to each video image of said group, the image type of each video image defining the dependence between said video image and the other video images of said group, said images of the group according to their image type so as to generate coded video images,
  • acceleration information indicating the forward or reverse speeds for which the corresponding coded video image is to be decoded during the decoding of the group of images
  • the acceleration information contained in the packets of the images allow it to obtain directly, without prior decoding of the images, the possible forward or rewind speeds to decode the stream. as well as the images to be decoded for each of the speeds.
  • the acceleration information of each video image is determined from its image type.
  • the video images are coded according to the H264 standard and the type of the video images is selected from the types I, P, Br (with several possible hierarchical levels BrI, Br2 ...) and B.
  • the acceleration information of a video image is furthermore determined as a function of the minimum distance between two consecutive type I or P images in the group of images to take account of the cases where the period between two I or P images varies within the GOP.
  • the packets generated conform to the ISO / IEC 13818-1 standard and the acceleration information is introduced into the AU_information structure defined by the DVB ETSI TS 101154 standard.
  • the invention also relates to a method for decoding a stream of video data packets generated according to the processing method described above, characterized in that it comprises the following steps:
  • the invention also relates to a video encoder for processing at least one group of consecutive images of a sequence of video images and generating a stream of video data packets, characterized in that it comprises:
  • an analysis module for analyzing said group of consecutive images and assigning an image type to each video image of said group, the image type of each video image defining the dependence between said video image and the other video images of said video image; group,
  • an encoding module for encoding said images of the group according to their image type so as to generate coded video images
  • a determination module for determining a so-called acceleration information for each video image of the group, said acceleration information indicating the forward or rewind speeds for which the corresponding coded video image is to be decoded during the decoding the group of images, and a generation module for generating, from said coded images, a stream of video data packets, the acceleration information of each video image of the group being introduced into the header of at least one data packet; video of said video image.
  • the invention relates to a video decoder adapted to decode a stream of video data packets generated by the video encoder defined above, characterized in that it comprises:
  • a reception module for receiving a speed command of advance or fast return
  • an extraction module for extracting, from said stream of video data packets, coded pictures and acceleration information for each of said coded pictures
  • a decoding module for decoding the coded video images whose acceleration information contains a speed of advance or fast return equal to said speed or fast forward speed setpoint or, in the absence of such images, , for decoding the coded video images whose acceleration information contains the nearest fast or fast return speed in absolute value of said speed or fast forward speed setpoint.
  • FIG. 1 illustrates a first hierarchical group structure of images
  • FIGS. 2A to 2D illustrate other hierarchical image group structures whose composition varies as a function of the complexity and the amplitude of the movement in the group of images;
  • FIG. 3 represents a flowchart of the steps of the method of the invention;
  • FIG. 4 illustrates a hierarchical image group structure in which the period between images I or P within the group of images varies;
  • FIG. 5 diagrammatically represents an encoder able to implement the method of the invention.
  • the invention proposes to add in the stream of coded images H264 information, called acceleration, information on the acceleration speeds supported by the image to be decoded. Because of the hierarchical structure of the images between them in the GOP, these speeds of acceleration are dichotomous: x2, x4, x8, xl6 in the case of figure 1.
  • the following table represents the acceleration information associated with each image of the GOP structure of Figure 1.
  • Such acceleration information is introduced, for each image of the GOP, into the stream of coded images (stream H264).
  • this information is for example in the form of a bit stream, each bit of the bit stream being associated with a possible speed of acceleration.
  • a bit is 1, it means that the image must be decoded to obtain the acceleration rate associated with this bit during decoding.
  • the acceleration information in the previous table indicates that the GOP image I in Figure 1 needs to be decoded for acceleration velocities x2, x4, x8 and xl6, that the P-image must be decoded for the acceleration rates x2, x4 and x8, that the images Br2 must be decoded for the acceleration rates x2 and x4, and that the BrI images must be decoded for the acceleration rate x2.
  • the acceleration information is preferably associated with an unencrypted transport layer and is introduced into the header of the data packets, for example in the AU_information structure defined by DVB ETSI TS 101154.
  • FIG. 3 represents a flowchart of the steps of the method of the invention implemented in an encoder.
  • the coder analyzes a group of consecutive images and determines, for the latter, a hierarchical structure adapted to the content of the images.
  • the encoder determines in particular one type of image for each of them.
  • the encoder performs on the video images to be encoded correlation measurements between images (accumulation of absolute differences between pixels of the same geographical positions on images spaced by 1, 2 and 3 images). From these measurements, it selects one type of image, among types I, P, Br3, Br2, BrI, B, for each image.
  • the images to be encoded are coded according to their I, P, Br3, Br2, BrI, B image type in accordance with the H264 standard.
  • This coding step comprises a preliminary step of rearranging the images according to their type so that the images serving as reference to at least one other image are arranged before this image in the stream.
  • This coding step with image rearrangement is well known to those skilled in the art and will not be described in detail here.
  • a third step E3 which can be performed in parallel with step E2, an acceleration information is determined for each image.
  • This acceleration information is determined from the type of the image.
  • the basic principle of this step is the following for a GOP structure comprising images I, P, Br2, BrI and B: the images BrI are to be decoded to obtain an acceleration rate x2, the images Br2 are to be decoded for obtain the acceleration rates x2 and x4, the images P are to be decoded to obtain the acceleration rates x2, x4 and x8 and the image I is to be decoded for obtain acceleration rates x2, x4, x8 and xl6.
  • This case corresponds to the table defined previously for the structure of FIG. 1.
  • the images BrI are to be decoded to obtain a speed of acceleration x2
  • the images Br2 are to be decoded to obtain the acceleration rates x2 and x4
  • the images Br3 are to be decoded to obtain the acceleration rates x2, x4 and x8
  • the image P is to be decoded is to obtain the acceleration rates x2, x4, x8 and x16
  • the image I is to be decoded to obtain the acceleration rates x2, x4, x8, x16 and x32.
  • the acceleration information also advantageously depends on the minimum difference between two consecutive I or P images within the GOP. GOP.
  • the values of acceleration speeds defined previously for the images I, P, Br3, Br2, Br1 and B are then corrected as a function of this minimum difference. More precisely, the number of acceleration speeds is reduced if this minimum difference is small. If this difference is 2, then only the speed x2 is maintained for the I, P and Br2 images. If this difference is equal to 4, only the velocities x2 and x4 are maintained for the images I and P, and if this difference is equal to 8, only the velocities x2, x4 and x8 are maintained.
  • This case where the period p between two consecutive I or P images varies within the GOP is illustrated in FIG. 4.
  • This structure comprises I, P, Br 2, Br I and B images.
  • the minimum difference between two images I or P The acceleration rate values are then corrected as indicated above.
  • the following acceleration information is then obtained for this GOP structure:
  • the acceleration rates for the P and Br2 images are limited to x2 and x4 and for image I they are limited to x2, x4 and x24.
  • the coded video images are encapsulated in packets according to the MPEG2 System, ISO / IEC 13818-1 standard.
  • the acceleration information determined for this image is introduced into the header of at least one data packet relating to this coded picture.
  • this acceleration information is introduced into the user section of the header of the first packet of the image.
  • this acceleration information is for example introduced into the AU_information structure defined in each image by the DVB ETSI TS 101154 standard.
  • a decoder receiving a stream of data packets generated according to the method described above is able to identify immediately during the decoding of the image I the possible acceleration speeds to decode this stream. It is also able to define, from the set of GOP image acceleration information, the images to be decoded to best satisfy the acceleration requested by the user.
  • the decoder can thus at each image I define the speed of acceleration closest to that requested by the user because, due to the dynamic appearance of the structure of the GOP, it is possible that all speeds requested by the user are not accessible in the video stream.
  • the following example which corresponds to the GOP structure of FIG. 2D, is a case where the coder has chosen a GOP structure adapted to video content with strong and / or complex movements.
  • the decoder must choose either to limit it to x2 or to shift to x16. If the decoder chooses the speed of acceleration closest to the speed requested by the user, he chooses the speed x2. The decoder may also choose to alternate between the speed x2 and the speed x16 to obtain an average acceleration rate equal to the speed requested by the user.
  • FIG. 5 represents the diagram of a video encoder (also called video encoder) capable of implementing the method of the invention described above.
  • the represented modules are functional units, which may or may not correspond to physically distinguishable units.
  • these modules or some of them may be grouped into a single component, or be functionalities of the same software.
  • some modules may be composed of separate physical entities. Most of these modules have internal or external memory (not shown) to temporarily store data.
  • the video encoder comprises a first module 10 for analyzing video images received in baseband.
  • This analysis module performs correlation measurements between the images of a first group of images and determines, from these correlation measurements, a hierarchical structure of GOP and thus a type of image for each of the images of the group. .
  • a module 20 is then provided to rearrange the images according to their type so that the images serving as reference to another image are arranged before this image in the stream.
  • the stream of rearranged images is then delayed by a delay module.
  • the applied delay is equal to the number of GOP images. This delay is necessary to calculate the minimum difference between two consecutive I or P images within the GOP.
  • the delayed image stream is then processed by a module 40 for encoding images according to their type according to the H264 standard.
  • a module 50 is provided for determining the acceleration information for each of the GOP images. This acceleration information is determined for each image from its type and possibly the minimum distance between two images I or P in the GOP.
  • a packetization module 60 is provided for encapsulating the coded images in video data packets in accordance with the MPEG2 System, ISO / IEC 13818-1 standard. This module also introduces into the user section of the header of the first packet relating to each image the acceleration information determined previously for this image.
  • the delay module 30 may be disposed at other positions between the analysis module 10 and the packetization module 60. It can be placed between the modules 10 and 20 or between the modules 40 and 60.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Selon la demande, on rajoute dans le flux d'images codées H264 une information, dite d'accélération, renseignant sur les vitesses d'accélération (x2,x4,x8,x16... ) supportées par chaque image du flux à décoder. Cette information d'accélération est introduite dans l' en-tête d'au moins un des paquets de données vidéo de l'image. Lorsque le décodeur reçoit ce flux de paquets de données vidéo, les informations d'accélération contenues dans les paquets des images lui permettent d'obtenir directement, sans décodage préalable des images, les vitesses d'avance ou de retour rapide possibles pour décoder le flux ainsi que les images à décoder pour chacune des vitesses. L'objet de la demande est plus particulièrement destinée à améliorer le fonctionnement des décodeurs numériques vidéo ne disposant pas de capacité de décodage plus rapide que le temps réel.

Description

GENERATION DE FLUX DE PAQUETS DE DONNEES VIDEO CONTENANT DES INFORMATIONS D'ACCELERATION POUR LE
DECODAGE
Domaine de l'invention
La présente invention concerne un procédé de traitement d'une séquence d'images vidéo dans un codeur vidéo pour générer un flux de paquets de données vidéo destiné à être décodé par un décodeur numérique. L'invention est destinée à améliorer le fonctionnement des décodeurs numériques vidéo ne disposant pas de capacité de décodage plus rapide que le temps réel.
Arrière-plan technologique
Les décodeurs numériques vidéo sont couramment équipés de disque de stockage, ce qui permet une relecture ultérieure des données vidéo. Pour cela, le flux vidéo codé est stocké dès réception sur le disque de stockage puis relu pour être décodé lors du visionnage. La lecture à partir d'un disque de stockage apporte la possibilité de fonctions avancées comme l'avance rapide (AR) et le retour rapide (RR). Cependant, ces fonctions AR/RR ne sont possibles qu'à condition de pouvoir décoder très rapidement les images du flux vidéo. Deux solutions sont envisageables pour cela: soit le décodeur dispose d'une capacité de décodage plus rapide que le temps réel et il peut alors décoder toutes les images pour n'en afficher que le nombre requis pour la vitesse d'affichage demandée par l'utilisateur, soit le décodeur ne dispose pas d'une capacité de décodage plus rapide que le temps réel et il ne décode qu'une partie des images du flux vidéo codé.
La présente invention est destinée aux décodeurs ne disposant pas de capacité de décodage plus rapide que le temps réel et s'applique tout particulièrement au flux vidéo codé selon la norme H264 (AVC/MPEG4).
Un flux vidéo H264 introduit des relations d'interdépendance dans le codage, et par là- même dans le décodage, des images. Ces relations permettent de réduire considérablement la quantité d'informations nécessaires à la transmission ou au stockage d'images successives fortement corrélées temporellement. Ce codage basé sur des techniques dites de prédiction avec compensation de mouvement permet de déduire avec un minimum d'informations additionnelles la plupart des images vidéo à partir de ses voisines. Il existe donc une interdépendance des images qui permet de les hiérarchiser.
Dans la suite de la présente description, on considérera une hiérarchie comportant 4 types d'images:
- les images I (pour Intra) qui n'ont aucune dépendance avec les autres images et qui, de ce fait, constituent des points d'accès au décodage d'un flux vidéo; ces images servent généralement de référence aux autres images du flux vidéo;
- les images P (pour Prédites) dont le décodage se fait en référence à des images I ou P précédemment décodées du le flux vidéo; - les images Br (pour Bidirectionnelles références) dont le décodage se fait en référence à des images I ou P ou Br du flux vidéo; elles sont dites bidirectionnelles car elles s'appuient sur des images situées en amont et en aval dans le flux vidéo et servent de référence pour le décodage d'autres images; - les images B (pour Bidirectionnelles) dont le décodage se fait en référence à des images I, P ou Br du flux vidéo; elles sont dites bidirectionnelles car elles s'appuient sur des images situées en amont et en aval dans le flux vidéo mais ne servent pas de référence pour le décodage des autres images du flux. Ces relations d'interdépendance sont montrées sur la figure
1 pour un groupe d'images successives comportant 16 images. Dans cette figure, les flèches indiquent les relations de dépendance prédictive entre les images. Une image pointant sur une autre image indique que le décodage (ou codage) de l'image qui pointe dépend temporellement de l'image pointée. Dans cette figure, les images sont représentées dans l'ordre temporel. Dans l'exemple de la figure 1, deux niveaux hiérarchiques sont définis pour les images de type Br: le décodage des images Br de niveau 2, notées Br2, se fait uniquement en référence à des images I ou P et le décodage des images Br de niveau 1 , notées BrI , se fait uniquement en référence à des images I, P ou Br2. A noter que les dernières images Br2, BrI et B du groupe d'images se réfèrent à une image I du groupe d'images suivant.
Cette figure 1 montre que cette organisation hiérarchique des prédictions entre images présente un intérêt pour réaliser des applications de décodage accéléré. En effet, un décodage des images I et P uniquement permet un décodage accéléré de rapport 8 par rapport à un décodage temps réel. De la même façon, un décodage des images I, P et Br2 uniquement permet un décodage accéléré de rapport 4 par rapport à un décodage temps réel. Enfin, un décodage des images I, P, Br2 et BrI uniquement permet un décodage accéléré de rapport 2 par rapport à un décodage temps réel.
Si cette organisation hiérarchique constitue un apport évident pour la réalisation de fonctions d'avance rapide dans le décodeur numérique, il convient néanmoins de noter que le choix de l'organisation hiérarchique, c'est-à-dire le nombre de niveaux hiérarchiques, a un impact sensible sur la performance du codage en termes de qualité de rendu des images, les solutions de codage les plus performantes consistant à rendre dynamique la structure du groupe d'images (ou GOP en langue anglaise pour Group of Pictures) en l'ajustant au mieux au contenu des images à coder.
En effet, d'un point de vue purement intuitif, il est compréhensible d'imaginer qu'une baisse de la fréquence des images I et P rend l'apport de la prédiction temporelle moins efficace pour le codage. En effet, l'éloignement des images I ou P entre elles augmente les distorsions spatiales liées aux déplacements des objets et/ou de la caméra dans la scène. Ainsi, plus les scènes présentent des mouvements complexes et importants, plus il convient de réduire la période entre images I ou P lorsque l'on cherche à optimiser la performance de codage.
Les figures 2A à 2D montrent différentes structures de GOP définies en fonction du contenu vidéo des images de ce GOP.
La figure 2A montre une première structure de GOP comprenant 32 images et 6 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, une image P, 2 images Br3 (images Br de niveau 3), quatre images Br2 (images Br de niveau 2), huit images BrI (images Br de niveau 1) et seize images B. Une image I ou P apparaît toutes les 16 images. Cette structure est adaptée pour les mouvements très lents et peu complexes.
La figure 2B montre une deuxième structure de GOP comprenant 16 images et 5 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, deux images P, deux images Br2 (images Br de niveau 2), quatre images BrI (images Br de niveau 1) et huit images B. Une image I ou P apparaît dans le GOP toutes les 8 images. Cette structure est adaptée pour les mouvements lents et moyennement complexes.
La figure 2C montre une troisième structure de GOP comprenant 16 images et 4 niveaux hiérarchiques. Le GOP comprend plus précisément une image I, quatre images P, quatre images BrI (images Br de niveau 1) et huit images B. Une image I ou P apparaît dans le GOP toutes les 8 images. Cette structure est adaptée pour les mouvements moyens et/ou complexes.
La figure 2D montre une quatrième structure de GOP comprenant 16 images et 4 niveaux de hiérarchie. Le GOP comprend plus précisément une image I, huit images P et huit images B. Une image I ou P apparaît dans le GOP toutes les 4 images. Cette structure est adaptée pour les mouvements forts et/ou très complexes.
En référence à ces figures, on remarque que le nombre de niveaux hiérarchiques se réduit au fur et à mesure que la complexité et/ou l'amplitude du mouvement des objets et/ou de la caméra dans la scène filmée s'intensifie(nt).
Si l'utilisation de structures dynamiques de GOP hiérarchique adaptées au contenu vidéo permet d'améliorer la performance du codage, elle rend la gestion des fonctions de décodage accéléré difficile à gérer. En effet, les dépendances entre les images du GOP étant variables, la norme H264 ne permet pas actuellement au décodeur de disposer d'informations pertinentes et facilement accessibles pour déterminer à tout instant les images qu'il doit décoder pour atteindre la vitesse d'accélération demandée par l'utilisateur. La seule solution consiste à effectuer un décodage d'au moins une partie du flux vidéo pour accéder à ces informations pertinentes. Ce décodage est coûteux en ressources, notamment si un cryptage est réalisé sur les données lors de leur transport et/ou stockage. Pour remédier à ce problème, la norme DVB ETSI TS 101154 a défini une structure de données appelée AU_information. Cette structure de données est placée sur une couche non cryptée de la paquétisation (section utilisateur de la couche de transport MPEG2 ISO/IEC 13181-1) et fournit des informations au décodeur pour faciliter l'accès aux images. Mais, avec la norme DVB ETSI TS 101154 telle qu'elle existe actuellement, le décodeur est uniquement en mesure de connaître le type des images IfPfB et de savoir si l'image sert de référence (champ AU_ref_pic_idc de la structure AU_information) à une autre image. Ce champ permet simplement de distinguer une image Br (champ AU_ref_pic_idc non nul) d'une image B (champ AU_ref_pic_idc nul). A partir de ces informations, le décodeur n'est pas en mesure de déterminer les relations d'interdépendance entre les images du GOP, surtout si les images bidirectionnelles comportent plusieurs niveaux hiérarchiques et si la structure du GOP est variable.
Résumé de l'invention
Un objet de l'invention est de proposer une solution permettant au décodeur de connaître à tout instant les accélérations de décodage couvertes par chacune des images codées. Selon l'invention, on introduit, pour chaque image du flux vidéo H264, une information dite d'accélération renseignant sur les vitesses d'accélération (x2,x4,x8,xl6,...) pour lesquelles cette image est à décoder. Cette information est introduite par le codeur dans les paquets du flux vidéo. Aussi la présente invention a pour objet un procédé de traitement d'au moins un groupe d'images consécutives d'une séquence d'images vidéo dans un codeur vidéo destiné à générer un flux de paquets de données vidéo en vue de leur stockage ou de leur transport, caractérisé en ce qu'il comprend les étapes suivantes: - analyser ledit groupe d'images consécutives de manière à attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe, - coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,
- déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et
- générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet se rapportant à l'image vidéo correspondante.
Lorsque le décodeur reçoit ce flux de paquets de données vidéo, les informations d'accélération contenues dans les paquets des images lui permettent d'obtenir directement, sans décodage préalable des images, les vitesses d'avance ou de retour rapide possibles pour décoder le flux ainsi que les images à décoder pour chacune des vitesses.
Selon une particularité de l'invention, l'information d'accélération de chaque image vidéo est déterminée à partir de son type d'image.
Selon un mode de réalisation particulier, les images vidéo sont codées conformément à la norme H264 et le type des images vidéo est sélectionné parmi les types I, P, Br (avec plusieurs niveaux hiérarchiques possibles BrI, Br2...) et B.
Selon un mode de réalisation avantageux, l'information d'accélération d'une image vidéo est en outre déterminée en fonction de l'écart minimum entre deux images de type I ou P consécutives dans le groupe d'images pour tenir compte des cas où la période entre deux images I ou P varie au sein du GOP.
Selon un mode de réalisation particulier, les paquets générés sont conformes à la norme ISO/IEC 13818-1 et l'information d'accélération est introduite dans la structure AU_information définie par la norme DVB ETSI TS 101154. L'invention concerne également un procédé de décodage d'un flux de paquets de données vidéo généré selon le procédé de traitement décrit précédemment, caractérisé en ce qu'il comprend les étapes suivantes:
- recevoir une consigne de vitesse d'avance ou de retour rapide;
- extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et
- décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, en l'absence de telles images, décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.
L'invention concerne également un encodeur vidéo destiné à traiter au moins un groupe d'images consécutives d'une séquence d'images vidéo et à générer un flux de paquets de données vidéo, caractérisé en ce qu'il comprend:
- un module d'analyse pour analyser ledit groupe d'images consécutives et attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,
- un module de codage pour coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,
- un module de détermination pour déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et - un module de génération pour générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en- tête d'au moins un paquet de données vidéo de ladite image vidéo.
Enfin, l'invention concerne un décodeur vidéo apte à décoder un flux de paquets de données vidéo généré par l'encodeur vidéo défini précédemment, caractérisé en ce qu'il comprend:
- un module de réception pour recevoir une consigne de vitesse d'avance ou de retour rapide;
- un module d'extraction pour extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et
- un module de décodage pour décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, en l'absence de telles images, pour décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.
Brève description des figures
L'invention sera mieux comprise, et d'autres buts, détails, caractéristiques et avantages apparaîtront plus clairement au cours de la description explicative détaillée qui va suivre de modes de réalisation particuliers actuellement préférés de l'invention, en référence aux figures annexées, parmi lesquels :
- la figure 1 illustre une première structure hiérarchique de groupe d'images;
- les figures 2 A à 2D illustrent d'autres structures hiérarchiques de groupe d'images dont la composition varie en fonction de la complexité et de l'amplitude du mouvement dans le groupe d'images; - la figure 3 représente un organigramme des étapes du procédé de l'invention ; - la figure 4 illustre une structure hiérarchique de groupe d'images dans laquelle la période entre images I ou P à l'intérieur du groupe d'images varie ; et
- la figure 5 représente schématiquement un codeur apte à mettre en œuvre le procédé de l'invention.
Description détaillée de l'invention
L'invention propose de rajouter dans le flux d'images codées H264 une information, dite d'accélération, renseignant sur les vitesses d'accélération supportées par l'image à décoder. Du fait de la structure hiérarchique des images entre elles dans le GOP, ces vitesses d'accélération sont dichotomiques : x2, x4, x8, xl6 dans le cas de la figure 1. On rajoute à ces vitesses d'accélération, les vitesses rendues possible par le décodage des images I uniquement et qui correspondent à toutes les tailles de GOP, à savoir dans notre exemple toutes les vitesses multiples de 8: x24, x32, x40 .... Dans le tableau qui suit, on s'arrête à la vitesse d'accélération x32.
Le tableau qui suit représente l'information d'accélération associée à chaque image de la structure de GOP de la figure 1.
Figure imgf000011_0001
Une telle information d'accélération est introduite, pour chaque image du GOP, dans le flux d'images codées (flux H264). Comme montré dans le tableau précédent, cette information se présente par exemple sous la forme d'un train binaire, chaque bit du train binaire étant associé à une vitesse d'accélération possible. Lorsque, dans ce train binaire, un bit est à 1, cela signifie que l'image doit être décodée pour obtenir la vitesse d'accélération associée à ce bit lors du décodage. Les informations d'accélération contenues dans le tableau précédent indiquent que l'image I du GOP de la figure 1 doit être décodée pour les vitesses d'accélération x2, x4, x8 et xl6, que l'image P doit être décodée pour les vitesses d'accélération x2, x4 et x8, que les images Br2 doivent être décodées pour les vitesses d'accélération x2 et x4, et que les images BrI doivent être décodées pour la vitesse d'accélération x2. L'information d'accélération est de préférence associée à une couche de transport non cryptée et est introduite dans l' en-tête des paquets de données, par exemple dans la structure AU_information définie par la norme DVB ETSI TS 101154.
La figure 3 représente un organigramme des étapes du procédé de l'invention mise en œuvre dans un codeur.
Selon une première étape El, le codeur analyse un groupe d'images consécutives et détermine, pour celui-ci, une structure hiérarchique adaptée au contenu des images. Le codeur détermine en particulier un type d'image pour chacune d'entre elles. Pour cela, le codeur réalise sur les images vidéo à coder des mesures de corrélation entre images (accumulation des différences absolues entre pixels de mêmes positions géographiques sur des images espacées de 1, 2 et 3 images). A partir de ces mesures, il sélectionne un type d'image, parmi les types I, P, Br3, Br2, BrI, B, pour chaque image. Selon une deuxième étape E2, les images à coder sont codées selon leur type d'image I, P, Br3, Br2, BrI, B conformément à la norme H264. Cette étape de codage comprend une étape préalable de réarrangement des images en fonction de leur type pour que les images servant de référence à au moins une autre image soient disposées avant cette image dans le flux. Cette étape de codage avec réarrangement des images est bien connue de l'homme du métier et ne sera donc pas décrite en détail ici.
Selon une troisième étape E3, qui peut être effectuée parallèlement à l'étape E2, on détermine une information d'accélération pour chaque image. Cette information d'accélération est déterminée à partir du type de l'image. Le principe de base de cette étape est le suivant pour une structure de GOP comportant des images I, P, Br2, BrI et B: les images BrI sont à décoder pour obtenir une vitesse d'accélération x2, les images Br2 sont à décoder pour obtenir les vitesses d'accélération x2 et x4, les images P sont à décoder pour obtenir les vitesses d'accélération x2, x4 et x8 et l'image I est à décoder pour obtenir les vitesses d'accélération x2, x4, x8 et xl6. Ce cas correspond au tableau défini précédemment pour la structure de la figure 1. Dans le cas d'une structure de GOP comportant des images I, P, Br3, Br2, BrI et B: les images BrI sont à décoder pour obtenir une vitesse d'accélération x2, les images Br2 sont à décoder pour obtenir les vitesses d'accélération x2 et x4, les images Br3 sont à décoder pour obtenir les vitesses d'accélération x2, x4 et x8, l'image P est à décoder est pour obtenir les vitesses d'accélération x2, x4, x8 et xl6 et l'image I est à décoder pour obtenir les vitesses d'accélération x2, x4, x8, xl6 et x32.
Pour tenir compte des structures de GOP dans lesquelles la période p entre deux images I ou P consécutives varie au sein du GOP, l'information d'accélération dépend en outre avantageusement de l'écart minimum entre deux images I ou P consécutives au sein du GOP. Dans ce cas, les valeurs de vitesses d'accélération définies précédemment pour les images I, P, Br3, Br2, BrI et B sont ensuite corrigées en fonction de cet écart minimum. Plus précisément, le nombre de vitesses d'accélération est réduit si cet écart minimum est faible. Si cet écart vaut 2, alors seule la vitesse x2 est maintenue pour les images I, P et Br2. Si cet écart vaut 4, seules les vitesses x2 et x4 sont maintenues pour les images I et P, et si cet écart vaut 8, seules les vitesses x2, x4 et x8 sont maintenues.
Ce cas où la période p entre deux images I ou P consécutives varie au sein du GOP est illustré par la figure 4. Cette structure comporte des images I, P, Br2, BrI et B. L'écart minimum entre deux images I ou P consécutives est égal à 4. Les valeurs de vitesse d'accélération sont alors corrigées comme indiqué précédemment. On obtient alors les informations d'accélération suivantes pour cette structure de GOP:
Figure imgf000013_0001
Dans cet exemple, les vitesses d'accélération pour les images P et Br2 se limitent à x2 et x4 et, pour l'image I, elles se limitent à x2, x4 et x24.
Selon une quatrième étape E4, les images vidéo codées sont encapsulées dans des paquets selon la norme MPEG2 System, ISO/IEC13818-1. Pour chaque image codée, on introduit dans l'en-tête d'au moins un paquet de données se rapportant à cette image codée l'information d'accélération déterminée pour cette image. Avantageusement, on introduit cette information d'accélération dans la section utilisateur de l'en-tête du premier paquet de l'image. Comme indiqué précédemment, cette information d'accélération est par exemple introduite dans la structure AU_information définie à chaque image par la norme DVB ETSI TS 101154.
Ainsi, selon l'invention, un décodeur recevant un flux de paquets de données générés selon le procédé décrit précédemment est en mesure d'identifier immédiatement lors du décodage de l'image I les vitesses d'accélération possibles pour décoder ce flux. Il est aussi capable de définir, à partir de l'ensemble des informations d'accélération des images du GOP, les images à décoder pour satisfaire au mieux l'accélération demandée par l'utilisateur.
En mode opératoire, le décodeur peut ainsi à chaque image I définir la vitesse d'accélération la plus proche de celle demandée par l'utilisateur car, du fait de l'aspect dynamique de la structure du GOP, il se peut que toutes les vitesses d'accélération demandées par l'utilisateur ne soient pas accessibles dans le flux vidéo.
L'exemple qui suit, qui correspond à la structure de GOP de la figure 2D, est un cas où le codeur a choisi une structure de GOP adaptée à un contenu vidéo à mouvements forts et/ou complexes.
Figure imgf000014_0001
Dans ce cas, si l'utilisateur demande une vitesse d'accélération x4 à l'affichage, le décodeur doit choisir soit de la limiter à x2, soit de passer à xl6. Si le décodeur choisit la vitesse d'accélération la plus proche de la vitesse demandée par l'utilisateur, il choisit la vitesse x2. Le décodeur peut également choisir d'alterner entre la vitesse x2 et la vitesse xl6 pour obtenir une vitesse d'accélération moyenne égale à la vitesse demandée par l'utilisateur.
A noter que cette limitation de qualité de service est la conséquence d'un choix de la part l'opérateur qui émet le flux de privilégier la performance de codage. Si l'opérateur souhaite privilégier à tout instant le nombre de vitesses d'accélérations du mode spécial (ou trick mode en langue anglaise) du décodeur, il peut demander à ce que le codeur réalisant l'organisation en GOP emploie des structures de GOP permettant un plus grand nombre d'accélérations. La contrepartie de ce grand nombre de vitesses d'accélérations est la réduction du nombre de structures de GOP possibles.
La figure 5 représente le schéma d'un codeur vidéo (appelé également encodeur vidéo) apte à mettre en œuvre le procédé de l'invention décrit précédemment. Dans ce schéma, les modules représentés sont des unités fonctionnelles, qui peuvent ou non correspondre à des unités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant, ou constituer des fonctionnalités d'un même logiciel. A contrario, certains modules peuvent être éventuellement composés d'entités physiques séparées. La plupart de ces modules ont une mémoire interne ou externe (non représentée) pour stocker temporairement des données.
L'encodeur vidéo comprend un premier module d'analyse 10 d'images vidéo reçues en bande de base. Ce module d'analyse réalise des mesures de corrélation entre les images d'un premier groupe d'images et détermine, à partir de ces mesures de corrélation, une structure hiérarchique de GOP et donc un type d'image pour chacune des images du groupe.
Un module 20 est ensuite prévu pour réarranger les images en fonction de leur type de manière à ce que les images servant de référence à une autre image soient disposées avant cette image dans le flux.
Le flux des images réarrangées est ensuite retardé par un module 30 de retard. Le retard appliqué est égal au nombre d'images du GOP. Ce retard est nécessaire pour calculer l'écart minimum entre deux images I ou P consécutives au sein du GOP.
Le flux d'images retardé est ensuite traité par un module 40 destiné à coder pour les images selon leur type conformément à la norme H264. Un module 50 est prévu pour déterminer l'information d'accélération pour chacune des images du GOP. Cette information d'accélération est déterminée pour chaque image à partir de son type et éventuellement de l'écart minimum entre deux images I ou P dans le GOP. Enfin, un module 60 de paquetisation est prévu pour encapsuler les images codées dans des paquets de données vidéo conformément à la norme MPEG2 System, ISO/IEC13818-1. Ce module introduit également dans la section utilisateur de l'en-tête du premier paquet de rapportant à chaque image l'information d'accélération déterminée précédemment pour cette image.
A noter que le module de retard 30 peut être disposé à d'autres positions entre le module 10 d'analyse et le module 60 de paquetisation. Il peut être placé entre les modules 10 et 20 ou entre les modules 40 et 60. Bien que l'invention ait été décrite en liaison avec différents exemples de structures de GOP, il est bien évident qu'elle n'y est nullement limitée et qu'elle est applicable à tout type de structure de GOP.

Claims

REVENDICATIONS
1. Procédé de traitement d'au moins un groupe d'images consécutives d'une séquence d'images vidéo dans un codeur vidéo destiné à générer un flux de paquets de données vidéo en vue de leur stockage ou de leur transport, caractérisé en ce qu'il comprend les étapes suivantes:
- analyser (El) ledit groupe d'images consécutives de manière à attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,
- coder (E2) lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées,
- déterminer (E3) une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et
- générer (E4), à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet de données vidéo de ladite image vidéo.
2. Procédé selon la revendication 1, caractérisé en ce que l'information d'accélération d'une image vidéo est déterminée à partir du type d'image de ladite image vidéo.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que les images vidéo sont codées conformément à la norme H264.
4. Procédé selon la revendication 3, elle-même dépendante de la revendication 2, caractérisé en ce que l'information d'accélération d'une image vidéo est en outre déterminée en fonction de l'écart minimum entre deux images de type I ou P consécutives dans le groupe d'images.
5. Procédé selon l'une des revendications précédentes, caractérisé en ce que les paquets générés sont conformes à la norme ISO/IEC 13818-1.
6. Procédé selon la revendication 5, caractérisé en ce que l'information d'accélération de chaque image est introduite dans la structure AU_information définie par la norme DVB ETSI TS 101154.
7. Procédé de décodage d'un flux de paquets de données vidéo généré selon le procédé de traitement selon l'une des revendications 1 à 6, caractérisé en ce qu'il comprend les étapes suivantes:
- recevoir une consigne de vitesse d'avance ou de retour rapide; - extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et
- décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, à défaut, décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.
8. Encodeur vidéo destiné à traiter au moins un groupe d'images consécutives d'une séquence d'images vidéo et à générer un flux de paquets de données vidéo, caractérisé en ce qu'il comprend:
- un module d'analyse (10) pour analyser ledit groupe d'images consécutives et attribuer un type d'image à chaque image vidéo dudit groupe, le type d'image de chaque image vidéo définissant la dépendance entre ladite image vidéo et les autres images vidéo dudit groupe,
- un module de codage (20, 30, 40) pour coder lesdites images du groupe en fonction de leur type d'image de manière à générer des images vidéo codées, - un module de détermination (50) pour déterminer une information, dite d'accélération, pour chaque image vidéo du groupe, ladite information d'accélération indiquant les vitesses d'avance ou de retour rapide pour lesquelles l'image vidéo codée correspondante est à décoder lors du décodage du groupe d'images, et
- un module de génération (60) pour générer, à partir desdites images codées, un flux de paquets de données vidéo, l'information d'accélération de chaque image vidéo du groupe étant introduite dans l'en-tête d'au moins un paquet de données vidéo de ladite ima *g&e"- vidéo.
9. Décodeur vidéo apte à décoder un flux de paquets de données vidéo généré par l'encodeur vidéo selon la revendication 8, caractérisé en ce qu'il comprend: - un module de réception pour recevoir une consigne de vitesse d'avance ou de retour rapide;
- un module d'extraction pour extraire, à partir dudit flux de paquets de données vidéo, des images codées et une information d'accélération pour chacune desdites images codées; et - un module de décodage pour décoder les images vidéo codées dont l'information d'accélération contient une vitesse d'avance ou de retour rapide égale à ladite consigne de vitesse d'avance ou de retour rapide ou, à défaut, pour décoder les images vidéo codées dont l'information d'accélération contient la vitesse d'avance ou de retour rapide la plus proche en valeur absolue de ladite consigne de vitesse d'avance ou de retour rapide.
PCT/EP2009/067804 2008-12-31 2009-12-22 Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage WO2010076269A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0859156A FR2940737A1 (fr) 2008-12-31 2008-12-31 Generation de flux de paquets de donnees video contenant des informations d'acceleration pour le decodage
FR0859156 2008-12-31

Publications (1)

Publication Number Publication Date
WO2010076269A1 true WO2010076269A1 (fr) 2010-07-08

Family

ID=40929591

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2009/067804 WO2010076269A1 (fr) 2008-12-31 2009-12-22 Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage

Country Status (2)

Country Link
FR (1) FR2940737A1 (fr)
WO (1) WO2010076269A1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003009085A (ja) * 2001-06-20 2003-01-10 Mitsubishi Electric Corp デジタル信号記録装置および方法、デジタル信号再生装置および方法
US20050147375A1 (en) * 2003-01-17 2005-07-07 Shinya Kadono Moving picture coding method and moving picture decoding method
WO2005106875A1 (fr) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. Appareil de generation de flux d'images animees, appareil de codage d'images animees, appareil de multiplexage d'images animees et appareil de decodage d'images animees

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003009085A (ja) * 2001-06-20 2003-01-10 Mitsubishi Electric Corp デジタル信号記録装置および方法、デジタル信号再生装置および方法
US20050147375A1 (en) * 2003-01-17 2005-07-07 Shinya Kadono Moving picture coding method and moving picture decoding method
WO2005106875A1 (fr) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. Appareil de generation de flux d'images animees, appareil de codage d'images animees, appareil de multiplexage d'images animees et appareil de decodage d'images animees

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Digital Video Broadcasting (DVB); Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream European Broadcasting Union Union Européenne de Radio-Télévision EBUÜER; ETSI TS 101 154", ETSI STANDARDS, LIS, SOPHIA ANTIPOLIS CEDEX, FRANCE, vol. BC, no. V1.8.1, 1 July 2007 (2007-07-01), XP014037552, ISSN: 0000-0001 *

Also Published As

Publication number Publication date
FR2940737A1 (fr) 2010-07-02

Similar Documents

Publication Publication Date Title
US9398301B2 (en) Parallel video encoding based on complexity analysis
US10819994B2 (en) Image encoding and decoding methods and devices thereof
EP2238752A1 (fr) Pistes d'enrichissement d'application
FR2894421A1 (fr) Procede et dispositif de decodage d'un flux video code suivant un codage hierarchique
EP1862009B1 (fr) Procede d'envoi de commande a un serveur de flux de donnees numeriques et appareil implementant le procede
FR2849327A1 (fr) Procede et dispositif de decodage audio/video, circuit pilote video et boitier decodeur l'incorporant
EP3225027B1 (fr) Procédé de composition d'une représentation vidéo intermédiaire
US8391688B2 (en) Smooth rewind media playback
FR2932050A1 (fr) Procede et dispositif de transmission de donnees video
FR2930387A1 (fr) Procede de traitement d'un flux de donnees codes
EP3449634B1 (fr) Procédé de composition contextuelle d'une représentation vidéo intermédiaire
FR2891686A1 (fr) Procede et dispositif de detection de transitions dans une sequence video, procede et dispositif de codage, produits programme d'ordinateur et moyens de stockage correspondants.
FR2879387A1 (fr) Procede de transmission a debit binaire variable a travers un canal de transmission.
FR2834178A1 (fr) Procede de decodage de signaux video codes
FR2823943A1 (fr) Procede de detection de bruit dans un flux de donnees video codees
WO2010076269A1 (fr) Génération de flux de paquets de données vidéo contenant des informations d'accélération pour le décodage
EP2870773B1 (fr) Dispositif et procede d'enregistrement de donnees relatifs a une fonction de decalage temporel sur un support d'enregistrement
FR3101503A1 (fr) Gestion du téléchargement progressif adaptatif d’un contenu numérique sur réseau mobile avec sélection d’un débit d’encodage maximum autorisé en fonction d’un godet de données
EP3926929B1 (fr) Procédé de gestion de la lecture d'un contenu numérique au sein d'un terminal lecteur de contenus multimédias connecté à un dispositif de restitution
WO2013163221A1 (fr) Systèmes et procédés pour la diffusion en continu adaptative à transitions de flux vidéo augmentées
EP4104446A1 (fr) Procédé et dispositif de traitement de données de vidéo multi-vues
FR3073350B1 (fr) Procede d'enregistrement, dans une memoire de masse d'un equipement electronique, d'au moins un contenu multimedia
US20130287092A1 (en) Systems and Methods for Adaptive Streaming with Augmented Video Stream Transitions
EP3973714A1 (fr) Restitution d'un contenu en arrière-plan ou sous forme d'incrustation dans le cadre d'un téléchargement progressif adaptatif de type has
FR3114719A1 (fr) Procédé de gestion de la lecture d’un contenu numérique au sein d’un terminal lecteur de contenus multimédias connecté à un dispositif de restitution

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09795790

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09795790

Country of ref document: EP

Kind code of ref document: A1