WO2008132378A2 - Procédé et dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible - Google Patents

Procédé et dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible Download PDF

Info

Publication number
WO2008132378A2
WO2008132378A2 PCT/FR2008/050479 FR2008050479W WO2008132378A2 WO 2008132378 A2 WO2008132378 A2 WO 2008132378A2 FR 2008050479 W FR2008050479 W FR 2008050479W WO 2008132378 A2 WO2008132378 A2 WO 2008132378A2
Authority
WO
WIPO (PCT)
Prior art keywords
coded
coding
zone
zones
image
Prior art date
Application number
PCT/FR2008/050479
Other languages
English (en)
Other versions
WO2008132378A3 (fr
Inventor
Pierre Larbier
Marc Baillavoine
Original Assignee
Ateme Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ateme Sa filed Critical Ateme Sa
Priority to GB0916386A priority Critical patent/GB2459633A/en
Priority to US12/532,384 priority patent/US8279944B2/en
Publication of WO2008132378A2 publication Critical patent/WO2008132378A2/fr
Publication of WO2008132378A3 publication Critical patent/WO2008132378A3/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the invention relates to the coding of video image sequences, in particular the regulation of the coding bit rate of the video coders, with respect to a target bit rate.
  • a sequence of video images is composed of successive images, some of these images, designated I-images, being coded in intraframe mode, or without reference to the past represented by the preceding images of this sequence.
  • images either in Interframe mode, designated images P, then a new image I, and so on.
  • the predictive coding of the images P substantially reduces the volume of coded data, while maintaining a reasonable coding complexity.
  • any image I is by definition autonomous from the point of view coding, since the coding of the latter, non-predictive, does not appeal to the content of any previous image .
  • a stream of images or sequences of video images is said to random access when any image is accessible within a technically acceptable time. If, on the other hand, no image I is inserted in the flow or the sequence of video images, which is technically conceivable, the stream can not be regarded as random access, because access to the content of any image of determined rank theoretically depends on all previous images.
  • the encoding of streams or constant bit rate video sequences is executed from known prior art processes, as shown in FIG. 1b.
  • This process may consist in choosing a determined quantization step Q , which it is estimated a priori that the latter will produce the desired image size.
  • a first loop represented in FIG. 1b, operates at the temporal level of the succession of images by:
  • the second aforementioned loop can operate in a manner similar to that illustrated in Figure Ib, and for this reason, is not shown in the drawing. It thus makes it possible, for each block Bj of the current image, to determine the quantization step Qj applicable to the latter, as a function of its complexity Cj, the model M being adapted once the block Bj has been coded.
  • More recent video encoding standards provide encoding processes for encoding an image I spread over a plurality of P-pictures, referred to as progressive encoding. This new process makes it possible to dispense with the notion of image I.
  • each image of the stream or video sequence is subdivided into zones that are successively coded in blocks in intraframe mode, by ensuring, on the one hand, that at the end of a determined number of successive images all the zones of the image will have been encoded in Intra, the image I having thus been distributed over the determined number of images, and, on the other hand, that the parts of images encoded in Intertram mode do not use the non-image area. still refreshed, in order to preserve the past information of the predictive coding.
  • the video encoder can signal the video decoder that it transmits this type of image in progressive encoding.
  • the video decoder can, on reception, synchronize on these images, to ensure random access to the stream.
  • the process of progressive coding of images I allows, to a certain extent, the respect of a constraint in terms of video image bitrate, while guaranteeing random access to the video stream, the successive coding process of the blocks , according to a geometric scanning of the image, from top to bottom, does not give complete satisfaction and does not allow to respect with a small margin of error the constraint of flow in terms of target image size.
  • T T + ⁇ in which T denotes the size of the real image, after coding, T the estimated size of the image, given by the computational model and ⁇ the absolute encoding error on the size, strictly increasing function of the size T.
  • the object of the present invention is to overcome the drawbacks and limitations of the prior art, with the aim of ensuring as fine a regulation as possible of the flow rate or sequences of video images, in particular coded in progressive coding.
  • Another object of the present invention is also the implementation of a method and a device for regulating the flow coding rate or video image sequences making it possible to minimize the absolute encoding error of any image, regardless of the complexity of the image considered.
  • Another object of the present invention is finally the implementation of the method and the device that are the subject of the invention in an application to remote network video surveillance, thanks to which the fine flow rate regulation makes it possible to avoid any transmission collision. image and promote real-time control of any monitoring organ.
  • the method and the device for regulating the coding rate of video image sequences with respect to a target bit rate, represented by an image target size, objects of the invention operate on video images subdivided into a set of areas to code.
  • the estimated size of the set of fields to code is the size of the coded zones, the estimated size of the zones to be coded and an estimated coding error of the zones to be coded.
  • each consists of, respectively, makes it possible to discriminate, among the zones to be coded from this set of zones to be coded, the coding complexity of each zone to be coded, to classify the zones to be coded according to a determined order of complexity. , successively coding each zone to be coded according to the classification of complexity order, decreasing, successively minimizing the estimated coding error of each zone to be coded, the final size of each image vis-à-vis the target size , and optimizing the video image sequence rate.
  • the method and the device that are the subject of the invention are furthermore remarkable in that, in the context of an application to network video surveillance, including a remote control of a video surveillance camera, from a host terminal by an operator, each consists respectively of allowing, for each current image of rank p belonging to successive sequences of N images l ⁇ p ⁇ N, to subdivide each current image into a set of N superimposed coding zones, each formed by a plurality of pixel lines, discriminating among the zones to be coded the coding complexity of each zone to be coded, choosing one of the zones to be coded as the first zone to be coded and applying an Intratrame coding, with a minimum quantization step, to obtain maximum coding complexity for this first zone to be encoded, coding in interframe coding the zone to be coded immediately greater than this first zone, with application of a step of reduced quantification, to preserve the fineness of coding of this zone, coding in Intertrame coding each of the remaining coding zones, according to their classification of order of complexity,
  • the method and the device of the invention are applicable to video coding technology, network video streaming and their applications, such as, in particular, network video surveillance.
  • FIG. 2a represents, by way of illustration, a general flowchart of FIGS. essential steps allowing the implementation of the method which is the subject of the present invention
  • FIG. 2b represents, by way of illustration, a specific flowchart making it possible to minimize the estimated coding error of each zone to be coded
  • FIG. 3a represents, by way of illustration, a specific flowchart of the essential steps for implementing the method that is the subject of the invention in an application to network video surveillance;
  • FIG. 3b represents, by way of illustration, a specific example of implementation of the method which is the subject of the invention applied to the network video surveillance;
  • FIG. 3c represents, by way of illustration, a representative chronogram, by way of comparison, of the number of bits per image during a typical video surveillance sequence in the absence, respectively, in the presence of the implementation of the method which is the subject of the invention;
  • FIG. 4 represents, by way of illustration, a functional block diagram of a device for regulating the coding bit rate of video image sequences that is the subject of the invention, making it possible to implement the method and / or any application thereof. last to the video surveillance.
  • a more detailed description of the method and device for regulating the coding rate of video image sequences, with respect to a target bit rate represented by an image target size, in accordance with the subject of the present invention. will now be given in connection with Figure 2a and the following figures.
  • the method which is the subject of the invention applies as indicated previously in the description to the regulation of the coding rate of video image sequences vis-à-vis a target bit rate represented by a target size T c of given image.
  • any image F ' K is considered , k denoting the rank of the image considered in the above-mentioned image sequence, each video image being subdivided into a set of zones to be encoded, this together being noted , N denoting the number of zones to be coded in each image F ⁇ considered and Fkj designating each zone to be encoded of the aforementioned image.
  • the estimated size of the set of zones to be coded ⁇ k , i J j ⁇ ⁇ > is a function during the coding process of the size of the zones already coded, the estimated size of the zones to be encoded or remaining to be coded and an estimated coding error of the zones to be coded, the error
  • the method which is the subject of the invention is remarkable in that it consists, at least for each image F i prior to any coding of an area, of discriminating in one step A among the zones to be coded of all the zones to be coded , the coding complexity of each zone to code F ⁇ j.
  • the discrimination operation is noted: Discrimination
  • step A it is understood that the application of a computational model M to the set of areas to be coded Fkj makes it possible to obtain a set of coding complexity coefficients of each zone to be coded, this set being noted.
  • step A The operation of step A is followed by a step B of classifying the zones to be coded according to a determined order of complexity.
  • step B Classification c / fc, kr ⁇ o ⁇ c ⁇ ⁇ £. It will be understood that, by the above-mentioned classification operation, the latter consists in classifying, in order of magnitude, the coding complexity coefficients Cj obtained in step A, the classification by order of magnitude being a priori possible to be carried out in ascending order or descending.
  • step B of FIG. 2a the application of the classification or sorting function of the coding complexity coefficients Cj makes it possible to obtain a set of values sorted in ascending or descending order denoted o ⁇ c o ⁇ Z -
  • step B is then followed by a step C consisting in successively encoding each zone to be coded as a function of the decreasing complexity order classification of the coding complexity coefficients Cj obtained in step B.
  • the aforesaid coding operation consists in fact, as represented in step C of FIG. 2a, in coding by applying a quantization step Q 3 - to each zone to be coded F 1 and successively minimizing estimated coding error ê ⁇ of each zone to be coded F k j, the final size of each image after coding, final size denoted T *, vis-à-vis the target size Tc and finally optimizing the bit rate of the sequence corresponding video images.
  • each zone to be encoded F ⁇ j is encoded successively one after the other without that their complexity is taken into account.
  • / "compared to the target size T c serves to adjust the coding parameters, such as the quantization step for the coding area of current rank i.
  • Minimizing the aforementioned error term thus amounts to minimizing all the coding error values ⁇ t of each zone to be coded F k j.
  • the coding errors ⁇ ⁇ are proportional to the sizes T of each zone and therefore to the complexity of each of the zones to be coded F ⁇ j.
  • the method that is the subject of the invention makes it possible, on the contrary, to cut out a sequence of video images to be encoded in zones to be coded, to classify the complexity of the zones to be encoded and to code the sequence of images. in descending order of complexities, so as to begin coding by the areas occupying the most space and ending with the image areas to be coded occupying the least space.
  • the last zones to be coded then have two advantages: they have a very reliable estimate of the remaining size, and, being of smaller complexity successively, their coding error is small and it is therefore unlikely that the error which affects them results in exceeding the target size of the image Tc and thus buffers.
  • the coding complexity of each zone to be coded Fy is defined as the estimated size, in bytes, occupied by the zone to be encoded above after coding, for a quality of zone and of determined image. .
  • the coding complexity Cj of each zone to be coded can be estimated from at least the quantization step Qj to be applied during the coding and metrics process of the zone to be coded. of the current image F k , vis-à-vis at least one coded area of the previous image.
  • Te denotes the estimated size of the zone to be coded Fy.
  • C represents its complexity typically the sum of absolute value of the differences designated SAD;
  • Q represents the quantization step applied to the zone to be coded Fy ;
  • a and b are parameters related to the sequence of dynamically adjusted images being encoded.
  • the process for minimizing the estimated error of each zone to be coded Fy consists at least of successively adapting the quantization step Qj applied to the coding of each zone to be coded Fy.
  • step C of FIG. 2a mentioned above can consist, as represented in FIG. measuring the remaining size for encoding the image vis-à-vis the target size T c of the image and a step C 2 of performing the operation of predicting the area to be encoded Fy, as shown in FIG. Figure 2b.
  • the aforementioned prediction operation is executed when executing an interframe encoding for example.
  • Step C 3 is then followed by a step C 4 making it possible to execute the actual coding of the zone to be coded F k3 by applying the quantization step Q 3 determined in step C 3 .
  • a return to the execution of steps Ci and C 2 is provided for the coding of the next zone to be encoded as shown in the drawing of FIG. 2b.
  • the method which is the subject of the invention as described above with reference to FIGS. 2a and 2b can be implemented in order to ensure a substantially constant video image encoding rate for the transmission of the latter.
  • the method of the invention applies particularly advantageously to network video surveillance to ensure, in particular, the transmission of image sequences for the control of monitoring organs for example.
  • the video signal that is to say the successive sequences of video images, is compressed for example to the H.264 standard.
  • the video stream must be random access, in particular, to facilitate the visualization of what happened at a given moment or in a range of very short time at course of a given moment and it is then essential that the flow is respected very precisely.
  • the network equipment buffers part of the stream of video images or worse the stream is lost.
  • the video sequence is then delayed compared to the filmed scene and the operator can not effectively control his surveillance camera.
  • the method which is the subject of the invention then consists in coding a part of an image considered in intraframe mode so that the entire image has been coded in intraframe mode after a number N successive images.
  • a stream of video images is considered, each video image being denoted by Fk as noted above, where k denotes the rank of the image for example.
  • Fk the rank of the image for example.
  • Any sequence is considered successive N images in the aforementioned video stream, each image in each sequence of N images being noted F p , where p is actually the rank of each image in the sequence considered.
  • the method that is the subject of the invention applied to video surveillance then consists of a step a to subdivide each current image into a set of N superimposed coding zones, each zone being formed by a plurality of lines of pixels.
  • step a of FIG. 3a the subdivision operation is noted:
  • Step a is followed by a step b consisting in discriminating among the zones to be coded F P j the coding complexity of each zone to be coded. This operation is noted in Figure 3a Discrimination
  • Step b is followed by a step of choosing one of the zones to be coded as the first zone to be coded and applying an intratrame coding with a minimum quantization step to obtain a maximum coding complexity for the first zone to be coded. code above.
  • step c is thus subdivided into two sub-steps C1 of choice of the first zone, denoted First choice zone
  • the index j chosen sj O representing this choice in FIG. 3a.
  • Substep 1 Cl is followed by a substep c2_ of performing intraframe coding of the first selected zone, this operation being written to the c2_ substep:
  • the Intratrame coding applied to the first zone the minimum quantization step noted Qjo is applied, which makes it possible to obtain a maximum coding complexity for the first zone to be coded.
  • step c is then followed by a step of coding in Intertram coding the zone to be coded adjacent immediately greater than the first zone with application of a reduced quantization step to preserve the details of this zone which, at the same time, previous image was encoded in Intratame mode.
  • step d of FIG. 3a The operation in step d of FIG. 3a is noted
  • CodiNTER (Qsj-1, Fpsi-1) •
  • the quantization step Q S ji is decreased with respect to the quantization step Q 30 applied to sub-step c2_ of FIG. 3a to the first zone.
  • Step d is then followed by a step e of coding each of the remaining coding areas in terms of their order of decreasing complexity as described in the description with reference to FIGS. 2b.
  • this operation is performed by successively minimizing the estimated coding error of each zone to be coded remaining and the final size of each current image with respect to the aforementioned target size.
  • step e of FIG. 3a the Intertrame coding operation is noted Inter Coding
  • CodiN T ER (Qnr, F P3r! Jr ⁇ sj, sj -1 .
  • the coding operation is applied with a quantization step Qj r to each of the remaining coding zones of index jr , of course choosing the corresponding quantization step Qj r
  • the quantization step Q 31 - is calculated for each of the remaining zones of rank jr.
  • Step e is then followed by a step f_ of successively repeating the operations a to e for each image of rank p + 1 according to the current image, by choosing as the first zone to be coded one of the zones to be coded from distinct rank, among the p preceding images, of the rank of the coded zones as the first zone to be coded.
  • This mode of operation makes it possible to preserve the random access to the sequences of images.
  • the sub-step ⁇ 2 is followed by a sub step £ 3 of verification that the last image of the sequence of N images is not reached by the test p> N.
  • a return is made in step a for passage to the next image of rank p + 1.
  • the last image of rank N in the image sequence is reached and the process is completed for the sequence of N successive images above, the process of course continuing for any sequence of next images of the video image stream.
  • step cJL of choosing the first image area to be encoded it is indicated that several solutions can be retained for each image of successive rank p in a sequence of N images. According to a first nonlimiting variant, this choice can be made by circular permutation of a zone to be coded among N.
  • this choice can be made for each successive current image by exhaustive pseudo-random drawing of an area to be coded from N- (pl). .
  • the image area, which in the previous image was coded in intraframe mode, is then coded with a reduced quantization step.
  • FIG. 3a An exemplary implementation of the method that is the subject of the invention applied to video surveillance, as represented in FIG. 3a, will now be described with reference to FIG. 3b when applying video surveillance images of a construction site. for example.
  • the image is then cut into arbitrary zones, typically 3 16 ⁇ 16 pixel block lines, ie 48 pixels high along the length of the image for example.
  • the quantization step to be applied Qj 0 , Q a ji or Qj r is modified in
  • the quantization step is increased. Otherwise, it is decreased.
  • the complexity of their areas is adjusted in certain areas by artificially reducing the quantization step in order to promote the quality of these.
  • the first image zone coded in Intraframe is then always supposed to have a higher complexity than those coded in Intertram mode and thus systematically coded first.
  • This zone carries the rank 0 in FIG. 3b and therefore corresponds to the choice of the first zone in step c_l of FIG. 3a.
  • the coding of the zone above this zone chosen first and encoded in intraframe mode is then carried out, this zone carrying the rank 1 in FIG. 3b. This makes it possible to avoid degrading the quality of the areas that have just been refreshed by the Intratrame coding.
  • Refreshed zones are defined as all the zones that have been coded in Intraframe mode since the beginning of the progressive refresh.
  • the remaining zones are then classified according to their complexity and are coded in decreasing order of their complexity in accordance with the method that is the subject of the invention, as previously illustrated and described with reference to FIGS. 2a and 2b.
  • the zones coded in FIG. 3b successively carry the ranks 2, 3, 4 and 5 to 14 according to their complexity and unrelated to their location in the image Fk.
  • this procedure is made possible thanks to several tools that guarantee the independence of the data between the zones.
  • the coding order is not necessarily correlated with the order of sending packets on the network for the transmission of video image sequences.
  • the packets can be coded in an order, that is to say according to their complexity and not according to the geometry of the image, then they can be reorganized and sent in the classical order corresponding to the geometric coding of the aforementioned image.
  • FIG. 3b shows the division of the image into different zones, the choice of the first zone denoted 0 corresponding to the coding in intraframe mode and above this latter being the so-called "constrained" zone whose temporal prediction is limited. to itself, in order to use no data from the area below the Intraframe area.
  • the coding order of the remaining image areas to be encoded remaining is then determined according to the complexity of these areas by means of a criterion of sum of the absolute values of the differences, as described previously in the description.
  • the estimated size T of the image is the estimated size T of the image.
  • the quantization step of each zone is influenced by the estimated size of the image.
  • table T it can be seen that the implementation of the method, which is the subject of the invention, makes it possible to very significantly reduce the error obtained with respect to the standard error, "invention” compared with to "standard ⁇ ”, and thus makes it possible to adjust, very finely, the quantization step for each zone. This results in an image that respects, in a very fine way, the fixed target rate.
  • FIG. 4 A more detailed description of a video image sequence encoding rate control device with respect to a target bit rate, represented by an image target size, according to the object of the present invention and allowing, of course, the implementation of the method which is the subject of the invention will now be given in conjunction with FIG. 4.
  • the device which is the subject of the invention can be integrated into an encoder more complex video or implemented on a stand-alone machine for video coding itself.
  • the video images are subdivided into a set of areas to be coded and the estimated size of the set of areas to be coded is a function of the size of the coded areas, the estimated size of the areas to be coded and a number of areas to be coded. estimated coding error of the zones to be coded, as mentioned previously in the description.
  • the device according to the invention in addition to the conventional elements such as an input / output port, denoted I / O, of digital data representative of a video image to be encoded or of coded data and a central processing unit, denoted CPU, associated with a RAM working memory advantageously comprise a discrimination module Ml for the zones to be encoded of the set of zones to be coded for the coding complexity, a module M2 for classifying the zones to be coded in a decreasing order of complexity and a successive coding module M3 of each zone to be coded, as a function of the above-mentioned complexity order classification, by successively minimizing the estimated error of coding of each zone to be coded, the final size of each image vis-à-vis of the target size and thus optimizing the video image sequence rate.
  • a discrimination module Ml for the zones to be encoded of the set of zones to be coded for the coding complexity
  • a module M2 for classifying the zones to be coded in a decreasing order of complexity
  • the discrimination module M1, the classification module M2 and the successive coding module of each zone to be coded M3 as a function of the complexity order classification are advantageously each formed by a computer program module implanted in a single or multiple program memory module.
  • module M1 among the zones to be encoded of the set of zones to be coded, of the coding complexity of each zone to be coded, it is indicated that the latter can be formed by a programmable memory.
  • Such a programmable memory then makes it possible to adapt the discrimination process of the coding complexity of each zone to be coded according to the content of one or more video image sequences for example.
  • the invention finally covers a computer program product for implementing the method that is the subject of the invention, as described with reference to FIGS. 2a to 3c, such a program product being implemented for execution by a computer, as shown in FIG. 4, in one or more program modules, such as the aforementioned modules Ml, M2 and M3.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

L'invention concerne un procédé et un dispositif de régulation du débit de codage d'images vidéo vis-à-vis d'une taille cible d'image (T<SUB>c</SUB>). Les images (F<SUB>k</SUB>) étant subdivisées en zones à coder (F<SUB>kj</SUB>), on discrimine (A) parmi les zones (F<SUB>kj</SUB>) la complexité (C<SUB>j</SUB>) de codage de chaque zone, classifie (B) les zones à coder (F<SUB>kj</SUB>) selon un ordre de complexité déterminé, code (C) successivement chaque zone (F<SUB>kj</SUB>) en fonction de l'ordre de complexité décroissante, en minimisant successivement l'erreur estimée de codage, de chaque zone (F<SUB>kj</SUB>), la taille finale de chaque image vis- à-vis de la taille cible (T<SUB>c</SUB>) et le débit de séquence d ' images vidéo. Application au codage vidéo d'images de séquences vidéo, notamment à la vidéo surveillance en réseau.

Description

Procédé et dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible
L'invention concerne le codage de séquences d'images vidéo, en particulier la régulation du débit de codage des codeurs vidéo, vis-à-vis d'un débit cible.
Ainsi qu'illustré sur la figure la, une séquence d'images vidéo est composée d'images successives, certaines de ces images, désignées images I, étant codées en mode Intratrame, soit sans référence au passé représenté par les images précédentes de cette séquence d'images, soit en mode Intertrame, désignées images P, puis d'une nouvelle image I, et ainsi de suite.
On rappelle que le codage prédictif des images P permet de réduire sensiblement le volume de données codées, tout en conservant une complexité de codage raisonnable .
Dans l'hypothèse où, pour des besoins de traitement au décodage par exemple, on souhaite accéder à une image précise de rang défini dans le flux vidéo, et dans la séquence d'images vidéo, il est alors nécessaire de décoder l'ensemble des images P précédant cette image, jusqu'à la précédente image I. En effet, toute image I est par définition autonome du point de vue codage, puisque le codage de cette dernière, non prédictif, ne fait appel au contenu d'aucune image précédente.
Afin de réduire ou minimiser le temps d'accès à une image de rang déterminé, il est courant, lors du processus de codage de séquences d'images vidéo, d'insérer une image I toutes les secondes, dans le cas du codage vidéo classique de films par exemple. On est, dans cette situation, assuré de ne devoir décoder au maximum que 25 images, dans le cas d'un flux d'images vidéo à 25 images par seconde, pour accéder à n'importe quelle image du flux précité.
Dans ces conditions, un flux d'images ou de séquences d'images vidéo est dit à accès aléatoire lorsque toute image est accessible dans un délai techniquement acceptable. Si, au contraire, aucune image I n'est insérée dans le flux ou la séquence d'images vidéo, ce qui est techniquement envisageable, le flux ne peut être considéré comme à accès aléatoire, car l'accès au contenu de toute image de rang déterminé dépend théoriquement de toutes les images précédentes.
A l'heure actuelle, l'encodage de flux ou de séquences vidéo à débit constant est exécuté à partir de processus connus de l'art antérieur, tel que représenté en figure Ib. Ce processus peut consister à choisir un pas de quantification déterminé Q, dont on estime a priori que ce dernier va produire la taille d'image souhaitée.
Dans le cadre de contraintes fortes sur le flux ou la séquence vidéo, typiquement la prise en compte d'une taille de mémoire tampon d'image codée très faible au niveau des codeurs ou de certains décodeurs disponibles dans le commerce par exemple, les processus précités fonctionnent, le plus souvent, sur le principe d'une double boucle itérative. Une première boucle, représentée en figure Ib, opère au niveau temporel de la succession d'images par :
1) allocation d'une taille cible Tc pour le codage de l'image courante, F*, k désignant le rang de l'image, cette taille estimée étant fonction de l'état de remplissage actuel de la mémoire tampon du codeur ;
2) détermination du pas de quantification Q appliqué en fonction des caractéristiques de l'image courante à coder, notamment de sa complexité C, et d'un modèle calculatoire M liant le pas de quantification Q à la taille estimée T et à la complexité C de l'image.
Le modèle calculatoire liant la taille estimée T au pas de quantification Q et à la complexité C est
appliqué en imposant T = Tc pour trouver Q. 3) codage effectif de l'image courante FR par application du pas de quantification Q ;
4} mise à jour du modèle calculatoire M en fonction de la taille effective T de l'image courante codée . Une seconde boucle itérative appliquée au niveau spatial de l'image courante Fk, cette dernière étant divisée en blocs de codage Bj , j désignant le rang du bloc dans l'image à coder, permet de déterminer le pas de quantification Qj à appliquer au bloc Bj considéré, de manière à respecter strictement la contrainte de débit imposée.
La seconde boucle précité peut opérer de manière semblable à celle illustrée en figure Ib, et, pour cette raison, n'est pas représentée au dessin. Elle permet ainsi, pour chaque bloc Bj de l'image courante, de déterminer le pas de quantification Qj applicable à ce dernier, en fonction de sa complexité Cj, le modèle M étant adapté une fois le bloc Bj codé.
La deuxième boucle précitée permet un respect beaucoup plus strict de la contrainte ou consigne de débit. Pour une description plus détaillée des processus précités, on pourra utilement se reporter au texte de la norme MPEG4 : ISO/IEC 14496-2 Information Technology - Coding of audio visuals objects - Part 2 : Visual, Annexe L. Du fait de l'absence de codage prédictif, les images I occupent, à qualité égale, beaucoup plus d'espace qu'une image P. Dans le cadre de la norme H.264 définie par la recommandation ITU-T Rec.H.264, Annexe D.9.7, une image I occupe environ 8 fois plus de taille mémoire qu'une image P de même qualité. Le problème technique posé par le respect de la contrainte d'accès aléatoire par un flux ou séquence vidéo, dans le cadre de l'hypothèse précitée, peut être résumé ci-après : si l'on insère des images I, dans le but de satisfaire la contrainte d'accès aléatoire, il est nécessaire de réduire de manière très sévère la qualité de ces dernières, afin de ne pas dépasser la taille des mémoires tampons. La qualité résultante est alors médiocre avec, en particulier, une dégradation visuelle périodique particulièrement gênante, lors du passage des images I de qualité réduite.
Des normes de codage vidéo plus récentes proposent des processus de codage permettant de coder une image I étalée sur plusieurs images P, dit codage progressif. Ce nouveau processus permet de s'affranchir de la notion d'image I.
En pratique, chaque image du flux ou séquence vidéo est subdivisée en zones qui sont codées successivement par blocs en mode Intratrame, en s 'assurant, d'une part, qu'au bout d'un nombre déterminé d'images successives toutes les zones de l'image auront été codées en Intra, l'image I ayant ainsi été distribuée sur le nombre déterminé d'images, et, d'autre part, que les parties d'images codées en mode Intertrame n'utilisent pas la zone non encore rafraichie, afin de conserver l'information passée du codage prédictif.
Dans la norme H.264 précitée, le codeur vidéo peut signaler au décodeur vidéo qu'il transmet ce type d'image en codage progressif. Ainsi, le décodeur vidéo peut, à la réception, se synchroniser sur ces images, pour garantir un accès aléatoire au flux. Pour une description plus détaillée de la norme H.264 et du processus de codage progressif, on pourra utilement se reporter au texte de la recommandation ITU-T Rec.H.264,
Annexe D .9.7 précédemment citée .
Bien que le processus de codage progressif d'images I permette, dans une certaine mesure, le respect d'une contrainte en termes de débit d'image vidéo, tout en garantissant un accès aléatoire au flux vidéo, le processus de codage successif des blocs, selon un balayage géométrique de l'image, de haut en bas, ne donne pas totalement satisfaction et ne permet pas de respecter avec une faible marge d'erreur la contrainte de débit en termes de taille d'image cible.
En effet, le processus de contrôle de débit dans cette situation dispose du modèle calculatoire, illustré et décrit en liaison avec la figure Ib. Le modèle calculatoire précité est entaché d'une certaine erreur absolue E1 qui est d'autant plus grande
que la taille estimée T de l'image est grande.
Ainsi, la taille T de chaque image codée vérifie la relation (1) ci-après : T = T + ε dans laquelle T désigne la taille de l'image réelle, après codage, T la taille estimée de l'image, donnée par le modèle calculatoire et ε l'erreur absolue de codage sur la taille, fonction strictement croissante de la taille T.
Compte tenu du codage successif géométrique, de haut en bas, des blocs, ou zones à coder, lorsque le bas de l'image, dernières zones à coder de celle-ci, présente une grande complexité, on peut conclure que l'erreur absolue de taille £ introduite par le modèle calculatoire est grande. En effet, cette zone étant codée en dernier, l'erreur absolue ne peut aucunement être compensée par le codage d'autres zones, dont on peut par exemple réduire la qualité pour diminuer la taille de l'image codée finalement atteinte. Ceci aboutit, en conséquence, à un risque de dépassement de la capacité des mémoires tampon, et de dégradation des conditions de transmission, notamment de la fluidité du flux ou de la séquence vidéo.
A l'heure actuelle des processus permettant d'exécuter une régulation fine du débit de codage de flux ou de séquences vidéo tout en préservant l'accès aléatoire à ces derniers ne sont pas connus .
La présente invention a pour objet de remédier aux inconvénients et limitations des techniques antérieures, dans le but d'assurer une régulation aussi fine que possible du débit de flux ou de séquences d'images vidéo, notamment codées en codage progressif.
Un autre objet de la présente invention est également la mise en oeuvre d'un procédé et d'un dispositif de régulation du débit de codage de flux ou de séquences d'images vidéo permettant de minimiser l'erreur absolue de codage de toute image, indépendamment de la complexité de l'image considérée.
Un autre objet de la présente invention est enfin la mise en œuvre du procédé et du dispositif objets de l'invention dans une application à la vidéo surveillance à distance en réseau, grâce auxquels la régulation fine du débit permet d'éviter toute collision de transmission d'image et de favoriser la commande en temps réel de tout organe de surveillance. Le procédé et le dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible, représenté par une taille cible d'image, objets de l'invention, opèrent sur des images vidéo subdivisées en un ensemble de zones à coder. La taille estimée de l'ensemble de zones à coder est fonction de la taille des zones codées, de la taille estimée des zones à coder et d'une erreur estimée de codage des zones à coder .
Ils sont remarquables en ce que chacun consiste à, respectivement, permet de discriminer, parmi les zones à coder de cet ensemble de zones à coder, la complexité de codage de chaque zone à coder, classifier les zones à coder selon un ordre de complexité déterminé, coder successivement chaque zone à coder en fonction de la classification d'ordre de complexité, décroissante, en minimisant successivement l'erreur estimée de codage de chaque zone à coder, la taille finale de chaque image vis-à-vis de la taille cible, et en optimisant le débit de séquence d'image vidéo. Le procédé et le dispositif objets de l'invention sont en outre remarquables en ce que, dans le cadre d'une application à la vidéo surveillance en réseau, incluant une commande à distance d'une caméra de vidéo surveillance, à partir d'un terminal hôte par un opérateur, chacun consiste à respectivement permet de, pour chaque image courante de rang p appartenant à des séquences successives de N images l≤ p ≤ N, subdiviser chaque image courante en un ensemble de N zones à coder superposées, formée chacune par une pluralité de lignes de pixels, discriminer parmi les zones à coder la complexité de codage de chaque zone à coder, choisir l'une des zones à coder comme première zone à coder et appliquer un codage Intratrame, avec un pas de quantification minimum, pour obtenir une complexité de codage maximum pour cette première zone à coder, coder en codage intertrame la zone à coder immédiatement supérieure à cette première zone, avec application d'un pas de quantification diminué, pour préserver la finesse de codage de cette zone, coder en codage Intertrame chacune des zones à coder restantes, en fonction de leur classification d'ordre de complexité, en minimisant successivement l'erreur estimée de codage de chaque zone à coder restante, la taille finale de l'image courante vis-à-vis de la taille cible, répéter successivement les opérations précédentes pour chaque image de rang p+1, suivant l'image courante, en choisissant comme première zone à coder l'une des zones à coder de rang distinct du rang des zones codées comme première zone à coder parmi les p images précédentes. Ceci permet de conserver l'accès aléatoire aux séquences d'images.
Le procédé et le dispositif objets de l'invention trouvent application à la technologie du codage vidéo, de la transmission de flux vidéo en réseau et à leurs applications, telles que, notamment, la vidéo surveillance en réseau.
Ils seront mieux compris à la lecture de la description et à l'observation des dessins ci-après dans lesquels, outre les figures la et Ib relatives à l'art antérieur, - la figure 2a représente, à titre illustratif, un organigramme général des étapes essentielles permettant la mise en œuvre du procédé objet de la présente invention ,-
- la figure 2b représente, à titre illustratif, un organigramme spécifique permettant d'opérer une minimisation de l'erreur estimée de codage de chaque zone à coder ;
- la figure 3a représente, à titre illustratif, un organigramme spécifique des étapes essentielles de mise en œuvre du procédé objet de l'invention dans une application à la vidéo surveillance en réseau ;
- la figure 3b représente, à titre illustratif, un exemple spécifique de mise en œuvre du procédé objet de l'invention appliqué à la vidéo surveillance en réseau;
- la figure 3c représente, à titre illustratif, un chronogramme représentatif, à titre comparatif, du nombre de bits par image lors d'une séquence typique de vidéo surveillance en l'absence respectivement en présence de la mise en œuvre du procédé objet de l'invention ;
- la figure 4 représente, à titre illustratif, un schéma synoptique fonctionnel d'un dispositif de régulation du débit de codage de séquences d'images vidéo objet de l'invention, permettant de mettre en œuvre le procédé et/ou toute application de ce dernier à la vidéo surveillance. Une description plus détaillée du procédé et du dispositif de régulation du débit de codage de séquences d'images vidéo, vis-à-vis d'un débit cible représenté par une taille cible d'image, conformes à l'objet de la présente invention, sera maintenant donnée en liaison avec la figure 2a et les figures suivantes.
Le procédé objet de l'invention s'applique ainsi qu'indiqué précédemment dans la description à la régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible représenté par une taille cible Tc d'image donnée.
On comprend, en particulier, que pour une taille cible Tc donnée de chaque image et compte tenu de la fréquence de l'image dans la séquence d'images, on détermine ainsi un débit de codage de la séquence d'images ou flux d'images considérées.
Ainsi, en référence à la figure 2a, on considère toute image F'K, k désignant le rang de l'image considérée dans la séquence d'images précitée, chaque image vidéo étant subdivisée en un ensemble de zones à coder, cet ensemble étant noté
Figure imgf000012_0001
, N désignant le nombre de zones à coder dans chaque image F^ considérée et Fkj désignant chaque zone à coder de l'image précitée.
Ainsi, la taille estimée de l'ensemble de zones à coder ψk,iJ j^ι > est fonction au cours du processus de codage de la taille des zones déjà codées, de la taille estimée des zones à coder ou restant à coder et d'une erreur estimée de codage des zones à coder, l'erreur
estimée de codage étant notée ε} pour chacune des zones à coder en référence à la figure 2a.
Ainsi qu'on l'a représenté en outre sur la figure 2a précitée, le procédé objet de l'invention est remarquable en ce qu'il consiste au moins, pour chaque image F^ préalablement à tout codage d'une zone, à discriminer en une étape A parmi les zones à coder de l'ensemble des zones à coder
Figure imgf000012_0002
, la complexité de codage de chaque zone à coder F^j . A l' étape A de la figure 2a, l'opération de discrimination est notée : Discrimination
Figure imgf000012_0003
A l'étape A, on comprend que l'application d'un modèle calculatoire M à l'ensemble des zones à coder Fkj permet d'obtenir un ensemble de coefficients de complexité de codage de chaque zone à coder, cet ensemble étant noté
L'opération de l'étape A est suivie d'une étape B consistant à classifier les zones à coder selon un ordre de complexité déterminé. L'opération correspondante est notée à l'étape B Classification c/fc, kr →o{cβ}£ . On comprend que par l'opération de classification précitée, cette dernière consiste à classer par ordre de grandeur les coefficients de complexité de codage Cj obtenus à l'étape A, la classification par ordre de grandeur pouvant a priori être effectuée selon un ordre croissant ou décroissant.
Dans l'opération représentée à l'étape B de la figure 2a, l'application de la fonction de classification ou de tri des coefficients de complexité de codage Cj permet d'obtenir un ensemble de valeurs triées par ordre croissant ou décroissant noté o{co}Z -
L'étape B précitée est alors suivie d'une étape C consistant à coder successivement chaque zone à coder en fonction de la classification d'ordre de complexité décroissante des coefficients de complexité de codage Cj obtenus à l'étape B.
L'opération de codage successive de chaque zone à coder en fonction de la classification d'ordre de complexité décroissante représentée à l'étape C est notée Codage
CoCIiQ1, Fkl ) :Z , mxr \ .
Figure imgf000013_0001
L'opération de codage précitée consiste en fait, ainsi que représenté à l'étape C de la figure 2a, à effectuer le codage par application d'un pas de quantification Q3- à chaque zone à coder F^ et en minimisant successivement l'erreur estimée de codage ê < de chaque zone à coder Fkj, la taille finale de chaque image après codage, taille finale notée T*, vis-à-vis de la taille cible Tc et en optimisant finalement le débit de la séquence d'images vidéo correspondante.
Un justificatif du mode opératoire du procédé de régulation du débit de codage de séquences d'images vidéo, objet de la présente invention, tel que représenté en figure 2a, sera maintenant donné au plan théorique conformément à la description ci-après.
Pour un ensemble 1/%}-JI,V, de N zone d'images à coder, dans le cas du codage de l'art antérieur, chaque zone à coder F^j est encodée successivement l'une après l'autre sans que leur complexité ne soit prise en compte.
Ainsi, pour ajuster les paramètres de codage d'une zone à coder, Fkj et pour une zone de rang i courant, on estime la taille de l'ensemble de zones à coder précitée, laquelle se décompose en deux parties, la taille des zones précédemment codées qui est connue et la taille estimée des zones restant à coder selon la relation (2)
Figure imgf000014_0001
La taille estimée des zones restant à coder
/"comparée à la taille cible Tc sert à ajuster les paramètres de codage, tels que le pas de quantification pour la zone a coder de rang i courante.
Pour minimiser l'erreur de codage de la taille restant à coder, il est primordial que l'erreur qui affecte cette dernière soit minimale, cette erreur s 'exprimant sous la forme de la relation (3) selon : 5>, .
J>1
Minimiser le terme d'erreur précité revient ainsi à minimiser toutes les valeurs d'erreurs de codage εt de chaque zone à coder Fkj .
Les erreurs de codage ε} sont proportionnelles aux tailles T de chaque zone et donc à la complexité de chacune des zones à coder F^j . Compte tenu de cette observation, le procédé objet de l'invention permet, au contraire, de découper une séquence d'images vidéo à encoder en zones à coder, de classifier la complexité des zones à coder correspondantes et de coder la séquence d'images précitée dans l'ordre décroissant des complexités, de manière à commencer le codage par les zones occupant le plus d'espace et en terminant par les zones d'images à coder occupant le moins d'espace. En codant en premier les zones les plus complexes, on peut ainsi minimiser l'erreur ε de codage au fur et à mesure de l'encodage des zones successives.
Ainsi, les dernières zones à coder présentent alors deux avantages : elles disposent d'une estimation très fiable de la taille restante, et, étant de plus faible complexité successivement, leur erreur de codage est faible et il est donc peu probable que l'erreur qui les affecte aboutisse à un dépassement de la taille cible de l'image Tc et donc des mémoires tampon. D'une manière plus spécifique, on indique que la complexité de codage de chaque zone à coder Fy est définie comme la taille estimée, en octets, occupée par la zone à coder précitée après codage, pour une qualité de zone et d'image déterminée. A titre d'exemple non limitatif, on indique que la complexité de codage Cj de chaque zone à coder peut être estimée à partir d'au moins le pas de quantification Qj à appliquer au cours du processus de codage et de métrique de zone à coder de l'image courante Fk, vis-à- vis d'au moins une zone codée de l'image précédente.
Ainsi, de manière connue, pour estimer la complexité de codage de chaque zone à coder, il est possible d'utiliser un processus connu de l'état de la technique dans le domaine du codage vidéo permettant de lier la taille d'image estimée au pas de quantification et à des métriques sur la zone à coder, la taille de la zone à coder étant exprimée par la relation (4) ci-après
Te = (a*C/Q) + b*C/Q*Q) ) . Dans la relation précédente,
Te désigne la taille estimée de la zone à coder Fy .
C représente sa complexité typiquement la somme de valeur absolue des différences désignée SAD ; Q représente le pas de quantification appliqué sur la zone à coder Fy ; a et b sont des paramètres liés à la séquence d'images ajustés dynamiquement en cours de codage.
Pour une description plus détaillée de la détermination de la taille de chaque zone à coder en fonction de la complexité de cette dernière, on pourra utilement se reporter à l ' annexe L paragraphe L .1.2 de la norme MPEG4 déjà citée par exemple.
Une description plus détaillée du processus mis en œuvre pour minimiser l'erreur estimée de codage de chaque zone à coder sera maintenant donnée en liaison avec la figure 2b.
En référence à la figure précitée, on indique que le processus permettant de minimiser l'erreur estimée de chaque zone à coder Fy consiste au moins à adapter successivement le pas de quantification Qj appliqué au codage de chaque zone à coder Fy.
Dans ce but ainsi que représenté en figure 2b et suite à l'exécution de l'étape B de la figure 2a, l'étape C de la figure 2a précitée peut consister, ainsi que représenté en figure 2b, à exécuter conjointement une étape Ci consistant à mesurer la taille restante pour coder l'image vis-à-vis de la taille cible Tc de l'image et une étape C2 consistant à exécuter l'opération de prédiction de la zone à coder Fy, ainsi que représentée en figure 2b. L'opération de prédiction précitée est exécutée lorsqu'on exécute un codage Intertrame par exemple.
Les étapes Ci et C2 précitées sont alors suivies d'une étape C3 de calcul du pas de quantification Q3 à partir de la relation (4) précédente.
L'étape C3 est alors suivie d'une étape C4 permettant d'exécuter le codage proprement dit de la zone à coder Fk3 par application du pas de quantification Q3 déterminé à l'étape C3. Un retour à l'exécution des étapes Ci et C2 est prévu pour le codage de la zone à coder suivante ainsi que représentée au dessin de la figure 2b.
Le procédé objet de l'invention tel que décrit précédemment en liaison avec les figures 2a et 2b peut être mis en œuvre afin d'assurer un débit de codage d'images vidéo sensiblement constant pour la transmission de ces dernières.
Toutefois, le procédé objet de l'invention s'applique de manière particulièrement avantageuse à la vidéo surveillance en réseau pour assurer, notamment, la transmission de séquences d'images permettant la commande d'organes de surveillance par exemple.
Ainsi, on suppose l'existence d'un équipement de vidéo surveillance muni d'un système de commande de caméras, un opérateur pouvant à tout moment décider des mouvements de cette dernière à distance.
Entre la caméra de surveillance et l'opérateur utilisateur, le signal vidéo, c'est-à-dire les séquences successives d'images vidéo, est compressé par exemple à la norme H.264.
Dans la cadre d'une application à la vidéo surveillance, il est manifeste que le flux vidéo doit être à accès aléatoire, afin, en particulier, de faciliter la visualisation de ce qui s'est passé à un instant donné ou dans une plage de temps très brève au cours d'un instant donné et il est alors primordial que le débit soit respecté de manière très précise.
En effet, si ce dernier n'est pas respecté, les équipements réseau procèdent à la mise en mémoire tampon d'une partie du flux d'images vidéo ou pire le flux est alors perdu. La séquence vidéo subit alors un retard par rapport à la scène filmée et l'opérateur ne peut pas commander efficacement sa caméra de surveillance.
L'application du procédé objet de l'invention à la vidéo surveillance en réseau apparaît particulièrement avantageuse, car le procédé objet de l'invention dans cette application permet alors de résoudre toute les contraintes précitées, tant en ce qui concerne l'accès aléatoire aux séquences ou flux d'images vidéo que le respect des contraintes de débit de manière rigoureuse, afin d'éviter les inconvénients précédemment cités.
Dans ce but, le procédé objet de l'invention consiste alors à coder une partie d'une image considérée en mode Intratrame de manière à ce que l'intégralité de l'image ait été codée en mode Intratrame au bout d'un nombre N d'images successives.
En outre, afin de garantir l'accès aléatoire au flux d'images vidéo, on impose qu'aucune prédiction spatiale ou temporelle ne soit effectuée entre la zone rafraichie, c'est-à-dire l'ensemble des zones qui ont été codées en Intra depuis le début du rafraîchissement progressif, soit sur les p images successives, et le reste de l'image. Le procédé objet de la présente invention appliqué à la vidéo surveillance est alors mis en œuvre ainsi qu'il sera décrit en liaison avec la figure 3a ci-après .
En référence à la figure précitée, on considère un flux d'images vidéo, chaque image vidéo étant notée Fk ainsi que noté précédemment, k désignant le rang de l'image par exemple. On considère en outre toute séquence successive de N images dans le flux vidéo précité, chaque image dans chaque séquence de N images étant noté Fp, où p désigne en fait le rang de chaque image dans la séquence considérée. A titre d'exemple non limitatif le rang p de chaque image vérifie alors la relation p = 1+k mod N.
Selon la notation consacrée k mod N désigne le reste de la division de k par N.
Ainsi le rang p de chaque image dans la séquence de N images vérifie la relation (5) :
1 ≤ p < N.
En référence à la figure 3a, le procédé objet de l'invention appliqué à la vidéo surveillance consiste alors en une étape a à subdiviser chaque image courante en un ensemble de N zones à coder superposées, chaque zone étant formée par une pluralité de lignes de pixels.
A l'étape a de la figure 3a, l'opération de subdivision est notée : Subdivision
L'étape a est suivie d'une étape b consistant à discriminer parmi les zones à coder FPj la complexité de codage de chaque zone à coder. Cette opération est notée sur la figure 3a Discrimination
M(Fj;:→kχ:-
L'étape b est suivie d'une étape £ consistant à choisir l'une des zones à coder comme première zone a coder et à appliquer un codage Intratrame avec un pas de quantification minimum pour obtenir une complexité de codage maximum pour la première zone à coder précitée.
Sur la figure 3a l'étape c est ainsi subdivisée en deux sous-étapes cl de choix de la première zone, notée Choix première zone
Figure imgf000020_0001
Par le choix de la première zone précitée, on comprend que, à la première zone à coder de l'image est arbitrairement assigné un rang 0 l'indice j choisi sj=O représentant ce choix sur la figure 3a.
La sous-étape Cl1 est suivie d'une sous-étape c2_ consistant à effectuer un codage Intratrame de la première zone choisie, cette opération étant notée à la sous-étape c2_ :
Codage intra
COdiNTRA ( Qj O , FpO ) .
On comprend que, par le codage Intratrame appliqué à la première zone, on applique le pas de quantification minimum noté Qjo ce qui permet d'obtenir une complexité de codage maximum pour la première zone à coder.
L'étape c_ précitée est alors suivie d'une étape d consistant à coder en codage Intertrame la zone à coder adjacente immédiatement supérieure à la première zone avec application d'un pas de quantification diminué pour préserver les détails de cette zone qui, à l'image précédente, était codée en mode Intratame.
L'opération à l'étape d de la figure 3a est notée
Codage intβr sj=sj-l la notation symbolique de choix de la zone à coder de rang j-1 désignant le choix de la zone à coder adjacente immédiatement supérieure à la première zone par l'affectation symbolique sj=sj-l.
Le codage Intertrame est alors noté
CodiNTER (Qsj-1, Fpsj-l) • Le pas de quantification QSj-i est diminué par rapport au pas de quantification Q30 appliqué à la sous- étape c2_ de la figure 3a à la première zone.
Il permet de préserver les détails de cette zone qui, à l'image précédente, était codée en mode Intratrame. L'étape d est alors suivie d'une étape e consistant à coder en codage Intertrame chacune des zones à coder restantes en fonction de leur classification d'ordre de complexité décroissante, ainsi que décrit précédemment dans la description en liaison avec les figures 2a et 2b.
Bien entendu, cette opération est exécutée en minimisant successivement l'erreur estimée de codage de chaque zone à coder restante et la taille finale de chaque image courante vis-à-vis de la taille cible précitée.
A l'étape e de la figure 3a, l'opération de codage Intertrame est notée Codage inter
CodiNTER ( Qnr, FP3r! j r ≠ s j , sj -1 . Dans la relation précédente, on comprend que l'opération de codage est appliquée avec un pas de quantification Qjr à chacune des zones à coder restantes d'indice jr, en choisissant bien entendu le pas de quantification correspondant Qjr. La relation jr ≠ sj, sj-1 désigne chacune des zones à coder restantes de rang jr distinctes des zones première zone sj=O et sj-1, 2one adjacente immédiatement supérieure à la première zone précitée.
Bien entendu, le pas de quantification Q31- est calculé pour chacune des zones restantes de rang jr.
L'étape e est alors suivie d'une étape f_ consistant à répéter successivement les opérations a à e pour chaque image de rang p+1 suivant l'image courante, en choisissant comme première zone à coder l'une des zones à coder de rang distinct, parmi les p images précédentes, du rang des zones codées comme première zone à coder.
Ce mode opératoire permet de conserver l'accès aléatoire aux séquences d'images.
A titre d'exemple non limitatif, pour l'exécution de l'étape f comprenant le retour au début, c'est-à-dire à l'exécution de l'étape a, pour l'image suivante, l'opération f peut comprendre, ainsi que représenté sur la figure 3a, une sous étape fo consistant à passer à la zone à coder suivante : j = j+1 suivie d'une étape de test fi consistant à vérifier le rang j de la zone par rapport à la valeur N. Sur réponse négative au test fi, le processus est poursuivi par retour à l'étape d pour le passage à la zone à coder suivante.
Au contraire, sur réponse positive au test fi, toutes les zones à coder de l ' image courante de rang p ayant été encodées, on passe à une étape f2 de passage à l'image suivante par la relation p = p+1. La sous étape ±2 est suivie d'une sous étape £3 de vérification que la dernière image de la séquence de N images n'est pas atteinte par le test p>N. Sur réponse négative à la sous étape f3, un retour est effectué à l ' étape a pour passage à l ' image suivante de rang p+1. Au contraire, sur réponse positive à la sous étape f3, la dernière image de rang N dans la séquence d'images est atteinte et le processus est terminé pour la séquence de N images successive précitée, le processus continuant bien entendu pour toute séquence d'images suivante du flux d'image vidéo.
En ce qui concerne la mise en œuvre de l'étape cJL de choix de la première zone d'image à coder, on indique que plusieurs solutions peuvent être retenues pour chaque image de rang p successive dans une séquence de N images. Selon une première variante non limitative, ce choix peut être effectué par permutation circulaire d'une zone à coder parmi N.
On comprend ainsi que, par un tel processus, au bout de N images la totalité de l'image aura été codée en Intratrame par zones successives, ce qui permet d'effectuer ainsi et de se ramener à un codage progressif permettant la transmission d'une image codée en mode Intratrame toutes les N images.
Selon un autre mode de mise en œuvre non limitatif du processus de choix de la première zone, on indique que ce choix peut être effectué pour chaque image courante successive par tirage pseudo-aléatoire exhaustif d'une zone à coder parmi N-(p-l) . Dans cette hypothèse, la zone d'image, qui à l'image précédente était codée en mode Intratrame, est alors codée avec un pas de quantification diminué .
On comprend ainsi qu'il est possible également de coder la totalité d'une image en mode Intratrame sur N images, le tirage pseudo-aléatoire exhaustif permettant l'épuisement de toutes les zones à coder en mode
Intratrame .
Un exemple de mise en œuvre du procédé objet de l'invention appliqué à la vidéo surveillance, tel que représenté en figure 3a, sera maintenant décrit en liaison avec la figure 3b lors de l'application à des images de vidéo surveillance d'un chantier par exemple.
En référence à la figure 3b, l'image est alors découpée en zones arbitraires, typiquement 3 lignes de blocs 16 X 16 pixels, soit 48 pixels de haut sur la longueur de l'image par exemple.
Pour chaque zone à coder FPj , le pas de quantification à appliquer Qj0, Qaj-i ou Qjr est modifié en
fonction de la taille estimée Tde l'image. Si cette image dépasse la taille cible Tc le pas de quantification est augmenté. Dans le cas contraire, il est diminué.
Dans le cas de la mise en œuvre du procédé objet de l'invention représenté en figure 3a et 3b, on ajuste sur certaines zones leur complexité, en diminuant artificiellement le pas de quantification, afin de favoriser la qualité de celles-ci. La première zone d'image codée en Intratrame est alors toujours supposée présenter une complexité supérieure à celles des zones codées en mode Intertrame et donc systématiquement codée en premier. Cette zone porte le rang 0 sur la figure 3b et correspond donc au choix de la première zone à l'étape c_l de la figure 3a.
Après le codage de la première zone précitée, on procède alors au codage de la zone située au-dessus de cette zone choisie en premier et codée en mode Intratrame, cette zone portant le rang 1 sur la figure 3b. Ceci permet d'éviter de dégrader la qualité des zones qui viennent d'être rafraichies par le codage Intratrame. Par zones rafraichies, on entend l'ensemble des zones qui ont été codées en mode Intratrame depuis le début du rafraîchissement progressif.
Enfin, les zones restantes sont alors classées en fonction de leur complexité et sont codées dans l'ordre décroissant de leur complexité conformément au procédé objet de l'invention, tel qu'illustré précédemment et décrit en liaison avec les figures 2a et 2b. Les zones codées sur la figure 3b successivement portent les rangs 2, 3, 4 et 5 à 14 en fonction de leur complexité et sans rapport avec leur localisation dans l'image Fk. On indique toutefois que, dans le cadre de la norme H.264, ce mode opératoire est rendu possible grâce à plusieurs outils qui garantissent l'indépendance des données entre les zones .
En outre, il faut souligner que l'ordre de codage n'est pas forcément corrélé avec l'ordre d'envoi des paquets sur le réseau pour la transmission des séquences d'image vidéo. En effet, les paquets peuvent être codés dans un ordre, c'est-à-dire selon leur complexité et non selon la géométrie de l'image, puis ils peuvent être réorganisés et envoyés dans l'ordre classique correspondant au codage géométrique de l'image précitée.
Ce mode opératoire permet d'améliorer la compatibilité avec les décodeurs distants disponibles dans le commerce.
La figure 3b montre le découpage de l'image en différentes zones, le choix de la première zone noté 0 correspondant au codage en mode Intratrame et au-dessus de cette dernière se trouvant la zone dite « inter contrainte » dont la prédiction temporelle est limitée à elle-même, afin de n'utiliser aucune donnée de la zone située en-dessous de la zone Intratrame.
L'ordre de codage des différentes zones d'image à coder restantes, est alors déterminé en fonction de la complexité de ces zones au moyen d'un critère de somme des valeurs absolues des différences, ainsi que décrit précédemment dans la description.
Le tableau T ci-après donne de manière schématique l'erreur de prédiction associée à chaque zone.
Figure imgf000025_0001
On suppose de manière complètement arbitraire et non exacte a priori que l'erreur en bits est égale à 10% de la complexité. Dans un cas réel, l'erreur peut fréquemment atteindre 50% de la taille réelle ainsi que l'erreur globale ε qui affecte, au moment du codage de
la zone courante à coder, la taille estimée T de 1 ' image .
Par souci de clarification, on suppose que les zones sont codées strictement de la même manière dans les deux cas, c'est-à-dire que l'amélioration de l'estimation de la taille de l'image n'influence pas la manière de coder chaque zone. Dans un cas réel, le pas de quantification de chaque zone est influencé par la taille estimée de 1 ' image . A l'observation du tableau T précité, on constate que la mise en œuvre du procédé, objet de l'invention, permet de réduire de manière très importante l'erreur obtenue par rapport à l'erreur standard, "ε invention" par rapport à "ε standard", et permet donc d'ajuster, de manière très fine, le pas de quantification pour chaque zone. Il en résulte alors une image qui respecte, de manière très fine, le débit cible fixé.
Le gain réellement obtenu par la mise en œuvre du procédé objet de l'invention, peut être illustré en référence à la figure 3c.
La figure 3c précitée est un graphique montrant le nombre de bits par image lors du codage d'une séquence typique de vidéo surveillance avec la mise en œuvre du procédé objet de l'invention, trait continu, et sans la mise en œuvre de ce dernier, trait pointillé. On constate de la manière la plus nette que le débit est beaucoup mieux respecté grâce à la mise en œuvre du procédé objet de l'invention, les fluctuations de débit étant sensiblement filtrées, la valeur de consigne Tc=60000 bits de la taille cible de chaque image codée étant sensiblement respectée.
Une description plus détaillée d'un dispositif de régulation de débit de codage de séquences d'image vidéo vis-à-vis d'un débit cible, représenté par une taille cible d'image, conforme à l'objet de la présente invention et permettant, bien entendu, la mise en œuvre du procédé objet de l'invention, sera maintenant donnée en liaison avec la figure 4. D'une manière générale, on indique que le dispositif objet de l'invention, peut être intégré à un codeur vidéo plus complexe ou mis en œuvre sur une machine autonome permettant le codage vidéo proprement dit.
Dans les deux cas, les images vidéo sont subdivisées en un ensemble de zones à coder et la taille estimée de l'ensemble des zones à coder est fonction de la taille des zones codées, de la taille estimée des zones à coder et d'une erreur estimée de codage des zones à coder, ainsi que mentionné précédemment dans la description. Le dispositif objet de l'invention, outre les éléments classiques tel qu'un port d'entrée/sortie, noté I/O, de données numériques représentatives d'image vidéo à coder ou de données codées et une unité centrale de traitement, notée CPU, associée à une mémoire de travail RAM comportent avantageusement un module Ml de discrimination pour les zones à coder de l'ensemble des zones à coder de la complexité de codage, un module M2 de classification des zones à coder selon un ordre de complexité décroissante et un module M3 de codage successif de chaque zone à coder, en fonction de la classification d'ordre de complexité précitée en minimisant successivement l'erreur estimée de codage de chaque zone à coder, la taille finale de chaque image vis-à-vis de la taille cible et en optimisant ainsi le débit de séquence d'image vidéo. De préférence, ainsi que représenté sur la figure 4, le module de discrimination Ml, le module de classification M2 et le module de codage successif de chaque zone à coder M3 en fonction de la classification d'ordre de complexité, sont avantageusement formés chacun par un module de programme d'ordinateur implanté dans un module de mémoire de programme unique ou multiple.
Enfin, en ce qui concerne la mémoire de programme incorporant le module de discrimination, module Ml, parmi les zones à coder de l'ensemble des zones à coder, de la complexité de codage de chaque zone à coder, on indique que ce dernier peut être formé par une mémoire programmable .
Une telle mémoire programmable permet alors d'adapter le processus de discrimination de la complexité de codage de chaque zone à coder en fonction du contenu d'une ou plusieurs séquences d'images vidéo par exemple.
Il est ainsi possible d'adapter le processus de discrimination de la complexité précitée en fonction du contenu des séquences vidéo et des flux d'image vidéo correspondant et d'exécuter un traitement temporel adaptatif des flux d'images vidéo.
L'invention couvre enfin un produit de programme d'ordinateur permettant la mise en oeuvre du procédé objet de l'invention, tel que décrit en liaison avec les figures 2a à 3c, un tel produit de programme étant implanté pour exécution par un ordinateur, tel que représenté en figure 4, dans un ou plusieurs modules de programme, tels que les modules Ml, M2 et M3 précités.

Claims

REVENDICATIONS
1. Procédé de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible représenté par une taille cible d'image, dans lequel lesdites images vidéo sont subdivisées en un ensemble de zones à coder, la taille estimée dudit ensemble de zones à coder étant fonction de la taille des zones codées, de la taille estimée des zones à coder et d'une erreur estimée de codage des zones à coder, caractérisé en ce qu'il consiste, au moins, pour chaque image, préalablement à tout codage d'une zone, à : discriminer, parmi les zones à coder dudit ensemble de zones à coder, la complexité de codage de chaque zone à coder, la complexité de codage de chaque zone à coder étant définie comme la taille estimée, en octets, occupée par ladite zone à coder après codage, pour une qualité de zone et d'image déterminée; classifier lesdites zones à coder selon un ordre de complexité déterminé ; coder successivement chaque zone a coder en fonction de la classification d'ordre de complexité, décroissante, en minimisant successivement l'erreur estimée de codage de chaque zone à coder, la taille finale de chaque image vis-à-vis de ladite taille cible et en optimisant le débit de séquence d'images vidéo.
2. Procédé selon la revendication 1, caractérisé en ce que la complexité de codage de chaque zone à coder est estimée à partir d'au moins le pas de quantification à appliquer au cours du processus de codage, de métriques de zone à coder de l'image courante vis-à-vis d'au moins une zone codée de l ' image précédente .
3. Procédé selon la revendication 1 ou 2 , caractérisé en ce que la minimisation de l'erreur estimée consiste au moins à adapter successivement le pas de quantification appliqué au codage de chaque zone à coder.
4. Procédé selon l'une des revendications précédentes, caractérisé en ce que, dans le cadre d'une application à la vidéo surveillance en réseau, incluant une commande à distance d'une caméra de vidéo surveillance, à partir d'une terminal hôte par un opérateur, ledit procédé consiste au moins, pour chaque image courante de rang p appartenant à des séquences successives de N images, ï≤p≤N, à : a) subdiviser chaque image courante en un ensemble de N zones à coder superposées, formées chacune par une pluralité de lignes de pixels ; b) discriminer parmi lesdites zones à coder la complexité de codage de chaque zone à coder ; c) choisir l'une des zones à coder comme première zone à coder et appliquer un codage Intratrame, avec un pas de quantification minimum, pour obtenir une complexité de codage maximum pour ladite première zone à coder ; d) coder en codage Intertrame la zone à coder adjacente immédiatement supérieure à ladite première zone, avec application d'un pas de quantification diminué, pour préserver la finesse de codage de cette zone ; e) coder en codage Intertrame chacune des zones à coder restantes, en fonction de leur classification d'ordre de complexité, en minimisant successivement l'erreur estimée de codage de chaque zone à coder restante, la taille finale de ladite image courant vis-à-vis de ladite taille cible ; f) répéter successivement les opérations -a) à ~e) pour chaque image de rang p+1 suivant ladite image courante, en choisissant comme première zone à coder l ' une des zones à coder de rang distinct du rang des zones codées comme première zone à coder parmi les p images précédentes, ce gui permet de conserver l'accès aléatoire aux séquences d'images.
5. Procédé selon la revendication 4, caractérisé en ce que l'opération de choix comme première zone à coder pour chaque image courante successive est effectué par permutation circulaire d'une zone à coder parmi N.
6. Procédé selon la revendication 4, caractérisé en ce que l'opération de choix comme première zone à coder pour chaque image courante successive est effectuée par tirage pseudo-aléatoire exhaustif d'une zone à coder parmi N- (p-1) .
7. Dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible représenté par une taille cible d'image, dans lequel lesdites images vidéo son subdivisées en un ensemble de zones à coder, la taille estimée dudit ensemble de zones à coder étant fonction de la taille des zones codées, de la taille estimée des zones à coder et d'une erreur estimée de codage des zones à coder, caractérisé en ce que, outre un port d'entrée/sortie de données numériques représentatives d'images vidéo à coder respectivement codées, une unité centrale de traitement et une mémoire de travail, ledit dispositif comporte au moins : des moyens de discrimination, parmi les zones à coder dudit ensemble de zones à coder, de la complexité de codage de chaque zone à coder, la complexité de codage de chaque zone à coder étant définie comme la taille estimée, en octets, occupée par ladite zone à coder après codage, pour une qualité de zone et d'image déterminée;
- des moyens de classification des dites zones à coder selon un ordre de complexité décroissante ;
- des moyens de codage successif de chaque zone à coder en fonction de la classification d'ordre de complexité, en minimisant successivement l'erreur estimée de codage de chaque zone à coder, la taille finale de chaque image vis-à-vis de ladite taille cible et en optimisant le débit de séquence d'image vidéo.
8. Dispositif selon la revendication 7, caractérisé en ce que lesdits moyens de discrimination, lesdits moyens de classification et lesdits moyens de codage successif de chaque zone à coder en fonction de la classification d'ordre de complexité sont formés chacun par un module de programme d'ordinateur implanté dans un module de mémoire de programme unique ou multiple.
9. Dispositif selon la revendication 8, caractérisé en ce que la mémoire de programme incorporant ledit module de discrimination, parmi les zones à coder dudit ensemble de zones à coder, de la complexité de codage de chaque zone à coder est formée par une mémoire programmable, ce qui permet d'adapter le processus de discrimination de la complexité de codage de chaque zone à coder, en fonction du contenu d'une ou plusieurs séquences d'image vidéo.
10. Produit de programme d'ordinateur comportant une suite d'instructions pour exécution par un ordinateur, caractérisé en ce que, lors de cette exécution, ledit programme exécute les étapes du procédé selon l'une des revendications 1 à 6.
PCT/FR2008/050479 2007-03-21 2008-03-20 Procédé et dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible WO2008132378A2 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
GB0916386A GB2459633A (en) 2007-03-21 2008-03-20 Method and device for adjusting the encoding flowrate of video image sequences relative to a target flowrate
US12/532,384 US8279944B2 (en) 2007-03-21 2008-03-20 Method and device for regulating the encoding bit rate of video image sequences relative to a target bit rate

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0702063 2007-03-21
FR0702063A FR2914124B1 (fr) 2007-03-21 2007-03-21 Procede et dispositif de regulation du debit de codage de sequences d'images video vis-a-vis d'un debit cible

Publications (2)

Publication Number Publication Date
WO2008132378A2 true WO2008132378A2 (fr) 2008-11-06
WO2008132378A3 WO2008132378A3 (fr) 2008-12-24

Family

ID=38668655

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2008/050479 WO2008132378A2 (fr) 2007-03-21 2008-03-20 Procédé et dispositif de régulation du débit de codage de séquences d'images vidéo vis-à-vis d'un débit cible

Country Status (4)

Country Link
US (1) US8279944B2 (fr)
FR (1) FR2914124B1 (fr)
GB (1) GB2459633A (fr)
WO (1) WO2008132378A2 (fr)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010057170A1 (fr) * 2008-11-17 2010-05-20 Cernium Corporation Codage à modulation analytique d'une vidéo de surveillance
CN102164272A (zh) * 2011-04-07 2011-08-24 天津市亚安科技电子有限公司 在网络视频监控平台中减少云台控制延时的方法
CN103918258A (zh) * 2011-11-16 2014-07-09 瑞典爱立信有限公司 减少视频编码中的数据量

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5057916A (en) * 1990-11-16 1991-10-15 General Instrument Corporation Method and apparatus for refreshing motion compensated sequential video images
WO2000046999A1 (fr) * 1999-02-03 2000-08-10 Sarnoff Corporation Selection de quantificateurs en fonction des complexites par region derivees au moyen d'un modele de distorsion de debit
US6175654B1 (en) * 1998-03-26 2001-01-16 Intel Corporation Method and apparatus for encoding data in an interframe video encoder
US20060056519A1 (en) * 2001-12-21 2006-03-16 Michael Horowitz Dynamic intra-coded macroblock refresh interval for video error concealment

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271326A (ja) * 1997-03-21 1998-10-09 Sharp Corp 画像処理装置
KR100739785B1 (ko) * 2006-01-09 2007-07-13 삼성전자주식회사 관심 영역 기반 영상 부호화, 복호화 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5057916A (en) * 1990-11-16 1991-10-15 General Instrument Corporation Method and apparatus for refreshing motion compensated sequential video images
US6175654B1 (en) * 1998-03-26 2001-01-16 Intel Corporation Method and apparatus for encoding data in an interframe video encoder
WO2000046999A1 (fr) * 1999-02-03 2000-08-10 Sarnoff Corporation Selection de quantificateurs en fonction des complexites par region derivees au moyen d'un modele de distorsion de debit
US20060056519A1 (en) * 2001-12-21 2006-03-16 Michael Horowitz Dynamic intra-coded macroblock refresh interval for video error concealment

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Text of ISO/IEC 14496-2 Visual Third Edition" GENEVA : ISO, CH, 7 août 2003 (2003-08-07), XP030012728 cité dans la demande *
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION = ORGANISATION INTERNATIONALE DE NORMALISATION: "TEST MODEL 5" MPEG TEST MODEL 5. ISO-IEC/JTCI/SC29/WG11/N0400. CODED REPRESENTATION OF PICTURE AND AUDIO INFORMATION. DOCUMENT AVC-491B, VERSION 2: APRIL 1993, GENEVA, ISO, CH, 1993, pages 1-119, XP001150695 *
SCHREIER R M ET AL: "Motion Adaptive Intra Refresh for Low-Delay Video Coding" CONSUMER ELECTRONICS, 2006. ICCE '06. 2006 DIGEST OF TECHNICAL PAPERS. INTERNATIONAL CONFERENCE ON LAS VEGAS, NV, USA 07-11 JAN. 2006, PISCATAWAY, NJ, USA,IEEE, 7 janvier 2006 (2006-01-07), pages 453-454, XP010896700 ISBN: 0-7803-9459-3 *

Also Published As

Publication number Publication date
US20100296586A1 (en) 2010-11-25
GB0916386D0 (en) 2009-10-28
GB2459633A (en) 2009-11-04
US8279944B2 (en) 2012-10-02
FR2914124A1 (fr) 2008-09-26
FR2914124B1 (fr) 2009-08-28
WO2008132378A3 (fr) 2008-12-24

Similar Documents

Publication Publication Date Title
FR2764156A1 (fr) Dispositif de pretraitement pour codage mpeg ii
FR2898757A1 (fr) Procede et dispositif d&#39;adaptation d&#39;une frequence temporelle d&#39;une sequence d&#39;images video
FR2908585A1 (fr) Procede et dispositif de transmission de donnees video.
WO2006075061A1 (fr) Procede et dispositif de codage video
EP3707900B1 (fr) Procédé de formation d&#39;une séquence d&#39;images de sortie à partir d&#39;une séquence d&#39;images d&#39;entrée, procédé de reconstruction d&#39;une séquence d&#39;images d&#39;entrée à partir d&#39;une séquence d&#39;images de sortie, dispositifs, equipement serveur, equipement client et programmes d&#39;ordinateurs associés
FR2891685A1 (fr) Procede et dispositif d&#39;estimation de mouvement a references multiples, procede et dispositif de codage, produits programme d&#39;ordinateur et moyens de stockage correspondants.
EP2297968A1 (fr) Procede et systeme permettant de proteger un flux video compresse contre les erreurs survenant lors d&#39;une transmission
EP3490255A1 (fr) Compression intelligente de contenus vidéo grainés
FR2944938A1 (fr) Procede et dispositif de correction d&#39;erreurs.
WO2008132378A2 (fr) Procédé et dispositif de régulation du débit de codage de séquences d&#39;images vidéo vis-à-vis d&#39;un débit cible
EP3198876B1 (fr) Génération et codage d&#39;images intégrales résiduelles
EP2368367B1 (fr) Système et procédé interactif pour la transmission sur un réseau bas débit d&#39;images clefs sélectionnées dans un flux video
EP2410749A1 (fr) Procédé d&#39;encodage adaptatif d&#39;un flux vidéo numérique, notamment pour diffusion sur ligne xDSL
FR3002062A1 (fr) Systeme et procede de reduction dynamique de l&#39;entropie d&#39;un signal en amont d&#39;un dispositif de compression de donnees.
WO2006075070A1 (fr) Procede et dispositif de codage video
EP3357244A1 (fr) Procédé d&#39;encodage de flux de données vidéo basées sur des groupements d&#39;images (gop)
EP3637765A1 (fr) Optimisation d&#39;un sous-échantillonnage intervenant avant le codage d&#39;images en compression
WO2010124949A1 (fr) Procede d&#39;estimation du debit et de la distorsion de donnees d&#39;images codees a posteriori de l&#39;encodage
EP1241894A1 (fr) Procédé de codage d&#39;images numériques basé sur la dissimulation d&#39;erreurs
EP1714498B1 (fr) Procede de recherche de la directon de prediction en codage video intra-image
FR2978639A1 (fr) Procedes de compression et de decompression d&#39;images animees
EP3918798A1 (fr) Procédé et dispositif de codage et de décodage de données correspondant à une séquence vidéo
EP3843409A1 (fr) Procede d&#39;allocation pour liaison bas-debit
EP4104446A1 (fr) Procédé et dispositif de traitement de données de vidéo multi-vues
WO2016059196A1 (fr) Decodeur, procede et systeme de decodage de flux multimedia

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08788026

Country of ref document: EP

Kind code of ref document: A2

ENP Entry into the national phase

Ref document number: 0916386

Country of ref document: GB

Kind code of ref document: A

Free format text: PCT FILING DATE = 20080320

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 12532384

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 08788026

Country of ref document: EP

Kind code of ref document: A2