EP3922017A1 - Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image - Google Patents

Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image

Info

Publication number
EP3922017A1
EP3922017A1 EP20707501.1A EP20707501A EP3922017A1 EP 3922017 A1 EP3922017 A1 EP 3922017A1 EP 20707501 A EP20707501 A EP 20707501A EP 3922017 A1 EP3922017 A1 EP 3922017A1
Authority
EP
European Patent Office
Prior art keywords
pixel
prediction
block
value
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP20707501.1A
Other languages
German (de)
English (en)
Inventor
Félix Henry
Mohsen ABDOLI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Publication of EP3922017A1 publication Critical patent/EP3922017A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • TITLE METHODS AND DEVICES FOR CODING AND DECODING A DATA FLOW REPRESENTATIVE OF AT LEAST ONE IMAGE
  • the field of the invention is that of the coding and decoding of images or sequences of images, and in particular of video streams.
  • the invention relates to the compression of images or sequences of images using a block representation of the images.
  • the invention can in particular be applied to image or video coding implemented in current or future coders (JPEG, MPEG, H.264, HEVC, etc. and their amendments), and to the corresponding decoding.
  • JPEG Joint Photographic Experts Group
  • MPEG MPEG
  • H.264 High Efficiency Video Coding
  • HEVC High Efficiency Video Coding
  • Digital images and image sequences take up a lot of memory space, so when transmitting these images, they must be compressed to avoid congestion on the network used for that transmission.
  • HEVC compression standard High Efficiency Video Coding, Coding Tools and Specification
  • Matthias Wien, Signais and Communication Technology proposes to implement a prediction of pixels of a current image compared to other pixels belonging to the same image (intra prediction) or to a previous or next image (inter prediction).
  • intra prediction exploits spatial redundancies within an image.
  • the images are cut into blocks of pixels.
  • the blocks of pixels are then predicted using information already reconstructed, corresponding to the blocks previously encoded / decoded in the current image according to the order of travel of the blocks in the image.
  • the coding of a current block is carried out using a prediction of the current block, called the predictor block, and of a prediction residue or “residual block”, corresponding to a difference between the current block and the predictor block.
  • the residual block obtained is then transformed, for example using a DOT-type transform (discrete cosine transform).
  • the coefficients of the transformed residual block are then quantized, then encoded by entropy coding and transmitted to the decoder, which can reconstruct the current block by adding this residual block to the predictor block.
  • the decoding is done image by image, and for each image, block by block. For each block, the corresponding elements of the stream are read. The inverse quantization and the inverse transformation of the coefficients of the residual block are performed. Then the prediction of the block is calculated to obtain the predictor block, and the current block is reconstructed by adding the prediction (ie the predictor block) to the decoded residual block.
  • a DPCM (for Differential Dist Code Modulation) coding technique for coding blocks in Intra mode is inserted in a HEVC encoder.
  • One such technique consists in predicting a set of pixels of an intra block by another set of pixels of the same block which have been reconstructed previously.
  • a set of pixels of the intra block to be encoded corresponds to a row of the block, or a column or a row and a column and the intra prediction used to predict the set of pixels is one of the intra directional predictions defined in the HEVC standard.
  • the synthetic images are likely to contain areas having a very low number of pixel values, also called levels hereafter.
  • levels may have only 2 levels: one for the background and one for the foreground, such as black text on a white background.
  • the invention improves the state of the art. To this end, it relates to a method for decoding a coded data stream representative of at least one image cut into blocks.
  • Such a decoding method comprises, for at least one block of the image, said current block:
  • the invention also relates to a method for coding a data stream representative of at least one image cut into blocks.
  • a coding method comprises, for at least one block of the image, called the current block:
  • a group of pixel values representative of the neighboring pixel values of a block to be coded is determined.
  • this group comprises a predetermined number of the most frequent pixel values among the neighboring pixels of the block to be coded.
  • this group of values can include intensity values of the layers of the image when the image is represented in layers, for example for synthetic images, or comprising areas with a foreground and a background. delimited, such as black text on a white background.
  • the group of values comprises two values representative of the two most frequent values in the neighborhood of the block. When a pixel located in a transition zone is detected, its prediction value is modified to take one of the values of the group thus determined.
  • the selection of a value of the group is made as a function of a distance between the prediction value associated with said pixel and determined according to the first prediction mode with respect to the constant pixel values of the group.
  • This particular embodiment of the invention makes it possible to easily select a prediction value of the group for a pixel situated in a transition zone and does not require the transmission of additional information to indicate this selection.
  • the group comprising a first value and a second value, when a distance between the prediction value associated with said pixel and the first value is less than a distance between the associated prediction value at said pixel and the second value, the value of said selected group is the first value, and the value of said selected group is the second value otherwise.
  • the information indicating whether the pixel is predicted according to the second prediction mode is decoded from the data stream or encoded in the data stream only when the pixel prediction residue is different from 0.
  • This particular embodiment makes it possible to avoid the coding of the information indicating a prediction according to the second prediction mode when the prediction residue is different from 0.
  • the first mode of prediction is used by default to predict the current pixel.
  • This particular embodiment of the invention makes it possible to avoid the coding of unnecessary information by the coder. Indeed, at the encoder, when the prediction according to the first prediction mode makes it possible to obtain a zero prediction residue, ie an optimal prediction, the information indicating that the second prediction mode is not used for the current pixel is implicit.
  • Such a particular embodiment of the invention can be implemented in the encoder, by a preliminary step of calculating the prediction residue from the prediction resulting from the first prediction mode or else by a step of determining whether the value d the origin of the pixel to be coded is or is not distant from the prediction value resulting from the first prediction mode.
  • the determination of a group of constant pixel values for the block from previously decoded pixels is carried out by calculating a histogram of the values of neighboring pixels of the current block and previously reconstructed and the selection of at least two pixel values respectively representative of two most frequent pixel values among the neighboring pixels of the current block.
  • a threshold value is determined from at least one value of said group of constant pixel values for the block from previously decoded pixels.
  • the second prediction mode is chosen:
  • the invention also relates to a device for decoding an encoded data stream representative of at least one image cut into blocks.
  • a decoding device comprises a processor configured for, for at least one block of the image, said current block:
  • such a decoding device is included in a terminal.
  • the invention also relates to a device for coding a data stream representative of at least one image cut into blocks.
  • a coding device comprises a processor configured for, for at least one block of the image, said current block:
  • such a coding device is included in a terminal, or a server.
  • the invention also relates to a data stream representative of at least one image cut into blocks.
  • a data stream comprises, for at least one block of the image, said current block, and for each pixel of the current block:
  • the decoding method, respectively the encoding method, according to the invention can be implemented in various ways, in particular in wired form or in software form.
  • the decoding method, respectively the encoding method is implemented by a computer program.
  • the invention also relates to a computer program comprising instructions for implementing the decoding method or the encoding method according to any one of the particular embodiments described above, when said program is executed by a processor.
  • Such a program can use any programming language. It can be downloaded from a communications network and / or recorded on a computer readable medium.
  • This program can use any programming language, and be in the form of source code, object code, or intermediate code between source code and object code, such as only in a partially compiled form, or in any other desirable form.
  • the invention also relates to a recording medium or information medium readable by a computer, and comprising instructions of a computer program as mentioned above.
  • the recording media mentioned above can be any entity or device capable of storing the program.
  • the medium can include a storage means such as a memory.
  • the recording media can correspond to a transmissible medium such as an electrical or optical signal, which can be conveyed via an electrical or optical cable, by radio or by other means.
  • the program according to the invention can in particular be downloaded from an Internet type network.
  • the recording media can correspond to an integrated circuit in which the program is incorporated, the circuit being adapted to execute or to be used in the execution of the method in question.
  • FIG. 1 shows steps of the coding method according to a particular embodiment of the invention.
  • FIG. 2A illustrates an example of part of a data stream encoded according to a particular embodiment of the invention.
  • FIG. 2B illustrates an example of part of a data stream encoded according to another particular embodiment of the invention.
  • FIG. 3A illustrates an example of the position of the neighboring blocks of a current block to determine an intra prediction mode according to a particular embodiment of the invention.
  • FIG. 3B illustrates an example of the position of the reference pixels used to predict pixels of a current block according to a particular embodiment of the invention.
  • FIG. 4 shows steps of the decoding method according to a particular embodiment of the invention.
  • FIG. 5 illustrates examples of blocks comprising content of screen type each having two layers of content, as well as their respective neighborhood in the image according to a particular embodiment of the invention.
  • FIG. 6 illustrates an example of a 16x16 block comprising screen type content having two content layers and a transition map showing the transition states of the pixels for this block according to a particular embodiment of the invention.
  • FIG. 7 shows the simplified structure of an encoding device suitable for implementing the encoding method according to any one of the particular embodiments of the invention.
  • FIG. 8 shows the simplified structure of a decoding device adapted to implement the decoding method according to any one of the particular embodiments of the invention.
  • the invention makes it possible to improve a mode of coding a block of an image using a local prediction for pixels of the block located on a transition between two levels of very distinct pixel values.
  • a mode of coding a block to be coded using a local prediction allows the use of reference pixels belonging to the block to be coded to predict other pixels of the block to be coded. This prediction mode makes it possible to reduce the prediction residue thanks to the use of pixels of the block which are spatially very close to the pixel to be coded.
  • this coding mode introduces a relatively large coding residue when the original pixels are far from their prediction.
  • a block to be coded may have strong discontinuities.
  • reference pixels belonging to a background can be used to predict pixels of the same block belonging to a foreground, or vice versa.
  • the information available in the reference pixels is not adequate for an accurate prediction.
  • the pixels located at the border between a background area and a foreground area are hereinafter called transition pixels.
  • the invention proposes to derive for a block to be coded information relating to each layer of the image, for example information relating to the foreground and information relating to the background, in the case where only two layers are considered. Additional layers of content can obviously be taken into account, correspondingly increasing the amount of information to be derived. For example, the derivation of such information is to determine a group of constant pixel values for the block.
  • this information relating to each layer of the image is derived from a local neighborhood of the block to be coded.
  • this information is used with a mechanism for detecting the transition pixels in the block to be coded. This makes it possible to reduce the residual energy of such pixels.
  • FIG. 5 illustrates blocks (Bi-bl) comprising content of screen type each presenting two layers of content, as well as their respective neighborhood (Neigh) in the image.
  • the local neighborhood of a current block to be encoded contains useful information relating to the level of intensity of the two layers.
  • the prediction value for these pixels is corrected using an intensity level of the layer corresponding to that to which the pixel is susceptible. to belong.
  • such a mechanism in order to have an optimal prediction for each pixel of the block and a limited bit rate cost, such a mechanism is limited to the pixels satisfying certain conditions.
  • three states of the pixel to be predicted can be defined:
  • the pixel belongs to a homogeneous region in which the local prediction from neighboring pixels is very efficient, for example it provides a quantized prediction residue of zero.
  • the pixel is not a transition pixel. According to an alternative embodiment, this state can be detected implicitly at the decoder,
  • the pixel belongs to a region in which the local prediction from neighboring pixels is moderately efficient, for example it provides a weak prediction residual.
  • the prediction of the pixel by the correction mechanism cited above is allowed for this pixel, but the correction mechanism is not applied if the residual prediction error is not sufficiently large compared to a determined threshold value. depending on the intensity levels of the layers.
  • an indicator is coded specifically to signal the non-use of the correction mechanism,
  • the pixel belongs to a region in which the local prediction from neighboring pixels is not efficient, for example it provides a large prediction residue. Prediction of the pixel by the correction mechanism cited above is allowed for this pixel, and a flag is encoded specifically to signal this use.
  • FIG. 6 illustrates on the right an example of a 16x16 block comprising light text on a dark background and on the right a transition map for this block showing how the states described above can be assigned to the pixels of the block.
  • FIG. 1 shows steps of the coding method according to a particular embodiment of the invention.
  • a sequence of images h, l 2 , lisi b is coded in the form of a STR coded data stream according to a particular embodiment of the invention.
  • such a coding method is implemented by a coding device as described below in relation to FIG. 7.
  • a sequence of images h, l 2 , ..., Iisi b , Nb being the number of images of the sequence to be coded, is supplied at the input of the coding method.
  • the encoding method delivers at output an encoded data stream STR representative of the sequence of images supplied as input.
  • the coding of the sequence of images 1 ; l 2 , ..., l Nb is made image by image according to a coding order established beforehand and known to the coder.
  • the images can be coded in the time order 1 ; l 2 , ..., l Nb or in another order, for example
  • an image I to be encoded from the sequence of images ⁇ ⁇ 2 , ..., l Nb is cut into blocks, for example into blocks of size 32 ⁇ 32, or 64 ⁇ 64 pixels or more.
  • Such a block can be subdivided into square or rectangular sub-blocks, for example of size 16x16, 8x8, 4x4, 16x8, 8x16, ....
  • a first block or sub-block X b to be encoded of the image I is selected according to a direction of travel of the image I, which is predetermined. For example, it can be the first block in the lexicographical order of the image.
  • the encoder chooses the encoding mode for encoding the current block X b .
  • the encoder selects the coding mode for coding the current block X b from a first coding mode M1 and a second coding mode M2. Additional coding modes (not described here) can be used.
  • the first coding mode M1 corresponds to the coding of the current block by intra-classical prediction, for example as defined according to the HEVC standard
  • the second coding mode M2 corresponds to a coding mode by prediction said In Loop Residual (ILR) or DPCM described below.
  • ILR In Loop Residual
  • the principle of the invention can be extended to other types of coding modes for the first coding mode M1.
  • the first coding mode can correspond to any type of coding mode using a transformation of the prediction residue (coding by inter-picture prediction, coding by spatial prediction with "template matching" - for model matching - etc. ..).
  • the encoder can perform a bit rate / distortion optimization to determine the best encoding mode for encoding the current block.
  • additional coding modes distinct from the first and second coding modes can be tested, for example a coding mode in inter mode.
  • the encoder simulates the coding of the current block X b according to the different coding modes available in order to determine the bit rate and the distortion associated with each coding mode and select the coding mode offering the best bit rate / distortion compromise, for example according to the function D + ⁇ x R, where R represents the bit rate necessary to code the current block according to the coding mode evaluated, D the distortion measured between the decoded block and the original current block and l a Lagrangian multiplier, for example entered by the user or defined in the encoder.
  • step E20 information indicating the coding mode selected for the current block is coded in the data stream STR.
  • step E21 for coding the block according to M1. If the current block X b is coded according to the second coding mode M2, the method goes to step E22 for coding the block according to M2.
  • the step E21 of coding the block according to the first coding mode M1 is described below.
  • the first coding mode corresponds to an intra-classical prediction, such as that defined in the HEVC standard.
  • a quantization step 3 ⁇ 4 is determined.
  • the quantization step 3 ⁇ 4 can be set by the user, or calculated using a quantization parameter setting a compromise between compression and quality and entered by the user or defined by the encoder.
  • a quantization parameter can be the parameter L, used in the rate-distortion cost function D + A x R, where D represents the distortion introduced by the coding and R the rate used to code. This function is used to make coding choices. Conventionally, we are looking for the way to code the image which minimizes this function.
  • the quantization parameter can be the QP, corresponding to the quantization parameter conventionally used in the AVC or HEVC standards.
  • a prediction of the current block is determined using an intra-classic prediction mode.
  • each predicted pixel is calculated only from the decoded pixels resulting from the neighboring blocks (reference pixels) located above the current block, and to the left of the current block. How the pixels are predicted from the reference pixels depends on a prediction mode which is transmitted to the decoder, and which is chosen by the encoder from a predetermined set of known modes of the encoder and the decoder.
  • HEVC there are 35 possible prediction modes: 33 modes which interpolate the reference pixels in 33 different angular directions, and 2 other modes: the DC mode in which each pixel of the predicted block is produced from the average of the reference pixels, and PLANAR mode, which performs planar, non-directional interpolation.
  • This so-called “intra-classical prediction” approach is well known and also used in the ITU-T H.264 standard (where there are only 9 different modes), as well as in the JEM experimental software available at the internet address ( https://ivet.hhi.fraunhofer.de/). where there are 67 different prediction modes.
  • the intra-classical prediction respects the two aspects mentioned above (prediction of the pixels of the block to be coded from pixels of the neighboring blocks and transmission to the decoder of an optimal prediction mode).
  • the encoder therefore chooses one of the prediction modes available from the predetermined list of prediction modes.
  • One way to choose consists, for example, in evaluating all the prediction modes and in keeping the prediction mode which minimizes a cost function such as, conventionally, the bit rate-distortion cost.
  • the prediction mode chosen for the current block is coded from the neighboring blocks of the current block.
  • FIG. 3A illustrates an example of the position of neighboring blocks A b and B b of the current block X b to code the prediction mode of the current block X b .
  • the intra prediction mode chosen for the current block is coded using the intra prediction modes associated with the neighboring blocks.
  • the approach described in the HEVC standard for encoding the prediction mode of the current block can be used.
  • such an approach consists in identifying the intra m A prediction mode associated with the block A b located above the current block, and the intra m B prediction mode associated with the block B b located just to the left of the current block.
  • MPM for Most Probable Mode
  • non-MPM containing the 32 other prediction modes
  • syntax elements are transmitted:
  • an index in the non-MPM list corresponding to the prediction mode of the current block is coded.
  • the prediction residue R for the current block is constructed.
  • a predicted block P is constructed as a function of the prediction mode chosen in step E21 1. Then the prediction residue R is obtained by calculating the difference for each pixel, between the predicted block P and the original current block.
  • the prediction residue R is transformed into R T.
  • a frequency transform is applied to the block of residue R so as to produce the block R T comprising transformed coefficients.
  • the transform could be a transform of DCT type for example. It is possible to choose the transform to be used from among a predetermined set of transforms E T and to signal the transform used to the decoder.
  • the transformed residue block R T is quantized using for example a scalar quantization of quantization step d. This produces the quantized transformed prediction residue block R TQ .
  • the coefficients of the quantized block R TQ are encoded by an entropy coder.
  • the entropy coding specified in the HEVC standard can be used.
  • the current block is decoded by de-quantizing the coefficients of the quantized block R TQ , then by applying the inverse transform to the de-quantized coefficients to obtain the decoded prediction residue.
  • the prediction is then added to the decoded prediction residue in order to reconstruct the current block and to obtain its decoded version.
  • the decoded version of the current block can then be used subsequently to spatially predict other neighboring blocks of the image or else to predict blocks of other images by inter-image prediction.
  • the step E22 of coding the block according to the second coding mode M2, according to a particular embodiment of the invention, is described below.
  • the second coding mode corresponds to so-called ILR prediction coding.
  • a quantization step d 2 is determined.
  • the quantization step d 2 depends on the same quantization parameter as the quantization step ⁇ which would be determined in step E210 if the current block were coded according to the first coding mode.
  • the pixels of the current block can be predicted according to a first prediction mode or a second prediction mode.
  • a pixel of the current block is predicted by previously reconstructed pixels of a block neighboring the current block and / or previously processed pixels of the current block itself.
  • pixels are chosen which are as close as possible to the pixel to be predicted. For this reason, we speak of a local predictor.
  • a pixel of the current block is predicted by a level value of layers selected by a group of values determined from, for example, the neighborhood of the current block.
  • a group of constant pixel values for the block is determined from previously decoded pixels.
  • Several levels of reconstruction of the current block are determined, for example two, called f and b. These levels are constructed by analyzing the values taken by the reference pixels of the current block, ie the pixels resulting from blocks previously processed and neighboring to the current block.
  • There are several techniques for determining the f and b levels Thus, it is possible to calculate the histogram of the values of the reference pixels and to attribute to b the most frequent value and to f the second most frequent value. Another approach consists in identifying the local maxima of the histogram, ie the largest values surrounded by smaller values. The level f is then affected by the greatest local maximum and the level b by the second greatest local maximum.
  • thr p- where dyn is the maximum value of the signal.
  • the direct neighborhood of the current block is used: for example only the pixels of the column on the left, and of the row above the current block are used.
  • more than two values can be determined, by considering the following local maxima of the histogram for example.
  • the values f and b thus determined correspond to the values of the group of values used for the second prediction mode.
  • a local predictor PL for the pixel considered is determined.
  • This local predictor PL corresponds to the predictor obtained according to the first prediction mode.
  • the local predictor PL can be determined as follows. If we call X a current pixel to be predicted in the current block, A the pixel located immediately to the left of X, B the pixel located immediately to the left and above X, C the pixel located immediately above X, such that 'illustrated in FIG. 3B showing a current block X b .
  • min (A, B) corresponds to the function returning the smallest value between the value of A and the value of B and max (A, B) corresponds to the function returning the largest value between the value of A and the value of B.
  • local prediction functions can be used.
  • several local prediction functions can be available and the same local prediction function is selected for all the pixels of the current block. For example, an orientation of the texture of the pixels of neighboring blocks previously coded is analyzed. For example, the pixels previously encoded in a neighboring block which are located above or to the left of the current block are analyzed using a Sobel type operator. If it is determined that:
  • the prediction value PL (X) associated with the current pixel X of the current block is thus obtained as a function of the location of the pixel in the current block using either pixels outside the block and already reconstructed (and therefore available with their value decoded), either previously reconstructed pixels in the current block, or both. In all cases, the predictor PL uses previously reconstructed pixels.
  • FIG. 3B it can be seen that the pixels of the current block located on the first row and / or the first column of the current block will use as reference pixels (to build the prediction value PL (X)) pixels outside the block and already reconstructed (pixels in gray in FIG. 3B) and possibly already reconstructed pixels of the current block.
  • the reference pixels used to construct the prediction value PL (X) are located inside the current block.
  • the prediction mode is determined from among the first prediction mode and the second prediction mode to be used to predict the current pixel.
  • the second prediction mode is chosen when PL (X) ⁇ thr ⁇ X or when PL (X)>thr> X.
  • the second prediction mode is chosen: - when the original value X of the pixel is greater than the threshold value thr and the threshold value thr is greater than the prediction value PL (X) associated with the pixel determined according to the first prediction mode, or
  • an indicator t indicating that the pixel to be predicted is predicted according to the second prediction mode is positioned at 1 for example, and encoded in the data stream STR for example by entropy coding or transmitted as it is in the stream.
  • a value of the group of values determined during step E221 is selected to predict the current pixel.
  • the selection of a value of the group is made as a function of the distance between the prediction value associated with said pixel determined according to the first prediction mode with respect to the determined pixel values of the group. during step E221. For example, when the distance between the prediction value PL (X) associated with said pixel according to the first prediction mode and the value b of the group is less than the distance between the prediction value PL (X) associated with said pixel according to the first prediction mode and value f, the selected value is b, and the selected value is f otherwise.
  • the L1 or L2 standard can for example be used.
  • step E2205 The method then goes to step E2205.
  • step E2202 If, during step E2202, it is determined that the current pixel is not predicted according to the second prediction mode, the current pixel is then predicted according to the first prediction mode.
  • the prediction value PL (X) associated with the current pixel and obtained according to the first prediction mode is then not modified.
  • the prediction value PL (X) may have been obtained either by the first prediction mode or by the second prediction mode.
  • Q (X) is the quantized residue associated with X. It is calculated in the spatial domain, ie calculated directly from the difference between the prediction value PL (X) of pixel X and the original value of X. Such a residue quantized Q (X) for pixel X is stored in a quantized prediction residue block R1 Q , which will be encoded later.
  • the decoded predicted value P1 (X) of X is calculated by adding to the prediction value PL (X) the de-quantized value of the quantized residue Q (X).
  • the decoded predicted value P1 (X) thus makes it possible to predict any pixels which remain to be processed in the current block.
  • Such a block P1 constitutes the ILR predictor of the current block (as opposed to the intra-classical predictor).
  • the indicator t is also positioned at 0 since the current pixel is not predicted by the second prediction mode, but the flag t is not encoded in the STR data stream.
  • This prediction mode will be implicitly deduced at the decoder from the decoded value of the amplitude of the quantized prediction residue Q1 (X).
  • the indicator t is coded in the data stream after the coding of the quantized prediction residue Q1 (X).
  • the indicator t is positioned at 0, and coded during step E2207 in a systematic manner for each pixel, in the data stream STR, whatever the value of the amplitude a of the prediction residue Q1 (X).
  • the determination of the prediction mode from among the first prediction mode and the second mode of prediction. prediction to be used to predict the current pixel can for example be made by comparing a distance measurement between the prediction value provided by the first prediction mode and the original value X of the current pixel and a distance measurement between the value prediction provided by the second prediction mode and the original value X of the current pixel.
  • the order of travel of the current block is the lexicographic order, i.e. from left to right, and from top to bottom.
  • step E2205 the block of quantified residue R1 Q has been determined.
  • This block of quantized residue R1 Q must be coded in order to be transmitted to the decoder.
  • the predictor P1 of the current block was also determined.
  • the quantized residue block R1 Q is coded in order to transmit it to the decoder. It is possible to use any known approach such as the method described in HEVC to encode the quantized coefficients of a classical prediction residue.
  • each quantized prediction residue Q1 (X) of the current block is broken down into a value of amplitude a and an indicator of sign sgn when the amplitude a is distinct from 0.
  • the amplitude and sign values of the quantized residue block R1 Q are encoded using an entropy encoder in the STR data stream.
  • an additional prediction residue R2 from the ILR predictor obtained for the current block.
  • the coding of an additional prediction residue R2 is however optional. It is in fact possible to simply code the current block by its predicted version P1 and the quantized residue R1 Q.
  • the following steps correspond to the conventional steps for coding this residue R2.
  • the residue R2 is transformed using a frequency transform so as to produce the block of coefficients R2 T.
  • the transform can be a DOT type transform for example. It is possible to choose the transform to be used from among a predetermined set of transforms E T2 and to signal the transform used to the decoder. In this case, the set E T2 can be different from the set E T , in order to adapt to the particular statistics of the residue R2.
  • the block of coefficients R2 T is quantized, for example using a scalar quantization of quantization steps d. This produces the R2 TQ block.
  • the quantization step d can be set by the user. It can also be calculated using the parameter l fixing the compromise between compression and quality and entered by the user or the encoder. For example, the quantization step d can correspond to the quantization step 3 ⁇ 4 or be determined in a manner similar to the latter.
  • the coefficients of the quantized block R2 TQ are then transmitted in an encoded manner.
  • the encoding specified in the HEVC standard can be used.
  • the current block is decoded by de-quantizing the coefficients of the quantized block R2 TQ , then by applying the inverse transform to the de-quantized coefficients to obtain the decoded prediction residue.
  • the prediction P1 is then added to the residue of decoded prediction in order to reconstruct the current block and obtain its decoded version X rec .
  • the decoded version X rec of the current block can then be used subsequently to spatially predict other neighboring blocks of the image or else to predict blocks of other images by inter-image prediction.
  • step E23 it is checked whether the current block is the last block of the image to be processed by the encoding method, taking into account the order of travel defined above. If the current block is not the last block of the image to be processed, during a step E24, the next block of the image to be processed is selected according to the path of the image defined previously and the encoding method goes to step E2, where the selected block becomes the current block to be processed.
  • the method passes to the application of post-processing methods to be applied to the reconstructed image during a step E231.
  • postprocessing methods can be deblocking filtering and / or an SAO method (for Sample Adaptive Offset) as defined in the HEVC standard.
  • the method passes to the coding (step E25) of the next image of the video, if applicable.
  • FIGS. 2A and 2B schematically illustrate a part of the data stream resulting from the coding as described above according to various particular embodiments of the invention.
  • the data encoded for the pixel X1 are the amplitude value of the quantized prediction residue a (X1), its sign sgn (X1) and the value of the indicator t positioned at 1.
  • the data encoded for pixel X2 is the amplitude value of the quantized prediction residue a (X2), its sign sgn (X2) and the value of the indicator t.
  • the value of the amplitude of the quantized prediction residue being distinct from 0, the indicator t positioned at 0 is coded explicitly in the stream.
  • the encoded data for the pixel X3 is the amplitude value of the quantized prediction residue a (X3) which is zero.
  • the value of the amplitude of the quantized prediction residue is distinct from 0, the indicator t positioned at 0 is then not coded explicitly in the stream and will be implicitly deduced at the decoder.
  • the data encoded for the pixel X1 are the amplitude value of the quantized prediction residue a (X1), its sign sgn (X1) and the value of the indicator t positioned at 1.
  • the data encoded for the pixel X2 are the amplitude value of the quantized prediction residue a (X2), its sign sgn (X2) and the value of the indicator t positioned at 0.
  • the data encoded for the pixel X3 are the amplitude value of the quantized prediction residue a (X3) which is zero, and the indicator t positioned at 0.
  • FIG. 4 presents steps of the method of decoding a STR of encoded data representative of a sequence of images I ; l 2 , ..., l Nb to be decoded according to a particular embodiment of the invention.
  • the STR data stream has been generated via the encoding method presented in relation to FIG. 1.
  • the STR data stream is supplied at the input of a decoding device DEC, as described in relation to FIG. 8 .
  • the decoding method proceeds to decoding the stream image by image and each image is decoded block by block.
  • an image I to be decoded, is subdivided into blocks.
  • Each block will undergo a decoding operation consisting of a series of steps which are detailed below.
  • the blocks can be the same size or different sizes.
  • a first block or sub-block X b to be decoded of the image I is selected as the current block according to a direction of travel of the image I, which is predetermined. For example, it can be the first block in the lexicographical order of the image.
  • a step E42 information indicating a coding mode for the current block is read from the data stream STR.
  • this information indicates whether the current block is coded according to a first coding mode M1 or according to a second coding mode M2.
  • the first coding mode M1 corresponds to the coding of the current block by intra-classical prediction, for example as defined according to the HEVC standard
  • the second coding mode M2 corresponds to coding by In Loop prediction Residual (ILR).
  • ILR In Loop prediction Residual
  • the information read from the STR stream can also indicate the use of other coding modes to encode the current block (not described here).
  • a quantization step 3 ⁇ 4 is determined.
  • the quantization step 3 ⁇ 4 is determined from a quantization parameter QP transmitted in the STR data stream or in a manner similar to what was done to the encoder.
  • the quantization parameter QP can be the quantization parameter conventionally used in the AVC or HEVC standards.
  • the prediction mode used to encode the current block is decoded from the neighboring blocks. For this, like what was done at the encoder, the intra prediction mode chosen for the current block is decoded, using the intra prediction modes associated with the neighboring blocks of the current block.
  • an index in the non-MPM list corresponding to the prediction mode of the current block is read.
  • the binary indicator and the index of the prediction mode are therefore read for the current block from the data stream STR, to decode the intra prediction mode of the current block.
  • the decoder constructs a predicted block P for the current block from the decoded prediction mode.
  • the decoder decodes the coefficients of the quantized block R TQ from the data stream STR, for example by using the decoding specified in the HEVC standard.
  • the decoded block R TQ is de-quantized, for example using a scalar de-quantization of quantization steps This produces the block of dequantized coefficients R QD
  • an inverse frequency transform is applied to the block of de-quantized coefficients R TQD so as to produce the block of decoded prediction residue R TQD I.
  • the transform may be a transform of inverse DCT type for example. It is possible to choose the transform to be used from among a predetermined set of transforms E Ti by decoding an indicator from the data stream STR.
  • the step E44 of decoding the current block is described below when the current block is coded according to the second coding mode M2.
  • the quantization step d 2 is determined, in a manner similar to what was done at the encoder.
  • the pixels of the current block can be predicted according to the first prediction mode or the second prediction mode already presented in relation to FIG. 1.
  • the group of constant pixel values for the block is determined from previously decoded pixels of the image, in a manner similar to what was done at the encoder. It is considered as for the encoder, that the values of levels f and b have been determined.
  • the prediction value of the current pixel according to the first prediction mode is determined.
  • the same local predictor PL is used as that used at the encoder.
  • the local predictor PL is determined in an identical manner to what was done at the encoder.
  • the quantized residue R1 Q is decoded from the data stream STR. It is possible to use any known approach such as the method described in HEVC to decode the quantized coefficients of the classical prediction residue. The amplitude a of the quantized prediction residue Q1 '(X) for the current pixel is then obtained.
  • an indicator t indicating whether the current pixel is predicted according to the second mode prediction is implicitly positioned at 0.
  • the sign sgn associated with the quantized prediction residue QT (X) is read from the data stream STR.
  • the indicator t is coded systematically for each pixel of the current block.
  • the value 0 or 1 of the indicator t is read from the data stream STR and the state of the pixel s is positioned accordingly.
  • the current pixel is predicted according to the second prediction mode.
  • a value of the group of values determined during step E441 is selected and assigned to the prediction value PL (X) associated with the current pixel in order to predict the current pixel in a manner similar to what was done to the encoder. For example, if ⁇ PL (X) - b ⁇ ⁇ PL (X) f
  • the current pixel is predicted according to the first prediction mode.
  • the prediction value PL (X) of the current pixel determined according to the first prediction mode during step E441 1 is not modified.
  • the quantized residue Q1 ′ (X) is de-quantized using the quantization step d 2 , so as to produce the de-quantified residue QD1 (X).
  • the prediction residues Q1 (X) of the pixels of the current block are placed in a block of prediction residue R1 Q the de-quantized prediction residues QD1 (X) of the pixels of the current block are placed in a block of prediction residue of -quantified R1 QD, The reconstructed values X 'of the pixels of the current block are placed in a reconstructed block P1.
  • the browse order is the lexicographic order (from left to right, then the lines from top to bottom).
  • the block P1 comprising the reconstructed values PL (X) + QD1 (X) of each pixel of the current block constitutes here the decoded current block X rec .
  • an additional prediction residue has been coded for the current block. It is therefore necessary to decode this additional prediction residue in order to reconstruct the decoded version of the current block X rec .
  • this other particular embodiment may or may not be activated by default at the level of the encoder and of the decoder.
  • an indicator can be encoded in the data stream with the block level information to indicate for each block encoded according to the ILR encoding mode whether an additional prediction residue is encoded.
  • an indicator can be encoded in the data stream with the image level or sequence of images information to indicate for all the blocks of the image or of the sequence of images encoded according to the ILR encoding mode if a additional prediction residue is encoded.
  • the coefficients of the quantized prediction residue R2 TQ are decoded from the data stream STR, using means adapted to those used the encoder, for example the means implemented in an HEVC decoder.
  • the block of quantized coefficients R2 TQ is de-quantized, for example using a scalar de-quantization of quantization steps This produces the block of de-quantized coefficients R2 TQ D
  • an inverse frequency transform is applied to the block R2 TQD so as to produce the decoded prediction residue block R2 TQD I
  • the inverse transform may be a transform of inverse DCT type for example.
  • the transform to be used from among a predetermined set of transforms E T2 and to decode the information signaling the transform to be used at the decoder.
  • the set E T2 is different from the set E T , in order to adapt to the particular statistics of the residue R2.
  • the current block is reconstructed by adding the predicted block P1 obtained during step E444 to the decoded prediction residue R2 TQDL
  • step E45 it is checked whether the current block is the last block of the image to be processed by the decoding method, taking into account the browsing order defined previously. If the current block is not the last block of the image to be processed, during a step E46, the next block of the image to be processed is selected according to the path of the image defined previously and the decoding method passes to step E42, the selected block becoming the current block to be processed.
  • the method passes to the application of post-processing methods to be applied to the reconstructed image during a step E451 if necessary.
  • post-processing methods can be deblock filtering and / or an SAO method.
  • the method then proceeds to decoding (step E47) of the next image of the video, if applicable.
  • FIG. 7 shows the simplified structure of a COD coding device suitable for implementing the coding method according to any one of the particular embodiments of the invention.
  • the steps of the coding method are implemented by computer program instructions.
  • the coding device COD has the conventional architecture of a computer and comprises in particular a memory MEM, a processing unit UT, equipped for example with a processor PROC, and controlled by the computer program PG stored in MEM memory.
  • the computer program PG comprises instructions for implementing the steps of the coding method as described above, when the program is executed by the processor PROC.
  • the code instructions of the computer program PG are for example loaded into a RAM memory (not shown) before being executed by the processor PROC.
  • the processor PROC of the processing unit UT notably implements the steps of the coding method described above, according to the instructions of the computer program PG.
  • FIG. 8 shows the simplified structure of a decoding device DEC suitable for implementing the decoding method according to any one of the particular embodiments of the invention.
  • the decoding device DEC has the conventional architecture of a computer and includes in particular a MEMO memory, a UTO processing unit, equipped for example with a PROCO processor, and controlled by the PGO computer program stored in MEMO memory.
  • the computer program PGO comprises instructions for implementing the steps of the decoding method as described above, when the program is executed by the processor PROCO.
  • the code instructions of the computer program PGO are for example loaded into a RAM memory (not shown) before being executed by the PROCO processor.
  • the processor PROCO of the processing unit UTO notably implements the steps of the decoding method described above, according to the instructions of the computer program PGO.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention concerne un procédé de codage et décodage et corrélativement un dispositif de codage et de décodage d'un flux de données codées représentatif d'au moins une image découpée en blocs. Pour au moins un bloc courant de l'image, un groupe de valeurs de pixel constantes pour le bloc est déterminé (E441) à partir de pixels précédemment décodés, et pour chaque pixel du bloc, un résidu de prédiction associé audit pixel est décodé (E442). Une valeur de prédiction associée au pixel est déterminée (E4411) selon un premier mode de prédiction selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant, une information (E4422) indique si le pixel est prédit selon un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc. Lorsque le pixel est prédit selon le deuxième mode de prédiction, la valeur de prédiction associée au pixel est remplacée (E4423) par une valeur du groupe sélectionnée. Le pixel est reconstruit (E444) à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction.

Description

TITRE: PROCEDES ET DISPOSITIFS DE CODAGE ET DE DECODAGE D'UN FLUX DE DONNEES REPRESENTATIF D'AU MOINS UNE IMAGE
1. Domaine de l’invention
Le domaine de l’invention est celui du codage et du décodage d’images ou de séquences d’images, et notamment de flux vidéo.
Plus précisément, l’invention concerne la compression d’images ou de séquences d’images utilisant une représentation par blocs des images.
L’invention peut notamment s’appliquer au codage image ou vidéo mis en oeuvre dans les codeurs actuels ou à venir (JPEG, MPEG, H.264, HEVC, etc. et leurs amendements), et au décodage correspondant.
2. Art Antérieur
Les images et séquences d’images numériques occupent beaucoup d’espace en termes de mémoire, ce qui nécessite, lorsque l’on transmet ces images, de les compresser afin d’éviter les problèmes d’encombrement sur le réseau utilisé pour cette transmission.
On connaît déjà de nombreuses techniques de compression de données vidéo. Parmi celles-ci, le standard de compression HEVC ("High Efficiency Video Coding, Coding Tools and Spécification", Matthias Wien, Signais and Communication Technology, 2015) propose de mettre en oeuvre une prédiction de pixels d’une image courante par rapport à d’autres pixels appartenant à la même image (prédiction intra) ou à une image précédente ou suivante (prédiction inter).
Plus précisément, la prédiction intra exploite les redondances spatiales au sein d’une image. Pour ce faire, les images sont découpées en blocs de pixels. Les blocs de pixels sont alors prédits à l’aide d’informations déjà reconstruites, correspondant aux blocs précédemment codés/décodés dans l’image courante selon l’ordre de parcours des blocs dans l’image.
Par ailleurs, de manière classique, le codage d’un bloc courant est réalisé à l’aide d’une prédiction du bloc courant, dit bloc prédicteur, et d’un résidu de prédiction ou « bloc résiduel », correspondant à une différence entre le bloc courant et le bloc prédicteur. Le bloc résiduel obtenu est alors transformé, par exemple en utilisant une transformée de type DOT (transformée en cosinus discrète). Les coefficients du bloc résiduel transformé sont ensuite quantifiés, puis codés par un codage entropique et transmis au décodeur, qui peut reconstruire le bloc courant en ajoutant ce bloc résiduel au bloc prédicteur.
Le décodage est fait image par image, et pour chaque image, bloc par bloc. Pour chaque bloc, les éléments correspondants du flux sont lus. La quantification inverse et la transformation inverse des coefficients du bloc résiduel sont effectuées. Puis, la prédiction du bloc est calculée pour obtenir le bloc prédicteur, et le bloc courant est reconstruit en ajoutant la prédiction (i.e. le bloc prédicteur) au bloc résiduel décodé.
Dans US9253508, une technique de codage DPCM (pour Differential Puise Code Modulation en anglais) pour coder des blocs en mode Intra est insérée dans un codeur HEVC. Une telle technique consiste à prédire un ensemble de pixels d'un bloc intra par un autre ensemble de pixels du même bloc qui ont été précédemment reconstruits. Dans US9253508, un ensemble de pixels du bloc intra à coder correspond à une ligne du bloc, ou une colonne ou une ligne et une colonne et la prédiction intra utilisée pour prédire l'ensemble de pixels est l'une des prédictions intra directionnelles définies dans le standard HEVC.
Une telle technique n'est toutefois pas optimale. En effet, la prédiction d'un pixel par des pixels voisins précédemment traités est bien adaptée pour coder des données de type naturel (photos, vidéos). Toutefois, lorsque le type de contenu est artificiel, par exemple des contenus correspondant à des captures d'écran, ou à des images de synthèse, les images présentent de fortes discontinuités engendrant des transitions ayant de fortes énergies.
Plus particulièrement, les images de synthèse, par exemple, sont susceptibles de contenir des zones possédant un nombre très faible de valeurs de pixel, aussi appelé niveaux par la suite. Par exemple, certains zones peuvent présenter seulement 2 niveaux : un pour l'arrière-plan et un pour l'avant-plan, tel que du texte noir sur un fond blanc.
En présence d'une telle transition dans une zone de l'image, la valeur d'un pixel à coder est alors très éloignée de la valeur des pixels voisins. Une prédiction d'un tel pixel telle que celle décrite ci-dessus utilisant des pixels voisins précédemment traités peut alors difficilement modéliser de telles transitions.
Il existe donc un besoin pour une nouvelle méthode de codage et de décodage pour améliorer la compression des données image ou vidéo.
3. Exposé de l'invention
L'invention vient améliorer l'état de la technique. Elle concerne à cet effet un procédé de décodage d'un flux de données codées représentatif d'au moins une image découpée en blocs. Un tel procédé de décodage comprend, pour au moins un bloc de l'image, dit bloc courant:
- la détermination d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
• le décodage d'un résidu de prédiction associé audit pixel,
• la détermination d'une valeur de prédiction associée au pixel selon un premier mode de prédiction, selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant ou à un bloc de l'image précédemment décodé,
• le décodage à partir du flux de données, d'une information indiquant si le pixel est prédit selon un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
• lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
o sélection d'une valeur dudit groupe,
o remplacement de ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
• reconstruction dudit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction.
Corrélativement, l'invention concerne également un procédé de codage d'un flux de données représentatif d'au moins une image découpée en blocs. Un tel procédé de codage comprend, pour au moins un bloc de l'image, dit bloc courant:
- la détermination d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
• la détermination d'une valeur de prédiction associée au pixel selon un premier mode de prédiction selon lequel le pixel est prédit par la valeur de prédiction associée au pixel déterminée à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant ou à un bloc de l'image précédemment décodé,
• la détermination d'un mode de prédiction pour le pixel parmi le premier mode de prédiction et un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
• le codage dans le flux de données, d'une information indiquant si le pixel est prédit selon le deuxième mode de prédiction,
• lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
o sélection d'une valeur dudit groupe,
o remplacement de ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée, • le calcul d'un résidu de prédiction associé audit pixel à l'aide de la valeur de prédiction associée au pixel et de la valeur dudit pixel,
• le codage du résidu de prédiction associé audit pixel dans le flux de données,
• la reconstruction dudit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction décodé.
L'invention permet ainsi d'améliorer les performances en compression d'un mode de codage utilisant une prédiction locale par des pixels voisins d'un pixel à coder. Avantageusement, un groupe de valeurs de pixels représentatives des valeurs de pixels voisins d'un bloc à coder est déterminé. Par exemple, ce groupe comprend un nombre prédéterminé de valeurs de pixel les plus fréquentes parmi les pixels voisins du bloc à coder. Typiquement, ce groupe de valeurs peut comprendre des valeurs d'intensité des couches de l'image lorsque l'image est représentée en couches, par exemple pour des images de synthèses, ou comprenant des zones avec un avant-plan et un arrière-plan délimité, tel qu'un texte noir sur fond blanc. Selon un mode particulier de réalisation de l'invention, le groupe de valeurs comprend deux valeurs représentatives des deux valeurs les plus fréquentes dans le voisinage du bloc. Lorsqu'un pixel situé dans une zone de transition est détecté, sa valeur de prédiction est modifiée pour prendre une des valeurs du groupe ainsi déterminé.
Les valeurs d'un tel groupe sont dits constantes pour le bloc courant car elles sont déterminées une seule fois pour tous les pixels du bloc courant.
Selon un mode particulier de réalisation de l'invention, la sélection d'une valeur du groupe est faite en fonction d'une distance entre la valeur de prédiction associée audit pixel et déterminée selon le premier mode de prédiction par rapport aux valeurs de pixel constantes du groupe.
Ce mode particulier de réalisation de l'invention permet de sélectionner aisément une valeur de prédiction du groupe pour un pixel situé dans une zone de transition et ne nécessite pas de transmettre d'informations supplémentaires pour indiquer cette sélection.
Selon un autre mode particulier de réalisation de l'invention, le groupe comprenant une première valeur et une deuxième valeur, lorsqu'une distance entre la valeur de prédiction associée audit pixel et la première valeur est inférieure à une distance entre la valeur de prédiction associée audit pixel et la deuxième valeur, la valeur dudit groupe sélectionnée est la première valeur, et la valeur dudit groupe sélectionnée est la deuxième valeur sinon.
Selon un autre mode particulier de réalisation de l'invention, l'information indiquant si le pixel est prédit selon le deuxième mode de prédiction est décodée à partir du flux de données ou codée dans le flux de données seulement lorsque le résidu de prédiction du pixel est différent de 0.
Ce mode particulier de réalisation permet d'éviter le codage de l'information indiquant une prédiction selon le deuxième mode de prédiction lorsque le résidu de prédiction est différent de 0. Ainsi, selon ce mode particulier de réalisation, au décodeur, le premier mode de prédiction est utilisé par défaut pour prédire le pixel courant.
Ce mode particulier de réalisation de l'invention permet d'éviter le codage d'informations inutiles par le codeur. En effet, au codeur, lorsque la prédiction selon le premier mode de prédiction permet d'obtenir un résidu de prédiction nul, i.e. une prédiction optimale, l'information indiquant que le deuxième mode de prédiction n'est pas utilisé pour le pixel courant est implicite.
Un tel mode particulier de réalisation de l'invention peut être mis en œuvre au codeur, par une étape préalable de calcul du résidu de prédiction à partir de la prédiction issue du premier mode de prédiction ou bien par une étape de détermination si la valeur d'origine du pixel à coder est éloignée ou non de la valeur de prédiction issue du premier mode de prédiction.
Selon un autre mode particulier de réalisation de l'invention, la détermination d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés est réalisée par un calcul d'un histogramme des valeurs de pixels voisins du bloc courant et précédemment reconstruits et la sélection d'au moins deux valeurs de pixels représentatives respectivement de deux valeurs de pixels les plus fréquentes parmi les pixels voisins du bloc courant.
Selon un autre mode particulier de réalisation de l'invention, une valeur de seuil est déterminée à partir d'au moins une valeur dudit groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés. Lors de la détermination d'un mode de prédiction pour le pixel, le deuxième mode de prédiction est choisi:
- lorsque la valeur originale dudit pixel est supérieure à ladite valeur de seuil et la valeur de seuil est supérieure à la valeur de prédiction associée au pixel déterminée selon le premier mode de prédiction, ou
- lorsque la valeur originale dudit pixel est inférieure à ladite valeur de seuil et la valeur de seuil est inférieure à la valeur de prédiction associée au pixel déterminée selon le premier mode de prédiction. L'invention concerne également un dispositif de décodage d'un flux de données codées représentatif d'au moins une image découpée en blocs. Un tel dispositif de décodage comprend un processeur configuré pour, pour au moins un bloc de l'image, dit bloc courant:
- déterminer un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
• décoder un résidu de prédiction associé audit pixel,
• déterminer une valeur de prédiction associée au pixel, à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant ou à un bloc de l'image précédemment décodé,
• déterminer à partir du flux de données, une information indiquant si le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
• lorsque l'information indique que le pixel est prédit à l'aide d'une prédiction issue du groupe de valeurs de pixel constantes pour le bloc:
o sélectionner une valeur dudit groupe,
o remplacer ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
• reconstruire ledit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction.
Selon un mode particulier de réalisation de l'invention, un tel dispositif de décodage est compris dans un terminal.
L'invention concerne également un dispositif de codage d'un flux de données représentatif d'au moins une image découpée en blocs. Un tel dispositif de codage comprend un processeur configuré pour, pour au moins un bloc de l'image, dit bloc courant:
- déterminer un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
• déterminer une valeur de prédiction associée au pixel selon un premier mode de prédiction, selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant ou à un bloc de l'image précédemment décodé,
• déterminer un mode de prédiction pour le pixel parmi le premier mode de prédiction et un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
• coder dans le flux de données, une information indiquant si le pixel est prédit selon le deuxième mode de prédiction,
• lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
o sélectionner une valeur dudit groupe,
o remplacer ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
• calculer un résidu de prédiction associé audit pixel à l'aide de la valeur de prédiction associée au pixel et de la valeur dudit pixel,
• coder le résidu de prédiction associé audit pixel dans le flux de données,
• reconstruire ledit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction décodé.
Selon un mode particulier de réalisation de l'invention, un tel dispositif de codage est compris dans un terminal, ou un serveur.
L'invention concerne également un flux de données représentatif d'au moins une image découpée en blocs. Un tel flux de données comprend, pour au moins un bloc de l'image, dit bloc courant, et pour chaque pixel du bloc courant:
- une information représentative d'un résidu de prédiction associé audit pixel,
- une information indiquant si le pixel est prédit à l'aide d'une prédiction issue d'un groupe de valeurs de pixel constantes pour le bloc, le groupe de valeurs de pixel constantes pour le bloc étant déterminé à partir de pixels précédemment décodés.
Le procédé de décodage, respectivement le procédé de codage, selon l'invention peut être mis en œuvre de diverses manières, notamment sous forme câblée ou sous forme logicielle. Selon un mode particulier de réalisation de l'invention, le procédé de décodage, respectivement le procédé de codage, est mis en œuvre par un programme d'ordinateur. L'invention concerne également un programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé de décodage ou du procédé de codage selon l'un quelconque des modes particuliers de réalisation décrits précédemment, lorsque ledit programme est exécuté par un processeur. Un tel programme peut utiliser n’importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur.
Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable.
L'invention vise aussi un support d'enregistrement ou support d'informations lisible par un ordinateur, et comportant des instructions d'un programme d'ordinateur tel que mentionné ci- dessus. Les supports d'enregistrement mentionnés ci-avant peuvent être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage telle qu'une mémoire. D'autre part, les supports d'enregistrement peuvent correspondre à un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.
Alternativement, les supports d'enregistrement peuvent correspondre à un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
4. Liste des figures
D’autres caractéristiques et avantages de l’invention apparaîtront plus clairement à la lecture de la description suivante d’un mode de réalisation particulier, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :
[Fig 1] La figure 1 présente des étapes du procédé de codage selon un mode particulier de réalisation de l'invention.
[Fig 2A] La figure 2A illustre un exemple d'une partie d'un flux de données codées selon un mode particulier de réalisation de l'invention.
[Fig 2B] La figure 2B illustre un exemple d'une partie d'un flux de données codées selon un autre mode particulier de réalisation de l'invention.
[Fig 3A] La figure 3A illustre un exemple de position des blocs voisins d'un bloc courant pour déterminer un mode de prédiction intra selon un mode particulier de réalisation de l'invention.
[Fig 3B] La figure 3B illustre un exemple de position des pixels de référence utilisés pour prédire des pixels d'un bloc courant selon un mode particulier de réalisation de l'invention.
[Fig 4] La figure 4 présente des étapes du procédé de décodage selon un mode particulier de réalisation de l'invention.
[Fig 5] La figure 5 illustre des exemples de blocs comprenant du contenu de type écrans présentant chacun deux couches de contenus, ainsi que leur voisinage respectif dans l'image selon un mode particulier de réalisation de l'invention. [Fig 6] La figure 6 illustre un exemple de bloc 16x16 comprenant du contenu de type écrans présentant deux couches de contenus et une carte de transition montrant les états de transition des pixels pour ce bloc selon un mode particulier de réalisation de l'invention.
[Fig 7] La figure 7 présente la structure simplifiée d’un dispositif de codage adapté pour mettre en oeuvre le procédé de codage selon l'un quelconque des modes particuliers de réalisation de l'invention.
[Fig 8] La figure 8 présente la structure simplifiée d’un dispositif de décodage adapté pour mettre en oeuvre le procédé de décodage selon l'un quelconque des modes particuliers de réalisation de l'invention.
5. Description d'un mode de réalisation de l'invention
5.1 Principe général
L'invention permet d'améliorer un mode de codage d'un bloc d'une image utilisant une prédiction locale pour des pixels du bloc localisés sur une transition entre deux niveaux de valeurs de pixels très distincts.
Un mode de codage d'un bloc à coder utilisant une prédiction locale permet l'utilisation de pixels de référence appartenant au bloc à coder pour prédire d'autres pixels du bloc à coder. Ce mode de prédiction permet de réduire le résidu de prédiction grâce à l'utilisation de pixels du bloc très proches spatialement du pixel à coder.
Toutefois, ce mode de codage introduit un résidu de codage relativement grand lorsque les pixels d'origine sont éloignés de leur prédiction. C'est généralement le cas pour les contenus de type captures d'écrans, ou image de synthèse. Dans ce type de contenus, un bloc à coder peut présenter de fortes discontinuités. Dans ce cas, des pixels de référence appartenant à un arrière-plan peuvent être utilisés pour prédire des pixels du même bloc appartenant à un avant-plan, ou vice-versa. Dans ce cas, l'information disponible dans les pixels de référence n'est pas adéquate pour une prédiction précise. Les pixels localisés à la frontière entre une zone d'arrière-plan et une zone d'avant-plan sont appelés par la suite pixels de transition.
Avantageusement, l'invention propose de dériver pour un bloc à coder une information relative à chaque couche de l'image, par exemple une information relative à l'avant-plan et une information relative à l'arrière-plan, dans le cas où seulement deux couches sont considérées. Des couches supplémentaires de contenus peuvent évidemment être prises en compte, augmentant d'autant le nombre d'informations à dériver. Par exemple, la dérivation de telles informations consiste à déterminer un groupe de valeurs de pixels constantes pour le bloc.
Selon un mode particulier de réalisation de l'invention, ces informations relatives à chaque couche de l'image sont dérivées à partir d'un voisinage local du bloc à coder. Avantageusement, ces informations sont utilisées avec un mécanisme de détection des pixels de transition dans le bloc à coder. Ceci permet de réduire l'énergie résiduelle de tels pixels.
La figure 5 illustre des blocs (Bi-bl) comprenant du contenu de type écrans présentant chacun deux couches de contenus, ainsi que leur voisinage (Neigh) respectif dans l'image. Tel qu'illustré sur la figure 5, le voisinage local d'un bloc courant à coder contient des informations utiles relatives au niveau d'intensité des deux couches.
Selon l'invention, lorsque des pixels de transition dans le bloc à coder sont détectés, la valeur de prédiction pour ces pixels est corrigée à l'aide d'un niveau d'intensité de la couche correspondant à celle à laquelle le pixel est susceptible d'appartenir.
Selon un mode particulier de réalisation de l'invention, afin d'avoir une prédiction optimale pour chaque pixel du bloc et un coût en débit limité, un tel mécanisme est limité aux pixels satisfaisant certaines conditions.
En fonction d'un voisinage local d'un pixel à prédire, trois états du pixel à prédire peuvent être définis:
- s1 : le pixel appartient à une région homogène dans laquelle la prédiction locale à partir des pixels voisins est très efficace, par exemple elle fournit un résidu de prédiction quantifié nul. Dans ce cas, le pixel n'est pas un pixel de transition. Selon une variante de réalisation, cet état peut être détecté de manière implicite au décodeur,
- s2: le pixel appartient à une région dans laquelle la prédiction locale à partir des pixels voisins est modérément efficace, par exemple elle fournit un résidu de prédiction faible. La prédiction du pixel par le mécanisme de correction cité ci-dessus est autorisée pour ce pixel, mais le mécanisme de correction n'est pas appliqué si l'erreur de prédiction résiduelle n'est pas suffisamment grande par rapport à une valeur de seuil déterminée en fonction des niveaux d'intensité des couches. Dans ce cas, un indicateur est codé spécifiquement pour signaler la non-utilisation du mécanisme de correction,
- s3: le pixel appartient à une région dans laquelle la prédiction locale à partir des pixels voisins n'est pas efficace, par exemple elle fournit un résidu de prédiction important. La prédiction du pixel par le mécanisme de correction cité ci-dessus est autorisée pour ce pixel, et un indicateur est codé spécifiquement pour signaler cette utilisation.
La figure 6 illustre à droite un exemple de bloc 16x16 comprenant un texte clair sur un fond sombre et à droite une carte de transition pour ce bloc montrant comment les états décrits ci- dessus peuvent être assignés aux pixels du bloc.
5. 2 Exemples de mise en œuvre La figure 1 présente des étapes du procédé de codage selon un mode particulier de réalisation de l'invention. Par exemple, on code une séquence d'images h, l2, Iisib sous la forme d'un flux de données codées STR selon un mode particulier de réalisation de l'invention. Par exemple, un tel procédé de codage est mis en oeuvre par un dispositif de codage tel que décrit plus loin en relation avec la figure 7.
Une séquence d'images h , l2, ..., Iisib, Nb étant le nombre d'images de la séquence à coder, est fournie en entrée du procédé de codage. Le procédé de codage délivre en sortie un flux de données codées STR représentatif de la séquence d'images fournie en entrée.
De manière connue, le codage de la séquence d'images l ; l2, ..., lNb est fait image par image selon un ordre de codage préalablement établi et connu du codeur. Par exemple, les images peuvent être codées dans l'ordre temporel l ; l2, ..., lNb ou selon un autre ordre, par exemple
I l 3133 l³, , I Nb -
Lors d'une étape E0, une image I à coder de la séquence d'images \ \2, ..., lNb est découpée en blocs, par exemple en blocs de taille 32x32, ou 64x64 pixels ou plus. Un tel bloc peut être subdivisé en sous-blocs carrés ou rectangulaires, par exemple de taille 16x16, 8x8, 4x4, 16x8, 8x16, ....
Lors d'une étape E1 , un premier bloc ou sous-bloc Xb à coder de l'image I, est sélectionné selon un sens de parcours de l'image I, prédéterminé. Par exemple, il peut s'agir du premier bloc dans l'ordre lexicographique de parcours de l'image.
Lors d'une étape E2, l’encodeur choisit le mode de codage pour coder le bloc courant Xb. Selon le mode particulier de réalisation décrit ici, l'encodeur sélectionne le mode de codage pour coder le bloc courant Xb parmi un premier mode de codage M1 et un deuxième mode de codage M2. Des modes de codage supplémentaires (non décrits ici) peuvent être utilisés. Selon le mode particulier de réalisation décrit ici, le premier mode de codage M1 correspond au codage du bloc courant par prédiction intra classique, par exemple tel que défini selon le standard HEVC et le deuxième mode de codage M2 correspond à un mode de codage par prédiction dit In Loop Residual (ILR) ou DPCM décrit plus loin.
Le principe de l'invention peut être étendu à d'autres types de modes de codage pour le premier mode de codage M1 . Par exemple, le premier mode de codage peut correspondre à tout type de modes de codage utilisant une transformation du résidu de prédiction (codage par prédiction inter-images, codage par prédiction spatiale avec "template matching" - pour appariement de modèle-, etc...).
Lors de l'étape E2, le codeur peut réaliser une optimisation débit/distorsion pour déterminer le meilleur mode de codage pour coder le bloc courant. Au cours de cette optimisation débit/distorsion, des modes de codage supplémentaires distincts du premier et du deuxième mode de codage peuvent être testés, par exemple un mode de codage en mode inter. Au cours de cette optimisation débit/distorsion, le codeur simule le codage du bloc courant Xb selon les différents modes de codage disponibles afin de déterminer le débit et la distorsion associés à chaque mode de codage et sélectionne le mode de codage offrant le meilleur compromis débit/distorsion, par exemple selon la fonction D + À x R , où R représente le débit nécessaire pour coder le bloc courant selon le mode de codage évalué, D la distorsion mesurée entre le bloc décodé et le bloc courant original et l un multiplicateur lagrangien, par exemple entré par l'utilisateur ou défini au codeur.
Lors d'une étape E20, une information indiquant le mode de codage sélectionné pour le bloc courant est codée dans le flux de données STR.
Si le bloc courant Xb est codé selon le premier mode de codage M1 , le procédé passe à l'étape E21 de codage du bloc selon M1 . Si le bloc courant Xb est codé selon le deuxième mode de codage M2, le procédé passe à l'étape E22 de codage du bloc selon M2.
On décrit ci-après l'étape E21 de codage du bloc selon le premier mode de codage M1 , selon un mode particulier de réalisation de l'invention. Selon le mode particulier décrit ici, le premier mode de codage correspond à une prédiction intra classique, telle que celle définie dans le standard HEVC.
Lors d'une étape E210, un pas de quantification ¾ est déterminé. Par exemple, le pas de quantification ¾ peut être fixé par l’utilisateur, ou bien calculé à l’aide d’un paramètre de quantification fixant un compromis entre compression et qualité et entré par l’utilisateur ou défini par le codeur. Ainsi, un tel paramètre de quantification peut être le paramètre L, utilisé dans la fonction de coût débit-distorsion D + A x R, où D représente la distorsion introduite par le codage et R le débit utilisé pour coder. Cette fonction sert à faire des choix de codage. Classiquement on cherche la façon de coder l'image qui minimise cette fonction.
En variante, le paramètre de quantification peut être le QP, correspondant au paramètre de quantification utilisé classiquement dans les normes AVC ou HEVC. Ainsi, dans la norme HEVC, le pas de quantification ^est déterminé par l’équation ¾ = levelScale[QP% 6] << (QP/ 6) où levelScale[ k ] = { 40, 45, 51 , 57, 64, 72 } pour k = 0..5.
Lors d'une étape E21 1 , une prédiction du bloc courant est déterminée à l'aide d'un mode de prédiction intra classique. Selon cette prédiction intra classique, chaque pixel prédit est calculé uniquement à partir des pixels décodés issus des blocs voisins (pixels de référence) situés au-dessus du bloc courant, et à gauche du bloc courant. La façon dont les pixels sont prédits à partir des pixels de référence dépend d’un mode de prédiction qui est transmis au décodeur, et qui est choisi par le codeur parmi un ensemble prédéterminé de modes connus du codeur et du décodeur.
Ainsi, dans HEVC il y a 35 modes de prédiction possibles : 33 modes qui interpolent les pixels de référence dans 33 directions angulaires différentes, et 2 autres modes: le mode DC dans lequel chaque pixel du bloc prédit est produit à partir de la moyenne des pixels de référence, et le mode PLANAR, qui effectue une interpolation plane et non directionnelle. Cette approche dite « prédiction intra classique » est bien connue et également utilisée dans le standard ITU-T H.264 (où il n’y a que 9 modes différents), ainsi que dans le logiciel expérimental JEM disponible à l’adresse internet (https://ivet.hhi.fraunhofer.de/). où il y a 67 modes de prédiction différents. Dans tous les cas, la prédiction intra classique respecte les deux aspects cités ci-dessus (prédiction des pixels du bloc à coder à partir de pixels des blocs voisins et transmission au décodeur d'un mode de prédiction optimal).
Au cours de l'étape E21 1 , le codeur choisit donc un des modes de prédiction disponibles parmi la liste prédéterminée de modes de prédiction. Une façon de choisir consiste par exemple à évaluer tous les modes de prédiction et à conserver le mode de prédiction qui minimise une fonction de coût tel que, classiquement, le coût débit-distorsion.
Lors d'une étape E212, le mode de prédiction choisi pour le bloc courant est codé à partir des blocs voisins du bloc courant. La figure 3A illustre un exemple de position des blocs voisins Ab et Bb du bloc courant Xb pour coder le mode de prédiction du bloc courant Xb.
Au cours de l'étape E212, le mode de prédiction intra choisi pour le bloc courant est codé en utilisant les modes de prédiction intra associés aux blocs voisins.
Par exemple, l’approche décrite dans la norme HEVC pour coder le mode de prédiction du bloc courant peut être utilisée. Dans l’exemple de la figure 3A, une telle approche consiste à identifier le mode de prédiction intra mA associé au bloc Ab situé au-dessus du bloc courant, et le mode de prédiction intra mB associé au bloc Bb situé juste à gauche du bloc courant. En fonction de la valeur de mA et de mB, une liste dite MPM (pour Most Probable Mode), contenant 3 modes de prédiction intra, et une liste dite non-MPM, contenant les 32 autres modes de prédiction, sont créées.
Selon la norme HEVC, afin de coder le mode de prédiction intra du bloc courant, des éléments de syntaxe sont transmis :
-un indicateur binaire indiquant si le mode de prédiction à coder pour le bloc courant est dans la liste MPM ou non,
-si le mode de prédiction du bloc courant appartient à la liste MPM, un index dans la liste MPM correspondant au mode de prédiction du bloc courant est codé,
- si le mode de prédiction du bloc courant n'appartient pas à la liste MPM, un index dans la liste non-MPM correspondant au mode de prédiction du bloc courant est codé.
Lors d'une étape E213, le résidu de prédiction R pour le bloc courant est construit.
Au cours de l'étape E213, de manière classique, un bloc prédit P est construit en fonction du mode de prédiction choisi à l'étape E21 1 . Puis le résidu de prédiction R est obtenu en calculant la différence pour chaque pixel, entre le bloc prédit P et le bloc courant original.
Lors d'une étape E214, le résidu de prédiction R est transformé en RT. Au cours de l'étape E214, une transformée fréquentielle est appliquée au bloc de résidu R de façon à produire le bloc RT comprenant des coefficients transformés. La transformée pourra être une transformée de type DCT par exemple. Il est possible de choisir la transformée à utiliser parmi un ensemble prédéterminé de transformées ET et de signaler la transformée utilisée au décodeur.
Lors d'une étape E215, le bloc de résidu transformé RT est quantifié à l'aide par exemple d’une quantification scalaire de pas de quantification d . Ceci produit le bloc de résidu de prédiction transformé quantifié RTQ.
Lors d'une étape E216, les coefficients du bloc quantifié RTQ sont codés par un codeur entropique. On peut par exemple utiliser le codage entropique spécifié dans la norme HEVC. De manière connue, le bloc courant est décodé en dé-quantifiant les coefficients du bloc quantifié RTQ, puis en appliquant la transformée inverse aux coefficients dé-quantifiés pour obtenir le résidu de prédiction décodé. La prédiction est ensuite ajoutée au résidu de prédiction décodé afin de reconstruire le bloc courant et d'obtenir sa version décodée. La version décodée du bloc courant peut ensuite être utilisée ultérieurement pour prédire spatialement d'autres blocs voisins de l'image ou bien pour prédire des blocs d'autres images par prédiction inter-images.
On décrit ci-après l'étape E22 de codage du bloc selon le deuxième mode de codage M2, selon un mode particulier de réalisation de l'invention. Selon le mode particulier décrit ici, le deuxième mode de codage correspond à un codage par prédiction dit ILR.
Au cours d'une étape préalable E220, un pas de quantification d2 est déterminé. Par exemple, le pas de quantification d2 dépend d'un même paramètre de quantification que le pas de quantification ^qui serait déterminé à l'étape E210 si le bloc courant était codé selon le premier mode de codage.
Selon l'invention, dans ce mode de codage, les pixels du bloc courant peuvent être prédits selon un premier mode de prédiction ou un deuxième mode de prédiction.
Selon le premier mode de prédiction, un pixel du bloc courant est prédit par des pixels précédemment reconstruits d'un bloc voisin du bloc courant et/ou des pixels précédemment traités du bloc courant lui-même. De préférence, pour prédire un pixel, on choisit des pixels qui sont les plus proches possibles du pixel à prédire. Pour cette raison, on parle de prédicteur local.
Selon le deuxième mode de prédiction, un pixel du bloc courant est prédit par une valeur de niveau de couches sélectionnées par un groupe de valeurs déterminées à partir, par exemple, du voisinage du bloc courant. Au cours d'une étape E221 , un groupe de valeurs de pixel constantes pour le bloc est déterminé à partir de pixels précédemment décodés. On détermine plusieurs niveaux de reconstruction du bloc courant, par exemple deux, appelés f et b. Ces niveaux sont construits par analyse des valeurs prises par les pixels de référence du bloc courant, i.e. les pixels issus de blocs précédemment traités et voisins du bloc courant. Il existe plusieurs techniques pour déterminer les niveaux f et b. Ainsi, il est possible de calculer l’histogramme des valeurs des pixels de référence et d’attribuer à b la valeur la plus fréquente et à f la deuxième valeur la plus fréquente. Une autre approche consiste à identifier les maxima locaux de l'histogramme, i.e. les plus grandes valeurs entourées de valeurs plus petites. Le niveau f est alors affecté du plus grand maximum local et le niveau b du deuxième plus grand maximum local.
Par ailleurs, selon un mode particulier de réalisation de l'invention, une valeur seuil thr e st déterminée, qui est typiquement à mi-chemin de f et de b et définie telle que thr =
Selon un mode alternatif de réalisation, on peut également choisir thr = p- où dyn est la valeur maximum du signal.
Les variantes de réalisation décrites ci-dessus pour déterminer le groupe de valeurs de pixel constantes pour le bloc permettent une détection implicite des couches de l'image qui peut être mise en œuvre également au décodeur, sans nécessiter la transmission d'informations supplémentaires.
Par exemple, pour limiter la complexité de la détection des couches de l'image, le voisinage direct du bloc courant est utilisé : par exemple seuls les pixels de la colonne à gauche, et de la ligne au-dessus du bloc courant sont utilisés.
Selon d'autres variantes, plus de deux valeurs peuvent être déterminées, en considérant les maxima locaux suivants de l'histogramme par exemple.
Les valeurs f et b ainsi déterminées correspondent aux valeurs du groupe de valeurs utilisées pour le deuxième mode de prédiction.
On réalise les étapes suivantes pour chaque pixel du bloc courant.
Au cours d'une étape E2201 , un prédicteur local PL pour le pixel considéré est déterminé. Ce prédicteur local PL correspond au prédicteur obtenu selon le premier mode de prédiction. Le prédicteur local PL peut être déterminé comme suit. Si on appelle X un pixel courant à prédire du bloc courant, A le pixel situé immédiatement à gauche de X, B le pixel situé immédiatement à gauche et au-dessus de X, C le pixel situé immédiatement au-dessus de X, tel qu'illustré en figure 3B montrant un bloc courant Xb. Le prédicteur local PL est défini par: PL(X) = min(A,B) si C > max(A,B)
max(A,B) si C < min(A,B)
A+B-C sinon
où min(A,B) correspond à la fonction retournant la valeur la plus petite entre la valeur de A et la valeur de B et max(A,B) correspond à la fonction retournant la valeur la plus grande entre la valeur de A et la valeur de B.
D'autres fonctions de prédiction locales peuvent être utilisées. Selon une autre variante, plusieurs fonctions de prédiction locales peuvent être disponibles et une même fonction de prédiction locale est sélectionnée pour tous les pixels du bloc courant. Par exemple, une orientation de la texture des pixels de blocs voisins précédemment codés est analysée. Par exemple, les pixels précédemment codés dans un bloc voisin qui sont situés au-dessus ou à gauche du bloc courant sont analysés à l’aide d’un opérateur de type Sobel. S'il est déterminé que:
- si aucune orientation ne se dégage, la fonction de prédiction est celle définie ci-dessus,
- si l'orientation est horizontale, la fonction de prédiction est PL(X)=A,
- si l'orientation est verticale, la fonction de prédiction est PL(X)=B,
- si l'orientation est diagonale, la fonction de prédiction est PL(X)=C.
La valeur de prédiction PL(X) associée au pixel courant X du bloc courant est ainsi obtenue en fonction de la localisation du pixel dans le bloc courant à l’aide soit des pixels extérieurs au bloc et déjà reconstruits (et donc disponibles avec leur valeur décodée), soit des pixels précédemment reconstruits dans le bloc courant, soit des deux. Dans tous les cas, le prédicteur PL utilise des pixels précédemment reconstruits. Sur la figure 3B, on voit que les pixels du bloc courant situés sur la première ligne et/ou la première colonne du bloc courant utiliseront comme pixels de référence (pour construire la valeur de prédiction PL(X)) des pixels extérieurs au bloc et déjà reconstruits (pixels en gris sur la figure 3B) et éventuellement des pixels déjà reconstruits du bloc courant. Pour les autres pixels du bloc courant, les pixels de référence utilisés pour construire la valeur de prédiction PL(X) sont situés à l'intérieur du bloc courant.
Au cours d'une étape E2202, on détermine le mode de prédiction parmi le premier mode de prédiction et le deuxième mode de prédiction à utiliser pour prédire le pixel courant.
Selon un mode particulier de réalisation de l'invention, le deuxième mode de prédiction est choisi lorsque PL(X) < thr < X ou lorsque PL(X) > thr > X. Autrement dit, le deuxième mode de prédiction est choisi: - lorsque la valeur originale X du pixel est supérieure à la valeur de seuil thr e t la valeur de seuil thr e st supérieure à la valeur de prédiction PL(X) associée au pixel déterminée selon le premier mode de prédiction, ou
- lorsque la valeur originale X du pixel est inférieure à la valeur de seuil thr et la valeur de seuil thr e st inférieure à la valeur de prédiction PL(X) associée au pixel déterminée selon le premier mode de prédiction.
Si l'une des conditions ci-dessus est satisfaite, l'état du pixel à prédire est alors s=3 et le codeur passe à l'étape suivante E2203.
Au cours de l'étape E2203, un indicateur t indiquant que le pixel à prédire est prédit selon le deuxième mode de prédiction est positionné à 1 par exemple, et codé dans le flux de données STR par exemple par un codage entropique ou transmis tel quel dans le flux.
Au cours d'une étape E2204, une valeur du groupe de valeurs déterminées lors de l'étape E221 est sélectionnée pour prédire le pixel courant.
Selon un mode particulier de réalisation de l'invention, la sélection d'une valeur du groupe est faite en fonction de la distance entre la valeur de prédiction associée audit pixel déterminée selon le premier mode de prédiction par rapport aux valeurs de pixel du groupe déterminées lors de l'étape E221. Par exemple, lorsque la distance entre la valeur de prédiction PL(X) associée audit pixel selon le premier mode de prédiction et la valeur b du groupe est inférieure à la distance entre la valeur de prédiction PL(X) associée audit pixel selon le premier mode de prédiction et la valeur f, la valeur sélectionnée est b, et la valeur sélectionnée est f sinon.
Comme mesure de distance, la norme L1 ou L2 peut par exemple être utilisée.
Ainsi, si | PL(X) - h \ < \ PL(X) - f |, alors PL(X) = b, sinon PL(X ) = /.
Le procédé passe ensuite à l'étape E2205.
Si au cours de l'étape E2202, il est déterminé que le pixel courant n'est pas prédit selon le deuxième mode de prédiction, le pixel courant est alors prédit selon le premier mode de prédiction. La valeur de prédiction PL(X) associée au pixel courant et obtenue selon le premier mode de prédiction n'est alors pas modifiée. Le pixel courant est alors dans l'état s=1 ou s=2.
Au cours d'une étape E2205, un résidu de prédiction R1 (X) est calculé pour le pixel courant comme la différence entre la valeur originale X du pixel courant et la valeur de prédiction PL(X) associée au pixel courant, soit R1 (X)= X-PL(X). Ici, la valeur de prédiction PL(X) peut avoir été obtenue soit par le premier mode de prédiction, soit par le deuxième mode de prédiction. Le résidu de prédiction R1 (X) est ensuite quantifié en Q(X), par un quantificateur scalaire de pas de quantification d2 , par Q(X ) = ScalarQuant(Rl(X )) = ScalarQuant(52, X - PL(X )), le quantificateur scalaire étant par exemple un quantificateur scalaire au plus proche voisin tel que: ScalarQuant(A, x) D est le pas de quantification et x la valeur à
quantifier.
Q(X) est le résidu quantifié associé à X. Il est calculé dans le domaine spatial, i.e. calculé directement à partir de la différence entre la valeur de prédiction PL(X) du pixel X et la valeur originale de X. Un tel résidu quantifié Q(X) pour le pixel X est mémorisé dans un bloc de résidu de prédiction quantifié R1 Q, qui sera codé ultérieurement.
Lors d'une étape E2206, la valeur prédite décodée P1 (X) de X est calculée en ajoutant à la valeur de prédiction PL(X) la valeur dé-quantifiée du résidu quantifié Q(X). La valeur prédite décodée P1 (X) de X est ainsi obtenue par Pl(X) = PL X) + ScalarDequant S2, Q X)). Par exemple, la fonction inverse de quantification scalaire au plus proche est donnée par: ScalarDequant(A, x) = D x x.
La valeur prédite décodée P1 (X) permet ainsi de prédire d’éventuels pixels qui restent à traiter dans le bloc courant.
Par ailleurs, on peut définir le bloc P1 comprenant les valeurs décodées/reconstruites P1 (X) des pixels du bloc courant. Un tel bloc P1 constitue le prédicteur ILR du bloc courant (par opposition au prédicteur intra classique).
Selon un mode particulier de réalisation de l'invention, au cours d'une étape E2207, lorsque le résidu de prédiction quantifié Q1 (X) n'est pas nul, autrement dit lorsque l'amplitude a du résidu de prédiction quantifié Q1 (X) n'est pas nulle, l'indicateur t est positionné à 0 par exemple, et codé dans le flux de données STR. Dans ce cas, le pixel courant est considéré dans l'état s=2.
Selon ce mode particulier de réalisation de l'invention, lorsque le résidu de prédiction quantifié Q1 (X) est nul, i.e. l'amplitude a du résidu de prédiction quantifié Q1 (X) est nulle, l'indicateur t est également positionné à 0 puisque le pixel courant n'est pas prédit par le deuxième mode de prédiction, mais l'indicateur t n'est pas codé dans le flux de données STR. Ce mode de prédiction sera déduit de manière implicite au décodeur à partir de la valeur décodée de l'amplitude du résidu de prédiction quantifié Q1 (X). Dans ce cas, le pixel courant est considéré dans l'état s=1. Dans ce cas, le procédé passe de l'étape E2206 à l'étape E223 directement.
Bien entendu, en pratique, lorsqu'il est codé explicitement (s=2 ou s=3), l'indicateur t est codé dans le flux de données après le codage du résidu de prédiction quantifié Q1 (X). Selon un autre mode particulier de réalisation de l'invention, l'indicateur t est positionné à 0, et codé au cours de l'étape E2207 de manière systématique pour chaque pixel, dans le flux de données STR, quelle que soit la valeur de l'amplitude a du résidu de prédiction Q1 (X). Ainsi, au décodeur, il est déterminé de manière explicite par le décodeur si le pixel courant est prédit ou non selon le deuxième mode de prédiction, par lecture de l'indicateur t, quelle que soit la valeur du résidu de prédiction quantifié. Dans ce cas, il n'est pas différencié si le pixel est dans l'état s=1 ou s=2.
Selon une variante, dans ce mode particulier de réalisation de l'invention, puisque l'indicateur t est codé de manière systématique, lors de l'étape E2202, la détermination du mode de prédiction parmi le premier mode de prédiction et le deuxième mode de prédiction à utiliser pour prédire le pixel courant, peut par exemple être faite par comparaison d'une mesure de distance entre la valeur de prédiction fournie par le premier mode de prédiction et la valeur originale X du pixel courant et une mesure de distance entre la valeur de prédiction fournie par le deuxième mode de prédiction et la valeur originale X du pixel courant.
Les étapes décrites ci-dessus sont effectuées pour tous les pixels du bloc courant, dans un ordre de parcours qui assure que les pixels utilisés pour la prédiction locale soient disponibles.
Selon une variante de réalisation, l’ordre de parcours du bloc courant est l’ordre lexicographique, i.e. de gauche à droite, et de haut en bas.
Selon une autre variante de réalisation, plusieurs ordres de parcours du bloc courant peuvent être utilisés, par exemple :
-l’ordre lexicographique, ou
-en parcourant la première colonne de haut en bas, puis la colonne juste à sa droite, etc. ou bien,
-en parcourant les diagonales les unes après les autres.
Selon cette autre variante, il est possible de simuler le coût de codage associé à chacun des ordres de parcours et de choisir le meilleur ordre de parcours du bloc courant au sens débit/distorsion, puis de coder pour le bloc courant une information représentative de l’ordre de parcours choisi.
A l’issue de l'étape E2205, le bloc de résidu quantifié R1 Q a été déterminé. Ce bloc de résidu quantifié R1 Q doit être codé pour être transmis au décodeur. Le prédicteur P1 du bloc courant a également été déterminé. Lors d'une étape E223, le bloc de résidu quantifié R1Q est codé afin de le transmettre au décodeur. Il est possible d’utiliser toute approche connue telle que la méthode décrite dans HEVC pour coder les coefficients quantifiés d'un résidu de prédiction classique.
De manière classique, chaque résidu de prédiction quantifié Q1 (X) du bloc courant est décomposé en une valeur d'amplitude a et un indicateur de signe sgn lorsque l'amplitude a est distincte de 0.
Selon le mode particulier de réalisation de l'invention décrit ici, les valeurs amplitude et signe du bloc de résidu quantifié R1 Q sont codées à l'aide d'un codeur entropique dans le flux de données STR.
Selon un mode particulier de réalisation de l'invention, il est possible de déterminer et coder un résidu de prédiction additionnel R2 à partir du prédicteur ILR obtenu pour le bloc courant. Le codage d'un résidu de prédiction additionnel R2 est toutefois optionnel. Il est possible en effet de simplement coder le bloc courant par sa version prédite P1 et le résidu quantifié R1 Q.
Afin de coder un résidu de prédiction additionnel R2 pour le bloc courant, les étapes suivantes sont mises en oeuvre.
Lors d'une étape E224, la différence R2 entre le prédicteur P1 et le bloc courant original Xb est calculée afin de constituer un résidu additionnel R2 : R2= Xb-P1. Les étapes suivantes correspondent aux étapes classiques de codage de ce résidu R2.
Lors d'une étape E225, le résidu R2 est transformé à l'aide d'une transformée fréquentielle de façon à produire le bloc de coefficients R2T.
La transformée peut être une transformée de type DOT par exemple. Il est possible de choisir la transformée à utiliser parmi un ensemble prédéterminé de transformées ET2 et de signaler la transformée utilisée au décodeur. Dans ce cas, l’ensemble ET2 peut être différent de l’ensemble ET, afin de s’adapter aux statistiques particulières du résidu R2.
Lors d'une étape E226, le bloc de coefficients R2T est quantifié, par exemple à l’aide d’une quantification scalaire de pas de quantification d. Ceci produit le bloc R2TQ.
Le pas de quantification d peut être fixé par l’utilisateur. Il peut également être calculé à l’aide du paramètre l fixant le compromis entre compression et qualité et entré par l’utilisateur ou le codeur. Par exemple, le pas de quantification d peut correspondre au pas de quantification ¾ ou être déterminé de manière similaire à celui-ci.
Lors d'une étape E227, les coefficients du bloc quantifié R2TQ sont alors transmis de façon codée. On peut par exemple utiliser le codage spécifié dans la norme HEVC.
De manière connue, le bloc courant est décodé en dé-quantifiant les coefficients du bloc quantifié R2TQ, puis en appliquant la transformée inverse aux coefficients dé-quantifiés pour obtenir le résidu de prédiction décodé. La prédiction P1 est ensuite ajoutée au résidu de prédiction décodé afin de reconstruire le bloc courant et d'obtenir sa version décodée Xrec. La version décodée Xrec du bloc courant peut ensuite être utilisée ultérieurement pour prédire spatialement d'autres blocs voisins de l'image ou bien pour prédire des blocs d'autres images par prédiction inter-images.
Lors d'une étape E23, il est vérifié si le bloc courant est le dernier bloc de l'image à traiter par le procédé de codage, compte tenu de l’ordre de parcours défini précédemment. Si le bloc courant n'est pas le dernier bloc de l'image à traiter, lors d'une étape E24, le bloc suivant de l'image à traiter est sélectionné selon le parcours de l'image défini précédemment et le procédé de codage passe à l'étape E2, où le bloc sélectionné devient le bloc courant à traiter.
Si tous les blocs de l'image ont été codés, le procédé passe à l'application de méthodes de post-traitements à appliquer à l'image reconstruite lors d'une étape E231 . Par exemple de telles méthodes de post-traitements peuvent être un filtrage de déblocage et/ou une méthode SAO (pour Sample Adaptive Offset) telle que définie dans la norme HEVC.
Le procédé passe au codage (étape E25) de l'image suivante de la vidéo le cas échéant.
Les figures 2A et 2B illustrent de manière schématique une partie de flux de données issu du codage tel que décrit ci-dessus selon différents modes particuliers de réalisation de l'invention.
La figure 2A illustre un exemple de flux pour trois pixels (X1 , X2, X3) d'un bloc de l'image codés selon un mode particulier de réalisation de l'invention, dans lequel il a été déterminé que le pixel X1 est considéré dans l'état s=3, le pixel X2 est considéré dans l'état s=2 et le pixel X3 est considéré dans l'état s=1.
On voit que selon la variante décrite ici, les données codées pour le pixel X1 sont la valeur d'amplitude du résidu de prédiction quantifié a(X1 ), son signe sgn(X1 ) et la valeur de l'indicateur t positionnée à 1. Les données codées pour le pixel X2 sont la valeur d'amplitude du résidu de prédiction quantifié a(X2), son signe sgn(X2) et la valeur de l'indicateur t. Pour X2, la valeur de l'amplitude du résidu de prédiction quantifié étant distincte de 0, l'indicateur t positionné à 0 est codé explicitement dans le flux.
Les données codées pour le pixel X3 sont la valeur d'amplitude du résidu de prédiction quantifié a(X3) qui est nulle. Dans ce cas, la valeur de l'amplitude du résidu de prédiction quantifié est distincte de 0, l'indicateur t positionné à 0 n'est alors pas codé explicitement dans le flux et sera déduit de manière implicite au décodeur.
La figure 2B illustre un exemple de flux pour trois pixels (X1 , X2, X3) d'un bloc de l'image codés selon un autre mode particulier de réalisation de l'invention, dans lequel il a été déterminé que le pixel X1 est considéré dans l'état s=3, le pixel X2 est considéré dans l'état s=2 et le pixel X3 est considéré dans l'état s=1.
On voit que selon la variante décrite ici, les données codées pour le pixel X1 sont la valeur d'amplitude du résidu de prédiction quantifié a(X1 ), son signe sgn(X1 ) et la valeur de l'indicateur t positionnée à 1. Les données codées pour le pixel X2 sont la valeur d'amplitude du résidu de prédiction quantifié a(X2), son signe sgn(X2) et la valeur de l'indicateur t positionnée à 0.
Les données codées pour le pixel X3 sont la valeur d'amplitude du résidu de prédiction quantifié a(X3) qui est nulle, et l'indicateur t positionné à 0.
La figure 4 présente des étapes du procédé de décodage d'un flux STR de données codées représentatif d'une séquence d'images l ; l2, ..., lNb à décoder selon un mode particulier de réalisation de l'invention.
Par exemple, le flux de données STR a été généré via le procédé de codage présenté en relation avec la figure 1. Le flux de données STR est fourni en entrée d'un dispositif de décodage DEC, tel que décrit en relation avec la figure 8.
Le procédé de décodage procède au décodage du flux image par image et chaque image est décodée bloc par bloc.
Lors d'une étape E40, une image I, à décoder est subdivisée en blocs. Chaque bloc va subir une opération de décodage consistant en une suite d'étapes qui sont détaillées par la suite. Les blocs peuvent être de même taille ou de tailles différentes.
Lors d'une étape E41 , un premier bloc ou sous-bloc Xb à décoder de l'image I, est sélectionné comme bloc courant selon un sens de parcours de l'image I, qui est prédéterminé. Par exemple, il peut s'agir du premier bloc dans l'ordre lexicographique de parcours de l'image.
Lors d'une étape E42, une information indiquant un mode codage pour le bloc courant est lue à partir du flux de données STR. Selon le mode particulier de réalisation décrit ici, cette information indique si le bloc courant est codé selon un premier mode de codage M1 ou selon un deuxième mode de codage M2. Selon le mode particulier de réalisation décrit ici, le premier mode de codage M1 correspond au codage du bloc courant par prédiction intra classique, par exemple tel que défini selon le standard HEVC, et le deuxième mode de codage M2 correspond au codage par prédiction In Loop Residual (ILR).
Dans d'autres modes particuliers de réalisation, l'information lue à partir du flux STR peut également indiquer l'utilisation d'autres modes de codage pour coder le bloc courant (non décrits ici).
On décrit ci-après l'étape E43 de décodage du bloc courant lorsque le bloc courant est codé selon le premier mode de codage M1 . Lors d'une étape E430, un pas de quantification ¾ est déterminé. Par exemple, le pas de quantification ¾ est déterminé à partir d'un paramètre de quantification QP transmis dans le flux de données STR ou de manière similaire à ce qui a été fait au codeur. Par exemple, le paramètre de quantification QP peut être le paramètre de quantification utilisé classiquement dans les normes AVC ou HEVC. Ainsi, dans la norme HEVC, le pas de quantification ¾ est déterminé par l’équation = levelScale[QP%6] « (QP/6) où levelScale[ k ] =
{ 40, 45, 51 , 57, 64, 72 } pour k = 0..5.
Lors d'une étape E431 , le mode de prédiction utilisé pour coder le bloc courant est décodé à partir des blocs voisins. Pour cela, comme ce qui a été fait au codeur, le mode de prédiction intra choisi pour le bloc courant est décodé, en utilisant les modes de prédiction intra associés aux blocs voisins du bloc courant.
La construction des deux listes MPM et non-MPM est strictement similaire à ce qui a été fait lors du codage. Selon le standard HEVC, des éléments de syntaxe du type suivant sont décodés :
-un indicateur binaire indiquant si le mode de prédiction à coder pour le bloc courant est dans la liste MPM ou non,
-si le mode de prédiction du bloc courant appartient à la liste MPM, un index dans la liste MPM correspondant au mode de prédiction du bloc courant est lu,
- si le mode de prédiction du bloc courant n'appartient pas à la liste MPM, un index dans la liste non-MPM correspondant au mode de prédiction du bloc courant est lu.
L'indicateur binaire et l'index du mode de prédiction sont donc lus pour le bloc courant à partir du flux de données STR, pour décoder le mode de prédiction intra du bloc courant.
Lors d'une étape E432, le décodeur construit un bloc prédit P pour le bloc courant à partir du mode de prédiction décodé.
Lors d'une étape E433, le décodeur décode les coefficients du bloc quantifié RTQ à partir du flux de données STR, par exemple en utilisant le décodage spécifié dans la norme HEVC. Lors d'une étape E434, le bloc décodé RTQ est dé-quantifié, par exemple à l’aide d’une dé quantification scalaire de pas de quantification Ceci produit le bloc de coefficients dé quantifiés R QD·
Lors d'une étape E435, une transformée fréquentielle inverse est appliquée au bloc de coefficients dé-quantifiés RTQD de façon à produire le bloc de résidu de prédiction décodé RTQDI. La transformée pourra être une transformée de type DCT inverse par exemple. Il est possible de choisir la transformée à utiliser parmi un ensemble prédéterminé de transformées ETi en décodant un indicateur à partir du flux de données STR. Lors d'une étape E436, le bloc courant est reconstruit à partir du bloc prédit P obtenu à l'étape E432 et le bloc de résidu décodé RTQDI obtenu à l'étape E435, afin de produire le bloc courant décodé Xrec, par Xrec= P + RTQDI-
On décrit ci-après l'étape E44 de décodage du bloc courant lorsque le bloc courant est codé selon le deuxième mode de codage M2.
Lors d'une étape E440, le pas de quantification d2 est déterminé, de manière similaire à ce qui a été fait au codeur.
Selon l'invention, dans ce mode de codage M2, les pixels du bloc courant peuvent être prédits selon le premier mode de prédiction ou le deuxième mode de prédiction déjà présentés en relation avec la figure 1.
Lors d'une étape E441 , le groupe de valeurs de pixel constantes pour le bloc est déterminé à partir de pixels précédemment décodés de l'image, de manière similaire à ce qui a été fait au codeur. On considère comme pour le codeur, que les valeurs de niveaux f et b ont été déterminées.
On réalise les étapes suivantes pour chaque pixel du bloc courant.
Lors d'une étape E441 1 , la valeur de prédiction du pixel courant selon le premier mode de prédiction est déterminée. Pour cela, on utilise le même prédicteur local PL que celui utilisé au codeur. Lorsque plusieurs prédicteurs locaux sont possibles, le prédicteur local PL est déterminé de manière identique à ce qui a été fait au codeur.
Lors d'une étape E442, le résidu quantifié R1 Q est décodé à partir du flux de données STR. Il est possible d’utiliser toute approche connue telle que la méthode décrite dans HEVC pour décoder les coefficients quantifiés du résidu de prédiction classique. On obtient alors l'amplitude a du résidu de prédiction quantifié Q1 '(X) pour le pixel courant.
Selon un mode particulier de réalisation de l'invention, lors d'une étape E4421 , lorsque l'amplitude a du résidu de prédiction quantifié Q1 '(X) est nulle, un indicateur t indiquant si le pixel courant est prédit selon le deuxième mode de prédiction est implicitement positionné à 0. Dans ce cas, le pixel courant est considéré dans l'état s=1 , et il sera prédit par la valeur de prédiction issue du premier mode de prédiction. Le résidu de prédiction quantifié Q1 '(X) est alors reconstruit par Ql'( ) = 0.
Sinon, lorsque l’amplitude a du résidu de prédiction quantifié Q1’(X) n’est pas nulle, le signe sgn associé au résidu de prédiction quantifié QT(X) est lu dans le flux de données STR. Le résidu de prédiction quantifié Q1’(X) est alors reconstruit par Ql'( ) = a x sgn. Puis, au cours d'une étape E4422, l'indicateur t pour le pixel courant est lu dans le flux de données STR. Si la valeur de l'indicateur t lue est 0, l'état du pixel courant est s=2. Si la valeur de l'indicateur t lue est 1 , l'état du pixel courant est s=3.
Selon un autre mode particulier de réalisation de l'invention, l'indicateur t est codé de manière systématique pour chaque pixel du bloc courant. Dans ce cas, au cours de l'étape E4422, la valeur 0 ou 1 de l'indicateur t est lue dans le flux de données STR et l'état du pixel s est positionné en conséquence.
Lorsque l'état du pixel courant est s=3, le pixel courant est prédit selon le deuxième mode de prédiction. Dans ce cas, lors d'une étape E4423, une valeur du groupe de valeurs déterminées lors de l'étape E441 est sélectionnée et affectée à la valeur de prédiction PL(X) associée au pixel courant pour prédire le pixel courant de manière similaire à ce qui a été fait au codeur. Par exemple, si \PL(X) - b \ < \PL(X ) f |, alors PL(X ) = b, sinon PL(X ) = /.
Le procédé passe ensuite à l'étape E443.
Lorsque l'état du pixel courant est s=2 ou s=1 , le pixel courant est prédit selon le premier mode de prédiction. Dans ce cas, la valeur de prédiction PL(X) du pixel courant déterminée selon le premier mode de prédiction au cours de l'étape E441 1 n'est pas modifiée.
Lors d'une étape E443, le résidu quantifié Q1 '(X) est dé-quantifié à l’aide du pas de quantification d2, de façon à produire le résidu dé-quantifié QD1 (X).
Lors d'une étape E444, la valeur reconstruite du pixel courant X' est obtenue à l'aide de la valeur de prédiction PL(X) déterminée lors de l'étape E441 1 ou E4423 et du résidu de prédiction dé-quantifié QD1 (X): X'=PL(X)+QD1 (X).
Les résidus de prédiction Q1 (X) des pixels du bloc courant sont placés dans un bloc de résidu de prédiction R1 Q les résidus de prédiction dé-quantifiés QD1 (X) des pixels du bloc courant sont placés dans un bloc de résidu de prédiction dé-quantifié R1 QD, Les valeurs reconstruites X' des pixels du bloc courant sont placées dans un bloc reconstruit P1.
Les étapes ci-dessus sont mises en œuvre pour tous les pixels du bloc courant, dans un ordre de parcours qui assure que les pixels utilisés pour la prédiction locale soient disponibles.
Par exemple, l’ordre de parcours est l’ordre lexicographique (de gauche à droite, puis les lignes de haut en bas). Selon un mode particulier de réalisation de l'invention, le bloc P1 comprenant les valeurs reconstruites PL(X)+QD1 (X) de chaque pixel du bloc courant constitue ici le bloc courant décodé Xrec.
Selon un autre mode particulier de réalisation de l'invention, on considère qu'un résidu de prédiction additionnel a été codé pour le bloc courant. Il est donc nécessaire de décoder ce résidu de prédiction additionnel afin de reconstruire la version décodée du bloc courant Xrec. Par exemple, cet autre mode particulier de réalisation peut être activé ou non par défaut au niveau du codeur et du décodeur. Ou bien, un indicateur peut être codé dans le flux de données avec les informations de niveau bloc pour indiquer pour chaque bloc codé selon le mode de codage ILR si un résidu de prédiction additionnel est codé. Ou bien encore un indicateur peut être codé dans le flux de données avec les informations de niveau image ou séquence d'images pour indiquer pour tous les blocs de l'image ou de la séquence d'images codés selon le mode de codage ILR si un résidu de prédiction additionnel est codé.
Lorsqu'un résidu de prédiction additionnel est codé pour le bloc courant, lors d'une étape E445, les coefficients du résidu de prédiction quantifié R2TQ sont décodés du flux de données STR, à l'aide de moyens adaptés à ceux mis en oeuvre au codeur, par exemple les moyens mis en oeuvre dans un décodeur HEVC.
Lors d'une étape E446, le bloc de coefficients quantifiés R2TQ est dé-quantifié, par exemple à l’aide d’une dé-quantification scalaire de pas de quantification Ceci produit le bloc de coefficients dé-quantifiés R2TQ
Lors d'une étape E447, une transformée fréquentielle inverse est appliquée au bloc R2TQD de façon à produire le bloc de résidu de prédiction décodé R2TQDI
La transformée inverse pourra être une transformée de type DCT inverse par exemple.
Il est possible de choisir la transformée à utiliser parmi un ensemble prédéterminé de transformées ET2 et de décoder l’information signalant la transformée à utiliser au décodeur. Dans ce cas, l’ensemble ET2 est différent de l’ensemble ET, afin de s’adapter aux statistiques particulières du résidu R2.
Lors d'une étape E448, le bloc courant est reconstruit en ajoutant le bloc prédit P1 obtenu lors de l'étape E444 au résidu de prédiction décodé R2TQDL
Lors d'une étape E45, il est vérifié si le bloc courant est le dernier bloc de l'image à traiter par le procédé de décodage, compte tenu de l’ordre de parcours défini précédemment. Si le bloc courant n'est pas le dernier bloc de l'image à traiter, lors d'une étape E46, le bloc suivant de l'image à traiter est sélectionné selon le parcours de l'image défini précédemment et le procédé de décodage passe à l'étape E42, le bloc sélectionné devenant le bloc courant à traiter.
Si tous les blocs de l'image ont été décodés, le procédé passe à l'application de méthodes de post-traitement à appliquer à l'image reconstruite lors d'une étape E451 si besoin. De telles méthodes de post-traitement peuvent être un filtrage de déblocage et/ou une méthode SAO.
Le procédé passe ensuite au décodage (étape E47) de l'image suivante de la vidéo le cas échéant.
La figure 7 présente la structure simplifiée d’un dispositif de codage COD adapté pour mettre en œuvre le procédé de codage selon l'un quelconque des modes particuliers de réalisation de l'invention.
Selon un mode particulier de réalisation de l'invention, les étapes du procédé de codage sont mises en œuvre par des instructions de programme d'ordinateur. Pour cela, le dispositif de codage COD a l'architecture classique d'un ordinateur et comprend notamment une mémoire MEM, une unité de traitement UT, équipée par exemple d'un processeur PROC, et pilotée par le programme d'ordinateur PG stocké en mémoire MEM. Le programme d'ordinateur PG comprend des instructions pour mettre en œuvre les étapes du procédé de codage tel que décrit ci-dessus, lorsque le programme est exécuté par le processeur PROC.
A l'initialisation, les instructions de code du programme d'ordinateur PG sont par exemple chargées dans une mémoire RAM (non représentée) avant d'être exécutées par le processeur PROC. Le processeur PROC de l'unité de traitement UT met notamment en œuvre les étapes du procédé de codage décrit ci-dessus, selon les instructions du programme d'ordinateur PG.
La figure 8 présente la structure simplifiée d’un dispositif de décodage DEC adapté pour mettre en œuvre le procédé de décodage selon l'un quelconque des modes particuliers de réalisation de l'invention.
Selon un mode particulier de réalisation de l'invention, le dispositif de décodage DEC a l'architecture classique d'un ordinateur et comprend notamment une mémoire MEMO, une unité de traitement UTO, équipée par exemple d'un processeur PROCO, et pilotée par le programme d'ordinateur PGO stocké en mémoire MEMO. Le programme d'ordinateur PGO comprend des instructions pour mettre en œuvre les étapes du procédé de décodage tel que décrit ci-dessus, lorsque le programme est exécuté par le processeur PROCO.
A l'initialisation, les instructions de code du programme d'ordinateur PGO sont par exemple chargées dans une mémoire RAM (non représentée) avant d'être exécutées par le processeur PROCO. Le processeur PROCO de l'unité de traitement UTO met notamment en oeuvre les étapes du procédé de décodage décrit ci-dessus, selon les instructions du programme d'ordinateur PGO.

Claims

Revendications
1. Procédé de décodage d'un flux de données codées représentatif d'au moins une image, ladite image étant découpée en blocs, le procédé de décodage comprend, pour au moins un bloc de l'image, dit bloc courant:
- la détermination (E441 ) d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
(i) le décodage (E442) d'un résidu de prédiction associé audit pixel,
(ii) la détermination (E441 1 ) d'une valeur de prédiction associée au pixel selon un premier mode de prédiction, selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant,
(iii) le décodage (E4422) à partir du flux de données, d'une information indiquant si le pixel est prédit selon un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
(iv) lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
(a) sélection (E4423) d'une valeur dudit groupe,
(b) remplacement (E4423) de ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
(v) reconstruction (E444) dudit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction.
2. Procédé de codage d'un flux de données représentatif d'au moins une image, ladite image étant découpée en blocs, le procédé de codage comprend, pour au moins un bloc de l'image, dit bloc courant:
- la détermination (E221 ) d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
(i) la détermination (E2201 ) d'une valeur de prédiction associée au pixel selon un premier mode de prédiction, selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant,
(ii) la détermination (E2202) d'un mode de prédiction pour le pixel parmi le premier mode de prédiction et un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc, (iii) le codage (E2203, E2207) dans le flux de données, d'une information indiquant si le pixel est prédit selon le deuxième mode de prédiction,
(iv) lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
(a) sélection (E2204) d'une valeur dudit groupe,
(b) remplacement (E2204) de ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
(v) le calcul (E2205) d'un résidu de prédiction quantifié associé audit pixel à l'aide de la valeur de prédiction associée au pixel et de la valeur dudit pixel,
(vi) la reconstruction (E2206) dudit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction décodé,
(vii) le codage (E223) du résidu de prédiction quantifié associé audit pixel dans le flux de données.
3. Procédé de décodage selon la revendication 1 ou de codage selon la revendication 2, dans lequel la sélection d'une valeur dudit groupe à utiliser est faite en fonction d'une distance entre la valeur de prédiction associée audit pixel par rapport aux valeurs de pixel constantes du groupe.
4. Procédé selon la revendication 3, dans lequel le groupe comprenant une première valeur et une deuxième valeur, lorsqu'une distance entre la valeur de prédiction associée audit pixel et la première valeur est inférieure à une distance entre la valeur de prédiction associée audit pixel et la deuxième valeur, la valeur dudit groupe sélectionnée est la première valeur, et la valeur dudit groupe sélectionnée est la deuxième valeur sinon.
5. Procédé de décodage selon la revendication 1 ou de codage selon la revendication 2, dans lequel le décodage à partir du flux de données ou le codage dans le flux de données, de l'information indiquant si le pixel est prédit selon le deuxième mode de prédiction est réalisé seulement lorsque le résidu de prédiction est différent de 0.
6. Procédé de décodage selon la revendication 1 ou de codage selon la revendication 2, dans lequel la détermination d'un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés est réalisée par un calcul d'un histogramme des valeurs de pixels voisins du bloc courant et précédemment reconstruits et la sélection d'au moins deux valeurs de pixels représentatives respectivement de deux valeurs de pixels les plus fréquentes parmi les pixels voisins du bloc courant.
7. Procédé de codage selon la revendication 2, dans lequel une valeur de seuil est déterminée à partir d'au moins une valeur dudit groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés, lors de la détermination d'un mode de prédiction pour le pixel, le deuxième mode de prédiction est choisi:
- lorsque la valeur originale dudit pixel est supérieure à ladite valeur de seuil et la valeur de seuil est supérieure à la valeur de prédiction associée au pixel déterminée selon le premier mode de prédiction, ou
- lorsque la valeur originale dudit pixel est inférieure à ladite valeur de seuil et la valeur de seuil est inférieure à la valeur de prédiction associée au pixel déterminée selon le premier mode de prédiction.
8. Dispositif de décodage d'un flux de données codées représentatif d'au moins une image, ladite image étant découpée en blocs, le dispositif de décodage comprend un processeur (PROCO) configuré pour, pour au moins un bloc de l'image, dit bloc courant:
- déterminer un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc:
(i) décoder un résidu de prédiction associé audit pixel,
(ii) déterminer une valeur de prédiction associée au pixel, à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant,
(iii) déterminer à partir du flux de données, une information indiquant si le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
(iv) lorsque l'information indique que le pixel est prédit à l'aide d'une prédiction issue du groupe de valeurs de pixel constantes pour le bloc:
(a) sélectionner une valeur dudit groupe,
(b) remplacer ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
(v) reconstruire ledit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction.
9. Dispositif de codage d'un flux de données représentatif d'au moins une image, ladite image étant découpée en blocs, le dispositif de codage comprend un processeur (PROC) configuré pour, pour au moins un bloc de l'image, dit bloc courant:
- déterminer un groupe de valeurs de pixel constantes pour le bloc à partir de pixels précédemment décodés,
- pour chaque pixel du bloc: (i) déterminer une valeur de prédiction associée au pixel selon un premier mode de prédiction, selon lequel le pixel est prédit à partir d'au moins un autre pixel précédemment décodé, ledit autre pixel précédemment décodé appartenant audit bloc courant,
(ii) déterminer un mode de prédiction pour le pixel parmi le premier mode de prédiction et un deuxième mode de prédiction selon lequel le pixel est prédit à l'aide d'une prédiction issue dudit groupe de valeurs de pixel constantes pour le bloc,
(iii) coder dans le flux de données, une information indiquant si le pixel est prédit selon le deuxième mode de prédiction,
(iv) lorsque l'information indique que le pixel est prédit selon le deuxième mode de prédiction:
(a) sélectionner une valeur dudit groupe,
(b) remplacer ladite valeur de prédiction associée au pixel par ladite valeur sélectionnée,
(v) calculer un résidu de prédiction associé audit pixel à l'aide de la valeur de prédiction associée au pixel et de la valeur dudit pixel,
(vi) coder le résidu de prédiction associé audit pixel dans le flux de données,
(vii) reconstruire ledit pixel à l'aide de la valeur de prédiction associée au pixel et du résidu de prédiction décodé.
10. Flux de données représentatif d'au moins une image, ladite image étant découpée en blocs, le flux de données comprend, pour au moins un bloc de l'image, dit bloc courant, et pour chaque pixel du bloc courant:
- une information représentative d'un résidu de prédiction associé audit pixel,
- une information indiquant si le pixel est prédit à l'aide d'une prédiction issue d'un groupe de valeurs de pixel constantes pour le bloc, le groupe de valeurs de pixel constantes pour le bloc étant déterminé à partir de pixels précédemment décodés.
1 1. Programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé de décodage selon l’une quelconque des revendications 1 ou 3 à 6 ou du procédé de codage selon l'une quelconque des revendications 2 à 7, lorsque ledit programme est exécuté par un processeur.
12. Support d'informations lisible par un ordinateur, et comportant des instructions d'un programme d'ordinateur selon la revendication 1 1.
EP20707501.1A 2019-02-07 2020-01-30 Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image Pending EP3922017A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1901228A FR3092719A1 (fr) 2019-02-07 2019-02-07 Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image.
PCT/FR2020/050146 WO2020161413A1 (fr) 2019-02-07 2020-01-30 Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image

Publications (1)

Publication Number Publication Date
EP3922017A1 true EP3922017A1 (fr) 2021-12-15

Family

ID=67185272

Family Applications (1)

Application Number Title Priority Date Filing Date
EP20707501.1A Pending EP3922017A1 (fr) 2019-02-07 2020-01-30 Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image

Country Status (8)

Country Link
US (1) US20220103862A1 (fr)
EP (1) EP3922017A1 (fr)
JP (1) JP2022519739A (fr)
KR (1) KR20210128401A (fr)
CN (1) CN113412618B (fr)
BR (1) BR112021014787A2 (fr)
FR (1) FR3092719A1 (fr)
WO (1) WO2020161413A1 (fr)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2977111A1 (fr) * 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9253508B2 (en) 2011-11-04 2016-02-02 Futurewei Technologies, Inc. Differential pulse code modulation intra prediction for high efficiency video coding
FR3023112A1 (fr) * 2014-06-27 2016-01-01 Bcom Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes
FR3046321B1 (fr) * 2015-12-29 2018-01-26 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
FR3066873A1 (fr) * 2017-05-29 2018-11-30 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image
US20190014325A1 (en) * 2017-07-05 2019-01-10 Industrial Technology Research Institute Video encoding method, video decoding method, video encoder and video decoder

Also Published As

Publication number Publication date
JP2022519739A (ja) 2022-03-24
CN113412618B (zh) 2024-05-17
FR3092719A1 (fr) 2020-08-14
BR112021014787A2 (pt) 2021-09-28
US20220103862A1 (en) 2022-03-31
KR20210128401A (ko) 2021-10-26
WO2020161413A1 (fr) 2020-08-13
CN113412618A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
FR2947134A1 (fr) Procedes de codage et de decodages d&#39;images, dispositifs de codage et de decodage, flux de donnees et programme d&#39;ordinateur correspondants.
FR2906433A1 (fr) Procedes et dispositifs de codage et de decodage d&#39;images, programme d&#39;ordinateur les mettant en oeuvre et support d&#39;informaton permettant de les mettre en oeuvre
EP3225029B1 (fr) Procede d&#39;encodage d&#39;image et equipement pour la mise en oeuvre du procede
EP3318061B1 (fr) Procede d&#39;encodage d&#39;image et equipement pour la mise en oeuvre du procede
FR2951345A1 (fr) Procede et dispositif de traitement d&#39;une sequence video
EP4311240A2 (fr) Procédé de partitionnement et procédé de signalisation de partitionnement d&#39;une unité d&#39;arborescence de codage
EP3854090A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
EP3479572A1 (fr) Procédé de codage intra d&#39;une image numérique et procédé de décodage correspondant
EP2716045B1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
EP3922017A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
FR2955995A1 (fr) Procede et dispositif de traitement d&#39;une sequence video
WO2020002796A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
EP3941045A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
WO2018073523A1 (fr) Procédé de codage et de décodage de paramètres d&#39;image, dispositif de codage et de décodage de paramètres d&#39;image et programmes d&#39;ordinateur correspondants
WO2020058595A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
EP3815366A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
EP3854088A1 (fr) Procédés et dispositifs de codage et de décodage d&#39;un flux de données représentatif d&#39;au moins une image
FR2957744A1 (fr) Procede de traitement d&#39;une sequence video et dispositif associe
WO2020260843A1 (fr) Procédé d&#39;encodage et de décodage vidéo par signalisation d&#39;un sous-ensemble de candidat
Nasiri Machine learning based optimization for VVC low bitrate coding
FR3064145A1 (fr) Procede de codage et decodage d&#39;images, dispositif de codage et decodage et programmes d&#39;ordinateur correspondants
FR3064870A1 (fr) Procede de decodage d&#39;au moins une image numerique, procede de codage, dispositifs, equipement terminal et programmes d&#39;ordinateurs associes

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20210712

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20230731