WO2014103182A1 - 映像符号化装置、映像符号化方法および映像符号化プログラム - Google Patents

映像符号化装置、映像符号化方法および映像符号化プログラム Download PDF

Info

Publication number
WO2014103182A1
WO2014103182A1 PCT/JP2013/007080 JP2013007080W WO2014103182A1 WO 2014103182 A1 WO2014103182 A1 WO 2014103182A1 JP 2013007080 W JP2013007080 W JP 2013007080W WO 2014103182 A1 WO2014103182 A1 WO 2014103182A1
Authority
WO
WIPO (PCT)
Prior art keywords
coefficient level
value
significant coefficient
significant
level
Prior art date
Application number
PCT/JP2013/007080
Other languages
English (en)
French (fr)
Inventor
健太 徳満
慶一 蝶野
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2014515952A priority Critical patent/JP5574072B1/ja
Priority to BR112015015122A priority patent/BR112015015122A2/pt
Priority to US14/651,466 priority patent/US10003804B2/en
Priority to EP13868141.6A priority patent/EP2941000B1/en
Publication of WO2014103182A1 publication Critical patent/WO2014103182A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Definitions

  • the present invention is a quantization technique for quantizing orthogonal transform coefficients, and is suitably applied to, for example, a video encoding apparatus using HEVC.
  • the video coding method based on the method described in Non-Patent Document 1 divides each frame of digitized video into coding tree units (CTU: Coding Tree Unit) and encodes each CTU in raster scan order. To do. Each CTU is divided into coding units (CU: Coding Unit) in a quad tree structure and encoded. Each CU is predicted by being divided into prediction units (PU: Prediction Unit). In addition, the prediction error of each CU is divided into transform units (TU: Transform Unit) in a quadtree structure, and is subjected to frequency conversion.
  • CTU Coding Tree Unit
  • CU is a coding unit for intra prediction / interframe prediction.
  • intra prediction and inter-frame prediction will be described.
  • Intra prediction is prediction generated from the reconstructed image of the encoding target frame.
  • Non-patent document 1 defines 33 types of angle intra prediction shown in FIG.
  • an intra prediction signal is generated by extrapolating the reconstructed pixels around the encoding target block in any of the 33 types of directions shown in FIG.
  • a CU that uses intra prediction is referred to as an intra CU.
  • Inter-frame prediction is prediction based on an image of a reconstructed frame (reference picture) having a display time different from that of an encoding target frame.
  • inter-frame prediction is also referred to as inter prediction.
  • FIG. 15 is an explanatory diagram illustrating an example of inter-frame prediction.
  • the motion vector MV (mv x , mv y ) indicates the parallel movement amount of the reconstructed image block of the reference picture with respect to the encoding target block.
  • Inter prediction generates an inter prediction signal based on a reconstructed image block of a reference picture (using pixel interpolation if necessary).
  • a CU using inter prediction is referred to as an inter CU.
  • a frame encoded only by the intra CU is called an I frame (or I picture).
  • a frame encoded including not only an intra CU but also an inter CU is called a P frame (or P picture).
  • a frame that is encoded including not only one reference picture for inter prediction of a block but also an inter CU that uses two reference pictures at the same time is called a B frame (or B picture).
  • 16 includes a frequency converter 101, a quantizer 1020, an entropy encoder 103, an inverse frequency transformer / inverse quantizer 104, a buffer 105, a predictor 106, and an estimator 107.
  • FIG. 17 is an explanatory diagram showing an example of CTU partitioning of frame t and a CU partitioning example of the eighth CTU (CTU8) of frame t when the spatial resolution of the frame is CIF (Common Intermediate Format) and the CTU size is 64.
  • FIG. 18 is an explanatory diagram showing a quadtree structure corresponding to the CU partitioning example of CTU8.
  • FIG. 19 is an explanatory diagram showing an example of TU partitioning of a CU.
  • the upper part shows an example of intra prediction 2N ⁇ 2N PU CU TU partitioning.
  • the CU is an intra prediction
  • the root of the quad tree is arranged in the PU, and the prediction error is expressed by a quad tree structure.
  • the bottom row shows an example of inter prediction 2N ⁇ N PU CU TU partitioning.
  • the root of the quad tree is placed in the CU, and the prediction error is expressed by a quad tree structure.
  • the estimator 107 determines a CU quadtree structure, a PU partition shape, and a TU quadtree structure that minimize the entropy coding cost for each CTU.
  • the predictor 106 generates a prediction signal for the input image signal of the CU based on the CU quadtree structure and the PU partition shape determined by the estimator 107.
  • the prediction signal is generated based on the above-described intra prediction or inter prediction.
  • the frequency converter 101? Performs frequency conversion on the prediction error image obtained by subtracting the prediction signal from the input image signal based on the TU quadtree structure determined by the estimator 107 ?.
  • the quantizer 1020 quantizes the frequency-transformed prediction error image (orthogonal transform coefficient).
  • the quantized orthogonal transform coefficient is referred to as a coefficient level.
  • a coefficient level having a value other than 0 is called a significant coefficient level.
  • the quantizer 1020 includes a coefficient level calculation unit 1201 that receives an orthogonal transform coefficient Kij and a quantization parameter QP and outputs a coefficient level Lij.
  • the entropy encoder 103 entropy-encodes cu_split_flag indicating a CTU quadtree structure, a prediction parameter, and a coefficient level.
  • the inverse frequency transform / inverse quantizer 104 dequantizes the coefficient level. Further, the inverse frequency transform / inverse quantizer 104 performs inverse frequency transform on the inversely quantized orthogonal transform coefficient.
  • the reconstructed prediction error image subjected to the inverse frequency conversion is supplied with a prediction signal and supplied to the buffer 105.
  • the buffer 105 stores the reconstructed image.
  • a general video encoding device Based on the above-described operation, a general video encoding device generates a bit stream.
  • an orthogonal transformation coefficient Kij and a coefficient level Lij of 4 ⁇ 4 TU are defined as follows.
  • Kij (0 ⁇ i, j ⁇ 3) is defined as the value of the orthogonal transformation coefficient at the horizontal position i and the vertical position j on the frequency axis.
  • the coefficient level Lij is defined as the value of the coefficient level corresponding to the orthogonal transformation coefficient Kij.
  • Kij and Lij are higher frequency components.
  • the coefficient level calculation unit 1201 calculates the coefficient level Lij by dividing Kij by the quantization step Qs. Formally, the coefficient level Lij is expressed by equation (1).
  • Lij Sign (Kij) / Floor (
  • Sign (a) is a function that returns the sign of the input a
  • Floor (a) is a function that returns the largest integer less than or equal to the input a
  • f is a parameter that determines the quantization characteristics (0 ⁇ f ⁇ 0.5). is there.
  • the value of f is 1/6 for inter prediction and 1/3 for intra prediction.
  • N is the block size of TU.
  • N 4.
  • FIG. 21 shows an example in which Kij is quantized with Qs having a value of 4096 and f having a value of 1/3.
  • the position information is information indicating the positions of all significant coefficient levels of the TU.
  • the position information in HEVC includes information last_significant_x and last_significant_y indicating the horizontal position and vertical position of the significant coefficient level to be transmitted first, and the position subsequent to (last_significant_x, last_significant_y) ( 0, 0) and information siginificant_coeff_flag indicating the presence or absence of a significant coefficient level at each position. Therefore, the number of position information bits is the sum of the number of bits of last_significant_x, the number of bits of last_significant_y, and the number of bits of siginificant_coeff_flag determined based on the position of the significant coefficient level to be transmitted first.
  • value information is information indicating the value of the significant coefficient level.
  • the value information in HEVC is information coeff_abs_level_greater1_flag indicating whether or not the absolute value of the significant coefficient level is greater than 1, whether or not the absolute value of the significant coefficient level is greater than 2
  • This information is composed of coeff_abs_level_remaining information.
  • the number of value information bits is the sum of the number of bits of coeff_abs_level_greater1_flag, the number of bits of coeff_abs_level_greater2_flag, the number of bits of coeff_sign_flag, and the number of bits of coeff_abs_level_remaining.
  • FIG. 22 shows the relationship between the position information and value information, and the coefficient level Lij.
  • the items on the vertical axis with respect to the horizontal axis indicate information on each Lij in the 4 ⁇ 4 TU shown in FIG.
  • siginificant_coeff_flag indicates the presence / absence of a significant coefficient level at each position from (3, 0) to (0, 0).
  • siginificant_coeff_flag 1
  • siginificant_coeff_flag 0.
  • FIG. 23 shows the relationship between position information and value information and the number of bits of value information.
  • the items on the vertical axis with respect to the horizontal axis indicate the number of position information bits and the number of value information bits of 4 ⁇ 4 TU shown in FIG.
  • bin refers to one bit in the intermediate bit string before being converted to the bitstream output by the entropy encoder 103.
  • the entropy encoder 103 ⁇ ⁇ ⁇ transmits bit 13bin of the position information of all significant coefficient levels in the TU and then the value information bits of each significant coefficient level. A total of 4 bins are transmitted.
  • the position information is composed of last_significant_x, last_significant_y and siginificant_coeff_flag.
  • siginificant_coeff_flag indicates the presence / absence of a significant coefficient level at each position of 9 from the position (2,) 1) to (0, ⁇ 0) following the position of the significant coefficient to be transmitted first, and is 9 bin.
  • the value information is composed of coeff_abs_level_greater1_flag, coeff_coeff_abs_level_greater2_flag, coeff_sign_flag, and coeff_abs_level_remaining.
  • coeff_abs_level_greater1_flag compared L 30 and L 01, are 2bin indicate whether 1 or greater.
  • coeff_coeff_abs_level_greater2_flag is 0bin because there is no coefficient level with an absolute value of a significant coefficient level greater than 2.
  • coeff_sign_flag indicates the sign of L 30 and L 01 and is 2 bins.
  • coeff_abs_level_remaining is 0bin because there is no coefficient level with an absolute value of the significant coefficient level greater than 2.
  • HEVC High efficiency video coding
  • JCT-VC Joint Collaborative Team on Video Coding
  • the entropy encoder using HEVC entropy encodes the position information of all significant coefficient levels in the TU in units of TUs, and then entropy codes the value information of each significant coefficient level. Therefore, there is a significant coefficient level (hereinafter referred to as a high cost coefficient level) that is expensive in transmission when the number of bits of position information and the number of bits of value information satisfy a predetermined condition. For example, when the number of bits of position information is larger than the number of bits of value information, the coefficient level becomes a high cost coefficient level. Further, when the value of the significant coefficient level is small, the coefficient level tends to become a high cost coefficient level. If the high cost coefficient level is transmitted, the compression efficiency decreases.
  • a significant coefficient level hereinafter referred to as a high cost coefficient level
  • An object of the present invention is to provide a video encoding device that prevents transmission at a high cost coefficient level and prevents a reduction in compression efficiency.
  • a video encoding apparatus includes an orthogonal transform unit that orthogonally transforms an image block to calculate an orthogonal transform coefficient, a quantization unit that quantizes the orthogonal transform coefficient to calculate a coefficient level, and all of the coefficient levels.
  • An entropy encoding unit that entropy-encodes each significant coefficient level value information and outputs a bitstream after entropy-encoding the position information of the significant coefficient level, and the quantization unit ,
  • Position information bit number calculating means for calculating the number of position information bits determined based on the position of the significant coefficient level first in the transmission order included in the image block, and calculating the value information bit number of the significant coefficient level
  • the video coding method orthogonally transforms an image block to calculate orthogonal transform coefficients, quantize the orthogonal transform coefficients to calculate coefficient levels, and entropy the position information of all significant coefficient levels among the coefficient levels.
  • a video encoding method in which, after encoding, the value information of each significant coefficient level is entropy encoded and a bit stream is output, and when calculating the coefficient level, the first significant in the transmission order included in the image block The number of position information bits determined based on the position of the correct coefficient level is calculated, the value information bit number of the significant coefficient level is calculated, and the position information bit number and the value information bit number The coefficient level is set to 0.
  • the video encoding program allows a computer to orthogonally transform an image block to calculate orthogonal transform coefficients, to quantize the orthogonal transform coefficients to calculate coefficient levels, and to calculate all significant values among the coefficient levels.
  • After entropy coding the coefficient level position information, entropy coding of each significant coefficient level value information and executing a process of outputting a bit stream, and calculating the coefficient level, transmission included in the image block The process of calculating the number of position information bits determined based on the position of the first significant coefficient level in order, the process of calculating the number of value information bits of the significant coefficient level, the number of position information bits and the number of value information bits And a process of setting a significant coefficient level satisfying a predetermined condition to 0.
  • FIG. 1 is a block diagram showing a first embodiment of a video encoding device according to the present invention.
  • FIG. It is a block diagram which shows the structure of the adaptive quantizer in 1st Embodiment. It is a flowchart which shows operation
  • FIG. 1 It is a block diagram which shows the structure of the adaptive quantizer in 5th Embodiment. It is a flowchart which shows operation
  • FIG. 6 is an explanatory diagram showing an example of CTU partitioning of frame t and a CU partitioning example of CTU8 of frame t. It is explanatory drawing which shows the quadtree structure corresponding to the CU division
  • FIG. FIG. 1 is a block diagram showing a first embodiment of a video encoding apparatus according to the present invention.
  • the configuration of a video encoding apparatus according to a first embodiment that outputs a bit stream using each frame of a digitized video as an input image will be described.
  • the video encoding apparatus includes a frequency converter 101, an adaptive quantizer 1021, an entropy encoder 103, an inverse frequency transformer / inverse quantizer 104, a buffer 105, a predictor 106, And an estimator 107.
  • an adaptive quantizer 1021 is provided instead of the quantizer 1020.
  • Other blocks in the video encoding device shown in FIG. 1B are the same as the blocks in the video encoding device shown in FIG.
  • the entropy encoder 103 performs entropy encoding on the position information of all significant coefficient levels in the TU in units of TU, and then entropy encodes the value information of each significant coefficient level. Therefore, only the adaptive quantizer 1021 will be described below.
  • FIG. 2 is a block diagram showing the configuration of adaptive quantizer 1021.
  • the adaptive quantizer shown in FIG. 2 includes a value information bit number calculation unit (R value calculation unit) 1202 and a position information bit number calculation unit (R locate ) in addition to the coefficient level calculation unit 1201 of the quantizer shown in FIG. Calculation unit) 1203 and high cost coefficient level detection / removal unit 1204.
  • R value calculation unit value information bit number calculation unit
  • R locate position information bit number calculation unit
  • the coefficient level calculation unit 1201 inputs the orthogonal transform coefficient Kij and the quantization parameter QP, and outputs a temporary coefficient level L′ ij.
  • the R value calculation unit 1202 receives the temporary coefficient level L′ ij and outputs R value that is the number of value information bits.
  • R value is the number of bits of information indicating the value of L′ ij. Specifically, R value is the number of bits of information coeff_abs_level_greater1_flag indicating whether or not the absolute value of the significant coefficient level is greater than 1, and the number of bits of information coeff_coeff_abs_level_greater2_flag that indicates whether or not the absolute value of the significant coefficient level is greater than 2.
  • the R locate calculation unit 1203 receives the orthogonal transform coefficient position (i, j) and outputs R locate which is the number of position information bits.
  • R locate is the number of bits of information indicating the positions on the frequency axis of all significant coefficient levels of TU. Specifically, R locate is the number of bits of last_significant_x and last_significant_y indicating the horizontal position and vertical position of the first significant coefficient level transmitted, and the position following (last_significant_x, last_significant_y) (0, 0) This is the sum of the number of bits of information siginificant_coeff_flag indicating the presence / absence of a significant coefficient level at positions up to.
  • the high cost coefficient level detection / removal unit 1204 receives L′ ij, R value, and R locate and outputs the coefficient level Lij. For example, when R locate is greater than 0 and R locate is greater than R value , the high cost coefficient level detection / removal unit 1204 detects L'ij as the high cost coefficient level and outputs a value of 0 as Lij To do. Otherwise, the temporary coefficient level L′ ij is output as Lij. That is, the high cost coefficient level detection / removal unit 1204 detects and removes the high cost coefficient level.
  • the adaptive quantizer 1021 performs transmission order ((3, 3) ⁇ (3, 2) ⁇ (2, for each orthogonal transform coefficient Kij (0 ⁇ i, j ⁇ 3) in each TU. 3) ⁇ (3, 1) ⁇ (2, 2) ⁇ (1, 3) ⁇ (3, 0) ⁇ (2, 1) ⁇ (1, 2) ⁇ (0, 3) ⁇ (2, 0) ⁇ (1, 1) ⁇ (0, 2) ⁇ (1, 0) ⁇ (0, 1) ⁇ (0, 0) in this order)
  • step S101 the coefficient level calculation unit 1201 calculates a temporary coefficient level L′ ij corresponding to the orthogonal transformation coefficient Kij using, for example, the above equation (1).
  • step S102 If it is determined in step S102 that the value of L'ij is not 0, the process proceeds to step S103. When the value of L′ ij is 0, the process proceeds to step S106.
  • step S103 the R value calculation unit 1202 calculates the bit number R value of the value information of L′ ij.
  • step S104 the R locate calculation unit 1203 determines whether a non-zero Lij has already been output in the TU. If a non-zero Lij is not yet output in the TU, the process proceeds to step S105. If non-zero Lij is already output in the TU, the value of R locate is set to 0, and the process proceeds to step S106.
  • step S105 the R locate calculation unit 1203 calculates the number of bits R locate of the position information determined based on the position of L′ ij.
  • the adaptive quantizer 1021 according to the present embodiment, the high cost factor level detection / removal section 1204, if greater than R The locate is 0, and R The locate is larger than the R value, L '
  • the video encoding apparatus can prevent compression efficiency from being lowered by preventing transmission at a high cost coefficient level.
  • Embodiment 2 FIG. In the first embodiment described above, the high cost coefficient level may not be detected accurately. Therefore, in order to detect the high cost coefficient level more accurately, the adaptive quantizer 1022 having the configuration shown in FIG. 4 is used in the second embodiment. Note that the video encoding apparatus of the second embodiment is basically configured as shown in FIG. 1, but an adaptive quantizer 1022 is provided instead of the adaptive quantizer 1021.
  • the adaptive quantizer 1022 shown in FIG. 4 includes a coefficient level calculation unit 1201, a value information bit number calculation unit (R value calculation unit) 1202, a position information bit number calculation unit (R locate calculation unit) 1203, and a high cost coefficient level detection. / Removal unit 1204, and square error reduction amount calculation unit (D calculation unit) 1205.
  • R value calculation unit value information bit number calculation unit
  • R locate calculation unit position information bit number calculation unit
  • D calculation unit square error reduction amount calculation unit
  • the coefficient level calculation unit 1201 inputs the orthogonal transform coefficient Kij and the quantization parameter QP, and outputs a temporary coefficient level L′ ij.
  • the D calculation unit 1205 receives the quantization parameter QP and L′ ij and outputs a square error reduction amount D.
  • the square error reduction amount D is a square error reduction amount with respect to Kij.
  • the D calculation unit 1205 uses the product of the square value of the quantization step Qs and the square value of L′ ij as shown in the following equation (3) to calculate the square error. Calculate the reduction amount D.
  • the R value calculation unit 1202 receives L′ ij and outputs R value that is the number of value information bits.
  • the R locate calculation unit 1203 receives the orthogonal transform coefficient position (i, j) and outputs R locate which is the number of position information bits.
  • the high cost coefficient level detection / removal unit 1204 receives L′ ij, R value , R locate , and D and outputs the coefficient level Lij.
  • the high cost coefficient level detection / removal unit 1204 uses the slope ⁇ of D with respect to the sum of R locate and R value .
  • is the gradient of the relationship between the square error reduction amount and the transmission code amount. ⁇ depends on the quantization parameter QP, and becomes smaller as the quantization parameter becomes smaller (as the quantization step size becomes smaller), and becomes larger as the quantization parameter becomes larger (as the quantization step size becomes larger). In the case of uniform quantization, ⁇ is expressed by the following equation (4) using Qs.
  • the high cost coefficient level detection / removal unit 1204 increases L'ij when the absolute value of L'ij is greater than 0 and the product of R locate and R value and ⁇ is greater than or equal to D.
  • the cost coefficient level is determined and a value of 0 is output as Lij. If L'ij is not at a high cost coefficient level, L'ij is output as Lij.
  • the adaptive quantizer 1022 performs transmission order ((3, 3) ⁇ (3, 2) ⁇ (2, for each orthogonal transform coefficient Kij (0 ⁇ i, j ⁇ 3) in each TU. 3) ⁇ (3, 1) ⁇ (2, 2) ⁇ (1, 3) ⁇ (3, 0) ⁇ (2, 1) ⁇ (1, 2) ⁇ (0, 3) ⁇ (2, 0) ⁇ (1, 1) ⁇ (0, 2) ⁇ (1, 0) ⁇ (0, 1) ⁇ (0, 0) in this order)
  • step S201 the coefficient level calculation unit 1201 calculates a temporary coefficient level L′ ij corresponding to the orthogonal transform coefficient Kij using, for example, the above equation (1).
  • step S202 If it is determined in step S202 that the value of L'ij is not 0, the process proceeds to step S203. If the value of L′ ij is 0, the process proceeds to step S207.
  • step S203 the D calculation unit 1205 calculates D that is a square error reduction amount for the orthogonal transform coefficient.
  • step S204 the R value calculation unit 1202 calculates the bit number R value of the value information of L′ ij.
  • step S205 the R locate calculation unit 1203 determines whether non-zero Lij has already been output in the TU. If non-zero Lij is not yet output in the TU, the process proceeds to step S206. If non-zero Lij has already been output in the TU, R locate is not calculated (the value of R locate is set to 0), and the process proceeds to step S207.
  • step S206 the R locate calculation unit 1203 calculates the number of bits R locate of the position information determined based on the position of L′ ij.
  • the adaptive quantizer 1022 in the present embodiment uses the square error reduction amount for Kij calculated by the square error reduction amount calculation unit (D calculation unit) 1205, whereby the adaptive quantizer in the first embodiment. Higher cost coefficient level can be detected more accurately than 1021. Therefore, in the video encoding device of the present embodiment, the effect of not reducing the compression efficiency is further increased by preventing transmission at a high cost coefficient level.
  • Embodiment 3 FIG.
  • the adaptive quantizer 1023 having the configuration shown in FIG. 6 is used in the third embodiment. Note that the video encoding apparatus of the third embodiment is basically configured as shown in FIG. 1, but an adaptive quantizer 1023 is provided instead of the adaptive quantizer 1021.
  • the adaptive quantizer 1023 shown in FIG. 6 includes a coefficient level calculation unit 1201, a value information bit number calculation unit (R value calculation unit) 1202, a position information bit number calculation unit (R locate calculation unit) 1203, and a high cost coefficient level detection. / Removal unit 1204, and square error reduction amount calculation unit (D calculation unit) 1205.
  • the coefficient level calculation unit 1201 receives the orthogonal transform coefficient Kij and the quantization parameter QP, calculates the temporary coefficient level L′ ij using, for example, the above equation (1), and outputs the temporary coefficient level L′ ij. .
  • the D calculation unit 1205 receives the quantization parameters QP, L′ ij, and Kij, and outputs a square error reduction amount D.
  • the square error reduction amount D is a square error reduction amount with respect to Kij.
  • the D calculation unit 1205 calculates D using Kij, Qs, and L′ ij as shown in the following equation (5).
  • the R value calculation unit 1202 receives L′ ij and outputs R value that is the number of value information bits.
  • the R locate calculation unit 1203 inputs the orthogonal transform coefficient position (i, j) and outputs R locate which is the number of position information bits.
  • the high cost coefficient level detection / removal unit 1204 receives L′ ij, R value , R locate , and D and outputs the coefficient level Lij.
  • the high cost coefficient level detection / removal unit 1204 increases L'ij when the absolute value of L'ij is greater than 0 and the product of R locate and R value and ⁇ is greater than or equal to D. Judge as the cost coefficient level and output a value of 0 as Lij. If L'ij is not at a high cost coefficient level, L'ij is output as Lij.
  • the D calculation unit 1205 calculates D using the quantization parameters QP and L′ ij, whereas in this embodiment, the D calculation unit 1205 includes Kij, Qs, and D is calculated using L′ ij, but the other processing is the same as in the second embodiment.
  • the adaptive quantizer 1023 in the present embodiment uses the square error reduction amount for Kij calculated by the D calculator 1205 that inputs the quantization parameters QP, L'ij, and Kij ⁇ ⁇ , so that the second embodiment is more effective. Can accurately detect the high cost coefficient level. Therefore, in the video encoding apparatus of the present embodiment, the effect of not reducing the compression efficiency is further increased by preventing transmission at a high cost coefficient level.
  • FIG. 7 is a block diagram illustrating a configuration of the adaptive quantizer 1024 in the video encoding device according to the fourth embodiment.
  • Adaptive quantizer 1024 includes the maximum number of bits of coeff_sign_flag determined from the position of the significant coefficient level to be transmitted first in the number of position information bits. Note that the video encoding apparatus of the fourth embodiment is basically configured as shown in FIG. 1, but an adaptive quantizer 1024 is provided instead of the adaptive quantizer 1021.
  • adaptive quantizer 1024 includes a coefficient level calculation unit 1201, an absolute value information bit number calculation unit (R abs calculation unit) 1206, a position / code number information bit number calculation unit (R locate_sign calculation unit) 1207, and A high cost coefficient level detection / removal unit 1204 is provided.
  • R abs calculation unit absolute value information bit number calculation unit
  • R locate_sign calculation unit position / code number information bit number calculation unit
  • the coefficient level calculation unit 1201 receives the orthogonal transform coefficient Kij and the quantization parameter QP, and outputs a temporary coefficient level L′ ij.
  • the R abs calculation unit 1206 receives L′ ij and outputs R abs which is the number of absolute value information bits.
  • R abs is the number of bits of information indicating the absolute value of L′ ij. Specifically, R abs is the number of bits of information coeff_abs_level_greater1_flag indicating whether the absolute value of the significant coefficient level is greater than 1, the number of bits of information coeff_coeff_abs_level_greater2_flag indicating whether the absolute value of the significant coefficient level is greater than 2 And the sum of the number of bits of information coeff_abs_level_remaining calculated based on the description in 9.2.2.8 of Non-Patent Document 1 and indicating the absolute value of the value obtained by subtracting coeff_abs_level_greater1_flag and coeff_abs_level_greater2_flag from the absolute value of the significant coefficient level.
  • the R locate_sign calculation unit 1207 receives the orthogonal transform coefficient position (i, j) and outputs R locate_sign which is the number of bits of position / code number information.
  • R locate_sign is the number of bits of information indicating the positions on the frequency axis of all significant coefficient levels of TU.
  • R locate_sign is the number of bits of last_significant_x and last_significant_y information indicating the horizontal position and vertical position of the first significant coefficient level to be transmitted, the position from (0, 0) to the position after (last_significant_x, last_significant_y) Is the sum of the number of bits of information significant_coeff_flag indicating the presence / absence of a significant coefficient level and the maximum number of bits of information coeff_sign_flag indicating the sign of the significant coefficient level.
  • the high cost coefficient level detection / removal unit 1204 receives L′ ij, R abs , and R locate_sign and outputs the coefficient level Lij.
  • R Locate_sign is greater than 0, and R Locate_sign is greater than R abs, detects L'ij as a high cost factor level, and outputs a value of 0 as Lij. Otherwise, the temporary coefficient level L′ ij is output as Lij.
  • the adaptive quantizer 1024 performs transmission order ((3, 3) ⁇ (3, 2) ⁇ (2, for each orthogonal transform coefficient Kij (0 ⁇ i, j 3) in each TU. 3) ⁇ (3, 1) ⁇ (2, 2) ⁇ (1, 3) ⁇ (3, 0) ⁇ (2, 1) ⁇ (1, 2) ⁇ (0, 3) ⁇ (2, 0) ⁇ (1, 1) ⁇ (0, 2) ⁇ (1, 0) ⁇ (0, 1) ⁇ (0, 0) in this order)
  • step S301 the coefficient level calculation unit 1201 calculates a temporary coefficient level L′ ij corresponding to the orthogonal transform coefficient Kij using, for example, the above equation (1).
  • step S302 If it is determined in step S302 that the value of L'ij is not 0, the process proceeds to step S303. If the value of L′ ij is 0, the process proceeds to step S306.
  • step S303 the R abs calculation unit 1206 calculates the number of bits R abs of the absolute value information of L′ ij.
  • step S304 the R locate_sign calculation unit 1207 determines whether or not a non-zero Lij has already been output in the TU. If a non-zero Lij is not yet output in the TU, the process proceeds to step S305. If non-zero Lij is already output in the TU, the value of R locate_sign is set to 0, and the process proceeds to step S306.
  • step S305 the R locate_sign calculation unit 1207 calculates the bit number R locate_sign of the position / code number information determined based on the position of L′ ij.
  • the high cost factor level detection / removal section 1204, R Locate_sign is greater than 0, and when R Locate_sign is greater than R abs, detect L'ij as a high cost factor levels However, by outputting a value of 0 as Lij, the high cost coefficient level is not transmitted. Therefore, the video encoding apparatus according to the present embodiment can prevent compression efficiency from being lowered by preventing transmission at a high cost coefficient level.
  • FIG. FIG. 9 is a block diagram showing the configuration of the adaptive quantizer 1025 in the video encoding device of the fifth embodiment.
  • the adaptive quantizer 1025 includes the maximum number of bits of coeff_sign_flag determined from the position of the significant coefficient level to be transmitted first in the number of position information bits.
  • the adaptive quantizer 1025 uses the square error reduction amount for Kij calculated by the square error reduction amount calculation unit (D calculation unit) 1205. Note that the video encoding apparatus of the fifth embodiment is basically configured as shown in FIG. 1, but an adaptive quantizer 1025 is provided instead of the adaptive quantizer 1021.
  • the adaptive quantizer 1025 shown in FIG. 9 includes a coefficient level calculation unit 1201, an absolute value information bit number calculation unit (R abs calculation unit) 1206, a position / code number information bit number calculation unit (R locate_sign calculation unit) 1207, a high A cost coefficient level detection / removal unit 1204 and a square error reduction amount calculation unit (D calculation unit) 1205 are included.
  • R abs calculation unit absolute value information bit number calculation unit
  • R locate_sign calculation unit position / code number information bit number calculation unit
  • D calculation unit square error reduction amount calculation unit
  • the coefficient level calculation unit 1201 receives the orthogonal transform coefficient Kij and the quantization parameter QP, and outputs a temporary coefficient level L′ ij.
  • the D calculation unit 1205 receives the quantization parameters QP and L′ ij and outputs D.
  • D is a square error reduction amount with respect to Kij.
  • the square error reduction amount D is calculated using the product of the square value of the quantization step Qs and the square value of L′ ij. .
  • the R abs calculation unit 1206 receives L′ ij and outputs R abs which is the number of absolute value information bits.
  • the R locate_sign calculation unit 1207 receives the orthogonal transform coefficient position (i, j) and outputs R locate_sign which is the number of position / code number information bits.
  • the high cost coefficient level detection / removal unit 1204 inputs L′ ij, R abs , R locate_sign and D and outputs the coefficient level Lij.
  • the high cost coefficient level detection / removal unit 1204 uses the slope ⁇ of D with respect to the sum of R locate_sign and R abs . In the case of uniform quantization, ⁇ is expressed by the above equation (4) using Qs.
  • the high cost coefficient level detection / removal unit 1204 increases L'ij when the absolute value of L'ij is greater than 0 and the product of R locate and R value and ⁇ is greater than or equal to D.
  • the cost coefficient level is determined and a value of 0 is output as Lij. If L'ij is not at a high cost coefficient level, L'ij is output as Lij.
  • the adaptive quantizer 1025 performs transmission order ((3, 3) ⁇ (3, 2) ⁇ (2, for each orthogonal transform coefficient Kij (0 ⁇ i, j ⁇ 3) in each TU. 3) ⁇ (3, 1) ⁇ (2, 2) ⁇ (1, 3) ⁇ (3, 0) ⁇ (2, 1) ⁇ (1, 2) ⁇ (0, 3) ⁇ (2, 0) ⁇ (1, 1) ⁇ (0, 2) ⁇ (1, 0) ⁇ (0, 1) ⁇ (0, 0) in this order)
  • step S401 the coefficient level calculation unit 1201 calculates a temporary coefficient level L′ ij corresponding to the orthogonal transform coefficient Kij using, for example, the above equation (1).
  • step S402 If it is determined in step S402 that the value of L'ij is not 0, the process proceeds to step S403. If the value of L′ ij is 0, the process proceeds to step S407.
  • step S403 the D calculation unit 1205 calculates D which is a square error reduction amount for the orthogonal transform coefficient.
  • step S404 the R abs calculation unit 1206 calculates the number of bits R abs of the absolute value information of L′ ij.
  • step S405 the R locate_sign calculation unit 1207 determines whether a non-zero Lij has already been output in the TU. If non-zero Lij is not yet output in the TU, the process proceeds to step S406. If non-zero Lij has already been output in the TU, R locate_sign is not calculated (the value of R locate_sign is set to 0), and the process proceeds to step S407.
  • step S406 the R locate_sign calculation unit 1207 calculates the number of bits R locate_sign of the position / code number information determined based on the position of L′ ij.
  • FIG. FIG. 11 is a block diagram illustrating a configuration of an adaptive quantizer 1026 in the video encoding device according to the sixth embodiment.
  • Adaptive quantizer 1026 includes the maximum number of bits of coeff_sign_flag determined from the position of the significant coefficient level to be transmitted first in the number of position information bits.
  • the adaptive quantizer 1026 uses a square error reduction amount with respect to Kij. Note that the video encoding apparatus of the sixth embodiment is basically configured as shown in FIG. 1, but an adaptive quantizer 1026 is provided instead of the adaptive quantizer 1021.
  • Adaptive quantizer 11 1026 the coefficient level calculation unit 1201, the absolute value information bits calculation section (R abs calculating unit) 1206, a position / code number information bits calculation section (R locate_sign calculation unit) 1207, a high A cost coefficient level detection / removal unit 1204 and a square error reduction amount calculation unit (D calculation unit) 1205 are included.
  • the coefficient level calculation unit 1201 receives the orthogonal transform coefficient Kij and the quantization parameter QP, calculates the temporary coefficient level L′ ij using, for example, the above equation (1), and outputs the temporary coefficient level L′ ij.
  • the D calculation unit 1205 receives the quantization parameters QP, L′ ij, and Kij, and outputs D.
  • D is a square error reduction amount with respect to Kij.
  • the D calculation unit 1205 calculates D using Kij, Qs, and L′ ij as shown in the above equation (5).
  • the R abs calculation unit 1206 receives L′ ij and outputs R abs which is the number of absolute value information bits.
  • the R locate_sign calculation unit 1207 receives the orthogonal transform coefficient position (i, j) and outputs R locate_sign which is the number of bits of position / code number information.
  • the high cost coefficient level detection / removal unit 1204 inputs L′ ij, R abs , R locate_sign , and D, and outputs the coefficient level Lij.
  • the absolute value of L'ij is greater than 0, and the product of the sum and ⁇ of R Locate_sign and R abs is the case of the above D determines L'ij a high cost factor levels, Lij values of 0 Output as.
  • the high cost coefficient level detection / removal unit 1204 outputs L'ij as Lij when L'ij is not at the high cost coefficient level.
  • the D calculation unit 1205 calculates D using the quantization parameters QP and L′ ij, whereas in this embodiment, the D calculation unit 1205 includes Kij, Qs, and D is calculated using L′ ij, but the other processing is the same as in the fifth embodiment.
  • the detection and removal of the high cost coefficient level is applied to all the non-zero temporary coefficient levels L′ ij, but a certain threshold value (quantization parameter QP or video property) Note that the temporary coefficient level L′ ij having an absolute value larger than 2) does not become a high cost coefficient level, for example, in order to reduce the amount of calculation.
  • the detection and removal of the high cost coefficient level in each of the above embodiments may be applied only to the temporary coefficient level L′ ij.
  • the temporary coefficient level L that has an absolute value equal to or less than the threshold value (for example, 2) Focusing on the fact that the number of bits of 'ij's coeff_abs_level_remaining ⁇ is expressed only by the TU code of the prefix part, in order to reduce the amount of calculation, the bit number of coeff_abs_level_remaining ⁇ of non-zero provisional coefficient level L'ij below the threshold is set The value of coeff_abs_level_greater1_flag and the value of coeff_abs_level_greater2_flag may be subtracted from the absolute value of L'ij.
  • the threshold value for example, 2
  • the adaptive quantizer applies the above-described detection and removal of the high cost coefficient level to all orthogonal transform coefficients.
  • the high cost coefficient level is almost generated in the intra-predicted orthogonal transform coefficients.
  • the adaptive quantizer may apply the above-described detection and removal of the high cost coefficient level only to the inter-predicted orthogonal transform coefficient.
  • the orthogonal transform coefficient is a frequency-transformed prediction error image.
  • transform_skip_flag shown in 7.3.9.11 Residual coding syntax of Non-Patent Document 1 is 1, that is, frequency conversion is performed in 4 ⁇ 4 TU.
  • the adaptive quantizer of the present invention may be applied to a prediction error image to which transformation based on a unit matrix is applied.
  • the position information is information indicating the positions of all significant coefficient levels of the TU (the sum of the number of bits of last_significant_x, last_significant_y, and siginificant_coeff_flag), but TU larger than 4 ⁇ 4 (8 ⁇ 8 TU , 16 ⁇ 16 TU, and 32 ⁇ 32 TU), in addition to the location information, 4 ⁇ 4 having 16 coefficient levels defined based on the description of 7.3.9.11 Residual coding syntax You may add the bit number of coded_sub_block_flag which shows the presence or absence of the significant coefficient level in a subblock.
  • each of the above embodiments can be configured by hardware, it can also be realized by a computer program.
  • the information processing system illustrated in FIG. 12 includes a processor 1001, a program memory 1002, a storage medium 1003 for storing video data, and a storage medium 1004 for storing a bitstream.
  • the storage medium 1003 and the storage medium 1004 may be separate storage media, or may be storage areas composed of the same storage medium.
  • a magnetic storage medium such as a hard disk can be used as the storage medium.
  • the program memory 1002 stores a program for realizing the function of each block shown in FIG. Then, the processor 1001 implements the function of the video encoding device shown in FIG. 1B by executing processing according to the program stored in the program memory 1002.
  • FIG. 13 is a block diagram showing the main part of the video encoding apparatus according to the present invention.
  • the video encoding apparatus according to the present invention includes an orthogonal transform unit 11 that performs orthogonal transform on an image block to calculate orthogonal transform coefficients, and a quantization unit that quantizes the orthogonal transform coefficients to calculate a coefficient level. 12 and an entropy encoding unit 13 that entropy-encodes the position information of all the significant coefficient levels among the coefficient levels and then entropy-encodes the value information of each significant coefficient level and outputs a bitstream.
  • the converting unit 12 includes a position information bit number calculating unit that calculates the number of position information bits determined based on the position of the first significant coefficient level in the transmission order included in the image block, and a significant coefficient level value information bit.
  • a value information bit number calculation unit for calculating a number, and a high cost coefficient level in which a significant coefficient level satisfying a predetermined condition for the position information bit number and the value information bit number is 0
  • a detection / removal unit A detection / removal unit.
  • Orthogonal transformation means for orthogonally transforming an image block to calculate orthogonal transformation coefficients
  • quantization means for quantizing the orthogonal transformation coefficients to calculate coefficient levels, and all significant coefficient levels among the coefficient levels
  • Entropy-encoding means for entropy-encoding the value information of each significant coefficient level and outputting a bitstream after entropy-encoding the position information of each of the significant coefficient levels
  • the quantization means includes: Position information bit number calculating means for calculating the number of position information bits determined based on the position of the first significant coefficient level in the transmission order included in the image block, and calculating the value information bit number of the significant coefficient level A value information bit number calculating means, and a significant coefficient level satisfying a predetermined condition between the position information bit number and the value information bit number is 0.
  • That video coding apparatus which comprises a high cost factor level detection / removal means.
  • the said quantization means contains the square error reduction amount calculation means which calculates the square error reduction amount with respect to an orthogonal transformation coefficient using a quantization parameter and the said significant coefficient level,
  • the said high cost coefficient The level detection / removal means uses the number of position information bits, the number of value information bits, and the amount of square error reduction, and the square error reduction amount is obtained by calculating the position information bit number and the value information bit.
  • the video encoding apparatus according to supplementary note 1 or supplementary note 2, wherein the significant coefficient level that is equal to or less than a value obtained by multiplying the sum by a predetermined multiplier is 0.
  • the position information bit number calculation means indicates the position information bit number of the first significant coefficient level and the sign of all significant coefficient levels in the block as the position information bit number. The sum of the number of bits of information is calculated, and the value information bit number calculation means calculates the number of bits of information of the absolute value of the significant coefficient level as the value information bit number. Any video encoding device.
  • the quantization means is any one of Supplementary notes 1 to 5 that uses the high-cost coefficient level detection / removal means only when the absolute value of the significant coefficient level is not more than a predetermined threshold value.
  • Video encoding device is any one of Supplementary notes 1 to 5 that uses the high-cost coefficient level detection / removal means only when the absolute value of the significant coefficient level is not more than a predetermined threshold value.
  • the value information bit number calculating means includes information indicating whether the significant coefficient level is greater than 1 from the absolute value information of the significant coefficient level greater than 2 included in the value information bit number.
  • Supplementary note 10 The video of any one of Supplementary note 5 to Supplementary note 9, wherein the quantization means quantizes a prediction error image to which a transform based on a unit matrix is applied instead of a frequency transform to calculate a coefficient level. Encoding device.
  • the position information bit number calculation means calculates the position information bit number in an image block (8 ⁇ 8 image block, 16 ⁇ 16 image block, or 32 ⁇ 32 image block) larger than 4 ⁇ 4.
  • the video encoding device according to any one of appendix 5 to appendix 9, which includes the number of bits of information indicating presence / absence of a significant coefficient level in a 4 ⁇ 4 subblock having 16 coefficient levels.
  • Orthogonal Transformer 12 Quantizer 13 Entropy Encoder 101 Frequency Converter 1020-1025 Adaptive Quantizer 103 Entropy Encoder 104 Inverse Frequency Transform / Inverse Quantizer 105 Buffer 106 Predictor 107 Estimator 1001 Processor 1002 Program Memory 1003 Storage medium 1004 Storage medium 1201 Coefficient level calculation part 1202 Value information bit number calculation part (R value calculation part) 1203 Location information bit number calculation part (R locate calculation part) 1204 High cost coefficient level detection / removal unit 1205 Square error reduction amount calculation unit (D calculation unit) 1206 Absolute value information bit number calculation part (R abs calculation part) 1207 Position / code number information bit number calculation part (R locate_sign calculation part)

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 映像符号化装置は、画像ブロックを直交変換して直交変換係数を計算する直交変換部11と、直交変換係数を量子化して係数レベルを計算する量子化部12と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化部13とを備え、量子化部11は、画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する位置情報ビット数計算部と、有意な係数レベルの値情報ビット数を計算する値情報ビット数計算部と、位置情報ビット数と値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする高コスト係数レベル検出/除去部とを含む。

Description

映像符号化装置、映像符号化方法および映像符号化プログラム
 本発明は、直交変換係数を量子化する量子化技術であって、例えば、HEVCを用いた映像符号化装置に好適に適用される。
 非特許文献1 に記載された方法に基づいた映像符号化方式は、ディジタル化された映像の各フレームを符号化ツリーユニット(CTU :Coding Tree Unit)に分割し、ラスタスキャン順に各CTU を符号化する。各CTU は、クアッドツリー構造で、符号化ユニット(CU:Coding Unit )に分割されて符号化される。各CUは、予測ユニット(PU:Prediction Unit )に分割されて予測される。また、各CUの予測誤差は、クアッドツリー構造で、変換ユニット(TU:Transform Unit )に分割されて周波数変換される。
 CUは、イントラ予測/フレーム間予測の符号化単位である。以下、イントラ予測およびフレーム間予測を説明する。
 イントラ予測は、符号化対象フレームの再構築画像から生成する予測である。非特許文献1 では、図14に示す33種類の角度イントラ予測などが定義されている。角度イントラ予測では、符号化対象ブロック周辺の再構築画素を図14に示す33種類の方向のいずれかに外挿して、イントラ予測信号が生成される。以下、イントラ予測を用いるCUをイントラCUと呼ぶ。
 フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築フレーム(参照ピクチャ)の画像に基づく予測である。以下、フレーム間予測をインター予測とも呼ぶ。図15は、フレーム間予測の例を示す説明図である。動きベクトルMV=(mvx, mvy)は、符号化対象ブロックに対する参照ピクチャの再構築画像ブロックの平行移動量を示す。インター予測は、参照ピクチャの再構築画像ブロックに基づいて(必要であれば画素補間を用いて)、インター予測信号を生成する。以下、インター予測を用いるCUをインターCUと呼ぶ。
 なお、イントラCUのみで符号化されたフレームはIフレーム(またはIピクチャ)と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームはPフレーム(またはPピクチャ)と呼ばれる。ブロックのインター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはBフレーム(またはBピクチャ)と呼ばれる。
 次に、図16を参照して、ディジタル化された映像の各フレームの各CUを入力画像としてビットストリームを出力する一般的な映像符号化装置の構成と動作を説明する。
 図16に示す映像符号化装置は、周波数変換器101 、量子化器1020、エントロピー符号化器103 、逆周波数変換/逆量子化器104 、バッファ105 、予測器106 、および推定器107 を備える。
 図17は、フレームの空間解像度がCIF (Common Intermediate Format)、CTU サイズが64の場合のフレームt のCTU 分割例、および、フレームt の第8CTU(CTU8)のCU分割例を示す説明図である。また、図18は、CTU8のCU分割例に対応するクアッドツリー構造を示す説明図である。
 図19は、CUのTU分割例を示す説明図である。上段には、イントラ予測 2N×2N PU のCUのTU分割例が示されている。CUがイントラ予測の場合、クアッドツリーの根(Root)をPUに配置し、予測誤差をクアッドツリー構造で表現する。下段には、インター予測 2N×N PUのCUのTU分割例が示されている。CUがインター予測の場合、クアッドツリーの根(Root)をCUに配置し、予測誤差をクアッドツリー構造で表現する。
 推定器107 は、CTU 毎に、エントロピー符号化コストを最小とするCUクアッドツリー構造、PU分割形状、およびTUクアッドツリー構造を決定する。
 予測器106 は、推定器107 が決定したCUクアッドツリー構造およびPU分割形状に基づいて、CUの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測またはインター予測に基づいて生成される。
 周波数変換器101 は、推定器107 が決定したTUクアッドツリー構造に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。
 量子化器1020は、周波数変換された予測誤差画像(直交変換係数)を量子化する。以下、量子化された直交変換係数を係数レベルと呼ぶ。また、0ではない値を持つ係数レベルのことを有意係数レベルと呼ぶ。図20に示すように、量子化器1020は、直交変換係数Kij と量子化パラメータQPとを入力し、係数レベルLij を出力する係数レベル計算部1201を備えている。
 エントロピー符号化器103 は、CTU のクアッドツリー構造を示すcu_split_flag、予測パラメータ、および係数レベルをエントロピー符号化する。
 逆周波数変換/逆量子化器104 は、係数レベルを逆量子化する。さらに、逆周波数変換/逆量子化器104 は、逆量子化した直交変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ105 に供給される。バッファ105 は、再構築画像を格納する。
 上述した動作に基づいて、一般的な映像符号化装置はビットストリームを生成する。
 以下、量子化器1020とエントロピー符号化器103 のそれぞれの動作を、図21に示す 4×4 TUの例を用いてさらに詳しく説明する。
 まず、 4×4 TUの直交変換係数Kij と係数レベルLij を以下のように定義する。
 Kij (0 ≦ i, j ≦ 3)を、周波軸での水平位置i および垂直位置j における直交変換係数の値と定義する。同様に、係数レベルLij を、直交変換係数Kij に対応する係数レベルの値と定義する。ただし、i 、j の値が大きいほど、Kij およびLij は高周波成分となる。
 次に、量子化を詳しく説明する。係数レベル計算部1201は、Kij を量子化ステップQsで割ることによって、係数レベルLij を計算する。定式的には、係数レベルLij は、(1)式で表される。
 Lij = Sign(Kij )・Floor (|Kij |/Qs+f )           (1)
 ただし、Sign(a )は入力a の正負の符号を返す関数、Floor(a )は入力a 以下の最も大きな整数を返す関数、f は量子化特性を決定するパラメータ(0 ≦f ≦ 0.5)である。f の値を、インター予測においては1/6 、イントラ予測においては1/3 とする。
 なお、Qsは、量子化パラメータQPを用いて以下の(2)式で示される。
Figure JPOXMLDOC01-appb-M000001
 ただし、N はTUのブロックサイズである。図21に示す 4×4 TUにおいては N=4 である。図21には、Kij を、4096の値を持つQsおよび1/3の値を持つf で量子化した例が示されている。
 続いて、エントロピー符号化を詳しく説明する。まず、係数レベルに対するエントロピー符号化の説明において用いる位置情報と値情報とを定義する。
 本明細書において、位置情報は、TUのすべての有意係数レベルの位置を示す情報である。
 非特許文献1 の7.4.9.11を参照すると、HEVCにおける位置情報は、最初に伝送する有意係数レベルの水平位置および垂直位置を示す情報last_significant_xおよびlast_significant_y と、(last_significant_x、last_significant_y )より後続の位置から(0, 0 )までのそれぞれの位置における有意係数レベルの有無を示す情報siginificant_coeff_flag とで構成される。ゆえに、位置情報ビット数は、最初に伝送する有意係数レベルの位置に基づいて決定されるlast_significant_xのビット数、last_significant_yのビット数、およびsiginificant_coeff_flag のビット数の総和である。
 本明細書において、値情報は、有意係数レベルの値を示す情報である。
 非特許文献1 の7.4.9.11を参照すると、HEVCにおける値情報は、有意係数レベルの絶対値が1より大きいか否かを示す情報coeff_abs_level_greater1_flag 、有意係数レベルの絶対値が2より大きいか否かを示す情報coeff_abs_level_greater2_flag 、有意係数レベルの正負の符号を示す情報coeff_sign_flag 、およびcoeff_abs_level_greater1_flag やcoeff_abs_level_greater2_flag よりも大きな有意係数レベルの絶対値から、coeff_abs_level_greater1_flag とcoeff_abs_level_greater2_flag とを減じた値(有意係数レベルの残り)の絶対値を示す情報coeff_abs_level_remaining で構成される。ゆえに、値情報ビット数は、有意係数レベルのcoeff_abs_level_greater1_flag のビット数、coeff_abs_level_greater2_flag のビット数、coeff_sign_flag のビット数、およびcoeff_abs_level_remaining のビット数の総和である。
 図22には、位置情報および値情報と係数レベルLij との関係が示されている。図22において、横軸に対する縦軸の項目は、図21に示された 4×4 TUにおける各Lij の情報を示す。
 図22におけるlast_significant_x、last_significant_yは、最初に伝送する有意係数レベルL30 = 1 の位置(i, j)=(3, 0)を示す。siginificant_coeff_flag は、(3, 0)より後続の位置から(0, 0)までのそれぞれの位置における有意係数レベルの有無を示す。有意係数レベルである場合はsiginificant_coeff_flag= 1、有意係数レベルでない場合にはsiginificant_coeff_flag =0とする。図22では、L30=1 およびL01=1 は、それぞれcoeff_abs_level_greater1_flag=0 とcoeff_sign_flag=0 (正)とで表現される。なお、両方とも値が2未満であるため、coeff_abs_level_greater2_flag とcoeff_abs_level_remaining とは用いられない。
 図23には、位置情報および値情報と値情報のビット数との関係が示されている。図23において、横軸に対する縦軸の項目は、図21に示された 4×4 TUの位置情報ビット数と値情報ビット数を示す。
 図23における各情報ビット数はbin 数で示される。bin は、エントロピー符号化器103 によって出力されるビットストリームに変換される前の中間ビット列における1つのビットを指す。
 図21に示された 4×4 TUの場合、エントロピー符号化器103 は、TU内のすべての有意係数レベルの位置情報のビット13bin を伝送してから、それぞれの有意係数レベルの値情報のビット数、計4binを伝送する。位置情報は、last_significant_x、last_significant_yおよびsiginificant_coeff_flag で構成される。last_significant_xおよびlast_significant_yは、最初に伝送する有意係数の位置である(i, j)=(3, 0)を示し、4binである。siginificant_coeff_flag は、最初の伝送する有意係数の位置より後続の位置(2, 1)から、(0, 0)までの 9 位置それぞれの有意係数レベルの有無を示し、9binである。
 値情報はcoeff_abs_level_greater1_flag 、coeff_coeff_abs_level_greater2_flag 、coeff_sign_flag 、およびcoeff_abs_level_remaining で構成される。coeff_abs_level_greater1_flag は、L30 とL01 に対し、1より大きいか否かを示し2binである。coeff_coeff_abs_level_greater2_flag は、有意係数レベルの絶対値が2より大きい係数レベルが存在しないため、0binである。coeff_sign_flag は、L30 とL01 の正負の符号を示し、2binである。coeff_abs_level_remaining は、有意係数レベルの絶対値が2より大きい係数レベルが存在しないため、0binである。
 なお、 4×4 TUの場合、それぞれの情報の最大bin 数は下記の通りである。すなわち、非特許文献1 の7.4.9.11に基づけば 4×4 TUにおいては最大値が3 (=N-1=4-1)であるから、last_significant_xは最大3binである。同様に、last_significant_yも、最大3binである。非特許文献1 の7.3.9.11に基づけば 4×4 TUあたり最大15であるから、siginificant_coeff_flag は最大15bin である。非特許文献1 の7.3.9.11に基づけば 4×4 TUあたり最大8 であるから、coeff_abs_level_greater1_flag は最大8binである。非特許文献1 の7.3.9.11に基づけば 4×4 TUあたり最大1 であるから、coeff_coeff_abs_level_greater2_flag は最大1binである。非特許文献1 の7.3.9.11に基づけば 4×4 TUあたり最大16であるから、coeff_sign_flag は最大16bin である。非特許文献1 の9.2.2.8 に基づいて、coeff_abs_level_remaining に対するbin が算出される。
 なお、非特許文献1 の9.2.2.8 の式(9-6 )および(9-7 )からわかるように、最後に伝送した有意係数レベルの値が所定の閾値を超える度に、coeff_abs_level_remaining のprefix部のbin string には高次元のTU符号が適用されるようになり、coeff_abs_level_remaining のsuffix部のbin stringには高次元のExp-Golom 符号が適用される。つまり、小さな値のcoeff_abs_level_remaining のsuffix部に対するbin 数は多くなり、大きな値のcoeff_abs_level_remainingのsuffix部に対するbin は少なくなる。
High efficiency video coding (HEVC) text specification draft 9, JCTVC-K1003_v9, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 11th Meeting: Shanghai, CN, 10209 October 2012.
 HEVCを用いたエントロピー符号化器は、TU単位で、TU内のすべての有意係数レベルの位置情報をエントロピー符号化してから、それぞれの有意係数レベルの値情報をエントロピー符号化する。ゆえに、有意係数レベルの位置情報のビット数と値情報のビット数とが所定の条件を満たすと伝送の際に高コストとなる有意係数レベル(以下、高コスト係数レベルと呼ぶ)が存在する。例えば、位置情報のビット数が、値情報のビット数より大きい場合、係数レベルは、高コスト係数レベルになる。また、有意係数レベルの値が小さい場合、係数レベルが高コスト係数レベルになる傾向がある。高コスト係数レベルを伝送すると、圧縮効率が低下する。
 本発明の目的は、高コスト係数レベルの伝送を防ぎ、圧縮効率を低下させないようにする映像符号化装置を提供することである。
 本発明による映像符号化装置は、画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、直交変換係数を量子化して係数レベルを計算する量子化手段と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、量子化手段は、画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する位置情報ビット数計算手段と、有意な係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、位置情報ビット数と値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする高コスト係数レベル検出/除去手段とを含むことを特徴とする。
 本発明による映像符号化方法は、画像ブロックを直交変換して直交変換係数を計算し、直交変換係数を量子化して係数レベルを計算し、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する映像符号化方法であって、係数レベルを計算する際に、画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算し、有意な係数レベルの値情報ビット数を計算し、位置情報ビット数と値情報ビット数とが所定の条件を満たす有意な係数レベルを0とすることを特徴とする。
 本発明による映像符号化プログラムは、コンピュータに、画像ブロックを直交変換して直交変換係数を計算する処理と、直交変換係数を量子化して係数レベルを計算する処理と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する処理とを実行させ、係数レベルを計算する処理で、画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する処理と、有意な係数レベルの値情報ビット数を計算する処理と、位置情報ビット数と値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする処理とを実行させることを特徴とする。
 本発明によれば、圧縮効率が低下する原因となる高コスト係数レベルを検出して除去することによって、高コスト係数レベルの伝送が防がれ、圧縮効率の低下が防止される。
本発明による映像符号化装置の第1の実施形態を示すブロック図である。 第1の実施形態における適応量子化器の構成を示すブロック図である。 適応量子化器の動作を示すフローチャートである。 第2の実施形態における適応量子化器の構成を示すブロック図である。 適応量子化器の動作を示すフローチャートである。 第3の実施形態における適応量子化器の構成を示すブロック図である。 第4の実施形態における適応量子化器の構成を示すブロック図である。 適応量子化器の動作を示すフローチャートである。 第5の実施形態における適応量子化器の構成を示すブロック図である。 適応量子化器の動作を示すフローチャートである。 第6の実施形態における適応量子化器の構成を示すブロック図である。 プログラムを用いた情報処理システムの例を示すブロック図である。 本発明による映像符号化装置の主要部を示すブロック図である。 33種類の角度イントラ予測の例を示す説明図である。 フレーム間予測の例を示す説明図である。 一般的な映像符号化装置の構成を示す説明図である。 フレームt のCTU 分割例、および、フレームt のCTU8のCU分割例を示す説明図である。 CTU8のCU分割例に対応するクアッドツリー構造を示す説明図である。 CUのTU分割例を示す説明図である。 一般的な適応量子化器の構成を示すブロック図である。 Kij を、4096の値を持つQsおよび1/6の値を持つパラメータf で量子化した例を示す説明図である。 位置情報および値情報と係数レベルLij との関係を示す説明図である。 位置情報および値情報と値情報のビット数との関係を示す説明図である
実施形態1.
 図1 は、本発明による映像符号化装置の第1の実施形態を示すブロック図である。図1 を参照して、ディジタル化された映像の各フレームを入力画像としてビットストリームを出力する第1 の実施形態の映像符号化装置の構成を説明する。
 図1 に示す第1の実施形態の映像符号化装置は、周波数変換器101 、適応量子化器1021、エントロピー符号化器103 、逆周波数変換/逆量子化器104 、バッファ105 、予測器106 、および推定器107 を備える。図16に示す映像符号化装置と比較すると、量子化器1020に代えて適応量子化器1021が設けられている。図1 に示す映像符号化装置における他のブロックは、図16に示す映像符号化装置におけるブロックと同じである。例えば、エントロピー符号化器103 は、TU単位で、TU内のすべての有意係数レベルの位置情報をエントロピー符号化してから、それぞれの有意係数レベルの値情報をエントロピー符号化する。よって、以下、適応量子化器1021のみを説明する。
 図2 は、適応量子化器1021の構成を示すブロック図である。図2 に示す適応量子化器は、図20に示す量子化器の係数レベル計算部1201に加えて、値情報ビット数計算部(Rvalue 計算部)1202、位置情報ビット数計算部(Rlocate 計算部)1203、および高コスト係数レベル検出/除去部1204を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPとを入力し、仮係数レベルL’ijを出力する。
 Rvalue計算部1202は、仮係数レベルL’ijを入力し、値情報ビット数であるRvalueを出力する。Rvalueは、L’ijの値を示す情報のビット数である。具体的には、Rvalueは、有意係数レベルの絶対値が1より大きいか否かを示す情報coeff_abs_level_greater1_flag のビット数、有意係数レベルの絶対値が2より大きいか否かを示す情報coeff_coeff_abs_level_greater2_flag のビット数、有意係数レベルの正負の符号を示す情報coeff_sign_flag のビット数、および非特許文献1 の9.2.2.8 の記載に基づいて計算される、有意係数レベルの絶対値からcoeff_abs_level_greater1_flag とcoeff_abs_level_greater2_flag を減じた値の絶対値を示す情報coeff_abs_level_remaining のビット数の和で構成される。
 Rlocate 計算部1203は、直交変換係数位置 (i, j)を入力し、位置情報ビット数であるRlocate を出力する。Rlocate は、TUのすべての有意係数レベルの周波数軸上での位置を示す情報のビット数である。Rlocate は、具体的には、最初に伝送される有意係数レベルの水平位置および垂直位置をそれぞれ示す情報last_significant_xおよびlast_significant_yのビット数と、(last_significant_x、last_significant_y)より後続の位置から (0, 0)までの位置における有意係数レベルの有無を示す情報siginificant_coeff_flagのビット数の和である。
 高コスト係数レベル検出/除去部1204は、L’ij、Rvalue、およびRlocate を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、例えば、Rlocate が0より大きく、かつ、Rlocate がRvalueより大きい場合、L’ijを高コスト係数レベルとして検出し、Lij として0の値を出力する。そうでない場合には、仮係数レベルL’ijをLij として出力する。すなわち、高コスト係数レベル検出/除去部1204は、高コスト係数レベルを検出して除去する。
 次に、図3 のフローチャートを参照して、適応量子化器1021の動作を説明する。適応量子化器1021は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 ((3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
 ステップS101で、係数レベル計算部1201は、例えば上記の(1)式を用いて、直交変換係数Kij に対応する仮係数レベルL’ijを計算する。
 ステップS102で、L’ijの値が0でない場合には、ステップS103に移行する。L’ijの値が0である場合には、ステップS106に移行する。
 ステップS103で、Rvalue 計算部1202は、L’ijの値情報のビット数Rvalueを計算する。
 ステップS104で、Rlocate 計算部1203は、すでにTU内で非0のLij を出力したか否か判断する。まだ、TU内で非0のLij を出力していない場合には、ステップS105に移行する。すでにTU内で非0のLij が出力した場合には、Rlocate の値を0とし、ステップS106に移行する。
 ステップS105で、Rlocate 計算部1203は、L’ijの位置に基づいて決定される位置情報のビット数Rlocate を計算する。
 ステップS106で、高コスト係数レベル検出/除去部1204は、ステップS102でL’ijの値が0であると判定された場合には、係数レベルLij (= 0)を出力する。そうでない場合には、高コスト係数レベル検出/除去部1204は、Rlocate が0より大きく、かつRlocate がRvalueよりも大きい場合に、L’ijを高コスト係数レベルとして検出し、Lij として0の値を出力する。そうでない場合には、L’ijをLij として出力する。
 以上に説明したように、本実施形態における適応量子化器1021では、高コスト係数レベル検出/除去部1204が、Rlocate が0より大きく、かつRlocate がRvalueよりも大きい場合に、L’ijを高コスト係数レベルとして検出し、Lij として0の値を出力することによって、高コスト係数レベルは伝送されない。よって、本実施形態の映像符号化装置は、高コスト係数レベルの伝送を防止することによって、圧縮効率を低下させないようにすることができる。
実施形態2.
 上記した第1の実施形態では、高コスト係数レベルを正確に検出できない場合がある。そこで、高コスト係数レベルをより正確に検出するために、第2の実施形態では、図4 に示す構成の適応量子化器1022を用いる。なお、第2の実施形態の映像符号化装置は、基本的に図1に示されるように構成されるが、適応量子化器1021に代えて、適応量子化器1022が設けられる。
 図4 に示す適応量子化器1022は、係数レベル計算部1201、値情報ビット数計算部(Rvalue計算部)1202、位置情報ビット数計算部(Rlocate 計算部)1203、高コスト係数レベル検出/除去部1204、および2乗誤差削減量計算部(D 計算部)1205を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPとを入力し、仮係数レベルL’ijを出力する。
 D 計算部1205は、量子化パラメータQPとL’ijとを入力し、2乗誤差削減量D を出力する。2乗誤差削減量D は、Kij に対する2乗誤差削減量である。本実施形態では、D 計算部1205は、以下の(3)式に示すように、量子化ステップQsの2乗の値とL’ijの2乗の値との積を用いて、2乗誤差削減量D を計算する。
 D = Qs2・(L’ij+α)2 -Qs2・α2 = Qs2・L’ij・(L’ij+2α)      (3)
 ただし、αは、-f <α<1-f を満たす係数である。
 Rvalue計算部1202は、L’ijを入力し、値情報ビット数であるRvalueを出力する。Rlocate 計算部1203は、直交変換係数位置 (i, j)を入力し、位置情報ビット数であるRlocate を出力する。
 高コスト係数レベル検出/除去部1204は、L’ij、Rvalue 、Rlocate 、D を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、Rlocate とRvalue との和に対するDの傾きλを用いる。なお、λは、2乗誤差削減量と伝送符号量との関係の勾配である。λは、量子化パラメータQPに依存し、量子化パラメータが小さくなるほど(量子化ステップサイズが小さくなるほど)小さな値となり、量子化パラメータが大きくなるほど(量子化ステップサイズが大きくなるほど)大きな値となる。λは、一様量子化の場合、Qsを用いて、以下の(4)式で示される。
Figure JPOXMLDOC01-appb-M000002
 高コスト係数レベル検出/除去部1204は、L’ijの絶対値が0より大きく、かつ、Rlocate とRvalueとの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
 次に、図5 のフローチャートを参照して、適応量子化器1022の動作を説明する。適応量子化器1022は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 ((3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
 ステップS201で、係数レベル計算部1201は、例えば上記の(1)式を用いて、直交変換係数Kij に対応する仮係数レベルL’ijを計算する。
 ステップS202で、L’ijの値が0でない場合には、ステップS203に移行する。L’ijの値が0である場合には、ステップS207に移行する。
 ステップS203で、D 計算部1205は、直交変換係数に対する2乗誤差削減量であるD を計算する。
 ステップS204で、Rvalue計算部1202は、L’ijの値情報のビット数Rvalueを計算する。
 ステップS205で、Rlocate 計算部1203は、すでにTU内で非0のLij を出力したか判断する。まだ、TU内で非0のLij を出力していない場合には、ステップS206に移行する。すでにTU内で非0のLij が出力した場合には、Rlocate を計算せず(Rlocate の値を0とし)、ステップS207に移行する。
 ステップS206で、Rlocate 計算部1203は、L’ijの位置に基づいて決定される位置情報のビット数Rlocate を計算する。
 ステップS207で、高コスト係数レベル検出/除去部1204は、ステップS202でL’ijの値が0であると判定された場合には、係数レベルLij (= 0)を出力する。そうでない場合には、高コスト係数レベル検出/除去部1204は、Rlocate とRvalueとの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
 本実施形態における適応量子化器1022は、2乗誤差削減量計算部(D 計算部)1205によって算出されたKij に対する2乗誤差削減量を用いることによって、第1の実施形態における適応量子化器1021よりも、正確に高コスト係数レベルを検出できる。よって、本実施形態の映像符号化装置では、高コスト係数レベルの伝送を防止することによって圧縮効率を低下させない効果がより大きくなる。
実施形態3.
 第2の実施形態では、Kij を用いずに2乗誤差削減量を計算するために、正確に高コスト係数レベルを検出できない場合がある。そこで、高コスト係数レベルをより正確に検出するために、第3の実施形態では、図6 に示す構成の適応量子化器1023を用いる。なお、第3の実施形態の映像符号化装置は、基本的に図1に示されるように構成されるが、適応量子化器1021に代えて、適応量子化器1023が設けられる。
 図6 に示す適応量子化器1023は、係数レベル計算部1201、値情報ビット数計算部(Rvalue計算部)1202、位置情報ビット数計算部(Rlocate 計算部)1203、高コスト係数レベル検出/除去部1204、および2乗誤差削減量計算部(D 計算部)1205を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPとを入力し、例えば上記の(1)式を用いて仮係数レベルL’ijを計算し、仮係数レベルL’ijを出力する。
 本実施形態では、D計算部1205は、量子化パラメータQP、L’ij、およびKij を入力し、2乗誤差削減量D を出力する。2乗誤差削減量Dは、Kij に対する2乗誤差削減量である。本実施形態では、D 計算部1205は、以下の(5)式に示すように、Kij 、Qs、およびL’ijを用いて、D を計算する。
 D = (Kij - 0)2 -(Kij - Qs・L’ij)2 = 2・Kij ・Qs・L’ij-Qs2・L’ij2  (5)
 Rvalue計算部1202は、L’ijを入力し、値情報ビット数であるRvalueを出力する。Rlocate 計算部1203は、直交変換係数位置 (i, j )を入力し、位置情報ビット数であるRlocate を出力する。
 高コスト係数レベル検出/除去部1204は、L’ij、Rvalue、Rlocate 、D を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、L’ijの絶対値が0より大きく、かつ、Rlocate とRvalueとの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
 第2の実施形態では、D 計算部1205が、量子化パラメータQPとL’ijとを用いてD を計算するのに対して、本実施形態では、D 計算部1205は、Kij 、Qs、およびL’ijを用いてD を計算するが、その他の処理は、第2の実施形態の場合と同じである。
 本実施形態における適応量子化器1023は、量子化パラメータQP、L’ijおよびKij を入力するD 計算部1205によって算出されたKij に対する2乗誤差削減量を用いることにより、第2の実施形態よりも正確に高コスト係数レベルを検出できる。よって、本実施形態の映像符号化装置では、高コスト係数レベルの伝送を防止することによって圧縮効率を低下させない効果がさらに大きくなる。
実施形態4.
 図7 は、第4の実施形態の映像符号化装置における適応量子化器1024の構成を示すブロック図である。適応量子化器1024は、最初に伝送する有意係数レベルの位置から決定されるcoeff_sign_flag の最大ビット数を位置情報ビット数に含める。なお、第4の実施形態の映像符号化装置は、基本的に図1に示されるように構成されるが、適応量子化器1021に代えて、適応量子化器1024が設けられる。
 図7 を参照して、適応量子化器1024の構成を説明する。図7 に示す適応量子化器1024は、係数レベル計算部1201、絶対値情報ビット数計算部(Rabs計算部)1206、位置/符号個数情報ビット数計算部(Rlocate_sign計算部)1207、および高コスト係数レベル検出/除去部1204を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPを入力し、仮係数レベルL’ijを出力する。
 Rabs計算部1206は、L’ijを入力し、絶対値情報ビット数であるRabsを出力する。Rabsは、L’ijの絶対値を示す情報のビット数である。具体的には、Rabsは、有意係数レベルの絶対値が1より大きいか否かを示す情報coeff_abs_level_greater1_flag のビット数、有意係数レベルの絶対値が2より大きいか否かを示す情報coeff_coeff_abs_level_greater2_flag のビット数、および非特許文献1 の9.2.2.8 の記載に基づいて計算される、有意係数レベルの絶対値からcoeff_abs_level_greater1_flag とcoeff_abs_level_greater2_flag とを減じた値の絶対値を示す情報coeff_abs_level_remaining のビット数の和である。
 Rlocate_sign計算部1207は、直交変換係数位置(i, j)を入力し、位置/符号個数情報ビット数であるRlocate_signを出力する。Rlocate_signは、TUのすべての有意係数レベルの周波数軸上での位置を示す情報のビット数である。具体的には、Rlocate_signは、最初に伝送する有意係数レベルの水平位置および垂直位置を示す情報last_significant_xおよびlast_significant_yのビット数、(last_significant_x、last_significant_y)より後続の位置から(0, 0)までの位置における有意係数レベルの有無を示す情報siginificant_coeff_flag のビット数、および有意係数レベルの正負の符号を示す情報coeff_sign_flag の最大ビット数の和である。
 高コスト係数レベル検出/除去部1204は、L’ij、Rabs、およびRlocate_signを入力し、係数レベルLij を出力する。Rlocate_sign が0より大きく、かつRlocate_signがRabsより大きい場合、L’ijを高コスト係数レベルとして検出し、0の値をLij として出力する。そうでない場合は、仮係数レベルL’ijをLij として出力する。
 次に、図8 のフローチャートを参照して、適応量子化器1024の動作を説明する。適応量子化器1024は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 ((3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
 ステップS301で、係数レベル計算部1201は、例えば上記の(1)式を用いて、直交変換係数Kij に対応する仮係数レベルL’ijを計算する。
 ステップS302で、L’ijの値が0でない場合には、ステップS303に移行する。L’ijの値が0である場合には、ステップS306に移行する。
 ステップS303で、Rabs計算部1206は、L’ijの絶対値情報のビット数Rabsを計算する。
 ステップS304で、Rlocate_sign計算部1207は、すでにTU内で非0のLij を出力したか否か判断する。まだ、TU内で非0のLij を出力していない場合には、ステップS305に移行する。すでにTU内で非0のLij を出力した場合には、Rlocate_signの値を0とし、ステップS306に移行する。
 ステップS305で、Rlocate_sign計算部1207は、L’ijの位置に基づいて決定される位置/符号個数情報のビット数Rlocate_signを計算する。
 ステップS306で、高コスト係数レベル検出/除去部1204は、ステップS302でL’ijの値が0であると判定された場合には、係数レベルLij (= 0)を出力する。そうでない場合には、高コスト係数レベル検出/除去部1204は、Rlocate_signが0より大きく、かつRlocate_signがRabsよりも大きい場合、L’ijを高コスト係数レベルとして検出し、0の値をLij として出力する。そうでない場合には、L’ijをLij として出力する。
 本実施形態の適応量子化器1024では、高コスト係数レベル検出/除去部1204が、Rlocate_signが0より大きく、かつRlocate_signがRabsよりも大きい場合、L’ijを高コスト係数レベルとして検出し、0の値をLij として出力することによって、高コスト係数レベルは伝送されない。よって、本実施形態の映像符号化装置は、高コスト係数レベルの伝送を防止することによって、圧縮効率を低下させないようにすることができる。
実施形態5.
 図9 は、第5の実施形態の映像符号化装置における適応量子化器1025の構成を示すブロック図である。適応量子化器1025は、最初に伝送する有意係数レベルの位置から決定されるcoeff_sign_flag の最大ビット数を位置情報ビット数に含める。また、適応量子化器1025は、2乗誤差削減量計算部(D 計算部)1205によって算出されたKij に対する2乗誤差削減量を用いる。なお、第5の実施形態の映像符号化装置は、基本的に図1に示されるように構成されるが、適応量子化器1021に代えて、適応量子化器1025が設けられる。
 図9 に示す適応量子化器1025は、係数レベル計算部1201、絶対値情報ビット数計算部(Rabs計算部)1206、位置/符号個数情報ビット数計算部(Rlocate_sign計算部)1207、高コスト係数レベル検出/除去部1204、および2乗誤差削減量計算部(D 計算部)1205を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPを入力し、仮係数レベルL’ijを出力する。
 D 計算部1205は、量子化パラメータQPとL’ijを入力し、D を出力する。D は、Kij に対する2乗誤差削減量である。本実施形態では、上記の(3)式に示すように、量子化ステップQsの2乗の値とL’ijの2乗の値との積を用いて、2乗誤差削減量D を計算する。
 Rabs計算部1206は、L’ijを入力し、絶対値情報ビット数であるRabsを出力する。Rlocate_sign計算部1207は、直交変換係数位置(i, j )を入力し、位置/符号個数情報ビット数であるRlocate_signを出力する。
 高コスト係数レベル検出/除去部1204は、L’ij、Rabs、Rlocate_signおよびD を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、Rlocate_signとRabsの和に対するDの傾きλを用いる。なお、λは、一様量子化の場合、Qsを用いて、上記の(4)式で示される。
 高コスト係数レベル検出/除去部1204は、L’ijの絶対値が0より大きく、かつ、Rlocate とRvalueとの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
 次に、図10 のフローチャートを参照して、適応量子化器1025の動作を説明する。適応量子化器1025は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 ((3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
 ステップS401で、係数レベル計算部1201は、例えば上記の(1)式を用いて、直交変換係数Kij に対応する仮係数レベルL’ijを計算する。
 ステップS402で、L’ijの値が0でない場合には、ステップS403に移行する。L’ijの値が0である場合には、ステップS407に移行する。
 ステップS403で、D 計算部1205は、直交変換係数に対する2乗誤差削減量であるD を計算する。
 ステップS404で、Rabs計算部1206は、L’ijの絶対値情報のビット数Rabsを計算する。
 ステップS405で、Rlocate_sign計算部1207は、すでにTU内で非0のLij が出力したか判断する。まだ、TU内で非0のLij を出力していない場合には、ステップS406に移行する。すでにTU内で非0のLij が出力した場合には、Rlocate_signを計算せず(Rlocate_signの値を0とし)、ステップS407に移行する。
 ステップS406で、Rlocate_sign計算部1207は、L’ijの位置に基づいて決定される位置/符号個数情報のビット数Rlocate_signを計算する。
 ステップS407で、高コスト係数レベル検出/除去部1204は、ステップS402でL’ijの値が0であると判定された場合には、係数レベルLij (= 0)を出力する。そうでない場合には、高コスト係数レベル検出/除去部1204は、Rlocate_signとRabsの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。高コスト係数レベル検出/除去部1204は、L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
実施形態6.
 図11は、第6の実施形態の映像符号化装置における適応量子化器1026の構成を示すブロック図である。適応量子化器1026は、最初に伝送する有意係数レベルの位置から決定されるcoeff_sign_flag の最大ビット数を位置情報ビット数に含める。また、適応量子化器1026は、Kij に対する2乗誤差削減量を用いる。なお、第6の実施形態の映像符号化装置は、基本的に図1に示されるように構成されるが、適応量子化器1021に代えて、適応量子化器1026が設けられる。
 図11に示す適応量子化器1026は、係数レベル計算部1201、絶対値情報ビット数計算部(Rabs計算部)1206、位置/符号個数情報ビット数計算部(Rlocate_sign計算部)1207、高コスト係数レベル検出/除去部1204、および2乗誤差削減量計算部(D 計算部)1205を有する。
 係数レベル計算部1201は、直交変換係数Kij と量子化パラメータQPを入力し、例えば上記の(1)式を用いて仮係数レベルL’ijを計算し、仮係数レベルL’ijを出力する。
 D 計算部1205は、量子化パラメータQP、L’ij、およびKij を入力し、D を出力する。D は、Kij に対する2乗誤差削減量である。本実施形態では、D 計算部1205は、上記の(5)式に示すように、Kij 、Qs、およびL’ijを用いて、D を計算する。
 Rabs計算部1206は、L’ijを入力し、絶対値情報ビット数であるRabsを出力する。
 Rlocate_sign計算部1207は、直交変換係数位置(i, j)を入力し、位置/符号個数情報ビット数であるRlocate_signを出力する。
 高コスト係数レベル検出/除去部1204は、L’ij、Rabs、Rlocate_sign、およびDを入力し、係数レベルLij を出力する。L’ijの絶対値が0より大きく、かつ、Rlocate_signとRabsの和とλの積が、D 以上の場合には、L’ijを高コスト係数レベルと判断し、0の値をLij として出力する。高コスト係数レベル検出/除去部1204は、L’ijが高コスト係数レベルではない場合には、L’ijをLij として出力する。
 第5の実施形態では、D 計算部1205が、量子化パラメータQPとL’ijとを用いてD を計算するのに対して、本実施形態では、D 計算部1205は、Kij 、Qs、およびL’ijを用いてD を計算するが、その他の処理は、第5の実施形態の場合と同じである。
 なお、上記の各々の実施形態では、すべての非0の仮係数レベルL’ijに対して高コスト係数レベルの検出と除去とが適用されたが、ある閾値(量子化パラメータQPや映像の性質によって変化する任意の値であるが、例えば2)より大きな絶対値の仮係数レベルL’ijが高コスト係数レベルにならないことに着目し、計算量を低減するために、その閾値以下の非0の仮係数レベルL’ijに対してのみ上記の各実施形態における高コスト係数レベルの検出と除去とを適用してもよい。
 また、ある閾値以下の非0の仮係数レベルL’ijにのみ上記の高コスト係数レベルの検出と除去とを適用する場合には、その閾値(例えば2)以下の絶対値の仮係数レベルL’ijのcoeff_abs_level_remaining のビット数がprefix部のTU符号だけで表現されることに着目し、計算量を低減するために、その閾値以下の非0の仮係数レベルL’ijのcoeff_abs_level_remaining のビット数を、L’ijの絶対値からcoeff_abs_level_greater1_flag の値およびcoeff_abs_level_greater2_flag の値を減じた値としてもよい。
 上記の各実施形態では、適応量子化器が、すべての直交変換係数に上記の高コスト係数レベルの検出と除去とを適用したが、イントラ予測された直交変換係数において高コスト係数レベルがほとんど発生しないことに着目し、計算量を低減させるために、適応量子化器は、インター予測された直交変換係数のみに上記の高コスト係数レベルの検出と除去とを適用してもよい。
 上記の各実施形態では、直交変換係数を周波数変換された予測誤差画像としたが、非特許文献1 の7.3.9.11 Residual coding syntaxに示されるtransform_skip_flag が1、すなわち、4×4 TUにおいて周波数変換の代わりに単位行列に基づいた変換が適用された予測誤差画像に本発明の適応量子化器を適用してもよい。
 上記の各実施形態では、位置情報をTUのすべての有意係数レベルの位置を示す情報(last_significant_x、last_significant_y, siginificant_coeff_flagのビット数の総和)としたが、4×4 よりも大きなTU ( 8×8 TU, 16×16 TU, および32×32 TU)においては、位置情報に加えて、非特許文献1の7.3.9.11 Residual coding syntaxの記載に基づいて定義される、16の係数レベルを持つ 4×4 サブブロックにおける有意係数レベル有無を示すcoded_sub_block_flagのビット数を追加してよい。
 また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
 図12に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
 図12に示された情報処理システムにおいて、プログラムメモリ1002には、図1 に示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1 に示された映像符号化装置の機能を実現する。
 図13は、本発明による映像符号化装置の主要部を示すブロック図である。図13に示すように、本発明による映像符号化装置は、画像ブロックを直交変換して直交変換係数を計算する直交変換部11と、直交変換係数を量子化して係数レベルを計算する量子化部12と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化部13とを備え、量子化部12は、画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する位置情報ビット数計算部と、有意な係数レベルの値情報ビット数を計算する値情報ビット数計算部と、位置情報ビット数と値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする高コスト係数レベル検出/除去部とを含む。
 上記の実施形態の一部又は全部は以下の付記のようにも記載されうるが、本発明の構成は以下の構成に限定されない。
(付記1)画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、前記直交変換係数を量子化して係数レベルを計算する量子化手段と、前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、前記量子化手段は、前記画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する位置情報ビット数計算手段と、有意な係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、前記位置情報ビット数と前記値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする高コスト係数レベル検出/除去手段とを含むことを特徴とする映像符号化装置。
(付記2)前記高コスト係数レベル検出/除去手段が、前記位置情報ビット数が前記値情報ビット数よりも大きい場合に、有意な係数レベルを0とする付記1の映像符号化装置。
(付記3)前記量子化手段が、量子化パラメータと前記有意な係数レベルとを用いて、直交変換係数に対する2乗誤差削減量を計算する2乗誤差削減量計算手段を含み、前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる前記有意な係数レベルを0とする付記1または付記2の映像符号化装置。
(付記4)前記2乗誤差削減量計算手段は、前記量子化パラメータ、前記有意係数レベル、および前記直交変換係数を用いて、前記2乗誤差削減量を計算する付記3の映像符号化装置。
(付記5)前記位置情報ビット数計算手段は、前記位置情報ビット数として、伝送順で最初に有意な係数レベルの位置情報ビット数とブロック内のすべての有意な係数レベルの正負の符号を示す情報のビット数との和を計算し、前記値情報ビット数計算手段は、前記値情報ビット数として、前記有意な係数レベルの絶対値の情報のビット数を計算する付記1から付記4のうちのいずれかの映像符号化装置。
(付記6)前記量子化手段は、前記有意な係数レベルの絶対値が所定の閾値以下の場合にのみ、前記高コスト係数レベル検出/除去手段を用いる付記1から付記5のうちのいずれかの映像符号化装置。
(付記7)前記所定の閾値が2以下である付記6の映像符号化装置。
(付記8)前記値情報ビット数計算手段は、前記値情報ビット数に含まれる、2より大きな前記有意係数レベルの絶対値情報から、前記有意係数レベルが1より大きいか否かを示す情報と前記有意係数レベルが2より大きいか否かを示す情報とを減じた値(残りの絶対値情報のビット数)を、前記有意係数レベルの絶対値から2を減じた値とする付記7の映像符号化装置。
(付記9)インター予測された直交変換係数のみに対して、前記高コスト係数レベル検出/除去手段を用いる付記5から付記8のうちのいずれかの映像符号化装置。
(付記10)前記量子化手段は、周波数変換の代わりに、単位行列に基づいた変換が適用された予測誤差画像を量子化して係数レベルを計算する付記5から付記9のうちのいずれかの映像符号化装置。
(付記11) 前記位置情報ビット数計算手段は、 4×4 よりも大きな画像ブロック( 8×8 画像ブロック、16×16画像ブロック、または32×32画像ブロック) において、前記位置情報ビット数に、16の係数レベルをもつ 4×4 サブブロックにおける有意係数レベルの有無を示す情報のビット数を含める付記5から付記9のうちのいずれかの映像符号化装置。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2012年12月27日に出願された日本特許出願2012-285238を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 11  直交変換部
 12  量子化部
 13  エントロピー符号化部
 101  周波数変換器
 1020~1025 適応量子化器
 103  エントロピー符号化器
 104  逆周波数変換/逆量子化器
 105  バッファ
 106  予測器
 107  推定器
 1001 プロセッサ
 1002 プログラムメモリ
 1003 記憶媒体
 1004 記憶媒体
 1201 係数レベル計算部
 1202 値情報ビット数計算部(Rvalue 計算部)
 1203 位置情報ビット数計算部(Rlocate 計算部)
 1204 高コスト係数レベル検出/除去部
 1205 2乗誤差削減量計算部(D 計算部)
 1206 絶対値情報ビット数計算部(Rabs計算部)
 1207 位置/符号個数情報ビット数計算部(Rlocate_sign計算部)

Claims (10)

  1.  画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、
     前記直交変換係数を量子化して係数レベルを計算する量子化手段と、
     前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、
     前記量子化手段は、
     前記画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する位置情報ビット数計算手段と、
     有意な係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、
     前記位置情報ビット数と前記値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする高コスト係数レベル検出/除去手段とを含む
     ことを特徴とする映像符号化装置。
  2.  前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数が前記値情報ビット数よりも大きい場合に、有意な係数レベルを0とする
     請求項1記載の映像符号化装置。
  3.  前記量子化手段は、量子化パラメータと前記有意な係数レベルとを用いて、直交変換係数に対する2乗誤差削減量を計算する2乗誤差削減量計算手段を含み、
     前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる前記有意な係数レベルを0とする
     請求項1または請求項2記載の映像符号化装置。
  4.  前記2乗誤差削減量計算手段は、前記量子化パラメータ、前記有意係数レベル、および前記直交変換係数を用いて、前記2乗誤差削減量を計算する
     請求項3記載の映像符号化装置。
  5.  画像ブロックを直交変換して直交変換係数を計算し、
     前記直交変換係数を量子化して係数レベルを計算し、
     前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する映像符号化方法であって、
     前記係数レベルを計算する際に、
     前記画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算し、
     有意な係数レベルの値情報ビット数を計算し、
     前記位置情報ビット数と前記値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする
     ことを特徴とする映像符号化方法。
  6.  前記所定の条件を、前記位置情報ビット数が前記値情報ビット数よりも大きいことであるとする
     請求項5記載の映像符号化方法。
  7.  前記係数レベルを計算する際に、量子化パラメータと前記有意な係数レベルとを用いて、直交変換係数に対する2乗誤差削減量を計算し、
     前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる前記有意な係数レベルを0とする
     請求項5または請求項6記載の映像符号化方法。
  8.  前記量子化パラメータ、前記有意係数レベル、および前記直交変換係数を用いて、前記2乗誤差削減量を計算する
     請求項7記載の映像符号化方法。
  9.  コンピュータに、
     画像ブロックを直交変換して直交変換係数を計算する処理と、
     前記直交変換係数を量子化して係数レベルを計算する処理と、
     前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する処理とを実行させ、
     前記係数レベルを計算する処理で、
     前記画像ブロックに含まれる伝送順で最初に有意な係数レベルの位置に基づいて決定される位置情報ビット数を計算する処理と、
     有意な係数レベルの値情報ビット数を計算する処理と、
     前記位置情報ビット数と前記値情報ビット数とが所定の条件を満たす有意な係数レベルを0とする処理とを
     実行させるための映像符号化プログラム。
  10.  コンピュータに、
     前記位置情報ビット数が前記値情報ビット数よりも大きい場合に、有意な係数レベルを0とする処理を実行させるための請求項9記載の映像符号化プログラム。
PCT/JP2013/007080 2012-12-27 2013-12-03 映像符号化装置、映像符号化方法および映像符号化プログラム WO2014103182A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014515952A JP5574072B1 (ja) 2012-12-27 2013-12-03 映像符号化装置、映像符号化方法および映像符号化プログラム
BR112015015122A BR112015015122A2 (pt) 2012-12-27 2013-12-03 dispositivo de codificação de vídeo, método de codificação de vídeo e programa de codificação de vídeo
US14/651,466 US10003804B2 (en) 2012-12-27 2013-12-03 Video coding device using quantizing an orthogonal transform coefficient
EP13868141.6A EP2941000B1 (en) 2012-12-27 2013-12-03 Video coding device, video coding method, and video coding program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012285238 2012-12-27
JP2012-285238 2012-12-27

Publications (1)

Publication Number Publication Date
WO2014103182A1 true WO2014103182A1 (ja) 2014-07-03

Family

ID=51020309

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/007080 WO2014103182A1 (ja) 2012-12-27 2013-12-03 映像符号化装置、映像符号化方法および映像符号化プログラム

Country Status (5)

Country Link
US (1) US10003804B2 (ja)
EP (1) EP2941000B1 (ja)
JP (1) JP5574072B1 (ja)
BR (1) BR112015015122A2 (ja)
WO (1) WO2014103182A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105580368B (zh) * 2013-09-30 2018-10-19 日本放送协会 图像编码装置和方法以及图像解码装置和方法
US9930348B2 (en) * 2014-03-14 2018-03-27 Qualcomm Incorporated Coefficient level coding in a video coding process

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010087771A (ja) * 2008-09-30 2010-04-15 Nec Electronics Corp 画像符号化装置及び方法
JP2011509642A (ja) * 2008-01-08 2011-03-24 クゥアルコム・インコーポレイテッド Cabacコーダのためのレート歪みモデリングに基づいた量子化
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置
WO2012075193A1 (en) * 2010-12-03 2012-06-07 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6819803B2 (en) * 2001-07-02 2004-11-16 International Business Machines Corporation Faster lossless rotation of JPEG images
US20120207400A1 (en) * 2011-02-10 2012-08-16 Hisao Sasai Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
PT3145197T (pt) * 2011-10-31 2018-08-10 Samsung Electronics Co Ltd Método e aparelho para determinar um modelo de contexto para a transformação de nível de coeficiente de codificação e descodificação de entropia

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509642A (ja) * 2008-01-08 2011-03-24 クゥアルコム・インコーポレイテッド Cabacコーダのためのレート歪みモデリングに基づいた量子化
JP2010087771A (ja) * 2008-09-30 2010-04-15 Nec Electronics Corp 画像符号化装置及び方法
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置
WO2012075193A1 (en) * 2010-12-03 2012-06-07 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"High efficiency video coding (HEVC) text specification draft 9", JCTVC-K1003 V9, JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 LLTH MEETING, October 2012 (2012-10-01)

Also Published As

Publication number Publication date
BR112015015122A2 (pt) 2017-07-11
EP2941000B1 (en) 2020-11-04
JP5574072B1 (ja) 2014-08-20
US20150319440A1 (en) 2015-11-05
JPWO2014103182A1 (ja) 2017-01-12
EP2941000A1 (en) 2015-11-04
EP2941000A4 (en) 2016-06-08
US10003804B2 (en) 2018-06-19

Similar Documents

Publication Publication Date Title
US11943485B2 (en) Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
JP5537681B2 (ja) 変換ユニット内の複数サインビット秘匿
CN107396116B (zh) 视频编码和解码设备及非暂时性计算机可读存储介质
US11647205B2 (en) Video encoding device, video decoding device, video encoding method, video decoding method, and program using inter prediction
US9609342B2 (en) Compression for frames of a video signal using selected candidate blocks
WO2018123313A1 (ja) 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム
US9838681B2 (en) Apparatus of decoding video data
KR20140064972A (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
WO2015008417A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP5574072B1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
JP5644987B1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
JP4451759B2 (ja) 可逆ビデオ符号化装置,可逆ビデオ符号化方法,可逆ビデオ復号装置,可逆ビデオ復号方法,可逆ビデオ符号化プログラム,可逆ビデオ復号プログラムおよびそれらのプログラムの記録媒体
KR20180040827A (ko) 부호화 유닛의 그룹을 사용하는 비디오 코딩 방법 및 장치

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2014515952

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13868141

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2013868141

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 14651466

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112015015122

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112015015122

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20150623