WO2005081540A1 - 画像符号化方法、その装置及びその制御プログラム - Google Patents

画像符号化方法、その装置及びその制御プログラム Download PDF

Info

Publication number
WO2005081540A1
WO2005081540A1 PCT/JP2005/002243 JP2005002243W WO2005081540A1 WO 2005081540 A1 WO2005081540 A1 WO 2005081540A1 JP 2005002243 W JP2005002243 W JP 2005002243W WO 2005081540 A1 WO2005081540 A1 WO 2005081540A1
Authority
WO
WIPO (PCT)
Prior art keywords
dead zone
image
quantization
width
block
Prior art date
Application number
PCT/JP2005/002243
Other languages
English (en)
French (fr)
Inventor
Keiichi Chono
Yuzo Senda
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to JP2006510197A priority Critical patent/JP4613909B2/ja
Priority to US10/598,154 priority patent/US8743956B2/en
Priority to EP05719145A priority patent/EP1718080A4/en
Priority to CN2005800054937A priority patent/CN1922886B/zh
Publication of WO2005081540A1 publication Critical patent/WO2005081540A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the present invention relates to an image encoding method, an apparatus therefor, and a control program therefor, and more particularly, to an image encoding method for performing adaptive quantization for improving subjective image quality, an apparatus therefor, and a control program therefor.
  • an image frame forming a moving image is divided into a plurality of regions called macroblocks (MB), and encoding is performed on blocks obtained by finely dividing the MB.
  • AVC ISO / IEC 14496-10
  • Figure 2 shows the image frame configuration of Advanced Video Coding
  • the MB is supplied by an intra-frame prediction device 5108 for predicting from within the same image frame reconstructed in the past, or an inter-frame prediction device 5109 for predicting from a previously reconstructed image frame.
  • the predicted value is reduced.
  • the MB signal whose predicted value has been reduced is called a prediction error signal.
  • the prediction error signal is further divided into smaller blocks (hereinafter simply referred to as blocks), and a spatial domain force is also transformed into a frequency domain by an orthogonal transformer 5101.
  • the orthogonal transform coefficient of the block transformed into the frequency domain by the quantization device 5102 is quantized by the quantization step size corresponding to the quantization parameter supplied in MB units from the quantization control device 5103. .
  • the quantization control device 5103 monitors the generated code amount and increases the quantization parameter if the generated code amount is larger than the target code amount. Conversely, the quantization control device 5103 increases the quantization parameter. If it is less than the amount, reduce the quantization parameter. Thus, the moving image can be encoded with the target code amount.
  • the quantized orthogonal transform coefficient is called a quantized transform coefficient, and is a variable-length coding device.
  • Entropy coding is performed by 5104 and output.
  • the quantized transform coefficient is inversely quantized by an inverse quantizer 5105, and inversely orthogonally transformed by an inverse orthogonal transformer 5106 to return to the original spatial domain.
  • the predicted value is added to the block returned to the spatial area and stored in the frame memory 5107.
  • An image frame reconstructed from the stored blocks is called a reference frame.
  • the intra-frame prediction device 5108 is a prediction direction that minimizes the prediction error signal of the current MB from the reference frame
  • the inter-frame prediction device 5109 is that the prediction error signal of the current MB is minimized from the reference frame. Detect a motion vector.
  • the prediction determination switch 5110 compares the prediction error due to the intra-frame prediction with the prediction error due to the inter-frame prediction, and selects a prediction with a small prediction error.
  • the quantization control device 5103 monitors an input image signal and a prediction error signal that are not limited to the generated code amount, and If the visual sensitivity of the MB is high, the quantization parameter is made small (fine quantization), and if the visual sensitivity is low, the quantization parameter is made large (coarse quantization) (the finer the quantization, the better the image quality).
  • the conventional technology has the following three problems.
  • the first problem is that the pictures of each block constituting the MB are not always the same. In such a case, the conventional technology cannot perform quantization suitable for the picture of each block constituting the MB.
  • the second problem is that the individual blocks that make up the MB can be independently intra-frame predicted, or the individual blocks that make up the MB can be inter-frame predicted using independent motion vectors.
  • the performance of minimizing the prediction error differs for each block constituting the MB (hereinafter, referred to as prediction performance).
  • the conventional technology cannot perform quantization suitable for the prediction performance of each block constituting the MB.
  • the third problem is that, for the first and second reasons, the distribution of the orthogonal transform coefficients corresponding to the coordinates inside the block (hereinafter, referred to as the spatial frequency) is different, and the distribution of each block constituting the MB is different. Is not uniform. In such a case, the conventional technology cannot perform quantization suitable for the distribution of orthogonal transform coefficients of each block.
  • the quantization coefficient of the MB is adjusted according to the conversion coefficient having the highest visual sensitivity in the frequency domain within the MB or the block having the highest visual sensitivity in the spatial domain within the MB. Have no power to decide. As a result, other transform coefficients with low visual sensitivity in the frequency domain and blocks with low visual sensitivity in the spatial domain are quantized more than necessary. That is, an unnecessary information amount is assigned to a conversion coefficient having low visual sensitivity.
  • the high-frequency transform coefficients are cut off from the transform coefficients in all the blocks constituting the MB more than the low-frequency transform coefficients, and in the inter-frame prediction, the cutoff of the coefficients is performed.
  • Japanese Patent Application Laid-Open No. 2003-230142 (Document 1) describes a technique for improving the average subjective image quality of the entire image frame by turning it off without transmitting the quantization characteristic additional information.
  • the pattern of the block, the block cannot perform quantization suitable for the prediction performance and the distribution of block transform coefficients.
  • the code amount of the quantization parameter hereinafter referred to as quantization characteristic additional information
  • the present invention has been made in view of the above problems, and has as its object to provide each transform coefficient without using the quantization characteristic additional information, and each block having a plurality of transform coefficients as constituent elements.
  • the aim is to provide high-quality image coding technology by enabling quantization with flexible intensity.
  • an object of the present invention is to provide a transform coding technique that performs quantization on a plurality of transform coefficients with the same quantization width, and visually recognizes transform coefficients in a frequency domain without adding additional information to a bit stream.
  • An object of the present invention is to provide a higher quality image by enabling quantization according to sensitivity.
  • an object of the present invention is to provide a technique of transform coding of an image in which a set of blocks having a plurality of transform coefficients as components is quantized with the same quantization width, and additional information is added to a bit stream.
  • An object of the present invention is to provide a higher-quality image by enabling quantization according to the visual sensitivity of a block in a spatial domain without adding an image.
  • an image encoding method uses a step of generating a transform coefficient by transforming an image from a spatial domain to a frequency domain, and using the same quantization width as at the time of decoding. And a step of quantizing the transform coefficient with a quantization characteristic different from the quantization characteristic at the time of decoding.
  • the image coding apparatus of the present invention uses a transform unit that generates a transform coefficient by transforming an image from a spatial domain to a frequency domain, and uses the same quantization width as that used for decoding, And a quantization means for quantizing the transform coefficient with a quantization characteristic different from the quantization characteristic.
  • control program for image encoding uses a computer that converts an image into a spatial domain and a frequency domain to generate transform coefficients, and uses the same quantization width as used in decoding.
  • present invention is characterized in that it functions as a quantization means for quantizing a transform coefficient with a quantization characteristic different from the quantization characteristic at the time of decoding. The invention's effect
  • a means for setting a visual sensitivity in a frequency domain of a transform coefficient and a dead zone width according to a visual sensitivity in a spatial domain of a block having a plurality of transform coefficients as components This provides a quantization function according to the visual sensitivity of the transform coefficient in the frequency domain and the visual sensitivity in the spatial domain of a block having a plurality of transform coefficients as components.
  • the transform coefficient having low visual sensitivity in the frequency domain and the code amount wastedly consumed in blocks having low visual sensitivity in the spatial domain Can be reduced. Due to the reduction in the code amount, the quantization of the entire image frame becomes finer than in the conventional method, and a transform coefficient having high visual sensitivity in the frequency domain and a block having high visual sensitivity in the spatial domain are encoded with high image quality. .
  • FIG. 1 is a diagram showing a configuration of a conventional technique.
  • FIG. 2 is a diagram showing an image frame (only a luminance signal when the resolution is QCIF).
  • FIG. 3 is a diagram showing an example of the configuration of the first embodiment.
  • FIG. 4 is a flowchart of dead zone generation.
  • FIG. 5 is a flowchart for generating a block dead zone scale.
  • FIG. 6 is a quantization flow chart for one orthogonal transform coefficient.
  • FIG. 7 is a diagram showing quantization characteristics (quantization step size q) of the conventional method.
  • FIG. 10 is a view for explaining effects of the present invention.
  • a indicates the complexity of each block (the smaller the value, the flatter)
  • b indicates the quantization intensity according to the prior art
  • c indicates the quantization intensity according to the present invention.
  • the quantization intensity of MB is 20.
  • FIG. 11 is a diagram illustrating an example of a configuration of a second embodiment.
  • Replacement form (Rule 26)
  • FIG. 12 is a diagram showing an example of a configuration of a spatial frequency dead zone scale generation device.
  • FIG. 13 is an operation flowchart of the spatial frequency device characteristic type setting device.
  • FIG. 14 is a view for explaining effects of the present invention.
  • d indicates a block spatial frequency characteristic type inside MB
  • e indicates a quantization type according to the related art
  • f indicates a quantization type according to the present invention.
  • “1” is a bidirectional prediction block
  • “2” is a non-isolated motion block
  • “3” is a normal motion block.
  • FIG. 15 is a diagram showing quantization intensity characteristics for each type (only in the horizontal direction in a block).
  • FIG. 16 is a diagram showing an example of the configuration of the third embodiment.
  • FIG. 17 is a diagram showing an example of a configuration of a hybrid dead zone scale generation device.
  • FIG. 18 is a diagram showing an example of the configuration of the fourth embodiment.
  • FIG. 19 is an operation flowchart of the gap correction dead zone scale generation device.
  • FIG. 20 is a diagram showing a configuration of an information processing apparatus using the present invention.
  • a dead zone is generated using the same quantization width as at the time of decoding by using a dead zone generation device 201 and a block dead zone scale generation device 202 as shown in FIG.
  • Each transform coefficient is quantized with a quantization characteristic different from the quantization characteristic at the time of decoding by quantizing each transform coefficient using the quantization coefficient.
  • the visual sensitivity of the transform coefficient in the frequency domain and the multiple transform coefficients are obtained. It is possible to provide a quantization function according to the visual sensitivity in the spatial domain of a block including a coefficient as a component, and further reduce the code amount.
  • a conversion coefficient having a high visual sensitivity in the frequency domain, or a high visual sensitivity in the spatial domain, and a low visual sensitivity in a frequency domain in which the dead zone width becomes narrower in the block, the conversion coefficient, or the spatial domain The lower the visual sensitivity, the wider the dead zone width is set for a block.
  • the width of the dead zone is adaptively changed according to the flatness of the image.
  • the flatness of the image is determined by the prediction mode of the image, the direction of intra-frame prediction of the image, the motion of the image, the direction of inter-frame prediction of the image, the average absolute value error of the image, the variance of the image, and the maximum value of the image. It is calculated from at least one of the difference between the minimum values, the average absolute value error of the image prediction error signal, and the variance of the image prediction error signal.
  • FIG. 3 is an example showing the configuration of the first embodiment.
  • an image frame constituting a moving image is divided into a plurality of regions called macroblocks (MB), and coding is performed on blocks obtained by finely dividing the MB. .
  • MB macroblocks
  • the MB is an intra-frame prediction device 108 that predicts from within the same image frame reconstructed in the past or an inter-frame prediction device 109 that predicts from an image frame reconstructed in the past. The value is reduced.
  • the MB signal whose predicted value has been reduced is called a prediction error signal.
  • the prediction error signal is further divided into smaller blocks (hereinafter simply referred to as blocks), and is transformed by the orthogonal transformer 101 into a spatial domain force frequency domain.
  • the orthogonal transform coefficients of the block transformed into the frequency domain are quantized by the quantization device 102 at a quantization step size corresponding to the quantization parameter.
  • the quantization parameter is supplied from the quantization control device 103 to the quantization device 102 in MB units.
  • the quantization control device 103 monitors the generated code amount, and if the generated code amount is larger than the target code amount, increases the quantization parameter if the generated code amount is larger than the target code amount. If less, the quantization parameter is reduced.
  • the moving image can be encoded with the target code amount.
  • the quantized orthogonal transform coefficient is called a quantized transform coefficient, and is a variable-length coding device.
  • the quantized transform coefficients are inversely quantized by the inverse quantizer 105, subjected to inverse orthogonal transform by the inverse orthogonal transformer 106, and returned to the original spatial domain.
  • the predicted value is added to the block returned to the spatial area and stored in the frame memory 107.
  • the image frame reconstructed from the stored blocks is called a reference frame.
  • the intra-frame prediction device 108 minimizes the prediction error signal of the current MB from the reference frame
  • the inter-frame prediction device 109 minimizes the prediction error signal of the current MB from the reference frame. Detect a motion vector.
  • the prediction determination switch 110 compares the prediction error due to the intra-frame prediction with the prediction error due to the inter-frame prediction, and selects a prediction with a small prediction error.
  • the quantization device 102 uses a dead zone when quantizing the orthogonal transform coefficient supplied from the orthogonal transform device 101. Dead zone means that the output corresponding to an input near 0 (zero) is set to 0 (zero). The range of input for performing such operations is called the dead zone width.
  • the quantization device 102 sets the output obtained by quantizing the orthogonal transform coefficient, that is, the quantized transform coefficient to 0 (zero).
  • the dead zone width is generated by dead zone generating device 201 and block dead zone scale generating device 202.
  • the block dead zone scale generation device 202 receives the image signal and the prediction error, analyzes the picture or prediction performance of the target block, and generates a dead zone scale suitable for the picture and prediction performance of the block. Output to the device 201.
  • the dead zone generation device 201 receives the dead zone scale from the block dead zone scale generation device 202 and the MB quantization parameter from the quantization control device 103 as inputs, and obtains a dead zone from the dead zone scale and the MB quantization parameter.
  • the zone width is calculated, and the dead zone width is output to the quantization device 102.
  • the dead zone width is obtained by multiplying the dead zone scale by the MB quantization parameter. Therefore, the dead zone scale is a coefficient of the MB quantization parameter used to determine the dead zone width.
  • the size of the image frame is set to QCIF (176 x 144) size
  • the size of MB is set to 16 x 16 size
  • the size of the block constituting MB is set to 4 x 4 size.
  • a dead zone generation device 201 a block dead zone scale generation device 202, and a quantization device 102 accompanied by a change in internal operation by the dead zone generation device 201, which are features of the present embodiment, will be described. I do.
  • the input / output and operation of the dead zone generation device 201 will be described below.
  • the input of the dead zone generation device 201 is a dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ ) corresponding to the b-th block in the raster scan order of the MB currently targeted by the quantization device 102. 15, 0 ⁇ 3, 0 ⁇ j ⁇ 3), with the quantization parameter mb--q supplied from the quantization controller 103. is there.
  • the output of the dead zone generation device 201 is the orthogonal transform coefficient co b, i, j of the b-th block in the raster scan order in the MB currently targeted by the quantization device 102 (0 ⁇ b ⁇ 15, The dead zone width dz (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) corresponding to 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the operation of the dead zone generation device 201 will be described below with reference to FIG.
  • a reference dead zone base_dz (i, j) (0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) is calculated from the quantization parameter mb_q.
  • the calculation method of the reference dead zone is such that the encoding device to which the present invention is connected (hereinafter referred to as a base encoder) uses a quantization matrix WM (i, j) (0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3). ) Depends on whether or not to use.
  • the quantization matrix is a weighting parameter (quantization additional information) according to a spatial frequency for division in quantization and multiplication in inverse quantization.
  • the quantization width for each spatial frequency can be made variable.
  • the quantization step size q_step_table [q] is a quantization step size corresponding to the quantization parameter q defined by the base encoder (Q_MIN ⁇ p ⁇ Q_MAX, Q_MIN and Q_MAX also depend on the base encoder) .
  • step S101A a reference dead zone base_dz (i, j) is calculated by equation (1).
  • step S101B a reference dead zone base_dz (i, j) is calculated by equation (2).
  • base— dz (i, j) mb—q—step (2)
  • step S102 the dead zone width dz (i, j) is calculated from the reference dead zone base_dz (i, j) and the dead zone scale dz_scale (b, i, j) according to equation (3).
  • dead zone width dz (b, i, j) can be set arbitrarily by the value of the dead zone scale dz_scale (b, i, j).
  • the dead zone scale generation device 202 generates a dead zone scale suitable for the picture or prediction performance of each block having a plurality of transform coefficients as constituent elements.
  • the input to the block dead zone scale generating device 202 is an input image signal org (b, i, j) (b, i, j) corresponding to the b-th block in the raster scan order of the MB currently targeted by the quantizing device 102. 0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) and prediction error signal pd (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) is there.
  • bit precision of the input signal is n bits without sign.
  • the output of the block dead zone scale generator 202 is a dead zone scale dz-scale (b, i, j) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantizer 102. (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the block dead zone scale generator 202 uses the signal used to generate the dead zone scale as an image feature signal im b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ 3, 0 ⁇ j ⁇ 3)
  • block dead zone scale generating apparatus 202 Referring to FIG. 5, the operation of block dead zone scale generating apparatus 202 will be described.
  • step 301 an image feature signal is selected. There are three choices below.
  • the quantization control device 102 of the base encoder determines a quantization parameter using an input image signal other than the generated code amount
  • the quantization control device 102 inputs the image feature amount signal im b, i, j). Connect the force image signal org (b, i, j).
  • the quantization controller 102 of the base encoder determines the quantization parameter using the prediction error signal pd in addition to the generated code amount and the input image signal, the image feature amount signal im b, i , j) is connected to the prediction error signal pd (b, i, j).
  • step 302 the average absolute value error LlAC (b) corresponding to each block number b (0 ⁇ b ⁇ 15)
  • abs (x) is a function that returns the absolute value of the input x.
  • the average absolute value error L1AC (b) (l ⁇ LlAC (b) ⁇ n) indicates the distribution of the image feature signal within the block b.
  • step 303 the block complexity bcm (b) (0 ⁇ b ⁇ 15) corresponding to each block number b (0 ⁇ b ⁇ 15) is calculated using equation (6).
  • max (x, y) is a function that returns the magnitude of the value of the input x, y! /.
  • the quantization intensity can be set according to the visual sensitivity of the block in the spatial domain (picture / predictability).
  • step 304 the block dead zone scale bdz_scale (b) (0 ⁇ b ⁇ 15) corresponding to each block number b (0 ⁇ b ⁇ 15) is calculated using equation (7).
  • bdz_scale (b) clip (bdz_limit, (bcm (b) / min— bcm)) ⁇ ⁇ )
  • Parameter, clip (x, y) is the function that returns the value of input x, y which is smaller! /
  • Min (bcm (b) is bcm (b) This function returns the minimum value of (l ⁇ bcm (b) ⁇ n) .
  • the block dead zone scale is calculated in consideration of the complexity around the block. Then, the following equation (7A) may be used instead of equation (7)!
  • locaLbcm (b) is a function that returns the minimum bcm value of the target block b and its surrounding blocks
  • min (local_bcm (b) is a function that returns the minimum value of local_bcm (b) (l ⁇ bcm (b) ⁇ n) It is.
  • step 305 the dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ ) corresponding to each block number b (0 ⁇ b ⁇ 15) is calculated using equation (9). 3. Set the block dead zone scale bdz_scale (b) to 0 ⁇ j ⁇ 3).
  • the dead zone scale dz_scale of the block with low visual sensitivity in the spatial region where the visual sensitivity is high and the block dead zone scale dz_scale is small in the spatial region is large.
  • the pixel range of the block (the maximum pixel value and the minimum pixel Value difference) may be used. That is, any information may be used as long as the complexity of the block can be obtained.
  • the input of the quantization device 102 is a dead zone width dz (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) supplied from the dead zone generation device 201.
  • dz dead zone width
  • Orthogonal transform coefficients co b, i, j) supplied from the orthogonal transformer 101 (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3)
  • the quantizer supplied from the quantization controller 103 Parameter mb_q.
  • the output of the quantization device 102 is a quantized transform coefficient q_cof (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the input / output added to the conventional configuration is only the input dead zone width dz (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the output value of the quantization conversion coefficient q_co b, i, j) differs from the conventional method due to the influence of the operation described below.
  • step S201 it is compared whether the absolute value abs_col of the orthogonal transform coefficient co b, i, j) is smaller than the dead zone width dz (b, i, j). If it is smaller, step S202 is executed. Otherwise, step S203 is executed.
  • step S202 the quantized transform coefficient q_cof (b, i, j) is set to 0.
  • step S203 a quantized transform coefficient q_cof (b, i, j) is obtained by the following calculation method.
  • the method of calculating the quantized transform coefficients differs depending on whether or not the base encoder uses the quantization matrix WM (i, j) (0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3). Each step will be described below with step S203A if the quantization matrix is used, and S / B if so!
  • the quantization step size q_step_table [q] is a quantization step size corresponding to the quantization parameter q defined by the base encoder (Q_MIN ⁇ p ⁇ Q_MAX, Q_MIN and Q_MAX also depend on the base encoder) .
  • step S203A the quantized transform coefficient q_cof (b, i, j) is calculated by equation (10A).
  • abs (x) is a function that returns the absolute value of the input x
  • f is a parameter that depends on the base encoder and is less than 1, which is 0.5 if rounded off and 0 if truncated.
  • step S203B the quantized transform coefficient q_cof (b, i, j) is calculated by equation (10B).
  • abs (x) is a function that returns the absolute value of the input x
  • f is a parameter that depends on the base encoder and is less than 1, which is 0.5 for rounding and 0 for truncation.
  • Quantization for one MB is completed by applying ⁇ 3).
  • the quantization characteristic means the relationship between the input cof to the quantization device 102 and the output icof of the inverse quantization device 105.
  • the output i_coi3 ⁇ 4S0 of the input cof smaller than 2q is obtained by quantizing the quantization step size four times.
  • the visual sensitivity of a block is controlled by controlling the dead zone width dz in consideration of the pattern of the block, the prediction performance of the block, or the distribution of orthogonal transform coefficients in the block, which is simply determined by the prediction mode of the block.
  • quantization optimal for the visual sensitivity of the transform coefficients in the block can be realized.
  • the dead zone scale dz_scale supplied by the block dead zone scale generation device 202 of Embodiment 1 of the present invention can be controlled in consideration of the prediction performance of the picture / block of the block without adding the quantization additional information. That is, the quantization strength can be set according to the visual sensitivity of the block in the spatial domain as shown in FIG. According to the present invention, it is possible to set a quantization strength suitable for the visual sensitivity of a block in a spatial domain, and it is possible to reduce an unnecessary code amount generated in the block having a low visual sensitivity. As a result, the generated code amount of the entire image frame is also reduced, and the quantization parameter of the entire image frame is reduced. As a result, quantization of a block having high visual sensitivity in the spatial domain becomes finer than in the conventional method, and coding is performed with higher image quality.
  • FIG. 11 shows the configuration of Embodiment 2 of the present invention.
  • the configuration of the second embodiment includes a spatial frequency dead zone scale generator 203 instead of the block dead zone scale generator 202 in the configuration of the first embodiment.
  • the spatial frequency dead zone scale generator 203 generates a dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) to the dead zone generator 201
  • the present invention can be applied to other sizes.
  • the spatial frequency dead zone scale generating device 203 generates a dead zone scale suitable for the distribution of the orthogonal transform coefficients of each block constituting the MB.
  • the input to the spatial frequency dead zone scale generator 203 is an input image signal org (b, i, j) corresponding to the b-th block in the raster scan order of the MB currently targeted by the quantizer 102. (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3), prediction mode mode (b) (0) corresponding to the b-th block in the raster scan order of the MB currently targeted by quantizer 102 ⁇ b ⁇ 15) Mv (b, dir) (0 ⁇ b ⁇ 15, 0 ⁇ dir ⁇ l).
  • dir indicates the direction of the motion vector, where 0 is the horizontal direction and 1 is the vertical direction.
  • the prediction mode includes an intra-frame prediction mode (0 motion vectors) for prediction from within the same image frame, and an inter-frame prediction mode for prediction of one past or future image frame.
  • the output of the spatial frequency dead zone scale generator 203 is a dead zone scale dz_scale (b, i, j) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantizer 102. (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the input / output of the spatial frequency dead zone scale generation device 203 has been described above.
  • FIG. 12 shows the internal configuration of the spatial frequency dead zone scale generation device 203, and its operation will be described.
  • the spatial frequency dead zone scale generating device 203 includes a spatial frequency characteristic setting device 2031 and a dead zone scale device 2032 for each characteristic type.
  • the spatial frequency characteristic setting device 2031 uses the input image, prediction mode, and motion vector to calculate the distribution of the orthogonal transform coefficient of the b-th block in the raster scan order of the MB currently targeted by the quantization device 102. Outputs the characteristic type type (b) (0 ⁇ b ⁇ 15, 0 ⁇ type (b) ⁇ 3) according to.
  • spatial frequency characteristic setting device 2031 With reference to FIG. 13, the operation of spatial frequency characteristic setting device 2031 will be described.
  • step S4101 it is determined whether the prediction mode of block b is intra-frame prediction.
  • step S41011 is executed.
  • Range max_v (o, i, j) —mm—v (b, i, j) (12)
  • max_v (b, i, j) is a function that returns the largest pixel value org (b, i, j) (0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) of block b
  • min_v (b, i, j) is a function that returns the minimum pixel value org (b, i, j) (0 ⁇ 3, 0 ⁇ j ⁇ 3) of block b.
  • the block is flat or textured, it is desirable to quantize the transform coefficient of the low-frequency component in the block finely and coarsely quantize the transform coefficient of the high-frequency component.
  • step S4102 it is determined whether the prediction mode of block b is the bidirectional prediction mode.
  • the inside of the bidirectional prediction block is a pan area or a still area, and has high visual sensitivity.
  • the prediction error signal having a small power is noise generated by compressing a future or past frame, it is better to set the quantization strength at which the power is small and the prediction error signal is reduced!
  • abs (x) is a function that returns the absolute value of the input x
  • u_mv (b, dir) is a function that returns the motion vector mv in the dir direction of the block adjacent above block b
  • l_mv (b, dir) is This function returns the motion vector mv in the dir direction of the block adjacent to the left side of block b.
  • the non-isolated motion block is a pan area or a still area and has high visual sensitivity.
  • the prediction error signal having a small power is noise generated by compressing a frame in the future or the past, the quantization power for reducing the power and reducing the prediction error signal is good.
  • the characteristic-type dead zone scale device 2032 is a characteristic type type (b) corresponding to the b-th block in the raster scan order of the MB currently targeted by the quantization device 102 supplied by the spatial frequency characteristic setting device 2031.
  • the dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) of the b-th block is calculated.
  • the calculation method of the dead zone scale of block b according to the characteristic type (from typeO to 3) is shown below.
  • B0, Bl, B2, B3, and B4 are predetermined parameters.
  • B0 (i, j) ⁇ 0, 1.1, 1.3, 1.6 ⁇ , ⁇ 1.1, 1.3, 1.6, 1.8 ⁇ , ⁇ 1.3, 1.6, 1.8, 2.0 ⁇ , ⁇ 1.6, 1.8, 2.0,2.8 ⁇
  • B3 (x) ⁇ 0, 1.1, 1.3, 1.4 ⁇ , ⁇ 1.1, 1.3, 1.4, 1.6 ⁇ , ⁇ 1.3, 1.4, 1.6, 1.8 ⁇ , ⁇ 1.4, 1.6, 1.8, 2.0 ⁇ , with the relationship B4>B1>B2> 1.
  • the block width bw is a numerical value other than 4 in the present embodiment, it is shown that the values of B0 and B3 can be calculated by Expression (19).
  • K (i, j) is also a large value depending on the spatial frequency (i, j) .
  • the prediction mode in the intra-frame prediction mode and the prediction direction pred_dir can be supplied from the prediction determination 110, the prediction The inclination of type (0) should be changed according to the direction (vertical, horizontal, diagonal, etc.) of the direction pred_dir. For example, if the prediction direction is horizontal, the pattern inside the block is flat in the horizontal direction, and the quantization coefficient of the conversion coefficient corresponding to the frequency in the horizontal direction i is calculated from the conversion coefficient of the frequency in the vertical direction j. It is better to generate a dead zone scale dz_scale that quantizes finely
  • the dead zone width according to the distribution of the transform coefficient of each block can be set by the dead zone scale dz_scale supplied by the spatial frequency dead zone scale generation device 203. That is, as shown in FIGS. 14 and 15, it is possible to perform quantization in consideration of visual sensitivity in the frequency domain of each transform coefficient without adding quantization additional information.
  • a dead zone is set according to the distribution of transform coefficients of each block, and as a result, it is possible to reduce the generated code amount of transform coefficients with low visual sensitivity in the frequency domain. As a result, the generated code amount of the entire image frame is also reduced, and the quantization parameter of the entire image frame is reduced. As a result, a transform coefficient having high visual sensitivity in the frequency domain is quantized more finely than in the conventional method, and it is possible to perform encoding with higher image quality.
  • Example 3 of the present invention will be described.
  • FIG. 16 shows the configuration of Embodiment 3 of the present invention.
  • the configuration of the third embodiment includes a hybrid dead zone scale generation device 204 instead of the block dead zone scale generation device 202 in the configuration of the first embodiment.
  • Spatial frequency dead zone scale generator 203 Dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) corresponding to the b-th block in the raster scan order of the image frame Supply to
  • the size of the image frame is set to QCIF (176 x 144) size
  • the size of MB is set to 16 x 16 size
  • the size of block constituting MB is set to 4 x 4 size.
  • the hybrid dead zone scale generation device 204 generates a dead zone scale suitable for the picture of each block, the prediction performance of each block, and the distribution of the orthogonal transform coefficient of each block.
  • the input to the hybrid dead zone scale generator 204 is a prediction mode mode (b) (0 ⁇ b ⁇ 15) corresponding to the b-th block in the raster scan order of the MB currently targeted by the quantizer 102.
  • Motion vector mv (b, dir) (0 ⁇ b ⁇ 15, 0 ⁇ dir ⁇ l)
  • input image signal org (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3)
  • the prediction error signal pd (b, i, j) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the output of the hybrid dead zone scale generator 204 is a dead zone scale dz—scale (b, i, j) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantizer 102. ) (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • FIG. 17 shows the internal configuration of the hybrid dead zone scale generator 204, and its operation will be described below.
  • the hybrid dead zone generation device 204 as shown in FIG. 17 includes a block dead zone scale generation device 202, a spatial frequency dead zone scale generation device 203, and a mixer 2041.
  • the block dead zone scale generation device 202 is a spatial frequency dead zone according to the first embodiment.
  • the scale generation device 203 is as described in the second embodiment.
  • the input to the mixer 2041 is a dead zone scale ldz_scale l (b, b) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantization device 102 supplied by the block dead zone device 202.
  • the output of the mixer 2041 is a dead zone scale dz_scale (b, i, j) (0 ⁇ b ⁇ 15) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantizer 102. , 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • the mixer 2041 calculates the dead zone scale dz.scale (b, i, j) according to the characteristic type type (b) of the block b.
  • dz_scale (b, i, j) dz_scalel (b, i, j) X dz_scale2 (b, i, j) (20)
  • dz_scale (b, i, j) dz_scalel (b, i, j) X dz_scale2 (b, i, j) (20)
  • the visual sensitivity (pattern, prediction performance) in the spatial region of the block, and the It enables quantization suitable for visual sensitivity (distribution) in the frequency domain of transmutation coefficients.
  • the generated code amount of the entire image frame is also reduced, and the quantization parameter of the entire image frame is reduced.
  • a block having a high visual sensitivity in the spatial domain and a transform coefficient having a high visual sensitivity in the frequency domain are quantized more finely than in the conventional method, and encoding can be performed with higher image quality.
  • Example 4 of the present invention will be described.
  • FIG. 18 shows the configuration of Example 4 of the present invention.
  • the configuration of the fourth embodiment includes a gap correction dead zone scale generation device 205 instead of the block dead zone scale generation device 202 in the configuration of the first embodiment.
  • the gap correction dead zone scale generation device 205 is a dead zone scale dz_scale (b, i, j) corresponding to the b-th block in the raster scan order of the image frame (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3) is supplied to the dead zone generator 201.
  • the size of the image frame is
  • the present invention can be applied to other sizes.
  • the input to the gap correction dead zone scale generation device 205 is supplied from the quantization control device 103, the actual quantization parameter mb_q of the MB currently targeted by the quantization device 102, and the quantization control device 103. This is the ideal quantization parameter ideaLq of the MB currently targeted by the quantizer 102 to be implemented.
  • the output of the gap correction dead zone scale generation device 205 is the dead zone scale dz_scale (b, i, j) corresponding to the b-th block in the raster scan order within the MB currently targeted by the quantization device 102. (0 ⁇ b ⁇ 15, 0 ⁇ i ⁇ 3, 0 ⁇ j ⁇ 3).
  • step S501 the gap quantization width qstep_gap of the real quantization parameter mb_q and the ideal quantization parameter ideaLq is calculated using Expression (22).
  • the quantization step size q_st mark _table [q] is a quantization step size corresponding to the quantization parameter q defined by the base encoder (Q_MIN ⁇ p ⁇ Q_MAX, Q_MIN and Q--MAX are also included). Base encoder dependent).
  • step S502 the dead zone scale dz_scale (b, i, j) is calculated from the gap quantization width qstep_gap using Expression (23).
  • the first is that the prediction mode of the MB selected by the prediction decision of the base encoder 110 cannot transmit the difference between the quantization parameter of the current MB or the quantization parameter of the previous MB, and This is the case where the ideal MB quantization parameter of the quantization control device 103 of the encoder is larger than the actual MB quantization parameter.
  • the base encoder has a limitation on the difference delta_mb_Q from the quantization parameter of the previous MB that can be transmitted for each MB (for example, -2 ⁇ delta_mb_Q ⁇ 2), and This is a case where the ideal MB quantization parameter of the quantization control device 103 of the encoder is larger than the actual MB quantization parameter.
  • Example 5 of the present invention will be described.
  • the image encoding apparatus can also be realized by a computer program that can be configured by hardware.
  • FIG. 20 is a general block configuration diagram of an information processing system that implements the moving picture coding apparatus according to the present invention.
  • the information processing system (computer) shown in FIG. 20 includes a processor A1001, a program memory A1002, and storage media A1003 and A1004.
  • the storage media A1003 and A1004 may be separate storage media or storage areas having the same storage medium power.
  • a magnetic storage medium such as a hard disk can be used.
  • the present invention relates to an image transform coding technique, in which the visual sensitivity in the frequency domain of transform coefficients and the visual sensitivity in the spatial domain of a block having a plurality of transform coefficients as components are improved.
  • Means for setting a corresponding dead zone width, whereby quantization according to the visual sensitivity in the frequency domain of the transform coefficient and the visual sensitivity in the spatial domain of a block having a plurality of transform coefficients as components is provided. It is possible to provide functions.
  • the present invention wastefully consumes conversion coefficients having low visual sensitivity in the frequency domain and blocks having low visual sensitivity in the spatial domain without depending on the quantization width determined by the quantization parameter.
  • the amount of code that has been used can be reduced, and by reducing the amount of code, the quantization of the entire image frame becomes more intense than in the conventional method, and the conversion coefficient with high visual sensitivity in the frequency domain and the high visual sensitivity in the spatial domain
  • the blocks are coded with high quality.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 ブロックデッドゾーンスケール生成装置(202)は、画像信号と予測誤差とを入力とし、対象ブロックの絵柄あるいは予測性能を解析し、前記ブロックの絵柄、予測性能に適したデッドゾーンスケールを出力する。デッドゾーン生成装置(201)は、ブロックデッドゾーンスケール生成装置(202)からのデッドゾーンスケールと量子化制御装置(103)からのMB量子化パラメータを入力とし、前記ゾーンスケールとMB量子化パラメータからデッドゾーン幅を計算して、このデッドゾーン幅を出力する。量子化装置(102)は、直交変換装置(101)から供給される直交変換係数に対して、デッドゾーン生成装置(201)からのデッドゾーンを用いて量子化を行い、量子化変換係数を出力する。   これにより、量子化特性付加情報を利用することなく、変換係数毎、複数の変換係数を構成要素とするブロックごとに自在な強度の量子化を可能とし、高画質な画像符号化技術を提供することができる。

Description

明 細 書
画像符号化方法、その装置及びその制御プログラム
技術分野
[0001] 本発明は、画像符号化方法、その装置及びその制御プログラムに関し、特に主観 画質改善のための適応量子化を行なう画像符号化方法、その装置及びその制御プ ログラムに関する。
背景技術
[0002] 図面を参照して従来の技術を説明する。
[0003] 以下では、図 1を参照して従来技術の 1つである直交変換装置と予測装置 (フレー ム内予測/フレーム間予測)に基づいたハイブリッド動画像符号化を説明する。
[0004] 従来技術では、動画像を構成する画像フレームを複数のマクロブロック (MB)とよば れる領域に分割し、さらに前記 MBを細力べ分割したブロックに対して符号ィ匕を行う。 従来技術の具体的な画像フレームの構成例として、 AVC(ISO/IEC 14496-10
Advanced Video Coding)の画像フレーム構成を図 2に示す。
[0005] 前記 MBは、過去に再構築された同一画像フレーム内から予測するフレーム内予 測装置 5108、あるいは過去に再構築された過去の画像フレームから予測するフレー ム間予測装置 5109が供給する予測値が減じられる。前記予測値が減じられた MBの 信号を予測誤差信号と呼ぶ。
[0006] 前記予測誤差信号は、さらに細かいブロック(以後に単純にブロックと呼ぶ)に分割 されて、直交変換装置 5101によって空間領域力も周波数領域に変換される。
[0007] 量子化装置 5102によって、前記周波数領域に変換されたブロックの直交変換係数 は、量子化制御装置 5103より MB単位で供給する量子化パラメータに対応する量子 ィ匕ステップサイズで量子化される。
[0008] 一般に前記量子化制御装置 5103は、発生符号量を監視して発生符号量が目標の 符号量よりも多いようであれば量子化パラメータを大きくし、逆に発生符号量が目標 の符号量よりも少な 、ようであれば量子化パラメータを小さくする。これによつて動画 像を目標符号量で符号化できる。 [0009] 前記量子化された直交変換係数は量子化変換係数とよばれ、可変長符号化装置
5104によってエントロピー符号ィ匕されて出力される。
[0010] 以降の符号化のために、前記量子化変換係数は、逆量子化装置 5105で逆量子化 され、さらに逆直交変換装置 5106によって逆直交変換されて元の空間領域に戻され る。
[0011] 前記空間領域に戻されたブロックには、前記予測値が加えられフレームメモリ 5107 に格納される。前記格納されたブロックで再構成される画像フレームを参照フレーム と呼ぶ。
[0012] フレーム内予測装置 5108は、前記参照フレームから現 MBの予測誤差信号を最小 とする予測方向、一方のフレーム間予測装置 5109は、前記参照フレームから現 MB の予測誤差信号を最小とする動きベクトルを検出する。予測判定スィッチ 5110は、前 記フレーム内予測による予測誤差とフレーム間予測による予測誤差を比較し、予測 誤差が小なる予測を選択する。
[0013] 以上の処理によって圧縮された動画像の主観画質を保っために、前記量子化制 御装置 5103は、発生符号量だけでなぐ入力画像信号や予測誤差信号を監視して、 量子化対象の MBの視覚感度が高ければ量子化パラメータを小さく(量子化を細力べ )、低ければ量子化パラメータを大きく(量子化を粗く)する(量子化が細か 、ほど画 質がよい)。
[0014] AVCなどの従来技術では、伝送する量子化パラメータの情報量を削減するために 、 1つの MBに対して 1つの量子化パラメータしか伝送できない制約がある。
[0015] この制約により、 MBを構成するブロックのすべての直交変換係数を (輝度信号では 256個の係数を)、同じ量子化幅すなわち量子化特性で量子化する。
[0016] このため、従来技術には以下の 3つの課題がある。
[0017] 第 1の問題に、 MBを構成する各ブロックの絵柄が同一とは限らない。このような場 合にぉ 、て、従来技術では MBを構成する各ブロックの絵柄に適した量子化ができ ない。
[0018] 第 2の問題に、 MBを構成する個々のブロックが独立のフレーム内予測、あるいは MBを構成する個々のブロックが独立の動きベクトルによってフレーム間予測が可能 な動画像符号ィ匕において、 MBを構成するブロックごとに予測誤差を最小化する性 能が異なる(以後、予測性能と呼ぶ)。このような場合において、従来技術では MBを 構成する各ブロックの予測性能に適した量子化ができない。
[0019] 第 3の問題に、第 1および第 2の理由により、ブロック内部の座標(以後、空間周波 数とよぶ)に対応する直交変換係数の分布が異なり、 MBを構成する各ブロックでそ の分布が一様とならない。このような場合において、従来技術では各ブロックの直交 変換係数の分布に適した量子化ができな 、。
[0020] これらの問題により、従来技術では、 MB内で最も周波数領域で視覚感度の高い変 換係数、あるは MB内で最も空間領域で視覚感度が高いブロックに合わせて、 MBの 量子化パラメータを決定するし力ない。この結果、周波数領域で視覚感度の低い他 の変換係数や、空間領域で視覚感度の低いブロックが必要以上に細力べ量子化され る。すなわち、視覚感度の低い変換係数に不要な情報量を割り当てている。
[0021] また、フレーム内予測 MBでは MBを構成する全ブロック内の変換係数に対して高域 の変換係数を低域の変換係数よりも係数を切り落とし、フレーム間予測では前記係 数の切り落としをオフとすることで、量子化特性付加情報を伝送することなく画像フレ ーム全体の平均的な主観画質改善する技術が、特開 2003-230142号公報 (文献 1) に記載されている。
発明の開示
発明が解決しょうとする課題
[0022] し力しながら、上述した従来技術のように複数の変換係数、あるいは複数変換係数 を構成要素とするブロックの集合に同じ量子化パラメータを設定する方法では、プロ ックの絵柄、ブロックの予測性能、ブロックの変換係数の分布に適した量子化ができ ない。かといつて、変換係数毎あるいは複数変換係数を構成要素とするブロック毎に 量子化パラメータを設定して伝送する方法では、量子化パラメータ (以後、量子化特 性付加情報とよぶ)の符号量が膨大になり、一定の符号量での画像符号化では利用 できない。
[0023] また、文献 1に記載されるような技術では、画像フレームの最小構成単位であるプロ ック毎 (すなわち、 MBを構成するブロックごと)の絵柄 Z各ブロックの予測性能 Z各ブ ロック内の係数の分布に応じた量子化を実現できず、画像フレーム内に局所的な画 質劣化が生じてしまう問題がある。すなわち、上述した問題 1, 2, 3を解決することは できない。
[0024] そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、量子化 特性付加情報を利用することなぐ変換係数毎、複数の変換係数を構成要素とする ブロックごとに自在な強度の量子化を可能とし、高画質な画像符号化技術を提供す ることにめる。
[0025] また、本発明の目的は、複数の変換係数に同じ量子化幅で量子化を行う変換符号 化技術において、ビットストリームに追加の情報を加えることなぐ周波数領域での変 換係数の視覚感度に応じた量子化を可能とし、より高画質な画像を提供することにあ る。
[0026] また、本発明の目的は、複数変換係数を構成要素とするブロックの集合に同じ量子 化幅で量子化を行う画像の変換符号ィ匕技術にぉ 、て、ビットストリームに追加の情報 を加えることなぐ空間領域でのブロックの視覚感度に応じた量子化を可能とし、より 高画質な画像を提供することにある。
課題を解決するための手段
[0027] 上記課題を解決するために、本発明の画像符号化方法は、画像を空間領域から周 波数領域に変換することにより変換係数を生成するステップと、復号時と同じ量子化 幅を用い、復号時の量子化特性と異なる量子化特性で、変換係数を量子化するステ ップとを備えることを特徴とする。
[0028] また、本発明の画像符号化装置は、画像を空間領域から周波数領域に変換するこ とにより変換係数を生成する変換手段と、復号時と同じ量子化幅を用い、復号時の 量子化特性と異なる量子化特性で、変換係数を量子化する量子化手段とを備えるこ とを特徴とする。
[0029] また、本発明の画像符号ィ匕の制御プログラムは、コンピュータを、画像を空間領域 力 周波数領域に変換することにより変換係数を生成する変換手段と、復号時と同じ 量子化幅を用い、復号時の量子化特性と異なる量子化特性で、変換係数を量子化 する量子化手段として機能させることを特徴とする。 発明の効果
[0030] 本発明は画像の変換符号化技術において、変換係数の周波数領域での視覚感度、 複数変換係数を構成要素とするプロックの空間領域での視覚感度に応じたデッド ゾーン幅を設定する手段を具備し、 これによつて、 変換係数の周波数領域での視 覚感度および複数変換係数を構成要素とするブロックの空間領域での視覚感度に 応じた量子化機能を提供する。
[0031] 発明によって、 量子化パラメータによって決定される量子化幅に依存すること なく、 周波数領域で視覚感度の低い変換係数、 および空間領域で視覚感度の低い ブロックに無駄に消費されていた符号量を削減できる。 前記符号量の削減によつ て、 画像フレーム全体の量子化が従来方式よりも細かくなり、 周波数領域で視覚 感度の高い変換係数および空間領域で視覚感度の高いプロックが高画質に符号化 される。
図面の簡単な説明
[0032] [図 1]図 1は従来技術の構成を示す図である。
[図 2]図 2は画像フレーム(解像度が QCIFの場合で輝度信号のみ)を示す図である。
[図 3]図 3は実施例 1の構成の一例を示す図である。
[図 4]図 4はデッドゾーン生成のフローチヤ一トである。
[図 5]図 5はブロックデッドゾーンスケール生成のフローチヤ一トである。
[図 6]図 6は一つの直交変換係数に対する量子化フローチヤ一トである。
[図 7]図 7は従来方式の量子化特性 (量子化ステップサイズ q) を示す図である。
[図 8]図 8は本発明の量子化特性 (量子化ステップサイズ q、 デッ ドゾーン幅 dz=2 q) を示す図である。
[図 9]図 9は従来方式の量子化特性 (量子化ステップサイズ q' =4q) を示す図であ る。
[図 10]図 1 0は本発明の効果を説明する為の図である。 図中、 aは各ブロックの 複雑度 (小さい値ほど平坦) を示し、 bは従来技術での量子化強度を示し、 cは 本発明での量子化強度を示す。 ただし、 M Bの量子化強度 = 2 0である。
[図 11]図 1 1は実施例 2の構成の一例を示す図である。 差替え用紙 (規則 26) [図 12]図 1 2は空間周波数デッドゾーンスケール生成装置の構成の一例を示す図 である。
[図 13]図 1 3は空間周波数装置特性タイプ設定装置の動作フローチャートであ る。
[図 14]図 1 4は本発明の効果を説明する為の図である。 図中、 dは M B内部のブ ロック空間周波数特性タイプを示し、 eは従来技術での量子化タイプを示し、 f は本発明での量子化タイプを示す。 ただし、 「1」 は双方向予測ブロック、 「2」 は非孤立動きブロック、 「3」 は通常動きブロックである。
差替え用紙 (規則 26) [図 15]図 15はタイプ別の量子化強度特性 (ブロック内横方向のみ)を示す図である。
[図 16]図 16は実施例 3の構成の一例を示す図である。
[図 17]図 17はハイブリッドデッドゾーンスケール生成装置の構成の一例を示す図で ある。
[図 18]図 18は実施例 4の構成の一例を示す図である。
[図 19]図 19はギャップ補正デッドゾーンスケール生成装置の動作フローチャートであ る。
[図 20]図 20は本発明を利用した情報処理装置の構成を示す図である。
発明を実施するための最良の形態
[0033] 本発明は、画像符号ィ匕において、例えば、図 3に示される如ぐデッドゾーン生成装 置 201、ブロックデッドゾーンスケール生成装置 202用いて、復号時と同じ量子化幅で デッドゾーンを用いて各変換係数を量子化することにより、復号時の量子化特性と異 なる量子化特性で、各変換係数を量子化する。
[0034] また、変換係数毎に、又は、複数の変換係数を構成要素とするブロック毎に、デッド ゾーン幅を適応的に変化させることにより、変換係数の周波数領域での視覚感度お よび複数変換係数を構成要素とするブロックの空間領域での視覚感度に応じた量子 ィ匕機能を提供し、更に、符号量を削減できる。
[0035] 具体的には、周波数領域で視覚感度の高い変換係数、又は空間領域で視覚感度 の高 、ブロックほど前記デッドゾーン幅が狭ぐ周波数領域で視覚感度の低 、変換 係数、又は空間領域で視覚感度の低 、ブロックほど前記デッドゾーン幅が広く設定 する。また、デッドゾーンの幅を画像の平坦度によって適応的に変化させる。この際、 画像の平坦度を、画像の予測モード、画像のフレーム内予測の方向、画像の動き、 画像のフレーム間予測の方向、画像の平均絶対値誤差、画像の分散、画像の最大 値と最小値の差分、画像の予測誤差信号の平均絶対値誤差、および、画像の予測 誤差信号の分散の少なくとも 1つから計算する。
[0036] 以下、具体的な実施例を述べる。
実施例 1
[0037] 本発明の実施例 1について説明する。 [0038] 図 3は実施例 1の構成を示す一例である。
[0039] 本実施例では、動画像を構成する画像フレームを複数のマクロブロック (MB)とよば れる領域に分割し、さらに前記 MBを細力べ分割したブロックに対して符号ィ匕を行う。
[0040] 前記 MBは、過去に再構築された同一画像フレーム内から予測するフレーム内予 測装置 108、あるいは過去に再構築された過去の画像フレームから予測するフレーム 間予測装置 109が供給する予測値が減じられる。前記予測値が減じられた MBの信 号を予測誤差信号と呼ぶ。
[0041] 前記予測誤差信号は、さらに細かいブロック(以後に単純にブロックと呼ぶ)に分割 されて、直交変換装置 101によって空間領域力 周波数領域に変換される。
[0042] 前記周波数領域に変換されたブロックの直交変換係数は、量子化装置 102によつ て、量子化パラメータに対応する量子化ステップサイズで量子化される。
[0043] 量子化パラメータは、量子化制御装置 103より MB単位で量子化装置 102に供給さ れる。一般に前記量子化制御装置 103は、発生符号量を監視して発生符号量が目 標の符号量よりも多 、ようであれば量子化パラメータを大きくし、逆に発生符号量が 目標の符号量よりも少な 、ようであれば量子化パラメータを小さくする。これによつて 動画像を目標符号量で符号化できる。
[0044] 前記量子化された直交変換係数は量子化変換係数とよばれ、可変長符号化装置
104によってエントロピー符号ィ匕されて出力される。
[0045] 以降の符号化のために、前記量子化変換係数は、逆量子化装置 105で逆量子化さ れ、さらに逆直交変換装置 106によって逆直交変換されて元の空間領域に戻される。
[0046] 前記空間領域に戻されたブロックには、前記予測値が加えられフレームメモリ 107に 格納される。前記格納されたブロックで再構成される画像フレームを参照フレームと 呼ぶ。
[0047] フレーム内予測装置 108は、前記参照フレームから現 MBの予測誤差信号を最小と する予測方向、一方のフレーム間予測装置 109は、前記参照フレームから現 MBの 予測誤差信号を最小とする動きベクトルを検出する。予測判定スィッチ 110は、前記 フレーム内予測による予測誤差とフレーム間予測による予測誤差を比較し、予測誤 差が小なる予測を選択する。 [0048] さらに、本実施例では、量子化装置 102は、直交変換装置 101から供給される直交 変換係数を量子化する際に、デッドゾーンを用いる。デッドゾーンとは、 0 (ゼロ)に近 い入力に対応する出力を 0 (ゼロ)にすることをいう。また、このような操作を行う入力 の範囲をデッドゾーン幅という。ここでは、直交変換係数がデッドゾーン幅に含まれて いる場合に、量子化装置 102は、直交変換係数を量子化した出力、すなわち量子化 変換係数を 0 (ゼロ)とする。
[0049] デッドゾーン幅は、デッドゾーン生成装置 201およびブロックデッドゾーンスケール生 成装置 202によって生成される。
[0050] ブロックデッドゾーンスケール生成装置 202は、画像信号と予測誤差とを入力とし、 対象ブロックの絵柄あるいは予測性能を解析し、前記ブロックの絵柄、予測性能に適 したデッドゾーンスケールをデッドゾーン生成装置 201に出力する。
[0051] デッドゾーン生成装置 201は、ブロックデッドゾーンスケール生成装置 202からのデッ ドゾーンスケールと量子化制御装置 103からの MB量子化パラメータを入力とし、前記 デッドゾーンスケールと MB量子化パラメータからデッドゾーン幅を計算して、このデッ ドゾーン幅を量子化装置 102に出力する。具体的には、前記デッドゾーンスケールと MB量子化パラメータとを乗算してデッドゾーン幅を求める。したがって、前記デッドゾ ーンスケールとは、デッドゾーン幅を求める際の MB量子化パラメータの係数である。
[0052] 尚、以下では、説明を具体化するために、画像フレームのサイズを QCIF(176 X 144) サイズ、 MBのサイズを 16 X 16サイズ、 MBを構成するブロックのサイズを 4 X 4サイ ズとする。ただし当然、その他のサイズでも本発明を適用できることは言うまでもない
[0053] 以下の説明では、本実施例の特徴であるデッドゾーン生成装置 201、ブロックデッド ゾーンスケール生成装置 202、および前記デッドゾーン生成装置 201によって内部動 作の変更を伴う量子化装置 102を説明する。
[0054] デッドゾーン生成装置 201の入出力および動作を以下で説明する。
[0055] デッドゾーン生成装置 201の入力は、量子化装置 102が現在対象とする MBのラスタ スキャン順で b番目のブロックに対応するデッドゾーンスケール dz_scale(b,i, j)(0≤b≤ 15、 0≤ 3、 0≤j≤3)、量子化制御装置 103から供給される量子化パラメータ mb—qで ある。
[0056] デッドゾーン生成装置 201の出力は、量子化装置 102が現在対象とする MB内のラス タスキャン順で b番目のブロックの直交変換係数 co b,i,j)( 0≤b≤15、 0≤i≤3、 0≤j ≤3)に対応するデッドゾーン幅 dz(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)である。
[0057] 図 4を参照してデッドゾーン生成装置 201の動作を以下で説明する。
[0058] ステップ S101では、量子化パラメータ mb_qから基準デッドゾーン base_ dz(i,j) (0≤i≤ 3、 0≤j≤3)を計算する。基準デッドゾーンの計算方法は、本発明が接続される符号 ィ匕器 (以後、ベース符号化器と呼ぶ)が量子化マトリクス WM(i,j)(0≤i≤3、 0≤j≤3)を 利用する、しないによって異なる。量子化マトリクスとは、量子化での割り算および逆 量子化での掛け算に空間周波数に応じた重み付けパラメータ (量子化付加情報)で ある。
前記量子化マトリクスを用いることで、空間周波数ごとの量子化幅を可変とすることが できる。前記量子化マトリクスを利用する場合をステップ S101A、そうでない場合をス テツプ S101Bとして各ステップを以下で説明する。尚、以下で共通して利用する量子 ィ匕ステップサイズ mb_q_stepは、 mb_q_step=q_step_table[q]で設定される。前記量子ィ匕 ステップサイズ q_step_table[q]は、ベース符号化器で定義される量子化パラメータ qに 対応する量子化ステップサイズである (Q_MIN≤p≤ Q_MAX、 Q_MINおよび Q_MAXも ベース符号化器依存)。
[0059] ステップ S101Aでは、式(1)によって基準デッドゾーン base_dz(i,j)を計算する。
base— dzU,j)=mb—q— step X WMu,j) (1)
ステップ S101Bでは、式(2)によって基準デッドゾーン base_dz(i,j)を計算する。 base— dz(i,j)=mb—q— step (2)
ステップ S102では、式(3)によって、基準デッドゾーン base_dz(i,j)とデッドゾーンスケ ール dz_scale(b,i,j)からデッドゾーン幅 dz(i,j)を計算する。
dz(b,i,j尸 base— dz(i,j) X dz— scale(b,i,jノ (3)
尚、ここで、デッドゾーンスケール dz_scale(b,i,j)の値によって任意にデッドゾーン幅 dz(b,i,j)が設定できることを述べておく。
[0060] 以上でデッドゾーン生成装置 201の入出力および動作の説明を終わる。 [0061] デッドゾーンスケール生成装置 202は、複数の変換係数を構成要素とするブロック 毎に、そのブロックの絵柄あるいは予測性能に適した、デッドゾーンスケールを生成 する。
[0062] ブロックデッドゾーンスケール生成装置 202の入出力、動作を以下で説明する。
[0063] ブロックデッドゾーンスケール生成装置 202への入力は、量子化装置 102が現在対 象とする MBのラスタスキャン順で b番目のブロックに対応する入力画像信号 org(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)、予測誤差信号 pd(b,i,j)(0≤b≤ 15、 0≤i≤3 、 0≤j≤3)である。
[0064] ここで、入力信号のビット精度は符号なし nビットとする。
[0065] ブロックデッドゾーンスケール生成装置 202の出力は、量子化装置 102が現在対象と する MB内のラスタスキャン順で b番目のブロックに対応するデッドゾーンスケール dz— scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)である。
[0066] ブロックデッドゾーンスケール生成装置 202が、デッドゾーンスケールを生成するた めに使用する信号を画像特徴量信号 im b,i,j) (0≤b≤15、 0≤ 3、 0≤j≤3)とする
[0067] 図 5を参照して、ブロックデッドゾーンスケール生成装置 202の動作を説明する。
[0068] ステップ 301では、画像特徴量信号を選択する。以下 3種類の選択がある。
1 (C301A)ベース符号化器の量子化制御装置 102が、発生符号量以外に入力画像 信号を用いて量子化パラメータを決定する場合には、画像特徴量信号 im b,i,j)に入 力画像信号 org(b,i,j)を接続する。
2 (C301B)ベース符号化器の量子化制御装置 102が、発生符号量と入力画像信号 以外に予測誤差信号 pdを用いて量子化パラメータを決定する場合には、画像特徴 量信号 im b,i,j)に予測誤差信号 pd(b,i,j)を接続する。
3 (C301C) C301A、 C301B以外の場合には、画像特徴量信号 iml(b,i,j)に入力画像 信号 org(b,i,j)を接続する。
[0069] ステップ 302では、各ブロック番号 b(0≤b≤15)に対応する平均絶対値誤差 LlAC(b)
(0≤b≤15)を式 (4)、(5)で計算する。
[0070] [数 1] " (imf(b,i, j) - ave) (4)
Figure imgf000014_0001
ave = ^~ 〉,imf(b,i, j) (5)
16 ゾ =o z=o
[0071] ここで abs(x)は入力 xの絶対値を返す関数とする。平均絶対値誤差 L1AC (b)(l≤ LlAC(b)≤ n)は、ブロック bの内での画像特徴量信号の散らばりを示す。
[0072] ステップ 303では、式(6)を用いて各ブロック番号 b(0≤b≤ 15)に対応するブロック複 雑度 bcm(b) (0≤b≤15)を計算する。
[0073] [数 2] bcm{b) = max(l .0, -^— x L\AC{b)) (6)
. ― 1
[0074] ここで max(x,y)は入力 x,yの値の大き!/、方の値を返す関数である。
[0075] ブロック複雑度 bcm(b) (l≤bcm(b)≤n)が小さいほど、そのブロックは平坦であり人間 の視覚感度は高い。また、ブロック複雑度 bcm(b)が大きいほど、そのブロックは複雑 であり人間の視覚感度は低い。
[0076] このことを利用して、ブロック複雑度が小さいブロックの量子化の強度を小さぐ大き
V、ほど量子化の強度を強くすることで、空間領域でのブロックの視覚感度 (絵柄ゃ予 測性能)に応じた量子化強度を設定ができる。
[0077] ステップ 304では、式 (7)を用いて各ブロック番号 b(0≤b≤ 15)に対応するブロックデッ ドゾーンスケール bdz_scale (b)(0≤b≤ 15)を計算する。
bdz_scale(b)=clip(bdz_limit , (bcm(b)/ min— bcm)) \ ί)
min— bcm=min(bcm(b)) (8)
ここで、 bdzjimitは nよりも小さ!/、パラメータ、 clip(x,y)は入力 x,yの値の小さ!/、方の値 を返す関数、 min(bcm(b》は bcm(b)(l≤bcm(b)≤n)の最小値を返す関数である。 bdzjimitを小さくすればブロックごとの量子化強度の変更を小さくでき、 bdzjimitを大 きくすればダイナミックにブロックごとの量子化強度を変更することができる。
[0078] なお、ブロックの周囲の複雑度も考慮してブロックデッドゾーンスケールを計算する のであれば、式(7)の代わりに以下の式(7A)を用いてもよ!、。
bdz—scale(b)=clip(bdz— limit, (local— bcm(b)/ min—local— bcm)) (7A)
min_local_bcm=min(locai_bcm(b)) (8A)
ここで locaLbcm(b)は対象ブロック bとその周辺ブロックの最小の bcm値を返す関数、 min(local_bcm(b》は local_bcm(b)(l≤ bcm(b)≤ n)の最小値を返す関数である。
[0079] ステップ 305では、式 (9)を用いて各ブロック番号 b(0≤b≤ 15)に対応するデッドゾー ンスケール dz_scale (b,i,j)(0≤b≤ 15、 0≤i≤3、 0≤j≤3)に、ブロックデッドゾーンスケ ール bdz_scale(b)を設定する。
dz— scale(b,i,j)=bdz— scale(b "(0≤i≤3,0≤j≤3) (9)
以上のブロックデッドゾーンスケール生成装置 202の動作により、空間領域で視覚 感度の高 、ブロックのデッドゾーンスケール dz_scaleは小さぐ空間領域で視覚感度 の低いブロックのデッドゾーンスケール dz_scaleは大きくなる。
[0080] なお画像特徴量信号 b,i,j)に入力画像信号 org(b,i,j)が接続されている場合、平均 絶対値誤差でなぐブロックの画素レンジ (最大画素値と最小画素値の差)を利用し てもよい。ようは、ブロックの複雑度が得られる情報であればよい。
[0081] 以上で、ブロックデッドゾーンスケール生成装置 202の入出力、動作の説明を終了 する。
[0082] 量子化装置 102の入出力および動作を以下で説明する。
[0083] 量子化装置 102の入力は、デッドゾーン生成装置 201から供給されるデッドゾーン幅 dz(b,i,j)( 0≤b≤15、 0≤i≤3、 0≤j≤3)、直交変換装置 101から供給される直交変換 係数 co b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)、量子化制御装置 103から供給される量 子化パラメータ mb_qである。
[0084] 量子化装置 102の出力は、量子化変換係数 q_cof (b,i,j) (0≤b≤15、 0≤i≤3、 0≤j ≤3)である。
[0085] 従来の構成に追加となる入出力は、入力のデッドゾーン幅 dz(b,i,j)( 0≤b≤ 15、 0≤i ≤3、 0≤j≤3)のみである。しかし、以下で説明する動作の影響によって、量子化変 換係数 q_co b,i,j)の出力値が従来方式と異なる。
[0086] 図 6を参照して発明での量子化装置 102の動作を以下で説明する。 [0087] ステップ S201では、直交変換係数 co b,i,j)の絶対値 abs_col¾ デッドゾーン幅 dz(b,i,j)よりも小さ 、か比較する。小さければステップ S202、そうでなければステップ S203を続いて実行する。
[0088] ステップ S202では、量子化変換係数 q_cof (b,i,j)を 0とする。
[0089] ステップ S203では、以下の計算方法によって量子化変換係数 q_cof (b,i,j)を求める。
[0090] 量子化変換係数の計算方法は、ベース符号化器が量子化マトリクス WM (i,j)(0≤i ≤3、 0≤j≤3)を利用する、しないによって異なる。量子化マトリクスを利用する場合を ステップ S203A、そうでな!/、場合をステップ S203Bとして各ステップを以下で説明する
[0091] 以下で共通して利用する量子化ステップサイズ mb_q_stepは、
mb_q_step=q_step_table[q]で設定される。前記量子ィ匕ステップサイズ q_step_table[q]は 、ベース符号化器で定義される量子化パラメータ qに対応する量子化ステップサイズ である (Q_MIN≤p≤ Q_MAX、 Q_MINおよび Q_MAXもベース符号化器依存)。
[0092] ステップ S203Aでは式(10A)によって量子化変換係数 q_cof (b,i,j)を計算する。
[0093] [数 3]
Figure imgf000016_0001
qc = (abs(cof(b, i,ゾ)) + f x (WM(i, j) mb_q_step)) I VM{i, j) mb_q_step) (11A)
[0094] ここで abs(x)は入力 xの絶対値を返す関数、 fはベース符号器に依存する 1未満のパ ラメータであり四捨五入であれば 0.5、切捨てであれば 0となる。
[0095] ステップ S203Bでは式(10B)によって量子化変換係数 q_cof (b,i,j)を計算する。
[0096] [数 4] qc if(cof(b,i,j)≥0) (ιοΒ)
q_cof(b, =
― qc else qc = (abs(cof , i, j)) + f x mb_q_step) I mb_q_step (1 IB)
[0097] ここで abs(x)は入力 xの絶対値を返す関数、 fはベース符号器に依存する 1未満のパ ラメータであり四捨五入であれば 0.5、切捨てであれば 0となる。 [0098] 以上の処理を MB内のすべての直交変換係数 co b,i,j) (0≤b≤15、 0≤i≤3、 0≤j
≤ 3)に適用することで 1つの MBに対しての量子化が終了する。
[0099] 以上で量子化装置 102の入出力および動作の説明を終わる。
[0100] 本発明の効果を以下で説明する。
[0101] まず、デッドゾーンを可変とすることで量子化強度も可変とする原理を述べる。
[0102] 図 7, 8, 9を参照して、デッドゾーン dzによる量子化特性の違いを比較する(ベース 符号化器に量子化マトリクスがなぐ .5である場合)。量子化特性とは、量子化装 置 102への入力 cofと、逆量子化装置 105の出力 icofの関係を意味する。
[0103] 図 7は量子化ステップサイズ qの従来の量子化特性、図 8は量子化ステップサイズ q でデッドゾーン幅 dz=2qの発明方式の量子化特性、図 9は量子ィ匕ステップサイズ q' =4qの従来の量子化特性である。(図 7, 9の例はデッドゾーン幅 dz=0の発明の量子 化特性とも呼べる。 ) 図 7と図 8とを比較すると、デッドゾーン幅 dzによって dz=2qより も小さい入力 cofの出力 i_coi¾ なる。一方、図 9では量子化ステップサイズ 4倍の量子 ィ匕によって 2qよりも小さい入力 cofの出力 i_coi¾S0になる。
[0104] このことは"発明によって、デッドゾーン幅 dz以下の入力に対して、量子化ステップ サイズ qを変更することなく量子化ステップサイズ q' =4qの量子化を行った"ことを意味 する。
[0105] またデッドゾーン幅は、動画像ビットストリームに付カ卩して伝送する必要性がな!、。
[0106] つまり、変換係数ごとに前記デッドゾーン幅 dzを可変とすることで"量子化付加情報 追加することなぐ変換係数ごとに自由に量子化できる"ことを意味する。
[0107] 前記デッドゾーン幅 dzを、単純にブロックの予測モードだけでなぐブロックの絵柄、 ブロックの予測性能あるいはブロック内の直交変換係数の分布も考慮して制御するこ とによって、ブロックの視覚感度あるいはブロック内の変換係数の視覚感度に最適な 量子化を実現できる。
[0108] 本発明の実施例 1のブロックデッドゾーンスケール生成装置 202が供給するデッドゾ ーンスケール dz_scaleによって、量子化付加情報追加することなぐブロックの絵柄/ ブロックの予測性能を考慮して制御できる。つまり、図 10に示される如ぐ空間領域 でのブロックの視覚感度に応じた量子化強度設定を可能とする。 [0109] 本発明により、空間領域でのブロックの視覚感度に適した量子化強度設定が可能 となり、前記視覚感度の低いブロックでの余分な発生符号量を削減できる。これによ り、画像フレーム全体の発生符号量も削減され、画像フレーム全体の量子化パラメ一 タが小さくなる。この結果、空間領域で視覚感度の高いブロックの量子化が従来方式 よりも細かくなり、より高画質に符号化される。
[0110] 以上で、実施例 1の説明を終わる。
実施例 2
[0111] 本発明の実施例 2について説明する。
[0112] 図 11に本発明の実施例 2の構成を示す。実施例 2の構成は、実施例 1の構成にお けるブロックデッドゾーンスケール生成装置 202の代わりに、空間周波数デッドゾーン スケール生成装置 203を備える。空間周波数デッドゾーンスケール生成装置 203は、 画像フレームのラスタスキャン順で b番目のブロックに対応するデッドゾーンスケール dz_scale(b,i,j)(0≤b≤15、0≤i≤3、0≤j≤ 3)をデッドゾーン生成装置 201に供給する
[0113] 尚、以下の説明では、説明を具体化するために、画像フレームのサイズを
QCIF(176 X 144)サイズ、 MBのサイズを 16 X 16サイズ、 MBを構成するブロックのサ ィズを 4 X 4サイズとする。ただし当然、その他のサイズでも本発明を適用できることは 言うまでもない。
[0114] また、以下では、実施例 2における特徴である空間周波数デッドゾーンスケール生 成装置 203を説明する。なお、実施例 1の構成と同様なものについては詳細な説明は 省略する。
[0115] 空間周波数デッドゾーンスケール生成装置 203は、 MBを構成する各ブロックの直交 変換係数の分布に適したデッドゾーンスケールを生成する。
[0116] 空間周波数デッドゾーンスケール生成装置 203の入出力を以下で説明する。
[0117] 空間周波数デッドゾーンスケール生成装置 203への入力は、量子化装置 102が現 在対象とする MBのラスタスキャン順で b番目のブロックに対応する入力画像信号 org(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)、量子化装置 102が現在対象とする MBのラス タスキャン順で b番目のブロックに対応する予測モード mode(b)(0≤b≤ 15)、動きべタト ル mv(b,dir)(0≤b≤15, 0≤dir≤l)である。ここで dirは動きベクトルの方向を示し 0で横 方向、 1で縦方向とする。
[0118] 予測モードには、同一画像フレーム内から予測するフレーム内予測モード(動きべ タトル 0本)、過去または未来の画像フレーム 1枚力 予測するフレーム間予測モード
(動きベクトル 1本)、未来および過去の 2枚のフレームから予測する双方向フレーム 間予測モード (動きベクトル 2本)がある。
[0119] 空間周波数デッドゾーンスケール生成装置 203の出力は、量子化装置 102が現在 対象とする MB内のラスタスキャン順で b番目のブロックに対応するデッドゾーンスケー ル dz_scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)である。
[0120] 以上で、空間周波数デッドゾーンスケール生成装置 203の入出力の説明を終わる。
[0121] 次に、空間周波数デッドゾーンスケール生成装置 203の内部構成を図 12に示し、 その動作を説明する。
[0122] 空間周波数デッドゾーンスケール生成装置 203は、空間周波数特性設定装置 2031 と特性タイプ別デッドゾーンスケール装置 2032によって構成される。
[0123] 空間周波数特性設定装置 2031は入力された画像、予測モードおよび動きベクトル を用いて、量子化装置 102が現在対象とする MBのラスタスキャン順で b番目のブロッ クの直交変換係数の分布に応じた特性タイプ type(b)(0≤b≤ 15、 0≤type(b)≤3)を出 力する。
[0124] 図 13を参照して、空間周波数特性設定装置 2031の動作を説明する。
[0125] ステップ S4101では、ブロック bの予測モードがフレーム内予測かを判定する。
フレーム内予測であればステップ S41011を実行する。
[0126] ステップ S4101では、式 (12)の値が予め決めた閾値 edge_thよりも大きければブロック bをブロック bの特性タイプ type(b)=4として終了する。そうでなければブロック bの特性 タイプ type(b)=0として終了する。
Range=max_v(o, i , j)— mm— v(b ,i,j) (12)
ここで max_v(b,i,j)は、ブロック bの最大の画素値 org(b,i,j)(0≤i≤ 3、 0≤ j≤ 3)を返す 関数、 min_v(b,i,j)は、ブロック bの最小の画素値 org(b,i,j)(0≤ 3、 0≤j≤3)を返す関 数である。 [0127] フレーム内予測ブロックは、フレーム間予測よりも予測性能が低ぐ大きな予測誤差 が発生する。
[0128] ブロックが平坦あるいはテクスチャであれば、ブロック内の低周波数成分の変換係 数を細かく量子化し、高周波成分の変換係数の粗く量子化するのが望ましい。
一方、ブロックがエッジであれば高周波数にも主観的に重要な係数が発生するの で、各周波数の変換係数を一様な強度で量子化するのがよ 、。
[0129] ステップ S4102では、ブロック bの予測モードが双方向予測モードかを判定する。
双方向予測モードであればブロック bの特性タイプ type(b)=lとして終了する。そうで なければステップ S4103を実行する。
[0130] 双方向予測ブロック内は、パン領域あるいは静止領域であり視覚感度が高い。ただ し、小さいパワーの予測誤差信号は、未来あるいは過去のフレームの圧縮で発生し たノイズであるから、パワーの小さ 、予測誤差信号を落とす量子化強度の設定がよ!、
[0131] ステップ S4103では、式 (13)によってブロック bの動きベクトル mv(b,dir)(0≤b≤15, 0 ≤dir≤l)の散らばり msvを計算する。前記動きベクトルの散らばりが、予め決めた動き ベクトル散らばり閾値 mvs_thresよりも小さければ、ブロック bの特性タイプ type(b)=2とし て終了する。そうでなければステップ S4104を実行する。
mvs=abs(mv(b,0)— u— mv(b,0))+abs(mv(b, 1)— u— mv(D, 1))
+abs(mv(b,0)-l_mv(b,0))+abs(mv(b, l)-l_mv(b, 1)) (13)
ここで abs(x)は入力 xの絶対値を返す関数、 u_mv(b,dir)はブロック bの上側に隣接す るブロックの dir方向の動きベクトル mvを返す関数、 l_mv(b,dir)はブロック bの左側に隣 接するブロックの dir方向の動きベクトル mvを返す関数である。
[0132] 非孤立動きブロックは、パン領域あるいは静止領域であり視覚感度が高い。ただし 、小さいパワーの予測誤差信号は、未来あるいは過去のフレームの圧縮で発生した ノイズであるから、パワーの小さ 、予測誤差信号を落とす量子化強度の設定がよ!、。
[0133] ステップ S4104では、ブロック bの縦および横の動きベクトル長 mv(b,dir)(0≤b≤15, 0 ≤dir≤ 1)が、予め決めた高速動きベクトル長閾値 hs_mv_thresよりも大きいか (高速動 きブロックか)、小さいか (通常動きブロック)を判定する。高速動きブロックであればブ ロック bの特性タイプ type(b)=0、そうでなければ特性タイプ type(b)=3として終了する。
[0134] 高速動きブロックは、動き予測が当たらず、フレーム内予測と同様に大きな予測誤 差が発生する。しかし、動きが極端に速く人間の目には追従困難であるので、フレー ム内予測と同様に、高周波成分の変換係数の量子化強度を強く設定するのがよい。
[0135] 通常動きブロックは、フレーム内予測よりも予測誤差が小さくなる傾向がある。よって
、高周波成分の変換係数の量子化強度設定をフレーム内予測よりも緩やかにするの がよい。
[0136] ステップ S4101から S4104までの処理によって、各ブロックの変換係数の特性を分類 することができる。
[0137] 以上で、空間周波数特性設定装置 2031の動作説明を終了する。
[0138] 次に特性タイプ別デッドゾーンスケール装置 2032の動作を説明する。
[0139] 特性タイプ別デッドゾーンスケール装置 2032は、空間周波数特性設定装置 2031が 供給する量子化装置 102が現在対象とする MBのラスタスキャン順で b番目のブロック に対応する特性タイプ type(b)より、前記 b番目ブロックのデッドゾーンスケール dz_scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)を計算する。特性タイプ別 (typeOから 3) に応じたブロック bのデッドゾーンスケールの計算方法を以下に示す。
typeO (フレーム内予測ブロックでかつ非エッジあるいは高速動きブロック)
dz_scale(b,i,j)=BO(i,j) (14)
typel (双方向予測ブロック)
dz_scale(b,i,j)=Bl (15)
type2(非孤立動きブロック)
dz_scale(b,i,j)=B2 (16)
type3(通常動きブロック)
dz_scale(b,i,j)=B3(i,j) (17)
type4(フレーム内予測ブロックでかつエッジ)
dz_scale(b,i,j)=B4 (18)
ここで B0、 Bl, B2, B3、 B4は、予め決められたパラメータである。 B0(i,j)={{0, 1.1, 1.3, 1.6}, {1.1, 1.3, 1.6, 1.8}, {1.3, 1.6, 1.8, 2.0}, {1.6, 1.8, 2.0,2.8}}、 B3(x)={{0, 1.1, 1.3, 1.4},{ 1.1, 1.3, 1.4, 1.6} ,{1.3, 1.4, 1.6, 1.8}, {1.4, 1.6, 1.8, 2.0}}であり、 B4>B1 >B2 > 1の関係がある。なおブロックの幅 bwが本実施例の 4以外の数値であれば、 B0 や B3の値は、式(19)によって算出できることを示しておく。
B(i,j)=K(i,j) X (i2+j2)0-25 (19)
ただし、 K(i,j)は空間周波数 (i,j)に依存したはりも大きな値とする 尚、フレーム内予 測モードでかつ予測方向 pred_dirが予測判定 110から供給可能であれば、前記予測 方向 pred_dirの向き(縦、横、斜め、その他)によって type(0)の傾斜を変えるのがよい 。例えば、予測の向きが横方向なのであれば、ブロック内部の絵柄は横方向には平 坦であり、横方向 iの周波数に対応する変換係数の量子化係数を縦方向 jの周波数 の変換係数よりも細かく量子化するデッドゾーンスケール dz_scaleを生成するのがよい
[0140] 以上で、特性タイプ別デッドゾーンスケール装置 2032およびの空間周波数デッドゾ ーンスケール生成装置 203の動作説明を終わる。
[0141] 本発明の実施例 2により、空間周波数デッドゾーンスケール生成装置 203が供給す るデッドゾーンスケール dz_scaleによって、各ブロックの変換係数の分布に応じたデッ ドゾーン幅を設定できる。つまり、図 14、 15に示される如ぐ量子化付加情報追加す ることなぐ各変換係数の周波数領域での視覚感度を考慮した量子化を可能とする。
[0142] 本発明は、各ブロックの変換係数の分布に応じたデッドゾーンが設定され、この結 果周波数領域で視覚感度が低い変換係数の発生符号量を削減できる。これにより、 画像フレーム全体の発生符号量も削減され、画像フレーム全体の量子化パラメータ が小さくなる。この結果、周波数領域で視覚感度が高い変換係数が従来方式よりも 細かく量子化され、より高画質に符号ィ匕可能となる。
[0143] 以上で、実施例 2の説明を終わる。
実施例 3
[0144] 本発明の実施例 3について説明する。
[0145] 本発明の実施例 3の構成を図 16に示す。実施例 3の構成は、実施例 1の構成にお けるブロックデッドゾーンスケール生成装置 202の代わりに、ハイブリッドデッドゾーン スケール生成装置 204を備える。空間周波数デッドゾーンスケール生成装置 203は、 画像フレームのラスタスキャン順で b番目のブロックに対応するデッドゾーンスケール dz_scale(b,i,j)(0≤b≤15、0≤i≤3、0≤j≤ 3)をデッドゾーン生成装置 201に供給する
[0146] 尚、以下では、説明を具体化するために、画像フレームのサイズを QCIF(176 X 144) サイズ、 MBのサイズを 16 X 16サイズ、 MBを構成するブロックのサイズを 4 X 4サイ ズとする。ただし当然、その他のサイズでも本発明を適用できることは言うまでもない
[0147] また、以下の説明では、実施例 3における特徴であるハイブリッドデッドゾーンスケ ール生成装置 204を説明する。尚、実施例 1と同様な構成のものについては詳細な 説明は省略する。
[0148] ハイブリッドデッドゾーンスケール生成装置 204は、各ブロックの絵柄、各ブロックの 予測性能、各ブロックの直交変換係数の分布に適したデッドゾーンスケールを生成 する。
[0149] ハイブリッドデッドゾーンスケール生成装置 204の入出力、動作を以下で説明する。
[0150] ハイブリッドデッドゾーンスケール生成装置 204への入力は、量子化装置 102が現在 対象とする MBのラスタスキャン順で b番目のブロックに対応する予測モード mode(b)(0 ≤b≤15)、動きベクトル mv(b,dir)(0≤b≤15, 0≤dir≤l)、入力画像信号 org(b,i,j) (0≤ b≤15、 0≤i≤3、 0≤j≤3)、予測誤差信号 pd(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)で ある。
[0151] ハイブリッドデッドゾーンスケール生成装置 204の出力は、量子化装置 102が現在対 象とする MB内のラスタスキャン順で b番目のブロックに対応するデッドゾーンスケール dz— scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)である。
[0152] ノ、イブリツドデッドゾーンスケール生成装置 204の内部構成を図 17に示し、その動 作を以下で説明する。
[0153] 図 17に示される如ぐハイブリッドデッドゾーン生成装置 204は、ブロックデッドゾー ンスケール生成装置 202、空間周波数デッドゾーンスケール生成装置 203、および混 合器 2041によって構成される。
[0154] ブロックデッドゾーンスケール生成装置 202は第 1実施例、空間周波数デッドゾーン スケール生成装置 203は第 2実施例で説明したものである。
[0155] よって以下では、混合器 2041の入出力および動作のみを以下で説明する。
[0156] 混合器 2041への入力は、ブロックデッドゾーン装置 202が供給する量子化装置 102 が現在対象とする MB内のラスタスキャン順で b番目のブロックに対応するデッドゾー ンスケール ldz_scale l(b,i,j)(0≤b≤ 15、 0≤i≤3、 0≤j≤3)、空間周波数デッドゾーン 装置 203が供給する量子化装置 102が現在対象とする MB内のラスタスキャン順で b番 目のブロックに対応するデッドゾーンスケール 2dz_scale 2(b,i,j)(0≤b≤ 15、 0≤i≤ 3、 0≤j≤ 3)、空間周波数デッドゾーン装置 203が供給する量子化装置 102が現在対象と する MBのラスタスキャン順で b番目のブロックの変換係数の分布を示す特性タイプ type(b)(0≤ b≤ 15、 0≤ type(b)≤ 3)である。
[0157] 混合器 2041の出力は、量子化装置 102が現在対象とする MB内のラスタスキャン順 で b番目のブロックに対応するデッドゾーンスケール dz_scale(b,i,j)(0≤b≤ 15、 0≤i≤ 3、 0≤j≤3)である。
[0158] 混合器 2041は、前記ブロック bの特性タイプ type(b)に応じてデッドゾーンスケール dz.scale (b,i,j)を計算する。
typeO (フレーム内予測ブロックでかつ非エッジあるいは高速動きブロック)
dz_scale(b,i,j)=dz_scalel(b,i,j) X dz_scale2(b,i,j) (20)
typel (双方向予測ブロック)
dz_scale(b , 1 , j =maxi,dz_s cale 1 (b , i , j) , dz_s cale2 (b , ι , j)) (21)
type2(非孤立動きブロック)
dz_scale(b , l , j =max(dz_s cale 1 (b , i , j) , dz_s cale2 (b , i , j)) (21)
type3(通常動きブロック)
dz_scale(b,i,j)=dz_scalel(b,i,j) X dz_scale2(b,i,j) (20)
type4(フレーム内予測ブロックでかつエッジ)
dz_scale(b , 1 , j =max(dz_s cale 1 (b , i , j) , dz_s cale2 (b , i , j)) (21)
以上で、混合器 2041およびノ、イブリツドデッドゾーンスケール生成装置 204の動作 説明を終了する。
[0159] 本発明によって、ブロックの空間領域での視覚感度 (絵柄、予測性能)、およびに変 換係数の周波数領域での視覚感度 (分布)に適した量子化を可能とする。これにより 、画像フレーム全体の発生符号量も削減され、画像フレーム全体の量子化パラメ一 タが小さくなる。この結果、空間領域で視覚感度の高いブロックおよび周波数領域で 視覚感度の高い変換係数が従来方式よりも細かく量子化され、より高画質に符号ィ匕 可能となる。
[0160] 以上で実施例 3の説明を終わる。
実施例 4
[0161] 本発明の実施例 4について説明する。
[0162] 本発明の実施例 4の構成を図 18に示す。実施例 4の構成は、実施例 1の構成にお けるブロックデッドゾーンスケール生成装置 202の代わりに、ギャップ補正デッドゾーン スケール生成装置 205を備える。前記ギャップ補正デッドゾーンスケール生成装置 205は、画像フレームのラスタスキャン順で b番目のブロックに対応するデッドゾーンス ケール dz_scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤ 3)をデッドゾーン生成装置 201に供 給する。
[0163] 尚、以下の説明では、説明を具体化するために、画像フレームのサイズを
QCIF(176 X 144)サイズ、 MBのサイズを 16 X 16サイズ、 MBを構成するブロックのサ ィズを 4 X 4サイズとする。ただし当然、その他のサイズでも本発明を適用できることは 言うまでもない。
[0164] ギャップ補正デッドゾーンスケール生成装置 205の入出力と動作を以下で説明する
[0165] ギャップ補正デッドゾーンスケール生成装置 205への入力は、量子化制御装置 103 力 供給される量子化装置 102が現在対象とする MBの実量子化パラメータ mb_q、量 子化制御装置 103から供給される量子化装置 102が現在対象とする MBの理想量子 化パラメータ ideaLqである。
[0166] ギャップ補正デッドゾーンスケール生成装置 205の出力は、量子化装置 102が現在 対象とする MB内のラスタスキャン順で b番目のブロックに対応するデッドゾーンスケー ル dz_scale(b,i,j)(0≤b≤15、 0≤i≤3、 0≤j≤3)である。
[0167] 次に、図 19を参照して、ギャップ補正デッドゾーンスケール生成装置 205の動作を 説明する。
[0168] ステップ S501では、式 (22)を用いて実量子化パラメータ mb_qと理想量子化パラメ一 タ ideaLqのギャップ量子化幅 qstep_gapを計算する。なお、以下で共通して利用する 量子ィ匕ステップサイズ mb_q_stepは、 mb_q_step=q_step_table[q]で設定される。前記量 子化ステップサイズ q_st印 _table[q]は、ベース符号化器で定義される量子化パラメ一 タ qに対応する量子化ステップサイズである (Q_MIN≤p≤ Q_MAX、 Q_MINおよび Q— MAXもベース符号化器依存)。
[0169] [数 5]
[0 … if mb_q≥ ideal _q
qstep一 gap― (2Z)
w¾ q _ step[ideal _qV mb _q _ step[mb _ q] · · · else
[0170] ステップ S502では、式 (23)を用いてギャップ量子化幅 qstep_gapからデッドゾーンスケ ール dz_scale(b,i,j)を計算する。
dz_scale(b,i,j)=qstep_gap (23)
以上で、ギャップ補正デッドゾーンスケール生成装置 205の入出力と動作の説明を 終了する。
[0171] ギャップ補正デッドゾーンスケール生成装置 205の効果により、ベース符号化器の 以下の 2つ問題が発生した場合に、理想 MB量子化強度と実 MB量子化強度のギヤッ プを補正することができる。
[0172] 一つは、ベース符号化器の予測判定 110が選択した MBの予測モードが現 MBの量 子化パラメータあるいは前 MBの量子化パラメータとの差分が伝送不可能であり、力 つベース符号化器の量子化制御装置 103の理想 MB量子化パラメータが実 MB量子 ィ匕パラメータよりも大き 、場合である。
[0173] また、もう一つは、ベース符号化器に、 MB毎に伝送可能な前 MBの量子化パラメ一 タとの差分 delta_mb_Qに制限があり(例えば- 2≤delta_mb_Q≤2)、かつベース符号化 器の量子化制御装置 103の理想 MB量子化パラメータが実 MB量子化パラメータよりも 大きい場合である。
[0174] 上記子化強度のギャップの補正によって、視覚感度の低い MBで無駄に消費されて 体の量子化パラメータが小さくなり、視覚感度の高い MBをより細力べ量子化される。こ れにより、本発明によって、画像を従来方式よりも高画質に符号ィ匕できる。
[0175] 以上で実施例 4の説明を終わる。
実施例 5
[0176] 本発明の実施例 5について説明する。
[0177] 本発明による画像符号ィ匕装置は、以上の説明からも明らかなように、ハードウェア で構成することも可能である力 コンピュータプログラムにより実現することも可能であ る。
[0178] 図 20は、本発明による動画像符号ィ匕装置をインプリメントした情報処理システムの 一般的ブロック構成図である。
[0179] 図 20に示す情報処理システム(コンピュータ)は、プロセッサ A1001,プログラムメモ リ A1002,記憶媒体 A1003および A1004からなる。記憶媒体 A1003および A1004は、別 個の記憶媒体であってもよ 、し、同一の記憶媒体力もなる記憶領域であってもよ 、。 記憶媒体としては、ハードディスク等の磁気記憶媒体を用いることができる。
[0180] 以上の如ぐ本発明は、発明は画像の変換符号ィ匕技術において、変換係数の周波 数領域での視覚感度、複数変換係数を構成要素とするブロックの空間領域での視覚 感度に応じたデッドゾーン幅を設定する手段を具備し、これによつて、変換係数の周 波数領域での視覚感度および複数変換係数を構成要素とするブロックの空間領域 での視覚感度に応じた量子化機能を提供することが可能である。
[0181] また、本発明は、量子化パラメータによって決定される量子化幅に依存することなく 、周波数領域で視覚感度の低い変換係数、および空間領域で視覚感度の低いプロ ックに無駄に消費されていた符号量を削減でき、符号量の削減によって、画像フレー ム全体の量子化が従来方式よりも細力べなり、周波数領域で視覚感度の高い変換係 数および空間領域で視覚感度の高いブロックが高画質に符号化される。

Claims

請求の範囲
[1] 画像を空間領域力 周波数領域に変換することにより変換係数を生成するステップ と、
復号時と同じ量子化幅を用い、復号時の量子化特性と異なる量子化特性で、前記 変換係数を量子化するステップと
を備えることを特徴とする画像符号化方法。
[2] 前記量子化するステップは、デッドゾーンを用いて量子化するステップを備えること を特徴とする請求項 1に記載の画像符号化方法。
[3] デッドゾーン幅を設定するステップをさらに備えることを特徴とする請求項 2に記載 の画像符号化方法。
[4] 前記デッドゾーン幅を設定するステップは、前記変換係数ごとに前記デッドゾーン 幅を設定するステップを備えることを特徴とする請求項 3に記載の画像符号化方法。
[5] 前記デッドゾーン幅を設定するステップは、複数の変換係数を構成要素とするプロ ックの集合に同じ量子化幅で量子化を行う場合に、前記ブロックごとに前記デッドゾ 一ン幅を設定するステップを備えることを特徴とする請求項 3に記載の画像符号ィ匕方 法。
[6] 前記デッドゾーン幅を設定するステップは、前記デッドゾーン幅を適応的に変化さ せるステップを備えることを特徴とする請求項 3に記載の画像符号化方法。
[7] 前記デッドゾーン幅を設定するステップは、周波数領域で視覚感度の高!、変換係 数ほど前記デッドゾーン幅を狭ぐ周波数領域で視覚感度の低い変換係数ほど前記 デッドゾーン幅を広く設定するステップを備えることを特徴とする請求項 4に記載の画 像符号化方法。
[8] 前記デッドゾーン幅を設定するステップは、空間領域で視覚感度の高いブロックほ ど前記デッドゾーン幅を狭く、空間領域で視覚感度の低 、ブロックほど前記デッドゾ 一ン幅を広く設定するステップを備えることを特徴とする請求項 5に記載の画像符号 化方法。
[9] 前記デッドゾーン幅を変化させるステップは、前記画像の平坦度によって前記デッ ドゾーン幅を適応的に変化させるステップを備えることを特徴とする請求項 6に記載 の画像符号化方法。
[10] 前記画像の平坦度を、画像の予測モード、画像のフレーム内予測の方向、画像の 動き、画像のフレーム間予測の方向、画像の平均絶対値誤差、画像の分散、画像の 最大値と最小値の差分、画像の予測誤差信号の平均絶対値誤差、および、画像の 予測誤差信号の分散の少なくとも 1つ力 計算するステップをさらに備えることを特徴 とする請求項 9に記載の画像符号化方法。
[11] 前記デッドゾーン幅を設定するステップは、前記デッドゾーン幅を理想の量子化幅 と実際の量子化幅との関係力 求めるステップを備えることを特徴とする請求項 3に 記載の画像符号化方法。
[12] 画像を空間領域から周波数領域に変換することにより変換係数を生成する変換手 段と、
復号時と同じ量子化幅を用い、復号時の量子化特性と異なる量子化特性で、前記 変換係数を量子化する量子化手段と
を備えることを特徴とする画像符号化装置。
[13] 前記量子化手段は、デッドゾーンを用いて量子化する手段を備えることを特徴とす る請求項 12に記載の画像符号ィ匕装置。
[14] 前記量子化手段にデッドゾーン幅を設定するデッドゾーン生成手段をさらに備える ことを特徴とする請求項 13に記載の画像符号ィ匕装置。
[15] 前記デッドゾーン生成手段は、前記変換係数ごとに前記デッドゾーン幅を設定する デッドゾーンスケール生成手段を備えることを特徴とする請求項 14に記載の画像符 号化装置。
[16] 前記デッドゾーン生成手段は、前記量子化手段が複数の変換係数を構成要素とす るブロックの集合に同じ量子化幅で量子化を行う場合に、前記ブロックごとに前記デ ッドゾーン幅を設定するデッドゾーンスケール生成手段を備えることを特徴とする請 求項 14に記載の画像符号化装置。
[17] 前記デッドゾーン生成手段は、前記デッドゾーン幅を適応的に変化させるデッドゾ ーンスケール生成手段を備えることを特徴とする請求項 14に記載の画像符号ィ匕装 置。
[18] 前記デッドゾーンスケール生成手段は、周波数領域で視覚感度の高 、変換係数ほ ど前記デッドゾーン幅を狭く、周波数領域で視覚感度の低!ヽ変換係数ほど前記デッ ドゾーン幅を広く設定する手段を備えることを特徴とする請求項 15に記載の画像符 号化装置。
[19] 前記デッドゾーンスケール生成手段は、空間領域で視覚感度の高いブロックほど 前記デッドゾーン幅を狭ぐ空間領域で視覚感度の低 、ブロックほど前記デッドゾー ン幅を広く設定する手段を備えることを特徴とする請求項 16に記載の画像符号ィ匕装 置。
[20] 前記デッドゾーンスケール生成手段は、前記画像の平坦度によって前記デッドゾー ン幅を適応的に変化させる手段を備えることを特徴とする請求項 17に記載の画像符 号化装置。
[21] 前記画像の平坦度を、画像の予測モード、画像のフレーム内予測の方向、画像の 動き、画像のフレーム間予測の方向、画像の平均絶対値誤差、画像の分散、画像の 最大値と最小値の差分、画像の予測誤差信号の平均絶対値誤差、および、画像の 予測誤差信号の分散の少なくとも 1つ力 計算する手段をさらに備えることを特徴と する請求項 20に記載の画像符号化装置。
[22] 前記デッドゾーン生成手段は、前記デッドゾーン幅を理想の量子化幅と実際の量 子化幅との関係から求めるデッドゾーンスケール生成手段を備えることを特徴とする 請求項 14に記載の画像符号化装置。
[23] コンピュータを、
画像を空間領域から周波数領域に変換することにより変換係数を生成する変換手 段、
復号時と同じ量子化幅を用い、復号時の量子化特性と異なる量子化特性で、前記 変換係数を量子化する量子化手段
として機能させることを特徴とする画像符号ィ匕の制御プログラム。
[24] 前記量子化手段は、デッドゾーンを用いて量子化する手段を備えることを特徴とす る請求項 23に記載の画像符号ィ匕の制御プログラム。
[25] 前記コンピュータを、 前記量子化手段にデッドゾーン幅を設定するデッドゾーン生成手段として機能させ ることを特徴とする請求項 24に記載の画像符号ィ匕の制御プログラム。
[26] 前記デッドゾーン生成手段は、前記変換係数ごとに前記デッドゾーン幅を設定する デッドゾーンスケール生成手段を備えることを特徴とする請求項 25に記載の画像符 号化の制御プログラム。
[27] 前記デッドゾーン生成手段は、前記量子化手段が複数の変換係数を構成要素とす るブロックの集合に同じ量子化幅で量子化を行う場合に、前記ブロックごとに前記デ ッドゾーン幅を設定するデッドゾーンスケール生成手段を備えることを特徴とする請 求項 25に記載の画像符号ィ匕の制御プログラム。
[28] 前記デッドゾーン生成手段は、前記デッドゾーン幅を適応的に変化させるデッドゾ ーンスケール生成手段を備えることを特徴とする請求項 25に記載の画像符号ィ匕の 制御プログラム。
[29] 前記デッドゾーンスケール生成手段は、周波数領域で視覚感度の高!、変換係数ほ ど前記デッドゾーン幅を狭く、周波数領域で視覚感度の低!ヽ変換係数ほど前記デッ ドゾーン幅を広く設定する手段を備えることを特徴とする請求項 26に記載の画像符 号化の制御プログラム。
[30] 前記デッドゾーンスケール生成手段は、空間領域で視覚感度の高いブロックほど 前記デッドゾーン幅を狭ぐ空間領域で視覚感度の低 、ブロックほど前記デッドゾー ン幅を広く設定する手段を備えることを特徴とする請求項 27に記載の画像符号化の 制御プログラム。
[31] 前記デッドゾーンスケール生成手段は、前記画像の平坦度によって前記デッドゾー ン幅を適応的に変化させる手段を備えることを特徴とする請求項 28に記載の画像符 号化の制御プログラム。
[32] 前記コンピュータを、
前記画像の平坦度を、画像の予測モード、画像のフレーム内予測の方向、画像の 動き、画像のフレーム間予測の方向、画像の平均絶対値誤差、画像の分散、画像の 最大値と最小値の差分、画像の予測誤差信号の平均絶対値誤差、および、画像の 予測誤差信号の分散の少なくとも 1つ力 計算する手段として機能させることを特徴 とする請求項 31に記載の画像符号ィ匕の制御プログラム。
前記デッドゾーン生成手段は、前記デッドゾーン幅を理想の量子化幅と実際の量 子化幅との関係から求めるデッドゾーンスケール生成手段を備えることを特徴とする 請求項 25に記載の画像符号ィ匕の制御プログラム。
PCT/JP2005/002243 2004-02-20 2005-02-15 画像符号化方法、その装置及びその制御プログラム WO2005081540A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006510197A JP4613909B2 (ja) 2004-02-20 2005-02-15 画像符号化方法、その装置及びその制御プログラム
US10/598,154 US8743956B2 (en) 2004-02-20 2005-02-15 Image encoding method, device thereof, and control program thereof
EP05719145A EP1718080A4 (en) 2004-02-20 2005-02-15 BILDCODE PROCESS, DEVICE AND CONTROL PROGRAM THEREFOR
CN2005800054937A CN1922886B (zh) 2004-02-20 2005-02-15 图像编码方法及其设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-044011 2004-02-20
JP2004044011 2004-02-20

Publications (1)

Publication Number Publication Date
WO2005081540A1 true WO2005081540A1 (ja) 2005-09-01

Family

ID=34879326

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/002243 WO2005081540A1 (ja) 2004-02-20 2005-02-15 画像符号化方法、その装置及びその制御プログラム

Country Status (7)

Country Link
US (1) US8743956B2 (ja)
EP (3) EP2611157A1 (ja)
JP (2) JP4613909B2 (ja)
KR (1) KR100860147B1 (ja)
CN (1) CN1922886B (ja)
TW (1) TWI255651B (ja)
WO (1) WO2005081540A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010268508A (ja) * 2004-02-20 2010-11-25 Nec Corp 画像符号化方法、その装置及びその制御プログラム
JP2010541454A (ja) * 2007-10-04 2010-12-24 サムスン エレクトロニクス カンパニー リミテッド 復号化器での量子化係数調整方法及び装置
WO2015045301A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 映像符号化装置、映像符号化方法および映像符号化プログラム

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8422546B2 (en) * 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
JP2007151075A (ja) * 2005-10-31 2007-06-14 Seiko Epson Corp 印刷装置、印刷方法、画像処理装置、画像処理方法、印刷プログラム、画像処理プログラム、及び記録媒体
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US20080240257A1 (en) * 2007-03-26 2008-10-02 Microsoft Corporation Using quantization bias that accounts for relations between transform bins and quantization bins
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US20090060027A1 (en) * 2007-08-30 2009-03-05 Tektronix, Inc. Compressed Signal Subjective Quality Ratings Prediction
JP5055078B2 (ja) * 2007-10-01 2012-10-24 キヤノン株式会社 画像処理装置及びその方法
EP2046053A1 (en) * 2007-10-05 2009-04-08 Thomson Licensing Method and device for adaptively quantizing parameters for image coding
KR100939917B1 (ko) 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US20090262801A1 (en) * 2008-04-17 2009-10-22 Qualcomm Incorporated Dead zone parameter selections for rate control in video coding
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
CN101742323B (zh) * 2008-11-05 2013-05-01 上海天荷电子信息有限公司 无再损视频编码和解码的方法和装置
JP5158003B2 (ja) * 2009-04-14 2013-03-06 ソニー株式会社 画像符号化装置と画像符号化方法およびコンピュータ・プログラム
JP5484083B2 (ja) * 2010-01-14 2014-05-07 株式会社メガチップス 画像処理装置
JP5536071B2 (ja) 2010-10-05 2014-07-02 エンパイア テクノロジー ディベロップメント エルエルシー 空間光パターンに基づく深さデータの生成
KR20130108457A (ko) 2011-03-09 2013-10-02 닛본 덴끼 가부시끼가이샤 영상 부호화 장치, 영상 복호 장치, 영상 부호화 방법 및 영상 복호 방법
CN103548350B (zh) 2011-06-28 2017-03-01 日本电气株式会社 图像编码设备和图像解码设备
US20130188691A1 (en) * 2012-01-20 2013-07-25 Sony Corporation Quantization matrix design for hevc standard
US10356428B2 (en) * 2015-04-13 2019-07-16 Qualcomm Incorporated Quantization parameter (QP) update classification for display stream compression (DSC)
WO2017082698A1 (ko) * 2015-11-11 2017-05-18 삼성전자 주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
US20180041870A1 (en) * 2016-08-05 2018-02-08 Wymond Choy Detection Using NFC Open Circuit
KR102636100B1 (ko) 2016-12-16 2024-02-13 삼성전자주식회사 데드존에 기초하여 양자화를 수행하는 인코더 및 이를 포함하는 비디오 처리 시스템

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146685A (ja) * 1984-08-13 1986-03-06 Nec Corp 動画像信号の予測符号化装置
JPS62209984A (ja) * 1986-03-10 1987-09-16 Nec Corp 画像信号の符号化方法およびその装置
JPH02105792A (ja) * 1988-10-14 1990-04-18 Nippon Telegr & Teleph Corp <Ntt> 直交変換係数量子化回路
JPH0440118A (ja) * 1990-06-05 1992-02-10 Matsushita Electric Ind Co Ltd 量子化器
JPH05308629A (ja) * 1992-05-01 1993-11-19 Olympus Optical Co Ltd 動画像符号化方式
JPH07236142A (ja) * 1993-10-18 1995-09-05 Mitsubishi Electric Corp 高能率符号化装置及び復号化装置
JP2003230142A (ja) * 2001-11-30 2003-08-15 Sony Corp 画像情報符号化方法及び装置、並びにプログラム及び記録媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1066079A (en) * 1906-06-30 1913-07-01 Ashton Valve Company Signal for trains.
CA1277416C (en) * 1984-08-13 1990-12-04 Akihiro Furukawa Inter-frame predictive coding apparatus for video signal
JPH06146685A (ja) * 1992-10-30 1994-05-27 Oi Seisakusho Co Ltd 自動車用ドアロックの操作装置
US5724097A (en) * 1993-10-18 1998-03-03 Mitsubishi Denki Kabushiki Kaisha Adaptive quantization of video based on edge detection
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
JP2830855B2 (ja) 1996-08-22 1998-12-02 日本電気株式会社 適応量子化制御装置
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6408026B1 (en) * 1999-08-06 2002-06-18 Sony Corporation Deadzone quantization method and apparatus for image compression
US7003038B2 (en) 1999-09-27 2006-02-21 Mitsubishi Electric Research Labs., Inc. Activity descriptor for video sequences
CN1199468C (zh) * 2000-01-12 2005-04-27 皇家菲利浦电子有限公司 图像数据压缩
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
TWI323613B (en) * 2002-07-29 2010-04-11 Qualcomm Inc Digital image encoding
US6853318B1 (en) * 2003-12-30 2005-02-08 Eastman Kodak Company Digital image compression utilizing shrinkage of subband coefficients
EP1564997A1 (en) * 2004-02-12 2005-08-17 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images based on a quantization with an adaptive dead-zone size
KR100860147B1 (ko) 2004-02-20 2008-09-24 닛본 덴끼 가부시끼가이샤 화상 부호화 방법, 그 장치 및 제어 프로그램을 기록한 컴퓨터 판독가능한 기록 매체

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146685A (ja) * 1984-08-13 1986-03-06 Nec Corp 動画像信号の予測符号化装置
JPS62209984A (ja) * 1986-03-10 1987-09-16 Nec Corp 画像信号の符号化方法およびその装置
JPH02105792A (ja) * 1988-10-14 1990-04-18 Nippon Telegr & Teleph Corp <Ntt> 直交変換係数量子化回路
JPH0440118A (ja) * 1990-06-05 1992-02-10 Matsushita Electric Ind Co Ltd 量子化器
JPH05308629A (ja) * 1992-05-01 1993-11-19 Olympus Optical Co Ltd 動画像符号化方式
JPH07236142A (ja) * 1993-10-18 1995-09-05 Mitsubishi Electric Corp 高能率符号化装置及び復号化装置
JP2003230142A (ja) * 2001-11-30 2003-08-15 Sony Corp 画像情報符号化方法及び装置、並びにプログラム及び記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1718080A4 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010268508A (ja) * 2004-02-20 2010-11-25 Nec Corp 画像符号化方法、その装置及びその制御プログラム
US8743956B2 (en) 2004-02-20 2014-06-03 Nec Corporation Image encoding method, device thereof, and control program thereof
JP2010541454A (ja) * 2007-10-04 2010-12-24 サムスン エレクトロニクス カンパニー リミテッド 復号化器での量子化係数調整方法及び装置
WO2015045301A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 映像符号化装置、映像符号化方法および映像符号化プログラム

Also Published As

Publication number Publication date
JP2010268508A (ja) 2010-11-25
EP2611157A1 (en) 2013-07-03
TW200529672A (en) 2005-09-01
EP1718080A1 (en) 2006-11-02
CN1922886A (zh) 2007-02-28
EP2290986A1 (en) 2011-03-02
JP4952828B2 (ja) 2012-06-13
EP1718080A4 (en) 2011-01-12
KR20060118593A (ko) 2006-11-23
TWI255651B (en) 2006-05-21
JP4613909B2 (ja) 2011-01-19
CN1922886B (zh) 2012-08-01
KR100860147B1 (ko) 2008-09-24
US20070140333A1 (en) 2007-06-21
JPWO2005081540A1 (ja) 2008-03-06
US8743956B2 (en) 2014-06-03

Similar Documents

Publication Publication Date Title
WO2005081540A1 (ja) 画像符号化方法、その装置及びその制御プログラム
US8498335B2 (en) Adaptive deadzone size adjustment in quantization
JP4747975B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
JP4187405B2 (ja) 符号化方式におけるオブジェクトベースのレート制御装置及びその方法
KR0184905B1 (ko) 부호량제어장치 및 이것을 사용한 부호화장치
KR20060072070A (ko) 이미지 또는 픽쳐 시퀀스를 인코딩하는데 사용될 수 있는양자화 매트릭스를 발생하는 방법 및 장치
US7430329B1 (en) Human visual system (HVS)-based pre-filtering of video data
CN105379269A (zh) 兴趣区域感知的视频编码
KR19990076563A (ko) 동화상 부호화 방식
JP2004527960A (ja) メディアプロセッサにおけるmpeg2デコード処理の動的複雑性予測及び調整
GB2306846A (en) Determining quantization interval in video signal encoder
WO2002054772A2 (en) Method of performing video encoding rate control using bit budget
KR20080108538A (ko) 비디오 코딩 방법
KR100708182B1 (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
JP6946979B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
KR20100012149A (ko) 양자화/역 양자화 장치 및 방법과 그를 이용한 영상부호화/복호화 장치
JP3069144B2 (ja) 動画像符号化装置
KR20020087810A (ko) 미세입자 스케일러블 코딩의 적응적 선택 강화 적용 방법
JP2005005862A (ja) 画像符号化装置
Tun et al. An efficient rate control algorithm for a wavelet video codec
Mahmood et al. A content-aware quantisation mechanism for transform domain distributed video coding
JPH05219496A (ja) 画像符号化装置及び動画像符号化装置
US20060182175A1 (en) Image encoding apparatus, image encoding method, and computer program product
Tun et al. Rate control algorithm based on quality factor optimization for Dirac video codec
KR0141297B1 (ko) 비선형 양자화방법

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPEN Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2006510197

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2005719145

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2007140333

Country of ref document: US

Ref document number: 10598154

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 200580005493.7

Country of ref document: CN

Ref document number: 1020067016716

Country of ref document: KR

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWP Wipo information: published in national office

Ref document number: 2005719145

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067016716

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 10598154

Country of ref document: US