WO2007148619A1 - 動画像復号装置、復号画像記録装置、それらの方法及びプログラム - Google Patents

動画像復号装置、復号画像記録装置、それらの方法及びプログラム Download PDF

Info

Publication number
WO2007148619A1
WO2007148619A1 PCT/JP2007/062086 JP2007062086W WO2007148619A1 WO 2007148619 A1 WO2007148619 A1 WO 2007148619A1 JP 2007062086 W JP2007062086 W JP 2007062086W WO 2007148619 A1 WO2007148619 A1 WO 2007148619A1
Authority
WO
WIPO (PCT)
Prior art keywords
pixel
decoded image
image
compression
prediction
Prior art date
Application number
PCT/JP2007/062086
Other languages
English (en)
French (fr)
Inventor
Junji Tajime
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to JP2008522422A priority Critical patent/JP4973886B2/ja
Publication of WO2007148619A1 publication Critical patent/WO2007148619A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • Moving picture decoding apparatus decoded picture recording apparatus, method and program thereof
  • the present invention relates to a moving picture decoding apparatus that receives a compressed and encoded moving picture bit stream, and particularly to reduce a decoded picture in order to reduce a memory capacity and a memory band necessary for decoding, or
  • the present invention relates to a moving image decoding apparatus, a decoded image recording apparatus, a method and a program thereof, each including a reduction and compression unit.
  • MPEG-2 VIDEO ISO 13818-2 / ITU-TH.262
  • MPEG-4 Visual ISO 14496-2
  • H.264 ITU-T H Digital video compression encoding methods such as .264 / ISO 14496-10
  • a moving picture decoding apparatus that receives a compressed and encoded moving picture bit stream has a large memory capacity and memory bandwidth due to the complexity of the compression coding scheme and the increase in resolution of the decoding target picture. Necessary and problematic for implementation.
  • a moving picture decoding apparatus including means for reducing, reducing, or compressing a decoded image.
  • a typical technique of such a moving picture decoding apparatus provided with means for reducing or reducing and compressing a decoded picture for example, a conventional moving picture decoding apparatus described in Patent Document 1 is shown in FIG. .
  • This video decoding apparatus includes a decoding unit 201 (buffer 2011, VLD2012, inverse quantization 2013, inverse DCT2014, Karo calculation 2015, motion compensation 2016), a horizontal low-pass filter (LPF) and a decimation 202, a block compressor 203, horizontal upsample 204, block decompressor 205, 209, internal memory 'bus 206, MUXZDEMUX (multiplexing / distribution) 207, video' frame memory 208, display processor 210, display device 211, Consists of In the following description, the display functions (block decompressor 209, display processor 210, and display device 211) described in Patent Document 1 are the same as those for horizontal upsample 204 and block decompressor 205 during decoding.
  • the display functions (block decompressor 209, display processor 210, and display device 211) described in Patent Document 1 are the same as those for horizontal upsample 204 and block decompressor 205 during decoding.
  • Decoding section 201 decodes an image using the input compressed video bit stream and a reference image expanded by block decompressor 205 and expanded by horizontal upsample 204.
  • the decoded image decoded by the decoding unit 201 is reduced by the horizontal LPF and the decimation 202 and is compressed by the block compressor 203 for each pixel or for each compression processing unit, thereby reducing the amount of information.
  • the compressed data compressed by the horizontal LPF and the decimation 202 and compressed by the block compressor 203 is written into the video frame memory 208 to be used as a reference image of an image to be decoded later.
  • the written compressed data is expanded by the block decompressor 205 and expanded by the horizontal upsample 204 for decoding.
  • the amount of information can be reduced only by the reduction by the horizontal LPF and the decimation 202 and by the compression by the block compressor 203 alone.
  • H.264 is considered as the decoding unit 201 of the video decoding device disclosed in Patent Document 1.
  • FIG. 3 shows a block diagram of the decoding unit 31 in the H.264 decoding device.
  • H.264 is based on a hybrid code that combines motion compensation and frequency conversion. Intraframe prediction and deblocking filters are used.
  • the horizontal LPF and decimation 202 shown in Fig. 4 are reduced by 1/2 in the horizontal direction (3-tap LPF and even pixel positions are downsampled).
  • (1-D DPCM) the compression unit of the luminance signal is 8 pixels with the macroblock (MB) width, which is one of the H.264 compression coding processing units, horizontally reduced by 1/2, and the left pixel is the reference pixel.
  • the prediction error value is nonlinearly quantized with a fixed quantization representative value of 5 bits.
  • Figure 5 shows the normal (without means to reduce and compress) a video sequence.
  • the frame average luminance signal PSNR Pulak Signa Fto-Noise Ratio
  • PSNR Peak Signa Fto-Noise Ratio
  • the H.264 encoding condition is that the intra-prediction frame interval N is 15 frames, and the reference frame interval M is 3 frames.
  • the decoded image is not reduced! Unless the irreversible conversion method is used for the compression encoding method for compression, the reference image is reduced. And distortion due to compression.
  • Patent Document 1 Japanese Patent Laid-Open No. 10-66081 (Pages 9-11, Fig. 1)
  • Patent Document 2 JP-A-11-298892 (Fig. 1)
  • the moving picture decoding apparatus provided with the means for reducing and compressing disclosed in Patent Documents 1 and 2 may cause significant image quality degradation.
  • FIG. 6 shows the frame average luminance signal PSNR when a video sequence different from the video sequence described above is used.
  • the difference between the PSNR of the intra-prediction frames near 60 to 120 frames and 270 to 300 frames and the PSNR immediately before the intra-prediction frame is 10 dB or more.
  • the cause of the decrease in PSNR is related to reduction and compression processing.
  • an H.264 bit stream in which the image shown in FIG. 7 is compression-coded in the code mode shown in FIG.
  • the image shown in FIG. 7 has 15 consecutive black pixels from the edge of the image, and the original image starts from the 16th pixel.
  • the leftmost MB is the inter prediction MB of the still image
  • the right MB is the intra prediction MB
  • the prediction mode is the horizontal prediction shown in Fig. 9.
  • FIG. 10 shows the operation when the luminance signal of this H.264 bit stream is reduced and compressed, and expanded and expanded.
  • the pixel value changes greatly from the 15th pixel to the 16th pixel.
  • the pixel value changes greatly from the 13th pixel to the 15th pixel.
  • non-linear quantization is designed to allow distortion in cases where the prediction error value is large, so in addition to the 15th pixel mixed with large distortion due to reduction and compression, the 16th pixel is interpolated using that. The distortion also enters.
  • the MB at the left end of the inter prediction frame image is a black pixel, it is encoded as a still image. As a result, the MB at the same position in the intra prediction frame becomes the reference pixel. Since the MB on the right is an intra prediction MB and horizontal prediction, the 16th pixel column of the leftmost MB of the image is the reference pixel.
  • the MB reference pixel includes distortion caused by the reduction and compression of the intra prediction frame. As a result, when a predicted image is created by the horizontal prediction shown in Fig. 9, the distortion due to reduction and compression propagates to the entire MB.
  • intra prediction uses peripheral pixels as reference pixels
  • distortion due to reduction and compression is not limited to MB.
  • intra prediction MBs continue, distortion also propagates spatially.
  • a moving picture decoding apparatus provided with a conventional reduction or means for reducing and compressing
  • the problem is that the processing unit is reduced and compressed so that the distortion of each processing unit is minimized without considering the propagation of temporal and spatial distortions.
  • an object of the present invention is a reduction means or reduction that can suppress distortion propagation due to temporal and spatial compression, that is, image quality deterioration. It is another object of the present invention to provide a moving image decoding apparatus, a decoded image recording apparatus, a method and a program thereof, each including a compression unit.
  • the present invention for solving the above-mentioned problems is a decoding means for decoding a moving image bit stream that has been compression-encoded using a prediction process into an image signal, and a decoded image signal obtained by the decoding means.
  • a reduction means for reducing and obtaining a reduced image, a prediction frame memory means for holding the reduced image obtained by the reduction means, and reading the reduced image held in the prediction frame memory means In a moving picture decoding apparatus, comprising: an enlarging unit that supplies data used in a prediction process of a decoding unit; and an address control unit that controls writing or reading of a reduced image in the predicted frame memory unit
  • the reduction means determines the reference level for each pixel according to the pixel position referred to in the prediction process in the compression encoding method, and for a pixel with a high reference level, Large After image pixel value is close to the pixel value before reduction, is configured to perform control to take values, characterized Rukoto.
  • the present invention for solving the above-described problem is a method of recording a decoded image for creating a predicted image of the predictive image encoding / decoding method.
  • the estimated reference frequency is estimated and the decoded image area having a high reference frequency is lower than the decoded image area, and the pixel value after enlargement is closer to the pre-reduced pixel value than the decoded image area. It is characterized by doing so.
  • the present invention that solves the above-described problem is a decoded image recording method for creating a predicted image of a predictive image encoding / decoding method, and the decoding image is recorded when the decoded image is recorded after being reduced and compressed. Estimate the frequency with which the image area is referenced in the prediction, and set the decoded image area with a higher reference frequency so that the pixel value after enlargement is closer to the pixel value before the reduction than the decoded image area with a lower reference frequency. And compressing with high accuracy.
  • the present invention that solves the above-described problem is a program for recording a decoded image for creating a predicted image of a predictive image encoding / decoding method, and when the reduced image is recorded, A process for estimating the frequency with which a region is referred to in prediction, and a region with a higher reference frequency ⁇ The pixel value after enlargement is closer to the pixel value before the reduction than the region with a lower reference frequency than the decoded image region. It is characterized in that the information processing apparatus executes a process of taking
  • the present invention that solves the above-described problem is a program for recording a decoded image for creating a predicted image of a prediction image encoding / decoding method, and when the decoded image is recorded after being reduced and compressed,
  • the information processing apparatus executes a process for taking a value close to the pixel value and a process for compressing with high accuracy.
  • the present invention for solving the above-described problems is a decoded image recording apparatus for creating a predicted image of a predicted image encoding / decoding method, wherein when the decoded image is reduced and recorded, the area of the decoded image is recorded.
  • the estimated reference frequency is estimated and the decoded image area having a high reference frequency is lower than the decoded image area, and the pixel value after enlargement is closer to the pre-reduced pixel value than the decoded image area. It is characterized by having a reduction means.
  • the present invention that solves the above-described problem is a decoded image recording apparatus for creating a predicted image of a predictive image encoding / decoding method, wherein the decoding image is recorded when the decoded image is reduced and compressed and recorded.
  • the present invention for solving the above-mentioned problems is a moving picture decoding method for reducing a decoded picture signal and obtaining a reduced picture. A degree is determined, and for a pixel with a large reference degree, control is performed so that the pixel value after enlargement is close to the pixel value before reduction and takes a value.
  • the present invention for solving the above-described problems reduces the decoded image signal and uses different bits for each pixel.
  • a reference degree for each pixel is determined according to a pixel position referred to in prediction processing in the compression coding method, and For large pixels, control so that the pixel value after enlargement takes a value close to the pixel value before reduction, and control the amount of compressed data so that the number of allocated bits representing the quantized representative value is increased. It is characterized by that.
  • the present invention for solving the above problems is a program in a moving image decoding method for reducing a decoded image signal and obtaining a reduced image, and the program is referred to in a prediction process in a compression encoding method.
  • the degree of reference for each pixel is determined, and for pixels with a high degree of reference, the information processing device is controlled so that the pixel value after enlargement takes a value close to the pixel value before reduction. It is made to perform.
  • the present invention that solves the above-described problems is a moving picture decoding method in which a compressed image signal is obtained by reducing a decoded image signal, performing compression processing by assigning a different number of bits to each pixel, and obtaining compressed data.
  • the reference level for each pixel is determined according to the pixel position referenced in the prediction process in the encoding method, and for pixels with a high reference level, the pixel value after enlargement is close to the pixel value before reduction. It is characterized by controlling the amount of compressed data so as to control and increase the number of allocated bits representing the quantized representative value.
  • the present invention for solving the above problems is a program in a moving picture decoding method for reducing a decoded picture signal and obtaining a reduced picture, and the program is referred to in a prediction process in a compression coding system.
  • the degree of reference for each pixel is determined, and for pixels with a high degree of reference, the information processing device is controlled so that the pixel value after enlargement takes a value close to the pixel value before reduction. It is made to perform.
  • the present invention for solving the above problems is a program in a moving picture decoding method for obtaining compressed data by reducing a decoded image signal, performing quantization by assigning a different number of bits to each pixel, and performing compression processing.
  • the program determines the reference level for each pixel in accordance with the pixel position referenced in the prediction process in the compression encoding method, and for a pixel with a large reference level, the pixel value after enlargement is the same as that before reduction. It is characterized in that the information processing device is caused to execute processing for controlling the amount of compressed data so as to increase the number of allocated bits representing the quantized representative value, while controlling to take a value close to the pixel value.
  • the effect of the present invention can provide a reduction means that can suppress distortion due to reduction or compression, that is, reduction of image quality, or a moving picture decoding apparatus that includes reduction and compression means, and a technique thereof.
  • the reason is that the ease of referring to a certain pixel position in the frame from the pixel position referred to by the compression coding method targeted by the decoding device is set in advance, and the reference degree weighting reduction unit 102 or Since the reference degree weighting compression unit 106 is implemented, the reference degree weighting reduction unit 102 determines LPF coefficients so that the image characteristics after enlargement retain the image characteristics before reduction for pixels that are easily referred to. Therefore, the reference weighting compression unit 106 applies the number of bits assigned to the quantization representative value (the number of quantization representative values) to the pixels that are easily referred to. ), And compress it. As a result, it is possible to reduce distortion of pixels that are easily referred to and to suppress propagation of temporal and spatial distortion.
  • the ease of reference is not limited to the pixel position to be referred to by the compression coding method, the compression coding processing unit of the compression coding method targeted by the decoding device, and the reference weighting reduction unit. It may be set using any one or more of a reduction ratio, a pixel thinning position, a pixel position referred to by the compression coding method targeted by the reference degree weighting compression unit, a compression processing unit, and a compression ratio.
  • FIG. 22 shows a frame average luminance signal PSNR in which the result of Example 2 is added to the result of FIG.
  • embodiment 2 shows the second embodiment. From the figure, it can be seen that PSNR degradation can be suppressed in the present invention.
  • FIG. 1 is a block diagram showing a configuration of an embodiment of the present invention.
  • FIG. 2 is a block diagram showing a configuration of a video decoding device disclosed in Patent Document 1.
  • FIG. 3 is a block diagram showing a configuration example using H.264 for the moving picture decoding apparatus disclosed in Patent Document 1.
  • FIG. 4 is a diagram showing an example of a compression code method used for reduction and compression of a decoded image.
  • FIG. 5 is a graph showing the effect of a conventional video decoding device.
  • FIG. 11 is a block diagram showing the configuration of the second exemplary embodiment of the present invention.
  • FIG. 12 is a diagram showing the reference degree of each pixel position in the first embodiment.
  • FIG. 13 is a diagram showing another reference degree of each pixel position in the first embodiment.
  • FIG. 14 is a diagram showing another reference degree of each pixel position in the first embodiment.
  • FIG. 15 is a diagram illustrating the number of bits assigned to the quantized representative value at each pixel position and the reference relationship in the second embodiment.
  • FIG. 16 is a diagram showing a reference degree at the time of reduction of each pixel position, the number of assigned bits of quantized representative values, and a reference relationship in Example 2.
  • FIG. 17 is a diagram showing the number of bits assigned to the quantized representative value at each pixel position and the reference relationship in Example 2.
  • FIG. 18 is a diagram showing the number of bits assigned to the quantized representative value at each pixel position and the reference relationship in Example 2.
  • FIG. 19 is a diagram showing the number of bits assigned to the quantized representative value at each pixel position and the reference relationship in Example 2.
  • FIG. 20 is a diagram illustrating the number of bits assigned to the quantized representative value at each pixel position and the reference relationship in the second embodiment.
  • FIG. 21 is a general block configuration diagram of an information processing system that implements the video decoding device according to the present invention in the third embodiment.
  • FIG. 22 is a diagram showing a frame average luminance signal PSNR in which the result of Example 2 is added to the result of FIG. 6.
  • FIG. 1 is a block diagram showing the overall configuration of a video decoding device according to an embodiment of the present invention. is there.
  • the moving picture decoding apparatus includes a decoding unit 101, a reference degree weighting reduction unit 102, a prediction frame memory unit 103, an expansion unit 104, and an address control unit 105.
  • Decoding section 101 decodes an image using the input compressed video bit stream and the reference image expanded by expansion section 104.
  • the decoded image decoded by the decoding unit 101 is reduced by the reference degree weighting reduction unit 102 to reduce the amount of information.
  • the image reduced by the reference degree weighting reduction unit 102 is written in the prediction frame memory unit 103 to be used as a reference image of an image to be decoded later.
  • the address control unit 105 creates an address of a frame memory to which a reduced image is written, and supplies the frame memory address to the prediction frame memory unit 103 via an address line.
  • the written reduced image is enlarged by the enlargement unit 104 for decoding.
  • the reference level represents the ease with which a certain pixel position in the frame is referred to (frequency used for prediction), and the accurate reference level can also be obtained by analyzing the compressed video bitstream. it can.
  • the reference position is estimated and determined in advance for the pixel position force referred to by the compression coding method targeted by the decoding apparatus.
  • the reference degree weighting reduction unit 102 performs the same operation as the horizontal LPF and the decimation 202 in that the decoded image is reduced. However, since the reduction method of the reference degree weighting reduction unit 102 is designed and implemented in consideration of the estimated reference degree, the reference degree is large V, and the image characteristics after enlargement are not reduced for pixel values.
  • the coefficient of the LPF is determined so as to preserve the image characteristics, and the control is performed so as not to be the pixel to be thinned out, and the image is reduced.
  • the reference level is the compression coding processing unit of the compression coding method targeted by the decoding device, the reduction rate of the reference degree weighting reduction unit 102, and the pixel thinning. You can set the position using one or more displacements! /.
  • FIG. 11 shows the entire moving picture decoding apparatus according to the second embodiment of the present invention. It is a block diagram showing the configuration.
  • the video decoding device of the second embodiment refers to the video decoding device of the first embodiment.
  • a degree weighting compression unit 106 and an expansion unit 107 are added.
  • Decoding section 101 decodes an image using the input compressed video bitstream and the reference image expanded by expansion section 107 and expanded by expansion section 104.
  • the decoded image decoded by the decoding unit 101 is reduced by the reference degree weighting reduction unit 102 and compressed by the reference degree weighting compression unit 106 for each pixel or for each compression processing unit, thereby reducing the amount of information.
  • the compressed data compressed by the reference degree weighting reduction unit 102 and compressed by the reference degree weighting compression unit 106 is written to the prediction frame memory unit 103 to be used as a reference image of an image to be decoded later.
  • the address control unit 105 creates an address of the frame memory to which the compressed data is written, and supplies the frame memory address to the prediction frame memory unit 103 via the address line.
  • the written compressed data is expanded by the expansion unit 107 and expanded by the expansion unit 104 for recovery.
  • the reference degree weighting compression unit 106 operates in the same manner as the block compressor 203 in that the decoded image is compressed. However, the compression code method targeted by the reference degree weighting compression unit 106 is designed and implemented in consideration of the estimated reference degree.
  • the reference level is the compression coding processing unit of the compression coding method targeted by the decoding device, the reduction rate of the reference degree weighting reduction unit 102, and the pixel thinning. It may be set using any one or more of the position, compression processing unit, and compression rate of the compression code method targeted by the position and reference degree weighting compression unit 106.
  • H.264 is used as the decoding unit 101, and the reference degree weighting reduction unit 102 performs horizontal half reduction.
  • the reference degree in the reference degree weighting reduction unit 102 is determined from the reference pixel position of H.264 intra prediction, the compression encoding processing unit, the reduction rate, and the pixel thinning position.
  • 2, 4, 8, and 16 can be considered as processing units for H.264 compression codes.
  • the reduction ratio is 1/2.
  • the reference degree is determined by Equation 1 (Equation 1).
  • This reference degree considers the reference pixel position and reduction rate of H.264 intra prediction, and the position of the inter-pixel arch in the downsample, and satisfies R0> R1> R2.
  • the LPF used in the reference degree weighting reduction unit 102 changes the filter strength in accordance with the reference degree.
  • a 3-tap filter processing such as (4, 8, 4) / 16 is performed on the reference degree R1
  • the image characteristic after enlargement shows the pre-reduction image characteristic for R0 with a large R beam reference degree.
  • Filter processing of (3, 10, 3) / 16 or (0, 16, 0) / 16 is performed so as to hold it.
  • R2 with the smallest reference level is the pixel to be thinned out of the downsample.
  • FIG. 12 shows the reference degrees in the present example.
  • reference pixel positions and reduction rate power reference degrees R0, Rl, and R2 for intra prediction are set, and for pixels with a large reference degree, the image characteristics after enlargement are the image characteristics before reduction. Decide the LPF coefficient so that it will be retained, and reduce it by applying control such that it is not the pixel to be thinned out! /.
  • the reference pixel position of intra prediction, the reduction rate Considering the position of the inter-pixel arch, I would like to reduce the pixel with the reference degree R0 to reduce aliasing in the reduced image.
  • R0 pixels can be reduced.
  • R0 only for the intra reference pixel position of the vertical MB boundary as shown in FIG.
  • a filter with an arbitrary number of taps can be determined according to the force reference degree using a 3-tap filter.
  • the force using horizontal reduction can be similarly determined for vertical reduction and horizontal and vertical reduction.
  • the decoding unit 101 and the reference degree weighting reduction unit 102 are the same as those in the first embodiment, the description thereof will be omitted, and the operation of the reference degree weighting compression unit having a different operation will be described.
  • 1-D DPCM is used as the compression coding method of the reference degree weighting compression unit 106.
  • an X pixel is used as a compression processing unit.
  • the value of X is determined from the H.264 compression encoding processing unit and ease of implementation.
  • the reference degree used in the reference degree weighting compression unit is determined by Expression 2 (Equation 2).
  • This reference degree considers the pixel position to be referred to as “uses the left block of the intra prediction code target block as a reference pixel” of H.264, and satisfies R0> R1.
  • the reference degree is used as it is as the number of bits assigned to the quantization representative value.
  • the compression rate of the reference degree weighting compression unit is determined by R0 and R1.
  • FIG. 15 shows the number of bits assigned to quantized representative values and the reference relationship in this embodiment.
  • the right end pixel of the compression processing unit is set as the start point of the prediction pixel, and the right pixel is set as the prediction pixel.
  • FIG. 12 an example of the reference degree used in the reduction unit shown in FIG. 12 is shown, but the present invention is not limited to this, and can be applied to combinations of various reduction methods such as FIGS.
  • two reference degrees are defined within the compression processing unit, but it is also possible to determine a reference degree for each pixel.
  • the propagation of distortion becomes smaller as it is closer to the left end pixel. It is also possible to determine such that the right pixel in the logical unit increases the reference degree.
  • the right pixel and the left pixel in FIG. 4 are the predicted pixels, but the upper pixel or the lower pixel can be the predicted pixel.
  • the vertical pixel position is the same as in Equation 2 (Equation 2).
  • the degree of reference should be defined and the lower pixel should be the predicted pixel.
  • the right pixel is the predicted pixel.
  • Equation 3 Equation 3
  • Equation 3 Equation 3
  • FIG. 17 shows the number of bits assigned to the quantized representative value and the reference relationship when X is 8 in this embodiment.
  • FIGS. 16 and 17 are effective if the block including the reference pixel is encoded as a still image as shown in FIGS.
  • the reference degree is determined so that the probability that a block referred to by inter prediction includes a reference pixel having an assigned bit number R0 is high.
  • the reference degree is not equal to pixels adjacent vertically or horizontally.
  • the reference degree is determined by Equation 4 (Equation 4).
  • FIG. 18 shows the number of bits assigned to quantized representative values and the reference relationship in this embodiment.
  • Equation 5 Equation 5
  • FIG. 5 Equation 5
  • is an integer greater than or equal to 0.
  • a compression coding method using inter prediction other than ⁇ .264 can be used as the decoding unit 101.
  • 1-D DPCM is used as the compression coding method of the reference degree weighting compression unit 106.
  • any method can be used as the compression code key method. Therefore, in this embodiment, 2D DPCM (2-D DPCM) is used as the compression code method.
  • 2-D DPCM uses a block of horizontal X pixels X vertical Y pixels as a compression processing unit. X and Y values are
  • Equation 6 Equation 6
  • This reference degree is H.264 “Use the left block of the target block of the code key as a reference pixel”, “Intra prediction code target block” Consider the pixel position referred to as “use the upper block as a reference pixel”.
  • the reference degree is used as it is as the number of bits assigned to the quantized representative value as in the 1-D DPCM.
  • FIG. 20 shows the number of bits assigned to the quantized representative value and the reference relationship in this embodiment.
  • the lower right pixel of the compression processing unit is the starting point of the prediction pixel
  • the pixel using 1-D DPCM is the right or lower pixel
  • the pixel using 2-D DPCM is the right, bottom
  • the three pixels at the lower right are the predicted pixels.
  • the moving picture decoding apparatus can also be realized by a force computer program that can be configured by hardware.
  • FIG. 21 is a general block configuration diagram of an information processing system that implements a video decoding device according to the present invention.
  • the information processing system shown in FIG. 21 includes a processor 400, a program memory 401, and a storage medium 402.
  • the storage medium 402 may be a separate storage medium or a storage area having the same storage medium power.
  • a magnetic storage medium such as a RAM or a hard disk can be used, and plays the role of the prediction frame memory unit 103 described above.
  • the program memory 401 includes the decoding unit 101, the reference degree weighting reduction unit 102, the enlargement unit 104, the address control unit 105, the reference degree weighting compression unit 106, and the decompression unit 107 described above.
  • a program for causing the processor 400 to execute the processing of each part of the above is stored, and the processor 400 operates by this program.
  • the decoding unit 101 the reference degree weighting reduction unit 102, the enlargement unit 104, the address control unit 105, the reference degree weighting compression unit 106, and the decompression unit 107, and some of them are not known. Even if it is configured with hardware, it will not work.
  • Examples of utilization of the present invention include digital video decoding devices such as digital broadcast tuners, HDD recorders, and DVD players.

Abstract

動画像復号装置は、復号装置が対象とする圧縮符号化方式の参照する画素位置からフレーム内のある画素位置の参照されやすさが設定された参照度重み付け縮小部102および参照度重み付け圧縮部106を、実装している。参照度重み付け縮小部102では、参照されやすい画素に対しては、拡大後の画像特性が縮小前の画像特性を保持するようにLPFの係数を定め、間引きの対象画素としないような制御をかけ縮小し、参照度重み付け圧縮部106は、参照されやすい画素に対しては量子化代表値の割り当てビット数(量子化代表値数)を多くするような制御をかけ、圧縮する。

Description

明 細 書
動画像復号装置、復号画像記録装置、それらの方法及びプログラム 技術分野
[0001] 本発明は、圧縮符号化された動画像ビットストリームを入力とする動画像復号装置 に関し、特に、復号に必要となるメモリ容量及びメモリ帯域を削減するために復号画 像を縮小、あるいは縮小および圧縮する手段を備えた動画像復号装置、復号画像 記録装置、それらの方法及びプログラムに関する。
背景技術
[0002] 近年のデジタル技術の急速な進歩に伴い、 MPEG-2 VIDEO (ISO 13818-2/ITU- TH.262), MPEG- 4 Visual (ISO 14496-2)、 H.264(ITU-T H.264/ISO 14496- 10)など に代表されるデジタル動画像圧縮符号化方式が広く利用されるようになった。
[0003] しかし、圧縮符号化された動画像ビットストリームを入力とする動画像復号装置は、 圧縮符号化方式の複雑化、復号対象画像の高解像度化により、多大なメモリ容量及 びメモリ帯域を必要とし、実装する上で問題となっている。
[0004] この問題を解決する一つの方法として、復号画像を縮小、ある 、は縮小および圧縮 する手段を備えた動画像復号装置が開示されている。このような、復号画像を縮小、 あるいは縮小および圧縮する手段を備えた動画像復号装置の代表的な技術として、 例えば、特許文献 1に記載されている従来の動画像復号装置を図 2に示す。
[0005] この動画像復号装置は、復号部 201(バッファ 2011、 VLD2012,逆量子化 2013 、逆 DCT2014、カロ算 2015、動き補償 2016)と、水平ローパスフィルタ(LPF)および デシメーシヨン 202と、ブロックコンプレッサ 203と、水平アップサンプル 204と、ブロッ クデコンブレッサ 205、 209と、内部メモリ'バス 206と、 MUXZDEMUX (多重化/ 分配) 207と、ビデオ'フレームメモリ 208と、ディスプレイプロセッサ 210と、ディスプレ イデバイス 211とから構成される。尚、以下の説明において、特許文献 1に記載され ている表示機能 (ブロックデコンブレッサ 209、ディスプレイプロセッサ 210、ディスプ レイデバイス 211)に関しては、復号時の水平アップサンプル 204およびブロックデコ ンプレッサ 205と同様の動作となるので説明を省略する。 [0006] 復号部 201は、入力された圧縮動画像ビットストリームと、ブロックデコンブレッサ 20 5で伸長、水平アップサンプル 204で拡大された参照画像を用いて画像を復号する 。復号部 201で復号された復号画像は、水平 LPFおよびデシメーシヨン 202で縮小 され、ブロックコンプレッサ 203で、画素ごとあるいは圧縮処理単位ごとに圧縮され、 情報量が削減される。
[0007] 水平 LPFおよびデシメーシヨン 202で縮小、ブロックコンプレッサ 203で圧縮された 圧縮データは、後に復号する画像の参照画像として用いられるためにビデオ'フレー ムメモリ 208へ書き込まれる。
[0008] 書き込まれた圧縮データは、復号のためにブロックデコンブレッサ 205で伸長、水 平アップサンプル 204で拡大される。
[0009] 尚、説明では復号画像を縮小および圧縮する場合につ!ヽて述べたが、水平 LPF およびデシメーシヨン 202による縮小のみ、ブロックコンプレッサ 203による圧縮のみ でも情報量の削減は可能である。
[0010] また、同様の発明が、特許文献 2にも開示されている。
[0011] 次に具体例を用いて特許文献 1に開示された動画像復号装置の効果を示す。尚、 以下の説明にお 、て、特許文献 1に開示された動画像復号装置の復号部 201として H.264を考える。
[0012] 図 3に H.264復号装置における復号部 31のブロック図を示す。
[0013] H.264は、 MPEG-2 VIDEOや MPEG-4 Visualと同様に、動き補償と周波数変換を組 み合わせたハイブリッド符号ィ匕をベースにしており、さらに新しい技術であるイントラ( 空間、フレーム内)予測、デブロックフィルタが用いられている。
[0014] 図 4に示す水平 LPFおよびデシメーシヨン 202として、水平 1/2縮小 (3タップの LPF および偶数画素位置をダウンサンプル)、ブロックコンプレッサ 203の圧縮符号ィ匕方 式として、 1次元の差分 PCM(1-D DPCM)を考える。図 4より輝度信号の圧縮処理単 位は H.264の圧縮符号化処理単位の一つであるマクロブロック (MB: Macroblock)幅を 水平 1/2縮小した 8画素とし、左画素を参照画素とし、予測誤差値は 5ビット固定の量 子化代表値を持つ非線形量子化を行う。
[0015] 図 5に、ある映像シーケンスにおける通常の (縮小および圧縮する手段を持たない) H.264復号装置の復号画像を基準とした、縮小および圧縮する手段を備えた H.264 復号装置の復号画像のフレーム平均輝度信号 PSNR(Peak SignaFto-Noise Ratio)を 示す。
[0016] ここで、 H.264の符号化条件は、イントラ予測フレーム間隔 Nを 15フレーム、参照フ レーム間隔 Mを 3フレームとしている。
[0017] 縮小および圧縮する手段を備えた動画像復号装置では復号画像を縮小しな!ヽ、か つ圧縮する圧縮符号ィヒ方式に非可逆変換方式を利用しない限り、参照画像には縮 小および圧縮による歪みが含まれる。
[0018] この歪みはイントラ予測フレームが復号されるまで蓄積することになる。
[0019] このことは図 5において、 PSNRの劣化周期が Nフレームであることからも確認できる
[0020] ただし、画質劣化は生じるものの、表示する画像サイズが小さい場合などの簡易的 な復号の用途では、劣化を許容できる場合もあり、縮小および圧縮する手段を備え た動画像復号装置は効果がある。
特許文献 1 :特開平 10-66081号公報 (第 9-11頁、図 1)
特許文献 2:特開平 11-298892号公報 (図 1)
発明の開示
発明が解決しょうとする課題
[0021] しカゝしながら、これらの特許文献 1〜2に開示された縮小および圧縮する手段を備 えた動画像復号装置は、著 ヽ画質劣化が生じる場合がある。
[0022] 具体例を用いて画質劣化の原因を説明する。
[0023] 先に述べた映像シーケンスと異なる映像シーケンスを用いた場合のフレーム平均 輝度信号 PSNRを図 6に示す。
[0024] 図 6ではフレーム数が、 60〜120フレーム及び 270〜300フレーム付近のイントラ 予測フレームの PSNRとイントラ予測フレーム直前の PSNRとの差は 10dB以上にもなる
[0025] PSNRが低下する原因は縮小および圧縮の処理が関係している。例えば、図 7に示 す画像が図 8に示す符号ィ匕モードで圧縮符号化された H.264ビットストリームを考える [0026] 図 7に示した画像は、画像端から 15画素連続して黒い画素があり、 16画素目から 本来の画像が始まる。また、この H.264ビットストリームにおけるインター (フレーム間) 予測フレームは画像左端の MBが静止画のインター予測 MBとして、右隣の MBがイン トラ予測 MBかつ予測モードは図 9に示す水平方向予測として符号化されている。
[0027] ここで、 H.264ではイントラ予測モード、イントラ予測対象のブロックサイズは複数存 在するが、説明を簡単にするため、ブロックサイズが 16 X 16の水平方向予測として いる。この H.264ビットストリームの輝度信号を縮小および圧縮し、伸長および拡大し た時の動作を図 10に示す。
[0028] イントラ予測フレームでは通常の復号画素に対して水平 1/2縮小および 1-D DPCM 圧縮を行う。この例の場合、 15画素目から 16画素目にかけ画素値の変化が大きい。 そして、 LPFや、偶数画素位置のダウンサンプルによる間引きを考慮すると、 13画素 目から 15画素目にかけ画素値の変化が大きくなる。通常、非線形の量子化は予測 誤差値が大き 、場合に歪みを許容するように設計するので、縮小および圧縮による 大きな歪みが混入した 15画素目に加え、それを利用し補間される 16画素目にも歪 みが混入する。
[0029] インター予測フレームの画像左端の MBは多くの画素が黒い画素であるので静止画 として符号化される。その結果、イントラ予測フレームにおける同位置の MBが参照画 素となる。右隣の MBはイントラ予測 MBかつ水平方向予測なので画像左端 MBの 16 画素目の一列が参照画素となる。ここで、この MBの参照画素はイントラ予測フレーム の縮小および圧縮で生じた歪みを含んでいる。その結果、図 9に示した水平方向予 測で予測画像を作成すると縮小および圧縮による歪みは MB全体に伝播する。
[0030] このように、イントラ予測では参照画素として周辺画素を利用するので、縮小および 圧縮による歪みは MBだけでなぐイントラ予測 MBが連続する場合、歪みは空間的に も伝播する。
[0031] さらに、このインター予測フレームが参照フレームとして利用される場合、歪みは時 間的にも伝搬する。その結果、著しい画質劣化が生じる。
[0032] 従って、従来の縮小、あるいは縮小および圧縮する手段を備えた動画像復号装置 の問題点は、時間的、空間的な歪みの伝搬を考慮せずに、各処理単位の歪みが最 小となるように縮小および圧縮していることである。
[0033] そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、時間的 、空間的な圧縮による歪みの伝搬、すなわち画質劣化を抑制できる縮小手段、ある いは縮小および圧縮手段を備えた動画像復号装置、復号画像記録装置、それらの 方法及びプログラムを提供することにある。
課題を解決するための手段
[0034] 上記課題を解決する本発明は、予測処理を利用して圧縮符号化された動画像ビッ トストリームを画像信号へ復号する復号手段と、前記復号手段により得られた復号画 像信号を縮小し、縮小画像を得る縮小手段と、前記縮小手段により得られた縮小画 像を保持する予測フレームメモリ手段と、前記予測フレームメモリ手段に保持された 縮小画像を読み出し、これを拡大した後に前記復号手段の予測処理で利用するデ ータとして供給する拡大手段と、前記予測フレームメモリ手段に対する縮小画像の書 き込み、又は、読み出しを制御するアドレス制御手段とを有する動画像復号装置に おいて、前記縮小手段は、圧縮符号化方式における予測処理で参照される画素位 置に従い、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画 素値が縮小前の画素値に近 、値をとるように制御を行うように構成されて 、ることを 特徴とする。
[0035] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像の記録方法であって、復号画像を縮小して記録する時に、前記復号 画像の領域が予測で参照される頻度を推定し、参照頻度の高 ヽ復号画像の領域を 、参照頻度の低 、復号画像の領域よりも拡大後の画素値が縮小前の画素値に近 、 値をとるようにすることを特徴とする。
[0036] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像の記録方法であって、復号画像を縮小および圧縮して記録する時 に、前記復号画像の領域が予測で参照される頻度を推定し、参照頻度の高い復号 画像の領域を、参照頻度の低い復号画像の領域よりも、拡大後の画素値が縮小前 の画素値に近い値をとるようし、かつ、高い精度で圧縮することを特徴とする。 [0037] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像を記録するプログラムであって、復号画像を縮小して記録する時に、 前記復号画像の領域が予測で参照される頻度を推定する処理と、参照頻度の高 ヽ 復号画像の領域を、参照頻度の低い復号画像の領域よりも拡大後の画素値が縮小 前の画素値に近 、値をとるようにする処理とを情報処理装置に実行させることを特徴 とする。
[0038] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像を記録するプログラムであって、復号画像を縮小および圧縮して記 録する時に、前記復号画像の領域が予測で参照される頻度を推定する処理と、参照 頻度の高!、復号画像の領域を、参照頻度の低!、復号画像の領域よりも拡大後の画 素値が縮小前の画素値に近 、値をとるようにする処理と、高!、精度で圧縮する処理 と、を情報処理装置に実行させることを特徴とする。
[0039] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像の記録装置であって、復号画像を縮小して記録する時に、前記復号 画像の領域が予測で参照される頻度を推定し、参照頻度の高 ヽ復号画像の領域を 、参照頻度の低 、復号画像の領域よりも拡大後の画素値が縮小前の画素値に近 、 値をとるようにする縮小手段を有することを特徴とする。
[0040] 上記課題を解決する本発明は、予測画像符号化復号方法の予測画像を作成する ための復号画像の記録装置であって、復号画像を縮小および圧縮して記録する時 に、前記復号画像の領域が予測で参照される頻度を推定し、参照頻度の高い復号 画像の領域を、参照頻度の低い復号画像の領域よりも拡大後の画素値が縮小前の 画素値に近 、値をとるようにする縮小手段および高 、精度で圧縮する圧縮手段を有 することを特徴とする。
[0041] 上記課題を解決する本発明は、復号画像信号を縮小し、縮小画像を得る動画像復 号方法において、圧縮符号ィ匕方式における予測処理で参照される画素位置に従い 、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮 小前の画素値に近 、値をとるように制御することを特徴とする。
[0042] 上記課題を解決する本発明は、復号画像信号を縮小し、画素ごとに、異なるビット 数を割り当てた量子化を行って圧縮処理を行い、圧縮データを得る動画像復号方法 において、圧縮符号化方式における予測処理で参照される画素位置に従い、画素 ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮小前の 画素値に近い値をとるように制御し、かつ、量子化代表値を表す割当ビット数を多く するように圧縮データ量を制御することを特徴とする。
[0043] 上記課題を解決する本発明は、復号画像信号を縮小し、縮小画像を得る動画像復 号方法におけるプログラムであって、前記プログラムは、圧縮符号化方式における予 測処理で参照される画素位置に従い、画素ごとの参照度を定め、参照度の大きい画 素に対しては、拡大後の画素値が縮小前の画素値に近い値をとるように制御する処 理を情報処理装置に実行させることを特徴とする。
[0044] 上記課題を解決する本発明は、復号画像信号を縮小し、画素ごとに、異なるビット 数を割り当てた量子化を行って圧縮処理を行い、圧縮データを得る動画像復号方法 において、圧縮符号化方式における予測処理で参照される画素位置に従い、画素 ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮小前の 画素値に近い値をとるように制御し、かつ、量子化代表値を表す割当ビット数を多く するように圧縮データ量を制御することを特徴とする。
[0045] 上記課題を解決する本発明は、復号画像信号を縮小し、縮小画像を得る動画像復 号方法におけるプログラムであって、前記プログラムは、圧縮符号化方式における予 測処理で参照される画素位置に従い、画素ごとの参照度を定め、参照度の大きい画 素に対しては、拡大後の画素値が縮小前の画素値に近い値をとるように制御する処 理を情報処理装置に実行させることを特徴とする。
[0046] 上記課題を解決する本発明は、復号画像信号を縮小し、画素ごとに、異なるビット 数を割り当てた量子化を行って圧縮処理を行い、圧縮データを得る動画像復号方法 におけるプログラムであって、前記プログラムは、圧縮符号化方式における予測処理 で参照される画素位置に従い、画素ごとの参照度を定め、参照度の大きい画素に対 しては、拡大後の画素値が縮小前の画素値に近い値をとるように制御し、かつ、量子 化代表値を表す割当ビット数を多くするように圧縮データ量を制御する処理を情報処 理装置に実行させることを特徴とする。 発明の効果
[0047] 本発明の効果は、縮小または圧縮による歪み、すなわち画質劣化を抑制できる縮 小手段、あるいは縮小および圧縮手段を備えた動画像復号装置及びその技術を提 供することができる。
[0048] その理由は、復号装置が対象とする圧縮符号化方式の参照する画素位置からフレ ーム内のある画素位置の参照されやすさを予め設定して、参照度重み付け縮小部 1 02あるいは参照度重み付け圧縮部 106を実装するので、参照度重み付け縮小部 1 02では、参照されやすい画素に対しては、拡大後の画像特性が縮小前の画像特性 を保持するように LPFの係数を定め、間引きの対象画素としな!/、ような制御をかけ、 縮小し、参照度重み付け圧縮部 106では、参照されやすい画素に対しては、量子化 代表値の割り当てビット数 (量子化代表値数)を多くするような制御をかけ、圧縮する。 その結果、参照されやすい画素の歪みを軽減し、時間的、空間的な歪みの伝搬を抑 制することが可能となるからである。
[0049] ここで、参照されやすさは、圧縮符号化方式の参照する画素位置に加え、復号装 置が対象とする圧縮符号化方式の圧縮符号化処理単位、参照度重み付け縮小部が 対象とする縮小率、画素の間引き位置、参照度重み付け圧縮部が対象とする圧縮符 号化方式の参照する画素位置、圧縮処理単位、圧縮率のいずれか一つ以上を用い て設定してもよい。
[0050] 本発明の実際の効果として、図 6の結果に実施例 2の結果をカ卩えたフレーム平均輝 度信号 PSNRを、図 22に示す。図 22中、 Embodiment2が実施例 2を示している。 図より本発明では PSNRの劣化が抑制できていることが分かる。
図面の簡単な説明
[0051] [図 1]本発明の実施形態の構成を示すブロック図である。
[図 2]特許文献 1に開示された動画像復号装置の構成を示すブロック図である。
[図 3]特許文献 1に開示された動画像復号装置にお!ヽて H.264を用いた構成例を示 すブロック図である。
[図 4]復号画像の縮小および圧縮に利用する圧縮符号ィ匕方式の一例を示す図であ る。 [図 5]従来の動画像復号装置の効果を示すグラフである。
圆 6]従来の動画像復号装置の問題点を示すグラフである。
圆 7]従来の動画像復号装置の問題点を説明するための具体例である。
圆 8]従来の動画像復号装置の問題点を説明するための具体例である。
圆 9]H.264イントラ予測モードを説明する図である。
圆 10]縮小および圧縮による歪み発生原因を説明する図である。
圆 11]本発明の第 2の実施形態の構成を示すブロック図である。
[図 12]実施例 1における各画素位置の参照度を示す図である。
[図 13]実施例 1における各画素位置の別の参照度を示す図である。
[図 14]実施例 1における各画素位置の別の参照度を示す図である。
圆 15]実施例 2における各画素位置の量子化代表値の割り当てビット数および参照 関係を示す図である。
[図 16]実施例 2における各画素位置の縮小時の参照度、量子化代表値の割り当てビ ット数および参照関係を示す図である。
圆 17]実施例 2における各画素位置の量子化代表値の割り当てビット数および参照 関係を示す図である。
圆 18]実施例 2における各画素位置の量子化代表値の割り当てビット数および参照 関係を示す図である。
圆 19]実施例 2における各画素位置の量子化代表値の割り当てビット数および参照 関係を示す図である。
圆 20]実施例 2における各画素位置の量子化代表値の割り当てビット数および参照 関係を示す図である。
圆 21]実施例 3における本発明による動画像復号装置をインプリメントした情報処理 システムの一般的ブロック構成図である。
[図 22]図 6の結果に実施例 2の結果をカ卩えたフレーム平均輝度信号 PSNRを示した図 である。
符号の説明
101、 201、 31 復号部 102 参照度重み付け縮小部
103 予測フレームメモリ部
104 拡大部
105 アドレス制御部
106 参照度重み付け圧縮部
107 伸長部
202 水平ローパスフィルタおよびデシメーシヨン
203 ブロックコンプレッサ
204 水平アップサンプル
205、 209 ブロックデコンブレッサ
206 内部メモリ'バス
207 多重化 Z分配
208 ビデオ.フレームメモリ
210 ディスプレイプロセッサ
211 ディスプレイデバイス
2011、 301 ノ ッファ
2012 可変長復号
2013、 303 逆量子化
2014 逆離散コサイン変換
2015、 305 加算
2016、 306 動き補償
302 可変長復号
304 逆整数変換
307 イントラ予測
308 デブロックフィノレタ
発明を実施するための最良の形態
[0053] 次に、本発明の実施の形態について図面を参照して詳細に説明する。
[0054] 図 1は、本発明の実施形態による動画像復号装置の全体構成を示すブロック図で ある。
本実施の形態の動画像復号装置は、復号部 101と、参照度重み付け縮小部 102と 、予測フレームメモリ部 103と、拡大部 104と、アドレス制御部 105とから構成される。
[0055] 次に、本実施の形態の動画像復号装置の動作を説明する。
[0056] 復号部 101は、入力された圧縮動画像ビットストリームと、拡大部 104で拡大された 参照画像を用いて画像を復号する。復号部 101で復号された復号画像は、参照度 重み付け縮小部 102で、縮小され、情報量が削減される。
[0057] 参照度重み付け縮小部 102で縮小された画像は、後に復号する画像の参照画像 として用いられるために予測フレームメモリ部 103へ書き込まれる。書き込みにおい ては、アドレス制御部 105は、縮小画像を書き込むフレームメモリのアドレスを作成し 、アドレス線を介して、予測フレームメモリ部 103に供給する。
[0058] 書き込まれた縮小画像は、復号のために拡大部 104で拡大される。
[0059] ここで参照度とは、フレーム内のある画素位置の参照されやすさ (予測に利用される 頻度)を表し、正確な参照度は圧縮動画像ビットストリームを解析することで求めること もできる。しかし、本実施の形態では、復号装置が対象とする圧縮符号化方式の参 照する画素位置力 予め参照度を推定し定める。
[0060] 参照度重み付け縮小部 102は、復号画像を縮小するという点では水平 LPFおよび デシメーシヨン 202と同様の動作をする。しかし、参照度重み付け縮小部 102の縮小 方式は推定された参照度を考慮して設計され、実装されているので、参照度が大き V、画素値に対しては拡大後の画像特性が縮小前の画像特性を保持するよう〖こ LPF の係数を定め、間引きの対象画素としないような制御をかけ、縮小する。ここで、参照 度は圧縮符号化方式の参照する画素位置に加え、復号装置が対象とする圧縮符号 化方式の圧縮符号化処理単位、参照度重み付け縮小部 102の縮小率、画素の間引 き位置の 、ずれか一つ以上を用いて設定してもよ!/、。
[0061] 次に、本発明の第 2の発明を実施するための最良の形態について図面を参照して 詳細に説明する図 11は、本発明の第 2の実施形態による動画像復号装置の全体構 成を示すブロック図である。
[0062] 第 2の実施形態の動画像復号装置は、第 1の実施形態の動画像復号装置に参照 度重み付け圧縮部 106、伸長部 107を追加した構成となる。
[0063] 復号部 101は、入力された圧縮動画像ビットストリームと、伸長部 107で伸長、拡大 部 104で拡大された参照画像を用いて画像を復号する。復号部 101で復号された復 号画像は、参照度重み付け縮小部 102で縮小され、参照度重み付け圧縮部 106で 画素ごとあるいは圧縮処理単位ごとに、圧縮され、情報量が削減される。
[0064] 参照度重み付け縮小部 102で縮小、参照度重み付け圧縮部 106で圧縮された圧 縮データは、後に復号する画像の参照画像として用いられるために予測フレームメモ リ部 103へ書き込まれる。書き込みにおいては、アドレス制御部 105は、圧縮データ を書き込むフレームメモリのアドレスを作成し、アドレス線を介して、予測フレームメモ リ部 103に供給する。
[0065] 書き込まれた圧縮データは、復のために伸長部 107で伸長、拡大部 104で拡大さ れる。
[0066] 参照度重み付け圧縮部 106は、復号画像を圧縮するという点ではブロックコンプレ ッサ 203と同様の動作をする。しかし、参照度重み付け圧縮部 106が対象とする圧縮 符号ィ匕方式は推定された参照度を考慮して設計され、実装されている。ここで、参照 度は圧縮符号化方式の参照する画素位置に加え、復号装置が対象とする圧縮符号 化方式の圧縮符号化処理単位、参照度重み付け縮小部 102の縮小率、画素の間引 き位置、参照度重み付け圧縮部 106が対象とする圧縮符号ィ匕方式の参照する画素 位置、圧縮処理単位、圧縮率のいずれか一つ以上を用いて設定してもよい。
実施例 1
[0067] 次に、具体的な実施例を用いて本発明を実施するための最良の形態の構成およ び動作を説明する。
[0068] 本実施例では、復号部 101として H.264を用い、参照度重み付け縮小部 102では 水平 1/2の縮小を行う。
[0069] ここで、参照度重み付け縮小部 102における参照度は、 H.264のイントラ予測の参 照画素位置および圧縮符号化処理単位、縮小率、画素の間引き位置から決定する 。例えば H.264の圧縮符号ィ匕処理単位としては 2、 4、 8、 16が考えられる。また、本実 施例の場合、縮小率は 1/2となる。 [0070] 参照度は式 1 (数 1)で定める。
[0071] [数 1]
イントラ予測対象画素
かつ水平画素位置が偶数
Figure imgf000015_0001
イントラ予測非対象画素
Figure imgf000015_0002
かつ水平画素位置が偶数
上記以外
Figure imgf000015_0003
この参照度は H.264のイントラ予測の参照画素位置および縮小率、ダウンサンプル における画素の間弓 Iき位置を考慮しており、 R0〉R1〉R2を満たして!/、る。
[0072] 参照度重み付け縮小部 102で用いる LPFは、参照度に応じてフィルタの強度を変 更する。
[0073] 具体的には参照度が大きいものほど、拡大後の画像特性が縮小前の画像特性を 保持するようにする。参照度 R1に対して (4, 8, 4)/16のような 3タップのフィルタ処理を 行う場合、 Rはり参照度の大きい R0に対しては拡大後の画像特性が縮小前の画像 特性を保持するように (3, 10, 3)/16や (0, 16, 0)/16のフィルタ処理を行う。また、最も 参照度の小さい R2はダウンサンプルの間引き対象画素とする。
[0074] 本実施例における参照度を図 12に示す。
[0075] 本実施例では、イントラ予測の参照画素位置および縮小率力 参照度 R0, Rl, R2 を設定し、参照度の大きい画素に対しては拡大後の画像特性が縮小前の画像特性 を保持するように LPFの係数を定め、間引きの対象画素としな!/、ような制御をかけ縮 小する。
[0076] その結果、図 7、 8、 10のような例では縮小による歪みを抑制できる。
[0077] また、本実施例では参照度を定めるためにイントラ予測の参照画素位置、縮小率、 画素の間弓 Iき位置を考慮したが、縮小画像のエイリアシングを減らすには参照度 R0 となる画素は減らした方がょ 、。
[0078] 例えば、図 13に示すように MB境界のイントラ参照画素位置のみを R0と定めることで
、 R0となる画素を減らせる。
また、 R0となる画素をさらに減らすため、もしくは実装を容易にするため図 14に示す ように縦方向 MB境界のイントラ参照画素位置のみを R0を定めることも可能である。
[0079] また、本実施例では 3種類の参照度を定めたが、 3種類よりも多くの参照度を定める ことも可能である。
[0080] また、本実施例では 3タップフィルタを用いた力 参照度に応じて任意のタップ数の フィルタを定めることも可能である。
[0081] また、本実施例では水平方向の縮小を用いた力 垂直方向の縮小および水平、垂 直方向の縮小も同様に参照度を定めることが可能である。
実施例 2
[0082] 次に、具体的な実施例を用いて本発明を実施するため第 2の実施の形態の構成お よび動作を説明する。
[0083] 本実施例では、復号部 101、参照度重み付け縮小部 102は実施例 1と同様である ので説明を省略し、動作の異なる参照度重み付け圧縮部の動作を説明する。
[0084] 参照度重み付け圧縮部 106の圧縮符号化方式として 1-D DPCMを用いる。
[0085] ここで、 1-D DPCMでは X画素を圧縮処理単位とする。 Xの値は、 H.264の圧縮符号 化処理単位、実装の容易さから決定する。
[0086] 実施例 1における参照度も考慮し、参照度重み付け圧縮部で用いる参照度を式 2 ( 数 2)で定める。
[0087] [数 2] 水平画素位置
が Xn+(X - 1 ) 上記以外 R1 nは 0以上の整数 この参照度は H.264の「イントラ予測符号ィ匕対象ブロックの左ブロックを参照画素と して利用する」という参照される画素位置を考慮しており、 R0〉R1を満たしている。 参照度重み付け圧縮部 106に用いる 1-D DPCMでは、参照度をそのまま量子化代 表値の割り当てビット数として用いる。この場合、参照度重み付け圧縮部の圧縮率は R0、 R1で決まる。
[0088] 本実施例における量子化代表値の割り当てビット数および参照関係を図 15に示す
[0089] 本実施例では、圧縮処理単位の右端画素を予測画素の起点とし、右画素を予測 画素とする。
[0090] 図 12に示した縮小部で利用する参照度に対して、本実施例で Xの値を 8として用い た場合、図 16に示すように各 MBの参照画素となる周辺画素に対して量子化代表値 の割り当てビット数を R0にすることになる。
[0091] その結果、図 7、 8、 10のような例では縮小および圧縮による歪みを抑制できる。
[0092] また、本実施例では図 12に示した縮小部で利用する参照度の例を示したが、これ に限らず、図 13、 14など様々な縮小方式の組み合わせに適応できる。
[0093] また、本実施例では圧縮処理単位内で 2つの参照度を定めたが、各画素毎に参照 度を定めることも可能である。
[0094] この時、参照度の設定の際に 1-D DPCMの「右画素を予測画素とする」という予測 画素位置を考慮すると、左端画素に近いほど歪みの伝搬は小さくなるので、圧縮処 理単位内の右画素ほど参照度を大きくするように定めることも可能である。
[0095] また、本実施例では右画素、図 4では左画素を予測画素として 、たが、上画素もし くは下画素を予測画素とすることも可能である。ただし、 H.264の「イントラ予測符号ィ匕 対象ブロックの上ブロックを参照画素として利用する」という参照画素位置を考慮す れば、垂直画素位置に対しても式 2 (数 2)と同様の参照度を定め、下画素を予測画 素にすべきである。
[0096] 図 16の実施例では右画素を予測画素としていた。図 16の実施例の圧縮符号化方 式を用いてラスタスキャン表示をする場合、表示順に並び替えるために復号画像を 一時的に保持しておく必要があり、実用上望ましくない場合がある。そこで、本実施 例 3では参照度を式 3 (数 3)で定める。
[0097] [数 3]
nは 0以上の整数
Figure imgf000018_0001
式 3 (数 3)で定めた参照度を利用すると、参照度 R0となる画素の水平位置をずらす ことが可能になり、左画素を予測画素としながらも実施例 2と同様の効果を得ることが できる。
本実施例にぉ 、て、 Xを 8とした場合の量子化代表値の割り当てビット数および参 照関係を図 17に示す。
[0098] 各 MBの参照画素となる周辺画素の割り当てビット数は図 16と同じになる。
[0099] 上述した図 16、 17の実施例は、図 7、 8、 10で示したように参照画素を含むブロック が静止画として符号化されていれば有効である。しかし、一般的には全てのブロック が静止画として符号化されることはなぐ従来の圧縮する手段を備えた動画像復号装 置と同様の問題が生じる可能性がある。そこで、本実施例ではインター予測で参照さ れるブロック内に、割り当てビット数が R0となる参照画素が含まれる確率が高くなるよ うに参照度を定める。
具体的には、縦または横に隣接する画素と参照度が等しくならないように定める。 一例として式 4 (数 4)で参照度を定める。
[0100] [数 4] 水平画素位置 RG
が Xn+(X-1)
偶数ライン
上記以外
式 4 水平画素位置
が Xn ^U
奇数ライン
上記以外
nは 0以上の整数 本実施例における量子化代表値の割り当てビット数および参照関係を図 18に示す
[0101] X= 2、 4、 8として本実施例を用いた場合、図 15に示すように各 MBの参照画素とな る周辺画素に対して R0(〉R1)ビットを割り当てることになる。
[0102] インター予測で静止画ブロックが参照された場合は、図 12等に比べ割り当てビット 数が R0となる参照画素は減るが、一般的なインター予測を考えた場合、参照ブロック 内に割り当てビット数が R0となる参照画素が含まれる確率は高くなる。
[0103] この例では 1ラインごとに参照度、参照関係を設定したが、例えば、式 5 (数 5)およ び図 19に示すように X種類のものを設定することも可能である。
[0104] [数 5]
水平画素位置 Dn
が Χη Κϋ
0ライン
上記以外
水平画素位置
が Χη+1
式 5 1ライン
上記以外
水平画素位置
が Χη+(Χ— 1)
X - 1ライン
Figure imgf000020_0001
上記以外
ηは 0以上の整数 ここで、本実施例ではイントラ予測だけでなぐインター予測の参照画素に対しても 同様の効果が得られる。そこで、復号部 101として Η.264以外のインター予測を用い た圧縮符号化方式を利用することができる。
[0105] 上述した図 16〜19の実施例では参照度重み付け圧縮部 106の圧縮符号化方式 として 1-D DPCMを用いていた。
[0106] 本発明は圧縮符号ィ匕方式としては任意の方式を用いることができる。そこで本実施 例では圧縮符号ィ匕方式として 2次元 DPCM (2-D DPCM)を用いる。
[0107] 2-D DPCMは、横 X画素 X縦 Y画素のブロックを圧縮処理単位とする。 X、 Yの値は
H.264の圧縮符号化処理単位、圧縮率、実装の容易さ等から決定するもので、 2、 4、
8、 16が考えられる。参照度は式 6 (数 6)で定める。
[0108] [数 6] Γ 水平画素位置
が Χη+(Χ-1 )かつ
^ 垂直画素位置 R0
が Υη+(Υ - 1) 上記以外 R1 nは 0以上の整数 この参照度は H.264の「符号ィ匕対象ブロックの左ブロックを参照画素として利用する 」、「イントラ予測符号ィ匕対象ブロックの上ブロックを参照画素として利用する」という参 照される画素位置を考慮して 、る。
[0109] 参照度重み付け圧縮部 106に用いる 2-D DPCMでは 1-D DPCM同様、参照度を そのまま量子化代表値の割り当てビット数として用いる。
[0110] 本実施例における量子化代表値の割り当てビット数および参照関係を図 20に示す
[0111] 本実施例では圧縮処理単位の右下端画素を予測画素の起点とし、 1-D DPCMを 用いる画素は右または下画素を予測画素とし、 2-D DPCMを用いる画素は右、下、 右下の 3画素を予測画素とする。
実施例 3
[0112] 本発明による動画像復号装置は、以上の説明からも明らかなように、ハードウ ア で構成することも可能である力 コンピュータプログラムにより実現することも可能であ る。
[0113] 図 21は、本発明による動画像復号装置をインプリメントした情報処理システムの一 般的ブロック構成図である。
[0114] 図 21に示す情報処理システムは、プロセッサ 400、プログラムメモリ 401,記憶媒体 402からなる。記憶媒体 402は、別個の記憶媒体であってもよいし、同一の記憶媒体 力もなる記憶領域であってもよい。記憶媒体としては、 RAMや、ハードディスク等の 磁気記憶媒体を用いることができ、上述した予測フレームメモリ部 103の役割を果た す。
[0115] プログラムメモリ 401には、上述した復号部 101と、参照度重み付け縮小部 102と、 拡大部 104と、アドレス制御部 105と、参照度重み付け圧縮部 106と、伸長部 107と の各部の処理を、プロセッサ 400に行わせるプログラムが格納されており、このプログ ラムによってプロセッサ 400は動作する。
[0116] このように、コンピュータプログラムにより実現することも可能である。
[0117] 尚、復号部 101、参照度重み付け縮小部 102、拡大部 104、アドレス制御部 105、 参照度重み付け圧縮部 106および伸長部 107の全てをプログラムで動作させる必要 はなく、一部をノヽードウエアで構成しても力まわな ヽ。
[0118] 本発明の活用例として、デジタル放送チューナ、 HDDレコーダ、 DVDプレーヤの ようなデジタル動画像復号装置が挙げられる。
[0119] 本出願は、 2006年 6月 21日に出願された日本出願特願 2006— 171218号を基 礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

請求の範囲
[1] 予測処理を利用して圧縮符号化された動画像ビットストリームを画像信号へ復号す る復号手段と、前記復号手段により得られた復号画像信号を縮小し、縮小画像を得 る縮小手段と、前記縮小手段により得られた縮小画像を保持する予測フレームメモリ 手段と、前記予測フレームメモリ手段に保持された縮小画像を読み出し、これを拡大 した後に前記復号手段の予測処理で利用するデータとして供給する拡大手段と、前 記予測フレームメモリ手段に対する縮小画像の書き込み、又は、読み出しを制御す るアドレス制御手段とを有する動画像復号装置において、
前記縮小手段は、圧縮符号化方式における予測処理で参照される画素位置に従 い、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が 縮小前の画素値に近 、値をとるように制御を行うように構成されて 、ることを特徴とす る動画像復号装置。
[2] 前記縮小手段により得られた縮小画像を画素ごとに異なるビット数を割り当てた量 子化を行って圧縮処理を行い、圧縮データを得る圧縮手段と、前記圧縮手段により 得られた圧縮データを保持する前記予測フレームメモリ手段と、前記予測フレームメ モリ手段に保持された圧縮データを読み出し、圧縮データを伸張した後に前記拡大 手段へ供給する伸張手段と、前記予測フレームメモリ手段に対する圧縮データの書 き込み、又は、読み出しを制御する前記アドレス制御手段とを有する動画像復号装 ¾【こ; i l /、て、
前記参照度の大きい画素に対しては、量子化代表値を表す割当ビット数を多くする ように圧縮データ量制御を行うように構成されて ヽることを特徴とする請求項 1に記載 の動画像復号装置。
[3] 前記圧縮符号化方式はフレーム内予測を用いた圧縮符号化方式であり、前記圧 縮符号ィ匕方式において予測画像作成の際に参照される画素位置は、フレーム内予 測画像作成の際に参照される画素位置であることを特徴とする請求項 1又は請求項 2に記載の動画像復号装置。
[4] 前記参照度は、前記圧縮符号化方式における圧縮符号化処理単位、前記縮小手 段における縮小率、又は、前記縮小手段における画素の間引き位置のいずれか一 つ以上を用いて定めることを特徴とする請求項 1から請求項 3のいずれかに記載の動 画像復号装置。
[5] 前記参照度は、前記圧縮符号化方式における圧縮符号化処理単位、前記縮小手 段における縮小率、前記縮小手段における画素の間引き位置、前記圧縮手段にお いて予測画像作成の際に参照される画素位置、前記圧縮手段における圧縮処理単 位、又は、前記圧縮手段における圧縮率のいずれか一つ以上を用いて定めることを 特徴とする請求項 2又は請求項 3に記載の動画像復号装置。
[6] 前記圧縮手段は、圧縮処理単位の画素の一つを基準画素とし、前記基準画素の 量子化を行い、前記基準画素以外の画素に関しては、隣接する画素との差分に対し て量子化を行うように構成されて 、ることを特徴とする請求項 3から請求項 5の 、ずれ かに記載の動画像復号装置。
[7] 前記圧縮手段における圧縮処理単位内で最大の参照度は、縦または横に隣接す る画素と参照度が等しくならないように定めることを特徴とする請求項 6に記載の動画 像復号装置。
[8] 予測画像符号化復号方法の予測画像を作成するための復号画像の記録方法であ つて、
復号画像を縮小して記録する時に、前記復号画像の領域が予測で参照される頻 度を推定し、参照頻度の高い復号画像の領域を、参照頻度の低い復号画像の領域 よりも拡大後の画素値が縮小前の画素値に近 、値をとるようにすることを特徴とする 復号画像記録方法。
[9] 予測画像符号化復号方法の予測画像を作成するための復号画像の記録方法であ つて、
復号画像を縮小および圧縮して記録する時に、前記復号画像の領域が予測で参 照される頻度を推定し、参照頻度の高い復号画像の領域を、参照頻度の低い復号 画像の領域よりも、拡大後の画素値が縮小前の画素値に近い値をとるようし、かつ、 高 ヽ精度で圧縮することを特徴とする復号画像記録方法。
[10] 前記復号画像の領域が予測で参照される頻度の推定は、復号画像の領域内の予 測で参照される画素位置の数で推定することを特徴とする請求項 8又は請求項 9に 記載の復号画像記録方法。
[11] 前記予測画像符号ィ匕復号方法は、フレーム内予測を用いた予測画像符号ィ匕復号 方法であり、前記予測で参照される画素位置は、フレーム内予測画像を作成する際 に参照される画素位置であることを特徴とする請求項 10に記載の復号画像記録方 法。
[12] 前記画復号像の領域が予測で参照される頻度の推定は、前記予測画像符号化復 号方法における予測画像符号ィヒ処理単位、復号画像の縮小方法における縮小率、 又は、復号画像の縮小方法における画素の間引き位置のいずれか一つ以上を用い て推定することを特徴とする請求項 10又は請求項 11に記載の復号画像記録方法。
[13] 前記画復号像の領域が予測で参照される頻度の推定は、前記予測画像符号化復 号方法における予測画像符号ィヒ処理単位、復号画像の縮小方法における縮小率、 復号画像の縮小方法における画素の間引き位置、復号画像の圧縮方法における予 測画像作成の際に参照される画素位置、復号画像の圧縮方法における圧縮処理単 位、又は、復号画像の圧縮方法における圧縮率のいずれか一つ以上を用いて推定 することを特徴とする請求項 10又は請求項 11に記載の復号画像記録方法。
[14] 前記復号画像の圧縮方法は、圧縮処理単位の画素の一つを基準画素とし、前記 基準画素の量子化を行い、前記基準画素以外の画素に関しては、隣接する画素と の差分に対して量子化を行うことを特徴とする請求項 13に記載の復号画像記録方 法。
[15] 予測画像符号化復号方法の予測画像を作成するための復号画像を記録するプロ グラムであって、
復号画像を縮小して記録する時に、前記復号画像の領域が予測で参照される頻 度を推定する処理と、参照頻度の高い復号画像の領域を、参照頻度の低い復号画 像の領域よりも拡大後の画素値が縮小前の画素値に近 、値をとるようにする処理とを 情報処理装置に実行させることを特徴とするプログラム。
[16] 予測画像符号化復号方法の予測画像を作成するための復号画像を記録するプロ グラムであって、
復号画像を縮小および圧縮して記録する時に、前記復号画像の領域が予測で参 照される頻度を推定する処理と、参照頻度の高い復号画像の領域を、参照頻度の低 V、復号画像の領域よりも拡大後の画素値が縮小前の画素値に近!、値をとるようにす る処理と、高い精度で圧縮する処理と、を情報処理装置に実行させることを特徴とす るプログラム。
[17] 前記復号画像の領域が予測で参照される頻度を推定する処理は、復号画像の領 域内の予測で参照される画素位置の数で推定することを特徴とする請求項 15又は 請求項 16に記載のプログラム。
[18] 前記予測画像符号ィ匕復号方法は、フレーム内予測を用いた予測画像符号ィ匕復号 方法であり、前記予測で参照される画素位置は、フレーム内予測画像を作成する際 に参照される画素位置であることを特徴とする請求項 17に記載のプログラム。
[19] 前記画復号像の領域が予測で参照される頻度を推定する処理は、前記予測画像 符号化復号方法における予測画像符号化処理単位、復号画像の縮小方法における 縮小率、又は、復号画像の縮小方法における画素の間引き位置のいずれか一つ以 上を用いて推定することを特徴とする請求項 17又は請求項 18に記載のプログラム。
[20] 前記画復号像の領域が予測で参照される頻度を推定する処理は、前記予測画像 符号化復号方法における予測画像符号化処理単位、復号画像の縮小方法における 縮小率、復号画像の縮小方法における画素の間引き位置、復号画像の圧縮方法に おける予測画像作成の際に参照される画素位置、復号画像の圧縮方法における圧 縮処理単位、又は、復号画像の圧縮方法における圧縮率のいずれか一つ以上を用 いて推定することを特徴とする請求項 17又は請求項 18に記載のプログラム。
[21] 前記復号画像の圧縮方法は、圧縮処理単位の画素の一つを基準画素とし、前記 基準画素の量子化を行い、前記基準画素以外の画素に関しては、隣接する画素と の差分に対して量子化を行うことを特徴とする請求項 20に記載のプログラム。
[22] 予測画像符号化復号方法の予測画像を作成するための復号画像の記録装置であ つて、
復号画像を縮小して記録する時に、前記復号画像の領域が予測で参照される頻 度を推定し、参照頻度の高い復号画像の領域を、参照頻度の低い復号画像の領域 よりも拡大後の画素値が縮小前の画素値に近 、値をとるようにする縮小手段を有す ることを特徴とする復号画像記録装置。
[23] 予測画像符号化復号方法の予測画像を作成するための復号画像の記録装置であ つて、
復号画像を縮小および圧縮して記録する時に、前記復号画像の領域が予測で参 照される頻度を推定し、参照頻度の高い復号画像の領域を、参照頻度の低い復号 画像の領域よりも拡大後の画素値が縮小前の画素値に近 、値をとるようにする縮小 手段および高い精度で圧縮する圧縮手段を有することを特徴とする復号画像記録装 置。
[24] 前記縮小手段あるいは前記圧縮手段は、復号画像の領域内の予測で参照される 画素位置の数に基づ!/、て、前記復号画像の領域が予測で参照される頻度を推定す ることを特徴とする請求項 22又は請求項 23に記載の復号画像記録装置。
[25] 前記予測画像符号化復号方法は、フレーム内予測を用いた予測画像符号化復号 方法であり、前記予測で参照される画素位置は、フレーム内予測画像を作成する際 に参照される画素位置であることを特徴とする請求項 24に記載の復号画像記録装 置。
[26] 前記縮小手段は、前記予測画像符号化復号方法における予測画像符号化処理単 位、復号画像の縮小方法における縮小率、又は、復号画像の縮小方法における画 素の間引き位置のいずれか一つ以上を用いて、前記画復号像の領域が予測で参照 される頻度を推定することを特徴とする請求項 24又は請求項 25に記載の復号画像 記録装置。
[27] 前記縮小手段および前記圧縮手段は、前記予測画像符号化復号方法における予 測画像符号化処理単位、復号画像の圧縮方法における予測画像作成の際に参照さ れる画素位置、復号画像の縮小方法における縮小率、復号画像の縮小方法におけ る画素の間引き位置、復号画像の圧縮方法における圧縮処理単位、又は、復号画 像の圧縮方法における圧縮率のいずれか一つ以上を用いて、前記画復号像の領域 が予測で参照される頻度を推定することを特徴とする請求項 24又は請求項 25に記 載の復号画像記録装置。
[28] 前記復号画像の圧縮方法は、圧縮処理単位の画素の一つを基準画素とし、前記 基準画素の量子化を行い、前記基準画素以外の画素に関しては、隣接する画素と の差分に対して量子化を行うことを特徴とする請求項 27に記載の復号画像記録装 置。
[29] 復号画像信号を縮小し、縮小画像を得る動画像復号方法にぉ ヽて、
圧縮符号ィ匕方式における予測処理で参照される画素位置に従い、画素ごとの参照 度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮小前の画素値に 近 ヽ値をとるように制御することを特徴とする動画像復号方法。
[30] 復号画像信号を縮小し、画素ごとに、異なるビット数を割り当てた量子化を行って圧 縮処理を行!ヽ、圧縮データを得る動画像復号方法にぉ ヽて、
圧縮符号ィ匕方式における予測処理で参照される画素位置に従い、画素ごとの参照 度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮小前の画素値に 近い値をとるように制御し、かつ、量子化代表値を表す割当ビット数を多くするように 圧縮データ量を制御することを特徴とする動画像復号方法。
[31] 前記圧縮符号ィヒ方式はフレーム内予測を用いた圧縮符号ィヒ方式であり、前記圧 縮符号ィ匕方式において予測画像作成の際に参照される画素位置は、フレーム内予 測画像作成の際に参照される画素位置であることを特徴とする請求項 29又は請求 項 30に記載の動画像復号方法。
[32] 前記参照度は、前記圧縮符号化方式における圧縮符号化処理単位、復号画像の 縮小処理における縮小率、又は、復号画像の縮小処理における画素の間引き位置 の!、ずれか一つ以上を用いて定めることを特徴とする請求項 29又は請求項 31に記 載の動画像復号方法。
[33] 前記参照度は、前記圧縮符号化方式における圧縮符号化処理単位、復号画像の 縮小処理における縮小率、復号画像の縮小処理における画素の間引き位置、復号 画像の圧縮処理にお!ヽて予測画像作成の際に参照される画素位置、復号画像の圧 縮処理における圧縮処理単位、又は、復号画像の圧縮処理における圧縮率のいず れか一つ以上を用いて定めることを特徴とする請求項 30又は請求項 31に記載の動 画像復号方法。
[34] 圧縮処理単位の画素の一つを基準画素とし、前記基準画素の量子化を行!、、前 記基準画素以外の画素に関しては、隣接する画素との差分に対して量子化を行うこ とを特徴とする請求項 33に記載の動画像復号方法。
[35] 復号画像信号を縮小し、縮小画像を得る動画像復号方法におけるプログラムであ つて、
前記プログラムは、圧縮符号ィ匕方式における予測処理で参照される画素位置に従 い、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が 縮小前の画素値に近 、値をとるように制御する処理を情報処理装置に実行させるこ とを特徴とするプログラム。
[36] 復号画像信号を縮小し、画素ごとに、異なるビット数を割り当てた量子化を行って圧 縮処理を行!ヽ、圧縮データを得る動画像復号方法にぉ ヽて、
圧縮符号ィ匕方式における予測処理で参照される画素位置に従い、画素ごとの参照 度を定め、参照度の大きい画素に対しては、拡大後の画素値が縮小前の画素値に 近い値をとるように制御し、かつ、量子化代表値を表す割当ビット数を多くするように 圧縮データ量を制御することを特徴とする動画像復号方法。
[37] 復号画像信号を縮小し、縮小画像を得る動画像復号方法におけるプログラムであ つて、
前記プログラムは、圧縮符号ィ匕方式における予測処理で参照される画素位置に従 い、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が 縮小前の画素値に近 、値をとるように制御する処理を情報処理装置に実行させるこ とを特徴とするプログラム。
[38] 復号画像信号を縮小し、画素ごとに、異なるビット数を割り当てた量子化を行って圧 縮処理を行 、、圧縮データを得る動画像復号方法におけるプログラムであって、 前記プログラムは、圧縮符号ィ匕方式における予測処理で参照される画素位置に従 い、画素ごとの参照度を定め、参照度の大きい画素に対しては、拡大後の画素値が 縮小前の画素値に近い値をとるように制御し、かつ、量子化代表値を表す割当ビット 数を多くするように圧縮データ量を制御する処理を情報処理装置に実行させることを 特徴とするプログラム。
PCT/JP2007/062086 2006-06-21 2007-06-15 動画像復号装置、復号画像記録装置、それらの方法及びプログラム WO2007148619A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008522422A JP4973886B2 (ja) 2006-06-21 2007-06-15 動画像復号装置、復号画像記録装置、それらの方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006171218 2006-06-21
JP2006-171218 2006-06-21

Publications (1)

Publication Number Publication Date
WO2007148619A1 true WO2007148619A1 (ja) 2007-12-27

Family

ID=38833361

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2007/062086 WO2007148619A1 (ja) 2006-06-21 2007-06-15 動画像復号装置、復号画像記録装置、それらの方法及びプログラム

Country Status (2)

Country Link
JP (1) JP4973886B2 (ja)
WO (1) WO2007148619A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011514056A (ja) * 2008-02-22 2011-04-28 クゥアルコム・インコーポレイテッド 早いマクロブロック・デルタqpの決定
WO2011138912A1 (ja) * 2010-05-06 2011-11-10 日本電気株式会社 映像符号装置、映像復号装置、映像符号方法、映像復号方法及びプログラム
WO2012014472A1 (ja) * 2010-07-29 2012-02-02 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号方法、及び動画像復号装置
JP2014506442A (ja) * 2011-01-12 2014-03-13 シーメンス アクチエンゲゼルシヤフト ビデオコーダにおける参照イメージの圧縮及び伸長方法
WO2014050676A1 (ja) * 2012-09-28 2014-04-03 ソニー株式会社 画像処理装置および方法
WO2014157166A1 (ja) * 2013-03-28 2014-10-02 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
US8858809B2 (en) 2012-03-22 2014-10-14 Kabushiki Kaisha Toshiba Method of manufacturing magnetic recording medium
US9036934B2 (en) 2013-03-22 2015-05-19 Kabushiki Kaisha Toshiba Image encoder and image processing system

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08116539A (ja) * 1994-10-17 1996-05-07 Hitachi Ltd 動画像符号化装置と動画像符号化方法
JPH09247673A (ja) * 1996-03-04 1997-09-19 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化動画像再生装置
JPH1066081A (ja) * 1996-06-19 1998-03-06 Thomson Consumer Electron Inc Mpegデコーダのためのマルチモード・データ削減システム
JPH11146399A (ja) * 1997-11-05 1999-05-28 Sanyo Electric Co Ltd 画像復号装置
JPH11298892A (ja) * 1998-04-13 1999-10-29 Hitachi Ltd 符号化画像の復号装置及び画像表示装置
JP2001320712A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 繰り返しビデオ信号符号化方法およびこの方法のプログラムを記録した記録媒体
JP2002016913A (ja) * 2000-06-28 2002-01-18 Yamaha Corp トランスコーディング方法およびトランスコーディング装置
JP2002514867A (ja) * 1998-05-07 2002-05-21 サーノフ コーポレイション 情報ストリームデコーダにおけるメモリリソースの利用率増大方法および装置
WO2007091588A1 (ja) * 2006-02-09 2007-08-16 Nec Corporation 動画像復号装置、復号画像記録装置、それらの方法及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01251974A (ja) * 1988-03-31 1989-10-06 Hitachi Ltd 符号化装置および復号化装置
JP3552811B2 (ja) * 1995-09-29 2004-08-11 三菱電機株式会社 ディジタル映像信号符号化装置および復号化装置
WO2005062625A1 (ja) * 2003-12-22 2005-07-07 Nec Corporation 動画像を符号化する方法及び装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08116539A (ja) * 1994-10-17 1996-05-07 Hitachi Ltd 動画像符号化装置と動画像符号化方法
JPH09247673A (ja) * 1996-03-04 1997-09-19 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化動画像再生装置
JPH1066081A (ja) * 1996-06-19 1998-03-06 Thomson Consumer Electron Inc Mpegデコーダのためのマルチモード・データ削減システム
JPH11146399A (ja) * 1997-11-05 1999-05-28 Sanyo Electric Co Ltd 画像復号装置
JPH11298892A (ja) * 1998-04-13 1999-10-29 Hitachi Ltd 符号化画像の復号装置及び画像表示装置
JP2002514867A (ja) * 1998-05-07 2002-05-21 サーノフ コーポレイション 情報ストリームデコーダにおけるメモリリソースの利用率増大方法および装置
JP2001320712A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 繰り返しビデオ信号符号化方法およびこの方法のプログラムを記録した記録媒体
JP2002016913A (ja) * 2000-06-28 2002-01-18 Yamaha Corp トランスコーディング方法およびトランスコーディング装置
WO2007091588A1 (ja) * 2006-02-09 2007-08-16 Nec Corporation 動画像復号装置、復号画像記録装置、それらの方法及びプログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011514056A (ja) * 2008-02-22 2011-04-28 クゥアルコム・インコーポレイテッド 早いマクロブロック・デルタqpの決定
US8542730B2 (en) 2008-02-22 2013-09-24 Qualcomm, Incorporated Fast macroblock delta QP decision
WO2011138912A1 (ja) * 2010-05-06 2011-11-10 日本電気株式会社 映像符号装置、映像復号装置、映像符号方法、映像復号方法及びプログラム
WO2012014472A1 (ja) * 2010-07-29 2012-02-02 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号方法、及び動画像復号装置
JP2014506442A (ja) * 2011-01-12 2014-03-13 シーメンス アクチエンゲゼルシヤフト ビデオコーダにおける参照イメージの圧縮及び伸長方法
US9723318B2 (en) 2011-01-12 2017-08-01 Siemens Aktiengesellschaft Compression and decompression of reference images in a video encoder
US8858809B2 (en) 2012-03-22 2014-10-14 Kabushiki Kaisha Toshiba Method of manufacturing magnetic recording medium
CN104662901A (zh) * 2012-09-28 2015-05-27 索尼公司 图像处理装置及方法
JPWO2014050676A1 (ja) * 2012-09-28 2016-08-22 ソニー株式会社 画像処理装置および方法
US9591329B2 (en) 2012-09-28 2017-03-07 Sony Corporation Image processing device and method for encoding and decoding image
WO2014050676A1 (ja) * 2012-09-28 2014-04-03 ソニー株式会社 画像処理装置および方法
US9036934B2 (en) 2013-03-22 2015-05-19 Kabushiki Kaisha Toshiba Image encoder and image processing system
JP2014195142A (ja) * 2013-03-28 2014-10-09 Kddi Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
WO2014157166A1 (ja) * 2013-03-28 2014-10-02 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
CN105284109A (zh) * 2013-03-28 2016-01-27 Kddi株式会社 运动图像编码装置、运动图像解码装置、运动图像编码方法、运动图像解码方法、及程序
US9942563B2 (en) 2013-03-28 2018-04-10 Kddi Corporation Video encoding using subsampling to reduce number of reference pixels
CN105284109B (zh) * 2013-03-28 2018-08-24 Kddi株式会社 运动图像编码装置、运动图像解码装置、运动图像编码方法、运动图像解码方法、及程序

Also Published As

Publication number Publication date
JP4973886B2 (ja) 2012-07-11
JPWO2007148619A1 (ja) 2009-11-19

Similar Documents

Publication Publication Date Title
US11328452B2 (en) Image processing device and method
JP4384130B2 (ja) 動画像復号方法及び装置
RU2409005C2 (ru) Способ масштабируемого кодирования и декодирования видеосигнала
JP4734168B2 (ja) 画像復号化装置及び画像復号化方法
US20040179610A1 (en) Apparatus and method employing a configurable reference and loop filter for efficient video coding
JP4973886B2 (ja) 動画像復号装置、復号画像記録装置、それらの方法及びプログラム
WO2012017858A1 (ja) 画像処理装置と画像処理方法
JP5581688B2 (ja) 画像処理装置および方法、並びにプログラム
WO2008066601A1 (en) Memory reduced h264/mpeg-4 avc codec
JP5396711B2 (ja) 動画像復号装置、動画像復号方法及びプログラム
WO2012063878A1 (ja) 画像処理装置と画像処理方法
JP4774315B2 (ja) 画像復号化装置及び画像復号化方法
WO2012063604A1 (ja) 画像処理装置と画像処理方法
US9386310B2 (en) Image reproducing method, image reproducing device, image reproducing program, imaging system, and reproducing system
US20110235711A1 (en) Image processing device and method
JP2012085001A5 (ja)
KR20080067922A (ko) 영상 축소 기능을 갖는 영상 복호화 방법 및 장치
JP2010098633A (ja) 予測符号化装置および予測符号化方法
JP2007067526A (ja) 画像処理装置
JP2016158282A (ja) 動画像予測復号方法及び動画像予測復号装置
JP7359653B2 (ja) 動画像符号化装置
WO2011162299A1 (ja) 情報処理装置と情報処理方法
US20110051815A1 (en) Method and apparatus for encoding data and method and apparatus for decoding data
JP2011114369A (ja) 画像符号化復号装置
JP4526314B2 (ja) 動画像再生装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07745341

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2008522422

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 07745341

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)