WO2009113276A1 - 画像符号化方式変換装置 - Google Patents

画像符号化方式変換装置 Download PDF

Info

Publication number
WO2009113276A1
WO2009113276A1 PCT/JP2009/000983 JP2009000983W WO2009113276A1 WO 2009113276 A1 WO2009113276 A1 WO 2009113276A1 JP 2009000983 W JP2009000983 W JP 2009000983W WO 2009113276 A1 WO2009113276 A1 WO 2009113276A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction mode
frequency component
intra
screen prediction
unit
Prior art date
Application number
PCT/JP2009/000983
Other languages
English (en)
French (fr)
Inventor
工藤大樹
草野勝大
加藤嘉明
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2010502714A priority Critical patent/JP5241819B2/ja
Publication of WO2009113276A1 publication Critical patent/WO2009113276A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the present invention relates to an image coding method conversion apparatus for converting an image coding method.
  • JPEG Joint Photographic Expert Group
  • Motion JPEG Motion JPEG that encodes a moving image by continuously encoding JPEG.
  • the Motion JPEG method is sometimes called an MJPEG method or an M-JPEG method.
  • MPEG-2 Motion Picture Expert Group
  • MPEG-2 Motion Picture Expert Group
  • DVD Digital Versatile Disk
  • H.264 is a method adopted for terrestrial digital broadcasting for mobile terminals, so-called one-segment broadcasting.
  • H.264 system As described above, there are various image encoding methods, and generally, different image encoding methods are not compatible.
  • an image coding method conversion device disclosed in Patent Document 1 below, a method for converting a JPEG method into an MPEG-4 method is disclosed.
  • the DCT coefficient is used for compression in both the JPEG system and the MPEG-4 system, and direct current (DC) component conversion and Huffman code conversion are performed.
  • the JPEG system is converted to the MPEG-4 system.
  • H Since the DCT coefficient is not used in the H.264 system, this image coding system conversion apparatus uses the H.264 standard. It cannot be applied to H.264 conversion.
  • Non-Patent Documents 1 and 2 the MPEG-2 DCT coefficient before conversion is used.
  • a method of performing high-speed conversion by narrowing down the prediction mode in the intra-screen prediction of the H.264 system is disclosed.
  • the prediction mode is determined in 16 ⁇ 16 prediction, but all DCT coefficients may be used. In this case, a very large amount of calculation is required. It will take. In 4 ⁇ 4 prediction, only the prediction direction is narrowed down, and the prediction method is not completely determined.
  • Non-Patent Document 3 discloses a method of converting an 8 ⁇ 8 DCT coefficient into four 4 ⁇ 4 DCT coefficients and determining a prediction mode from the converted 4 ⁇ 4 DCT coefficients.
  • the amount of calculation for converting the 8 ⁇ 8 DCT coefficient into four 4 ⁇ 4 DCT coefficients is very large.
  • JP 2004-186811 A A fast Intra Mode Decision Algorithm for MPEG-2 to H.264 Video Transcoding''Consumer Electronics, 2006. ISCE 06.
  • 2006 IEEE Tenth International Symposium on 2006 Page (s): 1-5 Fast Intra Prediction Mode Decision Mode for MPEG-2 to H.264 Transcoding, Multimedia and Expo, 2007 IEEE International Conference 2-5 July, 2007 Page (s): 428--431 ⁇ Fast Intra Mode Decision Mode Method for MPEG MPEG H.264 Transcoding Image Processing, 2006 IEEE Standard International Conference 8-1-1 Oct. 2006 Page (s): 833-836
  • Non-Patent Documents 1 to 3 Since the conventional image coding method conversion apparatus is configured as described above, in Non-Patent Documents 1 to 3, H. Although the H.264 system can be included in the conversion target of the image encoding system, there is a problem that the amount of calculation when converting the image encoding system becomes very large.
  • the present invention has been made to solve the above-described problems, and an object of the present invention is to obtain an image coding method conversion apparatus capable of converting an image coding method with a small amount of calculation.
  • the image coding method conversion apparatus decodes a part of the encoded stream of the first coding method in which the image is converted into the frequency domain and encoded, and the signal of the frequency component of the image is obtained.
  • the frequency component signal acquired by the frequency component signal acquisition unit is encoded using the in-screen prediction direction estimated by the unit to generate an encoded stream of the second encoding method. .
  • the frequency component signal acquisition for decoding a part of the encoded stream of the first encoding method in which the image is converted into the frequency domain and encoded to acquire the signal of the frequency component of the image.
  • an intra-screen prediction direction estimation unit that estimates the direction of intra-screen prediction from the frequency component signal acquired by the frequency component signal acquisition unit, and the encoding unit is estimated by the intra-screen prediction direction estimation unit. Since it is configured to generate the encoded stream of the second encoding method by encoding the frequency component signal acquired by the frequency component signal acquisition unit using the direction of the inner prediction, the image code with a small amount of computation There is an effect that the conversion method can be converted.
  • FIG. 3 is an explanatory diagram showing blocks C 0 0 to C 0 3 to be encoded and surrounding blocks R0 to R5.
  • Block C 1 0 ⁇ C 1 15 of the encoding target image is an explanatory diagram showing a block R0 ⁇ R5 therearound. It is a flowchart which shows the narrowing-down process of the prediction mode in 4 * 4 prediction mode.
  • FIG. 10 is an explanatory diagram showing encoding target blocks A 0 0 to A 0 3 of the current frame and encoding target blocks B 0 0 to B 0 3 at the same position one frame before. It is a flowchart which shows the processing content of the prediction mode estimation process determination part 13 of the image coding system converter by Embodiment 3 of this invention. It is a block diagram which shows the image coding system converter by Embodiment 4 of this invention. It is a flowchart which shows the processing content of the prediction mode estimation process determination part 15 of the image coding system converter by Embodiment 4 of this invention.
  • FIG. 6 is an explanatory diagram showing peripheral blocks RA0 to RA5.
  • the frequency characteristics R0_bottom, R1_bottom of the lowermost 16 pixels of the blocks R0-R3, the surrounding blocks R0-R3, the surrounding blocks R0-R3, the rightmost 16 pixels of R2, R3, and the encoding target blocks C 0 0-C 0 3 It is explanatory drawing which shows frequency characteristics R2_right and R3_right. It is a block diagram which shows the image coding system converter by Embodiment 8 of this invention.
  • FIG. 4 is an explanatory diagram showing a 4 ⁇ 4 block C 1 n to be encoded and surrounding pixels a to i.
  • FIG. 1 is a block diagram showing an image coding method conversion apparatus according to Embodiment 1 of the present invention.
  • a JPEG simple decoding unit 1 is a JPEG method (first method) in which an image is converted into a frequency domain and encoded.
  • JPEG data that is an encoded stream of (1 encoding method) is input, a part of the JPEG data is decoded, and a DCT coefficient that is a signal of a frequency component of the image, and the width and height of the image are indicated.
  • the JPEG simple decoding unit 1 constitutes frequency component signal acquisition means.
  • the prediction mode estimation unit 2 calculates the H.264 from the DCT coefficient acquired by the JPEG simple decoding unit 1. A process of estimating a prediction mode (direction of intra-screen prediction) in the H.264 system (second encoding system) is performed. Note that the prediction mode estimation unit 2 constitutes an intra-screen prediction direction estimation unit.
  • H. H.264 encoding unit 3 is H.264.
  • H.264 encoding is performed by the JPEG simple decoding unit 1 using the prediction mode estimated by the prediction mode estimation unit 2 and the header information acquired by the JPEG simple decoding unit 1.
  • the DCT coefficients obtained by encoding A process of generating a H.264 stream (encoded stream of the second encoding method) is performed.
  • H. The H.264 encoding unit 3 constitutes encoding means.
  • FIG. 2 is a flowchart showing the processing contents of the prediction mode estimation unit 2 of the image coding method conversion apparatus according to Embodiment 1 of the present invention.
  • the first encoding method is the JPEG method
  • the second encoding method is H.264.
  • An example of the H.264 system will be described. However, this is merely an example, and it goes without saying that other similar schemes can be applied.
  • the first encoding method may be MPEG-1, MPEG-2, or MPEG-4.
  • the H.264 method can also compress in the time direction
  • the first embodiment targets only the in-screen compression method.
  • the JPEG method divides an image into 8 ⁇ 8 blocks, performs DCT conversion on each block, quantizes DCT coefficients obtained by performing DCT conversion, and converts the quantized DCT coefficients to variable-length codes. It is a method to convert. Generally, when the DCT coefficient is quantized, the compression efficiency is increased by increasing the quantization coefficient for the high frequency component and cutting the high frequency component.
  • This prediction means that a predicted image is created from adjacent pixels that have already been encoded, and the difference between the image to be encoded and the predicted image is taken. That is, H.H. In the H.264 system, it is selected whether the above prediction is performed in a 16 ⁇ 16 block region (16 ⁇ 16 prediction mode) or a 4 ⁇ 4 block region (4 ⁇ 4 prediction mode).
  • prediction mode estimation is performed at high speed by using JPEG DCT coefficients.
  • the JPEG simple decoding unit 1 receives JPEG JPEG data in which an image is converted into a frequency domain and is encoded, a part of the JPEG data is decoded and a DCT coefficient which is a signal of a frequency component of the image And header information indicating the width and height of the image.
  • IDCT Inverse Discrete Cosine Transform
  • IDCT Inverse Discrete Cosine Transform
  • the DCT coefficient is output to the prediction mode estimation unit 2, and the header information is set to H.264.
  • H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation unit 2 receives the DCT coefficient from the JPEG simple decoding unit 1, the prediction mode estimation unit 2 calculates the H.264 from the DCT coefficient.
  • the prediction mode (direction of intra-screen prediction) in the H.264 system is estimated.
  • the processing content of the prediction mode estimation part 2 is demonstrated concretely.
  • FIG. 5 is an explanatory diagram showing blocks C 0 0 to C 0 3 to be image-encoded and surrounding blocks R0 to R5.
  • the blocks C 0 0 to C 0 3 and R0 to R5 are all 8 ⁇ 8 blocks.
  • the situation in which the prediction mode 0 (vertical prediction) in the 16 ⁇ 16 prediction mode is efficient is the lowest 8 pixels of the block R0. This is a case where the pixels of the blocks C 0 0 and C 0 2 are close, and the lowermost 8 pixels of the block R 1 are close to the pixels of the blocks C 0 1 and C 0 3.
  • the situation in which the prediction mode 1 (horizontal prediction) in the 16 ⁇ 16 prediction mode is efficient is the rightmost 8 in the block R2. This is a case where the pixels are close to the pixels of the blocks C 0 0 and C 0 1 and the rightmost 8 pixels of the block R 3 are close to the pixels of the blocks C 0 2 and C 0 3.
  • the situation in which the prediction mode 2 (DC prediction) in the 16 ⁇ 16 prediction mode is efficient is the bottom 16 of the blocks R0 and R1. This is a case where the average value of the pixels, the rightmost 16 pixels of the blocks R2 and R3, and the lower right pixel of the block R4 is close to the average value of all the pixels of the blocks C 0 0 to C 0 3.
  • the situation where the prediction mode 3 (planar prediction) in the 16 ⁇ 16 prediction mode is efficient is the lowest part of the blocks R0 and R1.
  • the rightmost 8 pixels of the blocks R2 and R3, and the lower right pixel of the block R4 are used to create a predicted image with gradation, so that the lowermost pixels of the blocks R0 and R1 Change in the horizontal direction of the blocks C 0 0 to C 0 3, and the change in the rightmost pixel in the blocks R 2 and R 3 is close to the vertical change in the blocks C 0 0 to C 0 3. It is. This is effective for an image with gradation.
  • the prediction mode estimation unit 2 performs H.264.
  • the evaluation value Cost is calculated by substituting the DCT coefficients output from the JPEG simple decoding unit 1 into the evaluation functions shown in the following equations (1) and (2). 16 ⁇ 16_0 and Cost 16 ⁇ 16_1 are calculated (step ST1 in FIG. 2).
  • DCT_C 0 0 i, j , DCT_C 0 1 i, j , DCT_C 0 2 i, j , DCT_C 0 3 i, j , DCT_R0 i, j , DCT_R1 i, j , DCT_R2 i, j , DCT_R3 i, j are , DCT coefficients of i rows and j columns in blocks C 0 1, C 0 2, C 0 3, C 0 4, R0, R1, R2, R3, respectively.
  • k is a coefficient used for calculation, and here, it is assumed that 0 ⁇ k ⁇ 7.
  • k 0, it means that the prediction mode is estimated only from the DCT coefficient of the direct current component among all the DCT coefficients.
  • w 16 ⁇ 16_DC0 , w 16 ⁇ 16_DC1 , w 16 ⁇ 16_DC2 , w 16 ⁇ 16_DC3 , w i , w j are weights.
  • the evaluation value Cost 16 ⁇ 16_0 evaluates the proximity of the horizontal change between the blocks C 0 0, C 0 2 and the block R0 and the horizontal change between the blocks C 0 1, C 0 3 and the block R1. This is an evaluation value of prediction mode 0 (vertical prediction) in the 16 ⁇ 16 prediction mode. Further, the evaluation value Cost 16 ⁇ 16_1 is obtained by evaluating the closeness of the vertical change between the blocks C 0 0, C 0 1 and the block R2 and the vertical change between the blocks C 0 2, C 0 3 and the block R3. The evaluation value of prediction mode 1 (horizontal prediction) in the 16 ⁇ 16 prediction mode.
  • Prediction mode estimating unit 2 evaluation value Cost 16 ⁇ 16_0, calculating the Cost 16 ⁇ 16_1, with comparing the evaluation value Cost 16 ⁇ 16_0 and the threshold th 16 ⁇ 16_0 (step ST2), and the evaluation value Cost 16 ⁇ 16_1
  • the threshold th 16 ⁇ 16_1 is compared (steps ST3 and ST4).
  • the prediction mode estimation unit 2 determines that the pixel is sufficiently close to neighboring pixels in units of 16 ⁇ 16 blocks when at least one of Expression (3) or Expression (4) is satisfied, and any of the 16 ⁇ 16 prediction modes It is decided to use the prediction mode. On the other hand, when both of the equations (3) and (4) are not satisfied, As a prediction mode in the H.264 system, it is determined that any prediction mode in the 4 ⁇ 4 prediction mode is used (step ST5).
  • the prediction mode estimation part 2 determines using the prediction mode 0 (vertical prediction) in 16 * 16 prediction mode, when only Formula (3) is materialized (step ST6). Further, when only the equation (4) is established, it is determined that the prediction mode 1 (horizontal prediction) in the 16 ⁇ 16 prediction mode is used (step ST7).
  • the prediction mode estimation unit 2 takes the absolute value of the difference between the evaluation value Cost 16 ⁇ 16_0 and the evaluation value Cost 16 ⁇ 16_1 when both the expressions (3) and (4) hold, and the difference absolute value and the threshold th 16 ⁇ 16_2 are compared (step ST8).
  • the prediction mode estimation unit 2 determines that only the vertical direction or the horizontal direction is valid, and compares the evaluation value Cost 16 ⁇ 16_0 with the evaluation value Cost 16 ⁇ 16_1 (Step S1). ST9). Cost 16 ⁇ 16_0 ⁇ Cost 16 ⁇ 16_1 (6)
  • the prediction mode estimation unit 2 determines that the prediction mode 0 (vertical prediction) in the 16 ⁇ 16 prediction mode is used when Expression (6) is satisfied (Step ST10), and when Expression (6) is not satisfied, It is determined that the prediction mode 1 (horizontal prediction) in the 16 ⁇ 16 prediction mode is used (step ST11).
  • the prediction mode estimation unit 2 determines that the prediction mode 2 (DC prediction) in the 16 ⁇ 16 prediction mode or the prediction mode 3 (planar prediction) in the 16 ⁇ 16 prediction mode is effective when Expression (5) is not satisfied. .
  • the change in the lowermost pixel in the blocks R0 and R1 and the change in the rightmost pixel in the blocks R2 and R3 are the pixels of the blocks C 0 0 to C 0 4. It can be said that it is effective when it is close to change.
  • the prediction mode estimation unit 2 calculates the sum of the evaluation value Cost 16 ⁇ 16_0 and the evaluation value Cost 16 ⁇ 16_1 , and compares the sum with the threshold th 16 ⁇ 16_3 (step ST12).
  • Cost 16 ⁇ 16_3 Cost 16 ⁇ 16_0 + Cost 16 ⁇ 16_1 ⁇ th 16 ⁇ 16_3 (7)
  • the prediction mode estimation unit 2 determines that the prediction mode 3 (planar prediction) in the 16 ⁇ 16 prediction mode is used when the equation (7) is satisfied (step ST14), and when the equation (7) is not satisfied, It is determined that the prediction mode 2 (DC prediction) in the 16 ⁇ 16 prediction mode is used (step ST13).
  • FIG. 6 is an explanatory diagram showing blocks C 10 to C 1 15 to be image-encoded and surrounding blocks R0 to R5.
  • the blocks C 1 0 to C 1 15 are all 4 ⁇ 4 blocks and are encoded in the order of 0 to 15.
  • the blocks C 1 0 to C 1 15 are obtained by dividing the blocks C 0 0 to C 0 3 of FIG. 5 into four blocks.
  • the block C 0 0 is a block C 1 0 to C 1 3 and the block C 0 1 is a block C 0 1.
  • block C 0 2 is block C 1 8 ⁇ C 1 11
  • block C 0 3 is one that is divided into blocks C 1 12 ⁇ C 1 15.
  • the blocks R0 to R5 are all 8 ⁇ 8 blocks and are the same as the blocks R0 to R5 in FIG.
  • the prediction mode estimation unit 2 calculates the evaluation values in the vertical direction and the horizontal direction for each block, and calculates the ratio between the evaluation values in the vertical direction and the horizontal direction.
  • the prediction mode estimation unit 2 roughly narrows down to three prediction modes (vertical direction, horizontal direction, diagonal direction) according to the ratio of the evaluation values, and determines the prediction mode from the narrowed prediction direction. In narrowing down the prediction modes, the prediction modes 0, 3, and 7 are set to the vertical direction, the prediction modes 1 and 8 are set to the horizontal direction, and the prediction modes 2, 4, 5, and 6 are set to the diagonal direction.
  • the classification of the prediction mode is based on the position of the pixel that creates the predicted image.
  • FIG. 7 is a flowchart showing prediction mode narrowing-down processing in the 4 ⁇ 4 prediction mode.
  • 8, 9 and 10 are flowcharts showing prediction mode selection processing in the 4 ⁇ 4 prediction mode.
  • the prediction mode estimation unit 2 calculates the vertical evaluation value Cost 4 ⁇ 4_V blocks C 1 n (0 ⁇ n ⁇ 15), and n, the horizontal evaluation value Cost 4 ⁇ 4_H, and n ( Step ST21 in FIG. 7).
  • the evaluation value calculation method differs for each block, and the calculation method will be described later.
  • the prediction mode estimation unit 2 calculates the ratio RateVH 4 ⁇ 4, n between the evaluation value in the vertical direction and the evaluation value in the horizontal direction (step ST22).
  • the prediction mode estimation unit 2 compares the evaluation value ratio RateVH 4 ⁇ 4, n with the thresholds th 4 ⁇ 4_H, n and th 4 ⁇ 4_V, n . (Steps ST23 and ST24). RateVH 4 ⁇ 4, n ⁇ th 4 ⁇ 4_H, n (9) th 4 ⁇ 4_H, n ⁇ RateVH 4 ⁇ 4, n ⁇ th 4 ⁇ 4_V, n (10) RateVH 4 ⁇ 4, n ⁇ th 4 ⁇ 4_V, n (11)
  • the prediction mode estimation unit 2 narrows down the prediction modes 1 and 8 assuming that the prediction in the horizontal direction is effective when Expression (9) is satisfied (step ST25).
  • the prediction mode estimation unit 2 narrows down the prediction modes 2, 4, 5, and 6 assuming that the prediction in the oblique direction is effective when Expression (10) is satisfied (step ST26).
  • the prediction mode estimation unit 2 narrows down the prediction modes 0, 3, and 7 assuming that the prediction in the vertical direction is effective when Expression (11) is satisfied (step ST27).
  • the prediction mode estimation unit 2 narrows down to the prediction modes 1 and 8, the prediction mode ratio RateVH 4 ⁇ 4, n and the threshold th 4 ⁇ 4_1_8, n are compared (step ST31 in FIG. 8). RateVH 4 ⁇ 4, n > th 4 ⁇ 4_1_8, n (12)
  • the prediction mode estimation unit 2 determines that the prediction mode 1 is used when the equation (12) is satisfied (step ST32), and determines that the prediction mode 8 is used when the equation (12) is not satisfied. (Step ST33).
  • the evaluation value Cost that evaluates the AC component of the DCT coefficient of the 8 ⁇ 8 block including the target 4 ⁇ 4 block. 4 ⁇ 4_2, n is calculated (step ST41 in FIG. 9), and the evaluation value Cost 4 ⁇ 4_2, n is compared with the threshold th 4 ⁇ 4_2, n (step ST42).
  • the prediction mode estimation unit 2 determines that the prediction mode 2 is used when the equation (13) is satisfied (step ST43). If the equation (13) is not satisfied, the evaluation value ratio RateVH 4 ⁇ 4, n And threshold values th 4 ⁇ 4 — 4 — 5, n and th 4 ⁇ 4 — 4 — 6, n are compared (steps ST44 and ST45). RateVH 4 ⁇ 4, n ⁇ th 4 ⁇ 4_4_5, n (14) th 4 ⁇ 4_4_5, n ⁇ RateVH 4 ⁇ 4, n ⁇ th 4 ⁇ 4_4_6, n (15) RateVH 4 ⁇ 4, n > th 4 ⁇ 4_4_6, n (16)
  • the prediction mode estimation part 2 determines using the prediction mode 5, when Formula (14) is materialized (step ST46).
  • the prediction mode estimation part 2 determines using the prediction mode 4, when Formula (15) is materialized (step ST47).
  • the prediction mode estimation part 2 determines using the prediction mode 6, when Formula (16) is materialized (step ST48).
  • RateVH 4 ⁇ 4, n and the thresholds th 4 ⁇ 4_0_7, n and th 4 ⁇ 4_3_7, n are compared (FIG. 10 steps ST51 and ST52).
  • the prediction mode estimation part 2 determines using the prediction mode 0, when Formula (17) is materialized (step ST53).
  • the prediction mode estimation part 2 determines using the prediction mode 7, when Formula (18) is materialized (step ST54).
  • the prediction mode estimation part 2 determines as the thing using the prediction mode 3, when Formula (19) is materialized (step ST55).
  • the prediction mode estimation part 2 determines a prediction mode completely, only the prediction mode is narrowed down, SAD and SATD are implemented about the narrowed down prediction mode, The prediction mode may be determined.
  • evaluation values Cost 4 ⁇ 4_V vertical blocks of 4 ⁇ 4 shown in FIG. 6, n, the horizontal evaluation value Cost 4 ⁇ 4_H, method of calculating the n Basically, it is calculated from the DCT coefficients of the 8 ⁇ 8 block from which each 4 ⁇ 4 block is configured and the 8 ⁇ 8 block adjacent thereto.
  • n 0 (C 1 0)
  • An evaluation value is calculated using the DCT coefficient of R2.
  • n is 5 (C 1 5)
  • C 0 1 that contains the block C 1 5
  • An evaluation value is calculated using the DCT coefficient. For the horizontal direction, only the AC component of block C 0 1 is considered.
  • C 0 1 including the block C 1 6 and the block C 0 adjacent to the block C 0 1 are used.
  • An evaluation value is calculated using a DCT coefficient of zero. Only the AC component of the block C 0 1 is considered in the vertical direction.
  • C 0 3 including the block C 1 12 and C 0 1 adjacent to the block C 0 3 are used.
  • C 0 2 is used to calculate an evaluation value.
  • the prediction mode can be estimated from the DCT coefficients of 8 ⁇ 8 blocks.
  • H.264 encoding unit 3 uses the prediction mode and the header information acquired by the JPEG simple decoding unit 1 to calculate the DCT coefficient acquired by the JPEG simple decoding unit 1.
  • IDCT processing may be performed on the DCT coefficient acquired by the JPEG simple decoding unit 1, and the DCT coefficient may be returned to the pixel signal before encoding.
  • encoding may be performed by converting DCT coefficients to integer precision DCT using a transformation matrix.
  • a part of JPEG data encoded by converting an image into the frequency domain is decoded, and a DCT coefficient which is a signal of a frequency component of the image is obtained.
  • a prediction mode estimation unit 2 that estimates a prediction mode (direction of intra-screen prediction) in the H.264 system.
  • the H.264 encoding unit 3 encodes the DCT coefficient acquired by the JPEG simple decoding unit 1 using the prediction mode estimated by the prediction mode estimation unit 2 to generate the H.264 encoding. Since the H.264 stream is generated, a small amount of computation and the H.264 can be performed from the JPG method. There is an effect that can be converted into the H.264 system.
  • Equation (1) Equation (2), Equation (20) to Equation (51)
  • the prediction mode is estimated only from the DCT coefficients of the low frequency components among all the DCT coefficients, the amount of computation Can be greatly reduced.
  • the prediction mode estimation unit 2 uses the DCT coefficient acquired by the JPEG simple decoding unit 1 to determine the H.264 format.
  • the prediction mode estimation unit in the H.264 system has been described.
  • the prediction mode estimation unit 2 determines whether to adopt the 16 ⁇ 16 prediction mode or the 4 ⁇ 4 prediction mode, similarly to the first embodiment. Since the 16 ⁇ 16 prediction mode is adopted and the processing content when selecting the prediction mode in the 16 ⁇ 16 prediction mode is the same as that in the first embodiment, the description thereof is omitted. Hereinafter, the processing content when the 4 ⁇ 4 prediction mode is employed will be described with reference to FIGS. 5 and 6. 11 and 12 are flowcharts showing prediction mode selection processing of the image coding method conversion apparatus according to the second embodiment of the present invention.
  • the prediction mode estimation unit 2 determines whether the high-frequency component is present in the block C 0 0.
  • the prediction mode estimation unit 2 determines that a high frequency component exists in the block C 0 0 when the following equation (52) is established (step ST61 in FIG. 11).
  • MAX (DCT_C 0 0 i, j ) is the maximum value of the DCT coefficient
  • th 2_high is a threshold value
  • 4 ⁇ i and j ⁇ 7 is shown, but for example, 4 ⁇ i and 4 ⁇ j may be used.
  • the prediction mode estimation unit 2 determines a prediction mode in the same manner as in the first embodiment (step ST62).
  • the high frequency component does not exist in the block C 0 0, the following formulas (53) to (55) are calculated, and the evaluation values Cost 2_4 ⁇ 4,0,0 , Cost 2_4 ⁇ 4,0, 1 , Cost 2_4 ⁇ 4,0,2_4 is calculated (step ST63).
  • the prediction mode estimation unit 2 calculates the evaluation values Cost 2_4 ⁇ 4,0,0 , Cost 2_4 ⁇ 4,0,1 and Cost 2_4 ⁇ 4,0,2_4 , the smallest evaluation among these evaluation values is calculated. Select a value.
  • the evaluation value Cost 2 — 4 ⁇ 4,0,0 is the minimum (step ST64)
  • the prediction mode estimation unit 2 determines that the prediction mode 0 is used for the block C 10 (step ST65).
  • the evaluation value Cost 2 — 4 ⁇ 4, 0, 1 is the minimum (step ST66)
  • the prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 10 (step ST67).
  • the prediction mode estimation unit 2 compares the DCT coefficient maximum value MAX (DCT_C 0 0 i, j ) with the threshold th 2_DC (step ST68).
  • the prediction mode estimation unit 2 determines that the prediction mode 4 is used for the block C 10 (step ST69).
  • the block C 1 0 determines that utilizes the prediction mode 2 (step ST70).
  • the prediction mode estimation unit 2 determines the prediction mode of the block C 10 , the prediction mode is sequentially determined by taking advantage of the absence of high frequency components. That is, for the block C 1 1 determines the prediction mode 1, the block C 1 2 determines the prediction mode 0, for block C 1 3, determines whether the following equation (57) is satisfied (Step ST81 in FIG. 12).
  • the prediction mode estimation unit 2 determines that the prediction mode 2 is used for the block C 13 (step ST82).
  • the prediction mode estimation part 2 determines whether the following formula
  • the prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 13 (step ST84). When the equation (58) is not established, the prediction mode estimation unit 2 determines that the prediction mode 0 is used for the block C 13 (step ST85). Thereafter, the prediction modes of the blocks C 14 to C 1 15 are determined for the blocks C 0 1, C 0 2 and C 0 3 in the same manner.
  • the prediction mode estimation unit 2 uses the following formula (59) as the determination of the high frequency component.
  • the following formulas (60) to (62) are calculated and the evaluation value Cost 2 — 4 ⁇ 4,1, 0 , Cost 2_4 ⁇ 4,1,1 and Cost 2_4 ⁇ 4,1,2_4 are calculated.
  • the prediction mode estimation unit 2 calculates the evaluation values Cost 2_4 ⁇ 4,1,0 , Cost 2_4 ⁇ 4,1,1 and Cost 2_4 ⁇ 4,1,2_4 , the smallest evaluation among these evaluation values is calculated. Select a value.
  • the prediction mode estimation unit 2 determines that the prediction mode 0 is used for the block C 14 when the evaluation value Cost 2 — 4 ⁇ 4,1,0 is minimum.
  • the prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 14 when the evaluation value Cost 2 — 4 ⁇ 4, 1, 1 is the minimum.
  • the prediction mode estimation unit 2 compares the maximum value MAX (DCT_C 0 1 i, j ) of the DCT coefficient with the threshold th 2_DC .
  • the prediction mode estimation unit 2 determines that the prediction mode 4 is used for the block C 14 when Expression (63) is established. On the other hand, if the expression (63) is not satisfied, the block C 1 4 is determined to utilize prediction mode 2.
  • Prediction mode estimation unit 2 the block C 1 5 is determined to utilize prediction mode 1
  • the block C 1 6 is determined to utilize prediction mode 0.
  • For block C 1 7 determines whether the following equation (64) holds.
  • Prediction mode estimating unit 2 if the expression (64) holds for the block C 1 7 is determined to utilize prediction mode 2. On the other hand, when the formula (64) is not satisfied, it is determined whether the following formula (65) is satisfied. Prediction mode estimating unit 2, if the expression (65) holds for the block C 1 7 is determined to utilize prediction mode 1. On the other hand, if the expression (65) is not satisfied, the block C 1 7 is determined to utilize prediction mode 0.
  • the prediction mode estimation unit 2 uses the following formula (66) as the determination of the high frequency component.
  • the prediction mode estimation unit 2 calculates the evaluation values Cost 2 — 4 ⁇ 4 , 2, 0 , Cost 2 — 4 ⁇ 4 , 2, 1 , and Cost 2 — 4 ⁇ 4 , 2 , 2_4 , the smallest evaluation among these evaluation values is calculated. Select a value. Prediction mode estimating unit 2, if the evaluation value Cost 2_4 ⁇ 4,2,0 is at a minimum, it is determined that utilizes the prediction mode 0 for the block C 1 8. Further, the prediction mode estimation unit 2, when the evaluation value Cost 2_4 ⁇ 4, 2, 1 is the smallest, is determined to utilize the prediction mode 1 for block C 1 8.
  • the prediction mode estimation unit 2 compares the DCT coefficient maximum value MAX (DCT_C 0 2 i, j ) with the threshold th 2_DC .
  • Prediction mode estimating unit 2 if the expression (70) is satisfied, it is determined that utilizes the prediction mode 4 for the block C 1 8. On the other hand, if the expression (69) is not satisfied, it is determined that utilizes the prediction mode 2 for block C 1 8.
  • Prediction mode estimation unit 2 the block C 1 9 is determined to utilize prediction mode 1
  • the block C 1 10 is determined to utilize prediction mode 0.
  • the prediction mode estimation unit 2 determines that the prediction mode 2 is used for the block C 1 11 when the formula (71) is established. On the other hand, when Expression (71) is not satisfied, it is determined whether or not the following Expression (72) is satisfied. The prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 1 11 when the formula (72) is established. On the other hand, if the expression (72) is not satisfied, the block C 1 11 is determined to utilize prediction mode 0.
  • the prediction mode estimation unit 2 uses the following formula (73) as the determination of the high frequency component.
  • the following formulas (74) to (76) are calculated, and the evaluation value Cost 2 — 4 ⁇ 4, 3, 0 , Cost 2_4 ⁇ 4,3,1 and Cost 2_4 ⁇ 4,3,2_4 are calculated.
  • the prediction mode estimation unit 2 calculates the evaluation values Cost 2_4 ⁇ 4,3,0 , Cost 2_4 ⁇ 4,3,1 and Cost 2_4 ⁇ 4,3,2_4 , the smallest evaluation among these evaluation values is calculated. Select a value. Prediction mode estimating unit 2, if the evaluation value Cost 2_4 ⁇ 4,3,0 is minimal, for the block C 1 12 is determined to utilize prediction mode 0. Further, the prediction mode estimation unit 2, when the evaluation value Cost 2_4 ⁇ 4,3,1 is minimal, for the block C 1 12 is determined to utilize prediction mode 1.
  • the prediction mode estimation unit 2 compares the maximum DCT coefficient MAX (DCT_C 0 3 i, j ) with the threshold th 2_DC .
  • Prediction mode estimating unit 2 if the expression (77) holds for the block C 1 12 is determined to utilize prediction mode 4. On the other hand, if the expression (77) is not satisfied, the block C 1 12 is determined to utilize prediction mode 2.
  • the prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 1 13 and determines that the prediction mode 0 is used for the block C 1 14. For block C 1 15, it is determined whether or not the following equation (78) holds.
  • the prediction mode estimation unit 2 determines that the prediction mode 2 is used for the block C 1 15 when Expression (78) is established. On the other hand, when the formula (78) is not satisfied, it is determined whether the following formula (79) is satisfied. The prediction mode estimation unit 2 determines that the prediction mode 1 is used for the block C 1 15 when Expression (79) is established. On the other hand, if the expression (79) is not satisfied, it is determined that utilizes the prediction mode 0 for the block C 1 15.
  • the prediction mode of three 4 ⁇ 4 blocks is determined by comparing the DC components, and the remaining 1 One block can also be easily determined from the sum of the AC components. Therefore, when there is no high-frequency component, the 4 ⁇ 4 prediction mode is determined at a very high speed. Conversion to the H.264 system can be performed at high speed.
  • the prediction mode estimation unit 2 uses the DCT coefficient acquired by the JPEG simple decoding unit 1 to determine the H.264 format. As shown in FIG. 14, in the case of a moving image, it is often expressed in a format in which still images are arranged in the time axis direction. In general, the correlation is often high (similar). Therefore, in the third embodiment, when similar images are continuously encoded, the H.264 format is changed.
  • the prediction mode of the H.264 system is not estimated, and the same prediction mode as the prediction mode one frame before is continuously used. Specifically, it is as follows.
  • FIG. 13 is a block diagram showing an image coding system conversion apparatus according to Embodiment 3 of the present invention.
  • the DCT coefficient storage unit 11 stores the DCT coefficient acquired by the JPEG simple decoding unit 1, and then stores the latest DCT coefficient (DCT coefficient of the current frame) acquired by the JPEG simple decoding unit 1.
  • the DCT coefficient one frame before is output to the prediction mode estimation process determination unit 13.
  • the DCT coefficient storage unit 11 constitutes frequency component storage means.
  • the prediction mode storage unit 12 is an H.264 estimated by the prediction mode estimation unit 2. When the prediction mode output command of the prediction mode is received from the prediction mode estimation processing determination unit 13, the stored prediction mode one frame before is stored in H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode storage unit 12 constitutes an intra-screen prediction direction storage unit.
  • the prediction mode estimation process determination unit 13 compares the DCT coefficient of the current frame acquired by the JPEG simple decoding unit 1 with the DCT coefficient of the previous frame stored in the DCT coefficient storage unit 11 to calculate a prediction mode estimation unit. In H.2. If it is determined that it is necessary to perform the prediction mode estimation process (intra-screen prediction direction estimation process) of the H.264 method and the prediction mode estimation process needs to be performed, the prediction mode estimation command is used as the prediction mode estimation command. When the prediction mode estimation process is performed by the prediction mode estimation unit 2 by determining that the prediction mode estimation process need not be performed, the prediction mode output unit outputs a prediction mode output command. 12, the prediction mode one frame before stored in the prediction mode storage unit 12 is set to H.12.
  • FIG. 16 is a flowchart showing the processing contents of the prediction mode estimation processing determination unit 13 of the image coding method conversion apparatus according to Embodiment 3 of the present invention.
  • the DCT coefficient storage unit is the same as the first and second embodiments. 11, only the operations of the prediction mode storage unit 12 and the prediction mode estimation process determination unit 13 will be described.
  • the DCT coefficient storage unit 11 stores the DCT coefficient when the JPEG simple decoding unit 1 acquires the DCT coefficient, and then the JPEG simple decoding unit 1 stores the DCT coefficient of the current frame. Is obtained, the stored DCT coefficient of the previous frame is output to the prediction mode estimation processing determination unit 13.
  • the prediction mode storage unit 12 is configured so that the prediction mode estimation unit 2 is H.264 as in the first embodiment. When the H.264 prediction mode is estimated, the prediction mode is stored.
  • the prediction mode estimation process determination unit 13 When the prediction mode estimation process determination unit 13 receives the DCT coefficient of the current frame from the JPEG simple decoding unit 1 and the DCT coefficient of one frame before from the DCT coefficient storage unit 11, the prediction mode estimation process determination unit 13 Are compared with the DCT coefficients of the H.E. The necessity of performing the H.264 prediction mode estimation process is determined. When the prediction mode estimation process determination unit 13 determines that the prediction mode estimation process needs to be performed, the prediction mode estimation process is output to the prediction mode estimation unit 2 by outputting a prediction mode estimation command to the prediction mode estimation unit. 2 to perform.
  • the prediction mode output command is output to the prediction mode storage unit 12, so that the prediction mode of the previous frame stored in the prediction mode storage unit 12 is determined.
  • H. The H.264 encoding unit 3 outputs the result.
  • the processing content of the prediction mode estimation process determination part 13 is demonstrated concretely.
  • FIG. 15 is an explanatory diagram showing the encoding target blocks A 0 0 to A 0 3 of the current frame and the encoding target blocks B 0 0 to B 0 3 at the same position one frame before.
  • the blocks A 0 0 to A 0 3 and B 0 0 to B 0 3 are all 8 ⁇ 8 blocks.
  • the encoding target blocks are similar in consecutive frames, high-efficiency encoding is possible even if the same prediction mode as the previous frame is used.
  • the encoding target blocks are different in consecutive frames, if the same prediction mode as that of the previous frame is used, the encoding efficiency is likely to deteriorate.
  • the prediction mode estimation process determination unit 13 outputs the DCT coefficient of the current frame output from the JPEG simple decoding unit 1 and the DCT coefficient storage unit 11 in order to determine the necessity of performing the prediction mode estimation process.
  • the difference value Diff is calculated by substituting the DCT coefficient one frame before for the evaluation function shown in the following equation (80) (step ST91).
  • DCT_A 0 0 i, j , DCT_A 0 1 i, j , DCT_A 0 2 i, j , DCT_A 0 3 i, j , DCT_B 0 0 i, j , DCT_B 0 1 i, j , DCT_B 0 2 i, j , DCT_B 0 3 i, j are DCTs of i rows and j columns in blocks A 0 0, A 0 1, A 0 2, A 0 3, B 0 0, B 0 1, B 0 2, B 0 3, respectively. It is a coefficient. Further, k and l are coefficients used in the calculation.
  • the prediction mode estimation process determination unit 13 compares the difference value Diff with the threshold th Diff (step ST92).
  • Diff ⁇ th Diff (81) When the equation (81) is established, the prediction mode estimation processing determination unit 13 regards the encoding target block as similar between consecutive frames, and outputs a prediction mode output command to the prediction mode storage unit 12. (Step ST93).
  • the prediction mode storage unit 12 receives the prediction mode output command from the prediction mode estimation process determination unit 13, the prediction mode storage unit 12 sets the stored prediction mode one frame before to H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode stored in the prediction mode storage unit 12 is the prediction mode several frames before
  • the prediction mode several frames before is set to H.264.
  • H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation process determination unit 13 regards that the encoding target block is different between consecutive frames, and outputs a prediction mode estimation command to the prediction mode estimation unit 2 (Step ST94).
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation process determination unit 13, the prediction mode estimation unit 2 performs the same as in the first and second embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the prediction mode estimation part 2 is H.264.
  • the prediction mode may be estimated using DCT coefficients as in the first and second embodiments, but SAD and SATD are performed for all prediction modes. Thus, the prediction mode may be determined.
  • the prediction mode estimation process determination unit 13 is stored in the DCT coefficient and DCT coefficient storage unit 11 of the current frame acquired by the JPEG simple decoding unit 1. Compared with the DCT coefficient of the previous frame, the H.D. If it is determined that it is necessary to perform the prediction mode estimation process of the H.264 method and the prediction mode estimation process needs to be performed, the prediction mode estimation process is performed by the prediction mode estimation unit 2 while the prediction mode estimation process is performed. If it is determined that it is not necessary to perform the mode estimation process, the prediction mode one frame before stored in the prediction mode storage unit 12 is set to H.264.
  • the prediction mode estimation unit 2 performs the prediction mode estimation process only when the current frame and the encoding target block at the same position one frame before are different. As a result, H. There is an effect that the conversion to the H.264 system can be speeded up.
  • the prediction mode estimation unit 2 performs the prediction mode estimation process only when the current frame and the encoding target block at the same position one frame before are different. Even when the current frame and the encoding target block at the same position one frame before are similar, if the prediction mode estimation unit 2 has not performed the prediction mode estimation process continuously for the specified number of times, You may make it make the prediction mode estimation part 2 implement the estimation process of prediction mode. Specifically, it is as follows.
  • FIG. 17 is a block diagram showing an image coding method conversion apparatus according to Embodiment 4 of the present invention.
  • the same prediction mode count unit 14 increments the count value Count when the prediction mode output command is output from the prediction mode estimation process determination unit 15 to the prediction mode storage unit 12, and the prediction mode estimation process determination unit 15 estimates the prediction mode.
  • the count value Count is reset to zero.
  • the prediction mode estimation process determination unit 15 stores the DCT coefficient of the current frame acquired by the JPEG simple decoding unit 1 and one frame stored in the DCT coefficient storage unit 11. Compared with the previous DCT coefficient, the H. If it is determined that it is necessary to perform the prediction mode estimation process of the H.264 method and the prediction mode estimation process needs to be performed, the prediction mode estimation process is performed by the prediction mode estimation unit 2 while the prediction mode estimation process is performed. If it is determined that it is not necessary to perform the mode estimation process, the prediction mode one frame before stored in the prediction mode storage unit 12 is set to H.264.
  • FIG. 18 is a flowchart showing the processing contents of the prediction mode estimation processing determination unit 15 of the image coding method conversion apparatus according to Embodiment 4 of the present invention.
  • the same prediction mode as the previous frame is used any number of times as long as the current block and the current block at the same position in the previous frame are similar in the current block. I keep trying. However, for example, when the minute changes continue even if they are similar between frames, such as sunshine fluctuations, if the same prediction mode is continuously used, the coding efficiency may deteriorate. . Therefore, in the fourth embodiment, in order to prevent the same prediction mode from being used continuously when a minute change is continued, a limit is set on the number of continuous use of the same prediction mode. .
  • the processing content of the same prediction mode count part 14 and the prediction mode estimation process determination part 15 is demonstrated concretely.
  • the prediction mode estimation process determination unit 15 determines the necessity of performing the prediction mode estimation process in order to determine the current frame output from the JPEG simple decoding unit 1.
  • the difference value Diff is calculated by substituting the DCT coefficient and the DCT coefficient one frame before output from the DCT coefficient storage unit 11 into the evaluation function shown in the above equation (80) (step ST101).
  • the prediction mode estimation process determination unit 15 compares the difference value Diff with the threshold th Diff (step ST102).
  • the prediction mode estimation process determination unit 15 When the above equation (81) is not satisfied (Diff> th Diff ), the prediction mode estimation process determination unit 15 considers that the current block is different between consecutive frames, and counts the same prediction mode. The count value Count of the unit 14 is reset to 0 (step ST103), and a prediction mode estimation command is output to the prediction mode estimation unit 2 (step ST104).
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation processing determination unit 15, the prediction mode estimation unit 2 performs the same as in the first to third embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the prediction mode estimation part 2 is H.264.
  • the prediction mode may be estimated using DCT coefficients as in the first to third embodiments. However, SAD and SATD are performed for all prediction modes. Thus, the prediction mode may be determined.
  • the prediction mode estimation process determination unit 15 considers that the encoding target block is similar between consecutive frames when the above equation (81) is satisfied (when Diff ⁇ th Diff ), and the same prediction mode count.
  • the count value Count of the unit 14 is compared with the threshold th Count (step ST105).
  • the prediction mode estimation process determination unit 15 increments the count value Count of the same prediction mode count unit 14 by “1” (step ST106), and stores the output instruction of the prediction mode in the prediction mode. It outputs to the part 12 (step ST107).
  • the prediction mode storage unit 12 receives a prediction mode output command from the prediction mode estimation processing determination unit 15, the prediction mode storage unit 12 sets the stored prediction mode of the previous frame to H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode stored in the prediction mode storage unit 12 is a prediction mode several frames before, H.
  • the prediction mode several frames before H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation process determination unit 15 has reached the specified number (upper limit number) of continuous use of the same prediction mode, so the count value Count of the same prediction mode count unit 14 Is reset to 0 (step ST103), and a prediction mode estimation command is output to the prediction mode estimation unit 2 (step ST104).
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation processing determination unit 15, the prediction mode estimation unit 2 performs the same as in the first to third embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the fourth embodiment when the count value Count of the same prediction mode count unit 14 exceeds the threshold th Count , the current block and the current block and the encoding target block at the same position one frame before are displayed. Even when similar, since the prediction mode estimation process determination unit 15 is configured to cause the prediction mode estimation process to be performed by the prediction mode estimation unit 2, high-efficiency encoding is possible even when a small change continues. The effect which can be performed is produced.
  • Embodiment 5 the current frame and the encoding target block at the same position one frame before are compared, and the H.
  • the method for determining the necessity of executing the H.264 prediction mode estimation processing is shown, not only the current block and the current block and the current block, but also the peripheral blocks of the current block are compared.
  • the basic configuration of the image coding method conversion apparatus according to the fifth embodiment is the same as that of the image coding method conversion apparatuses according to the third and fourth embodiments, but the prediction mode estimation process determination units 13 and 15 are configured as follows. The difference is that the current frame and the encoding target block at the same position one frame before and the neighboring blocks of the target block are compared to determine the necessity of performing the prediction mode estimation process.
  • description will be made with reference to the configuration of the image coding method conversion apparatus in FIG. 13 for convenience of explanation.
  • FIG. 19 shows encoding target blocks A 0 0 to A 0 3 of the current frame, peripheral blocks RA 0 to RA 5 , encoding target blocks B 0 0 to B 0 3 at the same position one frame before, and their surroundings
  • FIG. 6 is an explanatory diagram showing blocks RB0 to RB5.
  • the blocks A 0 0 to A 0 3, RA 0 to RA 5, B 0 0 to B 0 3, and RB 0 to RB 5 are all 8 ⁇ 8 blocks.
  • the prediction mode estimation process determination unit 13 determines the necessity of performing the prediction mode estimation process, and the DCT coefficient of the current frame output from the JPEG simple decoding unit 1 and 1 output from the DCT coefficient storage unit 11.
  • the difference value Diff neighbor is calculated by substituting the DCT coefficient before the frame into the evaluation function shown in the following equation (83).
  • DCT_A 0 0 i, j , DCT_A 0 1 i, j , DCT_A 0 2 i, j , DCT_A 0 3 i, j , DCT_B 0 0 i, j , DCT_B 0 1 i, j , DCT_B 0 2 i, j , DCT_B 0 3 i, j are DCTs of i rows and j columns in blocks A 0 0, A 0 1, A 0 2, A 0 3, B 0 0, B 0 1, B 0 2, B 0 3, respectively. It is a coefficient.
  • DCT_RA0 i, j, DCT_RA1 i , j, DCT_RA2 i, j, DCT_RA3 i, j, DCT_RA4 i, j, DCT_RA5 i, j, DCT_RB0 i, j, DCT_RB1 i, j, DCT_RB2 i, j, DCT_RB3 i, j , DCT_RB4 i, j , and DCT_RB5 i, j are the DCT coefficients of i rows and j columns in blocks RA0, RA1, RA2, RA3, RA4, RA5, RB0, RB1, RB2, RB3, RB4, and RB5, respectively.
  • k and l are coefficients used in the calculation.
  • the horizontal direction uses only the low frequency component, and the vertical direction uses the DCT coefficient up to the high frequency component to determine the necessity of performing the prediction mode estimation process.
  • U i, j and v i, j are weights.
  • the prediction mode estimation process determination unit 13 compares the difference value Diff neighbor with the threshold th neighbor .
  • Diff neighbor ⁇ th neighbor (84) When Expression (84) is established, the prediction mode estimation process determination unit 13 regards the encoding target block as similar between consecutive frames, and outputs a prediction mode output command to the prediction mode storage unit 12. To do.
  • the prediction mode storage unit 12 receives the prediction mode output command from the prediction mode estimation process determination unit 13, the prediction mode storage unit 12 sets the stored prediction mode one frame before to H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode stored in the prediction mode storage unit 12 is the prediction mode several frames before
  • the prediction mode several frames before is set to H.264.
  • H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation process determination unit 13 regards that the encoding target block is different between consecutive frames, and outputs a prediction mode estimation command to the prediction mode estimation unit 2 To do.
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation process determination unit 13, the prediction mode estimation unit 2 performs the same as in the first to fourth embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the prediction mode estimation process it is necessary to perform the prediction mode estimation process by including not only the encoding target block at the same position one frame before the current frame but also the surrounding blocks of the encoding target block.
  • the sex is judged. For this reason, since it is possible to cope with a change in the prediction mode due to the difference between neighboring blocks between the current frame and the previous frame, highly efficient predictive coding becomes possible.
  • Embodiment 6 FIG.
  • the necessity of performing the prediction mode estimation process may be determined in consideration of the prediction mode of the previous frame stored in the prediction mode storage unit 12. Specifically, it is as follows.
  • FIG. 20 is a block diagram showing an image coding method conversion apparatus according to Embodiment 6 of the present invention.
  • the prediction mode estimation process determination unit 16 determines the necessity of performing the prediction mode estimation process, similarly to the prediction mode estimation process determination unit 13 of FIG. 13 or the prediction mode estimation process determination unit 15 of FIG. If it is determined that the process needs to be performed, the prediction mode estimation process is performed by the prediction mode estimation unit 2, while if it is determined that the prediction mode estimation process is not required, the prediction mode storage unit 12 stores the prediction mode estimation process.
  • the stored prediction mode one frame before is set to H.264.
  • the prediction mode estimation process determination unit 16 considers the prediction mode one frame before stored in the prediction mode storage unit 12 when determining the necessity of performing the prediction mode estimation process. And make a decision.
  • the prediction mode estimation process determination part 16 comprises the estimation process determination means.
  • FIG. 21 is a flowchart showing the processing contents of the prediction mode estimation processing determination unit 16 of the image coding method conversion apparatus according to Embodiment 6 of the present invention.
  • the prediction mode estimation process determination unit 16 determines whether the prediction mode one frame before stored in the prediction mode storage unit 12 is a 16 ⁇ 16 prediction mode or a 4 ⁇ 4 prediction mode ( Step ST111).
  • the prediction mode estimation process determination unit 16 calculates the difference value Diff 16 ⁇ 16_n (step ST112), the difference value Diff 16 ⁇ 16_n, and the threshold th 16 X16_n are compared (step ST113).
  • Diff 16 ⁇ 16_n ⁇ th 16 ⁇ 16_n (85)
  • n is a 16 ⁇ 16 prediction mode one frame before, and is any one of prediction modes 0 to 3.
  • the prediction mode estimation process determination unit 16 regards the encoding target block as similar between consecutive frames, and outputs a prediction mode output command to the prediction mode storage unit 12. (Step ST118).
  • the prediction mode storage unit 12 receives a prediction mode output command from the prediction mode estimation process determination unit 16
  • the prediction mode storage unit 12 sets the stored prediction mode of the previous frame to H.264.
  • H.264 encoding unit 3 outputs the result.
  • the prediction mode stored in the prediction mode storage unit 12 is the prediction mode several frames before, H.
  • the prediction mode several frames before H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation process determination unit 16 regards that the encoding target block is different between consecutive frames, and outputs a prediction mode estimation command to the prediction mode estimation unit 2. (Step ST119).
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation process determination unit 16, the prediction mode estimation unit 2 performs the same as in the first to fifth embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the prediction mode estimation process determination unit 16 calculates ⁇ 0 to ⁇ 5, m and a difference value Diff 4 ⁇ 4 based on the 4 ⁇ 4 prediction mode when the prediction mode one frame before is the 4 ⁇ 4 prediction mode (Stes ST114 to ST116), the difference value Diff 4 ⁇ 4 is compared with the threshold th 4 ⁇ 4 (step ST117).
  • a calculation method of ⁇ 0 to ⁇ 5, m, Diff 4 ⁇ 4 will be described later.
  • the prediction mode estimation processing determination unit 16 regards the encoding target block as similar between consecutive frames, and outputs a prediction mode output command to the prediction mode storage unit 12.
  • Step ST118 When the prediction mode storage unit 12 receives a prediction mode output command from the prediction mode estimation process determination unit 16, the prediction mode storage unit 12 sets the stored prediction mode of the previous frame to H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode stored in the prediction mode storage unit 12 is the prediction mode several frames before, The prediction mode several frames before is set to H.264. H.264 encoding unit 3 outputs the result.
  • the prediction mode estimation process determination unit 16 regards that the encoding target block is different between consecutive frames, and outputs a prediction mode estimation command to the prediction mode estimation unit 2. (Step ST119).
  • the prediction mode estimation unit 2 receives the prediction mode estimation command from the prediction mode estimation process determination unit 16, the prediction mode estimation unit 2 performs the same as in the first to fifth embodiments.
  • H.264 prediction mode is estimated, and the prediction mode is set to H.264. It outputs to the H.264 encoding unit 3 and the prediction mode storage unit 12.
  • the prediction mode estimation processing determination unit 16 encodes the encoding target blocks A 0 0 to A 0 3, B 0 0 to B 0 3, and the block A as shown in the following equation (87).
  • the difference value Diff 16 ⁇ 16 — 0 is calculated using the DCT coefficients of the blocks RA 0, RA 1 and RB 0 , RB 1 adjacent to 0 0, A 0 1 and the blocks B 0 0, B 0 1.
  • Diff 16 ⁇ 16 — 2 is calculated using the DCT coefficients of RA 0 to RA 3 and blocks RB 0 to RB 3 adjacent to 0 0 to B 0 2.
  • the encoding target blocks A 0 0 to A 0 3, B 0 0 to B 0 3, the blocks A 0 0 to A 0 2, and the block B are expressed as shown in the following formula (90).
  • the difference value Diff 16 ⁇ 16 — 3 is calculated using the DCT coefficients of the blocks RA0 to RA3 and RB0 to RB3 adjacent to 0 0 to B 0 2 and the upper left blocks RB4 and RA4.
  • Prediction mode estimating process determining unit 16, calculating the difference value Diff 16 ⁇ 16_n by equation (87) to (90), as described above, compares the difference value Diff 16 ⁇ 16_n and a threshold th 16 ⁇ 16_n Thus, the necessity of performing the prediction mode estimation process is determined.
  • the prediction mode estimation process determination unit 16 encodes blocks A 0 0 to A 0 3, B 0 0 to B 0 3, and a block A 0 0.
  • the difference value Diff 4 ⁇ 4 is calculated using the DCT coefficients of the blocks RA 0 to RA 5 and RB 0 to RB 5 around the blocks A 0 2 and B 0 0 to B 0 2.
  • FIG. 22 shows the encoding target blocks B 1 0 to B 1 15 one frame before and the surrounding blocks RB 0 to RB 5 in the 4 ⁇ 4 prediction mode, and the encoding target blocks A 0 0 to A 0 of the current frame. 3 and the peripheral blocks RA0 to RA5.
  • a block B 1 0 to B 1 15 is obtained by dividing the block B 0 0 to B 0 3 of FIG. 19 into four blocks.
  • the block B 0 0 is a block B 1 0 to B 1 3 and the block B 0 1 is a block B 0 1.
  • block B 1 4 ⁇ B 1 7 the block B 0 2 block B 1 8 ⁇ B 1 11, block B 0 3 is one that is divided into blocks B 1 12 ⁇ B 1 15.
  • the value of ⁇ 0 is determined by whether or not prediction is performed using pixels included in the block RB0 in the previous frame. Prediction is performed using the pixels included in the block RB0 in the previous frame because the prediction mode of B 1 0 is 0, 2 to 7, the prediction mode of B 1 1 is 0, 2 to 7, and B 14 This is a case where the prediction mode is 4-6.
  • the .mu.0 0 as an initial value, if the B 1 0, B 1 1 is taking the prediction modes, each 4/9 is added to .mu.0, if B 1 4 is taking the prediction modes, the .mu.0 1/9 is added.
  • the value of ⁇ 1 is determined by whether or not prediction is performed using pixels included in the block RB1 in the previous frame.
  • the prediction is performed using the pixels included in the block RB1 in the previous frame because the prediction mode of B 11 is 3 or 7, the prediction mode of B 14 is 0, 2 to 7, and the prediction mode of B 15 Is 0, 2-7.
  • the .mu.1 0 as an initial value, if the B 1 1, B 1 4, B 1 5 is taking the prediction mode, respectively .mu.1 1/3 is added.
  • the value of ⁇ 2 is determined depending on whether or not prediction is performed using pixels included in the block RB2 in the previous frame. Is the prediction using the pixels contained in the previous frame in the block RB2 is performed, B 1 0 prediction mode of 1,2,4-6,8, prediction mode B 1 2 is 1,2,4- This is a case where the prediction modes of 6, 8, and B 1 8 are 4-6.
  • the .mu.2 0 as an initial value, if the B 1 0, B 1 2 is taking the prediction modes, each 4/9 is added to .mu.2, if B 1 8 is taking the prediction modes, the .mu.2 1/9 is added.
  • the value of ⁇ 3 is determined depending on whether prediction is performed using pixels included in the block RB3 in the previous frame. Prediction is performed using pixels included in the block RB3 in the previous frame because the prediction mode of B 1 8 is 1, 2, 4 to 6, 8, and the prediction mode of B 1 10 is 1, 2, 4 to This is the case for 6 and 8.
  • the current block and the neighboring block used when comparing the encoding target block and the neighboring block at the same position one frame before are predicted one frame before. Since it is determined from the mode, if the same prediction mode as the previous frame is used, it is possible to infer whether or not the coding efficiency changes greatly, and furthermore, highly efficient predictive coding is possible. Has the effect of becoming.
  • the prediction mode estimation unit 2 uses the DCT coefficients acquired by the JPEG simple decoding unit 1 to determine the H.264 format.
  • the prediction mode estimation unit 2 is configured to estimate the H.264 prediction mode.
  • a new frequency characteristic (frequency component) may be calculated from the DCT coefficient acquired by the JPEG simple decoding unit 1, and the prediction mode may be estimated from the frequency characteristic.
  • the image coding method conversion apparatus has the same basic configuration as the image coding method conversion apparatus according to any one of the first to sixth embodiments. Since the processing content of the H.264 encoding unit 3 is the same as that of the first embodiment, only the processing content of the prediction mode estimation unit 2 will be described. Unless otherwise specified, the variables in the mathematical expressions represent the same meaning as in the first embodiment.
  • FIG. 5 is an explanatory diagram showing the encoding target blocks C 0 0 to C 0 3 of the image and the surrounding blocks R0 to R5.
  • the blocks C 0 0 to C 0 3 and R0 to R5 are all 8 ⁇ 8 blocks.
  • the situation where the prediction mode 0 (vertical direction) in the 16 ⁇ 16 prediction mode is efficient is that the values of the bottom 8 pixels of the block R0 and the pixels of the blocks C 0 0 and C 0 2 are close, and the bottom of the block R1 This is a case where the values of the 8 pixels and the pixels of the blocks C 0 1 and C 0 3 are close.
  • the situation where the prediction mode 1 (horizontal direction) in the 16 ⁇ 16 prediction mode is efficient is that the rightmost eight pixels of the block R2 and the values of the pixels of the blocks C 0 0 and C 0 1 are close, and the block R3 This is a case where the rightmost eight pixels and the values of the pixels of the blocks C 0 2 and C 0 3 are close.
  • the situation where the prediction mode 2 (DC prediction) in the 16 ⁇ 16 prediction mode is efficient is that the average value of the lowermost 16 pixels of the blocks R0 and R1 and the rightmost 16 pixels of the blocks R2 and R3 is This is a case close to all the pixels of C 0 0 to C 0 3.
  • the situation where the prediction mode 3 (plane prediction) in the 16 ⁇ 16 prediction mode is efficient is that the lowermost 15 pixels of the blocks R0 and R1, the rightmost 15 pixels of the blocks R2 and R3, and the right of the R4 Since a predicted image with gradation is created using the lower pixel, the change in the lowermost pixel of the blocks R0 and R1 matches the change in the horizontal direction of the blocks C 0 0 to C 0 3. This is a case where the change in the rightmost pixel of the blocks R2 and R3 is close to the change in the vertical direction of the blocks C 0 0 to C 0 3. This is effective for an image with gradation.
  • the prediction mode estimation unit 2 substitutes the DCT coefficients output from the JPEG simple decoding unit 1 into the functions shown in the following equations (93) to (96), and R0, which are pixels used for prediction
  • the frequency characteristics R0_bottom and R1_bottom of the lowermost 16 pixels of R1 and the frequency characteristics R2_right and R3_right of the rightmost 16 pixels of R2 and R3 are calculated.
  • DCT_R0 i, j , DCT_R1 i, j , DCT_R2 i, j and DCT_R3 i, j are i-th row and j-th column DCT coefficients in blocks R0, R1, R2 and R3, respectively.
  • D j, i is an element of the discrete cosine transformation matrix D
  • d T j, i is an element of the transposed matrix D T of the discrete cosine matrix D.
  • w i and w j are weights.
  • FIG. 23 shows the frequency characteristics R0_bottom and R1_bottom of the lowermost 16 pixels of the blocks R 0 to R 3, the blocks R 0 to R 3 around the blocks C 0 0 to C 0 3, and the rightmost ends of R 2 and R 3.
  • R0_right of 16 pixels, and R3_right The blocks C 0 0 to C 0 3 and R0 to R3 are all 8 ⁇ 8 blocks.
  • R0_bottom and R1_bottom indicate the frequency characteristics in the vertical direction of the lowermost pixels of the blocks R0 and R1
  • R2_right and R3_right indicate the frequency characteristics in the horizontal direction of the rightmost pixels of the blocks R2 and R3. is there.
  • the prediction mode estimation part 2 is H.264.
  • the DCT coefficients output from the JPEG simple decoding unit 1 and the above R0_bottom, R1_bottom, R2_right, R3_right are expressed by the following equations (97) and (98):
  • the evaluation values Cost 16 ⁇ 16 — 0 and Cost 16 ⁇ 16 — 1 are calculated by substituting into the evaluation function shown in FIG.
  • k is a coefficient used for calculation, and 0 ⁇ k ⁇ 7.
  • k 0, it means that the prediction mode is estimated only from the DCT coefficient of the direct current component and the frequency characteristic of the direct current component among all the DCT coefficients.
  • w16 ⁇ 16_0j , w16 ⁇ 16_1j , w16 ⁇ 16_2j , w16 ⁇ 16_3j , w16 ⁇ 16_0i , w16 ⁇ 16_1i , w16 ⁇ 16_2i , and w16 ⁇ 16_3i are weights.
  • the evaluation value Cost 16 ⁇ 16_0 evaluates the proximity of the horizontal change between the blocks C 0 0, C 0 2 and the block R0 and the horizontal change between the blocks C 0 1, C 0 3 and the block R1. This is an evaluation value of prediction mode 0 (vertical prediction) in the 16 ⁇ 16 prediction mode. Further, the evaluation value Cost 16 ⁇ 16_1 is obtained by evaluating the closeness of the vertical change between the blocks C 0 0, C 0 1 and the block R2 and the vertical change between the blocks C 0 2, C 0 3 and the block R3. The evaluation value of prediction mode 1 (horizontal prediction) in the 16 ⁇ 16 prediction mode. Since the subsequent estimation processing is the same as in the first to sixth embodiments, description thereof will be omitted.
  • the prediction mode estimation unit 2 does not use the frequency components of the surrounding 8 ⁇ 8 blocks, but evaluates using the frequency components of only the portions necessary for prediction. Value is calculated, and H.V. Since it is configured to determine the H.264 prediction mode, there is an effect that the prediction mode can be estimated with higher accuracy.
  • the prediction mode estimation unit 2 uses the DCT coefficients acquired by the JPEG simple decoding unit 1 to determine the H.264 format.
  • the prediction mode in the H.264 system is estimated.
  • the estimation is performed using the frequency component in units of 4 ⁇ 4 blocks instead of the frequency component in units of 8 ⁇ 8 blocks. You may do it.
  • a conversion coefficient in units of 4 ⁇ 4 blocks that can be calculated by performing 4 ⁇ 4 conversion on the pixel value decoded from JPEG is used. To do.
  • FIG. 24 is a block diagram showing an image coding method conversion apparatus according to Embodiment 8 of the present invention.
  • a JPEG decoding unit 21 converts the image into a frequency domain and encodes it (first image).
  • JPEG data that is an encoded stream of (encoding method) is input
  • the JPEG data is decoded, and as a decoding result, a pixel value (pixel signal) of the image and a DCT coefficient that is a signal of a frequency component of the image
  • a process for acquiring header information indicating the width and height of the image is performed.
  • the JPEG decoding unit 21 constitutes a signal acquisition unit.
  • the prediction mode estimation unit 22 calculates the H.264 from the pixel values and DCT coefficients acquired by the JPEG decoding unit 21.
  • a process of estimating a prediction mode (direction of intra-screen prediction) in the H.264 system (second encoding system) is performed.
  • the prediction mode estimation unit 22 constitutes an intra-screen prediction direction estimation unit.
  • the H.264 encoding unit 23 is H.264.
  • H.264 encoding is performed by the JPEG simple decoding unit 21 using the prediction mode estimated by the prediction mode estimation unit 22 and the header information acquired by the JPEG decoding unit 21.
  • the pixel value is encoded and H.264 is encoded.
  • a process of generating a H.264 stream (encoded stream of the second encoding method) is performed.
  • the H.264 encoding unit 23 constitutes encoding means.
  • the JPEG decoding unit 21 decodes the JPEG data.
  • the JPEG decoding unit 21 acquires header information indicating the pixel value of the image, the DCT coefficient that is the frequency component of the image, the width and height of the image, and the like as the decoding result of the JPEG data.
  • the pixel value of the image is obtained from the JPEG decoding unit 21 to the prediction mode estimation unit 22 and the H.264 format.
  • the H.264 encoding unit 23 outputs the DCT coefficient from the JPEG decoding unit 21 to the prediction mode estimation unit 22.
  • the header information is sent from the JPEG decoding unit 21 to H.264.
  • the H.264 encoding unit 23 outputs the result.
  • the prediction mode estimation unit 22 When the prediction mode estimation unit 22 receives the pixel value and the DCT coefficient of the image from the JPEG decoding unit 21, the prediction mode estimation unit 22 calculates the H.264 from the pixel value and the DCT coefficient.
  • the prediction mode in the H.264 system is estimated. That is, the prediction mode estimation unit 22 determines whether to adopt the 16 ⁇ 16 mode or the 4 ⁇ 4 prediction mode in the same manner as any one of the prediction mode estimation units 2 in the first to seventh embodiments. To do. Since the 16 ⁇ 16 prediction mode is adopted and the processing contents when selecting the prediction mode in the 16 ⁇ 16 prediction mode are the same as those in any of the first to seventh embodiments, description thereof will be omitted.
  • the prediction mode estimation unit 22 determines that the 4 ⁇ 4 prediction mode is adopted, the pixel values X of 16 4 ⁇ 4 blocks in the corresponding 16 ⁇ 16 macroblock are substituted into the following equation (99). 4 ⁇ 4 conversion coefficient Y is calculated.
  • the 4 ⁇ 4 transform coefficient Y indicates the frequency characteristic in the block
  • the prediction mode estimation unit 22 calculates an evaluation value from the 4 ⁇ 4 transform coefficient Y.
  • a 4 ⁇ 4 prediction mode in the H.264 scheme is estimated. Specifically, it is as follows. 25 to 27 are flowcharts showing prediction mode estimation processing in the 4 ⁇ 4 prediction mode.
  • the prediction mode estimation unit 22 substitutes the 4 ⁇ 4 conversion coefficient into the following formulas (101) and (102) to evaluate the vertical direction evaluation value Value 4 ⁇ 4_V and the horizontal direction evaluation value Value 4 ⁇ 4_H. Is calculated (step ST120 in FIG. 25).
  • y i, j is the i, j component of the 4 ⁇ 4 transform coefficient in the 4 ⁇ 4 block.
  • w i and w j are weights.
  • k is a coefficient used in the calculation.
  • k 1, it means that the prediction mode is estimated from only the 4 ⁇ 4 transform coefficients of the low frequency component among all 4 ⁇ 4 transform coefficients.
  • Prediction mode estimating unit 22 when calculating the vertical evaluation value Value 4 ⁇ 4_V and horizontal evaluation value Value 4 ⁇ 4_H, with comparing the vertical evaluation value Value 4 ⁇ 4_V and the threshold th 4 ⁇ 4_V, The horizontal evaluation value Value 4 ⁇ 4_H is compared with the threshold th 4 ⁇ 4_H (step ST121).
  • the prediction mode estimation unit 22 assumes that DC prediction is effective because the frequency components in the vertical direction and the horizontal direction are both small when the expressions (103) and (104) are satisfied, and thus the prediction mode of the 4 ⁇ 4 prediction mode is used. 2 is used (step ST122).
  • Prediction mode estimating unit 22 has the formula (103) or if not satisfied even one of formula (104), the ratio RateVH 4 ⁇ the vertical direction of the evaluation value Value 4 ⁇ 4_V and horizontal evaluation value Value 4 ⁇ 4_H 4 is calculated (step ST123).
  • the prediction mode estimation unit 22 compares the evaluation value ratio RateVH 4 ⁇ 4 with the thresholds th 4 ⁇ 4 — 0 and th 4 ⁇ 4 — 1 (steps ST124 and ST126).
  • RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_1 (106) th 4 ⁇ 4_1 ⁇ RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_0 (107) th 4 ⁇ 4_0 ⁇ RateVH 4 ⁇ 4 (108)
  • the prediction mode estimation unit 22 determines that the prediction in the horizontal direction is effective and uses the prediction mode 1 of the 4 ⁇ 4 prediction mode (step ST125).
  • Expression (108) the prediction mode estimation unit 22 determines that the prediction in the vertical direction is valid and uses the prediction mode 0 of the 4 ⁇ 4 prediction mode (step ST127).
  • FIG. 28 is an explanatory diagram showing pixel values of 4 ⁇ 4 blocks and 4 ⁇ 4 conversion coefficients after performing 4 ⁇ 4 conversion processing.
  • the sign SignVH 4 ⁇ 4 is positive
  • the sign SignVH 4 ⁇ 4 is negative. ing.
  • the prediction mode estimation unit 22 determines whether the signVH 4 ⁇ 4 is positive or negative (step ST129). SignVH 4 ⁇ 4 ⁇ 0 (110) When Expression (110) is established, the prediction mode estimation unit 22 narrows the 4 ⁇ 4 prediction mode to the prediction modes 3, 7, and 8 assuming that there is an edge toward the upper right or the lower left (step ST131). On the other hand, if the formula (110) is not satisfied, the 4 ⁇ 4 prediction mode is narrowed down to the prediction modes 4, 5, and 6 assuming that there is an edge toward the lower right or upper left (step ST130).
  • RateVH 4 ⁇ 4 and the threshold values th 4 ⁇ 4_8 and th 4 ⁇ 4_7 are compared (step ST132 in FIG. 26). , ST134).
  • RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_8 (111) th 4 ⁇ 4_8 ⁇ RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_7 (112) th 4 ⁇ 4_7 ⁇ RateVH 4 ⁇ 4 (113)
  • the prediction mode estimation part 22 determines using the prediction mode 8 of 4 * 4 prediction mode, when Formula (111) is materialized (step ST133).
  • the prediction mode estimation part 22 determines to use the prediction mode 7 of 4 * 4 prediction mode, when Formula (113) is materialized (step ST135).
  • the prediction mode estimation part 22 determines as the thing using the prediction mode 3 of 4 * 4 prediction mode, when Formula (112) is materialized (step ST136).
  • RateVH 4 ⁇ 4 is compared with the thresholds th 4 ⁇ 4_5 and th 4 ⁇ 4_6 (step ST137 in FIG. 27). , ST139).
  • RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_6 (114) th 4 ⁇ 4_6 ⁇ RateVH 4 ⁇ 4 ⁇ th 4 ⁇ 4_5 (115) th 4 ⁇ 4_5 ⁇ RateVH 4 ⁇ 4 (116)
  • the prediction mode estimation part 22 determines using the prediction mode 6 of 4 * 4 prediction mode, when Formula (114) is materialized (step ST138).
  • the prediction mode estimation part 22 determines using the prediction mode 5 of 4 * 4 prediction mode, when Formula (116) is materialized (step ST140).
  • the prediction mode estimation part 22 determines to use the prediction mode 4 of 4 * 4 prediction mode, when Formula (115) is materialized (step ST141).
  • the prediction mode can be estimated from the 4 ⁇ 4 transform coefficients of the 4 ⁇ 4 block.
  • the cost may be calculated by SAD or the like by narrowing down to three prediction modes including adjacent prediction modes.
  • the adjacent modes are those in which the direction of the arrow is close in the lower diagram of FIG. 5.
  • the prediction modes 0 and 3 are the adjacent modes. Become.
  • the H.264 encoding unit 23 encodes the pixel value acquired from the JPEG decoding unit 21 using the prediction mode and the header information acquired by the JPEG decoding unit 21. H. H.264 stream is generated.
  • the DCT that is the signal of the pixel value of the image and the signal of the frequency component of the image is decoded by decoding the JPEG data encoded by converting the image into the frequency domain.
  • the JPEG decoding unit 21 that acquires the coefficient, and the DCT coefficient that is the signal of the pixel value acquired by the JPEG decoding unit 21 and the frequency component of the image are converted into H.264.
  • the H.264 encoding unit 23 encodes the pixel value acquired by the JPEG decoding unit 21 using the prediction mode estimated by the prediction mode estimation unit 22, and outputs H.264 data.
  • the prediction mode estimation unit 22 calculates 4 ⁇ 4 transform coefficients, The calculation of 4 ⁇ 4 conversion in the H.264 encoding unit 23 can be omitted. There is an effect that conversion to H.264 can be performed at high speed.
  • Embodiment 9 FIG.
  • the estimation of the prediction mode is performed in units of 4 ⁇ 4 blocks when estimating the 4 ⁇ 4 prediction mode.
  • the unit of 5 ⁇ 5 blocks including the pixel values used for prediction is shown.
  • the estimation of the prediction mode may be performed in
  • the 4 ⁇ 4 prediction mode is estimated, the 4 ⁇ 4 prediction mode is estimated from the frequency components of the 5 ⁇ 5 block including the pixel value of the 4 ⁇ 4 block and the pixel value used for the prediction.
  • the basic configuration of the image coding system conversion apparatus according to the ninth embodiment is the same as that of the eighth embodiment. Since the processing content of the H.264 encoding unit 23 is the same as that of the eighth embodiment, only the processing content of the prediction mode estimation unit 22 will be described.
  • the prediction mode estimation unit 22 determines whether to adopt the 16 ⁇ 16 mode or the 4 ⁇ 4 prediction mode, as in the eighth embodiment. Since the 16 ⁇ 16 prediction mode is adopted and the processing contents when selecting the prediction mode in the 16 ⁇ 16 prediction mode are the same as those in any of the first to seventh embodiments, description thereof will be omitted.
  • FIG. 29 is an explanatory diagram showing a 4 ⁇ 4 block C 1 n to be encoded and surrounding pixels a to i.
  • the prediction mode estimation unit 22 determines to adopt the 4 ⁇ 4 prediction mode
  • the 16 4 ⁇ 4 blocks in the corresponding 16 ⁇ 16 macroblock and the pixel values a to i around the 4 ⁇ 4 block are included.
  • 5 ⁇ 5 block X including is substituted into the following equation (117) to calculate the frequency component Y of 5 ⁇ 5 block.
  • the prediction mode estimation unit 22 calculates an evaluation value from the frequency component Y of the 5 ⁇ 5 block.
  • a 4 ⁇ 4 prediction mode in the H.264 scheme is estimated. That is, the prediction mode estimation unit 22 substitutes the 4 ⁇ 4 conversion coefficient into the following formulas (120) and (121) to evaluate the vertical evaluation value Value 4 ⁇ 4_V and the horizontal evaluation value Value 4 ⁇ 4_H. Is calculated (step ST120 in FIG. 25).
  • y i, j is the i, j component of the frequency component of the 5 ⁇ 5 block in the 4 ⁇ 4 block.
  • w i and w j are weights.
  • the prediction mode estimation unit 22 uses the frequency characteristics of 5 ⁇ 5 blocks composed of 4 ⁇ 4 blocks and surrounding pixels used for prediction, H. Since it is configured to determine the H.264 prediction mode, there is an effect that the prediction mode can be estimated with higher accuracy.
  • the image coding method conversion apparatus decodes a part of the encoded stream of the first coding method in which an image is converted into the frequency domain and is encoded,
  • a frequency component signal acquisition means for acquiring a frequency component signal; and an intra-screen prediction direction estimation means for estimating an intra-screen prediction direction from the frequency component signal acquired by the frequency component signal acquisition means.
  • the frequency component signal acquired by the frequency component signal acquisition unit is encoded to generate an encoded stream of the second encoding method.
  • the image coding method can be converted with a small amount of calculation, and it is suitable for use in an image coding method conversion device for compressing and coding an image.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 画像が周波数領域に変換されて符号化されているJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数を取得するJPEG簡易復号部1と、JPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モード(画面内予測の方向)を推定する予測モード推定部2とを設け、H.264符号化部3が予測モード推定部2により推定された予測モードを用いて、JPEG簡易復号部1により取得されたDCT係数を符号化してH.264ストリームを生成する。

Description

画像符号化方式変換装置
 この発明は、画像の符号化方式を変換する画像符号化方式変換装置に関するものである。
 近年、画像を圧縮して符号化する技術が広く用いられている。
 画像符号化方式の代表的なものとしては、主にデジタルカメラなどで用いられるJPEG(Joint Photographic Expert Group)方式がある。
 また、JPEGを連続して符号化することで、動画像を符号化するMotionJPEGと呼ばれる方式がある。MotionJPEG方式はMJPEG方式やM-JPEG方式と呼ばれることもある。
 さらに、DVD(Digital Versatile Disk)-VIDEOに採用されているMPEG-2(Moving Picture Expert Group)と呼ばれる方式もある。
 また、携帯端末向けの地上デジタル放送、いわゆるワンセグ放送に採用されている方式であるH.264方式もある。
 以上のように、画像符号化方式には様々な方式があり、一般に、異なる画像符号化方式には互換性がない。
 ユーザが異なる画像符号化方式に対応するには、それぞれの画像符号化方式に対応する画像復号装置を用意するか、画像符号化方式変換装置を用意する必要がある。
 しかし、例えば、市販されているDVDプレーヤでは、MPEG-2方式以外の方式には対応することができず、それぞれの画像符号化方式に対応する画像復号装置を用意するのは現実的に困難な場合がある。
 一方、画像符号化方式変換装置を用意すれば、それぞれの画像符号化方式に対応する画像復号装置を用意する必要がなくなるが、画像の変換に要する時間や、変換後の画像の品質が問題になる。
 例えば、以下の特許文献1に開示されている画像符号化方式変換装置では、JPEG方式をMPEG-4方式に変換する手法が開示されている。
 即ち、この画像符号化方式変換装置では、JPEG方式とMPEG-4方式の双方がDCT係数を圧縮に用いていることを利用し、直流(DC:Direct Current)成分の変換とハフマンコードの変換によって、JPEG方式をMPEG-4方式に変換するようにしている。
 しかし、H.264方式ではDCT係数が用いられないので、この画像符号化方式変換装置では、H.264方式の変換に適用することができない。
 また、H.264方式では画面内予測と呼ばれる技術が用いられているが、JPEG方式やMPEG-2方式では画面内予測と呼ばれる技術は用いられない。
 特に、H.264方式で採用されている画面内予測における予測モードの決定処理において、SAD(Sum of Absolute Difference)やSATD(Sum of Absolute Transformed Difference)は非常に演算量が大きいとされている。
 そこで、非特許文献1,2では、変換前のMPEG-2のDCT係数を利用し、H.264方式の画面内予測における予測モードを絞り込むことで、高速な変換を行う方法を開示している。
 ただし、非特許文献1,2では、16×16予測において、予測モードを決定するようにしているが、全てのDCT係数を使用する場合があり、この場合には、非常に多くの演算量を要することになる。
 なお、4×4予測においては、予測方向の絞込みを行うだけで、完全には予測方法を決定していない。
 非特許文献3では、8×8DCT係数を4つの4×4DCT係数に変換し、変換した4×4DCT係数から予測モードを決定する方法を開示している。
 ただし、8×8DCT係数を4つの4×4DCT係数に変換する演算量は非常に大きなものとなる。
特開2004-186811号公報 「A fast Intra Mode Decision Algorithm for MPEG-2 to H.264 Video Transcoding」Consumer Electronics, 2006. ISCE '06. 2006 IEEE Tenth International Symposium on 2006 Page(s):1 - 5 「Fast Intra Prediction Mode Decision for MPEG-2 to H.264 Transcoding」Multimedia and Expo, 2007 IEEE International Conference on2-5 July 2007 Page(s):428 - 431 「Fast Intra Mode Decision Method for MPEG to H.264 Transcoding」Image Processing, 2006 IEEE International Conference on8-11 Oct. 2006 Page(s):833 - 836
 従来の画像符号化方式変換装置は以上のように構成されているので、非特許文献1~3では、H.264方式を画像符号化方式の変換対象に含めることができるが、画像符号化方式を変換する際の演算量が非常に大きくなるなどの課題があった。
 この発明は上記のような課題を解決するためになされたもので、少ない演算量で画像符号化方式を変換することができる画像符号化方式変換装置を得ることを目的とする。
 この発明に係る画像符号化方式変換装置は、画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームの一部を復号して、画像の周波数成分の信号を取得する周波数成分信号取得手段と、周波数成分信号取得手段により取得された周波数成分の信号から画面内予測の方向を推定する画面内予測方向推定手段とを設け、符号化手段が画面内予測方向推定手段により推定された画面内予測の方向を用いて、周波数成分信号取得手段により取得された周波数成分の信号を符号化して第2の符号化方式の符号化ストリームを生成するようにしたものである。
 この発明によれば、画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームの一部を復号して、画像の周波数成分の信号を取得する周波数成分信号取得手段と、周波数成分信号取得手段により取得された周波数成分の信号から画面内予測の方向を推定する画面内予測方向推定手段とを設け、符号化手段が画面内予測方向推定手段により推定された画面内予測の方向を用いて、周波数成分信号取得手段により取得された周波数成分の信号を符号化して第2の符号化方式の符号化ストリームを生成するように構成したので、少ない演算量で画像符号化方式を変換することができる効果がある。
この発明の実施の形態1による画像符号化方式変換装置を示す構成図である。 この発明の実施の形態1による画像符号化方式変換装置の予測モード推定部2の処理内容を示すフローチャートである。 16×16予測モードにおける4つの予測モードを示す説明図である。 4×4予測モードにおける9つの予測モードを示す説明図である。 画像の符号化対象のブロックC00~C03と、その周辺のブロックR0~R5を示す説明図である。 画像の符号化対象のブロックC10~C115と、その周辺のブロックR0~R5を示す説明図である。 4×4予測モードにおける予測モードの絞込み処理を示すフローチャートである。 4×4予測モードにおける予測モードの選択処理を示すフローチャートである。 4×4予測モードにおける予測モードの選択処理を示すフローチャートである。 4×4予測モードにおける予測モードの選択処理を示すフローチャートである。 この発明の実施の形態2による画像符号化方式変換装置の予測モードの選択処理を示すフローチャートである。 この発明の実施の形態2による画像符号化方式変換装置の予測モードの選択処理を示すフローチャートである。 この発明の実施の形態3による画像符号化方式変換装置を示す構成図である。 静止画像と動画像の関係を示す説明図である。 現在のフレームの符号化対象ブロックA00~A03と1フレーム前の同一位置の符号化対象ブロックB00~B03を示す説明図である。 この発明の実施の形態3による画像符号化方式変換装置の予測モード推定処理判定部13の処理内容を示すフローチャートである。 この発明の実施の形態4による画像符号化方式変換装置を示す構成図である。 この発明の実施の形態4による画像符号化方式変換装置の予測モード推定処理判定部15の処理内容を示すフローチャートである。 現在のフレームの符号化対象ブロックA00~A03と、その周辺ブロックRA0~RA5と、1フレーム前の同一位置の符号化対象ブロックB00~B03と、その周辺ブロックRB0~RB5とを示す説明図である。 この発明の実施の形態6による画像符号化方式変換装置を示す構成図である。 この発明の実施の形態6による画像符号化方式変換装置の予測モード推定処理判定部16の処理内容を示すフローチャートである。 4×4予測モードのときの1フレーム前の符号化対象ブロックB10~B115とその周辺のブロックRB0~RB5と、現在のフレームの符号化対象ブロックA00~A03とその周辺のブロックRA0~RA5とを示す説明図である。 画像の符号化対象ブロックC00~C03と、その周辺のブロックR0~R3と、ブロックR0,R1の最下部16画素の周波数特性R0_bottom,R1_bottomと、R2,R3の最右端16画素の周波数特性R2_right,R3_rightとを示す説明図である。 この発明の実施の形態8による画像符号化方式変換装置を示す構成図である。 4×4予測モードにおける予測モードの選択及び絞込み処理を示すフローチャートである。 4×4予測モードにおける予測モードの選択処理を示すフローチャートである。 4×4予測モードにおける予測モードの選択処理を示すフローチャートである。 4×4ブロックの画素値と4×4変換処理を施した後の4×4変換係数を示す説明図である。 符号化対象の4×4ブロックC1nと、その周辺の画素a~iを示す説明図である。
 以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
 図1はこの発明の実施の形態1による画像符号化方式変換装置を示す構成図であり、図において、JPEG簡易復号部1は画像が周波数領域に変換されて符号化されているJPEG方式(第1の符号化方式)の符号化ストリームであるJPEGデータを入力すると、そのJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数と、画像の幅や高さなどを示すヘッダ情報を取得する処理を実施する。なお、JPEG簡易復号部1は周波数成分信号取得手段を構成している。
 予測モード推定部2はJPEG簡易復号部1により取得されたDCT係数からH.264方式(第2の符号化方式)における予測モード(画面内予測の方向)を推定する処理を実施する。なお、予測モード推定部2は画面内予測方向推定手段を構成している。
 H.264符号化部3はH.264方式の符号化処理を実施する符号化部であり、予測モード推定部2により推定された予測モードとJPEG簡易復号部1により取得されたヘッダ情報を用いて、JPEG簡易復号部1により取得されたDCT係数を符号化して、H.264ストリーム(第2の符号化方式の符号化ストリーム)を生成する処理を実施する。なお、H.264符号化部3は符号化手段を構成している。
 図2はこの発明の実施の形態1による画像符号化方式変換装置の予測モード推定部2の処理内容を示すフローチャートである。
 次に動作について説明する。
 この実施の形態1では、第1の符号化方式がJPEG方式であり、第2の符号化方式がH.264方式である例を説明する。
 ただし、これは単なる一例に過ぎず、類似する他の方式であっても適用することができることは言うまでもない。例えば、第1の符号化方式がMPEG-1方式、MPEG-2方式又はMPEG-4方式であってもよい。
 なお、H.264方式は時間方向の圧縮も可能であるが、この実施の形態1では、画面内圧縮方式のみを対象とする。
 最初に、JPEG方式及びH.264方式について簡単に説明する。
 JPEG方式は、画像を8×8のブロックに分割して、各ブロックに対するDCT変換を実施し、DCT変換を実施することにより得られるDCT係数を量子化し、量子化後のDCT係数を可変長符号化する方式である。
 一般に、DCT係数を量子化する際、高周波成分に対する量子化係数を大きくして、高周波成分をカットすることにより、圧縮効率を高めている。
 H.264方式では、画像を16×16のブロック(マクロブロック)に分割し、マクロブロック毎に、16×16予測を行うか、4×4予測を行うかを選択する。
 この予測は、既に符号化された隣接する画素から予測画像を作成し、符号化対象の画像と予測画像の差分を取ることを意味する。
 即ち、H.264方式では、上記の予測を16×16ブロック領域(16×16予測モード)で行うか、4×4ブロック領域(4×4予測モード)で行うかを選択する。
 16×16予測モードには4つの予測モードがあり(図3を参照)、4×4予測モードには9つの予測モードがあり(図4を参照)、隣接するどの画素から予測を行うかを選択することができる。
 この予測処理により、取られた差分に対して、整数精度で周波数領域への変換を実施し、その変換により得られる係数を量子化する。この適応的な予測処理を行うことにより、圧縮効率を高めている。
 しかし、この予測モードの選択は、非常に演算量が多い処理である。
 この実施の形態1では、JPEG方式のDCT係数を利用することで、予測モードの推定を高速に行う。
 以下、図1の画像符号化方式変換装置の処理内容を詳細に説明する。
 JPEG簡易復号部1は、画像が周波数領域に変換されて符号化されているJPEG方式のJPEGデータを入力すると、そのJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数と、画像の幅や高さなどを示すヘッダ情報を取得する。
 通常のJPEG復号では、得られたDCT係数に対してIDCT(Inverse Discrete Cosine Transform)処理を実施して画素の値に復号するが、JPEG簡易復号部1ではIDCT処理を実施せず、得られたDCT係数を予測モード推定部2に出力し、ヘッダ情報をH.264符号化部3に出力する。
 予測モード推定部2は、JPEG簡易復号部1からDCT係数を受けると、そのDCT係数からH.264方式における予測モード(画面内予測の方向)を推定する。
 以下、予測モード推定部2の処理内容を具体的に説明する。
 図5は画像の符号化対象のブロックC00~C03と、その周辺のブロックR0~R5を示す説明図である。なお、ブロックC00~C03,R0~R5は、いずれも8×8のブロックである。
 16×16予測モードにおける予測モード0(垂直予測)が効率的である状況(H.264方式において、予測モード0を利用するのが適正である状況)は、ブロックR0の最下部の8画素とブロックC00,C02の画素が近く、ブロックR1の最下部の8画素とブロックC01,C03の画素が近い場合である。
 また、16×16予測モードにおける予測モード1(水平予測)が効率的である状況(H.264方式において、予測モード1を利用するのが適正である状況)は、ブロックR2の最右端の8画素とブロックC00,C01の画素が近く、ブロックR3の最右端の8画素とブロックC02,C03の画素が近い場合である。
 16×16予測モードにおける予測モード2(DC予測)が効率的である状況(H.264方式において、予測モード2を利用するのが適正である状況)は、ブロックR0,R1の最下部の16画素と、ブロックR2,R3の最右端の16画素と、ブロックR4の右下1画素との平均値が、ブロックC00~C03の全ての画素の平均値に近い場合である。
 また、16×16予測モードにおける予測モード3(平面予測)が効率的である状況(H.264方式において、予測モード3を利用するのが適正である状況)は、ブロックR0,R1の最下部の8画素と、ブロックR2,R3の最右端の8画素と、ブロックR4の右下の画素とを利用して、グラデーションのある予測画像が作成されるため、ブロックR0,R1の最下部の画素の変化が、ブロックC00~C03の水平方向の変化に一致し、ブロックR2,R3の最右端の画素の変化が、ブロックC00~C03の垂直方向の変化に近い場合である。これは、グラデーションのある画像の場合に有効である。
 そこで、予測モード推定部2は、H.264方式において、利用に適する予測モードを推定するために、JPEG簡易復号部1から出力されたDCT係数を下記の式(1)及び式(2)に示す評価関数に代入して、評価値Cost16×16_0,Cost16×16_1を算出する(図2のステップST1)。
Figure JPOXMLDOC01-appb-M000001
 ただし、DCT_C0i,j,DCT_C0i,j,DCT_C0i,j,DCT_C0i,j,DCT_R0i,j,DCT_R1i,j,DCT_R2i,j,DCT_R3i,jは、それぞれブロックC01,C02,C03,C04,,R0,R1,R2,R3におけるi行,j列のDCT係数である。
 また、kは計算に用いる係数であり、ここでは、0≦k≦7であるとする。因みに、k=0とすれば、全DCT係数のうち、直流成分のDCT係数のみから予測モードを推定することを意味する。また、k=1又はk=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみから予測モードを推定することを意味する。ここでは、k=1又はk=2とすれば、低周波成分のDCT係数のみから予測モードを推定することを意味するとしたが、例えば、k=3としても、低周波成分のDCT係数のみから予測モードを推定することを意味する。
 w16×16_DC0,w16×16_DC1,w16×16_DC2,w16×16_DC3,wi,wjは重みである。
 評価値Cost16×16_0は、ブロックC00,C02とブロックR0の水平方向の変化及びブロックC01,C03とブロックR1の水平方向の変化の近さを評価しており、16×16予測モードにおける予測モード0(垂直予測)の評価値である。
 また、評価値Cost16×16_1は、ブロックC00,C01とブロックR2の垂直方向の変化及びブロックC02,C03とブロックR3の垂直方向の変化の近さを評価しており、16×16予測モードにおける予測モード1(水平予測)の評価値である。
 予測モード推定部2は、評価値Cost16×16_0,Cost16×16_1を算出すると、評価値Cost16×16_0と閾値th16×16_0を比較するとともに(ステップST2)、評価値Cost16×16_1と閾値th16×16_1を比較する(ステップST3,ST4)。
 Cost16×16_0≦th16×16_0                 (3)
 Cost16×16_1≦th16×16_1                 (4)
 予測モード推定部2は、式(3)又は式(4)の少なくとも一方が成立する場合、16×16ブロックの単位で充分に周辺画素に近いと判断し、16×16予測モードにおける何れかの予測モードを利用するものと決定する。
 一方、式(3)と式(4)の双方が成立しない場合、H.264方式における予測モードとして、4×4予測モードにおける何れかの予測モードを利用するものと決定する(ステップST5)。
 予測モード推定部2は、式(3)のみが成立する場合、16×16予測モードにおける予測モード0(垂直予測)を利用するものと決定する(ステップST6)。
 また、式(4)のみが成立する場合、16×16予測モードにおける予測モード1(水平予測)を利用するものと決定する(ステップST7)。
 予測モード推定部2は、式(3)と式(4)の双方が成立する場合、評価値Cost16×16_0と評価値Cost16×16_1の差分絶対値を取り、その差分絶対値と閾値th16×16_2を比較する(ステップST8)。
 |Cost16×16_0-Cost16×16_1|≧th16×16_2
                                  (5)
 予測モード推定部2は、式(5)が成立する場合、垂直方向又は水平方向のいずれかのみが有効である判断し、評価値Cost16×16_0と評価値Cost16×16_1を比較する(ステップST9)。
 Cost16×16_0<Cost16×16_1               (6)
 予測モード推定部2は、式(6)が成立する場合、16×16予測モードにおける予測モード0(垂直予測)を利用するものと決定し(ステップST10)、式(6)が成立しない場合、16×16予測モードにおける予測モード1(水平予測)を利用するものと決定する(ステップST11)。
 予測モード推定部2は、式(5)が成立しない場合、16×16予測モードにおける予測モード2(DC予測)又は16×16予測モードにおける予測モード3(平面予測)が有効であると判断する。
 このうち、予測モード3(平面予測)は、ブロックR0,R1の最下部の画素の変化と、ブロックR2,R3の最右端の画素の変化とが、ブロックC00~C04の画素の変化に近い場合に有効であると言える。
 そこで、予測モード推定部2は、評価値Cost16×16_0と評価値Cost16×16_1の和を取り、その和と閾値th16×16_3を比較する(ステップST12)。
 Cost16×16_3=Cost16×16_0+Cost16×16_1≦th16×16_3
                                  (7)
 予測モード推定部2は、式(7)が成立する場合、16×16予測モードにおける予測モード3(平面予測)を利用するものと決定し(ステップST14)、式(7)が成立しない場合、16×16予測モードにおける予測モード2(DC予測)を利用するものと決定する(ステップST13)。
 予測モード推定部2は、ステップST5において、4×4予測モードにおける何らかの予測モードを利用するものと決定すると、以下のようにして、4×4予測モードにおける予測モードを選択する。
 図6は画像の符号化対象のブロックC10~C115と、その周辺のブロックR0~R5を示す説明図である。
 ブロックC10~C115は、いずれも4×4のブロックであり、0~15の順序で符号化される。
 ブロックC10~C115は、図5のブロックC00~C03が4分割されたものであって、ブロックC00はブロックC10~C13、ブロックC01はブロックC14~C17、ブロックC02はブロックC18~C111、ブロックC03はブロックC112~C115に分割されたものである。
 なお、ブロックR0~R5は、いずれも8×8のブロックであり、図4のブロックR0~R5と同じである。
 予測モード推定部2は、垂直方向と水平方向の評価値をブロック毎に算出して、その垂直方向と水平方向の評価値の比を算出する。
 予測モード推定部2は、評価値の比によって、大まかに、3つに予測モード(垂直方向、水平方向、斜め方向)に絞込み、絞り込んだ予測方向から予測モードを決定する。
 この予測モードの絞込みにおいて、予測モード0,3,7を垂直方向、予測モード1,8を水平方向、予測モード2,4,5,6を斜め方向とする。この予測モードの分類は、予測画像を作成する画素の位置に基づくものである。
 具体的には、以下の通りである。
 図7は4×4予測モードにおける予測モードの絞込み処理を示すフローチャートである。
 図8、図9及び図10は4×4予測モードにおける予測モードの選択処理を示すフローチャートである。
 まず、予測モード推定部2は、ブロックC1n(0≦n≦15)の垂直方向の評価値Cost4×4_V,nと、水平方向の評価値Cost4×4_H,nとを算出する(図7のステップST21)。評価値の算出方法はブロック毎に異なり、その算出方法は後述する。
 予測モード推定部2は、垂直方向と水平方向の評価値をブロック毎に算出すると、垂直方向の評価値と水平方向の評価値の比RateVH4×4,nを算出する(ステップST22)。
Figure JPOXMLDOC01-appb-M000002
 予測モード推定部2は、評価値の比RateVH4×4,nを算出すると、その評価値の比RateVH4×4,nと閾値th4×4_H,n,th4×4_V,nを比較する(ステップST23,ST24)。
 RateVH4×4,n<th4×4_H,n                  (9)
 th4×4_H,n≦RateVH4×4,n<th4×4_V,n          (10)
 RateVH4×4,n≧th4×4_V,n                 (11)
 予測モード推定部2は、式(9)が成立する場合、水平方向への予測が有効であるとして、予測モード1,8に絞込みを行う(ステップST25)。
 予測モード推定部2は、式(10)が成立する場合、斜め方向への予測が有効であるとして、予測モード2,4,5,6に絞込みを行う(ステップST26)。
 予測モード推定部2は、式(11)が成立する場合、垂直方向への予測が有効であるとして、予測モード0,3,7に絞込みを行う(ステップST27)。
 予測モード推定部2は、予測モード1,8に絞込みを行うと、評価値の比RateVH4×4,nと閾値th4×4_1_8,nを比較する(図8のステップST31)。
 RateVH4×4,n>th4×4_1_8,n               (12)
 予測モード推定部2は、式(12)が成立する場合、予測モード1を利用するものと決定し(ステップST32)、式(12)が成立しない場合、予測モード8を利用するものと決定する(ステップST33)。
 予測モード推定部2は、予測モード2,4,5,6に絞込みを行うと、対象となっている4×4ブロックが含まれる8×8ブロックのDCT係数のAC成分を評価する評価値Cost4×4_2,nを算出し(図9のステップST41)、その評価値Cost4×4_2,nと閾値th4×4_2,nを比較する(ステップST42)。
Figure JPOXMLDOC01-appb-M000003
 予測モード推定部2は、式(13)が成立する場合、予測モード2を利用するものと決定し(ステップST43)、式(13)が成立しない場合、評価値の比RateVH4×4,nと閾値th4×4_4_5,n,th4×4_4_6,nを比較する(ステップST44,ST45)。
 RateVH4×4,n≦th4×4_4_5,n               (14)
 th4×4_4_5,n<RateVH4×4,n≦th4×4_4_6,n      (15)
 RateVH4×4,n>th4×4_4_6,n               (16)
 予測モード推定部2は、式(14)が成立する場合、予測モード5を利用するものと決定する(ステップST46)。
 予測モード推定部2は、式(15)が成立する場合、予測モード4を利用するものと決定する(ステップST47)。
 予測モード推定部2は、式(16)が成立する場合、予測モード6を利用するものと決定する(ステップST48)。
 予測モード推定部2は、予測モード0,3,7に絞込みを行うと、評価値の比RateVH4×4,nと閾値th4×4_0_7,n,th4×4_3_7,nを比較する(図10のステップST51,ST52)。
 RateVH4×4,n≦th4×4_0_7,n               (17)
 th4×4_0_7,n<RateVH4×4,n≦th4×4_3_7,n      (18)
 RateVH4×4,n>th4×4_3_7,n               (19)
 予測モード推定部2は、式(17)が成立する場合、予測モード0を利用するものと決定する(ステップST53)。
 予測モード推定部2は、式(18)が成立する場合、予測モード7を利用するものと決定する(ステップST54)。
 予測モード推定部2は、式(19)が成立する場合、予測モード3を利用するものと決定する(ステップST55)。
 この実施の形態1では、予測モード推定部2が完全に予測モードを決定するものについて示しているが、予測モードの絞込みのみを実施して、絞り込んだ予測モードについてSADやSATDを実施して、予測モードを決定するようにしてもよい。
 以下、図6に示す4×4の各ブロックの垂直方向の評価値Cost4×4_V,n,水平方向の評価値Cost4×4_H,nの算出方法について説明する。
 基本的に、4×4の各ブロックが構成される元となる8×8ブロックと、それに隣接する8×8ブロックのDCT係数から算出される。
 n=0(C10)のときは、下記の式(20)及び式(21)に示すように、ブロックC10が含まれるC00と、ブロックC00に隣接するブロックR0,R2のDCT係数を用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000004
 n=1(C11)のときは、下記の式(22)及び式(23)に示すように、ブロックC11が含まれるC00と、ブロックC00に隣接するブロックR0のDCT係数を用いて評価値を算出する。水平方向については、ブロックC00のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000005
 n=2(C12)のときは、下記の式(24)及び式(25)に示すように、ブロックC12が含まれるC00と、ブロックC00に隣接するブロックR2のDCT係数を用いて評価値を算出する。垂直方向については、ブロックC00のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000006
 n=3(C13)のときは、下記の式(26)及び式(27)に示すように、ブロックC13が含まれるC00のAC成分のみを用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000007
 n=4(C14)のときは、下記の式(28)及び式(29)に示すように、ブロックC14が含まれるC01と、ブロックC01に隣接するC00と、ブロックR1のDCT係数を用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000008
 n=5(C15)のときは、下記の式(30)及び式(31)に示すように、ブロックC15が含まれるC01と、ブロックC01に隣接するブロックR1のDCT係数を用いて評価値を算出する。水平方向については、ブロックC01のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000009
 n=6(C16)のときは、下記の式(32)及び式(33)に示すように、ブロックC16が含まれるC01と、ブロックC01に隣接するブロックC00のDCT係数を用いて評価値を算出する。垂直方向については、ブロックC01のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000010
 n=7(C17)のときは、下記の式(34)及び式(35)に示すように、ブロックC17が含まれるC01のAC成分のみを用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000011
 n=8(C18)のときは、下記の式(36)及び式(37)に示すように、ブロックC18が含まれるC02と、ブロックC02に隣接するC00,R3のDCT係数を用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000012
 n=9(C19)のときは、下記の式(38)及び式(39)に示すように、ブロックC19が含まれるC02と、ブロックC02に隣接するC00のDCT係数を用いて評価値を算出する。水平方向については、ブロックC02のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000013
 n=10(C110)のときは、下記の式(40)及び式(41)に示すように、ブロックC110が含まれるC02と、ブロックC02に隣接するR3のDCT係数を用いて評価値を算出する。垂直方向については、ブロックC02のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000014
 n=11(C111)のときは、下記の式(42)及び式(43)に示すように、ブロックC111が含まれるC02のAC成分のみを用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000015
 n=12(C112)のときは、下記の式(44)及び式(45)に示すように、ブロックC112が含まれるC03と、ブロックC03に隣接するC01,C02のDCT係数を用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000016
 n=13(C113)のときは、下記の式(46)及び式(47)に示すように、ブロックC113が含まれるC03と、ブロックC03に隣接するC01のDCT係数を用いて評価値を算出する。水平方向については、ブロックC03のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000017
 n=14(C114)のときは、下記の式(48)及び式(49)に示すように、ブロックC114が含まれるC03と、ブロックC03に隣接するC02のDCT係数を用いて評価値を算出する。垂直方向については、ブロックC03のAC成分のみを考える。
Figure JPOXMLDOC01-appb-M000018
 n=15(C115)のときは、下記の式(50)及び式(51)に示すように、ブロックC115が含まれるC03のAC成分のみを用いて評価値を算出する。
Figure JPOXMLDOC01-appb-M000019
 上記の式(20)~式(51)は、式(1)及び式(2)の項の一部と同一部分があるため、式(1)及び式(2)を計算する時点で、その同一部分を保持するようにしてもよい。
 上記のようにして、予測モードの決定処理を実施することで、8×8ブロックのDCT係数から予測モードを推定することができる。
 H.264符号化部3は、予測モード推定部2が予測モードを推定すると、その予測モードとJPEG簡易復号部1により取得されたヘッダ情報を用いて、JPEG簡易復号部1により取得されたDCT係数を符号化することにより、H.264ストリームを生成する。
 H.264ストリームの生成に際して、JPEG簡易復号部1により取得されたDCT係数に対するIDCT処理を実施して、そのDCT係数を画素信号に戻してから符号化を行うようにしてもよい。
 また、非特許文献4に開示されているように、変換行列を用いて、DCT係数を整数精度DCTに変換して符号化を行うようにしてもよい。
・非特許文献4
「Efficient MPEG-2 to H.264/AVC intra transcoding in transform-domain」
Circuits and Systems, 2005. ISCAS 2005. IEEE International Symposium on
23-26 May 2005 Page(s):1234 - 1237 Vol. 2
 以上で明らかなように、この実施の形態1によれば、画像が周波数領域に変換されて符号化されているJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数を取得するJPEG簡易復号部1と、JPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モード(画面内予測の方向)を推定する予測モード推定部2とを設け、H.264符号化部3が予測モード推定部2により推定された予測モードを用いて、JPEG簡易復号部1により取得されたDCT係数を符号化してH.264ストリームを生成するように構成したので、少ない演算量で、JPG方式からH.264方式に変換することができる効果を奏する。
 また、この実施の形態1では、式(1)、式(2)、式(20)~式(51)において、多くの共通の項を有しているので、実際の計算に要する演算量が少なくなる特徴を有している。
 なお、式(1)、式(2)、式(20)~式(51)において、変数kを小さくすれば、即ち、k=0として、全DCT係数のうち、直流成分のDCT係数のみから予測モードを推定する場合や、k=1又はk=2として(あるいは、k=3として)、全DCT係数のうち、低周波成分のDCT係数のみから予測モードを推定する場合には、演算量を大幅に削減することができる。
実施の形態2.
 上記実施の形態1では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モードを推定するものについて示したが、予測モード推定部2がH.264方式における予測モードを推定する際、JPEG簡易復号部1により取得されたDCT係数の中に高周波成分のDCT係数が含まれているか否かを判定し、高周波成分のDCT係数が含まれていない場合には、推定する予測モードを絞り込むようにしてもよい。
 JPEG簡易復号部1及びH.264符号化部3の処理内容は、上記実施の形態1と同様であるため、予測モード推定部2の処理内容のみを説明する。
 なお、特に断りがない限り、数式中の変数は、上記実施の形態1と同じ意味を表すものとする。
 予測モード推定部2は、上記実施の形態1と同様にして、16×16予測モードを採用するか、4×4予測モードを採用するかを判定する。
 16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1と同様であるため説明を省略する。
 以下、図5及び図6を参照しながら、4×4予測モードが採用された場合の処理内容を説明する。
 図11及び図12はこの発明の実施の形態2による画像符号化方式変換装置の予測モードの選択処理を示すフローチャートである。
 まず、予測モード推定部2は、ブロックC00に高周波成分が存在しているか否かを判定する。
 予測モード推定部2は、下記の式(52)が成立する場合、ブロックC00に高周波成分が存在していると判定する(図11のステップST61)。
  MAX(DCT_C0i,j)>th2_high            (52)
 ただし、MAX(DCT_C0i,j)はDCT係数の最大値であり、th2_highは閾値であり、4≦i,j≦7である。ここでは、4≦i,j≦7である例を示しているが、例えば、4≦i,4≦jであってもよい。i,jについては、以降の説明において全て同様である。
 なお、高周波成分が存在しているか否かを判定は、他の方法を用いてもよい。
 予測モード推定部2は、ブロックC00に高周波成分が存在している場合、上記実施の形態1と同様にして、予測モードを決定する(ステップST62)。
 一方、ブロックC00に高周波成分が存在していない場合、下記の式(53)~式(55)を計算して、評価値Cost2_4×4,0,0,Cost2_4×4,0,1,Cost2_4×4,0,2_4を算出する(ステップST63)。
 予測モード推定部2は、評価値Cost2_4×4,0,0,Cost2_4×4,0,1,Cost2_4×4,0,2_4を算出すると、これらの評価値の中で、最小の評価値を選択する。
 予測モード推定部2は、評価値Cost2_4×4,0,0が最小である場合(ステップST64)、ブロックC10については予測モード0を利用するものと決定する(ステップST65)。
 また、予測モード推定部2は、評価値Cost2_4×4,0,1が最小である場合(ステップST66)、ブロックC10については予測モード1を利用するものと決定する(ステップST67)。
 予測モード推定部2は、評価値Cost2_4×4,0,2_4が最小である場合、DCT係数の最大値MAX(DCT_C0i,j)と閾値th2_DCを比較する(ステップST68)。
  MAX(DCT_C0i,j)>th2_DC              (56)
 ただし、4≦i,j≦7である。
 予測モード推定部2は、式(56)が成立する場合、ブロックC10については予測モード4を利用するものと決定する(ステップST69)。
 一方、式(56)が成立しない場合、ブロックC10については予測モード2を利用するものと決定する(ステップST70)。
 予測モード推定部2は、ブロックC10の予測モードを決定すると、高周波成分がないことを活かし、順次、予測モードを決定する。
 即ち、ブロックC11については予測モード1に決定し、ブロックC12については予測モード0に決定し、ブロックC13については、下記の式(57)が成立するか否かを判定する(図12のステップST81)。
Figure JPOXMLDOC01-appb-M000021
 予測モード推定部2は、式(57)が成立する場合、ブロックC13については予測モード2を利用するものと決定する(ステップST82)。
 予測モード推定部2は、式(57)が成立しない場合、下記の式(58)が成立するか否かを判定する(ステップST83)。
Figure JPOXMLDOC01-appb-M000022
 予測モード推定部2は、式(58)が成立する場合、ブロックC13については予測モード1を利用するものと決定する(ステップST84)。
 予測モード推定部2は、式(58)が成立しない場合、ブロックC13については予測モード0を利用するものと決定する(ステップST85)。
 以降、ブロックC01,C02,C03についても同様の方法で、ブロックC14~C115の各ブロックの予測モードを決定する。
 予測モード推定部2は、ブロックC01では、高周波成分の判定として、下記の式(59)を用いる。
  MAX(DCT_C0i,j)>th2_high            (59)
 ただし、4≦i,j≦7である。
 ブロックC01に高周波成分が存在しない場合、ブロックC14の予測モードを決定するために、下記の式(60)~式(62)を計算して、評価値Cost2_4×4,1,0,Cost2_4×4,1,1,Cost2_4×4,1,2_4を算出する。
Figure JPOXMLDOC01-appb-M000023
 予測モード推定部2は、評価値Cost2_4×4,1,0,Cost2_4×4,1,1,Cost2_4×4,1,2_4を算出すると、これらの評価値の中で、最小の評価値を選択する。
 予測モード推定部2は、評価値Cost2_4×4,1,0が最小である場合、ブロックC14については予測モード0を利用するものと決定する。
 また、予測モード推定部2は、評価値Cost2_4×4,1,1が最小である場合、ブロックC14については予測モード1を利用するものと決定する。
 予測モード推定部2は、評価値Cost2_4×4,1,2_4が最小である場合、DCT係数の最大値MAX(DCT_C0i,j)と閾値th2_DCを比較する。
  MAX(DCT_C0i,j)>th2_DC              (63)
 ただし、4≦i,j≦7である。
 予測モード推定部2は、式(63)が成立する場合、ブロックC14については予測モード4を利用するものと決定する。
 一方、式(63)が成立しない場合、ブロックC14については予測モード2を利用するものと決定する。
 予測モード推定部2は、ブロックC15については予測モード1を利用するものと決定し、ブロックC16については予測モード0を利用するものと決定する。
 ブロックC17については、下記の式(64)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000024
 予測モード推定部2は、式(64)が成立する場合、ブロックC17については予測モード2を利用するものと決定する。
 一方、式(64)が成立しない場合、下記の式(65)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000025
 予測モード推定部2は、式(65)が成立する場合、ブロックC17については予測モード1を利用するものと決定する。
 一方、式(65)が成立しない場合、ブロックC17については予測モード0を利用するものと決定する。
 予測モード推定部2は、ブロックC02では、高周波成分の判定として、下記の式(66)を用いる。
  MAX(DCT_C0i,j)>th2_high            (66)
 ただし、4≦i,j≦7である。
 ブロックC02に高周波成分が存在しない場合、ブロックC18の予測モードを決定するために、下記の式(67)~式(69)を計算して、評価値Cost2_4×4,2,0,Cost2_4×4,2,1,Cost2_4×4,2,2_4を算出する。
Figure JPOXMLDOC01-appb-M000026
 予測モード推定部2は、評価値Cost2_4×4,2,0,Cost2_4×4,2,1,Cost2_4×4,2,2_4を算出すると、これらの評価値の中で、最小の評価値を選択する。
 予測モード推定部2は、評価値Cost2_4×4,2,0が最小である場合、ブロックC18については予測モード0を利用するものと決定する。
 また、予測モード推定部2は、評価値Cost2_4×4,2,1が最小である場合、ブロックC18については予測モード1を利用するものと決定する。
 予測モード推定部2は、評価値Cost2_4×4,2,2_4が最小である場合、DCT係数の最大値MAX(DCT_C0i,j)と閾値th2_DCを比較する。
  MAX(DCT_C0i,j)>th2_DC              (70)
 ただし、4≦i,j≦7である。
 予測モード推定部2は、式(70)が成立する場合、ブロックC18については予測モード4を利用するものと決定する。
 一方、式(69)が成立しない場合、ブロックC18については予測モード2を利用するものと決定する。
 予測モード推定部2は、ブロックC19については予測モード1を利用するものと決定し、ブロックC110については予測モード0を利用するものと決定する。
 ブロックC111については、下記の式(71)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000027
 予測モード推定部2は、式(71)が成立する場合、ブロックC111については予測モード2を利用するものと決定する。
 一方、式(71)が成立しない場合、下記の式(72)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000028
 予測モード推定部2は、式(72)が成立する場合、ブロックC111については予測モード1を利用するものと決定する。
 一方、式(72)が成立しない場合、ブロックC111については予測モード0を利用するものと決定する。
 予測モード推定部2は、ブロックC03では、高周波成分の判定として、下記の式(73)を用いる。
  MAX(DCT_C0i,j)>th2_high            (73)
 ただし、4≦i,j≦7である。
 ブロックC03に高周波成分が存在しない場合、ブロックC112の予測モードを決定するために、下記の式(74)~式(76)を計算して、評価値Cost2_4×4,3,0,Cost2_4×4,3,1,Cost2_4×4,3,2_4を算出する。
Figure JPOXMLDOC01-appb-M000029
 予測モード推定部2は、評価値Cost2_4×4,3,0,Cost2_4×4,3,1,Cost2_4×4,3,2_4を算出すると、これらの評価値の中で、最小の評価値を選択する。
 予測モード推定部2は、評価値Cost2_4×4,3,0が最小である場合、ブロックC112については予測モード0を利用するものと決定する。
 また、予測モード推定部2は、評価値Cost2_4×4,3,1が最小である場合、ブロックC112については予測モード1を利用するものと決定する。
 予測モード推定部2は、評価値Cost2_4×4,3,2_4が最小である場合、DCT係数の最大値MAX(DCT_C0i,j)と閾値th2_DCを比較する。
  MAX(DCT_C0i,j)>th2_DC              (77)
 ただし、4≦i,j≦7である。
 予測モード推定部2は、式(77)が成立する場合、ブロックC112については予測モード4を利用するものと決定する。
 一方、式(77)が成立しない場合、ブロックC112については予測モード2を利用するものと決定する。
 予測モード推定部2は、ブロックC113については予測モード1を利用するものと決定し、ブロックC114については予測モード0を利用するものと決定する。
 ブロックC115については、下記の式(78)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000030
 予測モード推定部2は、式(78)が成立する場合、ブロックC115については予測モード2を利用するものと決定する。
 一方、式(78)が成立しない場合、下記の式(79)が成立するか否かを判定する。
Figure JPOXMLDOC01-appb-M000031
 予測モード推定部2は、式(79)が成立する場合、ブロックC115については予測モード1を利用するものと決定する。
 一方、式(79)が成立しない場合、ブロックC115については予測モード0を利用するものと決定する。
 この実施の形態2によれば、高周波成分の存在を判定して、8×8ブロック内に高周波成分がない場合、DC成分の比較によって、3つの4×4ブロックの予測モードが決まり、残る1つのブロックについても、AC成分の和から簡単に決めることができる。
 したがって、高周波成分がない場合に、非常に高速に4×4予測モードを決定して、H.264方式への変換を高速に行うことが可能になる。
実施の形態3.
 上記実施の形態1,2では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式の予測モードを推定するものについて示したが、動画像の場合、図14に示すように、静止画像を時間軸方向に並べた形式で表されることが多く、時間的に近いフレームは一般に相関が高い(類似している)ことが多い。
 そこで、この実施の形態3では、類似している画像が連続して符号化されている場合、H.264方式の予測モードの推定を行わず、1フレーム前の予測モードと同一の予測モードを使用し続けるようにしている。
 具体的には、以下の通りである。
 図13はこの発明の実施の形態3による画像符号化方式変換装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
 DCT係数記憶部11はJPEG簡易復号部1により取得されたDCT係数を記憶し、その後、JPEG簡易復号部1により最新のDCT係数(現在のフレームのDCT係数)が取得されると、記憶している1フレーム前のDCT係数を予測モード推定処理判定部13に出力する。なお、DCT係数記憶部11は周波数成分記憶手段を構成している。
 予測モード記憶部12は予測モード推定部2により推定されたH.264方式の予測モードを記憶し、予測モード推定処理判定部13から予測モードの出力指令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。なお、予測モード記憶部12は画面内予測方向記憶手段を構成している。
 予測モード推定処理判定部13はJPEG簡易復号部1により取得された現在のフレームのDCT係数とDCT係数記憶部11に記憶されている1フレーム前のDCT係数とを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理(画面内予測方向の推定処理)の実施の必要性を判定し、その予測モード推定処理を実施する必要があると判定すれば、予測モードの推定命令を予測モード推定部2に出力することにより、その予測モード推定処理を予測モード推定部2に実施させる一方、その予測モード推定処理を実施する必要がないと判定すれば、予測モードの出力命令を予測モード記憶部12に出力することにより、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させる処理を実施する。なお、予測モード推定処理判定部13は推定処理判定手段を構成している。
 図16はこの発明の実施の形態3による画像符号化方式変換装置の予測モード推定処理判定部13の処理内容を示すフローチャートである。
 次に動作について説明する。
 ただし、DCT係数記憶部11、予測モード記憶部12及び予測モード推定処理判定部13を実装している点以外は、上記実施の形態1,2と同様であるため、ここでは、DCT係数記憶部11、予測モード記憶部12及び予測モード推定処理判定部13の動作のみを説明する。
 DCT係数記憶部11は、上記実施の形態1と同様にして、JPEG簡易復号部1がDCT係数を取得すると、そのDCT係数を記憶し、その後、JPEG簡易復号部1が現在のフレームのDCT係数を取得すると、記憶している1フレーム前のDCT係数を予測モード推定処理判定部13に出力する。
 予測モード記憶部12は、上記実施の形態1と同様にして、予測モード推定部2がH.264方式の予測モードを推定すると、その予測モードを記憶する。
 予測モード推定処理判定部13は、JPEG簡易復号部1から現在のフレームのDCT係数を受け、DCT係数記憶部11から1フレーム前のDCT係数を受けると、現在のフレームのDCT係数と1フレーム前のDCT係数とを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理の実施の必要性を判定する。
 予測モード推定処理判定部13は、予測モード推定処理を実施する必要があると判定すると、予測モードの推定命令を予測モード推定部2に出力することにより、その予測モード推定処理を予測モード推定部2に実施させる。
 一方、予測モード推定処理を実施する必要がないと判定すると、予測モードの出力命令を予測モード記憶部12に出力することにより、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させる。
 以下、予測モード推定処理判定部13の処理内容を具体的に説明する。
 図15は現在のフレームの符号化対象ブロックA00~A03と1フレーム前の同一位置の符号化対象ブロックB00~B03を示す説明図である。ただし、ブロックA00~A03、B00~B03は、いずれも8×8ブロックである。
 符号化対象ブロックが、連続するフレームにおいて類似している場合は、1フレーム前と同一の予測モードを用いても、高効率の符号化が可能である。
 一方、符号化対象ブロックが、連続するフレームにおいて相違している場合は、1フレーム前と同一の予測モードを用いると、符号化効率が悪化する可能性が高い。
 そこで、予測モード推定処理判定部13は、予測モード推定処理の実施の必要性を判定するため、JPEG簡易復号部1から出力された現在のフレームのDCT係数と、DCT係数記憶部11から出力された1フレーム前のDCT係数とを下記の式(80)に示す評価関数に代入して、差分値Diffを算出する(ステップST91)。
Figure JPOXMLDOC01-appb-M000032
 ただし、DCT_A0i,j,DCT_A0i,j,DCT_A0i,j,DCT_A0i,j,DCT_B0i,j,DCT_B0i,j,DCT_B0i,j,DCT_B0i,jは、それぞれブロックA00,A01,A02,A03,B00,B01,B02,B03におけるi行、j列のDCT係数である。
 また、k及びlは計算に用いる係数であり、ここでは、0≦k≦7,0≦l≦7であるとする。
 k=0,l=0とすれば全DCT係数のうち、直流成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 k=2,l=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 また、k=2,l=7とすれば、水平方向は低周波成分のみを用い、垂直方向は高周波成分までのDCT係数を用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 なお、wi,jは重みである。
 予測モード推定処理判定部13は、差分値Diffを算出すると、その差分値Diffと閾値thDiffを比較する(ステップST92)。
   Diff≦thDiff                     (81)
 予測モード推定処理判定部13は、式(81)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する(ステップST93)。
 予測モード記憶部12は、予測モード推定処理判定部13から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
 ただし、予測モード推定処理判定部13から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
 予測モード推定処理判定部13は、式(81)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する(ステップST94)。
 予測モード推定部2は、予測モード推定処理判定部13から予測モードの推定命令を受けると、上記実施の形態1,2と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 なお、予測モード推定部2は、H.264方式の予測モードを推定する際、上記実施の形態1,2と同様に、DCT係数を用いて予測モードを推定してもよいが、全ての予測モードに対して、SADやSATDを実施して、予測モードを決定するようにしてもよい。
 以上で明らかなように、この実施の形態3によれば、予測モード推定処理判定部13がJPEG簡易復号部1により取得された現在のフレームのDCT係数とDCT係数記憶部11に記憶されている1フレーム前のDCT係数とを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理の実施の必要性を判定し、その予測モード推定処理を実施する必要があると判定すれば、その予測モード推定処理を予測モード推定部2に実施させる一方、その予測モード推定処理を実施する必要がないと判定すれば、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させるように構成したので、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが相違している場合に限り、予測モード推定部2における予測モードの推定処理が実施されるようになり、その結果、H.264方式への変換の高速化を図ることができる効果を奏する。
実施の形態4.
 上記実施の形態3では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが相違している場合に限り、予測モード推定部2が予測モードの推定処理を実施するものについて示したが、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している場合でも、規定回数連続して、予測モード推定部2が予測モードの推定処理を実施していない場合には、予測モードの推定処理を予測モード推定部2に実施させるようにしてもよい。
 具体的には、以下の通りである。
 図17はこの発明の実施の形態4による画像符号化方式変換装置を示す構成図であり、図において、図13と同一符号は同一または相当部分を示すので説明を省略する。
 同一予測モードカウント部14は予測モード推定処理判定部15から予測モードの出力命令が予測モード記憶部12に出力されるとカウント値Countをインクリメントし、予測モード推定処理判定部15から予測モードの推定命令が予測モード推定部2に出力されるとカウント値Countを0リセットする。
 予測モード推定処理判定部15は図13の予測モード推定処理判定部13と同様に、JPEG簡易復号部1により取得された現在のフレームのDCT係数とDCT係数記憶部11に記憶されている1フレーム前のDCT係数とを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理の実施の必要性を判定し、その予測モード推定処理を実施する必要があると判定すれば、その予測モード推定処理を予測モード推定部2に実施させる一方、その予測モード推定処理を実施する必要がないと判定すれば、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させるが、予測モード推定処理判定部15は同一予測モードカウント部14のカウント値Countが閾値thCountに到達すると、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している場合でも、その予測モード推定処理を予測モード推定部2に実施させるようにする。
 なお、同一予測モードカウント部14及び予測モード推定処理判定部15から推定処理判定手段が構成されている。
 図18はこの発明の実施の形態4による画像符号化方式変換装置の予測モード推定処理判定部15の処理内容を示すフローチャートである。
 次に動作について説明する。
 上記実施の形態3では、符号化対象ブロックにおいて、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している限り、何回でも、前のフレームと同一の予測モードを使用し続けるようにしている。
 しかしながら、例えば、日照変動などのように、フレーム間では類似していても、微小な変化が連続する場合には、同一の予測モードを使用し続けると、符号化効率が悪くなる可能性がある。
 そこで、この実施の形態4では、微小な変化が連続するような場合には、同一の予測モードが使用され続けないようにするため、同一予測モードの連続使用数に制限を設けるようにしている。
 以下、同一予測モードカウント部14及び予測モード推定処理判定部15の処理内容を具体的に説明する。
 予測モード推定処理判定部15は、図13の予測モード推定処理判定部13と同様に、予測モード推定処理の実施の必要性を判定するため、JPEG簡易復号部1から出力された現在のフレームのDCT係数と、DCT係数記憶部11から出力された1フレーム前のDCT係数とを上記の式(80)に示す評価関数に代入して、差分値Diffを算出する(ステップST101)。
 予測モード推定処理判定部15は、差分値Diffを算出すると、その差分値Diffと閾値thDiffを比較する(ステップST102)。
 予測モード推定処理判定部15は、上記の式(81)が成立しない場合(Diff>thDiffの場合)、符号化対象ブロックが、連続するフレーム間において相違しているとみなし、同一予測モードカウント部14のカウント値Countを0リセットして(ステップST103)、予測モードの推定命令を予測モード推定部2に出力する(ステップST104)。
 予測モード推定部2は、予測モード推定処理判定部15から予測モードの推定命令を受けると、上記実施の形態1~3と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 なお、予測モード推定部2は、H.264方式の予測モードを推定する際、上記実施の形態1~3と同様に、DCT係数を用いて予測モードを推定してもよいが、全ての予測モードに対して、SADやSATDを実施して、予測モードを決定するようにしてもよい。
 予測モード推定処理判定部15は、上記の式(81)が成立する場合(Diff≦thDiffの場合)、符号化対象ブロックが、連続するフレーム間において類似しているとみなし、同一予測モードカウント部14のカウント値Countと閾値thCountを比較する(ステップST105)。
   Count≦thCount                 (82)
 予測モード推定処理判定部15は、式(82)が成立する場合、同一予測モードカウント部14のカウント値Countを“1”だけインクリメントして(ステップST106)、予測モードの出力命令を予測モード記憶部12に出力する(ステップST107)。
 予測モード記憶部12は、予測モード推定処理判定部15から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
 ただし、予測モード推定処理判定部15から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
 予測モード推定処理判定部15は、式(82)が成立しない場合、同一の予測モードの連続使用回数が規定回数(上限回数)に到達しているので、同一予測モードカウント部14のカウント値Countを0リセットして(ステップST103)、予測モードの推定命令を予測モード推定部2に出力する(ステップST104)。
 予測モード推定部2は、予測モード推定処理判定部15から予測モードの推定命令を受けると、上記実施の形態1~3と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 以上で明らかなように、この実施の形態4によれば、同一予測モードカウント部14のカウント値Countが閾値thCountを上回ると、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している場合でも、予測モード推定処理判定部15が予測モード推定処理を予測モード推定部2に実施させるように構成したので、微小な変化が連続するような場合でも、高効率な符号化を行うことができる効果を奏する。
実施の形態5.
 上記実施の形態3,4では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理の実施の必要性を判定するものについて示したが、現在のフレームと1フレーム前の同一位置の符号化対象ブロックだけでなく、符号化対象ブロックの周辺ブロックも比較対象に含めて、予測モード推定処理の実施の必要性を判定することにより、より高効率な符号化を行うことができるようにしてもよい。
 この実施の形態5における画像符号化方式変換装置は、上記実施の形態3,4の画像符号化方式変換装置と基本的な構成は同一であるが、予測モード推定処理判定部13,15が、現在のフレームと1フレーム前の同一位置の符号化対象ブロック及び対象ブロックの周辺ブロックを比較して、予測モード推定処理の実施の必要性を判定するようにしている点で相違している。
 この実施の形態5では、説明の便宜上、図13の画像符号化方式変換装置の構成を参照して説明する。
 図19は現在のフレームの符号化対象ブロックA00~A03と、その周辺ブロックRA0~RA5と、1フレーム前の同一位置の符号化対象ブロックB00~B03と、その周辺ブロックRB0~RB5とを示す説明図である。
 ただし、ブロックA00~A03,RA0~RA5,B00~B03及びRB0~RB5は、いずれも8×8ブロックである。
 予測モード推定処理判定部13は、予測モード推定処理の実施の必要性を判定するため、JPEG簡易復号部1から出力された現在のフレームのDCT係数と、DCT係数記憶部11から出力された1フレーム前のDCT係数とを下記の式(83)に示す評価関数に代入して、差分値Diffneighborを算出する。
Figure JPOXMLDOC01-appb-M000033
 ただし、DCT_A0i,j,DCT_A0i,j,DCT_A0i,j,DCT_A0i,j,DCT_B0i,j,DCT_B0i,j,DCT_B0i,j,DCT_B0i,jは、それぞれブロックA00,A01,A02,A03,B00,B01,B02,B03におけるi行、j列のDCT係数である。
 また、DCT_RA0i,j,DCT_RA1i,j,DCT_RA2i,j,DCT_RA3i,j,DCT_RA4i,j,DCT_RA5i,j,DCT_RB0i,j,DCT_RB1i,j,DCT_RB2i,j,DCT_RB3i,j,DCT_RB4i,j,DCT_RB5i,jは、それぞれブロックRA0,RA1,RA2,RA3,RA4,RA5,RB0,RB1,RB2,RB3,RB4,RB5におけるi行、j列のDCT係数である。
 また、k及びlは計算に用いる係数であり、ここでは、0≦k≦7,0≦l≦7であるとする。
 k=0,l=0とすれば全DCT係数のうち、直流成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 k=2,l=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 また、k=2,l=7とすれば、水平方向は低周波成分のみを用い、垂直方向は高周波成分までのDCT係数を用いて、予測モード推定処理の実施の必要性を判定することを意味する。
 なお、ui,j,vi,jは重みである。
 予測モード推定処理判定部13は、差分値Diffneighborを算出すると、その差分値Diffneighborと閾値thneighborを比較する。
   Diffneighbor≦thneighbor             (84)
 予測モード推定処理判定部13は、式(84)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する。
 予測モード記憶部12は、予測モード推定処理判定部13から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
 ただし、予測モード推定処理判定部13から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
 予測モード推定処理判定部13は、式(84)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する。
 予測モード推定部2は、予測モード推定処理判定部13から予測モードの推定命令を受けると、上記実施の形態1~4と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 この実施の形態5によれば、現在のフレームと1フレーム前の同一位置の符号化対象ブロックだけでなく、符号化対象ブロックの周辺ブロックも比較対象に含めて、予測モード推定処理の実施の必要性を判定するようにしている。このため、現在のフレームと1フレーム前において、周辺ブロックの相違による予測モードの変化に対応することができるので、高効率な予測符号化が可能になる。
実施の形態6.
 上記実施の形態5では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックだけでなく、符号化対象ブロックの周辺ブロックも比較対象に含めて、予測モード推定処理の実施の必要性を判定するものについて示したが、予測モード記憶部12に記憶されている1フレーム前の予測モードを考慮して、予測モード推定処理の実施の必要性を判定するようにしてもよい。
 具体的には、以下の通りである。
 図20はこの発明の実施の形態6による画像符号化方式変換装置を示す構成図であり、図において、図13及び図17と同一符号は同一または相当部分を示すので説明を省略する。
 予測モード推定処理判定部16は図13の予測モード推定処理判定部13又は図17の予測モード推定処理判定部15と同様に、予測モード推定処理の実施の必要性を判定し、その予測モード推定処理を実施する必要があると判定すれば、その予測モード推定処理を予測モード推定部2に実施させる一方、その予測モード推定処理を実施する必要がないと判定すれば、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させるが、予測モード推定処理判定部16は予測モード推定処理の実施の必要性を判定する際、予測モード記憶部12に記憶されている1フレーム前の予測モードを考慮して判定を行う。なお、予測モード推定処理判定部16は推定処理判定手段を構成している。
 図21はこの発明の実施の形態6による画像符号化方式変換装置の予測モード推定処理判定部16の処理内容を示すフローチャートである。
 まず、予測モード推定処理判定部16は、予測モード記憶部12に記憶されている1フレーム前の予測モードが、16×16予測モードであるのか、4×4予測モードであるのかを判定する(ステップST111)。
 予測モード推定処理判定部16は、1フレーム前の予測モードが16×16予測モードである場合、差分値Diff16×16_nを算出し(ステップST112)、その差分値Diff16×16_nと閾値th16×16_nを比較する(ステップST113)。差分値Diff16×16_nの算出方法は後述する。
   Diff16×16_n≦th16×16_n             (85)
 ここで、nは1フレーム前の16×16予測モードであり、予測モード0~3のいずれかである。
 予測モード推定処理判定部16は、式(85)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する(ステップST118)。
 予測モード記憶部12は、予測モード推定処理判定部16から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
 ただし、予測モード推定処理判定部16から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
 予測モード推定処理判定部16は、式(85)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する(ステップST119)。
 予測モード推定部2は、予測モード推定処理判定部16から予測モードの推定命令を受けると、上記実施の形態1~5と同様に、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 予測モード推定処理判定部16は、1フレーム前の予測モードが4×4予測モードである場合、4×4予測モードに基づいて、μ0~μ5,m,差分値Diff4×4を算出し(ステップST114~ST116)、その差分値Diff4×4と閾値th4×4を比較する(ステップST117)。μ0~μ5,m,Diff4×4の算出方法は後述する。
   Diff4×4≦th4×4                  (86)
 予測モード推定処理判定部16は、式(86)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する(ステップST118)。
 予測モード記憶部12は、予測モード推定処理判定部16から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
 ただし、予測モード推定処理判定部16から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
 予測モード推定処理判定部16は、式(86)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する(ステップST119)。
 予測モード推定部2は、予測モード推定処理判定部16から予測モードの推定命令を受けると、上記実施の形態1~5と同様に、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
 以下、差分値Diff16×16_nの算出方法について説明する。
 予測モード推定処理判定部16は、n=0のときは、下記の式(87)に示すように、符号化対象ブロックA00~A03,B00~B03と、ブロックA00,A01及びブロックB00,B01に隣接するブロックRA0,RA1及びRB0,RB1のDCT係数を用いて差分値Diff16×16_0を算出する。
Figure JPOXMLDOC01-appb-M000034
 n=1のときは、下記の式(88)に示すように、符号化対象ブロックA00~A03,B00~B03と、ブロックA00,A02及びブロックB00,B02に隣接するブロックRA2,RA3及びRB2,RB3のDCT係数を用いて差分値Diff16×16_1を算出する。
Figure JPOXMLDOC01-appb-M000035
 n=2のときは、下記の式(89)に示すように、符号化対象ブロックA00~A03,B00~B03と、ブロックA00~A02及びブロックB00~B02に隣接するRA0~RA3及びブロックRB0~RB3のDCT係数を用いて差分値Diff16×16_2を算出する。
Figure JPOXMLDOC01-appb-M000036
 n=3のときは、下記の式(90)に示すように、符号化対象ブロックA00~A03,B00~B03と、ブロックA00~A02及びブロックB00~B02に隣接するブロックRA0~RA3及びRB0~RB3と、左上のブロックRB4及びRA4のDCT係数を用いて差分値Diff16×16_3を算出する。
Figure JPOXMLDOC01-appb-M000037
 予測モード推定処理判定部16は、式(87)~式(90)によって差分値Diff16×16_nを算出すると、上述したように、その差分値Diff16×16_nと閾値th16×16_nを比較して、予測モード推定処理の実施の必要性を判定する。
 次に、差分値Diff4×4の算出方法について説明する。
 予測モード推定処理判定部16は、下記の式(91)及び式(92)に示すように、符号化対象ブロックA00~A03,B00~B03と、ブロックA00~A02及びブロックB00~B02の周辺のブロックRA0~RA5及びRB0~RB5のDCT係数を用いて差分値Diff4×4を算出する。
Figure JPOXMLDOC01-appb-M000038
 ただし、μ0~μ5は、0≦μi≦1(0≦i≦5)の実数値をとり、符号化対象ブロックの周辺ブロックRA0~RA5及びRB0~RB5のDCT係数の差分に対する重みである。
 以下、μ0~μ5の算出方法について説明する。
 図22は4×4予測モードのときの1フレーム前の符号化対象ブロックB10~B115とその周辺のブロックRB0~RB5と、現在のフレームの符号化対象ブロックA00~A03とその周辺のブロックRA0~RA5とを示す説明図である。
 ブロックB10~B115は、図19のブロックB00~B03が4分割されたものであって、ブロックB00はブロックB10~B13、ブロックB01はブロックB14~B17、ブロックB02はブロックB18~B111、ブロックB03はブロックB112~B115に分割されたものである。
 μ0は、前フレームでブロックRB0内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB0内に含まれる画素を用いて予測が行われるのは、B10の予測モードが0,2~7、B11の予測モードが0,2~7、B14の予測モードが4~6の場合である。
 μ0=0を初期値として、B10,B11が上記予測モードをとっている場合、μ0にそれぞれ4/9が加算され、B14が上記予測モードをとっている場合、μ0に1/9が加算される。
 μ1は、前フレームでブロックRB1内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB1内に含まれる画素を用いて予測が行われるのは、B11の予測モードが3または7、B14の予測モードが0,2~7、B15の予測モードが0,2~7の場合である。
 μ1=0を初期値として、B11,B14,B15が上記予測モードをとっている場合、μ1にそれぞれ1/3が加算される。
 μ2は、前フレームでブロックRB2内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB2内に含まれる画素を用いて予測が行われるのは、B10の予測モードが1,2,4~6,8、B12の予測モードが1,2,4~6,8、B18の予測モードが4~6の場合である。
 μ2=0を初期値として、B10,B12が上記予測モードをとっている場合、μ2にそれぞれ4/9が加算され、B18が上記予測モードをとっている場合、μ2に1/9が加算される。
 μ3は、前フレームでブロックRB3内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB3内に含まれる画素を用いて予測が行われるのは、B18の予測モードが1,2,4~6,8、B110の予測モードが1,2,4~6,8の場合である。
 μ3=0を初期値として、B18,B110が上記予測モードをとっている場合、μ3にそれぞれ1/2が加算される。
 μ4は、前フレームでブロックRB4内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB4内に含まれる画素を用いて予測が行われるのは、B10の予測モードが4~6の場合であり、これを満たすとき、μ4=1/9とされる。
 μ5は、前フレームでブロックRB5内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB5内に含まれる画素を用いて予測が行われるのは、B15の予測モードが3または7の場合であり、これを満たすとき、μ5=4/9とされる。
 以上で明らかなように、この実施の形態6によれば、現在のフレームと1フレーム前の同一位置の符号化対象ブロック及び周辺ブロックの比較を行うときに用いる周辺ブロックを、1フレーム前の予測モードから判断しているので、1フレーム前と同じ予測モードを用いた場合、符号化効率が大きく変化するか否かを推測することができるようになり、さらに、高効率な予測符号化が可能になる効果を奏する。
実施の形態7.
 上記実施の形態1~6では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式の予測モードを推定するものについて示したが、予測モード推定部2がH.264方式の予測モードを推定する際、JPEG簡易復号部1により取得されたDCT係数から新たに周波数特性(周波数成分)を算出し、その周波数特性から予測モードを推定するようにしてもよい。
 この実施の形態7における画像符号化方式変換装置は、上記実施の形態1~6のいずれかの画像符号化方式変換装置と基本的な構成は同一であり、JPEG簡易復号部1及びH.264符号化部3の処理内容は、上記実施の形態1と同様であるため、予測モード推定部2の処理内容についてのみ説明する。
 なお、特に断りがない限り、数式中の変数は、上記実施の形態1と同じ意味を表すものとする。
 予測モード推定部2は、上記実施の形態1と同様にして、16×16予測モードを採用するか、4×4予測モードを採用するかを判定する。
 以下、予測モード推定部2の処理内容を具体的に説明する。
 図5は画像の符号化対象ブロックC00~C03と、その周辺のブロックR0~R5を示す説明図である。なお、ブロックC00~C03,R0~R5は、いずれも8×8のブロックである。
 16×16予測モードにおける予測モード0(垂直方向)が効率的である状況は、ブロックR0の最下部の8画素とブロックC00,C02の画素の値が近く、ブロックR1の最下部の8画素とブロックC01,C03の画素の値が近い場合である。
 また、16×16予測モードにおける予測モード1(水平方向)が効率的である状況は、ブロックR2の最右端の8画素とブロックC00,C01の画素の値が近く、ブロックR3の最右端の8画素とブロックC02,C03の画素の値が近い場合である。
 16×16予測モードにおける予測モード2(DC予測)が効率的である状況は、ブロックR0,R1の最下部の16画素と、ブロックR2,R3の最右端の16画素との平均値が、ブロックC00~C03の全ての画素に近い場合である。
 また、16×16予測モードにおける予測モード3(プレーン予測)が効率的である状況は、ブロックR0,R1の最下部の15画素と、ブロックR2,R3の最右端の15画素と、R4の右下の1画素とを利用して、グラデーションのある予測画像が作成されるため、ブロックR0,R1の最下部の画素の変化が、ブロックC00~C03の水平方向の変化に一致し、ブロックR2,R3の最右端の画素の変化が、ブロックC00~C03の垂直方向の変化に近い場合である。これは、グラデーションのある画像の場合に有効である。
 そこで、予測モード推定部2は、JPEG簡易復号部1から出力されたDCT係数を、下記の式(93)から式(96)に示す関数に代入して、予測に用いられる画素であるR0,R1の最下部16画素の周波数特性R0_bottom,R1_bottomと、R2,R3の最右端16画素の周波数特性R2_right,R3_rightとを算出する。
Figure JPOXMLDOC01-appb-M000039
 ただし、DCT_R0i,j,DCT_R1i,j,DCT_R2i,j,DCT_R3i,jは、それぞれブロックR0,R1,R2,R3におけるi行,j列のDCT係数である。
 また、dj,iは離散コサイン変換行列Dの要素、dT j,iは離散コサイン行列Dの転置行列DTの要素である。
 wi,wjは重みである。
 図23は画像の符号化対象ブロックC00~C03と、その周辺のブロックR0~R3と、ブロックR0,R1の最下部16画素の周波数特性R0_bottom,R1_bottomと、R2,R3の最右端16画素の周波数特性R2_right,R3_rightとを示す説明図である。なお、ブロックC00~C03,R0~R3は、いずれも8×8のブロックである。
 R0_bottom,R1_bottomは、ブロックR0,R1の最下部の画素の垂直方向の周波数特性を示すものであり、R2_right,R3_rightは、ブロックR2,R3の最右端の画素の水平方向の周波数特性を示すものである。
 次に、予測モード推定部2は、H.264方式において、利用に適する予測モードを推定するために、JPEG簡易復号部1から出力されたDCT係数と、上記のR0_bottom,R1_bottom,R2_right,R3_rightとを下記の式(97)及び式(98)に示す評価関数に代入して、評価値Cost16×16_0,Cost16×16_1を算出する。
Figure JPOXMLDOC01-appb-M000040
 ただし、kは計算に用いる係数であり、0≦k≦7であるとする。
 因みに、k=0とすれば、全DCT係数のうち、直流成分のDCT係数及び直流成分の周波数特性のみから予測モードを推定することを意味する。
 また、k=1、または、k=2とすれば、全DCT係数のうち、低周波成分のDCT係数及び低周波成分の周波数特性のみから予測モードを推定することを意味する。
 また、k=7とすれば、高周波成分までのDCT係数及び高周波成分までの周波数特性から予測モードを推定することを意味する。
 w16×16_0j,w16×16_1j,w16×16_2j,w16×16_3j,w16×16_0i,w16×16_1i,w16×16_2i,w16×16_3iは重みである。
 評価値Cost16×16_0は、ブロックC00,C02とブロックR0の水平方向の変化及びブロックC01,C03とブロックR1の水平方向の変化の近さを評価しており、16×16予測モードにおける予測モード0(垂直予測)の評価値である。
 また、評価値Cost16×16_1は、ブロックC00,C01とブロックR2の垂直方向の変化及びブロックC02,C03とブロックR3の垂直方向の変化の近さを評価しており、16×16予測モードにおける予測モード1(水平予測)の評価値である。
 以降の推定処理については、上記実施の形態1~6と同様であるため、説明を省略する。
 以上で明らかなように、この実施の形態7によれば、予測モード推定部2において周辺の8×8ブロックの周波数成分を用いるのではなく、予測に必要な箇所のみの周波数成分を用いて評価値を算出し、その評価値からH.264の予測モードを決定するように構成しているので、より精度が高い予測モードの推定を行うことができる効果を奏する。
実施の形態8.
 上記実施の形態1~7では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モードを推定するものについて示したが、4×4予測モードを推定する際に、8×8ブロック単位の周波数成分ではなく、4×4ブロック単位の周波数成分を用いて推定を行うようにしてもよい。
 この実施の形態8では、4×4予測モードを推定する際に、JPEGから復号される画素値に、4×4変換を施すことで算出可能な4×4ブロック単位の変換係数を用いるようにする。
 図24はこの発明の実施の形態8による画像符号化方式変換装置を示す構成図であり、図において、JPEG復号部21は画像が周波数領域に変換されて符号化されているJPEG方式(第1の符号化方式)の符号化ストリームであるJPEGデータを入力すると、そのJPEGデータを復号し、その復号結果として、その画像の画素値(画素信号)、その画像の周波数成分の信号であるDCT係数及び画像の幅や高さなどを示すヘッダ情報を取得する処理を実施する。なお、JPEG復号部21は信号取得手段を構成している。
 予測モード推定部22はJPEG復号部21により取得された画素値及びDCT係数からH.264方式(第2の符号化方式)における予測モード(画面内予測の方向)を推定する処理を実施する。なお、予測モード推定部22は画面内予測方向推定手段を構成している。
 H.264符号化部23はH.264方式の符号化処理を実施する符号化部であり、予測モード推定部22により推定された予測モードとJPEG復号部21により取得されたヘッダ情報を用いて、JPEG簡易復号部21により取得された画素値を符号化してH.264ストリーム(第2の符号化方式の符号化ストリーム)を生成する処理を実施する。なお、H.264符号化部23は符号化手段を構成している。
 次に動作について説明する。
 JPEG復号部21は、画像が周波数領域に変換されて符号化されているJPEG方式の符号化ストリームであるJPEGデータを入力すると、そのJPEGデータを復号する。
 JPEG復号部21は、JPEGデータの復号結果として、画像の画素値、画像の周波数成分であるDCT係数及び画像の幅や高さなどを示すヘッダ情報を取得する。
 なお、画像の画素値は、JPEG復号部21から予測モード推定部22及びH.264符号化部23に出力され、DCT係数はJPEG復号部21から予測モード推定部22に出力される。
 また、ヘッダ情報は、JPEG復号部21からH.264符号化部23に出力される。
 予測モード推定部22は、JPEG復号部21から画像の画素値及びDCT係数を受けると、その画素値及びDCT係数からH.264方式における予測モードを推定する。
 即ち、予測モード推定部22は、上記実施の形態1~7におけるいずれかの予測モード推定部2と同様にして、16×16モードを採用するか、4×4予測モードを採用するかを判定する。
 16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1~7のいずれかと同様であるため説明を省略する。
 予測モード推定部22は、4×4予測モードを採用する旨の判定を行うと、該当16×16マクロブロック内の16個の4×4ブロックの画素値Xを下記の式(99)に代入して4×4変換係数Yを算出する。
Figure JPOXMLDOC01-appb-M000041
 4×4変換係数Yは、DCT係数と同様に、ブロック内の周波数特性を示しており、予測モード推定部22は、この4×4変換係数Yから評価値を算出し、H.264方式における4×4予測モードを推定する。
 具体的には以下の通りである。
 図25から図27は4×4予測モードにおける予測モードの推定処理を示すフローチャートである。
 まず、予測モード推定部22は、4×4変換係数を下記の式(101)及び式(102)に代入して、垂直方向の評価値Value4×4_V及び水平方向の評価値Value4×4_Hを算出する(図25のステップST120)。
Figure JPOXMLDOC01-appb-M000042
 ただし、yi,jは4×4ブロックにおける4×4変換係数のi,j成分である。wi,wjは重みである。
 kは計算に用いる係数であり、ここでは、1≦k≦3であるとする。因みに、k=1とすれば、全ての4×4変換係数のうち、低周波成分の4×4変換係数のみから予測モードを推定することを意味する。
 また、k=3とすれば、全ての4×4変換係数のうち、高周波成分の4×4変換係数の周波数特性から予測モードを推定することを意味する。
 予測モード推定部22は、垂直方向の評価値Value4×4_V及び水平方向の評価値Value4×4_Hを算出すると、垂直方向の評価値Value4×4_Vと閾値th4×4_Vを比較するとともに、水平方向の評価値Value4×4_Hと閾値th4×4_Hを比較する(ステップST121)。
  Value4×4_V<th4×4_V                 (103)
  Value4×4_H<th4×4_H                 (104)
 予測モード推定部22は、式(103)及び式(104)が成立する場合、垂直方向と水平方向の周波数成分がともに小さいので、DC予測が有効であるとして、4×4予測モードの予測モード2を利用するものと決定する(ステップST122)。
 予測モード推定部22は、式(103)又は式(104)のいずれか一方でも成立しない場合、垂直方向の評価値Value4×4_Vと水平方向の評価値Value4×4_Hとの比RateVH4×4を算出する(ステップST123)。
Figure JPOXMLDOC01-appb-M000043
 予測モード推定部22は、評価値の比RateVH4×4を算出すると、その評価値の比RateVH4×4と閾値th4×4_0,th4×4_1を比較する(ステップST124、ST126)。
  RateVH4×4<th4×4_1                 (106)
  th4×4_1≦RateVH4×4<th4×4_0           (107)
  th4×4_0≦RateVH4×4                 (108)
 予測モード推定部22は、式(106)が成立する場合、水平方向の予測が有効であるとして、4×4予測モードの予測モード1を利用するものと決定する(ステップST125)。
 予測モード推定部22は、式(108)が成立する場合、垂直方向の予測が有効であるとして、4×4予測モードの予測モード0を利用するものと決定する(ステップST127)。
 予測モード推定部22は、式(107)が成立する場合、垂直方向成分と水平方向成分を乗算してSignVH4×4を算出する(ステップST128)。
  SignVH4×4=y0,1・y1,0               (109)
 ここで、図28は4×4ブロックの画素値と4×4変換処理を施した後の4×4変換係数を示す説明図である。
 画像内のエッジが左下から右上に向かっているとき、符号SignVH4×4は正になっており、画像内のエッジが左上から右下に向かっているとき、符号SignVH4×4は負になっている。
 予測モード推定部22は、SignVH4×4を算出すると、SignVH4×4の正負を判定する(ステップST129)。
  SignVH4×4≧0                     (110)
 予測モード推定部22は、式(110)が成立する場合、右上又は左下へ向かうエッジがあるとして、4×4予測モードを予測モード3,7,8に絞り込むようにする(ステップST131)。
 一方、式(110)が成立しない場合、右下又は左上に向かうエッジがあるとして、4×4予測モードを予測モード4,5,6に絞り込むようにする(ステップST130)。
 予測モード推定部22は、4×4予測モードを予測モード3,7,8に絞り込むと、評価値RateVH4×4と閾値th4×4_8,th4×4_7を比較する(図26のステップST132、ST134)。
  RateVH4×4<th4×4_8                (111)
  th4×4_8≦RateVH4×4<th4×4_7          (112)
  th4×4_7≦RateVH4×4                (113)
 予測モード推定部22は、式(111)が成立する場合、4×4予測モードの予測モード8を利用するものと決定する(ステップST133)。
 予測モード推定部22は、式(113)が成立する場合、4×4予測モードの予測モード7を利用するものと決定する(ステップST135)。
 予測モード推定部22は、式(112)が成立する場合、4×4予測モードの予測モード3を利用するものと決定する(ステップST136)。
 予測モード推定部22は、4×4予測モードを予測モード4,5,6に絞り込むと、評価値RateVH4×4と閾値th4×4_5,th4×4_6を比較する(図27のステップST137、ST139)。
  RateVH4×4<th4×4_6                (114)
  th4×4_6≦RateVH4×4<th4×4_5          (115)
  th4×4_5≦RateVH4×4                (116)
 予測モード推定部22は、式(114)が成立する場合、4×4予測モードの予測モード6を利用するものと決定する(ステップST138)。
 予測モード推定部22は、式(116)が成立する場合、4×4予測モードの予測モード5を利用するものと決定する(ステップST140)。
 予測モード推定部22は、式(115)が成立する場合、4×4予測モードの予測モード4を利用するものと決定する(ステップST141)。
 上記のようにして、予測モードの決定処理を実施することで、4×4ブロックの4×4変換係数から予測モードを推定することができる。
 また、予測モード推定部22で決定された予測モード以外に、隣り合う予測モードを含めて、3つの予測モードに絞り込み、SADなどによってコストを計算するようにしてもよい。
 ここで、隣り合うモードとは、図5の下側の図において、矢印の方向が近いもののことであり、例えば、予測モード7に決定されたときは、予測モード0,3が隣り合うモードとなる。
 H.264符号化部23は、予測モード推定部22が予測モードを推定すると、その予測モードとJPEG復号部21により取得されたヘッダ情報を用いて、JPEG復号部21より取得された画素値を符号化してH.264ストリームを生成する。
 以上で明らかなように、この実施の形態8によれば、画像が周波数領域に変換されて符号化されているJPEGデータを復号して、画像の画素値及び画像の周波数成分の信号であるDCT係数を取得するJPEG復号部21と、JPEG復号部21により取得された画素値及び画像の周波数成分の信号であるDCT係数からH.264方式における予測モードを推定する予測モード推定部22とを設け、H.264符号化部23が予測モード推定部22により推定された予測モードを用いて、JPEG復号部21により取得された画素値を符号化してH.264ストリームを生成するように構成したので、4×4予測モードの推定精度を高めることができる効果を奏する。
 また、予測モード推定部22において4×4変換係数を算出しているため、H.264符号化部23における4×4変換の計算を省略することが可能であり、H.264への変換を高速に行うことができる効果を奏する。
実施の形態9.
 上記実施の形態8では、4×4予測モードを推定する際に、4×4ブロック単位で予測モードの推定を実施するものについて示したが、予測に用いる画素値を含めた5×5ブロック単位で予測モードの推定を実施するようにしてもよい。
 この実施の形態9では、4×4予測モードを推定する際に、4×4ブロックの画素値と予測に用いる画素値を含めた5×5ブロックの周波数成分から4×4予測モードを推定するようにする。
 この実施の形態9における画像符号化方式変換装置は、上記実施の形態8と基本的な構成は同一であり、JPEG復号部21及びH.264符号化部23の処理内容は、上記実施の形態8と同様であるため、予測モード推定部22の処理内容のみを説明する。
 予測モード推定部22は、上記実施の形態8と同様にして、16×16モードを採用するか、4×4予測モードを採用するかを判定する。
 16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1~7のいずれかと同様であるため説明を省略する。
 図29は符号化対象の4×4ブロックC1nと、その周辺の画素a~iを示す説明図である。
 予測モード推定部22は、4×4予測モードを採用する旨の判定を行うと、該当16×16マクロブロック内の16個の4×4ブロックと4×4ブロックの周辺の画素値a~iを含めた5×5ブロックXを下記の式(117)に代入して5×5ブロックの周波数成分Yを算出する。
Figure JPOXMLDOC01-appb-M000044
 予測モード推定部22は、5×5ブロックの周波数成分Yを算出すると、その5×5ブロックの周波数成分Yから評価値を算出し、H.264方式における4×4予測モードを推定する。
 即ち、予測モード推定部22は、4×4変換係数を下記の式(120)及び式(121)に代入して、垂直方向の評価値Value4×4_V及び水平方向の評価値Value4×4_Hを算出する(図25のステップST120)。
Figure JPOXMLDOC01-appb-M000045
 ただし、yi,jは4×4ブロックにおける5×5ブロックの周波数成分のi,j成分である。wi,wjは重みである。
 kは計算に用いる係数であり、ここでは、1≦k≦4であるとする。因みに、k=1とすれば、全ての5×5ブロックの周波数成分のうち、低周波成分のみから予測モードを推定することを意味する。
 また、k=4とすれば、全ての5×5ブロックの周波数成分のうち、高周波成分の周波数特性から予測モードを推定することを意味する。
 以降の推定処理については、上記実施の形態8と同様であるため説明を省略する。
 以上で明らかなように、この実施の形態9によれば、予測モード推定部22において、4×4ブロックと予測に用いられる周辺画素とで構成される5×5ブロックの周波数特性を用いて、H.264の予測モードを決定するように構成したので、より精度が高い予測モードの推定を行うことができる効果を奏する。
 以上のように、この発明に係る画像符号化方式変換装置は、画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームの一部を復号して、画像の周波数成分の信号を取得する周波数成分信号取得手段と、周波数成分信号取得手段により取得された周波数成分の信号から画面内予測の方向を推定する画面内予測方向推定手段とを設け、符号化手段が画面内予測方向推定手段により推定された画面内予測の方向を用いて、周波数成分信号取得手段により取得された周波数成分の信号を符号化して第2の符号化方式の符号化ストリームを生成するように構成したので、少ない演算量で画像符号化方式を変換することができ、画像を圧縮して符号化する画像符号化方式変換装置などに用いるのに適している。

Claims (16)

  1.  画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームの一部を復号して、上記画像の周波数成分の信号を取得する周波数成分信号取得手段と、上記周波数成分信号取得手段により取得された周波数成分の信号から画面内予測の方向を推定する画面内予測方向推定手段と、上記画面内予測方向推定手段により推定された画面内予測の方向を用いて、上記周波数成分信号取得手段により取得された周波数成分の信号を符号化して第2の符号化方式の符号化ストリームを生成する符号化手段とを備えた画像符号化方式変換装置。
  2.  画面内予測方向推定手段は、周波数成分信号取得手段により取得された周波数成分の信号のうち、低周波成分の信号から画面内予測の方向を推定することを特徴とする請求項1記載の画像符号化方式変換装置。
  3.  画面内予測方向推定手段は、周波数成分信号取得手段により取得された周波数成分の信号のうち、直流成分の信号から画面内予測の方向を推定することを特徴とする請求項1記載の画像符号化方式変換装置。
  4.  画面内予測方向推定手段は、周波数成分信号取得手段により取得された周波数成分の信号の中に高周波成分の信号が含まれているか否かを判定し、高周波成分の信号が含まれていない場合には、直流成分の信号から画面内予測の方向を推定することを特徴とする請求項1記載の画像符号化方式変換装置。
  5.  画面内予測方向推定手段は、周波数成分信号取得手段により取得された周波数成分の信号の中に高周波成分の信号が含まれているか否かを判定し、高周波成分の信号が含まれていない場合には、推定する画面内予測の方向を絞り込むことを特徴とする請求項1記載の画像符号化方式変換装置。
  6.  第1の符号化方式がJPEG方式又はMotionJPEG方式であり、第2の符号化方式がH.264方式であることを特徴とする請求項1記載の画像符号化方式変換装置。
  7.  第1の符号化方式がMPEG-1方式、MPEG-2方式又はMPEG-4方式であり、第2の符号化方式がH.264方式であることを特徴とする請求項1記載の画像符号化方式変換装置。
  8.  周波数成分信号取得手段により取得された周波数成分の信号を記憶する周波数成分記憶手段と、画面内予測方向推定手段により推定された画面内予測の方向を記憶する画面内予測方向記憶手段と、上記周波数成分信号取得手段により取得された最新の周波数成分の信号と上記周波数成分記憶手段に記憶されている前回の周波数成分の信号とを比較して、上記画面内予測方向推定手段における画面内予測方向の推定処理の実施の必要性を判定し、上記画面内予測方向の推定処理を実施する必要があると判定すれば、上記画面内予測方向の推定処理を上記画面内予測方向推定手段に実施させる一方、上記画面内予測方向の推定処理を実施する必要がないと判定すれば、上記画面内予測方向記憶手段に記憶されている画面内予測の方向を符号化手段に出力させる推定処理判定手段とを設けたことを特徴とする請求項1記載の画像符号化方式変換装置。
  9.  推定処理判定手段は、周波数成分信号取得手段により取得された最新の周波数成分の信号及び周波数成分記憶手段に記憶されている前回の周波数成分の信号のうち、低周波成分の信号を用いて、画面内予測方向の推定処理の実施の必要性を判定することを特徴とする請求項8記載の画像符号化方式変換装置。
  10.  推定処理判定手段は、周波数成分信号取得手段により取得された最新の周波数成分の信号及び周波数成分記憶手段に記憶されている前回の周波数成分の信号のうち、直流成分の信号を用いて、画面内予測方向の推定処理の実施の必要性を判定することを特徴とする請求項8記載の画像符号化方式変換装置。
  11.  推定処理判定手段は、画面内予測方向の推定処理を実施する必要がないとする判定が規定回数連続している場合、上記画面内予測方向の推定処理を実施する必要がないと判定しても、上記画面内予測方向の推定処理を画面内予測方向推定手段に実施させることを特徴とする請求項8記載の画像符号化方式変換装置。
  12.  推定処理判定手段は、画面内予測方向記憶手段に記憶されている画面内予測の方向を考慮して、画面内予測方向の推定処理の実施の必要性を判定することを特徴とする請求項8記載の画像符号化方式変換装置。
  13.  画面内予測方向推定手段は、周波数成分信号取得手段により取得された周波数成分の信号のうち、画面内予測に利用する周波数成分を算出し、上記周波数成分から画面内予測の方向を推定することを特徴とする請求項1記載の画像符号化方式変換装置。
  14.  画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームを復号して、上記画像の画素信号と周波数成分の信号を取得する信号取得手段と、上記信号取得手段により取得された画素信号及び周波数成分の信号から画面内予測の方向を推定する画面内予測方向推定手段と、上記画面内予測方向推定手段により推定された画面内予測の方向を用いて、上記信号取得手段により取得された画素信号を符号化して第2の符号化方式の符号化ストリームを生成する符号化手段とを備えた画像符号化方式変換装置。
  15.  画面内予測方向推定手段は、信号取得手段により取得された画素信号を上記信号取得手段により取得された周波数成分の信号と異なる第2の周波数成分の信号に変換し、上記第2の周波数成分の信号から画面内予測の方向を推定することを特徴とする請求項14記載の画像符号化方式変換装置。
  16.  画面内予測方向推定手段は、第2の周波数成分の信号のうち、低周波成分の信号から画面内予測の方向を推定することを特徴とする請求項15記載の画像符号化方式変換装置。
PCT/JP2009/000983 2008-03-12 2009-03-04 画像符号化方式変換装置 WO2009113276A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010502714A JP5241819B2 (ja) 2008-03-12 2009-03-04 画像符号化方式変換装置

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008-062856 2008-03-12
JP2008062856 2008-03-12
JP2008140446 2008-05-29
JP2008-140446 2008-05-29
JP2008194877 2008-07-29
JP2008-194877 2008-07-29

Publications (1)

Publication Number Publication Date
WO2009113276A1 true WO2009113276A1 (ja) 2009-09-17

Family

ID=41064950

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/000983 WO2009113276A1 (ja) 2008-03-12 2009-03-04 画像符号化方式変換装置

Country Status (2)

Country Link
JP (1) JP5241819B2 (ja)
WO (1) WO2009113276A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083599A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
JP2013507084A (ja) * 2009-10-05 2013-02-28 アイ.シー.ヴイ.ティー リミテッド 画像処理のための方法およびシステム
US8908984B2 (en) 2009-10-05 2014-12-09 I.C.V.T. Ltd. Apparatus and methods for recompression of digital images
WO2019196941A1 (en) * 2018-04-13 2019-10-17 Mediatek Inc. Adaptive implicit transform setting

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6212890B2 (ja) * 2013-03-22 2017-10-18 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121273A (ja) * 2004-10-20 2006-05-11 Victor Co Of Japan Ltd 符号化変換方法及び符号化変換装置
WO2006100946A1 (ja) * 2005-03-24 2006-09-28 Pioneer Corporation 画像信号再符号化装置及び画像信号再符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121273A (ja) * 2004-10-20 2006-05-11 Victor Co Of Japan Ltd 符号化変換方法及び符号化変換装置
WO2006100946A1 (ja) * 2005-03-24 2006-09-28 Pioneer Corporation 画像信号再符号化装置及び画像信号再符号化方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9503738B2 (en) 2009-10-05 2016-11-22 Beamr Imaging Ltd Apparatus and methods for recompression of digital images
US10674154B2 (en) 2009-10-05 2020-06-02 Beamr Imaging Ltd Apparatus and methods for recompression of digital images
JP2013507084A (ja) * 2009-10-05 2013-02-28 アイ.シー.ヴイ.ティー リミテッド 画像処理のための方法およびシステム
US10362309B2 (en) 2009-10-05 2019-07-23 Beamr Imaging Ltd Apparatus and methods for recompression of digital images
US8908984B2 (en) 2009-10-05 2014-12-09 I.C.V.T. Ltd. Apparatus and methods for recompression of digital images
US9866837B2 (en) 2009-10-05 2018-01-09 Beamr Imaging Ltd Apparatus and methods for recompression of digital images
CN105451018A (zh) * 2010-01-07 2016-03-30 株式会社东芝 运动图像解码装置以及运动图像解码方法
US9392282B2 (en) 2010-01-07 2016-07-12 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
US9148659B2 (en) 2010-01-07 2015-09-29 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
US9154779B2 (en) 2010-01-07 2015-10-06 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
US9294768B2 (en) 2010-01-07 2016-03-22 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
CN105430400A (zh) * 2010-01-07 2016-03-23 株式会社东芝 运动图像解码装置以及运动图像解码方法
WO2011083599A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
CN105681794A (zh) * 2010-01-07 2016-06-15 株式会社东芝 运动图像解码装置以及运动图像解码方法
CN103024391B (zh) * 2010-01-07 2016-06-29 株式会社东芝 运动图像解码装置以及运动图像解码方法
US9143777B2 (en) 2010-01-07 2015-09-22 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
US9113139B2 (en) 2010-01-07 2015-08-18 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
US9113138B2 (en) 2010-01-07 2015-08-18 Kabushiki Kaisha Toshiba Moving-picture encoding apparatus and moving-picture decoding apparatus
CN105681794B (zh) * 2010-01-07 2018-09-04 株式会社东芝 运动图像解码装置以及运动图像解码方法
CN105430400B (zh) * 2010-01-07 2019-06-11 株式会社东芝 运动图像解码装置以及运动图像解码方法
CN103024391A (zh) * 2010-01-07 2013-04-03 株式会社东芝 运动图像解码装置以及运动图像解码方法
CN102763416A (zh) * 2010-01-07 2012-10-31 株式会社东芝 运动图像编码装置以及运动图像解码装置
WO2019196941A1 (en) * 2018-04-13 2019-10-17 Mediatek Inc. Adaptive implicit transform setting
CN112042194A (zh) * 2018-04-13 2020-12-04 联发科技股份有限公司 自适应性隐式转换设定
US10999604B2 (en) 2018-04-13 2021-05-04 Mediatek Inc. Adaptive implicit transform setting
CN112042194B (zh) * 2018-04-13 2024-04-16 寰发股份有限公司 一种编码/解码的方法及电子装置

Also Published As

Publication number Publication date
JPWO2009113276A1 (ja) 2011-07-21
JP5241819B2 (ja) 2013-07-17

Similar Documents

Publication Publication Date Title
AU2019200515B2 (en) Image decoding device, image encoding device, and method thereof
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
KR101131689B1 (ko) 필터 선택을 이용한 비디오 압축 방법
WO2011155364A1 (ja) 画像復号化装置と画像符号化装置およびその方法とプログラム
US8165411B2 (en) Method of and apparatus for encoding/decoding data
JP5194119B2 (ja) 画像処理方法及び対応する電子装置
JPH11112973A (ja) 映像信号変換装置及び映像信号変換方法
JP5241819B2 (ja) 画像符号化方式変換装置
JP2012169762A (ja) 画像符号化装置と画像復号化装置およびその方法とプログラム
JP2011259205A (ja) 画像復号化装置と画像符号化装置およびその方法とプログラム
JP2006311079A (ja) 画像ビットストリーム変換装置
US9055292B2 (en) Moving image encoding apparatus, method of controlling the same, and computer readable storage medium
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
US20040264790A1 (en) Method of and apparatus for adaptively encoding motion image according to characteristics of input image
JP2001036908A (ja) 動画像圧縮装置
JP5387520B2 (ja) 情報処理装置と情報処理方法
JP2009206911A (ja) 動画像変換装置
KR100987581B1 (ko) 고속 움직임 추정을 위한 부분 블록정합 방법
JP2868445B2 (ja) 動画像圧縮方法および装置
JP2018191334A (ja) 画像符号化装置と画像符号化方法およびプログラム
JP4364919B2 (ja) 動画像復号化装置
JP2005323315A (ja) 予測情報・量子化値制御圧縮符号化装置、予測情報・量子化値制御圧縮符号化プログラムおよび予測情報・量子化値制御圧縮符号化方法
JP2002016923A (ja) 画像符号化装置および画像符号化方法
JP4100067B2 (ja) 画像情報変換方法及び画像情報変換装置
WO2000062554A1 (en) Image processing method and image processing device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09721152

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010502714

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09721152

Country of ref document: EP

Kind code of ref document: A1