WO2021117091A1 - 符号化方法、符号化装置、及びプログラム - Google Patents

符号化方法、符号化装置、及びプログラム Download PDF

Info

Publication number
WO2021117091A1
WO2021117091A1 PCT/JP2019/048104 JP2019048104W WO2021117091A1 WO 2021117091 A1 WO2021117091 A1 WO 2021117091A1 JP 2019048104 W JP2019048104 W JP 2019048104W WO 2021117091 A1 WO2021117091 A1 WO 2021117091A1
Authority
WO
WIPO (PCT)
Prior art keywords
coding
coding unit
sub
unit block
isp
Prior art date
Application number
PCT/JP2019/048104
Other languages
English (en)
French (fr)
Inventor
優也 大森
中村 健
小林 大祐
裕江 岩崎
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/783,056 priority Critical patent/US20230022215A1/en
Priority to JP2021563456A priority patent/JP7364936B2/ja
Priority to PCT/JP2019/048104 priority patent/WO2021117091A1/ja
Publication of WO2021117091A1 publication Critical patent/WO2021117091A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Definitions

  • the present invention relates to a coding method, a coding device, and a program.
  • H.H. which is the latest international standard video coding standard. 265 / HEVC (High Efficiency Video Coding) (hereinafter referred to as "HEVC") is becoming widespread.
  • HEVC High Efficiency Video Coding
  • H. 266 / VVC Very Video Coding
  • VVC Very Video Coding
  • Intra-predictive coding means that when a coding unit (CU), which is a coding unit block, is coded, the pixels of the pixels located around the CU to be coded (hereinafter referred to as “the CU to be coded”). This is a coding method that predicts, estimates, and compensates for the pixel values of the pixels in the coding target CU based on the values.
  • CU coding unit
  • the intra-predictive coding is a pixel located in a CU adjacent to the CU to be coded, and is a pixel in a generated reconstructed image (that is, an image that has been coded and decoded).
  • Intra-predictive coding encodes the difference between the input image and the predictive image.
  • Intra-prediction coding determines, for each CU, an intra-prediction mode that minimizes the RD (Rate-Distortion) cost in generating a prediction image.
  • the intra prediction mode there are a plurality of directional prediction modes (ANGULAR mode), one DC prediction mode (DC mode), and one plane prediction mode (PLANAR mode).
  • the number of modes in the ANGULAR mode is set to 33 modes in HEVC and 65 modes in VVC.
  • the encoder in intra-prediction coding, it is ideal for the encoder to select the intra-prediction mode that minimizes the RD cost.
  • frequency conversion such as predictive image generation, difference image generation, discrete cosine transform (DCT), quantization, and entropy coding processing of CABAC (Context-based Adaptive Binary Arithmetic Coding) Is required.
  • CABAC Context-based Adaptive Binary Arithmetic Coding
  • the intra prediction mode is often determined using the value of the cost that simplifies the RD cost (hereinafter referred to as "simplified cost").
  • a value obtained by adding an overhead bit or the like to the difference absolute value sum (SATD) of the difference image may be used as the simplification cost.
  • the encoder performs prediction image generation, difference image generation, frequency conversion, quantization, dequantization, and reverse frequency conversion processing only for one intra prediction mode determined based on the simplification cost, and is to be encoded. Generate a reconstructed image of the CU. The generated reconstructed image is referred to in the intra-predictive coding of other coded CUs encoded thereafter.
  • the encoder only needs to execute the above-mentioned processing such as frequency conversion once in the generation of the reconstructed image. That is, the encoder does not need to perform the above-mentioned processing such as frequency conversion in order to determine the intra prediction mode.
  • ISP IntraSubPartition
  • the CU is divided vertically or horizontally. Further, in the ISP prediction process, the CU is divided into two or four sub-CUs. Further, in the ISP prediction process, the same intra prediction mode is used in all the sub-CUs divided from the same CU. Therefore, the intra prediction mode of two or four sub-CUs can be expressed by only one flag, and the code amount is reduced.
  • the intra-prediction for the CU to be encoded is performed with reference to the reconstructed image of the adjacent CU.
  • the reconstructed image is sequentially generated for each sub-CU, so that it is possible to perform intra-prediction for the sub-CU to be encoded by referring to the reconstructed image of the adjacent sub-CU. it can. Therefore, in the ISP prediction processing, the spatial distance between the pixel to be coded and the reference destination pixel is closer than that in the normal intra-prediction coding, and it is possible to refer to a pixel having a higher correlation. As a result, the ISP prediction process can further improve the prediction accuracy of the prediction image and reduce the code amount.
  • the ISP prediction process information indicating whether or not the ISP prediction process should be used and information indicating in which direction (vertical direction or horizontal direction) the CU should be divided are transmitted as flags. Ru.
  • how many CUs should be divided (either two or four) is automatically determined based on the size of the CU to be encoded. Therefore, in the ISP prediction process, a flag indicating how many CUs should be divided is unnecessary.
  • the ISP prediction process reduces the amount of code by expressing the intra prediction mode of all sub-CUs with only one flag. This is because it is assumed that the intra prediction modes of the sub-CUs divided from the same CU are similar. However, if there are variations in the intra-prediction mode that should be originally determined when the ISP prediction process is not used for each sub-CU, the intra-prediction mode that should be originally determined is determined to be a completely different intra-prediction mode. A sub-CU is created in which intra-prediction is made. As a result, even if the distance between the encoding target pixel and the reference destination pixel is short, the prediction accuracy in the intra prediction may be low. That is, when the ISP prediction process is used, the code amount may rather increase. In fact, it is not uncommon for the intra-prediction modes of each sub-CU to vary, and it may not be desirable to use ISP prediction processing.
  • the ISP prediction processing it is possible to determine whether or not the ISP prediction processing should be used by calculating and comparing the RD costs for all the intra prediction modes for each sub-CU. However, if it is determined that the ISP prediction process should not be used, the process performed for this determination is wasted. Then, the amount of processing performed for this determination may be enormous.
  • the intra-prediction mode of the sub-CUs in the same CU is common, and the reference pixel in the intra-prediction is another sub-CU in the same CU. Therefore, the intra prediction mode cannot be determined sequentially for each sub-CU.
  • the ISP prediction process when calculating the cost for the intra prediction mode, the above is performed for the second sub CU only after the reconstructed image in the above intra prediction mode is generated for the first sub CU.
  • the amount of processing in the ISP prediction processing is enormous as compared with the normal intra prediction. Further, in order to determine whether or not to use the ISP prediction process, it is necessary to calculate the RD cost for all the intra-prediction modes for each sub-CU, and the processing amount of the process required for this determination. Is often huge. Further, in determining the intra prediction mode in the ISP prediction process, the flag indicating the division direction (vertical direction or horizontal direction) of the CU and the intra prediction mode of all 67 modes of the VVC are used. A flag indicating whether or not is required. Therefore, in the ISP prediction processing, it is necessary to generate a reconstructed image of each sub-CU for all combinations of the division direction and the intra prediction mode, so that there is a problem that the processing in the encoder is heavily burdened.
  • the present invention has been made in view of such circumstances, and an object of the present invention is to provide a technique capable of reducing the processing amount of ISP (Intra Sub Partition) prediction processing in intra prediction coding.
  • ISP Intelligent Sub Partition
  • One aspect of the present invention is a coding method in which an image is divided into blocks for coding, the division step for dividing the image to be coded into a plurality of coding unit blocks, and the pixels of the coding unit block.
  • a determination step for determining whether or not to perform the coding by dividing the coding unit block into a plurality of sub-coding unit blocks based on the edge direction and edge strength of the edge obtained for each, and the determination step.
  • the coding of the first sub-coding unit block is the same as that of the first sub-coding unit block.
  • a coding method comprising a coding step of performing the coding with reference to a second sub-coding unit block in the unit block.
  • one aspect of the present invention is a coding device that divides an image into blocks and performs coding, a division unit that divides an image to be coded into a plurality of coding unit blocks, and the coding unit block. Based on the edge direction and edge strength of the edge obtained for each pixel, the coding unit block is divided into a plurality of sub-coding unit blocks to determine whether or not to perform the coding, and the determination unit. When the determination unit determines that the coding unit block is divided into a plurality of sub-coding unit blocks, the coding of the first sub-coding unit block is the same as that of the first sub-coding unit block. It is a coding apparatus including a coding unit that performs the coding with reference to a second sub-coding unit block in the coding unit block.
  • one aspect of the present invention is a computer that divides an image into blocks and performs coding, a division step of dividing an image to be coded into a plurality of coding unit blocks, and each pixel of the coding unit block. Based on the edge direction and edge strength of the obtained edge, the coding unit block is divided into a plurality of sub-coding unit blocks to determine whether or not to perform the coding, and the determination step When it is determined that the coding unit block is divided into a plurality of sub-coding unit blocks, the same coding unit block as the first sub-coding unit block is used in the coding of the first sub-coding unit block. It is a program for executing the coding step of performing the coding with reference to the second sub-coding unit block in the above.
  • FIG. 1 is a block diagram showing a functional configuration of the video coding apparatus 100 according to the first embodiment of the present invention.
  • the video coding device 100 receives an input of a video signal (hereinafter, referred to as “original image signal”) indicating a CU to be coded.
  • the video coding device 100 encodes the input original image signal according to a designated parameter. Then, the video coding device 100 outputs a coded bit stream showing the coded result.
  • the video coding apparatus 100 includes an intra prediction processing unit 101, an inter prediction processing unit 102, a prediction image generation unit 103, a residual signal generation unit 104, and a conversion / quantization processing unit 105.
  • the prediction image generation unit 103 acquires information indicating the prediction result output from the intra prediction processing unit 101 or the inter prediction processing unit 102.
  • the prediction image generation unit 103 generates a prediction signal of the original image signal by referring to the past decoded image data stored in the reference image data storage unit 110 according to the information indicating the prediction result.
  • the prediction image generation unit 103 outputs the prediction signal to the residual signal generation unit 104 and the decoding signal generation unit 108.
  • the residual signal generation unit 104 acquires the original image signal. Further, the residual signal generation unit 104 acquires the prediction signal output from the prediction image generation unit 103. The residual signal generation unit 104 calculates the difference between the original image signal and the predicted signal. The residual signal generation unit 104 outputs a predicted residual signal indicating the calculated difference to the conversion / quantization processing unit 105.
  • the conversion / quantization processing unit 105 acquires the predicted residual signal output from the residual signal generation unit 104.
  • the conversion / quantization processing unit 105 performs orthogonal transform such as DCT transform on the acquired predicted residual signal to generate a conversion coefficient.
  • the conversion / quantization processing unit 105 quantizes the generated conversion coefficient.
  • the conversion / quantization processing unit 105 outputs the quantized conversion coefficient to the entropy coding unit 106 and the inverse quantization / inverse conversion processing unit 107.
  • the entropy coding unit 106 acquires the quantized conversion coefficient output from the conversion / quantization processing unit 105.
  • the entropy coding unit 106 entropy encodes the quantized conversion coefficient.
  • the entropy coding unit 106 outputs a coded bit stream showing the result of entropy coding.
  • the inverse quantization / inverse conversion processing unit 107 acquires the quantized conversion coefficient output from the conversion / quantization processing unit 105.
  • the inverse quantization / inverse transformation processing unit 107 inversely quantizes the quantized conversion coefficient.
  • the inverse quantization / inverse transformation processing unit 107 performs inverse orthogonal transformation on the inverse quantization conversion coefficient to generate a predicted residual decoding signal.
  • the inverse quantization / inverse transformation processing unit 107 outputs the generated predicted residual decoding signal to the decoding signal generation unit 108.
  • the decoding signal generation unit 108 acquires the prediction signal output from the prediction image generation unit 103. Further, the decoding signal generation unit 108 acquires the predicted residual decoding signal output from the inverse quantization / inverse conversion processing unit 107. The decoding signal generation unit 108 generates a decoding signal of the CU to be encoded by adding the prediction signal and the prediction residual decoding signal. The decoding signal generation unit 108 outputs the generated decoding signal to the loop filter processing unit 109 and the reference image data storage unit 110.
  • the loop filter processing unit 109 acquires the decoding signal output from the decoding signal generation unit 108.
  • the loop filter processing unit 109 generates a reference image by performing filtering processing on the acquired decoded signal.
  • the filtering process referred to here is a process for reducing coding distortion.
  • the loop filter processing unit 109 outputs the generated reference image to the reference image data storage unit 110.
  • the reference image data storage unit 110 acquires the decoding signal output from the decoding signal generation unit 108 and the reference image output from the loop filter processing unit 109.
  • the decoding signal output from the decoding signal generation unit 108 is also referred to as a “decoding signal before loop filter processing”.
  • the reference image output from the loop filter processing unit 109 is also referred to as a “decoding signal after the loop filter processing”.
  • the reference image data storage unit 110 stores the decoding signal before the loop filter processing and the decoding signal after the loop filter processing.
  • the decoding signal before the loop filter processing and the decoding signal after the loop filter processing stored in the reference image data storage unit 110 are the prediction processing in the intra prediction processing unit 101, the prediction processing in the inter prediction processing unit 102, and the prediction image generation. It is used in the generation process of the predicted image in the unit 103.
  • the intra prediction processing unit 101 acquires the original image signal. Further, the intra prediction processing unit 101 acquires the decoding signal before the loop filter processing from the reference image data storage unit 110. The intra prediction processing unit 101 performs intra prediction on the original image signal by using the acquired decoding signal before the loop filter processing. The intra-prediction processing unit 101 outputs information indicating the prediction result of the intra-prediction to the prediction image generation unit 103. The configuration of the intra prediction processing unit 101 will be described in detail later.
  • the inter-prediction processing unit 102 acquires the original image signal.
  • the inter-prediction processing unit 102 acquires the decoded signal after the loop filter processing from the reference image data storage unit 110.
  • the inter-prediction processing unit 102 performs motion search processing between frames using the acquired decoding signal after the loop filter processing on the original image signal.
  • the inter-prediction processing unit 102 outputs information indicating a prediction result by inter-prediction to the prediction image generation unit 103.
  • FIG. 2 is a block diagram showing a functional configuration of the intra-prediction processing unit 101 according to the first embodiment of the present invention.
  • the intra prediction processing unit 101 includes the intra prediction processing unit 201, the ISP pre-analysis unit 202, and the ISP prediction processing unit 203.
  • the intra prediction processing unit 101 acquires the original image signal. Further, the intra prediction processing unit 101 acquires a reference image (decoded signal before loop filter processing) from the reference image data storage unit 110.
  • the intra-prediction processing unit 201 performs normal intra-prediction using the original image signal and the reference signal. That is, the intra prediction processing unit 201 refers to the reference pixels around the coding target CU with respect to the coding target CU in accordance with the intra prediction mode.
  • the intra prediction processing unit 201 refers to the reference pixels around the coding target CU with respect to the coding target CU in accordance with the intra prediction mode.
  • the intra-prediction processing unit 201 calculates the index value (for example, RD cost) of the evaluation index for each intra-prediction mode for the CU to be encoded.
  • the intra-prediction processing unit 201 determines the intra-prediction mode, which is the best index value among the calculated index values, as the CU intra-prediction mode to be encoded.
  • the intra-prediction processing unit 201 outputs information indicating the determined intra-prediction mode to the prediction image generation unit 103 as a prediction result.
  • the ISP pre-analysis unit 202 performs pre-analysis for the ISP prediction processing performed by the ISP prediction processing unit 203.
  • the ISP pre-analysis unit 202 determines whether or not to execute the ISP prediction process by the pre-analysis. Further, the ISP pre-analysis unit 202 determines the division direction (that is, the vertical direction, the horizontal direction, or both) of the candidate CU when performing the ISP prediction process. Further, when the ISP prediction process is performed, the ISP pre-analysis unit 202 determines the intra prediction mode as a candidate in the ISP prediction process.
  • the ISP pre-analysis unit 202 outputs information indicating the determined result (whether or not the ISP prediction processing can be executed, the division direction of the candidate CU, and the candidate intra prediction mode) to the ISP prediction processing unit 203.
  • the ISP prediction processing unit 203 acquires the information output from the ISP pre-analysis unit 202.
  • the ISP prediction processing unit 203 determines the operation based on the acquired information. For example, the ISP prediction processing unit 203 does not execute the ISP prediction processing (that is, does nothing) when the acquired information is information indicating that the ISP prediction processing should not be performed. Further, for example, the ISP prediction processing unit 203 performs the ISP prediction processing when the acquired information is information indicating that the ISP prediction processing should be performed.
  • the ISP prediction processing unit 203 When the ISP prediction processing unit 203 performs the ISP prediction processing, the ISP prediction processing unit 203 divides the coded target CU into two or more (two or four) sub-CUs. The ISP prediction processing unit 203 determines how many sub-CUs the coding target CU is divided based on the size of the coding target CU.
  • the ISP prediction processing unit 203 divides the CU to be encoded in the vertical direction or the horizontal direction and performs the ISP prediction processing. Based on the information acquired from the ISP pre-analysis unit 202, the ISP prediction processing unit 203 either divides the coded target CU in the vertical direction and performs the ISP prediction process, or divides the coded target CU in the horizontal direction and performs the ISP prediction process. It is determined whether to perform the prediction process or both of these ISP prediction processes.
  • each intra prediction mode of each sub-CU in one CU is common.
  • reference pixels in other sub-CUs around the sub-CU are referenced according to the intra prediction mode.
  • a decoded image is appropriately generated for each intra prediction mode, and in the subsequent ISP prediction processing for other sub-CUs, the pixel of the decoded image of the immediately preceding sub-CU is used as a reference pixel.
  • the intra prediction mode in the ISP prediction processing of VVC has a maximum of 67 modes (1 mode of DC, 1 mode of PLANAR, and 65 modes of Angular), similarly to the intra prediction mode used by the above intra prediction processing unit 201. To do. However, the number of intra prediction modes actually used can be significantly reduced from 67 modes by the candidate intra prediction modes determined by the ISP pre-analysis unit 202 described above.
  • the ISP prediction processing unit 203 calculates the index value (for example, RD cost) of the evaluation index for each candidate division direction for the coded CU. Further, when the ISP prediction processing unit 203 performs the ISP prediction processing, the ISP prediction processing unit 203 calculates the index value of the evaluation index for each candidate intra prediction mode for the coded target CU.
  • the index value for example, RD cost
  • the ISP prediction processing unit 203 determines the division direction, which is the best index value among the index values calculated for each of the candidate division directions, as the division direction of the CU to be encoded. Further, the ISP prediction processing unit 203 determines the intra prediction mode, which is the best index value among the index values calculated for each of the candidate intra prediction modes, as the intra prediction mode of the coded target CU. The intra prediction mode outputs information indicating the determined division direction and the intra prediction mode as a prediction result to the prediction image generation unit 103.
  • the intra prediction processing unit 201 may be configured to perform the intra prediction processing only when the ISP prediction processing by the ISP prediction processing unit 203 is not performed based on the determination of the ISP pre-analysis unit 202.
  • the intra-prediction processing unit 201 may be configured to always perform the intra-prediction processing regardless of whether or not the ISP prediction processing is performed by the ISP prediction processing unit 203.
  • the intra-prediction processing unit 101 may use, for example, an index value in the intra-prediction mode tentatively determined by the intra-prediction processing unit 201. Even if a better index value is output to the prediction image generation unit 103 as a prediction result by comparing the division direction in the ISP prediction process and the index value in the intra prediction mode, which is tentatively determined by the ISP prediction processing unit 203. Good.
  • the video coding apparatus 100 calculates the similarity of edge information between each sub-CU by the ISP pre-analysis unit 202.
  • the video coding apparatus 100 uses the similarity to determine whether or not the ISP prediction process can be executed, and each parameter in the ISP prediction process. As a result, the video coding apparatus 100 can reduce the amount of processing of the ISP prediction processing at the time of video coding.
  • FIG. 3 is a flowchart showing the operation of the ISP pre-analysis unit 202 according to the first embodiment of the present invention. The operation shown in this flowchart is started when the ISP pre-analysis unit 202 starts the ISP pre-analysis process for the CTU (Coding Tree Unit) to be encoded.
  • CTU Coding Tree Unit
  • the ISP pre-analysis unit 202 generates a differential image in the X direction and a differential image in the Y direction for the CTU to be encoded (step S101 and step S102), respectively.
  • a differential image for example, a first-order differential filter, a Prewitt filter, a Sobel filter and the like can be used.
  • the X-direction differential strength and the Y-direction differential strength can be obtained for all the pixels existing in the CTU to be encoded.
  • the ISP pre-analysis unit 202 calculates the edge direction and the edge strength for each of the pixels in the CTU to be encoded (step S104). For example, the ISP pre-analysis unit 202 may use the L1 norm or L2 norm (a value rounded to an integer) of the X-direction differential strength and the Y-direction differential strength as the edge strength for each pixel in the CTU to be encoded. ..
  • FIG. 4 is a diagram showing the intra prediction mode of VVC.
  • VVC Angular prediction as shown in FIG. 4, the intra prediction directions are classified into a total of 65 directions from mode2 to mode66. Since the differential direction of each pixel can be known from the X-direction differential strength and the Y-direction differential strength, the ISP pre-analysis unit 202 determines the differential direction (or the differential direction) of each pixel among the 65 intra-prediction directions in the VVC ANGULAR prediction. The direction closest to (the direction inverted by 180 degrees) may be determined as the edge direction of the target pixel.
  • the edge direction of each pixel takes an integer of 2 to 66.
  • the 65 directions of the intra prediction direction cover the range of 180 degrees in the upper left direction. Therefore, when the calculated differential direction points to the 180-degree portion in the lower right direction, the ISP pre-analysis unit 202 inverts the differential direction by 180 degrees and determines the closest direction as the edge direction of the target pixel. You may try to do it.
  • the ISP pre-analysis unit 202 performs the processing for the entire CTU in the above steps S101 to S103, and then performs the processing for each CU in the following steps S105 to S111.
  • the ISP pre-analysis unit 202 not only performs the processes of S105 to S111 when the CU positions are different, but also performs the processes of S105 to S111 when the CU sizes are different.
  • the ISP pre-analysis unit 202 sets the first sub-CU and performs the subsequent processing.
  • the ISP pre-analysis unit 202 votes the edge information calculated in step S103 for all the pixels in the set sub-CU. As a result, the ISP pre-analysis unit 202 generates a histogram for each edge direction as shown in FIG. 5, for example.
  • FIG. 5 is a diagram showing an example of a histogram generated by the ISP pre-analysis unit 202 according to the first embodiment of the present invention.
  • the ISP pre-analysis unit 202 may generate a histogram by voting one for each pixel for the mode number (intra-prediction mode number) corresponding to the edge direction of each pixel, for example. ..
  • the ISP pre-analysis unit 202 may generate a histogram by voting for the edge intensity value for each pixel in the mode number corresponding to the edge direction of each pixel, for example.
  • the ISP pre-analysis unit 202 does not vote only for the mode number corresponding to the edge direction of each pixel, but for example, the mode number corresponding to the edge direction of each pixel and some mode numbers before and after the mode number. May also vote. Further, in this case, the ISP pre-analysis unit 202 is made to vote for the largest value for the mode number corresponding to the edge direction of each pixel, and the mode numbers before and after that are separated from the mode number corresponding to the edge direction. You may vote for a value as small as the mode number.
  • the ISP pre-analysis unit 202 After generating the histogram in the sub-CU set above, the ISP pre-analysis unit 202 sets the mode number of the intra prediction mode, which is the maximum frequency in the generated histogram, as the edge direction of the sub-CU. For example, in the case of the histogram shown in FIG. 5, the edge direction of the sub-CU is "9".
  • the ISP pre-analysis unit 202 sets the frequency (that is, the intensity) in the histogram in the edge direction of the sub-CU as the edge intensity of the sub-CU (step S107).
  • the ISP pre-analysis unit 202 determines the edge direction and edge strength of all the sub-CUs when the coded CU is divided in each division direction (vertical direction and horizontal direction).
  • the edge direction and edge strength of the sub-CUs are determined.
  • the division direction of the candidate CU, and the candidate intra prediction mode are determined by using the information of (step S110). The method of determining each parameter in these ISP prediction processes will be described in detail later.
  • the ISP pre-analysis unit 202 executes the ISP prediction process only when there is at least one pair having the same edge direction among the (two or four) sub-CUs in which the CU to be encoded is divided. That is, the ISP pre-analysis unit 202 does not execute the ISP prediction process when there is no set in which the edge directions of the sub-CUs are the same.
  • the ISP pre-analysis unit 202 When the ISP prediction process is performed, the ISP pre-analysis unit 202 performs the ISP prediction process only in the division direction (vertical direction or horizontal direction) in which the number of pairs having the same edge direction of each sub-CU is larger. Execute. When the number of pairs having the same edge direction in each sub-CU is equal to each other in the vertical direction and the horizontal direction, the ISP pre-analysis unit 202 divides in the vertical direction and in the horizontal direction. For each, add up all the edge strengths for each sub-CU. Then, the ISP pre-analysis unit 202 may determine the division direction in which the total edge strength is stronger.
  • the ISP pre-analysis unit 202 will perform any division.
  • the ISP prediction process may be executed for the direction as well. It should be noted that the case where there is at least one set having the same edge direction of each of the above sub-CUs is the case where the same edge direction is output from at least two sub-CUs.
  • the ISP pre-analysis unit 202 sets only the edge direction in which the same set exists in each sub-CU as a candidate for the intra prediction mode in the ISP prediction process.
  • the ISP pre-analysis unit 202 sets three intra-prediction modes, which are a DC mode and a PLANAR mode, in addition to the intra-prediction mode corresponding to the edge direction, as candidates for the intra-prediction mode in the ISP prediction processing. You may.
  • the division direction of the candidate CU, and the candidate intra are only by the equivalent comparison process for each edge direction of the sub-CU. It is possible to determine the prediction mode. This makes it possible to narrow down the subsequent ISP prediction processing with a smaller amount of processing.
  • the ISP pre-analysis unit 202 calculates the maximum value and the minimum value of the mode number in the edge direction of each of the (two or four) sub-CUs in which the coded target CU is divided.
  • the ISP pre-analysis unit 202 executes the ISP prediction process only when the difference value between the calculated maximum value and the minimum value is smaller than the parameter value set by the encoder user. That is, the ISP pre-analysis unit 202 can set the difference value between the calculated maximum value and the minimum value in any of the division directions (both the vertical direction and the horizontal direction) of the CU to be encoded by the encoder user. If it exceeds the parameter value, the ISP prediction process is not executed.
  • the fact that the difference between the maximum value and the minimum value of the mode number in the edge direction in all the sub-CUs is small means that there is no sub-CU facing the deviated direction, that is, the entire sub-CUs are in the same direction. It means that it is suitable.
  • the configuration of the ISP pre-analysis unit 202 described above is a configuration intended to perform ISP prediction processing only in such a case.
  • the ISP pre-analysis unit 202 executes the ISP prediction process only in the division direction (vertical direction or horizontal direction) in which the above difference value is smaller. Alternatively, if the above difference value is smaller than the parameter value in any of the division directions (both the vertical direction and the horizontal direction) of the CU to be encoded, the ISP pre-analysis unit 202 performs the ISP in any division direction.
  • the prediction process may be executed.
  • the ISP pre-analysis unit 202 When performing ISP prediction processing, the ISP pre-analysis unit 202 generates a histogram of the CU to be encoded by merging the histograms of all the sub-CUs in the same division direction.
  • the ISP pre-analysis unit 202 sets only the mode number having the maximum frequency in the histogram of the coded target CU as a candidate for the edge direction of the coded target CU and the intra prediction mode in the ISP prediction process.
  • the ISP pre-analysis unit 202 may make the intra prediction mode corresponding to some mode numbers having a higher frequency in the histogram of the coded target CU as a candidate for the intra prediction mode of the ISP prediction process. ..
  • the ISP pre-analysis unit 202 may set only the intra prediction mode corresponding to the average value of each mode number in the edge direction of all the sub-CUs as a candidate for the intra prediction mode in the ISP prediction process.
  • the ISP pre-analysis unit 202 performs ISP prediction processing only for the intra prediction mode corresponding to two mode numbers that are the same as or close to the median among the mode numbers in the edge direction of all the sub-CUs. It may be a candidate for the intra prediction mode in.
  • the sum of the differences from each mode number in the edge direction of each sub-CU is minimized. It means that it is an intra-prediction mode.
  • the ISP pre-analysis unit 202 is added to the intra prediction mode corresponding to the edge direction as in the first embodiment.
  • DC mode and PLANAR mode may be added as candidates for the intra-prediction mode in the ISP prediction process.
  • the ISP prediction process determines whether or not the ISP prediction process can be executed is determined by the magnitude relationship of the value with respect to the parameter value that can be set by the encoder user. Therefore, the ISP is determined only on the encoder side. It is possible to adjust the usage rate of the prediction process.
  • whether or not the ISP prediction process can be executed, the division direction of the candidate CU, and the candidate intra prediction mode are determined by different determination methods.
  • the configuration may be. For example, whether or not the ISP prediction process can be executed is determined by whether or not there is at least one pair having the same edge direction of each sub-CU, and the frequency becomes the maximum in the histogram of the coded CU.
  • the intra prediction mode corresponding to the mode number may be determined as a candidate intra prediction mode.
  • the two-dimensional planar direction and edge information possessed by each sub-CU in the ISP prediction process are the original intra-prediction mode of each sub-CU (the original coding target).
  • the degree of similarity of edge information between sub-CUs is calculated by utilizing the fact that it has a high correlation with the intra-prediction mode of CU). Then, the video coding apparatus 100 determines whether or not the ISP prediction process can be executed and each parameter of the ISP prediction process using the calculated similarity. As a result, the video coding apparatus 100 can reduce the amount of processing of the ISP prediction processing in the encoder.
  • the ISP pre-analysis unit 202 is configured to calculate the edge direction and the edge strength in the above-described embodiment, it may be configured to calculate only the edge direction. In this case, for example, instead of voting the edge strength value in the histogram, the histogram may be voted as a fixed value one by one. For example, the ISP pre-analysis unit 202 acquires both the X-direction differential strength and the Y-direction differential strength for all the pixels existing in the CTU to be encoded. Then, the ISP pre-analysis unit 202 may calculate at least the edge direction, and may calculate the edge strength depending on the case.
  • the video coding device 100 can be applied to a video coding device, a video coding program, etc., which have a limited amount of calculation.
  • a part or all of the video coding apparatus 100 in the above-described embodiment may be realized by a computer.
  • the program for realizing this function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read by the computer system and executed.
  • the term "computer system” as used herein includes hardware such as an OS and peripheral devices.
  • the "computer-readable recording medium” refers to a portable medium such as a flexible disk, a magneto-optical disk, a ROM, or a CD-ROM, or a storage device such as a hard disk built in a computer system.
  • a "computer-readable recording medium” is a communication line for transmitting a program via a network such as the Internet or a communication line such as a telephone line, and dynamically holds the program for a short period of time. It may also include a program that holds a program for a certain period of time, such as a volatile memory inside a computer system that serves as a server or a client in that case. Further, the above program may be for realizing a part of the above-mentioned functions, and may be further realized for realizing the above-mentioned functions in combination with a program already recorded in the computer system. It may be realized by using a programmable logic device such as FPGA (Field Programmable Gate Array).
  • FPGA Field Programmable Gate Array
  • 100 Video coding device, 101 ... Intra prediction processing unit, 102 ... Inter prediction processing unit, 103 ... Prediction image generation unit, 104 ... Residual signal generation unit, 105 ... Conversion / quantization processing unit, 106 ... Entropy coding unit, 107 ... Inverse quantization / inverse conversion processing unit, 108 ... Decoding signal generation unit, 109 ... Loop filter processing unit, 110 ... -Data storage unit for reference image, 201 ... This intra prediction processing unit, 202 ... ISP pre-analysis unit, 203 ... ISP prediction processing unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

画像をブロックに分割して符号化を行う符号化方法は、符号化対象画像を複数の符号化単位ブロックに分割する分割ステップと、前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定ステップと、前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化ステップと、を有する。

Description

符号化方法、符号化装置、及びプログラム
 本発明は、符号化方法、符号化装置、及びプログラムに関する。
 映像符号化技術として、MPEG(Moving Picture Experts Group)-2、MPEG-4、及びH.264/MPEG-4 AVC(Advanced Video Coding)等が広く用いられいる。とくに近年は、最新の国際標準映像符号化規格であるH.265/HEVC(High Efficiency Video Coding)(以下、「HEVC」という。)の普及が進んでいる。さらに、H.265/HEVCの次の国際標準映像符号化規格として、2020年7月の標準化を目指し、H.266/VVC(Versatile Video Coding)(以下、「VVC」という。)の検討が進められている。VVCは、HEVCの2倍の符号化効率が実現されることを目標として、検討が進められている。
 HEVC、VVC等の規格に則った映像符号化では、イントラ予測符号化が行われることで符号化効率の向上が実現されている。イントラ予測符号化とは、符号化単位ブロックであるコーディングユニット(CU)を符号化する際に、符号化対象のCU(以下、「符号化対象CU」という。)の周辺に位置する画素の画素値に基づいて、当該符号化対象CU内の画素の画素値を予測・推定し、補償する符号化方式である。具体的には、イントラ予測符号化は、符号化対象CUに隣接するCU内に位置する画素であって、かつ生成済みの再構成画像(すなわち、符号化及び復号がなされた画像)内の画素を複数参照して、符号化対象CUの予測画像を生成する。イントラ予測符号化は、入力画像と予測画像との差分を符号化する。イントラ予測符号化は、予測画像の生成において、RD(Rate-Distortion)コストが最小となるイントラ予測モードをCUごとに決定する。イントラ予測モードとしては、複数の方向性予測のモード(ANGULARモード)と、1つの直流予測のモード(DCモード)と、1つの平面予測のモード(PLANARモード)とが存在する。ANGULARモードのモード数は、HEVCでは33モードに、及びVVCでは65モードに定められている。
 上述したように、イントラ予測符号化においては、エンコーダは、RDコストが最小となるイントラ予測モードを選択することが理想的である。しかしながら、RDコストの算出のためには、予測画像生成、差分画像生成、離散コサイン変換(DCT)等の周波数変換、量子化、及びCABAC(Context-based Adaptive Binary Arithmetic Coding)のエントロピー符号化の処理が必要とされる。特に、周波数変換及びエントロピー符号化における処理量は多く、エンコーダが、各CUごとに、全てのイントラ予測モードについてそれぞれRDコストを算出するのは難しい場合がある。
 以上のことから、RDコストを簡略化したコスト(以下、「簡略化コスト」という。)の値を用いてイントラ予測モードが決定される場合が多い。例えば、RDコストに代えて、差分画像の差分絶対値和(SATD)にオーバーヘッドビット等を加算した値が、簡略化コストとして用いられることがある。エンコーダは、簡略化コストに基づいて決定された1つのイントラ予測モードについてのみ、予測画像生成、差分画像生成、周波数変換、量子化、逆量子化、及び逆周波数変換の処理を行い、符号化対象CUの再構成画像を生成する。生成された再構成画像は、それ以降に符号化される他の符号化対象CUのイントラ予測符号化において参照される。この簡略化コストを用いる方法によれば、エンコーダは、再構成画像の生成において上記の周波数変換等の処理を一度だけ実行すればよい。すなわち、エンコーダは、イントラ予測モードの決定のために上記の周波数変換等の処理を行う必要がない。
 VVCでは、イントラ予測符号化において、ISP(Intra Sub Partition)予測処理という追加手法が提案されている。ISP予測処理においては、CUは、垂直又は水平に分割される。また、ISP予測処理においては、CUは、2つ又は4つのサブCUに分割される。また、ISP予測処理においては、同一のCUから分割された全てのサブCUにおいて、同一のイントラ予測モードが用いられる。そのため、2つ又は4つのサブCUのイントラ予測モードを1つのフラグのみで表現することが可能になり、符号量が削減される。
 また、通常のイントラ予測符号化は、上述したように、隣接するCUの再構成画像を参照して符号化対象CUについてのイントラ予測を行う。これに対し、ISP予測処理は、サブCUごとに再構成画像を順次生成していくため、隣接するサブCUの再構成画像を参照して符号化対象のサブCUについてのイントラ予測を行うことができる。そのため、ISP予測処理は、通常のイントラ予測符号化と比べて符号化対象画素と参照先画素との間の空間的距離が近く、より相関の高い画素を参照することができる。これにより、ISP予測処理は、予測画像の予測精度をより向上させ、符号量を削減することができる。
 また、ISP予測処理では、当該ISP予測処理を用いるべきか否かを示す情報と、CUをいずれの方向(垂直方向、又は水平方向)に分割すべきかを示す情報とが、それぞれフラグとして送信される。なお、ISP予測処理では、CUをいくつに(2つ、又は4つのいずれに)分割すべきかについては、符号化対象CUのサイズに基づいて自動的に決定される。そのため、ISP予測処理では、CUをいくつに分割すべきかを示すフラグは不要である。
S. De-Luxan-Hernandez, et al., "CE3:Intra Sub-Partitions Coding Mode (Tests 1.1.1 and 1.1.2)," JVET-M0102-v2, Joint Video Experts Team of ITU-T, 13th Meeting Marrakech, January 2019.
 ISP予測処理は、1つのフラグのみで全てのサブCUのイントラ予測モードを表現することによって符号量を削減する。これは、同一のCUから分割されたサブCUのそれぞれのイントラ予測モードは近似していることが前提とされているためである。しかしながら、各サブCUの、ISP予測処理が用いられなかった場合に本来決定されるべきイントラ予測モードにばらつきがある場合、本来決定されるべきイントラ予測モードとは全く異なるイントラ予測モードに決定されてイントラ予測が行われるサブCUが生じる。これにより、符号化対象画素と参照先画素との間の距離が近くても、イントラ予測における予測精度は低くなる場合がある。すなわち、ISP予測処理が用いられた場合に、むしろ符号量が増加する場合がある。実際に、各サブCUのイントラ予測モードにばらつきがあることは珍しくなく、ISP予測処理を用いることが望ましくない場合がある。
 これに対し、ISP予測処理において、サブCUごとに、全てのイントラ予測モードについてそれぞれRDコストを算出し比較することによって、ISP予測処理を用いるべきか否かを判定することは可能である。しかしながら、ISP予測処理を用いるべきではないと判定された場合、この判定のために行われた処理は無駄になる。そして、この判定のために行われる処理の処理量は膨大になることがある。
 上述したように、通常のイントラ予測では、RDコストに代わる簡略化コストに基づいて決定された1つのイントラ予測モードについてのみ、再構成画像生成のための各種処理を一度だけ実行し、処理量を削減することができる。これに対し、ISP予測処理では、同一CU内のサブCUのイントラ予測モードは共通であり、イントラ予測における参照先画素は同一CU内の他のサブCUである。そのため、サブCUごとにイントラ予測モードを順次確定させていくことができない。ISP予測処理では、イントラ予測モードについてのコストを算出する場合、1つ目のサブCUについて上記のイントラ予測モードでの再構成画像を生成した後でなければ、2つ目のサブCUについて上記のイントラ予測モードでのイントラ予測における参照を行うことができない。このように、ISP予測処理では、各サブCUにおいて、候補となるイントラ予測モードの全ての場合について再構成画像の生成が必要となる。そのため、ISP予測処理では、候補となるイントラ予測モードの数に相当する回数だけ、再構成画像生成のための各種処理が実行されなければならない。
 このように、ISP予測処理では、通常のイントラ予測に比べて処理量が膨大となる。また、ISP予測処理を用いるべきか否かについての判定を行うためには、サブCUごとに、全てのイントラ予測モードについてそれぞれRDコストが算出される必要があり、この判定に要する処理の処理量は膨大になることが多い。また、ISP予測処理におけるイントラ予測モードの決定においては、CUの分割方向(垂直方向、又水平方向)を示すフラグと、VVCの全67モードのイントラ予測モードの中のいずれのイントラ予測モードであるかを示すフラグとがそれぞれ必要になる。そのため、ISP予測処理では、分割方向とイントラ予測モードとの全ての組み合わせについて、各サブCUの再構成画像生成が必要となるため、エンコーダにおける処理に大きな負担がかかるという課題がある。
 本発明は、このような事情に鑑みてなされたもので、イントラ予測符号化におけるISP(Intra Sub Partition)予測処理の処理量を削減することができる技術の提供を目的としている。
 本発明の一態様は、画像をブロックに分割して符号化を行う符号化方法であって、符号化対象画像を複数の符号化単位ブロックに分割する分割ステップと、前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定ステップと、前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化ステップと、を有する符号化方法である。
 また、本発明の一態様は、画像をブロックに分割して符号化を行う符号化装置であって、符号化対象画像を複数の符号化単位ブロックに分割する分割部と、前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定部と、前記判定部により、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化部と、を備える符号化装置である。
 また、本発明の一態様は、画像をブロックに分割して符号化を行うコンピュータに、符号化対象画像を複数の符号化単位ブロックに分割する分割ステップと、前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定ステップと、前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化ステップと、を実行させるためのプログラムである。
 本発明により、イントラ予測符号化におけるISP(Intra Sub Partition)予測処理の処理量を削減することができる。
本発明の第1の実施形態に係る映像符号化装置100の機能構成を示すブロック図。 本発明の第1の実施形態に係るイントラ予測処理部101の機能構成を示すブロック図。 本発明の第1の実施形態に係るISP事前解析部202の動作を示すフローチャート。 VVCのイントラ予測モードを示す図。 本発明の第1の実施形態に係るISP事前解析部202によって生成されるヒストグラムの一例を示す図。
<第1の実施形態>
 以下、本発明の第1の実施形態に係る映像符号化装置100について、図面を参照しながら説明する。
[映像符号化装置の構成]
 以下、映像符号化装置100の機能構成について説明する。
 図1は、本発明の第1の実施形態に係る映像符号化装置100の機能構成を示すブロック図である。映像符号化装置100は、符号化対象CUを示す映像信号(以下、「原画像信号」という。)の入力を受け付ける。映像符号化装置100は、入力された原画像信号を、指定されたパラメータに従って符号化する。そして、映像符号化装置100は、符号化された結果を示す符号化ビットストリームを出力する。
 図1に示すように、映像符号化装置100は、イントラ予測処理部101と、インター予測処理部102と、予測画像生成部103と、残差信号生成部104と、変換・量子化処理部105と、エントロピー符号化部106と、逆量子化・逆変換処理部107と、復号信号生成部108と、ループフィルタ処理部109と、参照画像用データ記憶部110とを含んで構成される。
 予測画像生成部103は、イントラ予測処理部101又はインター予測処理部102から出力された予測結果を示す情報を取得する。予測画像生成部103は、予測結果を示す情報に従い、参照画像用データ記憶部110に保存された過去の復号画像データを参照して、原画像信号の予測信号を生成する。予測画像生成部103は、予測信号を残差信号生成部104及び復号信号生成部108へ出力する。
 残差信号生成部104は、原画像信号を取得する。また、残差信号生成部104は、予測画像生成部103から出力された予測信号を取得する。残差信号生成部104は、原画像信号と予測信号との差分を算出する。残差信号生成部104は、算出された差分を示す予測残差信号を変換・量子化処理部105へ出力する。
 変換・量子化処理部105は、残差信号生成部104から出力された予測残差信号を取得する。変換・量子化処理部105は、取得された予測残差信号に対してDCT変換等の直交変換を行い、変換係数を生成する。変換・量子化処理部105は、生成された変換係数を量子化する。変換・量子化処理部105は、量子化された変換係数を、エントロピー符号化部106及び逆量子化・逆変換処理部107へ出力する。
 エントロピー符号化部106は、変換・量子化処理部105から出力された、量子化された変換係数を取得する。エントロピー符号化部106は、量子化された変換係数をエントロピー符号化する。エントロピー符号化部106は、エントロピー符号化の結果を示す符号化ビットストリームを出力する。
 逆量子化・逆変換処理部107は、変換・量子化処理部105から出力された、量子化された変換係数を取得する。逆量子化・逆変換処理部107は、量子化された変換係数を逆量子化する。逆量子化・逆変換処理部107は、逆量子化された変換係数に対して逆直交変換を行い、予測残差復号信号を生成する。逆量子化・逆変換処理部107は、生成された予測残差復号信号を復号信号生成部108へ出力する。
 復号信号生成部108は、予測画像生成部103から出力された予測信号を取得する。また、復号信号生成部108は、逆量子化・逆変換処理部107から出力された予測残差復号信号を取得する。復号信号生成部108は、予測信号と予測残差復号信号とを加算することにより、符号化対象CUの復号信号を生成する。復号信号生成部108は、生成された復号信号をループフィルタ処理部109及び参照画像用データ記憶部110へ出力する。
 ループフィルタ処理部109は、復号信号生成部108から出力された復号信号を取得する。ループフィルタ処理部109は、取得された復号信号に対してフィルタリング処理を行うことにより、参照画像を生成する。ここでいうフィルタリング処理とは、符号化歪みを低減させる処理である。ループフィルタ処理部109は、生成された参照画像を参照画像用データ記憶部110へ出力する。
 参照画像用データ記憶部110は、復号信号生成部108から出力された復号信号と、ループフィルタ処理部109から出力された参照画像とを取得する。以下、復号信号生成部108から出力された復号信号を、「ループフィルタ処理前の復号信号」ともいう。また、ループフィルタ処理部109から出力された参照画像を、「ループフィルタ処理後の復号信号」ともいう。参照画像用データ記憶部110は、ループフィルタ処理前の復号信号とループフィルタ処理後の復号信号とを記憶する。参照画像用データ記憶部110に記憶されたループフィルタ処理前の復号信号及びループフィルタ処理後の復号信号は、イントラ予測処理部101における予測処理及びインター予測処理部102における予測処理と、予測画像生成部103における予測画像の生成処理において用いられる。
 イントラ予測処理部101は、原画像信号を取得する。また、イントラ予測処理部101は、参照画像用データ記憶部110からループフィルタ処理前の復号信号を取得する。イントラ予測処理部101は、原画像信号に対し、取得されたループフィルタ処理前の復号信号を用いてイントラ予測を行う。イントラ予測処理部101は、イントラ予測による予測結果を示す情報を予測画像生成部103へ出力する。なお、イントラ予測処理部101の構成については、後に詳しく説明する。
 インター予測処理部102は、原画像信号を取得する。インター予測処理部102は、参照画像用データ記憶部110からループフィルタ処理後の復号信号を取得する。インター予測処理部102は、原画像信号に対し、取得されたループフィルタ処理後の復号信号を用いてフレーム間の動き探索処理を行う。インター予測処理部102は、インター予測による予測結果を示す情報を予測画像生成部103へ出力する。
[イントラ予測処理部の構成]
 以下、イントラ予測処理部101の機能構成について、更に詳しく説明する。
 図2は、本発明の第1の実施形態に係るイントラ予測処理部101の機能構成を示すブロック図である。
 図2に示すように、イントラ予測処理部101は、本イントラ予測処理部201と、ISP事前解析部202と、ISP予測処理部203とを含んで構成される。
 イントラ予測処理部101は、原画像信号を取得する。また、イントラ予測処理部101は、参照画像用データ記憶部110から参照画像(ループフィルタ処理前の復号信号)を取得する。
 本イントラ予測処理部201は、原画像信号と参照信号とを用いて、通常のイントラ予測を行う。すなわち、本イントラ予測処理部201は、符号化対象CUに対し、当該符号化対象CUの周囲の参照画素をイントラ予測モードに則って参照する。VVCでは、イントラ予測モードの候補として、最大67モード(DCの1モード、PLANARの1モード、及びANGULARの65モード)存在する。
 本イントラ予測処理部201は、符号化対象CUについて、イントラ予測モードごとに評価指標の指標値(例えば、RDコスト)を算出する。本イントラ予測処理部201は、算出された指標値のうち最良の指標値となるイントラ予測モードを、符号化対象のCUイントラ予測モードとして決定する。本イントラ予測処理部201は、決定されたイントラ予測モードを示す情報を予測結果として予測画像生成部103へ出力する。
 ISP事前解析部202は、ISP予測処理部203によって行われるISP予測処理のための事前解析を行う。ISP事前解析部202は、事前解析により、ISP予測処理を実行すべきか否かを決定する。また、ISP事前解析部202は、ISP予測処理を行う場合、候補とするCUの分割方向(すなわち、垂直方向、水平方向、又はその両方)を決定する。また、ISP事前解析部202は、ISP予測処理を行う場合、ISP予測処理において候補とするイントラ予測モードを決定する。ISP事前解析部202は、決定された結果(ISP予測処理の実行可否、候補とするCUの分割方向、及び候補とするイントラ予測モード)を示す情報をISP予測処理部203へ出力する。
 ISP予測処理部203は、ISP事前解析部202から出力された情報を取得する。ISP予測処理部203は、取得された情報に基づいて動作を決定する。例えば、ISP予測処理部203は、取得された情報がISP予測処理を行うべきではないこと示す情報である場合には、ISP予測処理を実行しない(すなわち、何もしない)。また、例えば、ISP予測処理部203は、取得された情報がISP予測処理を行うべきであること示す情報である場合には、ISP予測処理を行う。
 ISP予測処理部203は、ISP予測処理を行う場合、符号化対象CUを2複数の(2つ又は4つの)サブCUに分割する。なお、ISP予測処理部203は、符号化対象CUのサイズに基づいて、当該符号化対象CUをいくつのサブCUに分割するかを決定する。
 ISP予測処理部203は、垂直方向又は水平方向に符号化対象CUを分割してISP予測処理を行う。ISP予測処理部203は、ISP事前解析部202から取得した情報に基づいて、符号化対象CUを垂直方向に分割してISP予測処理を行うか、符号化対象CUを水平方向に分割してISP予測処理を行うか、又は、これらのISP予測処理の双方を行うかを決定する。
 ISP予測処理において、1つのCU内のサブCUのそれぞれのイントラ予測モードは共通である。それぞれのサブCUにおいて、当該サブCUの周囲の他のサブCU内の参照画素が、イントラ予測モードに則って参照される。そしてイントラ予測モードごとに復号画像が適宜生成され、以降の他のサブCUについてのおISP予測処理においては、直前のサブCUの復号画像の画素が参照画素として用いられる。
 VVCのISP予測処理におけるイントラ予測モードは、上記の本イントラ予測処理部201によって用いられるイントラ予測モードと同様に、最大67モード(DCの1モード、PLANARの1モード、及びANGULARの65モード)存在する。但し、上述したISP事前解析部202によって決定される、候補とするイントラ予測モードによって、実際に用いられるイントラ予測モードの個数は67モードから大幅に削減されうる。
 ISP予測処理部203は、ISP予測処理を行う場合、符号化対象CUについて、候補とする分割方向ごとに評価指標の指標値(例えば、RDコスト)を算出する。また、ISP予測処理部203は、ISP予測処理を行う場合、符号化対象CUについて、候補とするイントラ予測モードごとに評価指標の指標値を算出する。
 ISP予測処理部203は、候補とする分割方向についてそれぞれ算出された指標値のうち最良の指標値となる分割方向を、符号化対象CUの分割方向として決定する。また、ISP予測処理部203は、候補とするイントラ予測モードについてそれぞれ算出された指標値のうち最良の指標値となるイントラ予測モードを、符号化対象CUのイントラ予測モードとして決定する。イントラ予測モードは、決定された分割方向及びイントラ予測モードを示す情報を予測結果として、予測画像生成部103へ出力する。
 なお、本イントラ予測処理部201は、ISP事前解析部202の決定に基づき、ISP予測処理部203によるISP予測処理が行われない場合にのみイントラ予測処理を行う構成であってもよい。または、本イントラ予測処理部201は、ISP予測処理部203によるISP予測処理が行われるか否かにかかわらず、常にイントラ予測処理を行う構成であってもよい。なお、本イントラ予測処理部201が常にイントラ予測処理を行う構成である場合には、イントラ予測処理部101は、例えば、本イントラ予測処理部201によって仮決定されたイントラ予測モードによる指標値と、ISP予測処理部203によって仮決定された、ISP予測処理における分割方向及びイントラ予測モードによる指標値とを比較して、より良い指標値を予測結果として予測画像生成部103へ出力するようにしてもよい。
 上述した構成を備えることで、本実施形態に係る映像符号化装置100は、ISP事前解析部202によって、各サブCUの間のエッジ情報の相似度を算出する。映像符号化装置100は、当該相似度を用いてISP予測処理の実行可否、及びISP予測処理における各パラメータを決定する。これにより、映像符号化装置100は、映像符号化時におけるISP予測処理の処理量を削減することができる。
[ISP事前解析部の動作]
 以下、ISP事前解析部202のISP事前解析処理における動作の一例について説明する。
 図3は、本発明の第1の実施形態に係るISP事前解析部202の動作を示すフローチャートである。本フローチャートが示す動作は、ISP事前解析部202が符号化対象のCTU(Coding Tree Unit)に対するISP事前解析処理を開始した際に開始される。
 ISP事前解析部202は、符号化対象のCTUについて、X方向の微分画像、及びY方向の微分画像をそれぞれ生成する(ステップS101及びステップS102)。なお、微分画像の生成には、例えば、1次微分フィルタ、Prewittフィルタ、及びSobelフィルタ等を用いることができる。これにより、符号化対象のCTU内に存在する全画素について、それぞれX方向微分強度及びY方向微分強度が得られる。
 ISP事前解析部202は、符号化対象のCTU内の画素のそれぞれについて、エッジ方向とエッジ強度とを算出する(ステップS104)。例えば、ISP事前解析部202は、符号化対象CTU内の画素それぞれについて、X方向微分強度とY方向微分強度とのL1ノルム又はL2ノルム(を整数に丸めた値)を、エッジ強度としてもよい。
 図4は、VVCのイントラ予測モードを示す図である。VVCのANGULAR予測の場合、図4のように、イントラ予測方向はmode2からmode66までの計65方向に分類される。X方向微分強度とY方向微分強度から各画素の微分方向がわかるため、ISP事前解析部202は、VVCのANGULAR予測におけるイントラ予測方向65方向のうち、各画素の微分方向(又は、微分方向を180度反転した方向)に最も近い方向を対象画素のエッジ方向として決定するようにしてもよい。ここで、各画素のエッジ方向は、2から66のいずれかの整数をとる。
 なお、イントラ予測方向の65方向は、左上方向の180度の範囲をカバーするものである。そのため、算出された微分方向が右下方向180度部分を指している場合には、ISP事前解析部202は、微分方向を180度反転した上で、最も近い方向を対象画素のエッジ方向として決定するようにしてもよい。
 ISP事前解析部202は、上記のステップS101~ステップS103においてCTU全体に対する処理を行った後、下記のステップS105~ステップS111においてCUごとの処理を行う。ISP事前解析部202は、CU位置が異なる場合についてS105~S111の処理をそれぞれ行うだけでなく、CUサイズが異なる場合についてもS105~S111の処理をそれぞれ行う。
 ISP事前解析部202は、まずISP事前処理を行う対象のCU(すなわち、符号化対象CU)を設定する(CU index=0)(ステップS104)。ISP事前解析部202は、まずCUの分割方向が垂直方向である場合について試行する(Division index=0(0:垂直,1:水平))(ステップS105)。ISP事前解析部202は、ISP予測処理として、上記設定された符号化対象CUを複数のサブCUに分割する(SubCU index=0)(ステップS106)。なお、上述したように、符号化対象CUがいくつのサブSUに分割されるかについては、当該符号化対象CUのサイズに応じて自動的に決定される。ISP事前解析部202は、最初のサブCUを設定し、以降の処理を行う。
 ISP事前解析部202は、上記設定されたサブCU内の全ての画素について、上記ステップS103において算出されたエッジ情報の投票を行う。これにより、い、ISP事前解析部202は、例えば図5に示すようなエッジ方向ごとのヒストグラムを生成する。
 図5は、本発明の第1の実施形態に係るISP事前解析部202によって生成されるヒストグラムの一例を示す図である。ISP事前解析部202は、例えば、各画素のエッジ方向に相当するモード番号(イントラ予測モードの番号)に、各画素ごとに1ずつ投票をしていくことによってヒストグラムを生成するようにしてもよい。又は、ISP事前解析部202は、例えば、各画素のエッジ方向に相当するモード番号に、各画素ごとにエッジ強度の値を投票していくことによってヒストグラムを生成するようにしてもよい。
 又は、ISP事前解析部202は、例えば、各画素のエッジ方向に相当するモード番号のみに投票するのではなく、各画素のエッジ方向に相当するモード番号と、その前後のいくつかのモード番号にも投票するようにしてもよい。さらに、この場合、ISP事前解析部202は、例えば、各画素のエッジ方向に相当するモード番号に最も大きな値を投票するようにし、その前後のモード番号についてはエッジ方向に相当するモード番号から離れたモード番号ほど小さな値を投票するようにしてもよい。
 ISP事前解析部202は、上記設定されたサブCUにおけるヒストグラムを生成した後、生成されたヒストグラムにおいて最大の度数となるイントラ予測モードのモード番号を、サブCUのエッジ方向として設定する。例えば、図5に示されるヒストグラムの場合、サブCUのエッジ方向は「9」である。ISP事前解析部202は、サブCUのエッジ方向における、ヒストグラムにおける度数(すなわち、強度)をサブCUのエッジ強度として設定する(ステップS107)。
 ISP事前解析部202は、上記設定されたサブCUが符号化対象CU内における最後のサブCUであるか否かを判定する(ステップS108)。最後のサブCUであると判定された場合(ステップS108・Yes)、ISP事前解析部202は、以下のステップS109に示す処理に進む。最後のサブCUではないと判定された場合(ステップS108・No)、ISP事前解析部202は、次のサブCUに対する処理に進み(SubCU index+=1)(ステップS112)、次のサブCUに対して上記ステップS107以降の処理を行う。
 ISP事前解析部202は、上記設定されたCUの水平方向の分割方向について試行中であるか否かを判定する(Division index==1?)(ステップS109)。水平方向の分割方向について試行中であると判定された場合(ステップS109・Yes)、ISP事前解析部202は、以下のステップS110示す処理に進む。垂直方向の分割方向について試行中であると判定された場合(ステップS109・No)、ISP事前解析部202は、次に、水平方向の分割方向について試行を行う(Division index+=1)(ステップS113)。
 ISP事前解析部202は、符号化対象CUを各分割方向(垂直方向及び水平方向)にそれぞれ分割した場合における全てのサブCUのエッジ方向及びエッジ強度を決定すると、サブCUのエッジ方向及びエッジ強度の情報を用いて、ISP予測処理の実行可否、候補とするCUの分割方向、及び候補とするイントラ予測モードを決定する(ステップS110)。なお、これらのISP予測処理における各パラメータの決定方法については後に詳しく説明する。
 ISP事前解析部202は、上記設定されたCUが符号化対象のCTU内における最後のCUであるか否かを判定する(ステップS111)。最後のCUであると判定された場合(ステップS111・Yes)、ISP事前解析部202は、符号化対象のCTUに対するISP事前解析処理を終了する。最後のCUではないと判定された場合(ステップS111・No)、ISP事前解析部202は、次のCUに対する処理に移り(CU index+=1)(ステップS114)、次のCUに対して上記ステップS105以降の処理を行う。以上で、図3のフローチャートが示すISP事前解析部202の動作が終了する。
[パラメータ決定方法]
 以下、図3に示されるフローチャートのステップS110において行われる、ISP予測処理における各パラメータの決定方法について説明する。
 ISP事前解析部202は、符号化対象CUが分割された(2つ又は4つの)サブCUのうち、エッジ方向が同一である組が少なくとも1組存在する場合のみ、ISP予測処理を実行する。すなわち、ISP事前解析部202は、各サブCUのエッジ方向が同一である組が1組も存在しないない場合には、ISP予測処理を実行しない。
 ISP事前解析部202は、ISP予測処理を行う場合には、各サブCUのエッジ方向が同一である組の数がより多いほうの分割方向(垂直方向、又は水平方向)のみについてISP予測処理を実行する。各サブCUにおいてエッジ方向が同一である組の数が、垂直方向と水平方向とにおいて互いに等しい場合には、ISP事前解析部202は、垂直方向に分割する場合と水平方向に分割する場合とのそれぞれについて、サブCUごとのエッジ強度を全て合計する。そして、ISP事前解析部202は、合計されたエッジ強度がより強いほうの分割方向に決定するようにしてもよい。
 または、垂直方向の分割及び水平方向のいずれの分割方向の場合においても、各サブCUのエッジ方向が同一である組が少なくとも1組存在する場合には、ISP事前解析部202は、いずれの分割方向についてもISP予測処理を実行するようにしてもよい。なお、上記の各サブCUのエッジ方向が同一である組が少なくとも1組存在する場合とは、すなわち、少なくとも2つのサブCUから同じエッジ方向が出力された場合である。
 ISP事前解析部202は、ISP予測処理を行う場合、各サブCUにおいて同一である組が存在するエッジ方向のみを、ISP予測処理におけるのイントラ予測モードの候補とする。なお、ISP事前解析部202は、上記エッジ方向に対応するイントラ予測モードに加えて、DCモード及びPLANARモードを加えた3つのイントラ予測モードを、ISP予測処理におけるイントラ予測モードの候補とするようにしてもよい。
 上記のようなISP予測処理の各パラメータの決定方法によれば、サブCUのエッジ方向ごとの等価比較処理だけで、ISP予測処理の実行可否、候補とするCUの分割方向、及び候補とするイントラ予測モードを決定することが可能となる。これにより、より少ない処理量で、以降のISP予測処理の絞り込みが可能になる。
<第2の実施形態>
 以下、本発明の第2の実施形態について説明する。第2の実施形態では、図3に示されるフローチャートのステップS110において行われるISP予測処理の各パラメータの決定方法として、上述した第1の実施形態とは異なり次のような方法が用いられる。
[パラメータ決定方法]
 ISP事前解析部202は、符号化対象CUが分割された(2つ又は4つの)サブCUのそれぞれのエッジ方向のモード番号の、最大値と最小値とを算出する。ISP事前解析部202は、算出された最大値と最小値との差分値がエンコーダの使用者によって設定可能なパラメータ値よりも小さい場合にのみ、ISP予測処理を実行する。すなわち、ISP事前解析部202は、符号化対象CUのいずれの分割方向(垂直方向及び水平方向の双方)についても、算出された最大値と最小値との差分値がエンコーダ使用者によって設定可能なパラメータ値以上になる場合には、ISP予測処理を実行しない。
 なお、全てのサブCUにおけるエッジ方向のモード番号の最大値と最小値との差が小さいということは、外れた方向を向いたサブCUが存在しないということ、すなわち、サブCU全体が同じ方向を向いている場合であることを意味する。上記のISP事前解析部202の構成は、このような場合においてのみISP予測処理を行わせることを意図した構成である。
 ISP事前解析部202は、上記の差分値がより小さい分割方向(垂直方向又は水平方向)のみについて、ISP予測処理を実行する。または、ISP事前解析部202は、符号化対象CUのいずれの分割方向(垂直方向及び水平方向の双方)についても、上記の差分値がパラメータ値より小さい場合には、いずれの分割方向についてもISP予測処理を実行するようにしてもよい。
 ISP事前解析部202は、ISP予測処理を行う場合、同一の分割方向の全てのサブCUのヒストグラムをマージすることによって、符号化対象CUのヒストグラムを生成する。ISP事前解析部202は、符号化対象CUのヒストグラムにおいて、最大の度数となるモード番号のみを符号化対象CUのエッジ方向とISP予測処理におけるイントラ予測モードの候補とする。または、ISP事前解析部202は、符号化対象CUのヒストグラムにおいて度数が上位であるいくつかのモード番号に対応するイントラ予測モードを、ISP予測処理のイントラ予測モードの候補とするようにしてもよい。
 又は、ISP事前解析部202は、全てのサブCUのエッジ方向におけるそれぞれのモード番号の平均値に対応するイントラ予測モードのみを、ISP予測処理におけるイントラ予測モードの候補とするようにしてもよい。又は、ISP事前解析部202は、全てのサブCUのエッジ方向におけるそれぞれのモード番号のうち、中央値と同一又は中央値に近似する2つのモード番号に対応するイントラ予測モードのみを、ISP予測処理におけるイントラ予測モードの候補とするようにしてもよい。
 なお、上記の、全てのサブCUのエッジ方向におけるそれぞれのモード番号の平均値に対応するイントラ予測モードとは、各サブCUのエッジ方向におけるそれぞれのモード番号との差の総和が最小になるようなイントラ予測モードであることを意味する。
 なお、上述した第2の実施形態に係るイントラ予測モードの決定方法のいずれにおいても、第1の実施形態と同様に、ISP事前解析部202は、上記エッジ方向に対応するイントラ予測モードに加えて、DCモード及びPLANARモードを加えた3つのイントラ予測モードを、ISP予測処理におけるイントラ予測モードの候補とするようにしてもよい。
 上記のようなISP予測処理の各パラメータの決定方法によれば、エンコーダの使用者によって設定可能なパラメータ値に対する値の大小関係によってISP予測処理の実行可否が決定されるため、エンコーダ側のみでISP予測処理の使用率を調整することが可能である。
 なお、上述した第1の実施形態及び第2の実施形態において、ISP予測処理の実行可否、候補とするCUの分割方向、及び候補とするイントラ予測モードが、別々の決定方法によって決定されるような構成であってもよい。例えば、ISP予測処理のを実行可否については、各サブCUのエッジ方向が同一である組が少なくとも1組以上存在するかか否かによって決定され、符号化対象CUのヒストグラムにおいて度数が最大となるモード番号に対応するイントラ予測モードが、候補とするイントラ予測モードとして決定されるような構成であってもよい。
 上述した各実施形態に係る映像符号化装置100は、ISP予測処理において各サブCUの持つ二次元平面的方向性及びエッジ情報が、各サブCUの本来のイントラ予測モード(元となる符号化対象CUのイントラ予測モード)と高い相関を持つことを利用して、サブCU間におけるエッジ情報の相似度を算出する。そして、映像符号化装置100は、算出された相似度を用いてISP予測処理の実行可否と、ISP予測処理の各パラメータとを決定する。これにより、映像符号化装置100は、エンコーダにおけるISP予測処理の処理量を削減させることができる。
 なお、上述した実施形態において、ISP事前解析部202は、エッジ方向とエッジ強度とを算出する構成としたが、エッジ方向のみを算出する構成であってもよい。この場合、例えば、エッジ強度の値をヒストグラムに投票していくのではなく、ヒストグラムには1ずつ固定値として投票していく構成等が考えられる。例えば、ISP事前解析部202は、符号化対象のCTU内に存在する全画素について、それぞれX方向微分強度及びY方向微分強度の両方を取得しておく。そして、ISP事前解析部202は、少なくともエッジ方向の算出は行い、場合に応じてエッジ強度の算出を行うようにしてもよい。
 なお、上述した各実施形態に係る映像符号化装置100は、演算量の限られている映像符号化装置及び映像符号化プログラム等に適用することができる。
 上述した実施形態における映像符号化装置100の一部又は全部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
100・・・映像符号化装置、101・・・イントラ予測処理部、102・・・インター予測処理部、103・・・予測画像生成部、104・・・残差信号生成部、105・・・変換・量子化処理部、106・・・エントロピー符号化部、107・・・逆量子化・逆変換処理部、108・・・復号信号生成部、109・・・ループフィルタ処理部、110・・・参照画像用データ記憶部、201・・・本イントラ予測処理部、202・・・ISP事前解析部、203・・・ISP予測処理部

Claims (9)

  1.  画像をブロックに分割して符号化を行う符号化方法であって、
     符号化対象画像を複数の符号化単位ブロックに分割する分割ステップと、
     前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定ステップと、
     前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化ステップと、
     を有する符号化方法。
  2.  前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     前記符号化ステップは、前記エッジ方向及び前記エッジ強度に基づいて、前記符号化単位ブロックのそれぞれの画素が属する前記サブ符号化単位ブロックをそれぞれ決定する
     請求項1に記載の符号化方法。
  3.  前記判定ステップは、前記符号化単位ブロックが分割された複数の前記サブ符号化単位ブロックのそれぞれの前記エッジ方向のうち同一の前記エッジ方向となる組が1組以上存在する場合に、前記符号化単位ブロックを複数の前記サブ符号化単位ブロックに分割して前記符号化を行うと判定する
     請求項1又は請求項2に記載の符号化方法。
  4.  前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     前記符号化ステップは、前記符号化単位ブロックが分割された複数の前記サブ符号化単位ブロックのそれぞれの前記エッジ方向のうち同一の前記エッジ方向となる組がより多くなるように、前記符号化単位ブロックを複数の前記サブ符号化単位ブロックに分割する
     請求項3に記載の符号化方法。
  5.  前記判定ステップは、前記符号化単位ブロックの分割パターンのうち、前記符号化単位ブロックが分割された複数の前記サブ符号化単位ブロックのそれぞれの前記エッジ方向を示す値の最大値と最小値との差分値が所定値よりも小さい前記分割パターンが少なくとも1つ存在する場合に、前記符号化単位ブロックを複数の前記サブ符号化単位ブロックに分割して前記符号化を行うと判定する
     請求項1又は請求項2に記載の符号化方法。
  6.  前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     前記符号化ステップは、前記差分値が前記所定値よりも小さい前記分割パターンによって前記符号化単位ブロックを複数の前記サブ符号化単位ブロックに分割する
     請求項5に記載の符号化方法。
  7.  前記判定ステップは、前記サブ符号化単位ブロックのそれぞれの画素の前記エッジ方向を示す番号ごとの前記画素の分布を表すヒストグラムを生成し、同一の前記符号化単位ブロックが分割された複数の前記サブ符号化単位ブロックのそれぞれの前記ヒストグラムを合計し、合計された前記ヒストグラムの最大度数及び前記最大度数となる前記番号に対応する前記エッジ方向を、前記符号化単位ブロックの前記エッジ強度及び前記符号化単位ブロックの前記エッジ方向とする
     請求項1から6のうちいずれか一項に記載の符号化方法。
  8.  画像をブロックに分割して符号化を行う符号化装置であって、
     符号化対象画像を複数の符号化単位ブロックに分割する分割部と、
     前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定部と、
     前記判定部により、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化部と、
     を備える符号化装置。
  9.  画像をブロックに分割して符号化を行うコンピュータに、
     符号化対象画像を複数の符号化単位ブロックに分割する分割ステップと、
     前記符号化単位ブロックの画素ごとに得られるエッジのエッジ方向及びエッジ強度に基づいて、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割して前記符号化を行うか否かを判定する判定ステップと、
     前記判定ステップにより、前記符号化単位ブロックを複数のサブ符号化単位ブロックに分割すると判定された場合、
     第一のサブ符号化単位ブロックの符号化において、前記第一のサブ符号化単位ブロックと同一の符号化単位ブロック内の第二のサブ符号化単位ブロックを参照して前記符号化を行う符号化ステップと、
     を実行させるためのプログラム。
PCT/JP2019/048104 2019-12-09 2019-12-09 符号化方法、符号化装置、及びプログラム WO2021117091A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/783,056 US20230022215A1 (en) 2019-12-09 2019-12-09 Encoding method, encoding apparatus and program
JP2021563456A JP7364936B2 (ja) 2019-12-09 2019-12-09 符号化方法、符号化装置、及びプログラム
PCT/JP2019/048104 WO2021117091A1 (ja) 2019-12-09 2019-12-09 符号化方法、符号化装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/048104 WO2021117091A1 (ja) 2019-12-09 2019-12-09 符号化方法、符号化装置、及びプログラム

Publications (1)

Publication Number Publication Date
WO2021117091A1 true WO2021117091A1 (ja) 2021-06-17

Family

ID=76329891

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/048104 WO2021117091A1 (ja) 2019-12-09 2019-12-09 符号化方法、符号化装置、及びプログラム

Country Status (3)

Country Link
US (1) US20230022215A1 (ja)
JP (1) JP7364936B2 (ja)
WO (1) WO2021117091A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023012934A1 (ja) * 2021-08-04 2023-02-09 日本電信電話株式会社 映像符号化装置、映像符号化方法、及び映像符号化プログラム
WO2023223705A1 (ja) * 2022-05-16 2023-11-23 日本電気株式会社 映像符号化装置、映像符号化方法および映像システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006523073A (ja) * 2003-03-03 2006-10-05 エージェンシー・フォア・サイエンス・テクノロジー・アンド・リサーチ 高度動画像符号化におけるイントラ予測のための高速モード決定アルゴリズム
JP2011082801A (ja) * 2009-10-07 2011-04-21 Fujitsu Ltd 画像処理装置および画像処理方法
WO2011080925A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 画像符号化装置および方法
JP2016208094A (ja) * 2015-04-15 2016-12-08 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9014265B1 (en) * 2011-12-29 2015-04-21 Google Inc. Video coding using edge detection and block partitioning for intra prediction
WO2014054267A1 (ja) * 2012-10-01 2014-04-10 パナソニック株式会社 画像符号化装置及び画像符号化方法
JP5856583B2 (ja) * 2013-05-16 2016-02-10 日本電信電話株式会社 イントラ予測方向絞込み方法、イントラ予測方向絞込み装置及びイントラ予測方向絞込みプログラム
US9294764B2 (en) * 2014-01-07 2016-03-22 Vixs Systems, Inc. Video encoder with intra-prediction candidate screening and methods for use therewith
WO2016137089A1 (ko) * 2015-02-27 2016-09-01 엘지전자(주) 비디오 신호의 인코딩/디코딩 방법 및 장치
WO2019188944A1 (en) * 2018-03-30 2019-10-03 Sharp Kabushiki Kaisha Systems and methods for applying deblocking filters to reconstructed video data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006523073A (ja) * 2003-03-03 2006-10-05 エージェンシー・フォア・サイエンス・テクノロジー・アンド・リサーチ 高度動画像符号化におけるイントラ予測のための高速モード決定アルゴリズム
JP2011082801A (ja) * 2009-10-07 2011-04-21 Fujitsu Ltd 画像処理装置および画像処理方法
WO2011080925A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 画像符号化装置および方法
JP2016208094A (ja) * 2015-04-15 2016-12-08 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VAN DER AUWERA, GREET ET AL.: "Description of Core Experiment 3 (CE3): Intra Prediction and Mode Coding", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACAU, CN, 3- 12 OCTOBER 2018, [JVET-L1023-V3], JVET-L1023 (VERSION 3 ), ITU-T, no. L1023-v3, 27 December 2018 (2018-12-27), pages 3 - 4, 15-17 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023012934A1 (ja) * 2021-08-04 2023-02-09 日本電信電話株式会社 映像符号化装置、映像符号化方法、及び映像符号化プログラム
WO2023223705A1 (ja) * 2022-05-16 2023-11-23 日本電気株式会社 映像符号化装置、映像符号化方法および映像システム
JP7392764B2 (ja) 2022-05-16 2023-12-06 日本電気株式会社 映像符号化装置、映像符号化方法および映像システム

Also Published As

Publication number Publication date
US20230022215A1 (en) 2023-01-26
JP7364936B2 (ja) 2023-10-19
JPWO2021117091A1 (ja) 2021-06-17

Similar Documents

Publication Publication Date Title
US10499054B2 (en) System and method for inter-frame predictive compression for point clouds
US11509934B2 (en) Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding
KR101365570B1 (ko) 인트라 예측 부호화, 복호화 방법 및 장치
JP5401009B2 (ja) 映像のイントラ予測符号化、復号化方法及び装置
KR100716999B1 (ko) 영상의 대칭성을 이용한 인트라 예측 방법, 이를 이용한영상의 복호화, 부호화 방법 및 장치
JP4937741B2 (ja) 映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体
KR102164752B1 (ko) 인트라 예측 장치
US8023562B2 (en) Real-time video coding/decoding
EP2213006B1 (en) Method and apparatus for performing motion estimation
KR101376673B1 (ko) 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치
US20160073107A1 (en) Method and apparatus for video encoding/decoding using intra prediction
KR20070038418A (ko) 비디오 신호 역양자화 방법 및 장치
KR20070019485A (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR20130005233A (ko) 영상 정보 부호화 방법 및 복호화 방법
KR20110112224A (ko) 부호화 모드에 대한 정보를 부호화, 복호화하는 방법 및 장치
KR20110045950A (ko) 복수의 프레임을 참조하여 영상을 부호화, 복호화하는 방법 및 장치
US20090016443A1 (en) Inter mode determination method for video encoding
CN111010578B (zh) 一种帧内帧间联合预测的方法、装置以及存储介质
KR20110017720A (ko) 적응적인 루프 필터링을 이용한 비디오의 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US10771815B2 (en) Method and apparatus for processing video signals using coefficient induced prediction
US20210014489A1 (en) Intra prediction device, image encoding device, image decoding device and program
WO2021117091A1 (ja) 符号化方法、符号化装置、及びプログラム
KR101362441B1 (ko) 쿼드트리 기반의 매크로블록을 위한 멀티 레벨의 양자화 파라미터 기록 방법 및 장치
AU2016228181A1 (en) Method for inducing a merge candidate block and device using same
WO2014084674A2 (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19955993

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021563456

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19955993

Country of ref document: EP

Kind code of ref document: A1