WO2020179828A1 - 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム - Google Patents

動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム Download PDF

Info

Publication number
WO2020179828A1
WO2020179828A1 PCT/JP2020/009211 JP2020009211W WO2020179828A1 WO 2020179828 A1 WO2020179828 A1 WO 2020179828A1 JP 2020009211 W JP2020009211 W JP 2020009211W WO 2020179828 A1 WO2020179828 A1 WO 2020179828A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
merge candidate
merge
motion vector
unit
Prior art date
Application number
PCT/JP2020/009211
Other languages
English (en)
French (fr)
Inventor
英樹 竹原
博哉 中村
智 坂爪
福島 茂
徹 熊倉
宏之 倉重
Original Assignee
株式会社Jvcケンウッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Jvcケンウッド filed Critical 株式会社Jvcケンウッド
Publication of WO2020179828A1 publication Critical patent/WO2020179828A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Definitions

  • the present invention relates to an image coding and decoding technique for dividing an image into blocks and performing prediction.
  • the image to be processed is divided into blocks which are a set of a predetermined number of pixels, and processing is performed in block units. Coding efficiency is improved by dividing into appropriate blocks and appropriately setting in-screen prediction (intra prediction) and inter-screen prediction (inter prediction).
  • Patent Document 1 describes a technique for applying an affine transformation at the time of inter-prediction.
  • moving images it is not uncommon for an object to undergo deformation such as enlargement / reduction and rotation, and efficient coding becomes possible by applying the technique of Patent Document 1.
  • Patent Document 1 since the technique of Patent Document 1 involves image conversion, there is a problem that the processing load is large. In view of the above problems, the present invention provides a low-load and efficient coding technique.
  • a merge candidate list construction unit that constructs a merge candidate list including a single-prediction or bi-prediction spatial merge candidate, and one selection merge from the merge candidate list based on a merge index.
  • a merge candidate selection unit that selects candidates, and a bi-prediction conversion unit that converts the selected merge candidate into bi-prediction motion information consisting of L0 prediction and L1 prediction when the selection merge candidate is simple prediction motion information.
  • the processing target block is divided into 4x4 sub-blocks, and the motion information of the L0 prediction of the twin prediction, the movement information of the L1 prediction of the twin prediction, or the movement of the L0 prediction and the L1 prediction of the twin prediction for each subblock. It has a motion information assigning section for assigning any of the information.
  • FIG. 9 is a flowchart illustrating an operation of dividing a tree block. It is a figure which shows a mode that the input image is divided
  • FIG. 6 It is a figure which shows the division
  • FIG. 3 is a block diagram of a detailed configuration of an inter prediction unit 102 in FIG. 1.
  • FIG. It is a block diagram of the detailed structure of the normal prediction motion vector mode derivation unit 301 of FIG.
  • It is a flow chart showing a processing procedure of normal prediction motion vector mode derivation processing.
  • It is a flow chart explaining a processing procedure of normal merge mode derivation processing.
  • FIG. 3 is a block diagram of a detailed configuration of an inter prediction unit 203 in FIG. 2.
  • FIG. It is a block diagram of the detailed structure of the normal prediction motion vector mode derivation unit 401 of FIG. It is a block diagram of the detailed structure of the normal merge mode derivation part 402 of FIG. It is a flowchart for demonstrating the normal prediction motion vector mode derivation process of the normal prediction motion vector mode derivation unit 401 of FIG. It is a figure explaining the history prediction motion vector candidate list initialization / update processing procedure. It is a flowchart of the same element confirmation processing procedure in the history prediction motion vector candidate list initialization / update processing procedure. It is a flowchart of the element shift processing procedure in the history prediction motion vector candidate list initialization / update processing procedure.
  • RefL0Pic reference picture of L0 prediction
  • the encoding/decoding processing target image is equally divided into a predetermined size.
  • This unit is defined as a tree block.
  • the size of the tree block is 128 ⁇ 128 pixels in FIG. 4, the size of the tree block is not limited to this, and any size may be set.
  • the tree blocks to be processed (corresponding to the encoding target in the encoding process and the decoding target in the decoding process) are switched in raster scan order, that is, from left to right and from top to bottom.
  • the inside of each tree block can be further recursively divided.
  • the block to be coded / decoded after the tree block is recursively divided is defined as the coded block. Further, tree blocks and coded blocks are collectively defined as blocks.
  • the size of the tree block may be a fixed value previously agreed between the coding device and the decoding device, or the size of the tree block determined by the coding device may be transmitted to the decoding device.
  • the maximum size of the tree block is 128x128 pixels, and the minimum size of the tree block is 16x16 pixels.
  • the maximum size of the coded block is 64x64 pixels, and the minimum size of the coded block is 4x4 pixels.
  • Intra prediction that performs prediction from the processed image signal of the processing target image
  • inter prediction MODE_INTER
  • the processed image is used for an image, an image signal, a tree block, a block, a coded block, etc. obtained by decoding a signal whose coding is completed in the coding process, and an image, an image signal, which has been decoded in the decoding process. Used for tree blocks, blocks, coded blocks, etc.
  • a mode for identifying the intra prediction (MODE_INTRA) and the inter prediction (MODE_INTER) is defined as a prediction mode (PredMode).
  • the prediction mode (PredMode) has an intra prediction (MODE_INTRA) or an inter prediction (MODE_INTER) as a value.
  • L0 prediction (Pred_L0) is available for P-slices.
  • Pred_L0 L0 prediction
  • Pred_L1 L1 prediction
  • Pred_BI bi-prediction
  • L0 prediction is inter prediction that refers to a reference picture managed by L0
  • L1 prediction is inter prediction that refers to a reference picture managed by L1.
  • Bi-prediction is an inter prediction in which both L0 prediction and L1 prediction are performed and one reference picture managed by each of L0 and L1 is referred to.
  • Information that identifies L0 prediction, L1 prediction, and bi-prediction is defined as an inter-prediction mode. In the subsequent processing, it is premised that processing is performed for each of L0 and L1 for constants and variables with subscript LX attached to the output.
  • the motion vector predictor mode is a mode in which an index for specifying a motion vector predictor, a differential motion vector, an inter prediction mode, and a reference index are transmitted to determine inter prediction information of a block to be processed.
  • the predicted motion vector is a predicted motion vector candidate derived from a processed block adjacent to the processed block or a block belonging to the processed image and located at the same position as or near (near) the processed block, and a predicted motion. Derived from the index to identify the vector.
  • ⁇ Merge mode> In the merge mode, the processed block adjacent to the processed block or the block belonging to the processed image and located at the same position as or near (near) the processed block without transmitting the differential motion vector and the reference index. This mode derives the inter-prediction information of the block to be processed from the inter-prediction information of.
  • the processed block adjacent to the processing target block and the inter-prediction information of the processed block are defined as spatial merge candidates.
  • Blocks that belong to the processed image and are located at the same position as or near (near) the block to be processed, and inter-prediction information derived from the inter-prediction information of that block are defined as time merge candidates.
  • Each merge candidate is registered in the merge candidate list, and the merge index identifies the merge candidate used in the prediction of the block to be processed.
  • FIG. 11 is a diagram illustrating a reference block referred to for deriving inter-prediction information in the predicted motion vector mode and the merge mode.
  • A0, A1, A2, B0, B1, B2, and B3 are processed blocks adjacent to the processing target block.
  • T0 is a block belonging to the processed image, and is a block located at the same position as the processing target block in the processing target image or in the vicinity (neighborhood) thereof.
  • A1 and A2 are blocks located on the left side of the processing target coding block and adjacent to the processing target coding block.
  • B1 and B3 are blocks located above the processing target coding block and adjacent to the processing target coding block.
  • A0, B0, and B2 are blocks located at the lower left, upper right, and upper left of the coded block to be processed, respectively.
  • Affine transform motion compensation is to perform motion compensation by dividing a coded block into sub-blocks of a predetermined unit and individually determining a motion vector for each of the divided sub-blocks.
  • the motion vector of each sub-block is derived from inter prediction information of a processed block adjacent to the processing target block, or a block belonging to the processed image located at the same position as the processing target block or in the vicinity thereof (nearby) 1 Derived based on one or more control points.
  • the size of the sub block is 4 ⁇ 4 pixels, but the size of the sub block is not limited to this, and the motion vector may be derived in pixel units.
  • FIG. 14 shows an example of affine transformation motion compensation when there are two control points.
  • the two control points have two parameters, a horizontal component and a vertical component. Therefore, the affine transformation when there are two control points is called a four-parameter affine transformation.
  • CP1 and CP2 in FIG. 14 are control points.
  • FIG. 15 shows an example of affine transformation motion compensation when there are three control points. In this case, the three control points have two parameters, a horizontal component and a vertical component. Therefore, the affine transformation when there are three control points is called a 6-parameter affine transformation.
  • CP1, CP2, and CP3 in FIG. 15 are control points.
  • Affine transformation motion compensation can be used in both the predicted motion vector mode and the merge mode.
  • the mode in which the affine transformation motion compensation is applied in the predicted motion vector mode is defined as the subblock predicted motion vector mode
  • the mode in which the affine transformation motion compensation is applied in the merge mode is defined as the subblock merge mode.
  • the syntax for expressing the prediction mode of the coding block will be described with reference to FIGS. 12A, 12B, and 13.
  • the pred_mode_flag of FIG. 12A is a flag indicating whether or not inter prediction is performed. If pred_mode_flag is 0, it is an inter-prediction, and if pred_mode_flag is 1, it is an intra-prediction. Intra prediction information intra_pred_mode is sent in the case of intra prediction, and merge_flag is sent in the case of inter prediction. merge_flag is a flag indicating whether to use the merge mode or the motion vector predictor mode.
  • inter_affine_flag 0
  • the flag inter_affine_flag indicating whether or not to apply the subblock predicted motion vector mode is sent.
  • cu_affine_type_flag is sent.
  • cu_affine_type_flag is a flag for determining the number of control points in the sub-block motion vector predictor mode.
  • merge_subblock_flag is a flag indicating whether to apply the sub-block merge mode.
  • POC Picture Order Count
  • POC Picture Order Count
  • FIG. 1 is a block diagram of the image coding device 100 according to the first embodiment.
  • the image coding apparatus 100 includes a block division unit 101, an inter prediction unit 102, an intra prediction unit 103, a decoded image memory 104, a prediction method determination unit 105, a residual generation unit 106, an orthogonal transformation/quantization unit 107.
  • a bit string coding unit 108, an inverse quantization / inverse orthogonal conversion unit 109, a decoded image signal superimposing unit 110, and a coding information storage memory 111 are provided.
  • the block division unit 101 recursively divides the input image to generate a coded block.
  • the block division unit 101 includes a 4-division unit that divides the block to be divided in the horizontal direction and a vertical direction, and a 2-3 division unit that divides the block to be divided into either the horizontal direction or the vertical direction. Including.
  • the block division unit 101 sets the generated coding block as a processing target coding block, and supplies the image signal of the processing target coding block to the inter prediction unit 102, the intra prediction unit 103, and the residual generation unit 106. Further, the block partitioning unit 101 supplies information indicating the determined recursive partitioning structure to the bit string coding unit 108. The detailed operation of the block division unit 101 will be described later.
  • the inter-prediction unit 102 performs inter-prediction of the coded block to be processed.
  • the inter prediction unit 102 derives a plurality of inter prediction information candidates from the inter prediction information stored in the encoded information storage memory 111 and the decoded image signal stored in the decoded image memory 104, A suitable inter-prediction mode is selected from the plurality of derived candidates, and the selected inter-prediction mode and the prediction image signal corresponding to the selected inter-prediction mode are supplied to the prediction method determination unit 105.
  • the detailed configuration and operation of the inter prediction unit 102 will be described later.
  • the intra prediction unit 103 performs intra prediction of the coded block to be processed.
  • the intra prediction unit 103 refers to the decoded image signal stored in the decoded image memory 104 as a reference pixel, and intra prediction based on the coding information such as the intra prediction mode stored in the coding information storage memory 111. Generates a predicted image signal.
  • the intra prediction unit 103 selects a suitable intra prediction mode from a plurality of intra prediction modes, and predicts a selected intra prediction mode and a prediction image signal corresponding to the selected intra prediction mode. It is supplied to the determination unit 105.
  • 10A and 10B show an example of intra prediction.
  • FIG. 10A shows the correspondence between the prediction direction of the intra prediction and the intra prediction mode number.
  • the intra prediction mode 50 generates an intra prediction image by copying reference pixels in the vertical direction.
  • the intra prediction mode 1 is a DC mode, and is a mode in which all the pixel values of the processing target block are set as the average value of the reference pixels.
  • Intra prediction mode 0 is a Planar mode, and is a mode in which a two-dimensional intra prediction image is created from reference pixels in the vertical and horizontal directions.
  • FIG. 10B is an example of generating an intra prediction image in the case of the intra prediction mode 40.
  • the intra prediction unit 103 copies the value of the reference pixel in the direction indicated by the intra prediction mode to each pixel of the processing target block. When the reference pixel in the intra prediction mode is not an integer position, the intra prediction unit 103 determines the reference pixel value by interpolation from the reference pixel values at the surrounding integer positions.
  • the decoded image memory 104 stores the decoded image generated by the decoded image signal superimposing unit 110.
  • the decoded image memory 104 supplies the stored decoded image to the inter prediction unit 102 and the intra prediction unit 103.
  • the prediction method determination unit 105 evaluates each of the intra prediction and the inter prediction by using the coding information, the code amount of the residual, the distortion amount between the predicted image signal and the image signal to be processed, and the like. , Determine the best prediction mode.
  • the prediction method determination unit 105 supplies intra-prediction information such as the intra-prediction mode to the bit string coding unit 108 as coding information.
  • the prediction method determination unit 105 uses the inter-prediction information such as the merge index and information (sub-block merge flag) indicating whether or not the sub-block merge mode is the bit string encoding unit 108 as the encoding information. Supply to.
  • the prediction method determination unit 105 indicates whether or not the inter-prediction mode, the predicted motion vector index, the reference indexes of L0 and L1, the differential motion vector, and the subblock predicted motion vector mode.
  • Inter-prediction information such as (sub-block prediction motion vector flag) is supplied to the bit string coding unit 108 as coding information. Further, the prediction method determination unit 105 supplies the determined coding information to the coding information storage memory 111. The prediction method determination unit 105 supplies the residual generation unit 106 and the prediction image signal to the decoded image signal superimposition unit 110.
  • the residual generation unit 106 generates a residual by subtracting the predicted image signal from the image signal to be processed, and supplies the residual to the orthogonal conversion / quantization unit 107.
  • the orthogonal transformation/quantization unit 107 performs orthogonal transformation and quantization on the residual according to the quantization parameter to generate an orthogonal transformation/quantized residual, and the generated residual is the bit string encoding unit 108. And the inverse quantization/inverse orthogonal transformation unit 109.
  • the bit string coding unit 108 encodes the coding information according to the prediction method determined by the prediction method determination unit 105 for each coding block, in addition to the information in units of sequences, pictures, slices, and coding blocks. Specifically, the bit string coding unit 108 encodes the prediction mode PredMode for each coding block. When the prediction mode is inter-prediction (MODE_INTER), the bit string encoding unit 108 uses a flag for determining whether or not it is in merge mode, a subblock merge flag, a merge index in the case of merge mode, and an inter-prediction mode in the case of not in merge mode.
  • MODE_INTER inter-prediction
  • Encoded information such as a predicted motion vector index, information about a differential motion vector, and a subblock predicted motion vector flag is encoded according to a specified syntax (bit string syntax rule) to generate a first bit string.
  • the prediction mode is intra prediction (MODE_INTRA)
  • the coding information such as the intra prediction mode is encoded according to the specified syntax (syntax rule of the bit string) to generate the first bit string.
  • the bit string coding unit 108 entropy encodes the orthogonal conversion and the quantized residual according to the specified syntax to generate a second bit string.
  • the bit string coding unit 108 multiplexes the first bit string and the second bit string according to the specified syntax, and outputs a bit stream.
  • the inverse quantization/inverse orthogonal transform unit 109 performs inverse quantization and inverse orthogonal transform on the orthogonal transform/quantized residual supplied from the orthogonal transform/quantization unit 107 to calculate the residual, and the calculated residual. The difference is supplied to the decoded image signal superimposing unit 110.
  • the decoded image signal superimposing unit 110 superimposes the prediction image signal according to the determination made by the prediction method determining unit 105 and the residual that has been inversely quantized and inversely orthogonally transformed by the inverse quantization/inverse orthogonal transforming unit 109 to obtain a decoded image. It is generated and stored in the decoded image memory 104.
  • the decoded image signal superimposing unit 110 may store the decoded image in the decoded image memory 104 after performing a filtering process on the decoded image to reduce distortion such as block distortion due to coding.
  • the coded information storage memory 111 stores coded information such as a prediction mode (inter-prediction or intra-prediction) determined by the prediction method determination unit 105.
  • the coding information stored in the coding information storage memory 111 includes inter prediction information such as the determined motion vector, the reference index of the reference lists L0 and L1, the history prediction motion vector candidate list, and the like.
  • the coding information stored in the coding information storage memory 111 includes the merge index and information indicating whether or not the sub-block merge mode is in addition to the above-mentioned information (sub-block merge flag). ) Inter prediction information is included.
  • the coding information stored in the coding information storage memory 111 includes the inter prediction mode, the predicted motion vector index, the differential motion vector, and the subblock prediction in addition to the above-mentioned information.
  • Inter-prediction information such as information indicating whether or not the motion vector mode is set (subblock prediction motion vector flag) is included.
  • the coding information stored in the coding information storage memory 111 includes intra prediction information such as the determined intra prediction mode.
  • FIG. 2 is a block showing a configuration of an image decoding device according to an embodiment of the present invention corresponding to the image coding device of FIG.
  • An image decoding apparatus includes a bit string decoding unit 201, a block division unit 202, an inter prediction unit 203, an intra prediction unit 204, a coded information storage memory 205, an inverse quantization/inverse orthogonal transform unit 206, and a decoded image signal convolution.
  • a unit 207 and a decoded image memory 208 are provided.
  • the decoding process of the image decoding device of FIG. 2 corresponds to the decoding process provided inside the image coding device of FIG. 1, the coding information storage memory 205 of FIG. 2 and the inverse quantization / reverse
  • the configurations of the orthogonal transformation unit 206, the decoded image signal superimposing unit 207, and the decoded image memory 208 are as follows: the coding information storage memory 111, the inverse quantization/inverse orthogonal transformation unit 109, and the decoded image signal of the image encoding device in FIG. It has a function corresponding to each configuration of the superimposing unit 110 and the decoded image memory 104.
  • the bit stream supplied to the bit string decoding unit 201 is separated according to the specified syntax rules.
  • the bit string decoding unit 201 decodes the separated first bit string to obtain sequence, picture, slice, coded block unit information, and coded block unit coding information. Specifically, the bit string decoding unit 201 decodes the prediction mode PredMode for determining whether to perform inter-prediction (MODE_INTER) or intra-prediction (MODE_INTRA) for each coded block.
  • the prediction mode is inter-prediction (MODE_INTER)
  • the bit string decoding unit 201 has a flag for determining whether or not it is in merge mode, a merge index in case of merge mode, a subblock merge flag, and inter-prediction in the case of predicted motion vector mode.
  • the coding information (inter prediction information) regarding the mode, the motion vector predictor index, the difference motion vector, the sub-block motion vector predictor flag, etc. is decoded according to the prescribed syntax, and the coding information (inter prediction information) is inter-prediction unit 203, And to the encoded information storage memory 205 via the block division unit 202.
  • the prediction mode is intra prediction (MODE_INTRA)
  • the coding information (intra prediction information) such as the intra prediction mode is decoded according to the specified syntax
  • the coding information (intra prediction information) is decoded in the inter prediction unit 203 or the intra prediction unit. It is supplied to the coded information storage memory 205 via the 204 and the block division unit 202.
  • the bit string decoding unit 201 decodes the separated second bit string to calculate an orthogonally transformed/quantized residual, and supplies the orthogonally transformed/quantized residual to the inverse quantization/inverse orthogonal transforming unit 206. To do.
  • the inter-prediction unit 203 describes the code of the already decoded image signal stored in the coding information storage memory 205 when the prediction mode PredMode of the coded block to be processed is the inter-prediction (MODE_INTER) and the prediction motion vector mode.
  • MODE_INTER inter-prediction
  • a plurality of predicted motion vector candidates are derived using the conversion information, and the derived candidates for the plurality of predicted motion vectors are registered in the predicted motion vector candidate list described later.
  • the inter prediction unit 203 selects a motion vector predictor according to the motion vector predictor index decoded and supplied by the bit string decoding unit 201 from among the plurality of motion vector predictor candidates registered in the motion vector predictor candidate list, A motion vector is calculated from the differential motion vector decoded by the bit string decoding unit 201 and the selected predicted motion vector, and the calculated motion vector is stored in the coding information storage memory 205 together with other coding information.
  • the coding information of the coding block supplied and stored here is the flags predFlagL0 [xP] [yP], predFlagL1 [xP] [yP], which indicate whether to use the prediction modes PredMode, L0 prediction, and L1 prediction.
  • xP and yP are indexes indicating the positions of the upper left pixels of the coding block in the picture.
  • PredMode is inter-prediction (MODE_INTER) and the inter-prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 indicating whether to use L0 prediction is 1, and the flag predFlagL1 indicating whether to use L1 prediction is used. Is 0.
  • the flag predFlagL0 indicating whether or not to use the L0 prediction is 0, and the flag predFlag L1 indicating whether or not to use the L1 prediction is 1.
  • the flag predFlagL0 indicating whether or not to use the L0 prediction and the flag predFlag L1 indicating whether or not to use the L1 prediction are both 1.
  • the prediction mode PredMode of the coded block to be processed is inter-prediction (MODE_INTER) and the merge mode is set, merge candidates are derived.
  • a plurality of merge candidates are derived, registered in the merge candidate list described later, and registered in the merge candidate list.
  • predFlagL0[xP][yP] predFlagL1[xP][yP]
  • L0, L1 reference index refIdxL0[xP][yP] refIdxL1[xP][yP]
  • L0, L1 motion vector mvL0[xP][yP ], MvL1 [xP] [yP] and other inter-prediction information is stored in the coded information storage memory 205.
  • xP and yP are indexes indicating the position of the upper left pixel of the coded block in the picture. The detailed configuration and operation of the inter prediction unit 203 will be described later.
  • the intra prediction unit 204 performs intra prediction when the prediction mode PredMode of the coded block to be processed is intra prediction (MODE_INTRA).
  • the coding information decoded by the bit string decoding unit 201 includes an intra prediction mode.
  • the intra prediction unit 204 generates a prediction image signal by intra prediction from the decoded image signal stored in the decoded image memory 208 according to the intra prediction mode included in the coding information decoded by the bit string decoding unit 201. Then, the generated predicted image signal is supplied to the decoded image signal superimposing unit 207. Since the intra prediction unit 204 corresponds to the intra prediction unit 103 of the image coding device 100, the same processing as that of the intra prediction unit 103 is performed.
  • the inverse quantization / anti-orthogonal conversion unit 206 performs anti-orthogonal conversion and anti-quantization on the orthogonal conversion / quantized residual decoded by the bit string decoding unit 201, and is inversely orthogonal conversion / anti-quantization. Get the residuals.
  • the decoded image signal superimposing unit 207, the predicted image signal inter-predicted by the inter prediction unit 203, or the predicted image signal intra-predicted by the intra prediction unit 204, and the inverse orthogonal transform/inverse orthogonal transform unit 206 perform the inverse orthogonal transform/inverse orthogonal transform.
  • the decoded image signal is decoded by superimposing the inverse quantized residual, and the decoded image signal is stored in the decoded image memory 208.
  • the decoded image signal superimposing unit 207 may perform a filtering process on the decoded image to reduce block distortion due to coding and then store in the decoded image memory 208. ..
  • FIG. 3 is a flowchart showing an operation of dividing an image into tree blocks and further dividing each tree block.
  • the input image is divided into tree blocks of a predetermined size (step S1001).
  • Each tree block is scanned in a predetermined order, that is, in the order of raster scan (step S1002), and the inside of the tree block to be processed is divided (step S1003).
  • FIG. 7 is a flowchart showing the detailed operation of the division process in step S1003. First, it is determined whether or not to divide the block to be processed into four (step S1101).
  • the processing target block is divided into four (step S1102).
  • Each block obtained by dividing the block to be processed is scanned in the Z scan order, that is, in the order of upper left, upper right, lower left, and lower right (step S1103).
  • FIG. 5 is an example of the Z scan order
  • FIG. 601 of FIG. 6A is an example of dividing the processing target block into four. Numbers 0 to 3 of 601 in FIG. 6A indicate the order of processing.
  • the division process of FIG. 7 is recursively executed for each block divided in step S1101 (step S1104).
  • step S1105) If it is determined that the block to be processed is not divided into four, 2-3 division is performed (step S1105).
  • FIG. 8 is a flowchart showing the detailed operation of the 2-3 division process of step S1105. First, it is determined whether or not the block to be processed is divided into 2-3, that is, whether or not to perform either 2-division or 3-division (step S1201).
  • step S1211 If it is not determined that the block to be processed is divided into 2-3, that is, if it is determined not to be divided, the division is terminated (step S1211). That is, the block divided by the recursive division process is not further recursively divided.
  • step S1202 it is determined whether or not to further divide the block to be processed into two.
  • step S1203 it is determined whether or not the processing target block is divided vertically (in the vertical direction) (step S1203), and based on the result, the processing target block is moved in the vertical direction (vertical direction). It is divided into two (step S1204) or the block to be processed is divided into two left and right (horizontal direction) (step S1205).
  • step S1204 the processing target block is divided into upper and lower (vertical) two divisions as shown in 602 of FIG. 6B, and as a result of step S1205, the processing target block is left and right (horizontal) as shown in 604 of FIG. 6D.
  • Direction divided into two.
  • step S1202 When it is not determined in step S1202 that the block to be processed is divided into two, that is, when it is determined to be divided into three, it is determined whether or not the block to be processed is divided into upper, middle, and lower (vertical direction) (step S1206). ), based on the result, the block to be processed is divided into upper, middle, lower (vertical direction) into three (step S1207), or the block to be processed is divided into left, middle, right (horizontal direction) into three (step S1208).
  • step S1207 the processing target block is divided into upper, middle and lower (vertical direction) three divisions as shown in 603 of FIG. 6C, and as a result of step S1208, the processing target block is left as shown in 605 of FIG. 6E. It is divided into three parts on the right (horizontal direction).
  • step S1209 After executing any one of step S1204, step S1205, step S1207, and step S1208, each block obtained by dividing the block to be processed is scanned in the order of left to right and top to bottom (step S1209).
  • the numbers 0 to 2 of 602 to 605 in FIGS. 6B to 6E indicate the order of processing.
  • the 2-3 division process of FIG. 8 is recursively executed (step S1210).
  • the necessity of division may be limited depending on the number of divisions, the size of the block to be processed, and the like.
  • the information that limits the necessity of division may be realized in a configuration that does not transmit information by making an agreement in advance between the coding device and the decoding device, or the coding device limits the necessity of division. It may be realized by a configuration in which the information to be determined is recorded and recorded in a bit string and transmitted to the decoding device.
  • each block after division is called the child block.
  • the block division unit 202 divides the tree block by the same processing procedure as the block division unit 101 of the image coding apparatus 100.
  • the block division unit 101 of the image coding device 100 applies an optimization method such as estimation of the optimum shape by image recognition and optimization of the distortion rate to determine the optimum block division shape, whereas the image decoding device
  • the block division unit 202 in 200 is different in that the block division shape is determined by decoding the block division information recorded in the bit string.
  • FIG. 9 shows the syntax (syntax rule of bit string) related to the block division of the first embodiment.
  • coding_quadtree () represents the syntax of the block quadtree processing.
  • multi_type_tree() represents the syntax for block division into two or three divisions.
  • mtt_split_vertical which is a flag indicating whether to divide vertically or horizontally
  • mtt_split_binary which is a flag determining whether to divide into two or three
  • mtt_split_vertical 1 indicates splitting in the vertical direction
  • mtt_split_vertical 0 indicates splitting in the horizontal direction
  • mtt_split_binary 1 indicates that it is divided into two
  • mtt_split_binary 0 indicates that it is divided into three.
  • the inter prediction method according to the embodiment is implemented in the inter prediction unit 102 of the image coding apparatus of FIG. 1 and the inter prediction unit 203 of the image decoding apparatus of FIG.
  • the inter prediction method according to the embodiment will be described with reference to the drawings.
  • the inter-prediction method is performed in either coding or decoding processing in units of coded blocks.
  • FIG. 16 is a diagram showing a detailed configuration of the inter-prediction unit 102 of the image coding apparatus of FIG.
  • the normal motion vector predictor mode deriving unit 301 derives a plurality of normal motion vector predictor candidates, selects a motion vector predictor, and calculates a difference motion vector between the selected motion vector predictor and the detected motion vector.
  • the detected inter prediction mode, reference index, motion vector, and calculated difference motion vector serve as inter prediction information in the normal motion vector predictor mode.
  • This inter-prediction information is supplied to the inter-prediction mode determination unit 305.
  • the detailed configuration and processing of the normal prediction motion vector mode derivation unit 301 will be described later.
  • the normal merge mode derivation unit 302 derives a plurality of normal merge candidates, selects the normal merge candidates, and obtains the inter-prediction information of the normal merge mode. This inter prediction information is supplied to the inter prediction mode determination unit 305. The detailed configuration and processing of the normal merge mode derivation unit 302 will be described later.
  • the sub-block prediction motion vector mode derivation unit 303 derives a plurality of sub-block prediction motion vector candidates, selects a sub-block prediction motion vector, and selects a difference motion vector between the selected sub-block prediction motion vector and the detected motion vector. calculate.
  • the detected inter-prediction mode, reference index, motion vector, and calculated difference motion vector become the inter-prediction information of the sub-block prediction motion vector mode. This inter prediction information is supplied to the inter prediction mode determination unit 305.
  • the sub-block merge mode derivation unit 304 derives a plurality of sub-block merge candidates, selects the sub-block merge candidates, and obtains the inter-prediction information of the sub-block merge mode. This inter prediction information is supplied to the inter prediction mode determination unit 305.
  • the inter prediction mode determination unit 305 is based on the inter prediction information supplied from the normal motion vector predictor mode derivation unit 301, the normal merge mode derivation unit 302, the sub block motion vector predictor mode derivation unit 303, and the sub block merge mode derivation unit 304. , Judge inter-prediction information.
  • the inter prediction mode determination unit 305 supplies inter prediction information according to the determination result to the motion compensation prediction unit 306.
  • the motion compensation prediction unit 306 performs inter-prediction for the reference image signal stored in the decoded image memory 104 based on the determined inter-prediction information. The detailed configuration and processing of the motion compensation prediction unit 306 will be described later.
  • FIG. 22 is a diagram showing a detailed configuration of the inter-prediction unit 203 of the image decoding apparatus of FIG.
  • the normal predicted motion vector mode derivation unit 401 derives a plurality of normal predicted motion vector candidates, selects a predicted motion vector, calculates an addition value of the selected predicted motion vector and the decoded differential motion vector, and obtains the motion vector. To do.
  • the decoded inter prediction mode, reference index, and motion vector serve as inter prediction information in the normal motion vector predictor mode. This inter-prediction information is supplied to the motion compensation prediction unit 406 via the switch 408. The detailed configuration and processing of the normal motion vector predictor mode deriving unit 401 will be described later.
  • the normal merge mode derivation unit 402 derives a plurality of normal merge candidates, selects the normal merge candidates, and obtains the inter-prediction information of the normal merge mode. This inter-prediction information is supplied to the motion compensation prediction unit 406 via the switch 408. The detailed configuration and processing of the normal merge mode derivation unit 402 will be described later.
  • the sub-block prediction motion vector mode derivation unit 403 derives a plurality of sub-block prediction motion vector candidates, selects a sub-block prediction motion vector, and calculates the added value of the selected sub-block prediction motion vector and the decoded difference motion vector. Calculate and use as a motion vector.
  • the decoded inter prediction mode, reference index, and motion vector serve as inter prediction information in the sub-block prediction motion vector mode. This inter prediction information is supplied to the motion compensation prediction unit 406 via the switch 408.
  • the sub-block merge mode derivation unit 404 derives a plurality of sub-block merge candidates, selects the sub-block merge candidates, and obtains the inter-prediction information of the sub-block merge mode. This inter-prediction information is supplied to the motion compensation prediction unit 406 via the switch 408.
  • the motion compensation prediction unit 406 performs inter-prediction for the reference image signal stored in the decoded image memory 208 based on the determined inter-prediction information.
  • the detailed configuration and processing of the motion compensation prediction unit 406 are the same as those of the motion compensation prediction unit 306 on the coding side.
  • the normal motion vector predictor mode derivation unit 301 in FIG. 17 includes a spatial motion vector predictor candidate derivation unit 321, a temporal motion vector predictor candidate derivation unit 322, a history motion vector predictor candidate derivation unit 323, a motion vector predictor candidate supplementation unit 325, and a normal motion. It includes a vector detection unit 326, a predicted motion vector candidate selection unit 327, and a motion vector subtraction unit 328.
  • the normal motion vector predictor mode derivation unit 401 in FIG. 23 includes a spatial motion vector predictor candidate derivation unit 421, a temporal motion vector predictor candidate derivation unit 422, a history motion vector predictor candidate derivation unit 423, a motion vector predictor candidate replenishment unit 425, and a motion predictive motion.
  • a vector candidate selection unit 426 and a motion vector addition unit 427 are included.
  • FIG. 19 is a flowchart showing the procedure of the normal motion vector predictor mode deriving processing by the normal motion vector mode deriving section 301 on the encoding side
  • FIG. 25 is the normal motion vector predictor mode deriving processing by the normal motion vector mode deriving section 401 on the decoding side. It is a flowchart which shows a procedure.
  • Normal prediction motion vector mode derivation unit Explanation on the coding side> The procedure for deriving the normal predicted motion vector mode on the coding side will be described with reference to FIG. In the description of the processing procedure of FIG. 19, the word “normal” shown in FIG. 19 may be omitted.
  • the normal motion vector detection unit 326 detects the normal motion vector for each inter-prediction mode and reference index (step S100 in FIG. 19).
  • the difference motion vector of the motion vector used in the inter-prediction of the normal prediction motion vector mode is calculated for each of L0 and L1, respectively (steps S101 to S106 in FIG. 19).
  • the prediction motion vector candidate list mvpListL0 of L0 is calculated and the prediction motion vector mvpL0 is selected. Then, the differential motion vector mvdL0 of the motion vector mvL0 of L0 is calculated.
  • the inter-prediction mode of the block to be processed is L1 prediction (Pred_L1)
  • the prediction motion vector candidate list mvpListL1 of L1 is calculated, the prediction motion vector mvpL1 is selected, and the difference motion vector mvdL1 of the motion vector mvL1 of L1 is calculated. ..
  • the prediction motion vector candidate list mvpList L0 of L0 is calculated, the prediction motion vector mvpL0 of L0 is selected, and L0.
  • the motion vector mvL0 of the motion vector mvL0 is calculated, the predicted motion vector candidate list mvpListL1 of L1 is calculated, the predicted motion vector mvpL1 of L1 is calculated, and the differential motion vector mvdL1 of the motion vector mvL1 of L1 is calculated. To do.
  • L0 and L1 are represented as common LX.
  • X of LX is 0, and in the process of calculating the differential motion vector of L1, X of LX is 1.
  • the other list is represented as LY.
  • the LX predicted motion vector candidates are calculated to construct the LX predicted motion vector candidate list mvpListLX (step S103 in FIG. 19).
  • the spatial motion vector predictor candidate deriving unit 321, the temporal motion vector predictor candidate deriving unit 322, the history motion vector predictor candidate deriving unit 323, and the motion vector predictor candidate replenishing unit 325 include a plurality of motion predictive motions. Derivation of vector candidates and construction of predicted motion vector candidate list mvpListLX. The detailed processing procedure of step S103 of FIG. 19 will be described later with reference to the flowchart of FIG.
  • the motion vector predictor candidate selection unit 327 selects the motion vector predictor mvpLX of LX from the motion vector predictor vector list of LX mvpListLX (step S104 in FIG. 19).
  • the predicted motion vector candidate list mvpListLX one element (the i-th element counting from 0) is represented as mvpListLX [i].
  • Each difference motion vector that is the difference between the motion vector mvLX and each motion vector predictor candidate mvpListLX[i] stored in the motion vector predictor candidate list mvpListLX is calculated.
  • the code amount when these differential motion vectors are encoded is calculated for each element (predicted motion vector candidate) of the predicted motion vector candidate list mvpListLX. Then, among the elements registered in the predicted motion vector candidate list mvpListLX, the predicted motion vector candidate mvpListLX [i] having the minimum sign amount for each candidate of the predicted motion vector is selected as the predicted motion vector mvpLX, and the candidate mvpListLX [i] is selected. Get index i.
  • the motion vector predictor represented by a smaller number i in the motion vector predictor candidate list mvpListLX select the candidate mvpListLX [i] as the optimal predicted motion vector mvpLX and get its index i.
  • the difference motion vector mvdLX of LX is calculated as (step S105 in FIG. 19).
  • the prediction motion vector candidate list mvpListL0 of L0 is calculated, and the prediction motion is calculated.
  • the vector mvpL0 is selected and the motion vector mvL0 of L0 is calculated.
  • the inter prediction mode of the block to be processed is L1 prediction (Pred_L1)
  • the motion vector predictor candidate list mvpListL1 for L1 is calculated, the motion vector predictor mvpL1 is selected, and the motion vector mvL1 for L1 is calculated.
  • the motion vector predictor candidate list mvpListL0 of L0 is calculated, and the motion vector predictor mvpL0 of L0 is selected, and L0 is calculated.
  • the motion vector mvL0 of L1 is calculated, the predicted motion vector candidate list mvpList L1 of L1 is calculated, the predicted motion vector mvpL1 of L1 is calculated, and the motion vector mvL1 of L1 is calculated respectively.
  • L0 and L1 are represented as a common LX.
  • LX represents an inter-prediction mode used for inter-prediction of the coded block to be processed.
  • X is 0 in the process of calculating the motion vector of L0, and X is 1 in the process of calculating the motion vector of L1.
  • the other reference list is represented as LY.
  • the LX predicted motion vector candidates are calculated and the LX predicted motion vector candidate list mvpListLX is constructed (step S203 in FIG. 25).
  • the spatial motion vector predictor candidate deriving unit 421, the temporal motion vector predictor candidate deriving unit 422, the history motion vector predictor candidate deriving unit 423, and the motion vector predictor candidate supplementing unit 425 include a plurality of motion predictive motions. Calculate vector candidates and build a predicted motion vector candidate list mvpListLX. The detailed processing procedure of step S203 of FIG. 25 will be described later using the flowchart of FIG.
  • the predicted motion vector candidate selection unit 426 selects the predicted motion vector candidate mvpListLX [mvpIdxLX] corresponding to the index mvpIdxLX of the predicted motion vector decoded and supplied by the bit string decoding unit 201 from the predicted motion vector candidate list mvpListLX. It is taken out as the predicted motion vector mvpLX (step S204 in FIG. 25).
  • the motion vector mvLX of LX is calculated as (step S205 in FIG. 25).
  • FIG. 20 shows a normal predicted motion vector mode derivation having a function common to the normal predicted motion vector mode derivation unit 301 of the image coding device and the normal predicted motion vector mode derivation unit 401 of the image decoding device according to the embodiment of the present invention. It is a flowchart which shows the processing procedure of processing.
  • the normal prediction motion vector mode derivation unit 301 and the normal prediction motion vector mode derivation unit 401 include a prediction motion vector candidate list mvpListLX.
  • the motion vector predictor candidate list mvpListLX has a list structure, and is provided with a storage area for storing, as elements, a motion vector predictor vector index indicating a location in the motion vector predictor candidate list and a motion vector predictor candidate corresponding to the index. ..
  • the number of the predicted motion vector index starts from 0, and the predicted motion vector candidate is stored in the storage area of the predicted motion vector candidate list mvpListLX.
  • the predicted motion vector candidate list mvpListLX can register at least two predicted motion vector candidates (inter-prediction information). Further, 0 is set in the variable numCurrMvpCand indicating the number of predicted motion vector candidates registered in the predicted motion vector candidate list mvpListLX.
  • Spatial prediction motion vector candidate derivation units 321 and 421 derive prediction motion vector candidates from blocks adjacent to the left side.
  • the inter prediction information of the block (A0 or A1 in FIG. 11) adjacent to the left side that is, a flag indicating whether or not the motion vector predictor candidate can be used, the motion vector, the reference index, etc. are referred to
  • the vector mvLXA is derived, and the derived mvLXA is added to the predicted motion vector candidate list mvpListLX (step S301 in FIG. 20). Note that X is 0 for L0 prediction and X is 1 for L1 prediction (the same applies hereinafter).
  • the spatial prediction motion vector candidate derivation units 321 and 421 derive the prediction motion vector candidates from the adjacent blocks on the upper side.
  • the inter prediction information of the block (B0, B1, or B2 in FIG. 11) adjacent to the upper side that is, a flag indicating whether or not the motion vector predictor candidate can be used, and the motion vector and the reference index are referred to.
  • the predicted motion vector mvLXB is derived, and if the derived mvLXA and mvLXB are not equal, mvLXB is added to the predicted motion vector candidate list mvpListLX (step S302 in FIG. 20). The processing of steps S301 and S302 in FIG.
  • the time prediction motion vector candidate derivation units 322 and 422 derive candidates for the prediction motion vector from the block in the picture whose time is different from the current processing target picture.
  • the flag availableFlagLXCol indicating whether the predicted motion vector candidates of the coded blocks of the pictures at different times are available, and the motion vector mvLXCol, the reference index refIdxCol, and the reference list listCol are derived, and the mvLXCol is used as the predicted motion vector candidate. It is added to the list mvpListLX (step S303 in FIG. 20).
  • time prediction motion vector candidate derivation unit 322 and 422 can be omitted in units of sequence (SPS), picture (PPS), or slice.
  • the historical motion vector predictor candidate derivation units 323 and 423 add the historical motion vector predictor candidates registered in the historical motion vector predictor candidate list HmvpCandList to the motion vector predictor candidate list mvpListLX. (Step S304 in FIG. 20). The details of the registration processing procedure in step S304 will be described later with reference to the flowchart of FIG.
  • the predicted motion vector candidate supplementing units 325 and 425 add the predicted motion vector candidates having a predetermined value such as (0,0) until the predicted motion vector candidate list mvpListLX is satisfied (S305 in FIG. 20).
  • the normal merge mode derivation unit 302 of FIG. 18 includes a spatial merge candidate derivation unit 341, a time merge candidate derivation unit 342, an average merge candidate derivation unit 344, a history merge candidate derivation unit 345, a merge candidate replenishment unit 346, and a merge candidate selection unit 347. including.
  • the normal merge mode derivation unit 402 of FIG. 24 includes a spatial merge candidate derivation unit 441, a time merge candidate derivation unit 442, an average merge candidate derivation unit 444, a history merge candidate derivation unit 445, a merge candidate replenishment unit 446, and a merge candidate selection unit 447. including.
  • FIG. 21 illustrates a procedure of a normal merge mode derivation process having a common function with the normal merge mode derivation unit 302 of the image encoding device and the normal merge mode derivation unit 402 of the image decoding device according to the embodiment of the present invention. It is a flowchart.
  • the normal merge mode derivation unit 302 and the normal merge mode derivation unit 402 include a merge candidate list mergeCandList.
  • Merge candidate list The mergeCandList has a list structure, and has a merge index indicating the location inside the merge candidate list and a storage area for storing the merge candidates corresponding to the indexes as elements. The number of the merge index starts from 0, and the merge candidate is stored in the storage area of the merge candidate list mergeCandList.
  • the merge candidate of the merge index i registered in the merge candidate list mergeCandList is represented by mergeCandList [i].
  • the merge candidate list mergeCandList can register at least 6 merge candidates (inter-prediction information). Further, 0 is set in the variable numCurrMergeCand indicating the number of merge candidates registered in the merge candidate list mergeCandList.
  • the processing target block is obtained from the coding information stored in the coding information storage memory 111 of the image coding device or the coding information storage memory 205 of the image decoding device.
  • Spatial merge candidates from blocks adjacent to each other (B1, A1, B0, A0, B2 in FIG. 11) are derived in the order of B1, A1, B0, A0, B2, and the derived spatial merge candidates are merge candidates. It is registered in the list mergeCandList (step S401 in FIG. 21).
  • N indicating either B1, A1, B0, A0, B2 or the time merge candidate Col is defined.
  • Flags availableFlagN indicating whether the inter-prediction information of block N can be used as a spatial merge candidate, reference index refIdxL0N of L0 of spatial merge candidate N, and reference index refIdxL1N of L1 and L0 prediction indicating whether L0 prediction is performed.
  • the motion vectors mvL0N of the L1 prediction flags predFlag L1N and L0 indicating whether or not the flags predFlag L0N and L1 prediction are performed, and the motion vector mvL1N of L1 are derived.
  • the merge candidate is derived without referring to the inter-prediction information of the block included in the coded block to be processed
  • the inter-prediction information of the block included in the coded block to be processed is derived.
  • a spatial merge candidate using is not derived.
  • the time merge candidate derivation unit 342 and the time merge candidate derivation unit 442 derive the time merge candidates from the pictures at different times and register the derived time merge candidates in the merge candidate list mergeCandList (FIG. 21).
  • Step S402 Flags availableFlagCol indicating whether time merge candidates are available, L0 prediction flags predFlagL0Col indicating whether L0 prediction of time merge candidates is performed, and L1 prediction flags predFlagL1Col indicating whether L1 prediction is performed, and L0.
  • the motion vector mvL0Col of L1 and the motion vector mvL1Col of L1 are derived.
  • time merge candidate derivation unit 342 and the time merge candidate derivation unit 442 can be omitted in units of sequence (SPS), picture (PPS), or slice.
  • the history merge candidate derivation unit 345 and the history merge candidate derivation unit 445 register the history prediction motion vector candidates registered in the history prediction motion vector candidate list HmvpCandList in the merge candidate list mergeCandList (step S403 in FIG. 21). .. If the number of merge candidates numCurrMergeCand registered in the merge candidate list mergeCandList is smaller than the maximum number of merge candidates MaxNumMergeCand, the number of merge candidates numCurrMergeCand registered in the merge candidate list mergeCandList is the maximum number of merge candidates MaxNumMergeCand as the upper limit. History merge candidates are derived and registered in the merge candidate list mergeCandList.
  • the average merge candidate derivation unit 344 and the average merge candidate derivation unit 444 derive the average merge candidate from the merge candidate list mergeCandList and add the derived average merge candidate to the merge candidate list mergeCandList (step of FIG. 21). S404). If the number of merge candidates numCurrMergeCand registered in the merge candidate list mergeCandList is smaller than the maximum number of merge candidates MaxNumMergeCand, the number of merge candidates numCurrMergeCand registered in the merge candidate list mergeCandList is the maximum number of merge candidates MaxNumMergeCand as the upper limit.
  • the average merge candidate is derived and registered in the merge candidate list mergeCandList.
  • the average merge candidate has a motion vector obtained by averaging the motion vectors of the first merge candidate and the second merge candidate registered in the merge candidate list mergeCandList for each L0 prediction and L1 prediction. It is a good merge candidate.
  • the merge candidate replenishment unit 346 and the merge candidate replenishment unit 446 if the number of merge candidates numCurrMergeCand registered in the merge candidate list mergeCandList is smaller than the maximum number of merge candidates MaxNumMergeCand, they are registered in the merge candidate list mergeCandList.
  • the existing number of merge candidates numCurrMergeCand derives additional merge candidates up to the maximum number of merge candidates MaxNumMergeCand and registers them in the merge candidate list mergeCandList (step S405 in FIG. 21).
  • a merge candidate in which the motion vector has a value of (0, 0) and the prediction mode is L0 prediction (Pred_L0) is added.
  • a merge candidate whose motion vector has a value of (0,0) and whose prediction mode is bi-prediction (Pred_BI) is added.
  • the reference index when adding a merge candidate is different from the reference index already added.
  • the merge candidate selection unit 347 and the merge candidate selection unit 447 select merge candidates from the merge candidates registered in the merge candidate list mergeCandList.
  • the merge candidate selection unit 347 on the coding side selects the merge candidate by calculating the code amount and the strain amount, and sets the merge index indicating the selected merge candidate and the inter-prediction information of the merge candidate in the inter-prediction mode determination unit. It is supplied to the motion compensation prediction unit 306 via 305.
  • the merge candidate selection unit 447 on the decoding side selects a merge candidate based on the decoded merge index and supplies the selected merge candidate to the motion compensation prediction unit 406.
  • FIG. 26 is a flowchart for explaining the procedure of initialization/update process of the history motion vector predictor candidate list.
  • history motion vector predictor candidate list HmvpCandList is updated in the coding information storage memory 111 and the coding information storage memory 205.
  • a history motion vector predictor candidate list update unit may be installed in the inter prediction unit 102 and the inter prediction unit 203 to update the history motion vector predictor candidate list HmvpCandList.
  • the history prediction motion vector candidate list HmvpCandList is set when the normal prediction motion vector mode or the normal merge mode is selected by the prediction method determination unit 105.
  • the decoding side updates the history motion vector predictor candidate list HmvpCandList on the decoding side when the prediction information decoded by the bit string decoding unit 201 is the normal motion vector predictor mode or the normal merge mode.
  • the inter-prediction information used when performing inter-prediction in the normal prediction motion vector mode or the normal merge mode is registered in the history prediction motion vector candidate list HmvpCandList as the inter-prediction information candidate hMvpCand.
  • the inter-prediction information candidate hMvpCand includes the reference index refIdxL0 of L0 and the reference index refIdxL1 of L1, the L0 prediction flag predFlag L0 indicating whether L0 prediction is performed, and the L1 prediction flag predFlag L1 indicating whether L1 prediction is performed.
  • the motion vector mvL0 of L0 and the motion vector mvL1 of L1 are included.
  • Inter-prediction information candidates among the elements that is, inter-prediction information registered in the history prediction motion vector candidate list HmvpCandList provided in the coding information storage memory 111 on the coding side and the coding information storage memory 205 on the decoding side. If the inter-prediction information with the same value as hMvpCand exists, delete the element from the historical prediction motion vector candidate list HmvpCandList. On the other hand, if there is no inter-prediction information with the same value as the inter-prediction information candidate hMvpCand, the first element of the historical prediction motion vector candidate list HmvpCandList is deleted, and the inter-prediction information candidate is at the end of the historical prediction motion vector candidate list HmvpCandList. Add hMvpCand.
  • the number of elements of the history motion vector predictor candidate list HmvpCandList provided in the coding information storage memory 111 on the coding side and the coding information storage memory 205 on the decoding side of the present invention is set to six.
  • the history prediction motion vector candidate list HmvpCandList for each slice is initialized (step S2101 in FIG. 26). Empty all elements of the history prediction motion vector candidate list HmvpCandList at the beginning of the slice, and the number of history prediction motion vector candidates registered in the history prediction motion vector candidate list HmvpCandList (current number of candidates) The value of NumHmvpCand becomes 0. Set.
  • history prediction motion vector candidate list HmvpCandList is initialized in slice units (the first coded block of the slice), it may be performed in picture units, tile units, or tree block line units.
  • step S2104 It is determined whether or not the inter-prediction information candidate hMvpCand to be registered exists (step S2104 in FIG. 26).
  • the prediction method determination unit 105 on the coding side determines the normal prediction motion vector mode or the normal merge mode, or when the bit string decoding unit 201 on the decoding side decodes the decoding as the normal prediction motion vector mode or the normal merge mode.
  • the inter-prediction information be the inter-prediction information candidate hMvpCand to be registered.
  • the coding side prediction method determination unit 105 determines the intra prediction mode, subblock prediction motion vector mode, or subblock merge mode, or the decoding side bit string decoding unit 201 determines the intra prediction mode, subblock prediction motion vector mode.
  • step S2104 of FIG. 26 NO
  • step S2104 YES in FIG. 26
  • FIG. 27 is a flowchart of the same element confirmation processing procedure. Number of history prediction motion vector candidates When the value of NumHmvpCand is 0 (step S2121: NO in FIG. 27), the history prediction motion vector candidate list HmvpCandList is empty and the same candidate does not exist, so steps S2122 to S2125 in FIG. 27 are skipped. Then, the same element confirmation processing procedure is ended.
  • step S2123 When the value of the number of historically predicted motion vector candidates NumHmvpCand is larger than 0 (YES in step S2121 in FIG. 27), the process of step S2123 is repeated from 0 to NumHmvpCand-1 in the historical predicted motion vector index hMvpIdx (step in FIG. 27). S2122 to S2125). First, it is compared whether or not the hMvpCandList [hMvpIdx], which is the xth element of the historical prediction motion vector candidate list counting from 0, is the same as the inter-prediction information candidate hMvpCand (step S2123 in FIG. 27). If they are the same (step S2123: YES in FIG.
  • a TRUE (true) value is set in the flag electricalCandExist indicating whether or not the same candidate exists, and the removal target index removeIdx indicating the position of the element to be deleted is currently set.
  • FIG. 28 is a flowchart of the element shift / addition processing procedure of the history prediction motion vector candidate list HmvpCandList in step S2106 of FIG.
  • First it is determined whether to remove the elements stored in the historical prediction motion vector candidate list HmvpCandList and then add a new element, or to add a new element without removing the elements. Specifically, it is compared whether or not TRUE (true) or NumHmvpCand is 6 in the flag identicalCandExist indicating whether or not the same candidate exists (step S2141 in FIG. 28).
  • step S2141 YES in FIG. 28
  • the historical prediction motion vector candidate list HmvpCandList Add the new element after removing the element stored in.
  • Set the initial value of index i to the value of removeIdx + 1.
  • the element shift processing of step S2143 is repeated. (Steps S2142 to S2144 in FIG. 28).
  • the element is shifted forward (step S2143 in FIG.
  • step S2142 the inter-prediction information candidate hMvpCand is added to the (NumHmvpCand-1) th HmvpCandList [NumHmvpCand-1] counting from 0, which corresponds to the end of the history prediction motion vector candidate list (step S2145 in FIG. 28), and this history prediction is performed.
  • the element shift / addition process of the motion vector candidate list HmvpCandList is completed.
  • TRUE (true) and NumHmvpCand do not satisfy any of the conditions 6 in the flag electricalCandExist indicating whether or not the same candidate exists (step S2141: NO in FIG.
  • the history prediction motion vector candidate list HmvpCandList it is stored in the history prediction motion vector candidate list HmvpCandList.
  • the inter-prediction information candidate hMvpCand is added to the end of the history motion vector predictor candidate list without removing the elements (step S2146 in FIG. 28).
  • the last of the history prediction motion vector candidate list is the HmvpCandList [NumHmvpCand] which is the NumHmvpCand th from 0.
  • NuMHmvpCand is incremented by 1, and the element shift and additional processing of this history prediction motion vector candidate list HmvpCandList are completed.
  • FIG. 31 is a diagram illustrating an example of the update process of the history prediction motion vector candidate list.
  • the elements in front of the history prediction motion vector candidate list HmvpCandList are compared with the new inter prediction information in order.
  • HMVP2 If the new element has the same value as the third element from the beginning of the history prediction motion vector candidate list HmvpCandList, HMVP2, the element HMVP2 is deleted from the history prediction motion vector candidate list HmvpCandList, and the elements behind HMVP3 ⁇ Shift (copy) HMVP5 forward one by one, add a new element to the end of the history prediction motion vector candidate list HmvpCandList (Fig. 31B), and complete the update of the history prediction motion vector candidate list HmvpCandList (Fig. 31C). ).
  • FIG. 29 is a flowchart for explaining the procedure of the history motion vector predictor candidate derivation process.
  • step S2201 in FIG. 29 When the current number of predicted motion vector candidates numCurrMvpCand is less than 2, which is the maximum number of elements in the predicted motion vector candidate list mvpListLX, and when the value of the number of historical predicted motion vector candidates NumHmvpCand is greater than 0 (step S2201 in FIG. 29). YES), the processes of steps S2202 to S2209 of FIG. 29 are performed.
  • steps S2203 to S2208 of FIG. 29 are repeated until the index i is 1 to 4 and the number of historical motion vector predictor candidates numCheckedHMVPCand, whichever is smaller (steps S2202 to S2209 of FIG. 29).
  • the current number of predicted motion vector candidates numCurrMvpCand is 2 or more, which is the maximum number of elements of the predicted motion vector candidate list mvpListLX (steps S2203: NO in FIG. 29)
  • the processing of steps S2204 to S2209 in FIG. 29 is omitted.
  • the history motion vector predictor candidate derivation process procedure ends.
  • step S2203 YES in FIG. 29
  • the processes after step S2204 in FIG. 29 are performed.
  • steps S2205 to S2207 are performed for Y's 0 and 1 (L0 and L1), respectively (steps S2204 to S2208 in FIG. 29).
  • the processing of steps S2206 to S2209 in FIG. 29 is omitted.
  • the history motion vector predictor candidate derivation process procedure ends.
  • step S2205 YES in FIG. 29
  • the processes after step S2206 in FIG. 29 are performed.
  • Step S2206 add the LY motion vector of the historical motion vector candidate HmvpCandList [NumHmvpCand-i] to the numCurrMvpCand th element mvpListLX [numCurrMvpCand] counting from 0 in the predicted motion vector candidate list (step in FIG. 29).
  • step S2207 the number of current predicted motion vector candidates numCurrMvpCand is incremented by 1.
  • the additional processing of step S2207 is skipped.
  • steps S2205 to S2207 of FIG. 29 is performed on both L0 and L1 (steps S2204 to S2208 of FIG. 29).
  • the index i is incremented by 1, and the index i is 4 or less than the number NumHmvpCand of the number of history motion vector predictor candidates, whichever is smaller, the processes in and after step S2203 are performed again (steps S2202 to S2209 in FIG. 29).
  • FIG. 30 is a flowchart for explaining the history merge candidate derivation processing procedure.
  • the initialization process is performed (step S2301 in FIG. 30).
  • the initial value of the index hMvpIdx is set to 1, and the additional processing from step S2303 to step S2310 in FIG. 30 is repeated from this initial value to NumHmvpCand (steps S2302 to S2311 in FIG. 30). If the number of elements registered in the current merge candidate list numCurrMergeCand is not less than or equal to (maximum number of merge candidates MaxNumMergeCand-1), merge candidates have been added to all the elements in the merge candidate list. The process ends (NO in step S2303 in FIG. 30).
  • step S2304 If the number of elements registered in the current merge candidate list numCurrMergeCand is (maximum number of merge candidates MaxNumMergeCand-1) or less, the processing in step S2304 and subsequent steps is performed. A value of FALSE (false) is set in sameMotion (step S2304 in FIG. 30). Subsequently, the initial value of the index i is set to 0, and the processes of steps S2306 and S2307 of FIG. 30 are performed from this initial value to numOrigMergeCand-1 (S2305 to S2308 of FIG. 30).
  • FALSE false
  • Historical motion vector Prediction Candidate list counts from 0 (NumHmvpCand-hMvpIdx) th element HmvpCandList [NumHmvpCand-hMvpIdx] counts from 0 in the merge candidate list and compares whether it has the same value as the i-th element mergeCandList [i] (Step S2306 in FIG. 30).
  • the same value of the merge candidate means that the merge candidate has the same value when all the constituent elements (inter prediction mode, reference index, motion vector) of the merge candidate have the same value.
  • both sameMotion and isPruned[i] are set to TRUE (step S2307 in FIG. 30). If the values are not the same (NO in step S2306 of FIG. 30), the process of step S2307 is skipped.
  • the repeated processing from step S2305 to step S2308 in FIG. 30 is completed, it is compared whether or not sameMotion is FALSE (step S2309 in FIG. 30).
  • step S2309 in FIG. 30 When sameMotion is FALSE (false) (in step S2309 in FIG. 30) YES), that is, the (NumHmvpCand-hMvpIdx)th element HmvpCandList[NumHmvpCand-hMvpIdx] counting from 0 in the history motion vector predictor candidate list does not exist in mergeCandList, so the history is predicted in numCurrMergeCandth mergeCandList[numCurrMergeCand] in the merge candidate list.
  • the (NumHmvpCand-hMvpIdx)th element HmvpCandList[NumHmvpCand-hMvpIdx] counted from 0 in the motion vector candidate list is added, and numCurrMergeCand is incremented by 1 (step S2310 in FIG. 30).
  • the index hMvpIdx is incremented by 1 (step S2302 of FIG. 30), and steps S2302 to S2311 of FIG. 30 are repeated.
  • FIG. 39 is a flowchart illustrating the procedure for deriving the average merge candidate.
  • the initialization process is performed (step S1301 in FIG. 39).
  • Set the variable numOrigMergeCand to the number of elements registered in the current merge candidate list, numCurrMergeCand.
  • Step S1302 to S1303 in FIG. 39 If the number of elements registered in the current merge candidate list numCurrMergeCand is not less than or equal to (maximum number of merge candidates MaxNumMergeCand-1), merge candidates have been added to all the elements in the merge candidate list. The process ends (step S1304 in FIG. 39). If the number of elements registered in the current merge candidate list numCurrMergeCand is (maximum number of merge candidates MaxNumMergeCand-1) or less, the processing in step S1305 and subsequent steps is performed.
  • step S1305 in FIG. 39 It is determined whether the i-th motion information mergeCandList[i] of the merge candidate list and the j-th motion information mergeCandList[j] of the merge candidate list are both invalid (step S1305 in FIG. 39), and both are invalid. In that case, move to the next element without deriving the average merge candidates of mergeCandList [i] and mergeCandList [j]. If both mergeCandList [i] and mergeCandList [j] are not invalid, the following processing is repeated with X as 0 and 1 (steps S1306 to 1314 in FIG. 39).
  • step S1310 if the LX prediction of mergeCandList[j] is not valid, that is, if the LX prediction of mergeCandList[i] is valid and the LX prediction of mergeCandList[j] is invalid, mergeCandList[i]
  • the average merge candidate of the LX prediction having the motion vector and the reference index of the LX prediction is derived and set to the LX prediction of the averageCand, and the LX prediction of the averageCand is enabled (step S1310 in FIG. 39).
  • step S1307 of FIG. 39 if the LX prediction of mergeCandList[i] is not valid, it is determined whether the LX prediction of mergeCandList[j] is valid (step S1311 of FIG. 39).
  • step S1312 If the LX prediction of mergeCandList [j] is valid, that is, the LX prediction of mergeCandList [i] is invalid and the LX prediction of mergeCandList [j] is valid, then the motion vector of the LX prediction of mergeCandList [j]
  • the average merge candidate of the LX prediction having the reference index is derived and set as the LX prediction of averageCand, and the LX prediction of averageCand is validated (step S1312 in FIG. 39).
  • step S1311 of FIG. 39 if the LX prediction of mergeCandList [j] is not valid, that is, if both the LX prediction of mergeCandList [i] and the LX prediction of mergeCandList [j] are invalid, the LX prediction of averageCand is invalidated.
  • the LX prediction is valid when the reference index refIdxLX is 0 or more, and when the LX prediction is invalid, that is, when the reference index refIdxLX does not exist, the reference index refIdxLX is set to -1.
  • the average merge candidate averageCand of the L0 prediction, L1 prediction or BI prediction generated as described above is added to the mergeCandList [numCurrMergeCand] of the numCurrMergeCand th mergeCandList [numCurrMergeCand] of the merge candidate list, and the numCurrMergeCand is incremented by 1 (step S1315 in FIG. 39). This completes the process of deriving the average merge candidate.
  • the motion compensation prediction unit 306 acquires the position and size of the block currently subject to prediction processing in coding. Further, the motion compensation prediction unit 306 acquires the inter prediction information from the inter prediction mode determination unit 305. A reference index and a motion vector are derived from the acquired inter prediction information, and the reference picture specified by the reference index in the decoded image memory 104 is the same as the image signal of the block that is the target of the prediction process for the motion vector. A prediction signal is generated after acquiring the image signal of the position moved from the position.
  • the inter prediction mode in inter prediction is prediction from a single reference picture such as L0 prediction or L1 prediction
  • the prediction signal acquired from one reference picture is used as the motion compensation prediction signal
  • the inter prediction mode is BI.
  • the weighted average of the prediction signals acquired from the two reference pictures is used as the motion compensation prediction signal
  • the motion compensation prediction signal is used to determine the prediction method.
  • Supply to unit 105 the weighted average ratio of bi-prediction is set to 1:1, but the weighted average may be performed using another ratio. For example, the weighting ratio may be increased as the picture interval between the picture to be predicted and the reference picture is closer. Further, the weighting ratio may be calculated by using the correspondence table between the combination of picture intervals and the weighting ratio.
  • the motion compensation prediction unit 406 has the same function as the motion compensation prediction unit 306 on the encoding side.
  • the motion compensation prediction unit 406 transfers the inter-prediction information from the normal prediction motion vector mode derivation unit 401, the normal merge mode derivation unit 402, the subblock prediction motion vector mode derivation unit 403, and the subblock merge mode derivation unit 404 to the switch 408. Get through.
  • the motion compensation prediction unit 406 supplies the obtained motion compensation prediction signal to the decoded image signal superimposing unit 207.
  • ⁇ About inter-prediction mode The process of performing prediction from a single reference picture is defined as uni-prediction, and in the case of uni-prediction, either one of the two reference pictures registered in the reference lists L0 and L1 called L0 prediction or L1 prediction was used. Make a prediction.
  • FIG. 32 shows a case in which the L0 reference picture (RefL0Pic) is uni-prediction and is at a time earlier than the processing target picture (CurPic).
  • FIG. 33 shows a case where the reference picture of the L0 prediction is at a time after the processing target picture in the simple prediction.
  • the L0 prediction reference picture in FIGS. 32 and 33 may be replaced with the L1 prediction reference picture (RefL1Pic) to perform simple prediction.
  • FIG. 34 shows a case where the reference picture for bi-prediction and L0 prediction is at a time before the processing target picture, and the L1 prediction reference picture is at a time after the processing target picture.
  • FIG. 35 shows a case where the reference picture of the L0 prediction and the reference picture of the L1 prediction are at a time before the processing target picture in the bi-prediction.
  • FIG. 36 shows a case where the reference picture of the L0 prediction and the reference picture of the L1 prediction are at a time after the processing target picture in the bi-prediction.
  • L0 prediction and L1 prediction may be performed using the same reference picture. It should be noted that the determination of whether the motion compensation prediction is performed by simple prediction or double prediction is determined based on, for example, information (for example, a flag) indicating whether or not to use L0 prediction and whether or not to use L1 prediction. To.
  • ⁇ About reference index> In the embodiment of the present invention, in order to improve the accuracy of motion compensation prediction, it is possible to select the optimum reference picture from a plurality of reference pictures in motion compensation prediction. Therefore, the reference picture used in the motion compensation prediction is used as a reference index, and the reference index is encoded in the bitstream together with the differential motion vector.
  • the motion compensation prediction unit 306 is used when the inter-prediction information by the normal prediction motion vector mode derivation unit 301 is selected in the inter-prediction mode determination unit 305. Acquires this inter prediction information from the inter prediction mode determination unit 305, derives the inter prediction mode, reference index, and motion vector of the currently processed block, and generates a motion compensation prediction signal. The generated motion compensation prediction signal is supplied to the prediction method determination unit 105.
  • the motion compensation prediction unit 406 is normally used when the switch 408 is connected to the normal prediction motion vector mode derivation unit 401 in the process of decoding, as shown by the inter prediction unit 203 on the decoding side of FIG.
  • the motion vector predictor mode derivation unit 401 acquires the inter prediction information, derives the inter prediction mode, the reference index, and the motion vector of the block currently being processed, and generates the motion compensation prediction signal.
  • the generated motion compensation prediction signal is supplied to the decoded image signal superimposing unit 207.
  • the motion compensation prediction unit 306 is used when the inter-prediction information by the normal merge mode derivation unit 302 is selected in the inter-prediction mode determination unit 305.
  • This inter prediction information is acquired from the inter prediction mode determination unit 305, the inter prediction mode, the reference index, and the motion vector of the currently processed block are derived to generate a motion compensation prediction signal.
  • the generated motion compensation prediction signal is supplied to the prediction method determination unit 105.
  • the motion compensation prediction unit 406 as shown in the inter prediction unit 203 on the decoding side in FIG. 22, when the switch 408 is connected to the normal merge mode derivation unit 402 in the decoding process, the normal merge mode is used.
  • the inter prediction information is obtained by the derivation unit 402, the inter prediction mode, the reference index, and the motion vector of the block currently being processed are derived, and the motion compensation prediction signal is generated.
  • the generated motion compensation prediction signal is supplied to the decoded image signal superimposing unit 207.
  • ⁇ Motion compensation processing based on subblock predicted motion vector mode> In the motion compensation prediction unit 306, as shown by the inter prediction unit 102 on the coding side of FIG. 16, when the inter prediction information by the subblock prediction motion vector mode derivation unit 303 is selected in the inter prediction mode determination unit 305. For this, the inter prediction information is acquired from the inter prediction mode determination unit 305, the inter prediction mode, the reference index, and the motion vector of the currently processed block are derived, and the motion compensation prediction signal is generated. The generated motion compensation prediction signal is supplied to the prediction method determination unit 105.
  • the motion compensation prediction unit 406 when the switch 408 is connected to the sub-block motion vector predictor mode derivation unit 403 in the decoding process, as shown in the inter prediction unit 203 on the decoding side in FIG. 22,
  • the inter-prediction motion vector mode deriving unit 403 acquires inter-prediction information, derives the inter-prediction mode, reference index, and motion vector of the block currently being processed, and generates a motion compensation prediction signal.
  • the generated motion compensation prediction signal is supplied to the decoded image signal superimposing unit 207.
  • the motion compensation prediction unit 306 is used when the inter-prediction information by the sub-block merge mode derivation unit 304 is selected in the inter-prediction mode determination unit 305.
  • the inter prediction information is acquired from the inter prediction mode determination unit 305, the inter prediction mode, the reference index, and the motion vector of the currently processed block are derived, and the motion compensation prediction signal is generated.
  • the generated motion compensation prediction signal is supplied to the prediction method determination unit 105.
  • the motion compensation prediction unit 406 as shown in the inter prediction unit 203 on the decoding side in FIG. 22, when the switch 408 is connected to the sub block merge mode derivation unit 404 in the decoding process, the sub block The inter prediction information by the merge mode deriving unit 404 is acquired, the inter prediction mode, the reference index, and the motion vector of the block currently being processed are derived, and the motion compensation prediction signal is generated. The generated motion compensation prediction signal is supplied to the decoded image signal superimposing unit 207.
  • motion compensation by the affine model can be used based on the following flags.
  • the following flags are reflected in the following flags based on the inter prediction condition determined by the inter prediction mode determination unit 305 in the encoding process, and are encoded in the bitstream.
  • Sps_affine_enabled_flag indicates whether or not motion compensation by the affine model can be used in inter-prediction. If sps_affine_enabled_flag is 0, the motion compensation by the affine model is suppressed in sequence units. Also, inter_affine_flag and cu_affine_type_flag are not transmitted in the CU (coding block) syntax of the coded video sequence. If sps_affine_enabled_flag is 1, motion compensation by the affine model can be used in the coded video sequence.
  • Sps_affine_type_flag indicates whether or not motion compensation by the 6-parameter affine model can be used in inter-prediction. If sps_affine_type_flag is 0, it is suppressed so that it is not motion compensation by the 6-parameter affine model. Also, cu_affine_type_flag is not transmitted in the CU syntax of the coded video sequence. If sps_affine_type_flag is 1, motion compensation by a 6-parameter affine model can be used in a coded video sequence. If sps_affine_type_flag does not exist, it shall be 0.
  • inter_affine_flag When decoding P or B slices, if inter_affine_flag is 1 in the CU currently being processed, an affine model is used to generate a motion compensation prediction signal for the CU currently being processed. Motion compensation is used. If inter_affine_flag is 0, the affine model is not used for the CU currently being processed. If inter_affine_flag does not exist, it shall be 0.
  • a reference index or motion vector is derived in sub-block units, so a motion-compensated prediction signal is generated using the reference index or motion vector to be processed in sub-block units.
  • the 4-parameter affine model is a mode in which the motion vector of the sub-block is derived from the four parameters of the horizontal and vertical components of the motion vector of each of the two control points, and motion compensation is performed in sub-block units.
  • Triangular merge mode is a kind of merge mode, and is a mode for performing motion compensation prediction by dividing the encoding/decoding block into diagonal partitions.
  • Triangular merge mode is a kind of geometric division merge mode that divides the coding/decoding block into blocks of non-rectangular shape.In the geometric division merge mode, the coding/decoding block is divided into two right triangles with diagonal lines. Corresponds to the split mode.
  • the geometric division merge mode is expressed by a combination of two parameters, for example, an index (angleIdx) indicating a division angle and an index (distanceIdx) indicating a distance from the center of the encoded block.
  • 64 patterns are defined as the geometric division merge mode, and fixed length coding is performed.
  • One mode indicates that the coded block is divided diagonally, which corresponds to the triangular merge mode.
  • the triangular merge mode will be described with reference to FIGS. 38A and 38B.
  • 38A and 38B show an example of prediction of a coding / decoding block which is a 16x16 triangular merge mode.
  • the encoding/decoding block in the triangular merge mode is divided into 4 ⁇ 4 sub-blocks, and each sub-block is divided into 3 of a uni-prediction partition 0 (UNI0), a uni-prediction partition 1 (UNI1), and a bi-prediction partition 2 (BI). Assigned to one partition.
  • the subblock on the upper side of the diagonal is assigned to partition 0
  • the subblock on the lower side of the diagonal is assigned to partition 1
  • the subblock on the diagonal is assigned to partition 2.
  • merge_triangle_split_dir the partition is assigned as shown in FIG. 38A
  • merge_triangle_split_dir is 1, the partition is assigned as shown in FIG. 38B.
  • the motion prediction of partition 0 uses the motion information of uni-prediction designated by the merge triangle index 0.
  • uni-prediction motion information specified by merge triangle index 1 is used.
  • the motion-compensated prediction of the partition 2 uses bi-prediction motion information that is a combination of the single-prediction motion information specified by the merge triangle index 0 and the single-prediction motion information specified by the merge triangle index 1.
  • the uni-prediction motion information is one set of a motion vector and a reference index
  • the bi-prediction motion information is composed of two sets of a motion vector and a reference index.
  • the motion information is simple-predicted motion information or bi-predicted motion information.
  • the merge candidate selection units 347 and 447 derive a triangular merge candidate list triangleMergeCandList from the derived merge candidate list mergeCandList. This process will be described with reference to FIG.
  • a part or all of the candidates of the merge candidate list mergeCandList are used as the triangular merge candidate list triangleMergeCandList (step S4501).
  • the number of triangular merge candidate lists is numTriangleMergeCand.
  • step S4503 it is determined whether or not the prediction mode of the candidate M is PRED_BI (step S4503). In the case of PRED_BI (step S4503: Yes), m is incremented by 1 and the process proceeds to the next process. On the other hand, when it is not PRED_BI (step S4503: No), it is determined whether the prediction mode of the candidate M is PRED_L1 (step S4504).
  • the merge candidate list constructed in (346, 446) motion information candidates for uni-prediction and bi-prediction are mixed. Therefore, in the triangular merge mode, the uni-prediction motion information included in the merge candidate list is converted into bi-prediction motion information, thereby converting the merge candidate list into the triangular merge candidate list.
  • the conversion from simple-predicted motion information to bi-predicted motion information assigns a predetermined reference index and a predetermined motion vector to the invalid predicted motion information.
  • the background screen is stationary and the object in the front often moves. That is, by setting one motion vector to (0,0), it is possible to improve the prediction efficiency when one partition is stationary and the other partition is moving. Further, in general, a reference picture having a small reference index has the highest prediction efficiency. Therefore, the prediction efficiency can be improved by setting the reference index to 0.
  • the reference index and motion vector of the invalid prediction are set to 0 and (0,0), respectively.
  • the reference index and motion vector of a valid prediction are 0 and (0,0), respectively, the result is the same as a normal merge. Therefore, in order to obtain a different effect from normal merging, the reference index and motion vector of the invalid prediction are 0 and (0,0), respectively, so that the reference index and motion vector of partition 0 and partition 1 are not the same. It does not have to be.
  • the reference index and motion vector of invalid prediction may be 1 and (0,0), 0 and (1,1), 1 and (1,1), respectively.
  • the reference index is fixed at 0, but the reference index is incremented by 1 according to the number of occurrences of the reference index of the prediction that is invalid for each prediction, such as 0, 1, 2, ... It is also possible to improve the coding efficiency by increasing the selection candidates.
  • the spatial merge candidate and the merge candidate supplement section 346 and the merge candidate supplement section 446 are supplemented with additional candidates, the spatial merge candidate and the time merge candidate and the additional candidate, and the history merge candidate. And there are additional candidates.
  • the merge candidate selection unit 447 on the decoding side acquires motion information from the derived triangular merge candidate list triangleMergeCandList. This processing will be described with reference to FIG.
  • a triangle merge candidate list triangleMergeCandList is generated as shown in FIG. 40 (step S4520).
  • the candidate M of the partition X is selected based on the merge triangle index merge_triangle_idxX (step S4521).
  • the maximum number of merge candidates and the maximum number of triangular merge candidates can be fixed to be the same.
  • the simple prediction motion information indicated by the merge triangular index 0 can be referred to as L0 prediction
  • the simple prediction motion information indicated by the merge triangular index 1 can be referred to as L1 prediction.
  • the merge triangular index 0 can be associated with merge_triangle_idx0 and the merge triangular index 1 can be associated with merge_triangle_idx1 to ensure robustness at the time of decoding.
  • the merge candidate selection unit 347 on the encoding side acquires the motion information from the derived triangle merge candidate list triangleMergeCandList, and calculates the code amount and the distortion amount. This processing will be described with reference to FIG.
  • a triangle merge candidate list triangleMergeCandList is generated as shown in FIG. 40 (step S4509).
  • step S4510 the reference index refIdxLA of the partition 0 is set as the reference index refIdxLXM of the candidate M (step S4510).
  • the motion vector mvLA of the partition 0 is set as the motion vector mvLXM of the candidate M (step S4510).
  • refIdxLXM is the reference index of the reference list LX.
  • mvLXM is a motion vector of the reference list LX
  • when X 0, it represents the motion vector mvL0M of the reference list L0
  • when X 1, it represents the motion vector mvL1M of the reference list L1.
  • n 0 to numTriangleMergeCand-1.
  • refIdxLYN is a reference index of the reference list LY.
  • step S4513 the code amount and the strain amount are calculated using the acquired motion information.
  • step S4511 YES
  • steps S4512 and S4513 are not performed.
  • the selected information (the direction merge_triangle_split_dir that divides the coded block and the merge triangular index merge_triangle_idx0, merge_triangle_idx1 that indicates the triangular merge candidates for each divided partition), and the triangular merge candidates
  • the inter prediction information of the above is supplied to the motion compensation prediction unit 306. Further, the bit string encoding unit 108 encodes the selected information.
  • the merge candidate selection unit 447 on the decoding side indicates the decoded information (the direction merge_triangle_split_dir for dividing the coded block and the merge triangular index indicating the triangular merge candidates for each divided partition).
  • merge_triangle_idx0, merge_triangle_idx1 a triangle merge candidate is selected, and inter prediction information of the selected triangle merge candidate is supplied to the motion compensation prediction unit 406.
  • the motion compensation prediction units 306 and 406 perform the following weighted averaging in the case of the triangular merge mode.
  • nCbR (nCbW> nCbH )? (nCbW / nCbH ): (nCbH / nCbW) Is calculated.
  • predSamplesLA is a pixel value for which motion compensation is performed using the motion vector mvLA
  • predSamplesLB a pixel value for which motion compensation is performed using mvLB.
  • the candidates are selected in units of merge triangular indexes, that is, the candidates are selected in the partition 0 and the partition 1, respectively.
  • the prediction efficiency can be improved.
  • the conversion from the merge candidate list to the triangular merge candidate list was performed by the merge candidate selection unit 347 and the merge candidate selection unit 447.
  • a list conversion unit may be installed in front of the merge candidate selection unit 347 and the merge candidate selection unit 447, and the list conversion unit may perform conversion from the merge candidate list to the triangular merge candidate list.
  • a merge candidate list construction unit including the unit (346, 446) may be set up.
  • the process of allocating the motion information of the selected candidate to each partition was executed by the merge candidate selection unit 347 and the merge candidate selection unit 447. This may be performed by the motion compensation prediction unit 306 and the motion compensation prediction unit 406. Alternatively, a motion information allocation unit may be installed in front of the motion compensation prediction unit 306 and the motion compensation prediction unit 406 to allocate motion information.
  • FIG. 43A or FIG. 43B is a diagram showing the syntax of merge_mode of the first modification.
  • the difference between FIGS. 43A and 43B is the number and position of merge_idx.
  • merge_triangle_idx0 may be encoded (decoded) at the position as it is, and merge_triangle_idx1 may not be encoded (decoded).
  • the operation of the merge candidate selection unit 447 is different from that of the first embodiment.
  • the operation of the merge candidate selection unit 447 of Modification 1 will be described.
  • FIG. 44 is a flowchart illustrating the operation of the merge candidate selection unit 447.
  • a triangular merge candidate list triangleMergeCandList is generated (step S4525).
  • the generation of the triangular merge candidate list is the same as that in FIG. 40 in the first embodiment.
  • the coding block candidate M is selected from the triangular merge candidate list triangleMergeCandList based on the merge index merge_idx (step S4526).
  • the motion vector mvLXM and the reference index refIdxLXM of the LX prediction of the candidate M are set as the motion vector mvX and the reference index refIdxX of the partition X (step S4527).
  • candidates are selected in units of coded blocks, and the motion vector and reference index of the selected candidates are used as single prediction or double prediction for each partition.
  • the number of codes related to the merged triangular index can be reduced, and the coding efficiency and the throughput of the bit string can be improved.
  • Modification 2 In the second modification, the operations of the merge candidate selection unit 347 and the merge candidate selection unit 447 are different from those of the first modification. The operation of the merge candidate selection unit 347 and the merge candidate selection unit 447 of the second modification will be described with reference to FIG. 45.
  • the merge candidate list mergeCandList is acquired (step S4530).
  • the candidate M of the coded block is selected from the merge candidate list mergeCandList based on the merge index merge_idx (step S4531).
  • step S4532 Check if the LX prediction of candidate M is invalid (step S4532). If the LX prediction of the candidate M is invalid (YES in step S4532), the motion vector mvX of the LX prediction is (0,0), and the reference index refIdxX of the prediction X is set to 0 (step S4533). If the LX prediction of the candidate M is not invalid (NO in step S4532), the motion vector mvX of the LX prediction is the motion vector mvLXM of the candidate M, and the reference index refIdxX of the prediction X is the reference index refIdxLXM of the candidate M (step S4534). ..
  • Modification 3 differs from the modification 2 in the number of merge indexes and the operations of the merge candidate selecting unit 347 and the merge candidate selecting unit 447.
  • the operations of the merge candidate selection unit 347 and the merge candidate selection unit 447 will be described with reference to FIG.
  • the merge candidate list mergeCandList is acquired (step S4630).
  • the candidate M of the coded block is selected from the merge candidate list mergeCandList based on the merge index merge_triangle_idxX (step S4631).
  • step S4632 Check if the LX prediction of candidate M is invalid (step S4632). If the LX prediction of the candidate M is invalid (YES in step S4632), the motion vector mvX of the LX prediction is set to mvLYM, and the reference index refIdxX of the prediction X is set to refIdxLYM (step S4633). Here, if X is 0, Y is 1, and if X is 1, Y is 0.
  • the motion vector mvX of the LX prediction is the motion vector mvLXM of the candidate M
  • the reference index refIdxX of the prediction X is the reference index refIdxLXM of the candidate M (step S4534).
  • the candidate M is selected using the merge candidate list in the triangular merge mode, and only the selected candidate is set as the candidate for the bi-prediction motion information.
  • the candidate M is selected using the merge candidate list in the triangular merge mode, and only the selected candidate is set as the candidate for the bi-prediction motion information.
  • the motion vector of the LX prediction in which the candidate M is invalid is set to (0,0).
  • the motion vector mvX of the prediction in which the candidate M is valid is set to (0,0). It may be ⁇ mvX which is a motion vector symmetric with respect to. In -mvX, both the horizontal component and the vertical component are symmetric with respect to (0,0), but only the horizontal component is symmetric with respect to (0,0), and only the vertical component is symmetric with respect to (0,0). May be good.
  • the predicted motion vector in which the candidate M is invalid may be used as the predicted motion vector itself in which the candidate M is valid. That is, if the L0 prediction is valid and the L1 prediction is invalid, mv0 and mv1 are set to mvL0M, and if the L1 prediction is valid and the L0 prediction is invalid, mv0 and mv1 are set to mvL1M.
  • the conversion of the bi-prediction into motion information was carried out by the merge candidate selection unit 347 and the merge candidate selection unit 447. This may be done by installing a bi-prediction conversion unit after the merge candidate selection unit 347 and the merge candidate selection unit 447, and converting the bi-prediction into motion information by the bi-prediction conversion unit.
  • the bitstream output by the image coding apparatus has a specific data format so that it can be decoded according to the coding method used in the embodiments. There is.
  • the image decoding device corresponding to this image coding device can decode the bit stream of this specific data format.
  • a transmission device that converts the bitstream output by the image encoding device into encoded data in a data format suitable for the transmission form of the communication path and transmits it to the network, and a transmission device that receives the encoded data from the network and sends the bitstream. And a receiving device that restores the image to the image decoding device and supplies it to the image decoding device.
  • the transmitting device includes a memory for buffering a bit stream output by the image coding device, a packet processing unit for packetizing the bit stream, and a transmitting unit for transmitting the encoded data packetized via the network.
  • the receiving device receives the encoded data packetized via the network, a memory for buffering the received encoded data, and packet-processes the encoded data to generate a bit stream for image decoding. And a packet processing unit provided to the device.
  • a display unit may be added by adding a display unit that displays an image decoded by the image decoding device to the configuration. In that case, the display unit reads the decoded image signal generated by the decoded image signal superimposing unit 207 and stored in the decoded image memory 208 and displays it on the screen.
  • an image pickup unit may be added to the configuration, and the picked-up image may be input to the image coding device to be used as an image pickup device.
  • the imaging unit inputs the captured image signal to the block division unit 101.
  • FIG. 37 shows an example of the hardware configuration of the encoding/decoding device of this embodiment.
  • the coding / decoding device includes the configuration of the image coding device and the image decoding device according to the embodiment of the present invention.
  • the encoding/decoding device 9000 has a CPU 9001, a codec IC 9002, an I/O interface 9003, a memory 9004, an optical disk drive 9005, a network interface 9006, and a video interface 9009, and each unit is connected by a bus 9010.
  • the image coding unit 9007 and the image decoding unit 9008 are typically implemented as a codec IC9002.
  • the image coding process of the image coding device according to the embodiment of the present invention is executed by the image coding unit 9007, and the image decoding process in the image decoding device according to the embodiment of the present invention is performed by the image decoding unit 9008.
  • the I / O interface 9003 is realized by, for example, a USB interface, and is connected to an external keyboard 9104, mouse 9105, or the like.
  • the CPU 9001 controls the encoding/decoding device 9000 so as to execute an operation desired by the user, based on the user operation input via the I/O interface 9003.
  • User operations using the keyboard 9104, mouse 9105, and the like include selection of which function to execute, coding or decoding, setting of coding quality, bitstream input / output destination, image input / output destination, and the like.
  • the optical disc drive 9005 When the user desires an operation of reproducing an image recorded on the disc recording medium 9100, the optical disc drive 9005 reads a bitstream from the inserted disc recording medium 9100 and outputs the read bitstream via the bus 9010. It is sent to the image decoding unit 9008 of the codec IC 9002.
  • the image decoding unit 9008 executes the image decoding process in the image decoding apparatus according to the embodiment of the present invention on the input bit stream, and sends the decoded image to the external monitor 9103 via the video interface 9009.
  • the encoding/decoding device 9000 has a network interface 9006 and can be connected to an external distribution server 9106 or a mobile terminal 9107 via the network 9101.
  • the network interface 9006 operates from the input disk recording medium 9100. Instead of reading the bitstream, the bitstream is acquired from the network 9101.
  • the bit stream recorded in the memory 9004 is subjected to the image decoding process in the image decoding apparatus according to the embodiment of the present invention. To do.
  • the video interface 9009 inputs the image from the camera 9102, and via the bus 9010, the image encoding unit 9007 of the codec IC 9002. Send to.
  • the image coding unit 9007 executes the image coding process in the image coding device according to the embodiment of the present invention on the image input via the video interface 9009 to create a bit stream. Then, the bit stream is sent to the memory 9004 via the bus 9010. If the user desires to record the bitstream on the disc recording medium 9100 instead of the memory 9004, the optical disc drive 9005 writes the bitstream to the inserted disc recording medium 9100.
  • Such a hardware configuration is realized, for example, by replacing the codec IC 9002 with the image encoding unit 9007 or the image decoding unit 9008.
  • the above processing related to coding and decoding may be realized as a transmission, storage, and reception device using hardware, and is stored in a ROM (read-only memory), a flash memory, or the like. It may be realized by firmware or software such as a computer.
  • the firmware program and software program may be recorded on a recording medium readable by a computer or the like and provided, or may be provided from a server via a wired or wireless network, or terrestrial or satellite digital broadcasting data broadcasting. May be provided as.
  • the present invention can be used in an image coding and decoding technique for dividing an image into blocks and performing prediction.
  • 100 image coding device 101 block division unit, 102 inter prediction unit, 103 intra prediction unit, 104 decoded image memory, 105 prediction method determination unit, 106 residual generation unit, 107 orthogonal transform/quantization unit, 108 bit string coding Part, 109 dequantization/inverse orthogonal transformation part, 110 decoded image signal superposition part, 111 encoded information storage memory, 200 image decoding device, 201 bit string decoding part, 202 block division part, 203 inter prediction part 204 intra prediction part, 205 encoded information storage memory 206 dequantization/inverse orthogonal transformation unit, 207 decoded image signal superimposing unit, 208 decoded image memory.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

空間マージ候補を含むマージ候補リストを構築するマージ候補構築部と、マージインデックスに基づいてマージ候補リストから1つの選択マージ候補を選択するマージ候補選択部と、選択マージ候補が単予測の動き情報である場合、選択マージ候補をL0予測とL1予測からなる双方向予測の動き情報に変換する双予測変換部と、符号化ブロックを4x4のサブブロックに分割し、サブブロック毎に双予測のL0予測の動き情報、双予測のL1予測の動き情報、双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当て部を有する。

Description

動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
 本発明は、画像をブロックに分割し、予測を行う画像符号化及び復号技術に関する。
 画像の符号化及び復号では、処理の対象となる画像を所定数の画素の集合であるブロックに分割し、ブロック単位で処理をする。適切なブロックに分割し、画面内予測(イントラ予測)、画面間予測(インター予測)を適切に設定することにより、符号化効率が向上する。
 動画像の符号化・復号では、符号化・復号済みのピクチャから予測するインター予測により符号化効率を向上している。特許文献1には、インター予測の際に、アフィン変換を適用する技術が記載されている。動画像では、物体が拡大・縮小、回転といった変形を伴うことは珍しいことではなく、特許文献1の技術を適用することにより、効率的な符号化が可能となる。
特開平9-172644号公報
 しかしながら、特許文献1の技術は画像の変換を伴うものであるため、処理負荷が多大という課題がある。本発明は上記の課題に鑑み、低負荷で効率的な符号化技術を提供する。
 上記課題を解決する本発明のある態様では、単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築部と、マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択部と、前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換部と、前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当て部を有する。
 本発明によれば、高効率な画像符号化・復号処理を低負荷で実現することができる。
本発明の実施の形態に係る画像符号化装置のブロック図である。 本発明の実施の形態に係る画像復号装置のブロック図である。 ツリーブロックを分割する動作を説明するためのフローチャートである。 入力された画像をツリーブロックに分割する様子を示す図である。 z-スキャンを説明する図である。 ブロックの分割形状を示す図である。 ブロックの分割形状を示す図である。 ブロックの分割形状を示す図である。 ブロックの分割形状を示す図である。 ブロックの分割形状を示す図である。 ブロックを4分割する動作を説明するためのフローチャートである。 ブロックを2分割または3分割する動作を説明するためのフローチャートである。 ブロック分割の形状を表現するためのシンタックスである。 イントラ予測を説明するための図である。 イントラ予測を説明するための図である。 インター予測の参照ブロックを説明するための図である。 符号化ブロック予測モードを表現するためのシンタックスである。 符号化ブロック予測モードを表現するためのシンタックスである。 インター予測に関するシンタックスエレメントとモードの対応を示す図である。 制御点2点のアフィン変換動き補償を説明するための図である。 制御点3点のアフィン変換動き補償を説明するための図である。 図1のインター予測部102の詳細な構成のブロック図である。 図16の通常予測動きベクトルモード導出部301の詳細な構成のブロック図である。 図16の通常マージモード導出部302の詳細な構成のブロック図である。 図16の通常予測動きベクトルモード導出部301の通常予測動きベクトルモード導出処理を説明するためのフローチャートである。 通常予測動きベクトルモード導出処理の処理手順を表すフローチャートである。 通常マージモード導出処理の処理手順を説明するフローチャートである。 図2のインター予測部203の詳細な構成のブロック図である。 図22の通常予測動きベクトルモード導出部401の詳細な構成のブロック図である。 図22の通常マージモード導出部402の詳細な構成のブロック図である。 図22の通常予測動きベクトルモード導出部401の通常予測動きベクトルモード導出処理を説明するためのフローチャートである。 履歴予測動きベクトル候補リスト初期化・更新処理手順を説明する図である。 履歴予測動きベクトル候補リスト初期化・更新処理手順における、同一要素確認処理手順のフローチャートである。 履歴予測動きベクトル候補リスト初期化・更新処理手順における、要素シフト処理手順のフローチャートである。 履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。 履歴マージ候補導出処理手順を説明するフローチャートである。 履歴予測動きベクトル候補リスト更新処理の一例を説明するための図である。 履歴予測動きベクトル候補リスト更新処理の一例を説明するための図である。 履歴予測動きベクトル候補リスト更新処理の一例を説明するための図である。 L0予測であってL0の参照ピクチャ(RefL0Pic)が処理対象ピクチャ(CurPic)より前の時刻にある場合の動き補償予測を説明するための図である。 L0予測であってL0予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合の動き補償予測を説明するための図である。 双予測であってL0予測の参照ピクチャが処理対象ピクチャより前の時刻にあって、L1予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合の動き補償予測の予測方向を説明するための図である。 双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが処理対象ピクチャより前の時刻にある場合の動き補償予測の予測方向を説明するための図である。 双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合の動き補償予測の予測方向を説明するための図である。 本発明の実施の形態の符号化復号装置のハードウェア構成の一例を説明するための図である。 三角マージモードの予測を説明する図である。 三角マージモードの予測を説明する図である。 平均マージ候補導出処理手順を説明するフローチャートである。 三角マージ候補リストの導出を説明する図である。 三角マージ候補リストからの動き情報の取得を説明する図である。 三角マージ候補リストからの動き情報の取得、および符号量とひずみ量を算出する処理を説明する図である。 マージモードを表現するためのシンタックスである。 マージモードを表現するためのシンタックスである。 三角マージ候補リストからの動き情報の取得を説明する図である。 マージ候補リストからの動き情報の取得を説明するフローチャートである。 マージ候補リストからの動き情報の取得を説明する別のフローチャートである。
 本実施の形態において使用する技術、及び技術用語を定義する。
 <ツリーブロック>
 実施の形態では、所定の大きさで符号化・復号処理対象画像を均等分割する。この単位をツリーブロックと定義する。図4では、ツリーブロックのサイズを128x128画素としているが、ツリーブロックのサイズはこれに限定されるものではなく、任意のサイズを設定してよい。処理対象(符号化処理においては符号化対象、復号処理においては復号対象に対応する。)のツリーブロックは、ラスタスキャン順、すなわち左から右、上から下の順序で切り替わる。各ツリーブロックの内部は、さらに再帰的な分割が可能である。ツリーブロックを再帰的に分割した後の、符号化・復号の対象となるブロックを符号化ブロックと定義する。また、ツリーブロック、符号化ブロックを総称してブロックと定義する。適切なブロック分割を行うことにより効率的な符号化が可能となる。ツリーブロックのサイズは、符号化装置と復号装置で予め取り決めた固定値とすることもできるし、符号化装置が決定したツリーブロックのサイズを復号装置に伝送するような構成をとることもできる。ここでは、ツリーブロックの最大サイズを128x128画素、ツリーブロックの最小サイズを16x16画素とする。また、符号化ブロックの最大サイズを64x64画素、符号化ブロックの最小サイズを4x4画素とする。
 <予測モード>
 処理対象符号化ブロック単位で、処理対象画像の処理済み画像信号から予測を行うイントラ予測(MODE_INTRA)、及び処理済み画像の画像信号から予測を行うインター予測(MODE_INTER)を切り替える。
 処理済み画像は、符号化処理においては符号化が完了した信号を復号した画像、画像信号、ツリーブロック、ブロック、符号化ブロック等に用いられ、復号処理においては復号が完了した画像、画像信号、ツリーブロック、ブロック、符号化ブロック等に用いられる。
 このイントラ予測(MODE_INTRA)とインター予測(MODE_INTER)を識別するモードを予測モード(PredMode)と定義する。予測モード(PredMode)はイントラ予測(MODE_INTRA)、またはインター予測(MODE_INTER)を値として持つ。
 <インター予測>
 処理済み画像の画像信号から予測を行うインター予測では、複数の処理済み画像を参照ピクチャとして用いることができる。複数の参照ピクチャを管理するため、L0(参照リスト0)とL1(参照リスト1)の2種類の参照リストを定義し、それぞれ参照インデックスを用いて参照ピクチャを特定する。PスライスではL0予測(Pred_L0)が利用可能である。BスライスではL0予測(Pred_L0)、L1予測(Pred_L1)、双予測(Pred_BI)が利用可能である。L0予測(Pred_L0)はL0で管理されている参照ピクチャを参照するインター予測であり、L1予測(Pred_L1)はL1で管理されている参照ピクチャを参照するインター予測である。双予測(Pred_BI)はL0予測とL1予測が共に行われ、L0とL1のそれぞれで管理されている1つずつの参照ピクチャを参照するインター予測である。L0予測、L1予測、双予測を特定する情報を、インター予測モードと定義する。以降の処理において出力に添え字LXが付いている定数、変数に関しては、L0、L1ごとに処理が行われることを前提とする。
 <予測動きベクトルモード>
 予測動きベクトルモードは、予測動きベクトルを特定するためのインデックス、差分動きベクトル、インター予測モード、参照インデックスを伝送し、処理対象ブロックのインター予測情報を決定するモードである。予測動きベクトルは、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックから導出した予測動きベクトル候補と、予測動きベクトルを特定するためのインデックスから導出する。
 <マージモード>
 マージモードは、差分動きベクトル、参照インデックスを伝送せずに、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から、処理対象ブロックのインター予測情報を導出するモードである。
 処理対象ブロックに隣接する処理済みブロック、およびその処理済みブロックのインター予測情報を空間マージ候補と定義する。処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロック、およびそのブロックのインター予測情報から導出されるインター予測情報を時間マージ候補と定義する。各マージ候補はマージ候補リストに登録され、マージインデックスにより、処理対象ブロックの予測で使用するマージ候補を特定する。
 <隣接ブロック>
 図11は、予測動きベクトルモード、マージモードで、インター予測情報を導出するために参照する参照ブロックを説明する図である。A0,A1,A2,B0,B1,B2,B3は、処理対象ブロックに隣接する処理済みブロックである。T0は、処理済み画像に属するブロックで、処理対象画像における処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックである。
 A1,A2は、処理対象符号化ブロックの左側に位置し、処理対象符号化ブロックに隣接するブロックである。B1,B3は、処理対象符号化ブロックの上側に位置し、処理対象符号化ブロックに隣接するブロックである。A0,B0,B2はそれぞれ、処理対象符号化ブロックの左下、右上、左上に位置するブロックである。
 予測動きベクトルモード、マージモードにおいて隣接ブロックをどのように扱うかの詳細については後述する。
 <アフィン変換動き補償>
 アフィン変換動き補償は、符号化ブロックを所定単位のサブブロックに分割し、分割された各サブブロックに対して個別に動きベクトルを決定して動き補償を行うものである。各サブブロックの動きベクトルは、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から導出する1つ以上の制御点に基づき導出する。本実施の形態では、サブブロックのサイズを4x4画素とするが、サブブロックのサイズはこれに限定されるものではないし、画素単位で動きベクトルを導出してもよい。
 図14に、制御点が2つの場合のアフィン変換動き補償の例を示す。この場合、2つの制御点が水平方向成分、垂直方向成分の2つのパラメータを有する。このため、制御点が2つの場合のアフィン変換を、4パラメータアフィン変換と呼称する。図14のCP1、CP2が制御点である。
 図15に、制御点が3つの場合のアフィン変換動き補償の例を示す。この場合、3つの制御点が水平方向成分、垂直方向成分の2つのパラメータを有する。このため、制御点が3つの場合のアフィン変換を、6パラメータアフィン変換と呼称する。図15のCP1、CP2、CP3が制御点である。
 アフィン変換動き補償は、予測動きベクトルモードおよびマージモードのいずれのモードにおいても利用可能である。予測動きベクトルモードでアフィン変換動き補償を適用するモードをサブブロック予測動きベクトルモードと定義し、マージモードでアフィン変換動き補償を適用するモードをサブブロックマージモードと定義する。
 <符号化ブロックのシンタックス>
 図12A、図12B、および図13を用いて、符号化ブロックの予測モードを表現するためのシンタックスを説明する。図12Aのpred_mode_flagは、インター予測か否かを示すフラグである。pred_mode_flagが0であればインター予測となり、pred_mode_flagが1であればイントラ予測となる。イントラ予測の場合にはイントラ予測の情報intra_pred_modeを送り、インター予測の場合にはmerge_flagを送る。merge_flagは、マージモードとするか、予測動きベクトルモードとするかを示すフラグである。予測動きベクトルモードの場合(merge_flag=0)、サブブロック予測動きベクトルモードを適用するか否かを示すフラグinter_affine_flagを送る。サブブロック予測動きベクトルモードを適用する場合(inter_affine_flag=1)、cu_affine_type_flagを送る。cu_affine_type_flagは、サブブロック予測動きベクトルモードにおいて、制御点の数を決定するためのフラグである。
 一方、マージモードの場合(merge_flag=1)、図12Bのmerge_subblock_flagを送る。merge_subblock_flagは、サブブロックマージモードを適用するか否かを示すフラグである。サブブロックマージモードの場合(merge_subblock_flag=1)、マージインデックスmerge_subblock_idxを送る。一方、サブブロックマージモードでない場合(merge_subblock_flag=0)、三角マージモードを適用するか否かを示すフラグmerge_triangle_flagを送る。三角マージモードを適用する場合(merge_triangle_flag=1)、ブロックを分割する方向merge_triangle_split_dir、および分割された2つのパーティションごとにマージ三角インデックスmerge_triangle_idx0,merge_triangle_idx1を送る。一方、三角マージモードを適用しない場合(merge_triangle_flag=0)、マージインデックスmerge_idxを送る。
 図13に各シンタックスエレメントの値と、それに対応する予測モードを示す。merge_flag=0,inter_affine_flag=0は、通常予測動きベクトルモード(Inter Pred Mode)に対応する。merge_flag=0,inter_affine_flag=1は、サブブロック予測動きベクトルモード(Inter Affine Mode)に対応する。merge_flag=1,merge_subblock_flag=0,merge_trianlge_flag=0は、通常マージモード(Merge Mode)に対応する。merge_flag=1,merge_subblock_flag=0,merge_trianlge_flag=1は、三角マージモード(Triangle Merge Mode)に対応する。merge_flag=1,merge_subblock_flag=1は、サブブロックマージモード(Affine Merge Mode)に対応する。
 <POC>
 POC(Picture Order Count)は符号化されるピクチャに関連付けられる変数であり、ピクチャの出力順序に応じた1ずつ増加する値が設定される。POCの値によって、同じピクチャであるかを判別したり、出力順序でのピクチャ間の前後関係を判別したり、ピクチャ間の距離を導出したりすることができる。例えば、2つのピクチャのPOCが同じ値を持つ場合、同一のピクチャであると判断できる。2つのピクチャのPOCが違う値を持つ場合、POCの値が小さいピクチャのほうが、先に出力されるピクチャであると判断でき、2つのピクチャのPOCの差が時間軸方向でのピクチャ間距離を示す。
(第1の実施の形態)
 本発明の第1の実施の形態に係る画像符号化装置100及び画像復号装置200について説明する。
 図1は、第1の実施の形態に係る画像符号化装置100のブロック図である。実施の形態の画像符号化装置100は、ブロック分割部101、インター予測部102、イントラ予測部103、復号画像メモリ104、予測方法決定部105、残差生成部106、直交変換・量子化部107、ビット列符号化部108、逆量子化・逆直交変換部109、復号画像信号重畳部110、および符号化情報格納メモリ111を備える。
 ブロック分割部101は、入力された画像を再帰的に分割して、符号化ブロックを生成する。ブロック分割部101は、分割対象となるブロックを水平方向と垂直方向にそれぞれ分割する4分割部と、分割対象となるブロックを水平方向または垂直方向のいずれかに分割する2-3分割部とを含む。ブロック分割部101は、生成した符号化ブロックを処理対象符号化ブロックとし、その処理対象符号化ブロックの画像信号を、インター予測部102、イントラ予測部103および残差生成部106に供給する。また、ブロック分割部101は、決定した再帰分割構造を示す情報をビット列符号化部108に供給する。ブロック分割部101の詳細な動作は後述する。
 インター予測部102は、処理対象符号化ブロックのインター予測を行う。インター予測部102は、符号化情報格納メモリ111に格納されているインター予測情報と、復号画像メモリ104に格納されている復号済みの画像信号とから、複数のインター予測情報の候補を導出し、導出した複数の候補の中から適したインター予測モードを選択し、選択されたインター予測モード、及び選択されたインター予測モードに応じた予測画像信号を予測方法決定部105に供給する。インター予測部102の詳細な構成と動作は後述する。
 イントラ予測部103は、処理対象符号化ブロックのイントラ予測を行う。イントラ予測部103は、復号画像メモリ104に格納されている復号済みの画像信号を参照画素として参照し、符号化情報格納メモリ111に格納されているイントラ予測モード等の符号化情報に基づくイントラ予測により予測画像信号を生成する。イントラ予測では、イントラ予測部103は、複数のイントラ予測モードの中から適したイントラ予測モードを選択し、選択されたイントラ予測モード、及び選択されたイントラ予測モードに応じた予測画像信号を予測方法決定部105に供給する。
 図10A及び図10Bにイントラ予測の例を示す。図10Aは、イントラ予測の予測方向とイントラ予測モード番号の対応を示したものである。例えば、イントラ予測モード50は、垂直方向に参照画素をコピーすることによりイントラ予測画像を生成する。イントラ予測モード1は、DCモードであり、処理対象ブロックのすべての画素値を参照画素の平均値とするモードである。イントラ予測モード0は、Planarモードであり、垂直方向・水平方向の参照画素から2次元的なイントラ予測画像を作成するモードである。図10Bは、イントラ予測モード40の場合のイントラ予測画像を生成する例である。イントラ予測部103は、処理対象ブロックの各画素に対し、イントラ予測モードの示す方向の参照画素の値をコピーする。イントラ予測部103は、イントラ予測モードの参照画素が整数位置でない場合には、周辺の整数位置の参照画素値から補間により参照画素値を決定する。
 復号画像メモリ104は、復号画像信号重畳部110で生成した復号画像を格納する。復号画像メモリ104は、格納している復号画像を、インター予測部102、イントラ予測部103に供給する。
 予測方法決定部105は、イントラ予測とインター予測のそれぞれに対して、符号化情報及び残差の符号量、予測画像信号と処理対象画像信号との間の歪量等を用いて評価することにより、最適な予測モードを決定する。イントラ予測の場合は、予測方法決定部105は、イントラ予測モード等のイントラ予測情報を符号化情報としてビット列符号化部108に供給する。インター予測のマージモードの場合は、予測方法決定部105は、マージインデックス、サブブロックマージモードか否かを示す情報(サブブロックマージフラグ)等のインター予測情報を符号化情報としてビット列符号化部108に供給する。インター予測の予測動きベクトルモードの場合は、予測方法決定部105は、インター予測モード、予測動きベクトルインデックス、L0、L1の参照インデックス、差分動きベクトル、サブブロック予測動きベクトルモードか否かを示す情報(サブブロック予測動きベクトルフラグ)等のインター予測情報を符号化情報としてビット列符号化部108に供給する。さらに、予測方法決定部105は、決定した符号化情報を符号化情報格納メモリ111に供給する。予測方法決定部105は、残差生成部106及び予測画像信号を復号画像信号重畳部110に供給する。
 残差生成部106は、処理対象の画像信号から予測画像信号を減ずることにより残差を生成し、直交変換・量子化部107に供給する。
 直交変換・量子化部107は、残差に対して量子化パラメータに応じて直交変換及び量子化を行い直交変換・量子化された残差を生成し、生成した残差をビット列符号化部108と逆量子化・逆直交変換部109とに供給する。
 ビット列符号化部108は、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報に加えて、符号化ブロック毎に予測方法決定部105によって決定された予測方法に応じた符号化情報を符号化する。具体的には、ビット列符号化部108は、符号化ブロック毎の予測モードPredModeを符号化する。予測モードがインター予測(MODE_INTER)の場合、ビット列符号化部108は、マージモードか否かを判別するフラグ、サブブロックマージフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトルに関する情報、サブブロック予測動きベクトルフラグ等の符号化情報(インター予測情報)を規定のシンタックス(ビット列の構文規則)に従って符号化し、第1のビット列を生成する。予測モードがイントラ予測(MODE_INTRA)の場合、イントラ予測モード等の符号化情報(イントラ予測情報)を規定のシンタックス(ビット列の構文規則)に従って符号化し、第1のビット列を生成する。また、ビット列符号化部108は、直交変換及び量子化された残差を規定のシンタックスに従ってエントロピー符号化して第2のビット列を生成する。ビット列符号化部108は、第1のビット列と第2のビット列を規定のシンタックスに従って多重化し、ビットストリームを出力する。
 逆量子化・逆直交変換部109は、直交変換・量子化部107から供給された直交変換・量子化された残差を逆量子化及び逆直交変換して残差を算出し、算出した残差を復号画像信号重畳部110に供給する。
 復号画像信号重畳部110は、予測方法決定部105による決定に応じた予測画像信号と逆量子化・逆直交変換部109で逆量子化及び逆直交変換された残差を重畳して復号画像を生成し、復号画像メモリ104に格納する。なお、復号画像信号重畳部110は、復号画像に対して符号化によるブロック歪等の歪を減少させるフィルタリング処理を施した後、復号画像メモリ104に格納してもよい。
 符号化情報格納メモリ111は、予測方法決定部105で決定した、予測モード(インター予測またはイントラ予測)等の符号化情報を格納する。インター予測の場合は、符号化情報格納メモリ111が格納する符号化情報には、決定した動きベクトル、参照リストL0、L1の参照インデックス、履歴予測動きベクトル候補リスト等のインター予測情報が含まれる。またインター予測のマージモードの場合は、符号化情報格納メモリ111が格納する符号化情報には、上述の各情報に加え、マージインデックス、サブブロックマージモードか否かを示す情報(サブブロックマージフラグ)のインター予測情報が含まれる。またインター予測の予測動きベクトルモードの場合は、符号化情報格納メモリ111が格納する符号化情報には、上述の各情報に加え、インター予測モード、予測動きベクトルインデックス、差分動きベクトル、サブブロック予測動きベクトルモードか否かを示す情報(サブブロック予測動きベクトルフラグ)等のインター予測情報が含まれる。イントラ予測の場合は、符号化情報格納メモリ111が格納する符号化情報には、決定したイントラ予測モード等のイントラ予測情報が含まれる。
 図2は、図1の画像符号化装置に対応した本発明の実施の形態に係る画像復号装置の構成を示すブロックである。実施の形態の画像復号装置は、ビット列復号部201、ブロック分割部202、インター予測部203、イントラ予測部204、符号化情報格納メモリ205、逆量子化・逆直交変換部206、復号画像信号重畳部207、および復号画像メモリ208を備える。
 図2の画像復号装置の復号処理は、図1の画像符号化装置の内部に設けられている復号処理に対応するものであるから、図2の符号化情報格納メモリ205、逆量子化・逆直交変換部206、復号画像信号重畳部207、および復号画像メモリ208の各構成は、図1の画像符号化装置の符号化情報格納メモリ111、逆量子化・逆直交変換部109、復号画像信号重畳部110、および復号画像メモリ104の各構成とそれぞれ対応する機能を有する。
 ビット列復号部201に供給されるビットストリームは、規定のシンタックスの規則に従って分離される。ビット列復号部201は、分離された第1のビット列を復号し、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報、及び、符号化ブロック単位の符号化情報を得る。具体的には、ビット列復号部201は、符号化ブロック単位でインター予測(MODE_INTER)かイントラ予測(MODE_INTRA)かを判別する予測モードPredModeを復号する。予測モードがインター予測(MODE_INTER)の場合、ビット列復号部201は、マージモードか否かを判別するフラグ、マージモードの場合はマージインデックス、サブブロックマージフラグ、予測動きベクトルモードである場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトル、サブブロック予測動きベクトルフラグ等に関する符号化情報(インター予測情報)を規定のシンタックスに従って復号し、符号化情報(インター予測情報)をインター予測部203、およびブロック分割部202を介して符号化情報格納メモリ205に供給する。予測モードがイントラ予測(MODE_INTRA)の場合、イントラ予測モード等の符号化情報(イントラ予測情報)を規定のシンタックスに従って復号し、符号化情報(イントラ予測情報)をインター予測部203またはイントラ予測部204、およびブロック分割部202を介して符号化情報格納メモリ205に供給する。ビット列復号部201は、分離した第2のビット列を復号して直交変換・量子化された残差を算出し、直交変換・量子化された残差を逆量子化・逆直交変換部206に供給する。
 インター予測部203は、処理対象の符号化ブロックの予測モードPredModeがインター予測(MODE_INTER)で予測動きベクトルモードである時に、符号化情報格納メモリ205に記憶されている既に復号された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を導出して、導出した複数の予測動きベクトルの候補を、後述する予測動きベクトル候補リストに登録する。インター予測部203は、予測動きベクトル候補リストに登録された複数の予測動きベクトルの候補の中から、ビット列復号部201で復号され供給される予測動きベクトルインデックスに応じた予測動きベクトルを選択し、ビット列復号部201で復号された差分動きベクトルと選択された予測動きベクトルから動きベクトルを算出し、算出した動きベクトルを他の符号化情報とともに符号化情報格納メモリ205に格納する。ここで供給・格納する符号化ブロックの符号化情報は、予測モードPredMode、L0予測、及びL1予測を利用するか否かを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での符号化ブロックの左上の画素の位置を示すインデックスである。予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0予測を利用するか否かを示すフラグpredFlagL0は1、L1予測を利用するか否かを示すフラグpredFlagL1は0である。インター予測モードがL1予測(Pred_L1)の場合、L0予測を利用するか否かを示すフラグpredFlagL0は0、L1予測を利用するか否かを示すフラグpredFlagL1は1である。インター予測モードが双予測(Pred_BI)の場合、L0予測を利用するか否かを示すフラグpredFlagL0、L1予測を利用するか否かを示すフラグpredFlagL1は共に1である。さらに、処理対象の符号化ブロックの予測モードPredModeがインター予測(MODE_INTER)でマージモードの時に、マージ候補を導出する。符号化情報格納メモリ205に記憶されている既に復号された符号化ブロックの符号化情報を用いて、複数のマージの候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中からビット列復号部201で復号され供給されるマージインデックスに対応したマージ候補を選択し、選択されたマージ候補のL0予測、及びL1予測を利用するか否かを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を符号化情報格納メモリ205に格納する。ここで、xP、yPはピクチャ内での符号化ブロックの左上の画素の位置を示すインデックスである。インター予測部203の詳細な構成と動作は後述する。
 イントラ予測部204は、処理対象の符号化ブロックの予測モードPredModeがイントラ予測(MODE_INTRA)の時に、イントラ予測を行う。ビット列復号部201で復号された符号化情報にはイントラ予測モードが含まれている。イントラ予測部204は、ビット列復号部201で復号された符号化情報に含まれるイントラ予測モードに応じて、復号画像メモリ208に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、生成した予測画像信号を復号画像信号重畳部207に供給する。イントラ予測部204は、画像符号化装置100のイントラ予測部103に対応するものであるから、イントラ予測部103と同様の処理を行う。
 逆量子化・逆直交変換部206は、ビット列復号部201で復号された直交変換・量子化された残差に対して逆直交変換及び逆量子化を行い、逆直交変換・逆量子化された残差を得る。
 復号画像信号重畳部207は、インター予測部203でインター予測された予測画像信号、またはイントラ予測部204でイントラ予測された予測画像信号と、逆量子化・逆直交変換部206により逆直交変換・逆量子化された残差とを重畳することにより、復号画像信号を復号し、復号した復号画像信号を復号画像メモリ208に格納する。復号画像メモリ208に格納する際には、復号画像信号重畳部207は、復号画像に対して符号化によるブロック歪等を減少させるフィルタリング処理を施した後、復号画像メモリ208に格納してもよい。
 次に、画像符号化装置100におけるブロック分割部101の動作について説明する。図3は、画像をツリーブロックに分割し、各ツリーブロックをさらに分割する動作を示すフローチャートである。まず、入力された画像を、所定サイズのツリーブロックに分割する(ステップS1001)。各ツリーブロックについては、所定の順序、すなわちラスタスキャン順に走査し(ステップS1002)、処理対象のツリーブロックの内部を分割する(ステップS1003)。
 図7は、ステップS1003の分割処理の詳細動作を示すフローチャートである。まず、処理対象のブロックを4分割するか否かを判断する(ステップS1101)。
 処理対象ブロックを4分割すると判断した場合は、処理対象ブロックを4分割する(ステップS1102)。処理対象ブロックを分割した各ブロックについて、Zスキャン順、すなわち左上、右上、左下、右下の順に走査する(ステップS1103)。図5は、Zスキャン順の例であり、図6Aの601は、処理対象ブロックを4分割した例である。図6Aの601の番号0~3は処理の順番を示したものである。そしてステップS1101で分割した各ブロックについて、図7の分割処理を再帰的に実行する(ステップS1104)。
 処理対象ブロックを4分割しないと判断した場合は、2-3分割を行う(ステップS1105)。
 図8は、ステップS1105の2-3分割処理の詳細動作を示すフローチャートである。まず、処理対象のブロックを2-3分割するか否か、すなわち2分割または3分割の何れかを行うか否かを判断する(ステップS1201)。
 処理対象ブロックを2-3分割すると判断しない場合、すなわち分割しないと判断した場合は、分割を終了する(ステップS1211)。つまり、再帰的な分割処理により分割されたブロックに対して、さらなる再帰的な分割処理はしない。
 処理対象のブロックを2-3分割すると判断した場合は、さらに処理対象ブロックを2分割するか否か(ステップS1202)を判断する。
 処理対象ブロックを2分割すると判断した場合は、処理対象ブロックを上下(垂直方向)に分割するか否かを判断し(ステップS1203)、その結果に基づき、処理対象ブロックを上下(垂直方向)に2分割する(ステップS1204)か、処理対象ブロックを左右(水平方向)に2分割する(ステップS1205)。ステップS1204の結果、処理対象ブロックは、図6Bの602に示す通り、上下(垂直方向)2分割に分割され、ステップS1205の結果、処理対象ブロックは、図6Dの604に示す通り、左右(水平方向)2分割に分割される。
 ステップS1202において、処理対象のブロックを2分割すると判断しなかった場合、すなわち3分割すると判断した場合は、処理対象ブロックを上中下(垂直方向)に分割するか否かを判断し(ステップS1206)、その結果に基づき、処理対象ブロックを上中下(垂直方向)に3分割する(ステップS1207)か、処理対象ブロックを左中右(水平方向)に3分割する(ステップS1208)。ステップS1207の結果、処理対象ブロックは、図6Cの603に示す通り、上中下(垂直方向)3分割に分割され、ステップS1208の結果、処理対象ブロックは、図6Eの605に示す通り、左中右(水平方向)3分割に分割される。
 ステップS1204、ステップS1205、ステップS1207、ステップS1208のいずれかを実行後、処理対象ブロックを分割した各ブロックについて、左から右、上から下の順に走査する(ステップS1209)。図6B~Eの602から605の番号0~2は処理の順番を示したものである。分割した各ブロックについて、図8の2-3分割処理を再帰的に実行する(ステップS1210)。
 ここで説明した再帰的なブロック分割は、分割する回数、または、処理対象のブロックのサイズ等により、分割要否を制限してもよい。分割要否を制限する情報は、符号化装置と復号化装置の間で予め取り決めを行うことで、情報の伝達を行わない構成で実現してもよいし、符号化装置が分割要否を制限する情報を決定し、ビット列に記録することにより、復号化装置に伝達する構成で実現してもよい。
 あるブロックを分割したとき、分割前のブロックを親ブロックと呼び、分割後の各ブロックを子ブロックと呼ぶ。
 次に、画像復号装置200におけるブロック分割部202の動作について説明する。ブロック分割部202は、画像符号化装置100のブロック分割部101と同様の処理手順でツリーブロックを分割するものである。ただし、画像符号化装置100のブロック分割部101では、画像認識による最適形状の推定や歪レート最適化等最適化手法を適用し、最適なブロック分割の形状を決定するのに対し、画像復号装置200におけるブロック分割部202は、ビット列に記録されたブロック分割情報を復号することにより、ブロック分割形状を決定する点が異なる。
 第1の実施の形態のブロック分割に関するシンタックス(ビット列の構文規則)を図9に示す。coding_quadtree()はブロックの4分割処理にかかるシンタックスを表す。multi_type_tree()はブロックの2分割または3分割処理にかかるシンタックスを表す。qt_splitはブロックを4分割するか否かを示すフラグである。ブロックを4分割する場合は、qt_split=1とし、4分割しない場合は、qt_split=0とする。4分割する場合(qt_split=1)、4分割した各ブロックについて、再帰的に4分割処理をする(coding_quadtree(0), coding_quadtree(1), coding_quadtree(2), coding_quadtree(3)、引数の0~3は図6Aの601の番号に対応する。)。4分割しない場合(qt_split=0)は、multi_type_tree()に従い、後続の分割を決定する。mtt_splitは、さらに分割をするか否かを示すフラグである。さらに分割をする場合(mtt_split=1)、垂直方向に分割するか水平方向に分割するかを示すフラグであるmtt_split_verticalと、2分割するか3分割するかを決定するフラグであるmtt_split_binaryを伝送する。mtt_split_vertical=1は、垂直方向に分割することを示し、mtt_split_vertical=0は、水平方向に分割することを示す。mtt_split_binary=1は、2分割することを示し、mtt_split_binary=0は3分割することを示す。2分割する場合(mtt_split_binary=1)、2分割した各ブロックについて、再帰的に分割処理をする(multi_type_tree(0), multi_type_tree(1)、引数の0~1は図6B~Dの602または604の番号に対応する。)。3分割する場合(mtt_split_binary=0)、3分割した各ブロックについて、再帰的に分割処理をする(multi_type_tree(0), multi_type_tree(1), multi_type_tree(2)、0~2は図6Bの603または図6Eの605の番号に対応する。)。mtt_split=0となるまで、再帰的にmulti_type_treeを呼び出すことにより、階層的なブロック分割を行う。
 <インター予測>
 実施の形態に係るインター予測方法は、図1の画像符号化装置のインター予測部102および図2の画像復号装置のインター予測部203において実施される。
 実施の形態によるインター予測方法について、図面を用いて説明する。インター予測方法は符号化ブロック単位で符号化及び復号の処理の何れでも実施される。
 <符号化側のインター予測部102の説明>
 図16は図1の画像符号化装置のインター予測部102の詳細な構成を示す図である。通常予測動きベクトルモード導出部301は、複数の通常予測動きベクトル候補を導出して予測動きベクトルを選択し、選択した予測動きベクトルと、検出された動きベクトルとの差分動きベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分動きベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がインター予測モード判定部305に供給される。通常予測動きベクトルモード導出部301の詳細な構成と処理については後述する。
 通常マージモード導出部302では複数の通常マージ候補を導出して通常マージ候補を選択し、通常マージモードのインター予測情報を得る。このインター予測情報がインター予測モード判定部305に供給される。通常マージモード導出部302の詳細な構成と処理については後述する。
 サブブロック予測動きベクトルモード導出部303では複数のサブブロック予測動きベクトル候補を導出してサブブロック予測動きベクトルを選択し、選択したサブブロック予測動きベクトルと、検出した動きベクトルとの差分動きベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分動きベクトルがサブブロック予測動きベクトルモードのインター予測情報となる。このインター予測情報がインター予測モード判定部305に供給される。
 サブブロックマージモード導出部304では複数のサブブロックマージ候補を導出してサブブロックマージ候補を選択し、サブブロックマージモードのインター予測情報を得る。このインター予測情報がインター予測モード判定部305に供給される。
 インター予測モード判定部305では通常予測動きベクトルモード導出部301、通常マージモード導出部302、サブブロック予測動きベクトルモード導出部303、サブブロックマージモード導出部304から供給されるインター予測情報に基づいて、インター予測情報を判定する。インター予測モード判定部305から判定結果に応じたインター予測情報が動き補償予測部306に供給される。
 動き補償予測部306では判定されたインター予測情報に基づいて、復号画像メモリ104に格納されている参照画像信号に対してインター予測を行う。動き補償予測部306の詳細な構成と処理については後述する。
 <復号側のインター予測部203の説明>
 図22は図2の画像復号装置のインター予測部203の詳細な構成を示す図である。
 通常予測動きベクトルモード導出部401は複数の通常予測動きベクトル候補を導出して予測動きベクトルを選択し、選択した予測動きベクトルと、復号した差分動きベクトルとの加算値を算出して動きベクトルとする。復号されたインター予測モード、参照インデックス、動きベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。通常予測動きベクトルモード導出部401の詳細な構成と処理については後述する。
 通常マージモード導出部402では複数の通常マージ候補を導出して通常マージ候補を選択し、通常マージモードのインター予測情報を得る。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。通常マージモード導出部402の詳細な構成と処理については後述する。
 サブブロック予測動きベクトルモード導出部403では複数のサブブロック予測動きベクトル候補を導出してサブブロック予測動きベクトルを選択し、選択したサブブロック予測動きベクトルと、復号した差分動きベクトルとの加算値を算出して動きベクトルとする。復号されたインター予測モード、参照インデックス、動きベクトルがサブブロック予測動きベクトルモードのインター予測情報となる。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。
 サブブロックマージモード導出部404では複数のサブブロックマージ候補を導出してサブブロックマージ候補を選択し、サブブロックマージモードのインター予測情報を得る。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。
 動き補償予測部406では判定されたインター予測情報に基づいて、復号画像メモリ208に格納されている参照画像信号に対してインター予測を行う。動き補償予測部406の詳細な構成と処理については符号化側の動き補償予測部306と同様である。
 <通常予測動きベクトルモード導出部(通常AMVP)>
 図17の通常予測動きベクトルモード導出部301は、空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325、通常動きベクトル検出部326、予測動きベクトル候補選択部327、動きベクトル減算部328を含む。
 図23の通常予測動きベクトルモード導出部401は、空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425、予測動きベクトル候補選択部426、動きベクトル加算部427を含む。
 符号化側の通常予測動きベクトルモード導出部301および復号側の通常予測動きベクトルモード導出部401の処理手順について、それぞれ図19、図25のフローチャートを用いて説明する。図19は符号化側の通常動きベクトルモード導出部301による通常予測動きベクトルモード導出処理手順を示すフローチャートであり、図25は復号側の通常動きベクトルモード導出部401による通常予測動きベクトルモード導出処理手順を示すフローチャートである。
 <通常予測動きベクトルモード導出部(通常AMVP):符号化側の説明>
 図19を参照して符号化側の通常予測動きベクトルモード導出処理手順を説明する。図19の処理手順の説明において、図19に示した通常という言葉を省略することがある。
 まず、通常動きベクトル検出部326でインター予測モードおよび参照インデックス毎に通常動きベクトルを検出する(図19のステップS100)。
 続いて、空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325、予測動きベクトル候補選択部327、動きベクトル減算部328で、通常予測動きベクトルモードのインター予測で用いる動きベクトルの差分動きベクトルをL0、L1毎にそれぞれ算出する(図19のステップS101~S106)。具体的には処理対象ブロックの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0の予測動きベクトル候補リストmvpListL0を算出して、予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0の差分動きベクトルmvdL0を算出する。処理対象ブロックのインター予測モードがL1予測(Pred_L1)の場合、L1の予測動きベクトル候補リストmvpListL1を算出して、予測動きベクトルmvpL1を選択し、L1の動きベクトルmvL1の差分動きベクトルmvdL1を算出する。処理対象ブロックのインター予測モードが双予測(Pred_BI)の場合、L0予測とL1予測が共に行われ、L0の予測動きベクトル候補リストmvpListL0を算出して、L0の予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0の差分動きベクトルmvdL0を算出するとともに、L1の予測動きベクトル候補リストmvpListL1を算出して、L1の予測動きベクトルmvpL1を算出し、L1の動きベクトルmvL1の差分動きベクトルmvdL1をそれぞれ算出する。
 L0、L1それぞれについて、差分動きベクトル算出処理を行うが、L0、L1ともに共通の処理となる。したがって、以下の説明においてはL0、L1を共通のLXとして表す。L0の差分動きベクトルを算出する処理ではLXのXが0であり、L1の差分動きベクトルを算出する処理ではLXのXが1である。また、LXの差分動きベクトルを算出する処理中に、LXではなく、もう一方のリストの情報を参照する場合、もう一方のリストをLYとして表す。
 LXの動きベクトルmvLXを使用する場合(図19のステップS102:YES)、LXの予測動きベクトルの候補を算出してLXの予測動きベクトル候補リストmvpListLXを構築する(図19のステップS103)。通常予測動きベクトルモード導出部301の中の空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325で複数の予測動きベクトルの候補を導出して予測動きベクトル候補リストmvpListLXを構築する。図19のステップS103の詳細な処理手順については図20のフローチャートを用いて後述する。
 続いて、予測動きベクトル候補選択部327により、LXの予測動きベクトル候補リストmvpListLXからLXの予測動きベクトルmvpLXを選択する(図19のステップS104)。ここで、予測動きベクトル候補リストmvpListLXの中で、ある1つの要素(0から数えてi番目の要素)をmvpListLX[i]として表す。動きベクトルmvLXと予測動きベクトル候補リストmvpListLXの中に格納された各予測動きベクトルの候補mvpListLX[i]との差分であるそれぞれの差分動きベクトルを算出する。それら差分動きベクトルを符号化したときの符号量を予測動きベクトル候補リストmvpListLXの要素(予測動きベクトル候補)ごとに算出する。そして、予測動きベクトル候補リストmvpListLXに登録された各要素の中で、予測動きベクトルの候補毎の符号量が最小となる予測動きベクトルの候補mvpListLX[i]を予測動きベクトルmvpLXとして選択し、そのインデックスiを取得する。予測動きベクトル候補リストmvpListLXの中で最小の発生符号量となる予測動きベクトルの候補が複数存在する場合には、予測動きベクトル候補リストmvpListLXの中のインデックスiが小さい番号で表される予測動きベクトルの候補mvpListLX[i]を最適な予測動きベクトルmvpLXとして選択し、そのインデックスiを取得する。
 続いて、動きベクトル減算部328で、LXの動きベクトルmvLXから選択されたLXの予測動きベクトルmvpLXを減算し、
  mvdLX = mvLX - mvpLX
としてLXの差分動きベクトルmvdLXを算出する(図19のステップS105)。
 <通常予測動きベクトルモード導出部(通常AMVP):復号側の説明>
 次に、図25を参照して復号側の通常予測動きベクトルモード処理手順を説明する。復号側では、空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425で、通常予測動きベクトルモードのインター予測で用いる動きベクトルをL0,L1毎にそれぞれ算出する(図25のステップS201~S206)。具体的には処理対象ブロックの予測モードPredModeがインター予測(MODE_INTER)で、処理対象ブロックのインター予測モードがL0予測(Pred_L0)の場合、L0の予測動きベクトル候補リストmvpListL0を算出して、予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出する。処理対象ブロックのインター予測モードがL1予測(Pred_L1)の場合、L1の予測動きベクトル候補リストmvpListL1を算出して、予測動きベクトルmvpL1を選択し、L1の動きベクトルmvL1を算出する。処理対象ブロックのインター予測モードが双予測(Pred_BI)の場合、L0予測とL1予測が共に行われ、L0の予測動きベクトル候補リストmvpListL0を算出して、L0の予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出するとともに、L1の予測動きベクトル候補リストmvpListL1を算出して、L1の予測動きベクトルmvpL1を算出し、L1の動きベクトルmvL1をそれぞれ算出する。
 符号化側と同様に、復号側でもL0、L1それぞれについて、動きベクトル算出処理を行うが、L0、L1ともに共通の処理となる。したがって、以下の説明においてはL0、L1を共通のLXとして表す。LXは処理対象の符号化ブロックのインター予測に用いるインター予測モードを表す。L0の動きベクトルを算出する処理ではXが0であり、L1の動きベクトルを算出する処理ではXが1である。また、LXの動きベクトルを算出する処理中に、算出対象のLXと同じ参照リストではなく、もう一方の参照リストの情報を参照する場合、もう一方の参照リストをLYとして表す。
 LXの動きベクトルmvLXを使用する場合(図25のステップS202:YES)、LXの予測動きベクトルの候補を算出してLXの予測動きベクトル候補リストmvpListLXを構築する(図25のステップS203)。通常予測動きベクトルモード導出部401の中の空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425で複数の予測動きベクトルの候補を算出し、予測動きベクトル候補リストmvpListLXを構築する。図25のステップS203の詳細な処理手順については図20のフローチャートを用いて後述する。
 続いて、予測動きベクトル候補選択部426で予測動きベクトル候補リストmvpListLXからビット列復号部201にて復号されて供給される予測動きベクトルのインデックスmvpIdxLXに対応する予測動きベクトルの候補mvpListLX[mvpIdxLX]を選択された予測動きベクトルmvpLXとして取り出す(図25のステップS204)。
 続いて、動きベクトル加算部427でビット列復号部201にて復号されて供給されるLXの差分動きベクトルmvdLXとLXの予測動きベクトルmvpLXを加算し、
  mvLX = mvpLX + mvdLX
としてLXの動きベクトルmvLXを算出する(図25のステップS205)。
 <通常予測動きベクトルモード導出部(通常AMVP):動きベクトルの予測方法>
 図20は本発明の実施の形態に係る画像符号化装置の通常予測動きベクトルモード導出部301及び画像復号装置の通常予測動きベクトルモード導出部401とで共通する機能を有する通常予測動きベクトルモード導出処理の処理手順を表すフローチャートである。
 通常予測動きベクトルモード導出部301及び通常予測動きベクトルモード導出部401では、予測動きベクトル候補リストmvpListLXを備えている。予測動きベクトル候補リストmvpListLXはリスト構造を成し、予測動きベクトル候補リスト内部の所在を示す予測動きベクトルインデックスと、インデックスに対応する予測動きベクトル候補とを要素として格納する記憶領域が設けられている。予測動きベクトルインデックスの数字は0から開始され、予測動きベクトル候補リストmvpListLXの記憶領域に、予測動きベクトル候補が格納される。本実施の形態においては、予測動きベクトル候補リストmvpListLXは少なくとも2個の予測動きベクトル候補(インター予測情報)を登録することができるものとする。さらに、予測動きベクトル候補リストmvpListLXに登録されている予測動きベクトル候補数を示す変数numCurrMvpCandに0を設定する。
 空間予測動きベクトル候補導出部321及び421は、左側に隣接するブロックからの予測動きベクトルの候補を導出する。この処理では、左側に隣接するブロック(図11のA0またはA1)のインター予測情報、すなわち予測動きベクトル候補が利用できるか否かを示すフラグ、及び動きベクトル、参照インデックス等を参照して予測動きベクトルmvLXA導出し、導出したmvLXAを予測動きベクトル候補リストmvpListLXに追加する(図20のステップS301)。なお、L0予測のときXは0、L1予測のときXは1とする(以下同様)。続いて、空間予測動きベクトル候補導出部321及び421は、上側に隣接するブロックからの予測動きベクトルの候補を導出する。この処理では、上側に隣接するブロック(図11のB0,B1,またはB2)のインター予測情報、すなわち予測動きベクトル候補が利用できるか否かを示すフラグ、及び動きベクトル、参照インデックス等を参照して予測動きベクトルmvLXBを導出し、それぞれ導出したmvLXAとmvLXBとが等しくなければ、mvLXBを予測動きベクトル候補リストmvpListLXに追加する(図20のステップS302)。図20のステップS301とS302の処理は参照する隣接ブロックの位置と数が異なる点以外は共通であり、符号化ブロックの予測動きベクトル候補が利用できるか否かを示すフラグavailableFlagLXN、及び動きベクトルmvLXN、参照インデックスrefIdxN(NはAまたはBを示す、以下同様)を導出する。
 続いて、時間予測動きベクトル候補導出部322及び422は、現在の処理対象ピクチャとは時間が異なるピクチャにおけるブロックからの予測動きベクトルの候補を導出する。この処理では、異なる時間のピクチャの符号化ブロックの予測動きベクトル候補が利用できるか否かを示すフラグavailableFlagLXCol、及び動きベクトルmvLXCol、参照インデックスrefIdxCol、参照リストlistColを導出し、mvLXColを予測動きベクトル候補リストmvpListLXに追加する(図20のステップS303)。
 なお、シーケンス(SPS)、ピクチャ(PPS)、またはスライスの単位で時間予測動きベクトル候補導出部322及び422の処理を省略することができるものとする。
 続いて、履歴予測動きベクトル候補導出部323及び423は履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補を予測動きベクトル候補リストmvpListLXに追加する。(図20のステップS304)。このステップS304の登録処理手順の詳細については図29のフローチャートを用いて後述する。
 続いて予測動きベクトル候補補充部325及び425は予測動きベクトル候補リストmvpListLXを満たすまで、(0,0)等の、所定の値の予測動きベクトル候補を追加する(図20のS305)。
 <通常マージモード導出部(通常マージ)>
 図18の通常マージモード導出部302は、空間マージ候補導出部341、時間マージ候補導出部342、平均マージ候補導出部344、履歴マージ候補導出部345、マージ候補補充部346、マージ候補選択部347を含む。
 図24の通常マージモード導出部402は、空間マージ候補導出部441、時間マージ候補導出部442、平均マージ候補導出部444、履歴マージ候補導出部445、マージ候補補充部446、マージ候補選択部447を含む。
 図21は本発明の実施の形態に係る画像符号化装置の通常マージモード導出部302及び画像復号装置の通常マージモード導出部402とで共通する機能を有する通常マージモード導出処理の手順を説明するフローチャートである。
 以下、諸過程を順を追って説明する。なお、以下の説明においては特に断りのない限りスライスタイプslice_typeがBスライスの場合について説明するが、Pスライスの場合にも適用できる。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 通常マージモード導出部302及び通常マージモード導出部402では、マージ候補リストmergeCandListを備えている。マージ候補リストmergeCandListはリスト構造を成し、マージ候補リスト内部の所在を示すマージインデックスと、インデックスに対応するマージ候補を要素として格納する記憶領域が設けられている。マージインデックスの数字は0から開始され、マージ候補リストmergeCandListの記憶領域に、マージ候補が格納される。以降の処理では、マージ候補リストmergeCandListに登録されたマージインデックスiのマージ候補は、mergeCandList[i]で表すこととする。本実施の形態においては、マージ候補リストmergeCandListは少なくとも6個のマージ候補(インター予測情報)を登録することができるものとする。さらに、マージ候補リストmergeCandListに登録されているマージ候補数を示す変数numCurrMergeCandに0を設定する。
 空間マージ候補導出部341及び空間マージ候補導出部441では、画像符号化装置の符号化情報格納メモリ111または画像復号装置の符号化情報格納メモリ205に格納されている符号化情報から、処理対象ブロックに隣接するそれぞれのブロック(図11のB1、A1、B0、A0、B2)からの空間マージ候補をB1、A1、B0、A0、B2の順に導出して、導出された空間マージ候補をマージ候補リストmergeCandListに登録する(図21のステップS401)。ここで、B1、A1、B0、A0、B2または時間マージ候補Colのいずれかを示すNを定義する。ブロックNのインター予測情報が空間マージ候補として利用できるか否かを示すフラグavailableFlagN、空間マージ候補NのL0の参照インデックスrefIdxL0N及びL1の参照インデックスrefIdxL1N、L0予測が行われるか否かを示すL0予測フラグpredFlagL0NおよびL1予測が行われるか否かを示すL1予測フラグpredFlagL1N、L0の動きベクトルmvL0N、L1の動きベクトルmvL1Nを導出する。ただし、本実施の形態においては処理対象となる符号化ブロックに含まれるブロックのインター予測情報を参照せずに、マージ候補を導出するので、処理対象の符号化ブロックに含まれるブロックのインター予測情報を用いる空間マージ候補は導出しない。
 続いて、時間マージ候補導出部342及び時間マージ候補導出部442では、異なる時間のピクチャからの時間マージ候補を導出して、導出された時間マージ候補をマージ候補リストmergeCandListに登録する(図21のステップS402)。時間マージ候補が利用できるか否かを示すフラグavailableFlagCol、時間マージ候補のL0予測が行われるか否かを示すL0予測フラグpredFlagL0ColおよびL1予測が行われるか否かを示すL1予測フラグpredFlagL1Col、及びL0の動きベクトルmvL0Col、L1の動きベクトルmvL1Colを導出する。
 なお、シーケンス(SPS)、ピクチャ(PPS)、またはスライスの単位で時間マージ候補導出部342及び時間マージ候補導出部442の処理を省略することができるものとする。
 続いて、履歴マージ候補導出部345及び履歴マージ候補導出部445では、履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補をマージ候補リストmergeCandListに登録する(図21のステップS403)。
 なお、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが、最大マージ候補数MaxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが最大マージ候補数MaxNumMergeCandを上限として履歴マージ候補は導出されて、マージ候補リストmergeCandListに登録される。
 続いて、平均マージ候補導出部344及び平均マージ候補導出部444では、マージ候補リストmergeCandListから平均マージ候補を導出して、導出された平均マージ候補をマージ候補リストmergeCandListに追加する(図21のステップS404)。
 なお、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが、最大マージ候補数MaxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが最大マージ候補数MaxNumMergeCandを上限として平均マージ候補は導出されて、マージ候補リストmergeCandListに登録される。
 ここで、平均マージ候補は、マージ候補リストmergeCandListに登録されている第1のマージ候補と第2のマージ候補の有する動きベクトルをL0予測及びL1予測毎に平均して得られる動きベクトルを有する新たなマージ候補である。
 続いて、マージ候補補充部346及びマージ候補補充部446では、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが、最大マージ候補数MaxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが最大マージ候補数MaxNumMergeCandを上限として追加マージ候補を導出して、マージ候補リストmergeCandListに登録する(図21のステップS405)。最大マージ候補数MaxNumMergeCandを上限として、Pスライスでは、動きベクトルが(0,0)の値を持つ予測モードがL0予測(Pred_L0)のマージ候補を追加する。Bスライスでは、動きベクトルが(0,0)の値を持つ予測モードが双予測(Pred_BI)のマージ候補を追加する。マージ候補を追加する際の参照インデックスは、すでに追加した参照インデックスと異なる。
 続いて、マージ候補選択部347及びマージ候補選択部447では、マージ候補リストmergeCandList内に登録されているマージ候補からマージ候補を選択する。符号化側のマージ候補選択部347では、符号量とひずみ量を算出することによりマージ候補を選択し、選択されたマージ候補を示すマージインデックス、マージ候補のインター予測情報を、インター予測モード判定部305を介して動き補償予測部306に供給する。一方、復号側のマージ候補選択部447では、復号されたマージインデックスに基づいて、マージ候補を選択し、選択されたマージ候補を動き補償予測部406に供給する。
 <履歴予測動きベクトル候補リストの更新>
 次に、符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListの初期化方法および更新方法について詳細に説明する。図26は履歴予測動きベクトル候補リスト初期化・更新処理手順を説明するフローチャートである。
 本実施の形態では、履歴予測動きベクトル候補リストHmvpCandListの更新は、符号化情報格納メモリ111及び符号化情報格納メモリ205で実施されるものとする。インター予測部102及びインター予測部203の中に履歴予測動きベクトル候補リスト更新部を設置して履歴予測動きベクトル候補リストHmvpCandListの更新を実施させてもよい。
 スライスの先頭で履歴予測動きベクトル候補リストHmvpCandListの初期設定を行い、符号化側では予測方法決定部105で通常予測動きベクトルモードまたは通常マージモードが選択された場合に履歴予測動きベクトル候補リストHmvpCandListを更新し、復号側では、ビット列復号部201で復号された予測情報が通常予測動きベクトルモードまたは通常マージモードの場合に履歴予測動きベクトル候補リストHmvpCandListを更新する。
 通常予測動きベクトルモードまたは通常マージモードでインター予測を行う際に用いるインター予測情報を、インター予測情報候補hMvpCandとして履歴予測動きベクトル候補リストHmvpCandListに登録する。インター予測情報候補hMvpCandには、L0の参照インデックスrefIdxL0およびL1の参照インデックスrefIdxL1、L0予測が行われるか否かを示すL0予測フラグpredFlagL0およびL1予測が行われるか否かを示すL1予測フラグpredFlagL1、L0の動きベクトルmvL0、L1の動きベクトルmvL1が含まれる。
 符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListに登録されている要素(すなわち、インター予測情報)の中に、インター予測情報候補hMvpCandと同じ値のインター予測情報が存在する場合は、履歴予測動きベクトル候補リストHmvpCandListからその要素を削除する。一方、インター予測情報候補hMvpCandと同じ値のインター予測情報が存在しない場合は、履歴予測動きベクトル候補リストHmvpCandListの先頭の要素を削除し、履歴予測動きベクトル候補リストHmvpCandListの最後に、インター予測情報候補hMvpCandを追加する。
 本発明の符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListの要素の数は6とする。
 まず、スライス単位での履歴予測動きベクトル候補リストHmvpCandListの初期化を行う(図26のステップS2101)。スライスの先頭で履歴予測動きベクトル候補リストHmvpCandListのすべての要素を空にし、履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補の数(現在の候補数)NumHmvpCandの値は0に設定する。
 なお、履歴予測動きベクトル候補リストHmvpCandListの初期化をスライス単位(スライスの最初の符号化ブロック)で実施するとしたが、ピクチャ単位、タイル単位やツリーブロック行単位で実施しても良い。
 続いて、スライス内の符号化ブロック毎に以下の履歴予測動きベクトル候補リストHmvpCandListの更新処理を繰り返し行なう(図26のステップS2102~S2107)。
 まず、符号化ブロック単位での初期設定を行う。同一候補が存在するか否かを示すフラグidenticalCandExistにFALSE(偽)の値を設定し、削除対象の候補を示す削除対象インデックスremoveIdxに0を設定する(図26のステップS2103)。
 登録対象のインター予測情報候補hMvpCandが存在するか否かを判定する(図26のステップS2104)。符号化側の予測方法決定部105で通常予測動きベクトルモードまたは通常マージモードと判定された場合、または復号側のビット列復号部201で通常予測動きベクトルモードまたは通常マージモードとして復号された場合、そのインター予測情報を登録対象のインター予測情報候補hMvpCandとする。符号化側の予測方法決定部105でイントラ予測モード、サブブロック予測動きベクトルモードまたはサブブロックマージモードと判定された場合、または復号側のビット列復号部201でイントラ予測モード、サブブロック予測動きベクトルモードまたはサブブロックマージモードとして復号された場合、履歴予測動きベクトル候補リストHmvpCandListの更新処理を行わず、登録対象のインター予測情報候補hMvpCandは存在しない。登録対象のインター予測情報候補hMvpCandが存在しない場合はステップS2105~S2106をスキップする(図26のステップS2104:NO)。登録対象のインター予測情報候補hMvpCandが存在する場合はステップS2105以下の処理を行う(図26のステップS2104:YES)。
 続いて、履歴予測動きベクトル候補リストHmvpCandListの各要素の中に登録対象のインター予測情報候補hMvpCandと同じ値の要素(インター予測情報)、すなわち同一の要素が存在するか否かを判定する(図26のステップS2105)。図27はこの同一要素確認処理手順のフローチャートである。履歴予測動きベクトル候補の数NumHmvpCandの値が0の場合(図27のステップS2121:NO)、履歴予測動きベクトル候補リストHmvpCandListは空で、同一候補は存在しないので図27のステップS2122~S2125をスキップし、本同一要素確認処理手順を終了する。履歴予測動きベクトル候補の数NumHmvpCandの値が0より大きい場合(図27のステップS2121のYES)、履歴予測動きベクトルインデックスhMvpIdxが0からNumHmvpCand-1まで、ステップS2123の処理を繰り返す(図27のステップS2122~S2125)。まず、履歴予測動きベクトル候補リストの0から数えてhMvpIdx番目の要素HmvpCandList[hMvpIdx]がインター予測情報候補hMvpCandと同一か否かを比較する(図27のステップS2123)。同一の場合(図27のステップS2123:YES)、同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)の値を設定し、削除対象の要素の位置を示す削除対象インデックスremoveIdxに現在の履歴予測動きベクトルインデックスhMvpIdxの値を設定し、本同一要素確認処理を終了する。同一でない場合(図27のステップS2123:NO)、hMvpIdxを1インクリメントし、履歴予測動きベクトルインデックスhMvpIdxがNumHmvpCand-1以下であれば、ステップS2123以降の処理を行う。
 再び図26のフローチャートに戻り、履歴予測動きベクトル候補リストHmvpCandListの要素のシフト及び追加処理を行う(図26のステップS2106)。図28は図26のステップS2106の履歴予測動きベクトル候補リストHmvpCandListの要素シフト/追加処理手順のフローチャートである。まず、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除いてから新たな要素を追加するか、要素を除かずに新たな要素追加するかを判定する。具体的には同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)またはNumHmvpCandが6か否かを比較する(図28のステップS2141)。同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)または現在の候補数NumHmvpCandが6のいずれかの条件を満たす場合(図28のステップS2141:YES)、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除いてから新たな要素を追加する。インデックスiの初期値をremoveIdx + 1の値に設定する。この初期値からNumHmvpCandまで、ステップS2143の要素シフト処理を繰り返す。(図28のステップS2142~S2144)。HmvpCandList[ i - 1 ]にHmvpCandList[ i ]の要素をコピーすることで要素を前方にシフトし(図28のステップS2143)、iを1インクリメントする(図28のステップS2142~S2144)。続いて、履歴予測動きベクトル候補リストの最後に相当する0から数えて(NumHmvpCand-1)番目 HmvpCandList[NumHmvpCand-1]にインター予測情報候補hMvpCandを追加し(図28のステップS2145)、本履歴予測動きベクトル候補リストHmvpCandListの要素シフト・追加処理を終了する。一方、同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)およびNumHmvpCandが6のいずれの条件も満たさない場合(図28のステップS2141:NO)、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除かずに、履歴予測動きベクトル候補リストの最後にインター予測情報候補hMvpCandを追加する(図28のステップS2146)。ここで、履歴予測動きベクトル候補リストの最後とは、0から数えてNumHmvpCand番目のHmvpCandList[NumHmvpCand]である。また、NumHmvpCandを1インクリメントして、本履歴予測動きベクトル候補リストHmvpCandListの要素シフトおよび追加処理を終了する。
 図31は履歴予測動きベクトル候補リストの更新処理の一例を説明する図である。6つの要素(インター予測情報)を登録済みの履歴予測動きベクトル候補リストHmvpCandListに新たな要素を追加する場合、履歴予測動きベクトル候補リストHmvpCandListの前方の要素から順に新たなインター予測情報と比較して(図31A)、新たな要素が履歴予測動きベクトル候補リストHmvpCandListの先頭から3番目の要素HMVP2と同じ値であれば、履歴予測動きベクトル候補リストHmvpCandListから要素HMVP2を削除して後方の要素HMVP3~HMVP5を前方に1つずつシフト(コピー)し、履歴予測動きベクトル候補リストHmvpCandListの最後に新たな要素を追加して(図31B)、履歴予測動きベクトル候補リストHmvpCandListの更新を完了する(図31C)。
 <履歴予測動きベクトル候補導出処理>
 次に、符号化側の通常予測動きベクトルモード導出部301の履歴予測動きベクトル候補導出部323、復号側の通常予測動きベクトルモード導出部401の履歴予測動きベクトル候補導出部423で共通の処理である図20のステップS304の処理手順である履歴予測動きベクトル候補リストHmvpCandListからの履歴予測動きベクトル候補の導出方法について詳細に説明する。図29は履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。
 現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数(ここでは2とする)以上または履歴予測動きベクトル候補の数がNumHmvpCandの値が0の場合(図29のステップS2201のNO)、図29のステップS2202からS2209の処理を省略し、履歴予測動きベクトル候補導出処理手順を終了する。現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数である2より小さい場合、かつ履歴予測動きベクトル候補の数NumHmvpCandの値が0より大きい場合(図29のステップS2201のYES)、図29のステップS2202からS2209の処理を行う。
 続いて、インデックスiが1から、4と履歴予測動きベクトル候補の数numCheckedHMVPCandのいずれか小さい値まで、図29のステップS2203からS2208の処理を繰り返す(図29のステップS2202~S2209)。現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数である2以上の場合(図29のステップS2203:NO)、図29のステップS2204からS2209の処理を省略し、本履歴予測動きベクトル候補導出処理手順を終了する。現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数である2より小さい場合(図29のステップS2203:YES)、図29のステップS2204以降の処理を行う。
 続いて、ステップS2205からS2207までの処理をYが0と1(L0とL1)についてそれぞれ行う(図29のステップS2204~S2208)。現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数である2以上の場合(図29のステップS2205:NO)、図29のステップS2206からS2209の処理を省略し、本履歴予測動きベクトル候補導出処理手順を終了する。現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストmvpListLXの最大要素数である2より小さい場合(図29のステップS2205:YES)、図29のステップS2206以降の処理を行う。
 続いて、履歴予測動きベクトル候補リストHmvpCandListの中に、符号化/復号対象動きベクトルの参照インデックスrefIdxLXと同じ参照インデックスの要素であり、予測動きベクトルリストmvpListLXのどの要素とも異なる要素の場合(図29のステップS2206:YES)、予測動きベクトル候補リストの0から数えてnumCurrMvpCand番目の要素mvpListLX[numCurrMvpCand]に履歴予測動きベクトル候補HmvpCandList[NumHmvpCand - i]のLYの動きベクトルを追加し(図29のステップS2207)、現在の予測動きベクトル候補の数numCurrMvpCandを1インクリメントする。履歴予測動きベクトル候補リストHmvpCandListの中に、符号化/復号対象動きベクトルの参照インデックスrefIdxLXと同じ参照インデックスの要素であり、予測動きベクトルリストmvpListLXのどの要素とも異なる要素がない場合(図29のステップS2206:NO)、ステップS2207の追加処理をスキップする。
 以上の図29のステップS2205からS2207の処理をL0とL1で双方ともに行う(図29のステップS2204~S2208)。インデックスiを1インクリメントし、インデックスiが4と履歴予測動きベクトル候補の数NumHmvpCandのいずれか小さい値以下の場合、再びステップS2203以降の処理を行う(図29のステップS2202~S2209)。
 <履歴マージ候補導出処理>
 次に、符号化側の通常マージモード導出部302の履歴マージ候補導出部345、復号側の通常マージモード導出部402の履歴マージ候補導出部445で共通の処理である図21のステップS404の処理手順である履歴マージ候補リストHmvpCandListからの履歴マージ候補の導出方法について詳細に説明する。図30は履歴マージ候補導出処理手順を説明するフローチャートである。
 まず、初期化処理を行う(図30のステップS2301)。isPruned[i]の0から(numCurrMergeCand -1)番目のそれぞれの要素にFALSEの値を設定し、変数numOrigMergeCandに現在のマージ候補リストに登録されている要素の数numCurrMergeCandを設定する。
 続いて、インデックスhMvpIdxの初期値を1に設定し、この初期値からNumHmvpCandまで、図30のステップS2303からステップS2310までの追加処理を繰り返す(図30のステップS2302~S2311)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下でなければ、マージ候補リストのすべての要素にマージ候補が追加されたので、本履歴マージ候補導出処理を終了する(図30のステップS2303のNO)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下の場合、ステップS2304以降の処理を行う。sameMotionにFALSE(偽)の値を設定する(図30のステップS2304)。続いて、インデックスiの初期値を0に設定し、この初期値からnumOrigMergeCand-1まで図30のステップS2306、S2307の処理を行う(図30のS2305~S2308)。履歴動きベクトル予測候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand- hMvpIdx]がマージ候補リストの0から数えてi番目の要素mergeCandList[i]と同じ値か否かを比較する(図30のステップS2306)。
 マージ候補の同じ値とはマージ候補が持つすべての構成要素(インター予測モード、参照インデックス、動きベクトル)の値が同じ場合にマージ候補が同じ値とする。マージ候補が同じ値、かつisPruned[i]がFALSEの場合(図30のステップS2306のYES)、sameMotionおよびisPruned[i]共にTRUE(真)を設定する(図30のステップS2307)。同じ値でない場合(図30のステップS2306のNO)、ステップS2307の処理をスキップする。図30のステップS2305からステップS2308までの繰り返し処理が完了したらsameMotionがFALSE(偽)か否かを比較し(図30のステップS2309)、sameMotionが FALSE(偽)の場合(図30のステップS2309のYES)、すなわち履歴予測動きベクトル候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand - hMvpIdx]はmergeCandListに存在しないので、マージ候補リストのnumCurrMergeCand番目のmergeCandList[numCurrMergeCand]に履歴予測動きベクトル候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand - hMvpIdx]を追加し、numCurrMergeCandを1インクリメントする(図30のステップS2310)。インデックスhMvpIdxを1インクリメントし(図30のステップS2302)、図30のステップS2302~S2311の繰り返し処理を行う。
 履歴予測動きベクトル候補リストのすべての要素の確認が完了するか、マージ候補リストのすべての要素にマージ候補が追加されたら、本履歴マージ候補の導出処理を完了する。
 <平均マージ候補導出処理>
 次に、符号化側の通常マージモード導出部302の平均マージ候補導出部344、復号側の通常マージモード導出部402の平均マージ候補導出部444で共通の処理である図21のステップS403の処理手順である平均マージ候補の導出方法について詳細に説明する。図39は平均マージ候補導出処理手順を説明するフローチャートである。
 まず、初期化処理を行う(図39のステップS1301)。変数numOrigMergeCandに現在のマージ候補リストに登録されている要素の数numCurrMergeCandを設定する。
 続いて、マージ候補リストの先頭から順に走査し、2つの動き情報を決定する。1つ目の動き情報を示すインデックスi=0、2つ目の動き情報を示すインデックスj=1とする。(図39のステップS1302~S1303)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下でなければ、マージ候補リストのすべての要素にマージ候補が追加されたので、本履歴マージ候補導出処理を終了する(図39のステップS1304)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下の場合は、ステップS1305以降の処理を行う。
 マージ候補リストのi番目の動き情報mergeCandList[i]とマージ候補リストのj番目の動き情報mergeCandList[j]がともに無効であるか否かを判定し(図39のステップS1305)、ともに無効である場合は、mergeCandList[i]とmergeCandList[j]の平均マージ候補の導出を行わず、次の要素に移る。mergeCandList[i]とmergeCandList[j]がともに無効でない場合は、Xを0と1として以下の処理を繰り返す(図39のステップS1306からS1314)。
 mergeCandList[i]のLX予測が有効であるかを判定する(図39のステップS1307)。mergeCandList[i]のLX予測が有効である場合は、mergeCandList[j]のLX予測が有効であるかを判定する(図39のステップS1308)。mergeCandList[j]のLX予測が有効である場合、すなわち、mergeCandList[i]のLX予測とmergeCandList[j]のLX予測がともに有効である場合は、mergeCandList[i]のLX予測の動きベクトルとmergeCandList[j]のLX予測の動きベクトルを平均したLX予測の動きベクトルとmergeCandList[i]のLX予測の参照インデックスを有するLX予測の平均マージ候補を導出してaverageCandのLX予測に設定し、averageCandのLX予測を有効とする(図39のステップS1309)。図39のステップS1308で、mergeCandList[j]のLX予測が有効でない場合、すなわち、mergeCandList[i]のLX予測が有効、かつmergeCandList[j]のLX予測が無効である場合は、mergeCandList[i]のLX予測の動きベクトルと参照インデックスを有するLX予測の平均マージ候補を導出してaverageCandのLX予測に設定し、averageCandのLX予測を有効とする(図39のステップS1310)。図39のステップS1307で、mergeCandList[i]のLX予測が有効でない場合、mergeCandList[j]のLX予測が有効であるか否かを判定する(図39のステップS1311)。mergeCandList[j]のLX予測が有効である場合、すなわちmergeCandList[i]のLX予測が無効、かつmergeCandList[j] のLX予測が有効である場合は、mergeCandList[j]のLX予測の動きベクトルと参照インデックスを有するLX予測の平均マージ候補を導出してaverageCandのLX予測に設定し、averageCandのLX予測を有効とする(図39のステップS1312)。図39のステップS1311で、mergeCandList[j]のLX予測が有効でない場合、すなわちmergeCandList[i]のLX予測、mergeCandList[j]のLX予測がともに無効である場合は、averageCandのLX予測を無効とする(図39のステップS1312)。
 ここで、LX予測が有効であるとは参照インデックスrefIdxLXが0以上である場合であり、LX予測が無効、つまり存在しない場合には参照インデックスrefIdxLXは-1に設定する。
 以上のように生成されたL0予測、L1予測またはBI予測の平均マージ候補averageCandを、マージ候補リストのnumCurrMergeCand番目のmergeCandList[numCurrMergeCand]に追加し、numCurrMergeCandを1インクリメントする(図39のステップS1315)。以上で、平均マージ候補の導出処理を完了する。
 なお、平均マージ候補は動きベクトルの水平成分と動きベクトルの垂直成分それぞれで平均される。
 <動き補償予測処理>
 動き補償予測部306は、符号化において現在予測処理の対象となっているブロックの位置およびサイズを取得する。また、動き補償予測部306は、インター予測情報をインター予測モード判定部305から取得する。取得したインター予測情報から参照インデックスおよび動きベクトルを導出し、復号画像メモリ104内の参照インデックスで特定される参照ピクチャを、動きベクトルの分だけ予測処理の対象となっているブロックの画像信号と同一位置より移動させた位置の画像信号を取得した後に予測信号を生成する。
 インター予測におけるインター予測モードがL0予測やL1予測のような、単一の参照ピクチャからの予測の場合には、1つの参照ピクチャから取得した予測信号を動き補償予測信号とし、インター予測モードがBI予測のような、予測モードが2つの参照ピクチャからの予測の場合には、2つの参照ピクチャから取得した予測信号を重みづけ平均したものを動き補償予測信号とし、動き補償予測信号を予測方法決定部105に供給する。ここでは双予測の重みづけ平均の比率を1:1とするが、他の比率を用いて重みづけ平均を行っても良い。例えば、予測対象となっているピクチャと参照ピクチャとのピクチャ間隔が近いものほど重みづけの比率が大きくなるようにしてもよい。また、重みづけ比率の算出をピクチャ間隔の組み合わせと重みづけ比率との対応表を用いて行うようにしても良い。
 動き補償予測部406は、符号化側の動き補償予測部306と同様の機能をもつ。動き補償予測部406は、インター予測情報を、通常予測動きベクトルモード導出部401、通常マージモード導出部402、サブブロック予測動きベクトルモード導出部403、サブブロックマージモード導出部404から、スイッチ408を介して取得する。動き補償予測部406は、得られた動き補償予測信号を、復号画像信号重畳部207に供給する。
 <インター予測モードについて>
 単一の参照ピクチャからの予測を行う処理を単予測と定義し、単予測の場合はL0予測またはL1予測という、参照リストL0、L1に登録された2つの参照ピクチャのいずれか一方を利用した予測を行う。
 図32は単予測であってL0の参照ピクチャ(RefL0Pic)が処理対象ピクチャ(CurPic)より前の時刻にある場合を示している。図33は単予測であってL0予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合を示している。同様に、図32および図33のL0予測の参照ピクチャをL1予測の参照ピクチャ(RefL1Pic)に置き換えて単予測を行うこともできる。
 2つの参照ピクチャからの予測を行う処理を双予測と定義し、双予測の場合はL0予測とL1予測の双方を利用してBI予測と表現する。図34は双予測であってL0予測の参照ピクチャが処理対象ピクチャより前の時刻にあって、L1予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合を示している。図35は双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが処理対象ピクチャより前の時刻にある場合を示している。図36は双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが処理対象ピクチャより後の時刻にある場合を示している。
 このように、L0/L1の予測種別と時間の関係は、L0が過去方向、L1が未来方向とは限定されずに用いることが可能である。また双予測の場合に、同一の参照ピクチャを用いてL0予測及びL1予測のそれぞれを行ってもよい。なお、動き補償予測を単予測で行うか双予測で行うかの判断は、例えばL0予測を利用するか否か及びL1予測を利用するか否かを示す情報(例えば、フラグ)に基づき判断される。
 <参照インデックスについて>
 本発明の実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照ピクチャの中から最適な参照ピクチャを選択することを可能とする。そのため、動き補償予測で利用した参照ピクチャを参照インデックスとして利用するとともに、参照インデックスを差分動きベクトルとともにビットストリーム中に符号化する。
 <通常予測動きベクトルモードに基づく動き補償処理>
 動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常予測動きベクトルモード導出部301によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
 同様に、動き補償予測部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408が通常予測動きベクトルモード導出部401に接続された場合には、通常予測動きベクトルモード導出部401によるインター予測情報を取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
 <通常マージモードに基づく動き補償処理>
 動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常マージモード導出部302によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
 同様に、動き補償予測部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408が通常マージモード導出部402に接続された場合には、通常マージモード導出部402によるインター予測情報を取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
 <サブブロック予測動きベクトルモードに基づく動き補償処理>
 動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロック予測動きベクトルモード導出部303によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
 同様に、動き補償予測部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408がサブブロック予測動きベクトルモード導出部403に接続された場合には、サブブロック予測動きベクトルモード導出部403によるインター予測情報を取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
 <サブブロックマージモードに基づく動き補償処理>
 動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロックマージモード導出部304によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
 同様に、動き補償予測部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408がサブブロックマージモード導出部404に接続された場合には、サブブロックマージモード導出部404によるインター予測情報を取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
 <アフィン変換予測に基づく動き補償処理>
 通常予測動きベクトルモード、および通常マージモードでは、以下のフラグに基づいてアフィンモデルによる動き補償が利用できる。以下のフラグは、符号化処理においてインター予測モード判定部305により決定されるインター予測の条件に基づいて以下のフラグに反映され、ビットストリーム中に符号化される。復号処理においては、ビットストリーム中の以下のフラグに基づいてアフィンモデルによる動き補償を行うか否かを特定する。
 sps_affine_enabled_flagは、インター予測において、アフィンモデルによる動き補償が利用できるか否かを表す。sps_affine_enabled_flagが0であれば、シーケンス単位でアフィンモデルによる動き補償ではないように抑制される。また、inter_affine_flag とcu_affine_type_flag は、符号化ビデオシーケンスのCU(符号化ブロック)シンタックスにおいて伝送されない。sps_affine_enabled_flagが1であれば、符号化ビデオシーケンスにおいてアフィンモデルによる動き補償を利用できる。
 sps_affine_type_flagは、インター予測において、6パラメータアフィンモデルによる動き補償が利用できるか否かを表す。sps_affine_type_flagが0であれば、6パラメータアフィンモデルによる動き補償ではないように抑制される。また、cu_affine_type_flagは、符号化ビデオシーケンスのCUシンタックスにおいて伝送されない。sps_affine_type_flagが1であれば、符号化ビデオシーケンスにおいて6パラメータアフィンモデルによる動き補償を利用できる。sps_affine_type_flagが存在しない場合には、0であるものとする。
 PまたはBスライスを復号している場合、現在処理対象となっているCUにおいて、inter_affine_flagが1であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、アフィンモデルによる動き補償が用いられる。inter_affine_flagが0であれば、現在処理対象となっているCUにアフィンモデルは用いられない。inter_affine_flagが存在しない場合には、0であるものとする。
 PまたはBスライスを復号している場合、現在処理対象となっているCUにおいて、cu_affine_type_flagが1であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、6パラメータアフィンモデルによる動き補償が用いられる。cu_affine_type_flagが0であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、4パラメータアフィンモデルによる動き補償が用いられる。
 アフィンモデルによる動き補償では、サブブロック単位で参照インデックスや動きベクトルが導出されることから、サブブロック単位で処理対象となっている参照インデックスや動きベクトルを用いて動き補償予測信号を生成する。
 4パラメータアフィンモデルは2つの制御点のそれぞれの動きベクトルの水平成分及び垂直成分の4つのパラメータからサブブロックの動きベクトルを導出し、サブブロック単位で動き補償を行うモードである。
 <三角マージモード>
 三角マージモードは、マージモードの一種であり、符号化・復号ブロック内を斜め方向のパーティションに分けて動き補償予測するモードである。三角マージモードは、符号化・復号ブロックを矩形ではない形状のブロックに分割する幾何学分割マージモードの一種であり、幾何学分割マージモードにおいて、符号化・復号ブロックを対角線で二つの直角三角形に分割するモードに相当する。
 幾何学分割マージモードは、例えば、分割角度を示すインデックス(angleIdx)、および符号化ブロックの中心からの距離を示すインデックス(distanceIdx)の2つのパラメータの組み合わせにより表現される。一例では、幾何学分割マージモードとして64パターンを定義し、固定長符号化する。64パターンのうち、分割角度を示すインデックスが符号化ブロックの対角線をなす角度(例えば45度(360度を32分割で表現する構成においては、angleIdx=4)又は135度(360度を32分割で表現する構成においては、angleIdx=12))を示し、かつ符号化ブロックの中心からの距離を示すインデックスが最小(distanceIdx=0, 分割境界が符号化ブロックの中心を通ることを示す)となる2つのモードは、符号化ブロックを対角線で分割することを示し、三角マージモードに相当する。
 図38A及び図38Bを用いて三角マージモードについて説明する。図38A及び図38Bは16x16の三角マージモードである符号化・復号ブロックの予測の一例を示す。三角マージモードの符号化・復号ブロックは4x4のサブブロックに分割され、各サブブロックは単予測のパーティション0(UNI0)、単予測のパーティション1(UNI1)、双予測のパーティション2(BI)の3つのパーティションに割り当てられる。ここでは、対角線の上側にあるサブブロックをパーティション0に、対角線の下側にあるサブブロックをパーティション1に、対角線上のサブブロックをパーティション2にそれぞれ割り当てる。merge_triangle_split_dirが0であれば、図38Aのようにパーティションが割り当てられ、merge_triangle_split_dirが1であれば、図38Bのようにパーティションが割り当てられる。
 パーティション0の動き補償予測には、マージ三角インデックス0で指定される単予測の動き情報が用いられる。パーティション1の動き補償予測には、マージ三角インデックス1で指定される単予測の動き情報が用いられる。パーティション2の動き補償予測には、マージ三角インデックス0で指定される単予測の動き情報とマージ三角インデックス1で指定される単予測の動き情報を組み合わせた双予測の動き情報が用いられる。
 ここで、単予測の動き情報とは動きベクトルと参照インデックスの1組であり、双予測の動き情報とは動きベクトルと参照インデックスの2組で構成される。また、動き情報とは単予測の動き情報または双予測の動き情報のことである。
 マージ候補選択部347および447は、導出されたマージ候補リストmergeCandListから、三角マージ候補リストtriangleMergeCandListを導出する。この処理について、図40を参照して説明する。
 まず、三角マージ候補リストtriangleMergeCandListとしてマージ候補リストmergeCandListの一部または全部の候補を利用する(ステップS4501)。そして、三角マージ候補リストの数をnumTriangleMergeCandとする。
 そして、m=0からnumTriangleMergeCand-1まで、以下の処理を繰り返す。三角マージ候補リストtriangleMergeCandListのm番目の候補をMとする(ステップS4502)。次に、候補Mの予測モードがPRED_BIか否かを判定する(ステップS4503)。PRED_BIの場合(ステップS4503:Yes)、mを+1して次の処理に移る。一方、PRED_BIでない場合(ステップS4503:No)、候補Mの予測モードがPRED_L1か否かを判定する(ステップS4504)。
 PRED_L1の場合(ステップS4504:Yes)、候補Mの参照リストL0について、参照インデックスrefIdxL0M=0、動きベクトルmvL0M=(0,0)とする(ステップS4505)。一方、PRED_L1でない場合(ステップS4504:No)、候補Mの参照リストL1について、参照インデックスrefIdxL1M=0、動きベクトルmvL1M=(0,0)とする(ステップS4506)。
 空間マージ候補導出部(341、441)、時間マージ候補導出部(342、442)、履歴マージ候補導出部(345、445)、平均マージ候補導出部(344、444)、及びマージ候補補充部(346、446)にて構築されたマージ候補リストには、単予測と双予測の動き情報候補が混在している。そのため、三角マージモードでは、マージ候補リストに含まれる単予測の動き情報を双予測の動き情報に変換することで、マージ候補リストを三角マージ候補リストに変換する。単予測の動き情報から双予測の動き情報への変換は、無効である予測の動き情報に、所定の参照インデックスと所定の動きベクトルを割り当てる。
 パン・スキャンなどのない画面が固定されている場合には、背景画面は静止し、前面にあるオブジェクトが移動することが多い。つまり、一方の動きベクトルを(0,0)とすることで、一方のパーティションが静止し、他方のパーティションが移動するような場合に予測効率を向上させることができる。また、一般的には参照インデックスの小さい参照ピクチャが最も予測効率が向上する。そのため、参照インデックスを0とすることで予測効率を向上させることができる。
 ここでは、処理を容易にするために、無効である予測の参照インデックスと動きベクトルはそれぞれ0と(0,0)にした。ところが、有効である予測の参照インデックスと動きベクトルがそれぞれ0と(0,0)である場合には、通常マージと同じ結果となる。そこで、通常マージとは異なる効果を得るために、パーティション0とパーティション1の参照インデックスと動きベクトルが同一にならないように、無効である予測の参照インデックスと動きベクトルはそれぞれ0と(0,0)にしなくてもよい。例えば、無効である予測の参照インデックスと動きベクトルをそれぞれ1と(0,0)、0と(1,1)、1と(1,1)などとしてもよい。
 ここでは、参照インデックスは0で固定としているが、各予測毎に無効である予測の参照インデックスの出現数に応じて参照インデックスを1ずつインクリメントし、0、1、2、・・・のように選択候補を増加させて符号化効率を向上させることもできる。
 なお、マージ候補リストの一部を利用する例として、空間マージ候補とマージ候補補充部346及びマージ候補補充部446で補充される追加候補、空間マージ候補と時間マージ候補と追加候補、履歴マージ候補と追加候補などがある。
 復号側のマージ候補選択部447は、導出された三角マージ候補リストtriangleMergeCandListから動き情報を取得する。この処理について、図41を用いて説明する。
 最初に、図40のように三角マージ候補リストtriangleMergeCandListを生成する(ステップS4520)。
 以下、X=0から1について、ステップS4521からステップS4522まで繰り返す。三角マージ候補リストtriangleMergeCandListから、パーティションXの候補Mをマージ三角インデックスmerge_triangle_idxXに基づいて選択する(ステップS4521)。
 次に、候補MのLX予測の動きベクトルmvLXMと参照インデックスrefIdxLXMを、パーティションXの動きベクトルmvXと参照インデックスrefIdxXとする(ステップS4522)。
 以上のように、三角マージ候補リストに含まれる動き情報を全て双予測とすることで、マージ候補数の最大数と三角マージ候補数の最大数を同一に固定することができる。さらに、マージ三角インデックス0が示す単予測の動き情報をL0予測とし、マージ三角インデックス1が示す単予測の動き情報をL1予測とすることができる。また、マージ三角インデックス0をmerge_triangle_idx0と関連付け、マージ三角インデックス1をmerge_triangle_idx1と関連付けて、復号時のロバスト性を確保することができる。
 符号化側のマージ候補選択部347は、導出された三角マージ候補リストtriangleMergeCandListから動き情報を取得し、符号量とひずみ量を算出する。この処理について、図42を参照して説明する。
 最初に、図40のように三角マージ候補リストtriangleMergeCandListを生成する(ステップS4509)。
 以下、X=0から1、m=0からnumTriangleMergeCand-1まで、処理を繰り返す。まず、三角マージ候補リストtriangleMergeCandListのm番目の候補をMとする(ステップS4510)。また、パーティション0の参照インデックスrefIdxLAを、候補Mの参照インデックスrefIdxLXMとする(ステップS4510)。さらに、パーティション0の動きベクトルmvLAを、候補Mの動きベクトルmvLXMとする(ステップS4510)。ここで、refIdxLXMは参照リストLXの参照インデックスであり、X=0の場合は参照リストL0の参照インデックスrefIdxL0Mを表し、X=1の場合は参照リストL1の参照インデックスrefIdxL1Mを表す。また、mvLXMは参照リストLXの動きベクトルであり、X=0の場合は参照リストL0の動きベクトルmvL0Mを表し、X=1の場合は参照リストL1の動きベクトルmvL1Mを表す。
 以下、n=0からnumTriangleMergeCand-1まで、処理を繰り返す。まず、n=mか否かを判定する(ステップS4511)。n=mでない場合(ステップS4511:No)、三角マージ候補リストtriangleMergeCandListのn番目の候補をNとする(ステップS4512)。また、パーティション1の参照インデックスrefIdxLBを、候補Nの参照インデックスrefIdxLYNとする(ステップS4512)。さらに、パーティション1の動きベクトルmvLBを、候補Nの動きベクトルmvLYNとする(ステップS4512)。ここで、YはX=0の場合には1を、X=1の場合には0を表す。加えて、refIdxLYNは参照リストLYの参照インデックスであり、Y=0の場合は参照リストL0の参照インデックスrefIdxL0Nを表し、Y=1の場合は参照リストL1の参照インデックスrefIdxL1Nを表す。また、mvLYNは参照リストLYの動きベクトルであり、Y=0の場合は参照リストL0の動きベクトルmvL0Nを表し、Y=1の場合は参照リストL1の動きベクトルmvL1Nを表す。
 次に、取得した動き情報を用いて、符号量とひずみ量を算出する(ステップS4513)。一方、n=mの場合(ステップS4511:Yes)、ステップS4512とS4513の処理をしない。
 算出された複数の符号量とひずみ量を比較することにより、符号化ブロックを分割する方向と、分割された各パーティションごとの三角マージ候補を選択する。三角マージモードを用いて符号化する場合、選択された情報(符号化ブロックを分割する方向merge_triangle_split_dirと、分割された各パーティションごとの三角マージ候補を示すマージ三角インデックスmerge_triangle_idx0, merge_triangle_idx1)、および三角マージ候補のインター予測情報を、動き補償予測部306に供給する。また、ビット列符号化部108は、選択された情報を符号化する。
 一方、復号側のマージ候補選択部447は、三角マージモードの場合には、復号された情報(符号化ブロックを分割する方向merge_triangle_split_dirと、分割された各パーティションごとの三角マージ候補を示すマージ三角インデックスmerge_triangle_idx0, merge_triangle_idx1)に基づいて、三角マージ候補を選択し、選択された三角マージ候補のインター予測情報を動き補償予測部406に供給する。
 動き補償予測部306及び406は、三角マージモードの場合には、以下のような重み付け平均をする。輝度の場合、符号化ブロックの幅nCbWおよび高さnCbHに対し、
  nCbR = ( nCbW > nCbH ) ? ( nCbW / nCbH ) : ( nCbH / nCbW )
を算出する。すると、符号化ブロック内の位置(x,y)において、図38Aの場合における重みwValueは、
  wValue = ( nCbW > nCbH ) ?
    ( Clip3( 0, 8, x / nCbR - y + 4 ) ) :
    ( Clip3( 0, 8, y / nCbR - x + 4 ) )
となる。一方、図38Bの場合における重みwValueは、
  wValue = ( nCbW > nCbH ) ?
    ( Clip3( 0, 8, nCbH - 1 - x / nCbR - y + 4 ) ) :
    ( Clip3( 0, 8, nCbW - 1 - y / nCbR - x + 4 ) )
となる。さらに、ビット数bitDepthに対し、
  shift1 = max( 5, 17 - bitDepth )
  offset1 = 1 << ( shift1 - 1 )
を算出する。すると、重み付け平均の結果pbSamplesは、
  pbSamples = Clip3( 0, ( 1 << bitDepth ) - 1,
    ( predSamplesLA * wValue + 
    predSamplesLB * ( 8 - wValue ) + offset1 ) >> shift1 )
となる。ここで、predSamplesLAは、動きベクトルmvLAを用いて動き補償した画素値であり、predSamplesLBは、mvLBを用いて動き補償した画素値である。
 以上のように、マージ三角インデックス単位で候補を選択、つまりパーティション0とパーティション1とでそれぞれ候補を選択するようにして、選択された各候補の動きベクトルと参照インデックスをパーティション毎に単予測や双予測として利用することで、予測効率を向上させることができる。
 ここでは、マージ候補リストから三角マージ候補リストへの変換をマージ候補選択部347とマージ候補選択部447で実施した。これは、マージ候補選択部347とマージ候補選択部447の前段にリスト変換部を設置して、マージ候補リストから三角マージ候補リストへの変換をリスト変換部で実施してもよい。また、空間マージ候補導出部(341、441)、時間マージ候補導出部(342、442)、履歴マージ候補導出部(345、445)、平均マージ候補導出部(344、444)、及びマージ候補補充部(346、446)を含むマージ候補リスト構築部を設置してもよい。
 また、ここでは、選択された候補の動き情報を各パーティションに割り当てる処理をマージ候補選択部347とマージ候補選択部447で実施した。これは、動き補償予測部306と動き補償予測部406で実施してもよい。あるいは、動き補償予測部306と動き補償予測部406の前段に動き情報割り当て部を設置して、動き情報を割り当てるようにしてもよい。
 (変形例1)
 変形例1では、merge_modeのシンタックスが第1の実施の形態とは異なる。図43Aまたは図43Bは、変形例1のmerge_modeのシンタックスを示す図である。図43Aと図43Bの相違は、merge_idxの数と位置である。第1の実施の形態ではマージインデックスはmerge_triangle_idxX(X=0,1)の2つであったが、本変形例ではマージインデックスを1つ利用する。merge_triangle_idx0とmerge_triangle_idx1が符号化(または復号)されず、merge_triangle_flagに依存せずにmerge_idxが符号化(または復号)される点が、第1の実施の形態とは異なる。なお、merge_idxの替わりにmerge_triangle_idx0をそのままの位置で符号化(復号)し、merge_triangle_idx1を符号化(復号)しないようにしてもよい。 また、変形例1ではマージ候補選択部447の動作が第1の実施の形態とは異なる。変形例1のマージ候補選択部447の動作について説明する。図44はマージ候補選択部447の動作を説明するフローチャートである。
 最初に、三角マージ候補リストtriangleMergeCandListを生成する(ステップS4525)。三角マージ候補リストの生成は、第1の実施の形態における図40と同じである。
 次に、三角マージ候補リストtriangleMergeCandListから符号化ブロックの候補Mをマージインデックスmerge_idxに基づいて選択する(ステップS4526)。
 以下、X=0から1について、ステップS4527を繰り返す。
 候補MのLX予測の動きベクトルmvLXMと参照インデックスrefIdxLXMを、パーティションXの動きベクトルmvXと参照インデックスrefIdxXとする(ステップS4527)。
 以上のように、符号化ブロック単位で候補を選択し、選択された候補の動きベクトルと参照インデックスをパーティション毎に単予測や双予測として利用する。これにより、マージ三角インデックスに係る符号を削減することができ、符号化効率とビット列のスループットを向上させることができる。
 (変形例2)
 変形例2では、マージ候補選択部347とマージ候補選択部447の動作が変形例1とは異なる。変形例2のマージ候補選択部347およびマージ候補選択部447の動作について、図45を用いて説明する。
 最初に、マージ候補リストmergeCandListを取得する(ステップS4530)。
 次に、マージ候補リストmergeCandListから符号化ブロックの候補Mをマージインデックスmerge_idxに基づいて選択する(ステップS4531)。
 次に、LX予測(X=0,1)について、ステップS4532からステップS4534まで繰り返す。
 候補MのLX予測が無効であるか検査する(ステップS4532)。候補MのLX予測が無効であれば(ステップS4532のYES)、LX予測の動きベクトルmvXを(0,0)、予測Xの参照インデックスrefIdxXを0とする(ステップS4533)。候補MのLX予測が無効でなければ(ステップS4532のNO)、LX予測の動きベクトルmvXを候補Mの動きベクトルmvLXM、予測Xの参照インデックスrefIdxXを候補Mの参照インデックスrefIdxLXMとする(ステップS4534)。
 (変形例3)
 変形例3では、マージインデックスの数とマージ候補選択部347とマージ候補選択部447の動作が変形例2とは異なる。ここでは、マージインデックスはmerge_triangle_idxX(X=0,1)の2つである。マージ候補選択部347とマージ候補選択部447の動作について、図46を用いて説明する。
 最初に、マージ候補リストmergeCandListを取得する(ステップS4630)。
 次に、LX予測(X=0,1)について、ステップS4631からステップS4634まで繰り返す。
 マージ候補リストmergeCandListから符号化ブロックの候補Mをマージインデックスmerge_triangle_idxXに基づいて選択する(ステップS4631)。
 候補MのLX予測が無効であるか検査する(ステップS4632)。候補MのLX予測が無効であれば(ステップS4632のYES)、LX予測の動きベクトルmvXをmvLYM、予測Xの参照インデックスrefIdxXをrefIdxLYMとする(ステップS4633)。ここで、Xが0であればYは1であり、Xが1であればYは0となる。候補MのLX予測が無効でなければ(ステップS4632のNO)、LX予測の動きベクトルmvXを候補Mの動きベクトルmvLXM、予測Xの参照インデックスrefIdxXを候補Mの参照インデックスrefIdxLXMとする(ステップS4534)。
 以上のように変形例1、変形例2及び変形例3では、三角マージモードの場合にマージ候補リストを利用して候補Mを選択し、選択された候補のみについて双予測の動き情報の候補に変換することで、双予測の動き情報の候補に変換する処理を削減することができる。また、三角マージ候補リストtriangleMergeCandListを生成しないことで、候補の選択までの回路を通常マージと共通化することができる。
 なお、変形例2のステップS4533では、候補Mの無効であるLX予測の動きベクトルを(0,0)としているが、例えば、候補Mの有効である予測の動きベクトルmvXを(0,0)に関して対称とする動きベクトルである-mvXとしてもよい。なお、-mvXは水平成分と垂直成分の両方を(0,0)に関して対称とするが、水平成分のみを(0,0)に関して対称としたり、垂直成分のみを(0,0)に関して対称としてもよい。
 また、候補Mの無効である予測の動きベクトルを候補Mの有効である予測の動きベクトルそのものとしてもよい。つまり、L0予測が有効でL1予測が無効あれば、mv0とmv1をmvL0Mとし、L1予測が有効でL0予測が無効あれば、mv0とmv1をmvL1Mとする。
 ここでは、双予測の動き情報への変換をマージ候補選択部347とマージ候補選択部447で実施した。これは、マージ候補選択部347とマージ候補選択部447の後段に双予測変換部を設置して、双予測の動き情報への変換を双予測変換部で実施してもよい。
 以上に述べた全ての実施の形態は、複数を組み合わせても良い。
 以上に述べた全ての実施の形態において、画像符号化装置が出力するビットストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有している。また、この画像符号化装置に対応する画像復号装置は、この特定のデータフォーマットのビットストリームを復号することができる。
 画像符号化装置と画像復号装置の間でビットストリームをやりとりするために、有線または無線のネットワークが用いられる場合、通信路の伝送形態に適したデータ形式にビットストリームを変換して伝送してもよい。その場合、画像符号化装置が出力するビットストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する送信装置と、ネットワークから符号化データを受信してビットストリームに復元して画像復号装置に供給する受信装置とが設けられる。送信装置は、画像符号化装置が出力するビットストリームをバッファするメモリと、ビットストリームをパケット化するパケット処理部と、ネットワークを介してパケット化された符号化データを送信する送信部とを含む。受信装置は、ネットワークを介してパケット化された符号化データを受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理してビットストリームを生成し、画像復号装置に提供するパケット処理部とを含む。
 また、画像復号装置で復号された画像を表示する表示部を構成に追加することで、表示装置としても良い。その場合、表示部は、復号画像信号重畳部207により生成され、復号画像メモリ208に格納された復号画像信号を読み出して画面に表示する。
 また、撮像部を構成に追加し、撮像した画像を画像符号化装置に入力することで、撮像装置としても良い。その場合、撮像部は、撮像した画像信号をブロック分割部101に入力する。
 図37に、本実施の形態の符号化復号装置のハードウェア構成の一例を示す。符号化復号装置は、本発明の実施の形態に係る画像符号化装置、および画像復号装置の構成を包含する。係る符号化復号装置9000は、CPU9001、コーデックIC9002、I/Oインターフェース9003、メモリ9004、光学ディスクドライブ9005、ネットワークインターフェース9006、ビデオインターフェース9009を有し、各部はバス9010により接続される。
 画像符号化部9007と画像復号部9008は、典型的にはコーデックIC9002として実装される。本発明の実施の形態に係る画像符号化装置の画像符号化処理は、画像符号化部9007により実行され、本発明の実施の形態に係る画像復号装置における画像復号処理は、画像復号部9008により実行される。I/Oインターフェース9003は、例えばUSBインターフェースにより実現され、外部のキーボード9104、マウス9105等と接続する。CPU9001は、I/Oインターフェース9003を介して入力したユーザー操作に基づき、ユーザーの所望する動作を実行するように符号化復号装置9000を制御する。キーボード9104、マウス9105等によるユーザーの操作としては、符号化、復号のどちらの機能を実行するかの選択、符号化品質の設定、ビットストリームの入出力先、画像の入出力先等がある。
 ユーザーがディスク記録媒体9100に記録された画像を再生する操作を所望する場合、光学ディスクドライブ9005は、挿入されたディスク記録媒体9100からビットストリームを読出し、読み出したビットストリームを、バス9010を介してコーデックIC9002の画像復号部9008に送る。画像復号部9008は入力したビットストリームに対して本発明の実施の形態に係る画像復号装置における画像復号処理を実行し、復号画像を、ビデオインターフェース9009を介して外部のモニタ9103へ送る。また、符号化復号装置9000は、ネットワークインターフェース9006を有し、ネットワーク9101を介して、外部の配信サーバ9106や、携帯端末9107と接続可能である。ユーザーがディスク記録媒体9100に記録された画像に変えて、配信サーバ9106や携帯端末9107に記録された画像を再生することを所望する場合は、ネットワークインターフェース9006は、入力されたディスク記録媒体9100からビットストリームを読出すことに変えて、ネットワーク9101よりビットストリームを取得する。また、ユーザーがメモリ9004に記録された画像を再生することを所望する場合は、メモリ9004に記録されたビットストリームに対して、本発明の実施の形態に係る画像復号装置における画像復号処理を実行する。
 ユーザーが外部のカメラ9102で撮像した画像を符号化しメモリ9004に記録する操作を所望する場合、ビデオインターフェース9009は、カメラ9102から画像を入力し、バス9010を介し、コーデックIC9002の画像符号化部9007に送る。画像符号化部9007は、ビデオインターフェース9009を介して入力した画像に対して本発明の実施の形態に係る画像符号化装置における画像符号化処理を実行し、ビットストリームを作成する。そしてビットストリームを、バス9010を介し、メモリ9004へ送る。ユーザーがメモリ9004に変えて、ディスク記録媒体9100にビットストリームを記録することを所望する場合は、光学ディスクドライブ9005は、挿入されたディスク記録媒体9100に対しビットストリームの書き出しを行う。
 画像符号化装置を有し画像復号装置を有さないハードウェア構成や、画像復号装置を有し画像符号化装置を有さないハードウェア構成を実現することも可能である。そのようなハードウェア構成は、例えばコーデックIC9002が、画像符号化部9007、または画像復号部9008にそれぞれ置き換わることにより実現される。
 以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現しても良いのは勿論のこと、ROM(リード・オンリー・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによって実現しても良い。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供しても良いし、有線あるいは無線のネットワークを通してサーバから提供しても良いし、地上波あるいは衛星ディジタル放送のデータ放送として提供しても良い。
 以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 本発明は、画像をブロックに分割して予測を行う画像符号化及び復号技術に利用できる。
 100 画像符号化装置、 101 ブロック分割部、 102 インター予測部、 103 イントラ予測部、104 復号画像メモリ、 105 予測方法決定部、 106 残差生成部、 107 直交変換・量子化部、 108 ビット列符号化部、 109 逆量子化・逆直交変換部、 110 復号画像信号重畳部、 111 符号化情報格納メモリ、 200 画像復号装置、 201 ビット列復号部、 202 ブロック分割部、 203 インター予測部 204 イントラ予測部、 205 符号化情報格納メモリ 206 逆量子化・逆直交変換部、 207 復号画像信号重畳部、 208 復号画像メモリ。

Claims (12)

  1.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像符号化装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築部と、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択部と、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換部と、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当て部を有することを特徴とする画像符号化装置。
  2.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像符号化装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築ステップと、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択ステップと、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換ステップと、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当てステップを有することを特徴とする画像符号化方法。
  3.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像符号化装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築ステップと、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択ステップと、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換ステップと、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当てステップを有することを特徴とする画像符号化プログラム。
  4.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像復号装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築部と、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択部と、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換部と、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当て部を有することを特徴とする画像復号装置。
  5.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像復号装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築ステップと、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択ステップと、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換ステップと、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当てステップを有することを特徴とする画像復号方法。
  6.  処理対象ブロック単位でマージ候補リストを生成してマージ候補を選択する画像復号装置であって、
     単予測または双予測の空間マージ候補を含むマージ候補リストを構築するマージ候補リスト構築ステップと、
     マージインデックスに基づいて前記マージ候補リストから1つの選択マージ候補を選択するマージ候補選択ステップと、
     前記選択マージ候補が単予測の動き情報である場合、前記選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換する双予測変換ステップと、
     前記処理対象ブロックを4x4のサブブロックに分割し、前記サブブロック毎に前記双予測のL0予測の動き情報、前記双予測のL1予測の動き情報、または前記双予測のL0予測とL1予測の動き情報のいずれかを割り当てる動き情報割り当てステップを有することを特徴とする画像復号プログラム。
  7.  前記マージ候補選択部は、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換部は、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項1に記載の画像符号化装置。
  8.  前記マージ候補選択ステップは、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換ステップは、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項2に記載の画像符号化方法。
  9.  前記マージ候補選択ステップは、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換ステップは、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項3に記載の画像符号化プログラム。
  10.  前記マージ候補選択部は、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換部は、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項4に記載の画像復号装置。
  11.  前記マージ候補選択ステップは、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換ステップは、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項5に記載の画像復号方法。
  12.  前記マージ候補選択ステップは、更に第2のマージインデックスに基づいて前記マージ候補リストから第2の選択マージ候補を選択し、
     前記双予測変換ステップは、前記選択マージ候補と前記第2の選択マージ候補をL0予測とL1予測からなる双予測の動き情報に変換することを特徴とする請求項6に記載の画像復号プログラム。
PCT/JP2020/009211 2019-03-04 2020-03-04 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム WO2020179828A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019038309A JP2022065217A (ja) 2019-03-04 2019-03-04 画像復号装置、画像復号方法及び画像復号プログラム
JP2019-038309 2019-03-04

Publications (1)

Publication Number Publication Date
WO2020179828A1 true WO2020179828A1 (ja) 2020-09-10

Family

ID=72337476

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/009211 WO2020179828A1 (ja) 2019-03-04 2020-03-04 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム

Country Status (2)

Country Link
JP (1) JP2022065217A (ja)
WO (1) WO2020179828A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013240047A (ja) * 2012-04-16 2013-11-28 Jvc Kenwood Corp 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013240047A (ja) * 2012-04-16 2013-11-28 Jvc Kenwood Corp 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LIAO, RULING ET AL.: "CE10.3.1b: Triangular prediction unit mode", JOINT VIDEO EXPERTS TEAM (JVET, 8 October 2018 (2018-10-08) *
LIAO, RULING ET AL.: "CE10-related: Simplification of triangular prediction unit mode", JOINT VIDEO EXPERTS TEAM (JVET, 13 January 2019 (2019-01-13) *

Also Published As

Publication number Publication date
JP2022065217A (ja) 2022-04-27

Similar Documents

Publication Publication Date Title
JP6864841B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
WO2020184459A1 (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP6958768B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
JP6866919B2 (ja) 動画像復号装置、動画像復号方法、動画像復号プログラム、動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP6911912B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP2023126510A (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
JP7063416B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020184457A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020262503A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020137814A1 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP2021052372A (ja) 画像復号装置、画像復号方法及び画像復号プログラム
WO2020184461A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020179828A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020184458A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020137857A1 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP2022046468A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20765509

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20765509

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP