WO2013088738A1 - 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム - Google Patents

動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム Download PDF

Info

Publication number
WO2013088738A1
WO2013088738A1 PCT/JP2012/008016 JP2012008016W WO2013088738A1 WO 2013088738 A1 WO2013088738 A1 WO 2013088738A1 JP 2012008016 W JP2012008016 W JP 2012008016W WO 2013088738 A1 WO2013088738 A1 WO 2013088738A1
Authority
WO
WIPO (PCT)
Prior art keywords
block
prediction information
inter prediction
prediction
encoded
Prior art date
Application number
PCT/JP2012/008016
Other languages
English (en)
French (fr)
Inventor
博哉 中村
福島 茂
英樹 竹原
Original Assignee
株式会社Jvcケンウッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to EP19217766.5A priority Critical patent/EP3654651B1/en
Priority to SI201231576T priority patent/SI2802146T1/sl
Priority to EP19156821.1A priority patent/EP3503554B1/en
Priority to DK12857437.3T priority patent/DK2802146T3/en
Priority to PL12857437T priority patent/PL2802146T3/pl
Priority to PL20169995T priority patent/PL3703371T3/pl
Priority to EP20169994.9A priority patent/EP3703370B1/en
Priority to PL20169994T priority patent/PL3703370T3/pl
Priority to EP21181798.6A priority patent/EP3907997A1/en
Priority to PL19156821T priority patent/PL3503554T3/pl
Priority claimed from JP2012273315A external-priority patent/JP5561348B2/ja
Priority to RU2014129060/08A priority patent/RU2598302C2/ru
Priority to PL19217766T priority patent/PL3654651T3/pl
Priority to EP12857437.3A priority patent/EP2802146B1/en
Application filed by 株式会社Jvcケンウッド filed Critical 株式会社Jvcケンウッド
Priority to EP20169995.6A priority patent/EP3703371B1/en
Priority to BR112014013962A priority patent/BR112014013962B1/pt
Priority claimed from JP2012273314A external-priority patent/JP5900308B2/ja
Publication of WO2013088738A1 publication Critical patent/WO2013088738A1/ja
Priority to US14/298,635 priority patent/US9674545B2/en
Priority to US15/196,872 priority patent/US9743104B2/en
Priority to US15/583,601 priority patent/US9906810B2/en
Priority to US15/583,616 priority patent/US9906811B2/en
Priority to US15/583,577 priority patent/US9906809B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/583Motion compensation with overlapping blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Definitions

  • the present invention relates to a moving image encoding and decoding technique, and more particularly to a moving image encoding and decoding technique using motion compensated prediction.
  • MPEG-4 AVC / H.3 is a typical video compression encoding system.
  • H.264 Motion compensation is used in which a picture is divided into a plurality of rectangular blocks, a picture that has already been encoded / decoded is used as a reference picture, and motion from the reference picture is predicted. This method of predicting motion by motion compensation is called inter prediction or motion compensated prediction.
  • MPEG-4 AVC / H. In the inter prediction in H.264, a plurality of pictures can be used as reference pictures, and the most suitable reference picture is selected for each block from the plurality of reference pictures to perform motion compensation. Therefore, a reference index is assigned to each reference picture, and the reference picture is specified by this reference index.
  • L0 prediction mainly used as forward prediction
  • L1 prediction list 1 prediction
  • bi-prediction using two inter predictions of L0 prediction and L1 prediction at the same time is also defined.
  • bi-directional prediction is performed, the inter-predicted signals of L0 prediction and L1 prediction are multiplied by a weighting coefficient, an offset value is added and superimposed, and a final inter-predicted image signal is obtained.
  • weighting coefficients and offset values used for weighted prediction representative values are set for each reference picture in each list and encoded.
  • the encoding information related to inter prediction includes, for each block, a prediction mode for distinguishing between L0 prediction and L1 prediction and bi-prediction, a reference index for specifying a reference picture for each reference list for each block, and a moving direction and a moving amount of the block.
  • MPEG-4 AVC / H. H.264 defines a direct mode for generating inter prediction information of a block to be encoded or decoded from inter prediction information of a decoded block.
  • the direct mode encoding of inter prediction information is not necessary, so that encoding efficiency is improved.
  • a picture in which the reference index of L1 is registered as 0 is defined as a reference picture colPic.
  • a block in the same position as the block to be encoded or decoded in the reference picture colPic is set as a reference block.
  • the L0 motion vector of the reference block is set as the reference motion vector mvCol, and the reference block is not encoded using the L0 prediction and is encoded using the L1 prediction. If this is the case, the L1 motion vector of the reference block is set as the reference motion vector mvCol.
  • the picture referred to by the reference motion vector mvCol is the L0 reference picture in the temporal direct mode
  • the reference picture colPic is the L1 reference picture in the temporal direct mode.
  • the L0 motion vector mvL0 and the L1 motion vector mvL1 in the temporal direct mode are derived from the reference motion vector mvCol by scaling calculation processing.
  • the inter-picture distance td is derived by subtracting the POC of the L0 reference picture in the temporal direct mode from the POC of the base picture colPic.
  • POC is a variable associated with the picture to be encoded, and is set to a value that increases by 1 in the picture output order. The difference in POC between two pictures indicates the inter-picture distance in the time axis direction.
  • td POC of base picture colPic-POC of L0 reference picture in temporal direct mode
  • the inter-picture distance tb is derived by subtracting the POC of the L0 reference picture in the temporal direct mode from the POC of the picture to be encoded or decoded.
  • tb POC of picture to be encoded or decoded-POC of L0 reference picture in temporal direct mode
  • the motion vector mvL0 of L0 in the temporal direct mode is derived from the reference motion vector mvCol by scaling calculation processing.
  • mvL0 tb / td * mvCol
  • the motion vector mvL1 of L1 is derived by subtracting the reference motion vector mvCol from the motion vector mvL0 of L0 in the temporal direct mode.
  • mvL1 mvL0-mvCol
  • the prediction accuracy may be lowered and the encoding efficiency may not be improved in the time direct.
  • the present inventors have come to recognize the necessity of further compressing the encoded information and reducing the overall code amount in the moving image encoding method using motion compensated prediction.
  • the present invention has been made in view of such a situation, and an object of the present invention is to calculate a moving picture coding that reduces coding amount of coding information and improves coding efficiency by calculating coding information candidates. And providing a decoding technique.
  • a moving picture coding apparatus divides a first block obtained by dividing each picture into one or a plurality of second blocks, and uses inter prediction to A video encoding device for encoding an image, wherein first inter prediction information from inter prediction information of a third block close to the second block to be encoded in a picture to be encoded
  • a second prediction information deriving unit (132) for deriving a second inter prediction information candidate from the inter prediction information of the fourth block, and when the first inter prediction information candidate is derived,
  • the second inter prediction information candidate is composed of predetermined prediction information candidates added to the second inter prediction information candidate.
  • a selection unit (136) that determines an index indicating inter prediction information, and an encoding unit (encoding an index indicating inter prediction information used for inter prediction of the second block to be encoded) ( 110).
  • the first prediction information deriving unit (130) outputs first encoded information of a fifth block included in the same first block as the first block including the second block to be encoded. It is not regarded as an inter prediction information candidate.
  • This apparatus is an image encoding apparatus that performs motion compensation prediction by dividing an encoded block into one or a plurality of prediction blocks based on a division mode, and is different in encoding from a prediction block to be encoded
  • Inter prediction information that is a temporal merge candidate is derived from inter prediction information of a prediction block that exists in the same position as or near the encoding target prediction block in a completed picture, and the code is calculated based on the derived inter prediction information.
  • a reference index deriving unit (131) that derives reference index information of temporal merge candidates as reference index information for specifying a reference picture used in the prediction block to be encoded ) And the derived reference index information Time to derive inter prediction information of the merge candidate comprises merging candidate generating unit (132).
  • the reference index deriving unit (131) when the division mode is a mode for dividing the coding block into upper and lower prediction blocks at a horizontal boundary, obtains reference index information of temporal merge candidates of the prediction block to be coded.
  • a temporal merge candidate Is set to the value of the reference index information of the encoded prediction block adjacent to the upper side of the prediction block to be encoded.
  • Still another aspect of the present invention is a video encoding method.
  • This method is a moving picture coding method in which a first block obtained by dividing each picture is divided into one or a plurality of second blocks, and a moving picture is coded using inter prediction.
  • a first prediction information deriving step for deriving a first inter prediction information candidate from inter prediction information of a third block adjacent to the second block to be encoded in the picture to be encoded, and the encoding target
  • a second inter prediction information candidate is derived from inter prediction information of a fourth block existing at the same position as or near the second block to be encoded in a picture different from the picture to be 2 prediction information derivation step, and when the first inter prediction information candidate is derived, the derived first inter prediction information candidate is determined as the second inter prediction information.
  • a candidate list construction step of constructing a prediction information candidate list composed of predetermined prediction information candidates obtained by adding the derived second inter prediction information candidates, and the prediction information candidates A selection step of selecting a candidate of inter prediction information used for the inter prediction of the second block to be encoded from the prediction information candidates in a list, and determining an index indicating the inter prediction information; and the encoding
  • encoding information of a fifth block included in the same first block as the first block including the second block to be encoded is converted into first inter prediction information. Not a candidate.
  • a moving picture decoding apparatus provides an encoded bit string in which a first block obtained by dividing each picture is divided into one or a plurality of second blocks, and a moving picture is encoded by inter prediction.
  • a moving picture decoding apparatus for decoding wherein a first inter prediction information candidate is derived from inter prediction information of a third block adjacent to the second block to be decoded in a picture to be decoded.
  • the derived first inter prediction information candidate is determined as the second inter prediction information candidate.
  • the first prediction information deriving unit (230) outputs encoded information of a fifth block included in the same first block as the first block including the second block to be decoded to a first interblock. It is not regarded as a prediction information candidate.
  • This apparatus is an image decoding apparatus that performs motion compensation prediction by dividing a decoded block into one or a plurality of prediction blocks based on a division mode, in a decoded picture that is temporally different from a prediction block to be decoded.
  • a reference index deriving unit (231) for deriving reference index information of temporal merge candidates as reference index information for identifying a reference picture used in the prediction block to be decoded; Time merge candidate based on reference index information Comprising time merging candidate generating unit that derives the centers prediction information and (232).
  • the reference index deriving unit (231) sets the reference index information of the temporal merge candidate to the left side of the prediction block to be decoded.
  • Still another aspect of the present invention is a moving picture decoding method.
  • This method is a moving picture decoding method in which a first block in which each picture is divided is divided into one or a plurality of second blocks, and a coded bit sequence in which a moving picture is coded by inter prediction is decoded.
  • the second inter prediction information candidate is derived from the inter prediction information of the fourth block existing at the same position or in the vicinity of the second block to be decoded in a picture different from the picture to be decoded.
  • the index indicates the candidate list construction step of constructing a prediction information candidate list composed of predetermined prediction information candidates added to the second inter prediction information candidates, and the prediction information candidates in the prediction information candidate list.
  • encoded information of a fifth block included in the same first block as the first block including the second block to be decoded is used as a first inter prediction information candidate. And not.
  • FIG. 10 is a flowchart for explaining a reference index derivation processing procedure for temporal merge candidates in the merge mode according to the method of the first embodiment. It is a figure explaining the adjacent block referred in the derivation
  • FIG. 10 is a flowchart for describing a reference index derivation processing procedure for a merged time temporal merge candidate according to the method of the fifth embodiment.
  • 22 is a flowchart for describing a reference index derivation processing procedure for temporal merge candidates in the merge mode according to the method of the sixth embodiment. It is a figure explaining the adjacent block referred in the derivation
  • 25 is a flowchart for describing a procedure for deriving a reference index of a merge mode temporal merge candidate according to the method of the seventh embodiment. It is a figure explaining the adjacent block referred in the derivation
  • FIG. 30 is a flowchart for describing a reference index derivation process procedure for a temporal merge candidate in the merge mode according to the method of the eighth embodiment.
  • a picture is divided into rectangular blocks of an arbitrary size and shape and motion compensation is performed in units of blocks between pictures.
  • a plurality of predicted motion vectors are derived from the motion vectors of a block adjacent to the encoding target block or a block of an encoded picture, and a difference vector between the motion vector of the encoding target block and the selected prediction motion vector.
  • the amount of code is reduced by calculating and encoding.
  • the coding amount is reduced by deriving the coding information of the coding target block by using the coding information of the block adjacent to the coding target block or the block of the coded picture.
  • a plurality of predicted motion vectors are calculated from the motion vectors of a block adjacent to the decoding target block or a block of a decoded picture, and selected from the difference vector decoded from the encoded stream
  • the motion vector of the decoding target block is calculated from the predicted motion vector and decoded.
  • the encoding information of the decoding target block is derived by using the encoding information of the block adjacent to the decoding target block or the block of the decoded picture.
  • the picture is equally divided into square units of any same size.
  • This unit is defined as a tree block, and is a block to be encoded or decoded in a picture (a block to be encoded in the encoding process and a block to be decoded in the decoding process.
  • a block to be encoded in the encoding process a block to be decoded in the decoding process.
  • It is used as a basic unit of address management for specifying.
  • the tree block is composed of one luminance signal and two color difference signals.
  • the size of the tree block can be freely set to a power of 2 depending on the picture size and the texture in the picture.
  • the tree block divides the luminance signal and chrominance signal in the tree block hierarchically into four parts (two parts vertically and horizontally) as necessary, The block can be made smaller in block size.
  • Each block is defined as a coding block, and is a basic unit of processing when performing coding and decoding. Except for monochrome, the coding block is also composed of one luminance signal and two color difference signals.
  • the maximum size of the coding block is the same as the size of the tree block.
  • An encoded block having the minimum size of the encoded block is called a minimum encoded block, and can be freely set to a power of 2.
  • the coding block A is a single coding block without dividing the tree block.
  • the encoding block B is an encoding block formed by dividing a tree block into four.
  • the coding block C is a coding block obtained by further dividing the block obtained by dividing the tree block into four.
  • the coding block D is a coding block obtained by further dividing the block obtained by dividing the tree block into four parts and further dividing the block into four twice hierarchically, and is a coding block of the minimum size.
  • (About prediction mode) Encoded or decoded within the picture to be encoded or decoded in units of coding blocks (in the encoding process, the encoded signal is used for a decoded picture, a prediction block, an image signal, etc., and the decoded picture in the decoding process) This is used for prediction blocks, image signals, etc. Hereinafter, unless otherwise noted, it is used in this sense.) From intra-prediction (MODE_INTRA) in which prediction is performed from surrounding image signals, and from encoded or decoded picture image signals Switch inter prediction (MODE_INTER) to perform prediction. A mode for identifying the intra prediction (MODE_INTRA) and the inter prediction (MODE_INTER) is defined as a prediction mode (PredMode). The prediction mode (PredMode) has intra prediction (MODE_INTRA) or inter prediction (MODE_INTER) as a value, and can be selected and encoded.
  • PartMode A mode for identifying the division method of the luminance signal and the color difference signal of the coding block is defined as a division mode (PartMode). Furthermore, this divided block is defined as a prediction block. As shown in FIG. 4, eight types of partition modes (PartMode) are defined according to the method of dividing the luminance signal of the coding block.
  • PartMode The partition mode (PartMode) that is regarded as one prediction block without dividing the luminance signal of the coding block shown in FIG. 4A is defined as 2N ⁇ 2N partition (PART_2Nx2N).
  • the division modes (PartMode) for dividing the luminance signal of the coding block shown in FIGS. 4B, 4C, and 4D into two prediction blocks arranged vertically are 2N ⁇ N division (PART_2NxN) and 2N ⁇ nU, respectively. It is defined as division (PART_2NxnU) and 2N ⁇ nD division (PART_2NxnD).
  • 2N ⁇ N division (PART_2NxN) is a division mode divided up and down at a ratio of 1: 1
  • 2N ⁇ nU division (PART_2NxnU) is a division mode divided up and down at a ratio of 1: 3 and 2N ⁇
  • the nD division (PART_2NxnD) is a division mode in which division is performed at a ratio of 3: 1 up and down.
  • the division modes (PartMode) for dividing the luminance signals of the coding blocks shown in FIGS. 4 (e), (f), and (g) into two prediction blocks arranged on the left and right are divided into N ⁇ 2N divisions (PART_Nx2N) and nL ⁇ 2N, respectively.
  • N ⁇ 2N division (PART_Nx2N) is a division mode in which left and right are divided at a ratio of 1: 1
  • nL ⁇ 2N division (PART_nLx2N) is a division mode in which division is performed at a ratio of 1: 3 in the left and right
  • nR ⁇ 2N division (PART_nRx2N) is a division mode in which the image is divided in the ratio of 3: 1 to the left and right.
  • the division mode (PartMode) in which the luminance signal of the coding block shown in FIG. 4 (h) is divided into four parts in the vertical and horizontal directions and defined as four prediction blocks is defined as N ⁇ N division (PART_NxN).
  • the color difference signal is also divided in the same manner as the vertical and horizontal division ratios of the luminance signal for each division mode (PartMode).
  • a number starting from 0 is assigned to the prediction block existing inside the coding block in the coding order. This number is defined as a split index PartIdx.
  • a number described in each prediction block of the encoded block in FIG. 4 represents a partition index PartIdx of the prediction block.
  • the partition index PartIdx of the upper prediction block is set to 0.
  • the partition index PartIdx of the lower prediction block is set to 1.
  • the partition index PartIdx of the left prediction block is set to 0.
  • the division index PartIdx of the right prediction block is set to 1.
  • the partition index PartIdx of the upper left prediction block is 0, the partition index PartIdx of the upper right prediction block is 1, and the partition index PartIdx of the lower left prediction block is 2.
  • the division index PartIdx of the prediction block at the lower right is set to 3.
  • the partition mode (PartMode) is 2N ⁇ 2N partition (PART_2Nx2N), 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD) , N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), and nR ⁇ 2N partition (PART_nRx2N).
  • PartMode 2N ⁇ 2N partition
  • PART_2Nx2N 2N ⁇ N partition
  • PART_2NxN 2N ⁇ nU partition
  • PART_2NxnU 2N ⁇ nD partition
  • N ⁇ N division (PART_NxN) can be defined. It is assumed that the partition mode (PartMode) does not define N ⁇ N partition (PART_NxN).
  • the partition mode (PartMode) When the prediction mode (PredMode) is intra prediction (MODE_INTRA), only the 2N ⁇ 2N partition (PART_2Nx2N) is defined as the partition mode (PartMode) except for the encoding block D which is the minimum encoding block, and the minimum encoding block
  • the partition mode (PartMode) defines N ⁇ N partition (PART_NxN) in addition to 2N ⁇ 2N partition (PART_2Nx2N).
  • N ⁇ N division (PART_NxN) is not defined other than the smallest coding block is that, except for the smallest coding block, the coding block can be divided into four to represent a small coding block.
  • the position of each block including the tree block, the encoding block, the prediction block, and the transform block according to the present embodiment has the position of the pixel of the luminance signal at the upper left of the luminance signal screen as the origin (0, 0).
  • the pixel position of the upper left luminance signal included in each block area is represented by two-dimensional coordinates (x, y).
  • the direction of the coordinate axis is a right direction in the horizontal direction and a downward direction in the vertical direction, respectively, and the unit is one pixel unit of the luminance signal.
  • the luminance signal and the color difference signal have the same image size (number of pixels) and the color difference format is 4: 4: 4.
  • the luminance signal and the color difference signal have a different color size format of 4: 4.
  • the position of each block of the color difference signal is represented by the coordinates of the pixel of the luminance signal included in the block area, and the unit is one pixel of the luminance signal. In this way, not only can the position of each block of the color difference signal be specified, but also the relationship between the positions of the luminance signal block and the color difference signal block can be clarified only by comparing the coordinate values.
  • Inter prediction mode in which prediction is performed from an image signal of a decoded picture, a plurality of decoded pictures can be used as reference pictures. In order to identify a reference picture selected from a plurality of reference pictures, a reference index is attached to each prediction block. In the B slice, any two reference pictures can be selected for each prediction block, and inter prediction can be performed.
  • inter prediction modes there are L0 prediction (Pred_L0), L1 prediction (Pred_L1), and bi-prediction (Pred_BI).
  • the reference picture is managed by L0 (reference list 0) and L1 (reference list 1) of the list structure, and the reference picture can be specified by specifying the reference index of L0 or L1.
  • L0 prediction is inter prediction that refers to a reference picture managed in L0
  • L1 prediction is inter prediction that refers to a reference picture managed in L1
  • bi-prediction is This is inter prediction in which both L0 prediction and L1 prediction are performed and one reference picture managed by each of L0 and L1 is referred to. Only L0 prediction can be used in inter prediction of P slice, and L0 prediction, L1 prediction, and bi-prediction (Pred_BI) that averages or weights and adds L0 prediction and L1 prediction can be used in inter prediction of B slice. In the subsequent processing, it is assumed that the constants and variables with the subscript LX in the output are processed for each of L0 and L1.
  • the merge mode In the merge mode, the prediction mode of the prediction block to be encoded or decoded, the inter prediction information such as the reference index and the motion vector is not encoded or decoded, but within the same picture as the prediction block to be encoded or decoded. Prediction block close to the prediction block to be encoded or decoded, or the same position as or near the prediction block to be encoded or decoded of a decoded picture that is temporally different from the prediction block to be encoded or decoded (neighboring In this mode, the inter prediction is performed by deriving the inter prediction information of the prediction block to be encoded or decoded from the inter prediction information of the prediction block existing at the position.
  • a prediction block close to the prediction block to be encoded or decoded in the same picture as the prediction block to be encoded or decoded and inter prediction information of the prediction block are spatial merge candidates, a prediction block to be encoded or decoded, and time Prediction information derived from a prediction block existing at the same position as or near (previously near) a prediction block to be encoded or decoded of a differently encoded or decoded picture and inter prediction information of the prediction block Are time merge candidates.
  • Each merge candidate is registered in the merge candidate list, and the merge candidate used in the inter prediction is specified by the merge index.
  • FIGS. 5, 6, 7, 8, and 9 illustrate the encoding or decoding within the same picture as the prediction block to be encoded or decoded that is referenced when the spatial merge candidate is derived and the reference index of the temporal merge candidate is derived. It is a figure explaining the prediction block adjacent to the prediction block of object.
  • FIG. 9 illustrates the same position as the prediction block to be encoded or decoded in a picture that has been encoded or decoded that is temporally different from the prediction block to be encoded or decoded that is referred to when the reference index of the temporal merge candidate is derived. It is a figure explaining the prediction block already encoded or decoded which exists in the vicinity. A prediction block that is close in the spatial direction of a prediction block to be encoded or decoded and a prediction block at the same position at different times will be described with reference to FIGS. 5, 6, 7, 8, and 9.
  • a prediction block A close to the left side of the prediction block to be encoded or decoded in the same picture as the prediction block to be encoded or decoded a prediction block B close to the upper side
  • a prediction block C that is close to the upper right vertex a prediction block D that is close to the lower left vertex
  • a prediction block E that is close to the upper left vertex are defined as prediction blocks close to the spatial direction.
  • the lowest prediction block A10 among the prediction blocks close to the left side is assumed to be the prediction block A close to the left side.
  • the left side in the present embodiment The rightmost prediction block B10 among the prediction blocks adjacent to is assumed to be the prediction block B1 adjacent to the upper side.
  • the prediction block A is close to the left side of the prediction block to be encoded or decoded. If the prediction block A is close to the lower left vertex of the prediction block to be encoded or decoded, the prediction block D is determined. If it is close to the top left vertex of the prediction block to be encoded or decoded, the prediction block E is determined. In the example of FIG. 6, the prediction block A, the prediction block E, and the prediction block E are the same prediction block.
  • the size of the prediction block G adjacent to the upper side of the prediction block to be encoded or decoded is larger than the prediction block to be encoded or decoded, the size is close to the upper side according to the above condition.
  • the prediction block B is used.
  • the prediction block G is close to the upper right vertex of the prediction block to be encoded or decoded
  • the prediction block C is set. If it is close to the top left vertex of the prediction block to be encoded or decoded, the prediction block E is determined. In the example of FIG. 8, the prediction block B, the prediction block C, and the prediction block E are the same prediction block.
  • (About POC) POC is a variable associated with the picture to be encoded, and is set to a value that increases by 1 in the picture output order. Based on the POC value, it is possible to determine whether they are the same picture, to determine the anteroposterior relationship between pictures in the output order, or to derive the distance between pictures. For example, if the POCs of two pictures have the same value, it can be determined that they are the same picture. When the POCs of two pictures have different values, it can be determined that the picture with the smaller POC value is the picture output first, and the difference between the POCs of the two pictures indicates the inter-picture distance in the time axis direction. Show.
  • FIG. 1 is a block diagram showing a configuration of a moving picture coding apparatus according to an embodiment of the present invention.
  • the moving image encoding apparatus includes an image memory 101, a motion vector detection unit 102, a difference motion vector calculation unit 103, an inter prediction information derivation unit 104, a motion compensation prediction unit 105, an intra prediction unit 106, and a prediction method determination unit.
  • the image memory 101 temporarily stores the image signal of the encoding target picture supplied in the order of shooting / display time.
  • the image memory 101 supplies the stored image signal of the picture to be encoded to the motion vector detection unit 102, the prediction method determination unit 107, and the residual signal generation unit 108 in units of predetermined pixel blocks.
  • the image signals of the pictures stored in the order of shooting / display time are rearranged in the encoding order and output from the image memory 101 in units of pixel blocks.
  • the motion vector detection unit 102 uses the motion vector for each prediction block size and each prediction mode by block matching between the image signal supplied from the image memory 101 and the reference picture supplied from the decoded image memory 116 for each prediction block. Detection is performed in units, and the detected motion vector is supplied to the motion compensation prediction unit 105, the difference motion vector calculation unit 103, and the prediction method determination unit 107.
  • the difference motion vector calculation unit 103 calculates a plurality of motion vector predictor candidates by using the encoded information of the already encoded image signal stored in the encoded information storage memory 115, and generates a prediction motion vector list.
  • the optimum motion vector predictor is selected from a plurality of motion vector predictor candidates registered and registered in the motion vector predictor list, and a motion vector difference is calculated from the motion vector detected by the motion vector detector 102 and the motion vector predictor. Then, the calculated difference motion vector is supplied to the prediction method determination unit 107.
  • a prediction motion vector index that identifies a prediction motion vector selected from prediction motion vector candidates registered in the prediction motion vector list is supplied to the prediction method determination unit 107.
  • the inter prediction information deriving unit 104 derives merge candidates in the merge mode.
  • a plurality of merge candidates are derived using the encoding information of the already encoded prediction block stored in the encoding information storage memory 115 and registered in a merge candidate list described later, and registered in the merge candidate list Flags predFlagL0 [xP] [yP], predFlagL1 [xP indicating whether or not to use the L0 prediction and L1 prediction of each prediction block of the selected merge candidate from among a plurality of merge candidates ] [yP], reference index refIdxL0 [xP] [yP], refIdxL1 [xP] [yP], motion vector mvL0 [xP] [yP], mvL1 [xP] [yP], etc.
  • a merge index for specifying the selected merge candidate is supplied to the prediction method determination unit 107.
  • xP and yP are indexes indicating the position of the upper left pixel of the prediction block in the picture. The detailed configuration and operation of the inter prediction information deriving unit 104 will be described later.
  • the motion compensated prediction unit 105 generates a predicted image signal by inter prediction (motion compensated prediction) from the reference picture using the motion vectors detected by the motion vector detection unit 102 and the inter prediction information deriving unit 104, and generates the predicted image signal. This is supplied to the prediction method determination unit 107.
  • inter prediction motion compensated prediction
  • L0 prediction and L1 prediction one-way prediction is performed.
  • Pred_BI bi-prediction
  • bi-directional prediction is performed, the inter-predicted signals of L0 prediction and L1 prediction are adaptively multiplied by weighting factors, offset values are added and superimposed, and finally A predicted image signal is generated.
  • the intra prediction unit 106 performs intra prediction for each intra prediction mode.
  • a prediction image signal is generated by intra prediction from the decoded image signal stored in the decoded image memory 211, a suitable intra prediction mode is selected from a plurality of intra prediction modes, the selected intra prediction mode, and A prediction image signal corresponding to the selected intra prediction mode is supplied to the prediction method determination unit 107.
  • the prediction method determination unit 107 evaluates the encoding information and the code amount of the residual signal for each prediction method, the distortion amount between the prediction image signal and the image signal, and the like from among a plurality of prediction methods.
  • the prediction mode PredMode and split mode PartMode are determined to determine whether inter prediction (PRED_INTER) or intra prediction (PRED_INTRA) is optimal for each coding block.
  • inter prediction PRED_INTER
  • the prediction method determination unit 107 stores information indicating the determined prediction method and encoded information including a motion vector corresponding to the determined prediction method in the encoded information storage memory 115.
  • the encoding information stored here is a flag predFlagL0 [xP] [yP], predFlagL1 [that indicates whether to use the prediction mode PredMode, the partition mode PartMode, the L0 prediction of each prediction block, and the L1 prediction of each prediction block.
  • xP and yP are indexes indicating the position of the upper left pixel of the prediction block in the picture.
  • PredMode is intra prediction (MODE_INTRA)
  • a flag predFlagL0 [xP] [yP] indicating whether to use L0 prediction and a flag predFlagL1 [xP] [yP] indicating whether to use L1 prediction are Both are zero.
  • the flag predFlagL0 [xP] [yP] indicating whether or not to use L0 prediction uses 1, L1 prediction.
  • the flag predFlagL1 [xP] [yP] indicating whether or not is zero.
  • the flag predFlagL0 [xP] [yP] indicating whether to use L0 prediction is 0, and the flag predFlagL1 [xP] [yP] indicating whether to use L1 prediction is 1.
  • the prediction method determination unit 107 supplies a prediction image signal corresponding to the determined prediction mode to the residual signal generation unit 108 and the decoded image signal superimposition unit 114.
  • the residual signal generation unit 108 generates a residual signal by performing subtraction between the image signal to be encoded and the predicted image signal, and supplies the residual signal to the orthogonal transform / quantization unit 109.
  • the orthogonal transform / quantization unit 109 performs orthogonal transform and quantization on the residual signal in accordance with the quantization parameter to generate an orthogonal transform / quantized residual signal, and a second encoded bit string generation unit 111 and the inverse quantization / inverse orthogonal transform unit 113. Further, the orthogonal transform / quantization unit 109 stores the quantization parameter in the encoded information storage memory 115.
  • the first encoded bit string generation unit 110 in addition to information in units of sequences, pictures, slices, and encoded blocks, codes corresponding to the prediction method determined by the prediction method determination unit 107 for each encoded block and predicted block Encoding information is encoded. Specifically, in the prediction mode PredMode, partition mode PartMode, and inter prediction (PRED_INTER) for each coding block, a flag that determines whether or not the mode is merge mode, merge index in the case of merge mode, and inter prediction in the case of not in merge mode Encoding information such as information on the mode, the predicted motion vector index, and the difference motion vector is encoded according to a prescribed syntax rule to be described later to generate a first encoded bit string, which is supplied to the multiplexing unit 112.
  • PredMode partition mode PartMode
  • PRED_INTER inter prediction
  • the second encoded bit string generation unit 111 entropy-encodes the residual signal that has been orthogonally transformed and quantized according to a specified syntax rule to generate a second encoded bit string, and supplies the second encoded bit string to the multiplexing unit 112.
  • the multiplexing unit 112 multiplexes the first encoded bit string and the second encoded bit string in accordance with a prescribed syntax rule, and outputs a bit stream.
  • the inverse quantization / inverse orthogonal transform unit 113 performs inverse quantization and inverse orthogonal transform on the orthogonal transform / quantized residual signal supplied from the orthogonal transform / quantization unit 109 to calculate a residual signal, and performs decoding. This is supplied to the image signal superimposing unit 114.
  • the decoded image signal superimposing unit 114 superimposes the predicted image signal according to the determination by the prediction method determining unit 107 and the residual signal subjected to inverse quantization and inverse orthogonal transform by the inverse quantization / inverse orthogonal transform unit 113 to decode the decoded image. Is generated and stored in the decoded image memory 116. Note that the decoded image may be stored in the decoded image memory 116 after filtering processing for reducing distortion such as block distortion due to encoding.
  • FIG. 2 is a block diagram showing the configuration of the moving picture decoding apparatus according to the embodiment of the present invention corresponding to the moving picture encoding apparatus of FIG.
  • the moving picture decoding apparatus according to the embodiment includes a separation unit 201, a first encoded bit string decoding unit 202, a second encoded bit string decoding unit 203, a motion vector calculation unit 204, an inter prediction information derivation unit 205, and a motion compensation prediction unit 206.
  • An intra prediction unit 207 an inverse quantization / inverse orthogonal transform unit 208, a decoded image signal superimposing unit 209, an encoded information storage memory 210, and a decoded image memory 211.
  • the decoding process of the moving picture decoding apparatus in FIG. 2 corresponds to the decoding process provided in the moving picture encoding apparatus in FIG. 1, so the motion compensation prediction unit 206 in FIG.
  • the configuration of the inverse orthogonal transform unit 208, the decoded image signal superimposing unit 209, the encoded information storage memory 210, and the decoded image memory 211 is the same as that of the motion compensation prediction unit 105, the inverse quantization / inverse of the moving image encoding device in FIG.
  • the orthogonal transform unit 113, the decoded image signal superimposing unit 114, the encoded information storage memory 115, and the decoded image memory 116 have functions corresponding to the respective configurations.
  • the bit stream supplied to the separation unit 201 is separated according to a rule of a prescribed syntax, the separated first encoded bit string is supplied to the first encoded bit string decoding unit 202, and the second encoded bit string is the first encoded bit string. This is supplied to the 2-encoded bit string decoding unit 203.
  • the first encoded bit string decoding unit 202 decodes the supplied encoded bit string to obtain sequence, picture, slice, encoded block unit information, and predicted block unit encoded information. Specifically, in the prediction mode PredMode for determining whether the prediction is inter prediction (PRED_INTER) or intra prediction (PRED_INTRA) for each coding block, split mode PartMode, and inter prediction (PRED_INTER), a flag for determining whether the mode is merge mode, When the merge mode is selected, the merge index is decoded.
  • PredMode for determining whether the prediction is inter prediction (PRED_INTER) or intra prediction (PRED_INTRA) for each coding block, split mode PartMode, and inter prediction (PRED_INTER)
  • the encoded information related to the inter prediction mode, the predicted motion vector index, the difference motion vector, and the like is decoded according to a predetermined syntax rule to be described later, and the encoded information is a motion vector calculation unit 204, supplied to the inter prediction information deriving unit 205 or the intra prediction unit 207.
  • the second encoded bit string decoding unit 203 calculates a residual signal that has been orthogonally transformed / quantized by decoding the supplied encoded bit string, and dequantized / inverted the residual signal that has been orthogonally transformed / quantized. This is supplied to the orthogonal transform unit 208.
  • the motion vector calculation unit 204 stores the encoded information of the already decoded image signal stored in the encoded information storage memory 210.
  • a prediction motion vector corresponding to the prediction motion vector index decoded and supplied in 202 is selected, a motion vector is calculated from the difference vector decoded in the first encoded bit string decoding unit 202 and the selected prediction motion vector, Is supplied to the motion compensation prediction unit 206 together with the encoded information of To pay.
  • the encoding information of the prediction block supplied / stored here includes flags predFlagL0 [xP] [yP], predFlagL1 [xP] [yP indicating whether to use the prediction mode PredMode, the partition mode PartMode, the L0 prediction, and the L1 prediction. ], L0, L1 reference indices refIdxL0 [xP] [yP], refIdxL1 [xP] [yP], L0, L1 motion vectors mvL0 [xP] [yP], mvL1 [xP] [yP], and the like.
  • xP and yP are indexes indicating the position of the upper left pixel of the prediction block in the picture.
  • the flag predFlagL0 indicating whether to use L0 prediction is 1, and the flag predFlagL1 indicating whether to use L1 prediction is 0 It is.
  • the inter prediction mode is L1 prediction (Pred_L1)
  • the flag predFlagL0 indicating whether to use L0 prediction is 0, and the flag predFlagL1 indicating whether to use L1 prediction is 1.
  • the inter prediction mode is bi-prediction (Pred_BI)
  • a flag predFlagL0 indicating whether to use L0 prediction and a flag predFlagL1 indicating whether to use L1 prediction are both 1.
  • the inter prediction information deriving unit 205 derives merge candidates when the prediction mode PredMode of the prediction block to be decoded is inter prediction (PRED_INTER) and in the merge mode.
  • a plurality of merge candidates are derived and registered in a merge candidate list, which will be described later, using the encoded information of already decoded prediction blocks stored in the encoded information storage memory 115, and registered in the merge candidate list Whether a merge candidate corresponding to the merge index decoded and supplied by the first encoded bit string decoding unit 202 is selected from among a plurality of merge candidates, and whether to use the L0 prediction and the L1 prediction of the selected merge candidate Flags predFlagL0 [xP] [yP], predFlagL1 [xP] [yP], L0, L1 reference indices refIdxL0 [xP] [yP], refIdxL1 [xP] [yP], L0, L1 motion vectors mvL0 [xP] Inter prediction information such as [yP
  • the motion compensation prediction unit 206 performs prediction by inter prediction (motion compensation prediction) from the reference picture stored in the decoded image memory 211 using the inter prediction information calculated by the motion vector calculation unit 204 or the inter prediction information deriving unit 205. An image signal is generated, and the predicted image signal is supplied to the decoded image signal superimposing unit 209.
  • Pred_BI bi-prediction
  • a weighted coefficient is adaptively multiplied and superimposed on the two motion-compensated predicted image signals of L0 prediction and L1 prediction to generate a final predicted image signal.
  • the intra prediction unit 207 performs intra prediction when the prediction mode PredMode of the prediction block to be decoded is intra prediction (PRED_INTRA).
  • the encoded information decoded by the first encoded bit string decoding unit includes an intra prediction mode, and by intra prediction from a decoded image signal stored in the decoded image memory 211 according to the intra prediction mode. A predicted image signal is generated, and the predicted image signal is supplied to the decoded image signal superimposing unit 209.
  • Flags predFlagL0 [xP] [yP] and predFlagL1 [xP] [yP] indicating whether to use L0 prediction and L1 prediction are both set to 0 and stored in the encoded information storage memory 210.
  • xP and yP are indexes indicating the position of the upper left pixel of the prediction block in the picture.
  • the inverse quantization / inverse orthogonal transform unit 208 performs inverse orthogonal transform and inverse quantization on the orthogonal transform / quantized residual signal decoded by the first encoded bit string decoding unit 202, and performs inverse orthogonal transform / An inverse quantized residual signal is obtained.
  • the decoded image signal superimposing unit 209 performs the prediction image signal inter-predicted by the motion compensation prediction unit 206 or the prediction image signal intra-predicted by the intra prediction unit 207 and the inverse orthogonal transform by the inverse quantization / inverse orthogonal transform unit 208.
  • the decoded image signal is decoded by superimposing the dequantized residual signal, and stored in the decoded image memory 211.
  • the decoded image may be stored in the decoded image memory 211 after filtering processing that reduces block distortion or the like due to encoding is performed on the decoded image.
  • FIG. 10 shows a first syntax structure described in the slice header in units of slices of the bitstream generated according to the present embodiment. However, only syntax elements relevant to the present embodiment are shown.
  • a picture colPic at a different time used in deriving a temporal motion vector predictor candidate or merge candidate is a L0 reference list of pictures including a prediction block to be processed or an L1 reference picture
  • a flag collocated_from_l0_flag indicating which reference picture registered in the reference list is used is set. Details of the flag collocated_from_l0_flag will be described later.
  • syntax elements may be placed in a picture parameter set describing syntax elements set in units of pictures.
  • FIG. 11 shows a syntax pattern described in units of prediction blocks.
  • PredMode of the prediction block is inter prediction (MODE_INTER)
  • merge_flag [x0] [y0] indicating whether the mode is the merge mode is set.
  • x0 and y0 are indices indicating the position of the upper left pixel of the prediction block in the picture of the luminance signal
  • merge_flag [x0] [y0] is the prediction block located at (x0, y0) in the picture It is a flag indicating whether or not merge mode.
  • merge_flag [x0] [y0] indicates merge mode
  • a merge list index syntax element merge_idx [x0] [y0] is set, which is a list of merge candidates to be referred to.
  • x0 and y0 are indices indicating the position of the upper left pixel of the prediction block in the picture
  • merge_idx [x0] [y0] is the merge index of the prediction block located at (x0, y0) in the picture is there.
  • FIG. 12 shows an example of the entropy code of the merge index syntax element merge_idx [x0] [y0].
  • the number of merge candidates is set to five.
  • merge_flag [x0] [y0] when merge_flag [x0] [y0] is 0, it indicates that the mode is not merge mode.
  • the slice type is B slice
  • a syntax element inter_pred_flag [x0] [y0] for identifying the inter prediction mode is installed.
  • the syntax element identifies L0 prediction (Pred_L0), L1 prediction (Pred_L1), and bi-prediction (Pred_BI).
  • syntax elements ref_idx_l0 [x0] [y0] and ref_idx_l1 [x0] [y0] of the reference index for specifying the reference picture, the motion vector and prediction of the prediction block obtained by motion vector detection The differential motion vector syntax elements mvd_l0 [x0] [y0] [j] and mvd_l1 [x0] [y0] [j], which are the differences from the motion vector, are provided.
  • x0 and y0 are indexes indicating the position of the upper left pixel of the prediction block in the picture
  • ref_idx_l0 [x0] [y0] and mvd_l0 [x0] [y0] [j] are respectively (x0 , Y0) is the reference index of L0 of the prediction block and the differential motion vector
  • ref_idx_l1 [x0] [y0] and mvd_l1 [x0] [y0] [j] are respectively (x0, y0) in the picture It is the reference index of L1 of the prediction block located, and a difference motion vector.
  • j represents a differential motion vector component
  • j represents 0 as an x component
  • j represents 1 as a y component.
  • syntax elements mvp_idx_l0 [x0] [y0] and mvp_idx_l1 [x0] [y0] of an index of a predicted motion vector list that is a list of predicted motion vector candidates to be referred to are set.
  • x0 and y0 are indices indicating the position of the upper left pixel of the prediction block in the picture
  • mvp_idx_l0 [x0] [y0] and mvp_idx_l1 [x0] [y0] are (x0, y0) in the picture It is the prediction motion vector index of L0 and L1 of the prediction block located.
  • the value of the number of candidates is set to 2.
  • the inter prediction information deriving method according to the embodiment is implemented in the inter prediction information deriving unit 104 of the video encoding device in FIG. 1 and the inter prediction information deriving unit 205 of the video decoding device in FIG.
  • the inter prediction information derivation method is performed in any of encoding and decoding processes for each prediction block constituting the encoding block.
  • the prediction mode PredMode of the prediction block is inter prediction (MODE_INTER) and in the merge mode
  • the prediction mode, the reference index, and the motion vector are derived, in the case of decoding, the prediction mode, the reference index, and the motion vector of the prediction block to be decoded using the prediction mode, the reference index, and the motion vector of the decoded prediction block It is carried out when deriving.
  • the merge mode is the prediction block A that is close to the left, the prediction block B that is close to the top, the prediction block C that is close to the top right, and the prediction block D that is close to the bottom left as described with reference to FIGS. 5, 6, 7, and 8.
  • the prediction block Col either T0 or T1
  • the inter prediction information deriving unit 104 of the moving image encoding device and the inter prediction information deriving unit 205 of the moving image decoding device register these merge candidates in the merge candidate list in a common order on the encoding side and the decoding side.
  • the inter prediction information deriving unit 104 of the video encoding device determines a merge index for specifying an element of the merge candidate list, encodes it via the first encoded bit string generation unit, and performs inter prediction of the video decoding device.
  • the information deriving unit 205 is supplied with the merge index decoded by the first encoded bit string decoding unit 202, selects a prediction block corresponding to the merge index from the merge candidate list, and selects the prediction mode of the selected merge candidate, Motion compensation prediction is performed using inter prediction information such as a reference index and a motion vector.
  • FIG. 13 is a diagram illustrating a detailed configuration of the inter prediction information deriving unit 104 of the video encoding device in FIG.
  • FIG. 14 is a diagram illustrating a detailed configuration of the inter prediction information deriving unit 205 of the video decoding device in FIG.
  • 13 and 14 indicate the inter prediction information deriving unit 104 of the video encoding device and the inter prediction information deriving unit 205 of the video decoding device, respectively.
  • the portions surrounded by the thick dotted lines inside them are the merge candidate list construction unit 120 of the moving picture coding apparatus that derives the respective merge candidates and constructs the merge candidate list, and the merge candidate list of the moving picture decoding apparatus.
  • a construction unit 220 is shown, which is similarly installed in a moving picture decoding apparatus corresponding to the moving picture encoding apparatus of the embodiment, so that the same derivation result consistent with encoding and decoding can be obtained.
  • merge candidate derivation and merge candidate list construction processing in the merge candidate list construction unit 120 of the video encoding device and the merge candidate list construction unit 220 of the video decoding device Merging candidate derivation and merge candidate list construction processing of the prediction block to be processed are performed without referring to a prediction block included in the same encoding block as the encoding block including the prediction block to be processed.
  • the coding block division mode (PartMode) is not 2N ⁇ 2N division (PART_2Nx2N), that is, when there are a plurality of prediction blocks in the coding block
  • the coding side performs coding.
  • the merge candidate derivation of each prediction block and the merge candidate list construction process can be performed in parallel in the conversion block.
  • FIG. 15 is a diagram illustrating a prediction block that is close to a processing target prediction block for each division mode (PartMode) of the processing target coding block.
  • A0, B0, C0, D0, and E0 are a prediction block A that is close to the left side of the prediction block to be processed whose partition index PartIdx is 0, a prediction block B that is close to the upper side, and a vertex at the upper right.
  • a prediction block C that is close to, a prediction block D that is close to the lower left vertex, and a prediction block E that is close to the upper left vertex are shown, and A1, B1, C1, D1, and E1 are predictions of processing targets with a partition index PartIdx of 1 Prediction block A near the left side of each block, prediction block B near the top side, prediction block C near the top right vertex, prediction block D near the bottom left vertex, and top left vertex Indicates the prediction block E, and A2, B2, C2, D2, and E2 are the left sides of the prediction blocks to be processed whose partition index PartIdx is 2, respectively.
  • a prediction block A that is close, a prediction block B that is close to the upper side, a prediction block C that is close to the top right vertex, a prediction block D that is close to the bottom left vertex, and a prediction block E that is close to the top left vertex are shown as A3 , B3, C3, D3, and E3 are a prediction block A that is close to the left side of the prediction block to be processed whose partition index PartIdx is 3, a prediction block B that is close to the upper side, and a prediction block that is close to the top right vertex.
  • FIGS. 15B, 15C, and 15D show that the partition mode (PartMode) for dividing the encoded block to be processed into two prediction blocks arranged vertically is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition ( It is a figure which shows the prediction block which adjoins in PART_2NxnU) and 2NxnD division
  • a prediction block B1 close to a processing target prediction block with PartIdx of 1 is a prediction block with PartIdx of 0.
  • the partition mode (PartMode) is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), and the prediction of the processing target
  • the block's PartIdx 1
  • the encoding of the prediction block B1 that is close to the upper side of the processing target prediction block and included in the same coding block as the coding block including the processing target prediction block is a prediction block having a PartIdx of 0
  • the prediction block of PartIdx 1
  • PartMode the division mode indicating the mode for dividing the coding block to be processed into two prediction blocks arranged side by side
  • a prediction block A1 adjacent to a processing target prediction block with PartIdx of 1 is a prediction block with PartIdx of 0.
  • the partition mode (PartMode) is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), and nR ⁇ 2N partition (PART_nRx2N),
  • the encoding of the prediction block A1 is a prediction block that is close to the left side of the processing target prediction block and is included in the same encoding block as the encoding block including the processing target prediction block.
  • the encoding information of the prediction block B1, C1, D1, or E1 that is not included in the same encoding block as the encoding block including the prediction block to be processed is referred to and the prediction block of PartIdx is 1
  • merge candidate derivation and marching of each prediction block in the encoded block are performed.
  • the candidate list construction process can be processed in parallel.
  • FIG. 16 is a flowchart for explaining merge candidate derivation and merge candidate list construction processing by sequential processing
  • FIG. 17 is a flowchart for explaining merge candidate derivation and merge candidate list construction processing by parallel processing.
  • the partition mode (PartMode) is not 2N ⁇ 2N partition (PART_2Nx2N) (NO in step S102), that is, the partition mode (PartMode) is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N), the prediction index of the prediction block merge candidate with the partition index PartIdx of 1
  • the derivation and merge candidate list is constructed (step S103), and the merge candidate derivation and merge candidate list construction process ends.
  • the merge candidate derivation of the prediction block whose partition index PartIdx of the coding block to be processed is 0 and the merge candidate list are constructed (step) S101).
  • the partition mode (PartMode) is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition ( In the case of PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N)
  • the partition index PartIdx of the processing target coding block is 1
  • Derivation of merge candidates for the prediction block and a merge candidate list are constructed (step S103
  • the partition mode (PartMode) is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), For N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), or nR ⁇ 2N partition (PART_nRx2N), a prediction block with PartIdx equal to 1 without referring to a prediction block with PartIdx of 0 in the same encoded block
  • PartMode is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), For N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), or nR ⁇ 2N partition (PART_nRx2N), a prediction block with PartIdx
  • merge candidate derivation and merge candidate list construction processing for a prediction block with PartIdx of 1 are performed without referring to a prediction block with PartIdx of 0. Is possible.
  • the division mode (PartMode) does not define N ⁇ N division (PART_NxN), but N ⁇ N division (PART_NxN) can also be defined.
  • FIG. 15 (h) shows adjacent prediction blocks in which the division mode (PartMode) is divided into four prediction blocks by dividing the luminance signal of the coding block to be processed into four prediction blocks in the vertical and horizontal directions, and in N ⁇ N division (PART_NxN).
  • FIG. A prediction block A1 adjacent to a processing target prediction block with PartIdx of 1 is a prediction block with PartIdx of 0.
  • the prediction mode is a prediction block in which the partition mode (PartMode) is N ⁇ N partition (PART_NxN), the processing target prediction block PartIdx is 1, and PartIdx is 0
  • the merge candidate derivation and merge candidate list construction processing for each prediction block in the encoded block by performing merge candidate derivation and merge candidate list construction processing for a prediction block whose PartIdx is 1 without referring to the block A1 Can be processed in parallel.
  • a prediction block B2 adjacent to a processing target prediction block with PartIdx of 2 is a prediction block with PartIdx of 0, and a prediction block C2 is a prediction block of PartIdx with 1.
  • the partition mode (PartMode) is N ⁇ N partition (PART_NxN)
  • the prediction block to be processed is PartIdx of 2
  • the partIdx is 0 and 1 prediction blocks.
  • the prediction block E3 that is close to the processing target prediction block whose PartIdx is 3 is a prediction block whose PartIdx is 0, the prediction block B3 is a prediction block whose PartIdx is 1, and the prediction block A3 is a prediction block whose PartIdx is 2. .
  • the partition mode (PartMode) is N ⁇ N partition (PART_NxN)
  • the PartIdx of the prediction block to be processed is 3
  • the prediction of PartIdx is 0, 1 and 2
  • the inter prediction information deriving unit 104 of the video encoding device in FIG. 13 includes a spatial merge candidate generation unit 130, a temporal merge candidate reference index deriving unit 131, a temporal merge candidate generation unit 132, a merge candidate registration unit 133, and the same merge candidate.
  • a determination unit 134, a merge candidate supplement unit 135, and an encoding information selection unit 136 are included.
  • the inter prediction information deriving unit 205 of the video decoding device in FIG. 14 includes a spatial merge candidate generation unit 230, a temporal merge candidate reference index deriving unit 231, a temporal merge candidate generation unit 232, a merge candidate registration unit 233, and a merge candidate identical determination. Section 234, merge candidate supplement section 235, and encoding information selection section 236.
  • FIG. 18 is a merge candidate derivation process and a merge candidate list having functions common to the inter prediction information deriving unit 104 of the video encoding device and the inter prediction information deriving unit 205 of the video decoding device according to the embodiment of the present invention. It is a flowchart explaining the procedure of this construction process. Hereinafter, the processes will be described in order. In the following description, a case where the slice type slice_type is a B slice will be described unless otherwise specified, but the present invention can also be applied to a P slice.
  • the slice type slice_type is a P slice
  • the L0 prediction (Pred_L0) is provided as the inter prediction mode, and there is no L1 prediction (Pred_L1) and bi-prediction (Pred_BI). Therefore, the processing related to L1 can be omitted.
  • Spatial merge candidates A, B, C, D, E from the prediction blocks A, B, C, D, E are derived and output.
  • N indicating any one of A, B, C, D, E and the temporal merge candidate Col is defined.
  • the flag predFlagL0N and the L1 prediction flag predFlagL1N indicating whether or not the L1 prediction is performed, the L0 motion vector mvL0N, and the L1 motion vector mvL1N are output (step S201).
  • the merge candidate is derived without referring to the prediction block included in the same encoding block as the encoding block including the prediction block to be processed, so that the code including the prediction block to be processed Spatial merge candidates included in the same coding block as the coding block are not derived.
  • the detailed processing procedure of step S201 will be described later in detail using the flowchart of FIG.
  • the temporal merge candidate reference index deriving unit 131 of the inter prediction information deriving unit 104 of the video encoding device and the temporal merge candidate reference index deriving unit 231 of the inter prediction information deriving unit 205 of the video decoding device A reference index of a temporal merge candidate is derived and output from a prediction block adjacent to a block to be converted or decoded (step S202).
  • the reference index of the temporal merge candidate is derived without referring to the prediction block included in the same encoded block as the encoded block including the prediction block to be processed.
  • step S202 When the inter prediction is performed using the inter prediction information of the temporal merge candidate when the slice type slice_type is P slice, only the L0 reference index is derived in order to perform the L0 prediction (Pred_L0), and the slice type slice_type is the B slice.
  • Pred_L0 L0 prediction
  • Pred_BI bi-prediction
  • step S203 the temporal merge candidate generating unit 132 of the inter prediction information deriving unit 104 of the video encoding device and the temporal merge candidate generating unit 232 of the inter prediction information deriving unit 205 of the video decoding device.
  • a flag availableFlagCol indicating whether a temporal merge candidate is available
  • an L0 prediction flag predFlagL0Col indicating whether L0 prediction of the temporal merge candidate is performed
  • an L1 prediction flag predFlagL1Col indicating whether L1 prediction is performed
  • a motion vector of L0 The motion vector mvL1N of mvL0N and L1 is output (step S203).
  • the detailed processing procedure of step S203 will be described later in detail using the flowchart of FIG.
  • the merge candidate registration unit 133 of the inter prediction information deriving unit 104 of the video encoding device and the merge candidate registration unit 233 of the inter prediction information deriving unit 205 of the video decoding device create a merge candidate list mergeCandList and merge
  • the merge candidate list mergeCandList is constructed by adding the spatial merge candidates A, B, C, D, E and the temporal merge candidate Col to the candidate list mergeCandList, and the merge candidate list mergeCandList is output (step S204).
  • the detailed processing procedure of step S204 will be described later in detail using the flowchart of FIG.
  • the merge candidate list mergeCandList When the motion vectors of the same reference index have the same value as the merge candidate, the merge candidate is removed except for the merge candidate in the smallest order, and the merge candidate list mergeCandList is output (step S205).
  • the merge candidate supplementing unit 135 of the inter prediction information deriving unit 104 of the video encoding device and the merge candidate supplementing unit 235 of the inter prediction information deriving unit 205 of the video decoding device are registered in the merge candidate list mergeCandList.
  • the merge candidates are supplemented so that the number of merge candidates that are present becomes the specified number, and the merge candidate list mergeCandList is output (step S206).
  • the number of merge candidates is defined as five.
  • the merge candidate list mergeCandList has a maximum number of merge candidates up to five, and the prediction mode in which the combination of L0 prediction and L1 prediction between already registered merge candidates is changed is a bi-prediction (Pred_BI) merge candidate or A merge candidate having a prediction mode having a value of (0, 0) at a different reference index and biprediction (Pred_BI) is added.
  • Pred_BI bi-prediction
  • FIG. 19 is a flowchart for describing the spatial merge candidate derivation processing procedure in step S201 of FIG.
  • N A (left side), B (upper side), C (upper right), D (lower left), or E (upper left) representing the region of the adjacent prediction block is entered.
  • a maximum of four spatial merge candidates are derived from five adjacent prediction blocks.
  • the encoding information of the prediction block A adjacent to the left side of the prediction block to be encoded or decoded is determined with the variable N as A to derive the merge candidate A, and the prediction block adjacent to the upper side with the variable N as B
  • the encoding information of B is examined to derive the merge candidate B, the encoding information of the prediction block C adjacent to the upper right side is determined with the variable N as C, the merge candidate C is derived, and the variable N is set as D to the lower left side.
  • the encoding information of the adjacent prediction block D is checked to derive the merge candidate D, and the variable N is set as E to check the encoding information of the prediction block E adjacent to the upper left side to derive the merge candidate E (step S1101 to step S1101). S1114).
  • step S1102 when the variable N is E and the values of the flags availableFlagA, availableFlagB, availableFlagC, availableFlagD are added and the total is 4 (YES in step S1102), that is, when four spatial merge candidates are derived, the merge candidate E
  • the flag availableFlagE is set to 0 (step S1107), the values of the motion vectors mvL0E and mvL1E of the merge candidate E are set to (0, 0) (step S1108), and the values of the flags predFlagL0E and predFlagL1E of the merge candidate E are both set. It is set to 0 (step S1109), and the space merge candidate derivation process is terminated.
  • four merge candidates are derived from adjacent prediction blocks. Therefore, when four spatial merge candidates are already derived, it is not necessary to perform further spatial merge candidate derivation processing.
  • step S1102 if the variable N is not E, or the values of the flags availableFlagA, availableFlagB, availableFlagC, availableFlagD are added and the total is not 4 (NO in step S1102), the process proceeds to step S1103.
  • the adjacent prediction block N is included in the same encoding block as the encoding block including the prediction block to be derived (YES in step S1103), the value of the flag availableFlagN of the merge candidate N is set to 0 (step S1107).
  • the values of the motion vectors mvL0N and mvL1N of the merge candidate N are both set to (0, 0) (step S1108), and the values of the flags predFlagL0N and predFlagL1N of the merge candidate N are both set to 0 (step S1109).
  • the adjacent prediction block N is included in the same encoding block as the encoding block including the prediction block to be derived (YES in step S1103), the encoding information of the adjacent prediction block N is not referred to, and the merge candidate N
  • parallel processing of merge candidate derivation and merge candidate list construction processing for each prediction block in the same coding block is enabled.
  • partition mode is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU) or 2N ⁇ nD partition (PART_2NxnD), and the processing target prediction block PartIdx is 1,
  • the case of the prediction block B adjacent to the upper side of the prediction block is a case where the adjacent prediction block N is included in the same encoded block as the encoded block including the prediction block to be derived.
  • the prediction block B adjacent to the upper side of the prediction block to be derived is a prediction block in which the PartIdx included in the same encoding block as the encoding block including the prediction block to be derived is 0, the adjacent prediction block B
  • the merge candidate derivation and merge candidate list of each prediction block in the same encoded block are not referred to. Enables parallel processing of construction processing.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N) or nR ⁇ 2N partition (PART_nRx2N), and the processing target prediction block PartIdx is 1, and the derivation target prediction block
  • the case of the prediction block A adjacent to the left side is also a case where the adjacent prediction block N is included in the same encoding block as the encoding block including the prediction block to be derived.
  • the prediction block A adjacent to the left side of the prediction block to be derived is a prediction block in which the PartIdx included in the same encoding block as the encoding block including the prediction block to be derived is 0, the adjacent prediction block By not referring to the encoding information of A and setting the value of the flag availableFlagA of the merge candidate A to 0 to make it not a spatial merge candidate, merge candidate derivation and merge candidate list of each prediction block in the same encoded block Enables parallel processing of the building process.
  • the adjacent prediction block N is derived even when the partition mode (PartMode) is N ⁇ N partition (PART_NxN) and the PartIdx of the prediction block to be processed is 1, 2 or 3. It may be included in the same encoded block as the encoded block including the target prediction block.
  • the prediction block N adjacent to the prediction block to be encoded or decoded is determined. If each prediction block N is specified, the encoding information of the prediction block N is acquired from the encoding information storage memory 115 or 210 (step S1104).
  • Step S1105 If the adjacent prediction block N cannot be used (NO in step S1105), or the prediction mode PredMode of the prediction block N is intra prediction (MODE_INTRA) (NO in step S1106), the value of the flag availableFlagN of the merge candidate N is set to 0. (Step S1107), the values of the motion vectors mvL0N and mvL1N of the merge candidate N are both set to (0, 0) (step S1108), and the values of the flags predFlagL0N and predFlagL1N of the merge candidate N are both set to 0 ( Step S1109).
  • the adjacent prediction block N cannot be used, specifically, when the adjacent prediction block N is located outside the slice to be encoded or decoded, or still in the encoding or decoding processing order. This corresponds to the case where the encoding or decoding process has not been completed.
  • the adjacent prediction block N is outside the same encoding block as the encoding block of the prediction block to be derived (YES in step S1104), or the adjacent prediction block N can be used (YES in step S1105).
  • the prediction mode PredMode is not intra prediction (MODE_INTRA) (YES in step S1106), the inter prediction information of the prediction block N is set as the inter prediction information of the merge candidate N.
  • the value of the flag availableFlagN of the merge candidate N is set to 1 (step S1110), and the motion vectors mvL0N and mvL1N of the merge candidate N are respectively used as the motion vectors mvL0N [xN] [yN] and mvL1N [xN] [yN] of the prediction block N (Step S1111), the reference indexes refIdxL0N and refIdxL1N of the merge candidate N are set to the same values as the reference indexes refIdxL0 [xN] [yN] and refIdxL1 [xN] [yN] of the prediction block N, respectively (
  • the flags predFlagL0N and predFlagL1N of the merge candidate N are set to the flags predFlagL0 [xN] [yN] and predFlagL1 [xN] [yN] of the prediction block N, respectively (step S1113).
  • the reference index of the temporal merge candidate is derived using the reference index of the spatial merge candidate, that is, the reference index used in the prediction block adjacent to the block to be encoded or decoded. This is because when the temporal merge candidate is selected, the reference index of the prediction block to be encoded or decoded has a high correlation with the reference index of the prediction block adjacent to the encoding or decoding target block to be the spatial merge candidate. It is.
  • reference is made to the prediction block A that is close to the left side of the prediction block to be derived or the prediction block B that is close to the upper side. Use only the index.
  • the prediction blocks A and B that are in contact with the sides of the prediction block to be encoded or decoded among the adjacent prediction blocks A, B, C, D, and E that are also spatial merge candidates are predicted to be encoded or decoded. This is because the correlation is higher than prediction blocks C, D, and E that are in contact with only the vertices of the block.
  • FIG. 20 is a diagram illustrating adjacent blocks referred to in the time merge candidate reference index derivation process according to the first embodiment of the present embodiment.
  • PartMode division mode
  • PartMode partition mode
  • the partition mode (PartMode) is 2N ⁇ 2N partition (PART_2Nx2N)
  • the prediction block A0 adjacent to the left of the prediction block to be derived is referred to, and the LX reference index of the temporal merge candidate Is set to the value of the reference index of the LX of the prediction block A0.
  • PartMode partition mode for dividing the processing target coding block into two prediction blocks arranged vertically is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), and 2N ⁇ nD partition (PART_2NxnD), FIG.
  • the prediction block adjacent to the left side of the prediction block to be derived is referred to, and the LX reference index of each temporal merge candidate is used as the prediction block to be derived. Is set to the value of the reference index of the LX of the prediction block adjacent to the left side of.
  • the prediction block A0 adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A0.
  • the prediction block A1 that is adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A1. Since the prediction blocks A0 and A1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • PartMode When the division mode (PartMode) for dividing the coding block to be processed into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N), FIG.
  • the prediction block adjacent to the upper side of the prediction block to be derived is referred to, and the LX reference index of each temporal merge candidate is used as the prediction block of each derivation target. Is set to the value of the reference index of the LX of the prediction block adjacent to the upper side.
  • the prediction block B0 that is close to the top is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction blocks B0 and B1.
  • the prediction block B1 that is close to the top is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block B1. Since the prediction blocks B0 and B1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • the value of the reference index of the temporal merge candidate LX is set to 0 as the default value.
  • the default value of the reference index of the temporal merge candidate LX is set to 0 because the reference picture corresponding to the reference index value of 0 in inter prediction This is because the probability of being most selected is high.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 21 is a flow chart for explaining the procedure for deriving the reference index of the time merge candidate in step S202 of FIG. 18 by the method of Example 1 of the present embodiment.
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N) (YES in step S2101), derived from the encoded information storage memory 115 or 210 The encoding information of the prediction block B adjacent on the target prediction block is acquired (step S2117).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block B. It is set to the same value as [xB] [yB] (step S2120).
  • xB and yB are indexes indicating the position of the upper left pixel of the prediction block B in the picture.
  • the reference index refIdxLXCol of the time merge candidate LX is set to a default value of 0 ( Step S2121).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • FIG. 22 is a diagram illustrating neighboring blocks referred to in the time merge candidate reference index derivation process according to the second example of the present embodiment.
  • the prediction block close to the left side of the prediction block to be derived or the prediction block close to the upper side is determined according to the partition mode (PartMode) of the encoded block and the partition index PartIdx of the prediction block. Switch which one to reference. Reference is made to a prediction block close to a side outside the coding block.
  • PartMode is 2N ⁇ 2N partition (PART_2Nx2N)
  • the prediction block A0 adjacent to the left of the prediction block to be derived is referred to, and the LX reference index of the temporal merge candidate Is set to the value of the reference index of the LX of the prediction block A0.
  • PartMode partition mode for dividing the processing target coding block into two prediction blocks arranged vertically is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), and 2N ⁇ nD partition (PART_2NxnD), FIG.
  • the prediction block adjacent to the left side of the prediction block to be derived is referred to, and the LX reference index of each temporal merge candidate is used as the prediction block to be derived. Is set to the value of the reference index of the LX of the prediction block adjacent to the left side of.
  • the prediction block A0 adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A0.
  • the prediction block A1 that is adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A1. Since the prediction blocks A0 and A1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • PartMode When the division mode (PartMode) for dividing the processing target coding block into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N), FIG.
  • the prediction block whose partition index PartIdx to be derived is 0 the prediction block A0 that is adjacent to the left is referred to, and the LX reference index that is the temporal merge candidate is the prediction block Set to the value of the LX reference index of A0.
  • the prediction block B1 that is close to the top is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block B1. Since the prediction blocks A0 and B1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks having the division indexes PartIdx of 0 and 1 can be derived in parallel.
  • the value of the reference index of the temporal merge candidate LX is set to 0 as the default value.
  • the default value of the reference index of the temporal merge candidate LX is set to 0 because the reference picture corresponding to the reference index value of 0 in inter prediction This is because the probability of being most selected is high.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 23 is a flowchart for explaining the derivation process procedure of the reference index of the time merge candidate in step S202 of FIG. 18 by the method of Example 2 of the present embodiment.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N) and the partition index PartIdx is not 1 (NO in step S2102), that is, 2N ⁇ 2N Partition (PART_2Nx2N), 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), or N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ When 2N division (PART_nRx2N) and the division index PartIdx is 0, the en
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), and nR ⁇ 2N partition (PART_nRx2N) and the partition index PartIdx is 1 (YES in step S2102)
  • encoding information The encoding information of the prediction block B adjacent to the prediction block to be derived is acquired from the storage memory 115 or 210 (step S2117).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block B. It is set to the same value as [xB] [yB] (step S2120).
  • xB and yB are indexes indicating the position of the upper left pixel of the prediction block B in the picture.
  • the reference index refIdxLXCol of the time merge candidate LX is set to a default value of 0 ( Step S2121).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • FIG. 24 is a diagram illustrating neighboring blocks referred to in the time merge candidate reference index derivation process according to the third example of the present embodiment.
  • the prediction block close to the left side of the prediction block to be derived or the prediction block close to the upper side is determined according to the partition mode (PartMode) of the encoded block and the partition index PartIdx of the prediction block. Switch which one to reference. For a prediction block with a partition index PartIdx of 0, refer to a prediction block close to a long side having higher correlation, and for a prediction block with a partition index PartIdx of 1, refer to a prediction block close to a side outside the coding block To do.
  • PartMode partition mode
  • Switch which one to reference For a prediction block with a partition index PartIdx of 0, refer to a prediction block close to a long side having higher correlation, and for a prediction block with a partition index PartIdx of 1, refer to a prediction block close to a side outside the coding block To do.
  • PartMode 2N ⁇ 2N partition (PART_2Nx2N)
  • the prediction block A0 adjacent to the left of the prediction block to be derived is referred to, and the LX reference index of the temporal merge candidate Is set to the value of the reference index of the LX of the prediction block A0.
  • PartMode for dividing the coding block to be processed into two prediction blocks arranged vertically is 2N ⁇ N division (PART_2NxN), 2N ⁇ nU division (PART_2NxnU), 2N ⁇ nD division (PART_2NxnD), FIG.
  • the prediction block B0 that is close to the upper side, which is a long side in the prediction block whose partition index PartIdx to be derived is 0, is referenced, and the LX reference of the temporal merge candidate The index is set to the value of the LX reference index of the prediction block B0.
  • the prediction block A1 close to the left side outside the coding block is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A1.
  • the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • PartMode When the division mode (PartMode) for dividing the coding block to be processed into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N), FIG.
  • a prediction block A0 that is close to the left side, which is a long side in a prediction block whose partition index PartIdx to be derived is 0, is referenced
  • a reference to LX that is a temporal merge candidate The index is set to the value of the LX reference index of the prediction block A0.
  • the prediction block B1 close to the upper side outside the coding block is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block B1.
  • the reference indexes of the temporal merge candidates of the two prediction blocks having the division indexes PartIdx of 0 and 1 can be derived in parallel.
  • the value of the reference index of the temporal merge candidate LX is set to 0 as the default value.
  • the default value of the reference index of the temporal merge candidate LX is set to 0 because the reference picture corresponding to the reference index value of 0 in inter prediction This is because the probability of being most selected is high.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 25 is a flow chart for explaining the procedure for deriving the reference index of the time merge candidate in step S202 of FIG. 18 by the method of the third embodiment of the present embodiment.
  • the partition mode (PartMode) is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), and the partition index PartIdx is not 0, N ⁇ 2N partition (PART_Nx2N), nL ⁇ When 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N) and partition index PartIdx is not 1 (NO in step S2103), that is, 2N ⁇ 2N partition (PART_2Nx2N) or 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD) and partition index PartI
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), and nR ⁇ 2N partition (PART_nRx2N) and the partition index PartIdx is 1 (YES in step S2102)
  • encoding information The encoding information of the prediction block B adjacent to the prediction block to be derived is acquired from the storage memory 115 or 210 (step S2117).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block B. It is set to the same value as [xB] [yB] (step S2120).
  • xB and yB are indexes indicating the position of the upper left pixel of the prediction block B in the picture.
  • the reference index refIdxLXCol of the time merge candidate LX is set to a default value of 0 ( Step S2121).
  • step S2119 to step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • FIG. 26 is a diagram illustrating adjacent blocks referred to in the time merge candidate reference index derivation process according to the fourth example of the present embodiment.
  • PartMode partition mode
  • PartIdx partition index
  • PartMode partition mode for dividing the processing target coding block into two prediction blocks arranged vertically is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), and 2N ⁇ nD partition (PART_2NxnD), FIG.
  • the prediction block whose partitioning index PartIdx to be derived is 0 the prediction block A0 that is adjacent to the left is referred to, and the LX reference index that is the temporal merge candidate is the prediction block Set to the value of the LX reference index of A0.
  • the prediction block A1 that is adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A1. Since the prediction blocks A0 and A1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • PartMode When the division mode (PartMode) for dividing the processing target coding block into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N), FIG.
  • the prediction block whose partition index PartIdx to be derived is 0 the prediction block A0 that is adjacent to the left is referred to, and the LX reference index that is the temporal merge candidate is the prediction block Set to the value of the LX reference index of A0.
  • the adjacent prediction block is not referred to, and the LX reference index of the temporal merge candidate is set to the default value 0. Since the prediction block A0 to be referred to is outside the encoded block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • the value of the reference index of the LX that is a temporal merge candidate is set to 0 as a default value.
  • the reason why the default value of the LX reference index of the temporal merge candidate is 0 when the adjacent prediction block A does not perform LX prediction or when the partition index PartIdx of the prediction block to be derived is 1 is referred to in inter prediction This is because the reference picture corresponding to the index value 0 is most likely to be selected.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 27 is a flowchart for explaining the derivation process procedure of the reference index of the time merge candidate in step S202 of FIG. 18 according to the method of Example 4 of the present embodiment.
  • PartMode is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition (PART_nRx2N) and the partition index PartIdx is not 1 (NO in step S2102), that is, 2N ⁇ 2N Partition (PART_2Nx2N), 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), or N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ When 2N division (PART_nRx2N) and the division index PartIdx is 0, the partition index PartIdx
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • Step S2121 This process is performed in each of L0 and L1 (steps S2118 to S2122). Note that LX is set to L0 when deriving the L0 reference index of the temporal merge candidate, and LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • the L0 prediction (Pred_L0) is provided as the inter prediction mode, and there is no L1 prediction (Pred_L1) and bi-prediction (Pred_BI). Therefore, the processing related to L1 can be omitted.
  • the time merge candidate LX reference index refIdxLXCol is set to a default value of 0 (step S2121).
  • step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • FIG. 28 is a diagram illustrating adjacent blocks that are referred to in the time merge candidate reference index derivation process according to the fifth embodiment of the present embodiment.
  • PartMode division mode
  • a prediction block close to a side outside the coding block is referred to. Reference is made when the prediction block close to the left side is outside the coding block, and when it is inside the coding block, it is not referred to and is set as a default value.
  • PartMode is 2N ⁇ 2N partition (PART_2Nx2N)
  • the prediction block A0 adjacent to the left of the prediction block to be derived is referred to, and the LX reference index of the temporal merge candidate Is set to the value of the reference index of the LX of the prediction block A0.
  • PartMode for dividing the coding block to be processed into two prediction blocks arranged vertically is 2N ⁇ N division (PART_2NxN), 2N ⁇ nU division (PART_2NxnU), and 2N ⁇ nD division (PART_2NxnD), FIG.
  • the prediction block whose partitioning index PartIdx to be derived is 0 the prediction block A0 that is adjacent to the left is referred to, and the LX reference index that is the temporal merge candidate is the prediction block Set to the value of the LX reference index of A0.
  • the prediction block A1 that is adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A1. Since the prediction blocks A0 and A1 to be referred to are both outside the coding block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • PartMode When the division mode (PartMode) for dividing the processing target coding block into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N)
  • the prediction blocks having the partition index PartIdx of 0 and 1 the prediction blocks that are adjacent to each other are not referred to, and the LX reference index of the temporal merge candidate is set to the default value of 0.
  • the prediction block adjacent to the prediction block to be processed is not referred to, the prediction block in the coding block is not referred to, and the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1, respectively. It can be derived in parallel.
  • the value of the reference index of the LX that is a temporal merge candidate is set to 0 as a default value.
  • the partition mode (PartMode) of the encoding block including the prediction block to be derived is N ⁇ 2N partition (PART_Nx2N), nL ⁇ 2N partition (PART_nLx2N), nR ⁇ 2N partition
  • the reason why the default value of the reference index of the LX as a temporal merge candidate is set to 0 is that there is a high probability that a reference picture corresponding to a reference index value of 0 is most selected in inter prediction.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 29 is a flowchart for explaining the derivation process procedure of the reference index of the time merge candidate in step S202 of FIG. 18 by the method of the fifth embodiment of the present embodiment.
  • PartMode partition mode
  • PART_Nx2N partition mode
  • PART_nLx2N partition mode 2N partition
  • PART_nRx2N nR ⁇ 2N partition
  • 2N ⁇ 2N partition PART_2Nx2N
  • the code of the prediction block A adjacent to the left of the prediction block to be derived from the encoded information storage memory 115 or 210 Information is acquired (step S2111).
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • the processing in subsequent step S2121 is performed as L0 and L1. Each of them is performed (steps S2118 to S2122). Note that LX is set to L0 when deriving the L0 reference index of the temporal merge candidate, and LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • the L0 prediction (Pred_L0) is provided as the inter prediction mode, and there is no L1 prediction (Pred_L1) and bi-prediction (Pred_BI). Therefore, the processing related to L1 can be omitted.
  • the time merge candidate LX reference index refIdxLXCol is set to a default value of 0 (step S2121).
  • step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • Example 6 Next, Example 6 of the present embodiment will be described.
  • the reference index of LX as a temporal merge candidate is set to a default value of 0 without referring to adjacent prediction blocks. Since the prediction block adjacent to the prediction block to be processed is not referred to, the prediction block in the encoded block is not referred to, and the time of two prediction blocks whose division indexes PartIdx are 0 and 1 included in the same encoded block Merge candidates can be derived in parallel.
  • the reason why the default value of the LX reference index of the temporal merge candidate is set to 0 is that there is a high probability that the reference picture corresponding to the reference index value of 0 is most selected in inter prediction.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • the reference index refIdxLXCol of the time merge candidate LX is set to the default value of 0 without referring to the adjacent block, so the first, second, third, fourth, fifth, and later-described seventh embodiment.
  • the derivation process can be simplified compared to.
  • FIG. 30 is a flow chart for explaining the procedure for deriving the reference index of the time merge candidate in step S202 of FIG. 18 by the method of Example 6 of the present embodiment.
  • step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_BI bi-prediction
  • the time merge candidate LX reference index refIdxLXCol is set to a default value of 0 (step S2115).
  • step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation process is terminated.
  • FIG. 31 is a diagram illustrating adjacent blocks that are referred to in the time merge candidate reference index derivation process according to the seventh embodiment of the present embodiment.
  • the partition mode (PartMode) of the encoding block the processing target encoding block
  • the partition index PartIdx of the prediction mode to be derived As shown in FIGS. 31A to 31G, the prediction block A adjacent to the left of the coding block to be processed is referred to, and the LX reference index of the temporal merge candidate is used as the LX reference index of the prediction block A.
  • the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • the value of the reference index of the LX that is a temporal merge candidate is set to 0 as a default value.
  • the reason why the default value of the reference index of the temporal merge candidate LX is set to 0 is that the reference picture corresponding to the reference index value of 0 is most selected in inter prediction. This is because the probability is high.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • the reference index of the temporal merge candidate of each prediction block in the encoded block is set to a common value, the reference index of the temporal merge candidate is derived for each prediction block in the encoded block. There is no need, and the derivation process can be simplified.
  • FIG. 32 is a flow chart for explaining the procedure for deriving the reference index of the time merge candidate in step S202 of FIG. 18 according to the method of the seventh embodiment of the present embodiment.
  • the coding information of the prediction block A adjacent to the left of the coding block to be processed is acquired from the coding information storage memory 115 or 210 (step S2131).
  • step S2133 to step S2135 The subsequent processing from step S2133 to step S2135 is performed in each of L0 and L1 (steps S2132 to S2136).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index of the temporal merge candidate refIdxLXCol is set to the same value as the value of the reference index refIdxLX [xA] [yA] of the LX of the prediction block A (step S2134).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A adjacent to the left of the coding block to be processed in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to 0 as a default value (Ste S2135).
  • step S2133 to step S2135 is performed in each of L0 and L1 (steps S2132 to S2136), and this reference index derivation processing is terminated.
  • whether to refer to the prediction block adjacent to the left side of the encoded block including the prediction block to be derived is switched.
  • the prediction block close to the upper side is changed. You may switch whether to refer.
  • FIG. 43 is a diagram illustrating neighboring blocks referred to in the time merge candidate reference index derivation process according to the eighth embodiment of the present embodiment.
  • Example 8 of the present embodiment whether to refer to a prediction block adjacent to the left side of the prediction block to be derived, according to the prediction index PartIdx of the prediction block, regardless of the encoding block partition mode (PartMode) Switch.
  • PartMode partition mode
  • the prediction block close to the left side is always outside the encoded block, but when the partition index PartIdx of the prediction block is other than 0, the partition mode (PartMode) depending on the coding block.
  • PartMode partition mode depending on the coding block.
  • the prediction block A0 adjacent to the left of the prediction block to be derived is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A0.
  • the partition mode (PartMode) for dividing the processing target coding block into two prediction blocks arranged vertically is 2N ⁇ N partition (PART_2NxN), 2N ⁇ nU partition (PART_2NxnU), 2N ⁇ nD partition (PART_2NxnD), and processing target
  • the division mode (PartMode) for dividing the encoded block of 2 into two prediction blocks arranged side by side is N ⁇ 2N division (PART_Nx2N), nL ⁇ 2N division (PART_nLx2N), and nR ⁇ 2N division (PART_nRx2N), FIG.
  • the prediction block A0 that is adjacent to the left is referred to in the prediction block with the division index PartIdx to be derived, and the time
  • the LX reference index of the merge candidate is set to the value of the LX reference index of the prediction block A0.
  • the adjacent prediction block is not referred to, and the LX reference index of the temporal merge candidate is set to the default value 0. Since the prediction block A0 to be referred to is outside the encoded block, the reference indexes of the temporal merge candidates of the two prediction blocks whose division indexes PartIdx are 0 and 1 can be derived in parallel.
  • the value of the reference index of the LX that is a temporal merge candidate is set to 0 as a default value.
  • the reason why the default value of the LX reference index of the temporal merge candidate is 0 when the adjacent prediction block A does not perform LX prediction or when the partition index PartIdx of the prediction block to be derived is 1 is referred to in inter prediction This is because the reference picture corresponding to the index value 0 is most likely to be selected.
  • the present invention is not limited to this, and the default value of the reference index may be a value other than 0 (1, 2, etc.).
  • the syntax element shown may be installed and transmitted so that it can be selected on the encoding side.
  • FIG. 44 is a flowchart for explaining the procedure for deriving the reference index of the time merge candidate in step S202 of FIG. 18 according to the method of the eighth embodiment of the present embodiment.
  • the division index PartIdx is 0 (YES in step S2104)
  • the encoding information of the prediction block A adjacent to the left of the prediction block to be derived is acquired from the encoding information storage memory 115 or 210 (step S2111). .
  • step S2113 to step S2115 The subsequent processing from step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_L1 Pred_L1
  • Pred_BI bi-prediction
  • the LX reference index refIdxLXCol of the temporal merge candidate is used as the LX reference index refIdxLX of the prediction block A.
  • the same value as [xA] [yA] is set (step S2114).
  • xA and yA are indexes indicating the position of the upper left pixel of the prediction block A in the picture.
  • the prediction block N when the prediction block N cannot be used outside the slice to be encoded or decoded, the prediction block N is encoded or encoded in the decoding order.
  • Both predFlagL0 [xN] [yN] and the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction of the prediction block N are 0.
  • xN and yN are indexes indicating the position of the upper left pixel of the prediction block N in the picture.
  • PredMode of the prediction block N is inter prediction (MODE_INTER) and the inter prediction mode is L0 prediction (Pred_L0)
  • the flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is 1
  • the flag predFlagL1 [xN] [yN] indicating whether to use the L1 prediction is 0.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N is a flag indicating whether to use 0, L1 prediction predFlagL1 [xN] [yN] is 1.
  • a flag predFlagL0 [xN] [yN] indicating whether to use the L0 prediction of the prediction block N, and a flag predFlagL1 [indicating whether to use the L1 prediction xN] [yN] are both 1.
  • the reference index refIdxLXCol of the LX that is a temporal merge candidate is set to a default value of 0 ( Step S2115).
  • step S2113 to step S2115 is performed in each of L0 and L1 (steps S2112 to S2116), and this reference index derivation processing is terminated.
  • step S2121 the processing in subsequent step S2121 is performed in each of L0 and L1 (steps S2118 to S2122).
  • LX is set to L0 when deriving the L0 reference index of the temporal merge candidate
  • LX is set to L1 when deriving the L1 reference index.
  • the slice type slice_type is a P slice
  • Pred_L0 the L0 prediction
  • Pred_BI bi-prediction
  • the time merge candidate LX reference index refIdxLXCol is set to a default value of 0 (step S2121).
  • step S2121 is performed in each of L0 and L1 (steps S2118 to S2122), and this reference index derivation processing is terminated.
  • whether or not to refer to the prediction block close to the left side of the prediction block to be derived is switched, but whether or not to refer to the prediction block close to the upper side instead of the prediction block close to the left side is determined. You may switch.
  • the partition mode (PartMode) of the encoded block does not define N ⁇ N partition (PART_NxN), but N ⁇ N partition (PART_NxN) can also be defined. Even when the coding block partition mode (PartMode) is N ⁇ N partition (PART_NxN), when deriving the reference index of the prediction block temporal merge candidate included in the processing target coding block, the processing target prediction block By deriving without referring to adjacent prediction blocks included in the same encoding block as the encoding block included in the reference block, reference to temporal merge candidates of four prediction blocks whose partition index PartIdx is 0, 1, 2, 3 Each index can be derived in parallel.
  • the reference index of the temporal merge candidate LX is set to the default value 0 without referring to the adjacent prediction block. Since the prediction block adjacent to the prediction block to be derived is not referred to, the reference indexes of the temporal merge candidates of the four prediction blocks whose division indexes PartIdx are 0, 1, 2, and 3 can be derived in parallel.
  • the reference index of the temporal merge candidate can be derived by referring to the reference index of the neighboring block.
  • FIG. 33 is a diagram for explaining adjacent blocks to be referred to in the process of deriving the reference index of the temporal merge candidate of the N ⁇ N division (PART_NxN) encoded block.
  • the prediction block A0 adjacent to the left is referred to, and the LX reference index of the prediction block A0 is used as the LX reference index of the temporal merge candidate.
  • the prediction block B1 that is close to the top is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block B1.
  • the prediction block A2 adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A2.
  • the adjacent prediction block is not referred to, and the LX reference index of the temporal merge candidate is set to a default value of 0. Since the prediction blocks A0 and A2 adjacent to the left of the prediction block to be processed and the prediction block B1 adjacent above are both outside the coding block, the four prediction blocks whose division index PartIdx is 0, 1, 2, 3 Reference indices for temporal merge candidates can be derived in parallel.
  • the prediction block A0 adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the LX of the prediction block A0.
  • the prediction block A2 adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the value of the LX reference index of the prediction block A2.
  • the adjacent prediction block is not referred to, and the reference index of the LX that is the temporal merge candidate is set to 0 as a default value. Since both the prediction blocks A0 and A2 adjacent to the left of the prediction block to be processed are outside the encoding block, the reference indexes of the temporal merge candidates of the four prediction blocks whose division indexes PartIdx are 0, 1, 2, and 3 are respectively set. It can be derived in parallel.
  • the prediction block A adjacent to the left of the processing target coding block is referred to, and the LX reference index of the temporal merge candidate is changed to the value of the LX reference index of the prediction block A.
  • the reference indexes of the temporal merge candidates of the four prediction blocks whose division indexes PartIdx are 0, 1, 2, and 3 are respectively parallel. Can be derived.
  • the prediction block A0 that is adjacent to the left is referred to, and the LX reference index of the temporal merge candidate is set to the LX of the prediction block A0.
  • the adjacent prediction block is not referred to, and the reference index of the LX as a temporal merge candidate is set to the default value of 0.
  • the reference indexes of the temporal merge candidates of the four prediction blocks whose division indexes PartIdx are 0, 1, 2, and 3 are respectively derived in parallel. be able to.
  • FIG. 34 is a flowchart for explaining the time merge candidate derivation processing procedure in step S203 of FIG.
  • a picture colPic at a different time is derived based on the slice type slice_type and the aforementioned flag collocated_from_l0_flag (step S3101).
  • FIG. 35 is a flowchart for explaining the procedure for deriving the picture colPic at different times in step S3101 of FIG.
  • the slice type slice_type is a B slice and the above-described flag collocated_from_l0_flag is 0 (YES in step S3201 and YES in step S3202)
  • RefPicList1 [0] that is, a picture colPic at a time when the pictures with the reference index 0 in the reference list L1 are different (Step S3203).
  • RefPicList0 [0] that is, the picture colPic of the reference list L0 with the reference index 0 is a different time (step S3205).
  • a prediction block colPU at a different time is derived, and encoding information is acquired (step S3102).
  • FIG. 36 is a flowchart for explaining the procedure for deriving the prediction block colPU of the picture colPic at different times in step S3102 of FIG.
  • a prediction block located in the lower right (outside) of the same position as the processing target prediction block in the picture colPic at different times is set as a prediction block colPU at different times (step S3301).
  • This prediction block corresponds to the prediction block T0 in FIG.
  • step S3302 the encoding information of the prediction block colPU at different times is acquired (step S3302).
  • PredMode of a prediction block colPU at a different time cannot be used, or when the prediction mode PredMode of a prediction block colPU at a different time is intra prediction (MODE_INTRA) (YES in step S3303, YES in step S3304)
  • the picture colPic in a different time The prediction block located in the upper left center of the same position as the processing target prediction block is set as a prediction block colPU at a different time (step S3305). This prediction block corresponds to the prediction block T1 in FIG.
  • a flag indicating whether the prediction motion vector mvL0Col of L0 derived from the prediction block of another picture at the same position as the prediction block to be encoded or decoded and the temporal merge candidate Col are valid is derived. Further, when the flag availableFlagL0Col or the flag availableFlagL1Col is 1, the flag availableFlagCol indicating whether or not the time merge candidate Col is valid is set to 1.
  • FIG. 37 is a flowchart for explaining the process of deriving inter prediction information of the time merge candidate in step S3103 and step S3104 in FIG.
  • L0 or L1 the list of time merge candidate derivation targets is LX
  • the prediction using LX is LX prediction.
  • LX becomes L0 when called as step S3103, which is a time merge candidate L0 derivation process
  • LX becomes L1, when called as step S3104, which is a time merge candidate L1 derivation process.
  • both the flag availableFlagLXCol and the flag predFlagLXCol are set to 0 (step S3403), and the motion vector mvLXCol Is set to (0, 0) (step S3404), and the process of deriving inter prediction information of the current time merge candidate ends.
  • mvCol, refIdxCol, and availableFlagCol are derived by the following procedure.
  • the prediction mode of the prediction block colPU is Pred_L1, and therefore the motion vector mvCol is predicted.
  • MvL1 [xPCol] [yPCol] that is the L1 motion vector of the block colPU is set (step S3406), and the reference index refIdxCol is set to the same value as the reference index RefIdxL1 [xPCol] [yPCol] of L1 (step S3406).
  • the list ListCol is set to L1 (step S3408).
  • xPCol and yPCol are indexes indicating the position of the upper left pixel of the prediction block colPU in the picture colPic at different times.
  • the L0 prediction flag PredFlagL0 [xPCol] [yPCol] of the prediction block colPU is not 0 (NO in step S3405 in FIG. 37)
  • the motion vector mvCol becomes the same value as MvL0 [xPCol] [yPCol], which is the L0 motion vector of the prediction block colPU.
  • the reference index refIdxCol is set to the same value as the reference index RefIdxL0 [xPCol] [yPCol] of L0 (step S3411), and the list ListCol is set to L0 (step S3412).
  • FIG. 38 is a flowchart showing a procedure for deriving inter prediction information of temporal merge candidates when the inter prediction mode of the prediction block colPU is bi-prediction (Pred_BI).
  • step S3501 it is determined whether the POCs of all the pictures registered in all the reference lists are smaller than the POC of the current encoding or decoding target picture (step S3501), and L0, which is all the reference lists of the prediction block colPU.
  • LX is L0, that is, the motion vector of L0 of the encoding or decoding target picture
  • the prediction vector candidate is derived (YES in step S3502)
  • the L0 inter prediction information of the prediction block colPU is selected, and LX is L1, that is, the prediction of the motion vector of the encoding or decoding target picture L1.
  • the prediction block Inter prediction information for L1 of the lock colPU is selected.
  • the flag collocated_from_l0_flag is 0. (YES in step S3503), the L0 inter prediction information of the prediction block colPU is selected. If the flag collocated_from_l0_flag is 1 (NO in step S3503), the L1 inter prediction information of the prediction block colPU is selected. To do.
  • the motion vector mvCol is set to the same value as MvL0 [xPCol] [yPCol] (step S3504), and the reference index refIdxCol is set to the same value as RefIdxL0 [xPCol] [yPCol] (step S3505), and the list ListCol is set to L0 (step S3506).
  • the motion vector mvCol is set to the same value as MvL1 [xPCol] [yPCol] (step S3507), see The index refIdxCol is set to the same value as RefIdxL1 [xPCol] [yPCol] (step S3508), and the list ListCol is set to L1 (step S3509).
  • both the flag availableFlagLXCol and the flag predFlagLXCol are set to 1 (step S3414).
  • the motion vector mvCol is scaled to be a time merge candidate LX motion vector mvLXCol (step S3415).
  • the motion vector scaling calculation processing procedure will be described with reference to FIGS. 39 and 40.
  • FIG. 39 is a flowchart showing the motion vector scaling calculation procedure in step S3105 of FIG.
  • the inter-picture distance tb is derived by subtracting the POC of the reference picture corresponding to the reference index of the temporal merge candidate LX derived in step S202 of FIG. 18 from the POC of the current encoding or decoding target picture (step S3602). . If the reference picture referenced in the list LX of the current encoding or decoding target picture is earlier than the current encoding or decoding target picture in the display order, the inter-picture distance tb is a positive value. When the reference picture referred to in the encoding or decoding target picture list LX is later in the display order, the inter-picture distance tb is a negative value.
  • tb POC of current encoding or decoding target picture—POC of reference picture corresponding to LX reference index of temporal merge candidate
  • step S3603 the inter-picture distances td and tb are compared. If the inter-picture distances td and tb are equal (YES in step S3603), the LX motion vector mvLXCol as a temporal merge candidate is set to the same value as the motion vector mvCol. After setting (step S3604), the scaling calculation process is terminated.
  • mvLXCol mvCol
  • step S3603 scaling calculation processing is performed by multiplying mvCol by the scale factor tb or td according to the following equation (step S3605), and the scaled temporal merge candidate Obtain the motion vector mvLXCol of LX.
  • mvLXCol tb or td * mvCol
  • FIG. 40 shows an example in which the scaling operation in step S3605 is performed with integer precision arithmetic.
  • the processing in steps S3606 to S3608 in FIG. 40 corresponds to the processing in step S3605 in FIG.
  • an inter-picture distance td and an inter-picture distance tb are derived (steps S3601 and S3602).
  • step S3603 the inter-picture distances td and tb are compared. If the inter-picture distances td and tb are equal (YES in step S3603), the LX motion vector mvLXCol that is the temporal merge candidate is similar to the flowchart of FIG. Is set to the same value as the motion vector mvCol (step S3604), and this scaling calculation process is terminated.
  • mvLXCol mvCol
  • tx (16384 + Abs (td or 2)) or td
  • DistScaleFactor (tb * tx + 32) >> 6
  • mvLXCol ClipMv (Sign (DistScaleFactor * mvCol) * ((Abs (DistScaleFactor * mvCol) + 127) >> 8)
  • FIG. 41 is a flowchart showing a merge candidate list construction processing procedure.
  • priorities are assigned, and merge candidates are registered in the merge candidate list mergeCandList in descending order of priority, thereby reducing the code amount of the merge index merge_idx [x0] [y0].
  • the amount of codes is reduced by placing elements with higher priorities in front of the merge candidate list.
  • the index 0 of the merge candidate list is “0”, the index 1 is “10”, the index 2 is “110”, the index 3 is “1110”, and the index 4 is “ By setting “11110”, the code amount representing the index 0 becomes 1 bit, and the code amount is reduced by registering an element considered to have a high occurrence frequency in the index 0.
  • the merge candidate list mergeCandList has a list structure, and is provided with a merge index indicating the location in the merge candidate list and a storage area for storing merge candidates corresponding to the index as elements.
  • the number of the merge index starts from 0, and merge candidates are stored in the storage area of the merge candidate list mergeCandList.
  • a prediction block that is a merge candidate of the merge index i registered in the merge candidate list mergeCandList is represented by mergeCandList [i], and is distinguished from the merge candidate list mergeCandList by array notation. To do.
  • step S4101 when availableFlagA is 1 (YES in step S4101), merge candidate A is registered at the head of the merge candidate list mergeCandList (step S4102). Subsequently, when availableFlagB is 1 (YES in step S4103), merge candidate B is registered at the end of the merge candidate list mergeCandList (step S4104). Subsequently, when availableFlagC is 1 (YES in step S4105), the merge candidate C is registered at the end of the merge candidate list mergeCandList (step S4106). Subsequently, when availableFlagD is 1 (YES in step S4107), the merge candidate D is registered at the end of the merge candidate list mergeCandList (step S4108).
  • step S4109 when availableFlagE is 1 (YES in step S4109), the merge candidate E is registered at the end of the merge candidate list mergeCandList (step S4110). Subsequently, when availableFlagCol is 1 (YES in step S4109), the merge candidate Col is registered at the end of the merge candidate list mergeCandList (step S4110).
  • the prediction block A adjacent to the left and the prediction block B adjacent to the top often move together with the prediction block to be encoded or decoded, so inter prediction of the prediction blocks A and B is performed.
  • the merge candidates A and B are registered ahead of the merge candidate list in preference to the other merge candidates C, D, E, and Col.
  • the encoding information selection unit 136 of the inter prediction information deriving unit 104 of the video encoding device selects a merge candidate from the merge candidates registered in the merge candidate list, and merge index and merge index are selected.
  • the inter prediction information of the merge candidate corresponding to is supplied to the motion compensation prediction unit 105.
  • merge candidates the same method as the prediction method determination unit 107 can be used.
  • the coding information and the coding amount of the residual signal and the coding distortion between the predicted image signal and the image signal are derived, and the merge candidate that produces the least generated code amount and coding distortion is determined.
  • entropy coding is performed on the merge index syntax element merge_idx, which is coding information in the merge mode, and the code amount of the coding information is calculated.
  • each merge candidate a predicted image signal motion-compensated according to the inter prediction information of each merge candidate by the same method as the motion compensation prediction unit 105, and an encoding target image signal supplied from the image memory 101, The amount of code of the prediction residual signal obtained by encoding the prediction residual signal is calculated. Coding information, that is, the total generated code amount obtained by adding the code amount of the merge index and the code amount of the prediction residual signal is calculated as an evaluation value.
  • the encoding distortion is calculated as a ratio representing an error from the original image signal caused by the encoding.
  • encoding information with a small generated code amount and encoding distortion is determined.
  • a merge index corresponding to the determined encoding information is encoded as a flag merge_idx represented by a second syntax pattern in units of prediction blocks.
  • the generated code amount calculated here is preferably a simulation of the encoding process, but can be approximated or approximated easily.
  • the encoding information selection unit 236 of the inter prediction information deriving unit 205 of the moving image encoding device performs a merge corresponding to the supplied merge index from among the merge candidates registered in the merge candidate list. A candidate is selected, and the inter prediction information of the merge candidate is supplied to the motion compensation prediction unit 206 and stored in the encoded information storage memory 210.
  • the moving image encoded stream output from the moving image encoding apparatus of the embodiment described above has a specific data format so that it can be decoded according to the encoding method used in the embodiment. Therefore, the moving picture decoding apparatus corresponding to the moving picture encoding apparatus can decode the encoded stream of this specific data format.
  • the encoded stream When a wired or wireless network is used to exchange an encoded stream between a moving image encoding device and a moving image decoding device, the encoded stream is converted into a data format suitable for the transmission form of the communication path. It may be transmitted.
  • a video transmission apparatus that converts the encoded stream output from the video encoding apparatus into encoded data in a data format suitable for the transmission form of the communication channel and transmits the encoded data to the network, and receives the encoded data from the network Then, a moving image receiving apparatus that restores the encoded stream and supplies the encoded stream to the moving image decoding apparatus is provided.
  • the moving image transmitting apparatus is a memory that buffers the encoded stream output from the moving image encoding apparatus, a packet processing unit that packetizes the encoded stream, and transmission that transmits the packetized encoded data via the network.
  • the moving image receiving apparatus generates a coded stream by packetizing the received data, a receiving unit that receives the packetized coded data via a network, a memory that buffers the received coded data, and packet processing. And a packet processing unit provided to the video decoding device.
  • the above processing relating to encoding and decoding can be realized as a transmission, storage, and reception device using hardware, and is stored in a ROM (Read Only Memory), a flash memory, or the like. It can also be realized by firmware or software such as a computer.
  • the firmware program and software program can be recorded on a computer-readable recording medium, provided from a server through a wired or wireless network, or provided as a data broadcast of terrestrial or satellite digital broadcasting Is also possible.
  • the present invention can be used for a moving picture coding technique using motion compensation prediction.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 各ピクチャを分割した第1ブロックを1つまたは複数の第2ブロックに分割して行うインター予測において、空間マージ候補生成部130は、第2ブロックを含む第1ブロックに含まれるブロックを参照せずに、空間マージ候補を導出する。時間マージ候補の参照インデックス導出部131は、符号化ブロックを水平境界で上下の予測ブロックに分割するモードの場合、時間マージ候補の参照インデックス情報を符号化対象の予測ブロックの左辺に近接する符号化済みの予測ブロックの参照インデックス情報の値に設定し、符号化ブロックを垂直境界で左右の予測ブロックに分割するモードの場合、時間マージ候補の参照インデックス情報を符号化対象の予測ブロックの上辺に近接する符号化済みの予測ブロックの参照インデックス情報の値に設定する。

Description

動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
 本発明は、動画像符号化及び復号技術に関し、特に動き補償予測を利用した動画像符号化及び復号技術に関する。
 動画像の圧縮符号化方式の代表的なものとして、MPEG-4 AVC/H.264の規格がある。MPEG-4 AVC/H.264では、ピクチャを複数の矩形ブロックに分割し、すでに符号化・復号したピクチャを参照ピクチャとし、参照ピクチャからの動きを予測する動き補償が用いられている。この動き補償により動きを予測する手法をインター予測または動き補償予測と呼ぶ。MPEG-4 AVC/H.264でのインター予測では、複数のピクチャを参照ピクチャとして用いることができ、これらの複数の参照ピクチャから最も適した参照ピクチャをブロック毎に選択して動き補償を行う。そこで、それぞれの参照ピクチャには参照インデックスが割り当てられ、この参照インデックスにより、参照ピクチャを特定する。なお、Bピクチャでは、復号済みの参照ピクチャから最大で2枚を選択してインター予測に用いることができる。それらの2枚の参照ピクチャからの予測をそれぞれ主に前方向の予測として使われるL0予測(リスト0予測)、主に後方向の予測として使われるL1予測(リスト1予測)として区別している。
 さらに、L0予測とL1予測の2つのインター予測を同時に用いる双予測も定義されている。双予測の場合は、双方向の予測を行い、L0予測、L1予測のそれぞれのインター予測された信号に重み付け係数を掛け算し、オフセット値を加算して重畳し、最終的なインター予測画像信号を生成する。重み付け予測に用いる重み付け係数及びオフセット値はピクチャ単位で各リストの参照ピクチャ毎に代表的な値が設定され、符号化される。インター予測に関する符号化情報には、ブロック毎に、L0予測とL1予測、双予測を区別する予測モード、ブロック毎の参照リスト毎に、参照ピクチャを特定する参照インデックス、ブロックの移動方向・移動量を表す動きベクトルがあり、これらの符号化情報を符号化・復号する。
 さらに、MPEG-4 AVC/H.264では、復号済みのブロックのインター予測情報から符号化または復号対象のブロックのインター予測情報を生成するダイレクトモードが定義されている。ダイレクトモードはインター予測情報の符号化が不要となるので、符号化効率が向上する。
 時間方向のインター予測情報の相関を利用する時間ダイレクトモードについて図42を用いて説明する。L1の参照インデックスが0に登録されているピクチャを基準ピクチャcolPicとする。基準ピクチャcolPic内で符号化または復号対象ブロックと同じ位置のブロックを基準ブロックとする。
 基準ブロックがL0予測を用いて符号化されていれば、基準ブロックのL0の動きベクトルを基準動きベクトルmvColとし、基準ブロックがL0予測を用いて符号化されておらず、L1予測を用いて符号化されていれば、基準ブロックのL1の動きベクトルを基準動きベクトルmvColとする。基準動きベクトルmvColが参照するピクチャを時間ダイレクトモードのL0の参照ピクチャとし、基準ピクチャcolPicを時間ダイレクトモードのL1の参照ピクチャとする。
 基準動きベクトルmvColからスケーリング演算処理により時間ダイレクトモードのL0の動きベクトルmvL0とL1の動きベクトルmvL1を導出する。
 基準ピクチャcolPicのPOCから、時間ダイレクトモードのL0の参照ピクチャのPOCを減算してピクチャ間距離tdを導出する。なお、POCは符号化されるピクチャに関連付けられる変数とし、ピクチャの出力順序で1ずつ増加する値が設定される。2つのピクチャのPOCの差が時間軸方向でのピクチャ間距離を示す。
 td=基準ピクチャcolPicのPOC-時間ダイレクトモードのL0の参照ピクチャのPOC
 符号化または復号対象ピクチャのPOCから時間ダイレクトモードのL0の参照ピクチャのPOCを減算してピクチャ間距離tbを導出する。
 tb=符号化または復号対象ピクチャのPOC-時間ダイレクトモードのL0の参照ピクチャのPOC
 基準動きベクトルmvColからスケーリング演算処理により時間ダイレクトモードのL0の動きベクトルmvL0を導出する。
 mvL0=tb / td * mvCol
 時間ダイレクトモードのL0の動きベクトルmvL0から基準動きベクトルmvColを減算しL1の動きベクトルmvL1を導出する。
 mvL1=mvL0 - mvCol
特開2004-129191号公報
 しかし、従来の方法では、符号化および復号対象のブロックにとって、時間ダイレクトでは、予測精度が低下し、符号化効率が良くならない場合もあった。
 このような状況下、本発明者らは、動き補償予測を使用する動画像符号化方式において、符号化情報をより一層圧縮し、全体の符号量を削減する必要性を認識するに至った。
 本発明はこうした状況に鑑みてなされたものであり、その目的は、符号化情報の候補を算出することにより、符号化情報の符号量の削減を図って符号化効率を向上させる動画像符号化及び復号技術を提供することにある。
 上記課題を解決するために、本発明のある態様の動画像符号化装置は、各ピクチャを分割した第1のブロックを1つまたは複数の第2のブロックに分割し、インター予測を用いて動画像を符号化する動画像符号化装置であって、符号化対象となるピクチャ内の、符号化対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出部(130)と、前記符号化対象となるピクチャとは異なるピクチャ内の、前記符号化対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出部(132)と、前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築部(133)と、前記予測情報候補リストにおける前記予測情報候補から、前記符号化対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択し、インター予測情報を示すインデックスを決定する選択部(136)と、前記符号化対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを符号化する符号化部(110)とを備える。前記第1予測情報導出部(130)は、前記符号化対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としない。
 本発明の別の態様もまた、動画像符号化装置である。この装置は、分割モードに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う画像符号化装置であって、符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける、前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、時間マージ候補となるインター予測情報を導出し、その導出したインター予測情報により前記符号化対象の予測ブロックのインター予測を行うマージモードにおいて、前記符号化対象の予測ブロックで用いられる参照ピクチャを特定する参照インデックス情報として、時間マージ候補の参照インデックス情報を導出する参照インデックス導出部(131)と、導出された前記参照インデックス情報に基づいた時間マージ候補のインター予測情報を導出する時間マージ候補生成部(132)とを備える。前記参照インデックス導出部(131)は、前記分割モードが前記符号化ブロックを水平境界で上下の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記符号化対象の予測ブロックの左辺に隣接する符号化済みの予測ブロックの参照インデックス情報の値に設定して出力し、前記分割モードが前記符号化ブロックを垂直境界で左右の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記符号化対象の予測ブロックの上辺に隣接する符号化済みの予測ブロックの参照インデックス情報の値に設定して出力する。
 本発明のさらに別の態様は、動画像符号化方法である。この方法は、各ピクチャを分割した第1のブロックを1つまたは複数の第2のブロックに分割し、インター予測を用いて動画像を符号化する動画像符号化方法であって、符号化対象となるピクチャ内の、符号化対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、前記符号化対象となるピクチャとは異なるピクチャ内の、前記符号化対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、前記予測情報候補リストにおける前記予測情報候補から、前記符号化対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択し、インター予測情報を示すインデックスを決定する選択ステップと、前記符号化対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを符号化する符号化ステップとを備える。前記第1予測情報導出ステップは、前記符号化対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としない。
 本発明のある態様の動画像復号装置は、各ピクチャが分割された第1のブロックが1つまたは複数の第2のブロックに分割され、インター予測により動画像が符号化された符号化ビット列を復号する動画像復号装置であって、復号対象となるピクチャ内の、復号対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出部(230)と、前記復号対象となるピクチャとは異なるピクチャ内の、前記復号対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出部(232)と、前記復号対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを復号する復号部(202)と、前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築部(233)と、前記予測情報候補リストにおける前記予測情報候補から、前記インデックスが示す前記復号対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択する選択部(236)とを備える。前記第1予測情報導出部(230)は、前記復号対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としない。
 本発明の別の態様もまた、動画像復号装置である。この装置は、分割モードに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う画像復号装置であって、復号対象の予測ブロックと時間的に異なる復号済みのピクチャにおける、前記復号対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、時間マージ候補となるインター予測情報を導出し、その導出したインター予測情報により前記復号対象の予測ブロックのインター予測を行うマージモードにおいて、前記復号対象の予測ブロックで用いられる参照ピクチャを特定する参照インデックス情報として、時間マージ候補の参照インデックス情報を導出する参照インデックス導出部(231)と、導出された前記参照インデックス情報に基づいた時間マージ候補のインター予測情報を導出する時間マージ候補生成部(232)とを備える。前記参照インデックス導出部(231)は、前記分割モードが前記復号ブロックを水平境界で上下の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記復号対象の予測ブロックの左辺に隣接する復号済みの予測ブロックの参照インデックス情報の値に設定して出力し、前記分割モードが前記復号ブロックを垂直境界で左右の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記復号対象の予測ブロックの上辺に隣接する復号済みの予測ブロックの参照インデックス情報の値に設定して出力する。
 本発明のさらに別の態様は、動画像復号方法である。この方法は、各ピクチャが分割された第1のブロックが1つまたは複数の第2のブロックに分割され、インター予測により動画像が符号化された符号化ビット列を復号する動画像復号方法であって、復号対象となるピクチャ内の、復号対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、前記復号対象となるピクチャとは異なるピクチャ内の、前記復号対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、前記復号対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを復号する復号ステップと、前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、前記予測情報候補リストにおける前記予測情報候補から、前記インデックスが示す前記復号対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択する選択ステップとを備える。前記第1予測情報導出ステップは、前記復号対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としない。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
 本発明によれば、伝送する符号化情報の発生符号量を削減させて、符号化効率を向上させることができる。
実施の形態に係る動きベクトルの予測方法を実行する動画像符号化装置の構成を示すブロック図である。 実施の形態に係る動きベクトルの予測方法を実行する動画像復号装置の構成を示すブロック図である。 ツリーブロック、符号化ブロックを説明する図である。 予測ブロックの分割モードを説明する図である。 マージモードでの空間マージ候補での処理対象の予測ブロックに近接する予測ブロックを説明する図である。 マージモードでの空間マージ候補での処理対象の予測ブロックに近接する予測ブロックを説明する図である。 マージモードでの空間マージ候補での処理対象の予測ブロックに近接する予測ブロックを説明する図である。 マージモードでの空間マージ候補での処理対象の予測ブロックに近接する予測ブロックを説明する図である。 マージモードでの時間マージ候補の導出の際に参照する予測ブロックを説明する図である。 マージモードに関するスライスレベルでのビットストリームのシンタックスを説明する図である。 マージモードに関する予測ブロックレベルでのビットストリームのシンタックスを説明する図である。 マージインデックスのシンタックス要素のエントロピー符号の一例を説明する図である。 図1の動画像符号化装置のインター予測情報導出部の詳細な構成を示すブロック図である。 図2の動画像復号装置のインター予測情報導出部の詳細な構成を示すブロック図である。 マージモードでの処理対象の予測ブロックに近接する予測ブロックを説明する図である。 マージ候補導出及びマージ候補リストの構築処理の順次処理の処理手順を説明するフローチャートである。 マージ候補導出及びマージ候補リストの構築処理の並列処理の処理手順を説明するフローチャートである。 マージモードのマージ候補の導出処理及びマージ候補リストの構築処理野手順を説明するフローチャートである。 マージモードの空間マージ候補導出処理手順を説明するフローチャートである。 本実施の形態の実施例1における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例1の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 本実施の形態の実施例2における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例2の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 本実施の形態の実施例3における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例3の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 本実施の形態の実施例4における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例4の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 本実施の形態の実施例5における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例5の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 実施例6の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 本実施の形態の実施例7における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例7の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。 NxN分割の符号化ブロックの参照インデックスの導出処理において参照する近接ブロックを説明する図である。 マージモードの時間マージ候補導出処理手順を説明するフローチャートである。 マージモードの異なる時間のピクチャの導出処理手順を説明するフローチャートである。 マージモードの異なる時間のピクチャの予測ブロックの導出処理手順を説明するフローチャートである。 マージモードの時間マージ候補導出処理手順を説明するフローチャートである。 マージモードの時間マージ候補導出処理手順を説明するフローチャートである。 動きベクトルのスケーリング演算処理手順を説明するフローチャートである。 動きベクトルのスケーリング演算処理手順を説明するフローチャートである。 マージモードのマージ候補リストの構築処理手順を説明するフローチャートである。 従来のMPEG-4 AVC/H.264の時間ダイレクトモードを説明する図である。 本実施の形態の実施例8における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。 実施例8の方法によるマージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。
 本実施の形態では、動画像の符号化に関し、特にピクチャを任意のサイズ、形状の矩形ブロックに分割し、ピクチャ間でブロック単位に動き補償を行う動画像符号化における符号化効率を向上させる為に、符号化対象ブロックに近接するブロックまたは符号化済みのピクチャのブロックの動きベクトルから複数の予測動きベクトルを導出し、符号化対象のブロックの動きベクトルと選択された予測動きベクトルとの差分ベクトルを算出して符号化することによって符号量を削減する。あるいは、符号化対象ブロックに近接するブロックまたは符号化済みのピクチャのブロックの符号化情報を利用することにより、符号化対象ブロックの符号化情報を導出することによって符号量を削減する。また、動画像の復号の場合は、復号対象ブロックに近接するブロックまたは復号済みのピクチャのブロックの動きベクトルから複数の予測動きベクトルを算出し、符号化ストリームから復号された差分ベクトルと選択された予測動きベクトルとから復号対象のブロックの動きベクトルを算出して復号する。あるいは、復号対象ブロックに近接するブロックまたは復号済みのピクチャのブロックの符号化情報を利用することにより、復号対象ブロックの符号化情報を導出する。
 まず、本実施の形態において使用する技術、及び技術用語を定義する。
 (ツリーブロック、符号化ブロックについて)
 実施の形態では、図3に示されるように、ピクチャ内を任意の同一サイズの正方の矩形の単位にて均等分割する。この単位をツリーブロックと定義し、ピクチャ内での符号化または復号対象ブロック(符号化処理においては符号化対象ブロック、復号処理においては復号対象ブロックのことである。以下、断りのない限り、この意味で用いる。)を特定するためのアドレス管理の基本単位とする。モノクロを除きツリーブロックは1つの輝度信号と2つの色差信号で構成される。ツリーブロックのサイズはピクチャサイズやピクチャ内のテクスチャに応じて、2のべき乗のサイズで自由に設定することができる。ツリーブロックはピクチャ内のテクスチャに応じて、符号化処理を最適にすべく、必要に応じてツリーブロック内の輝度信号、及び色差信号を階層的に4分割(縦横に2分割ずつ)して、ブロックサイズの小さいブロックにすることができる。このブロックをそれぞれ符号化ブロックと定義し、符号化及び復号を行う際の処理の基本単位とする。モノクロを除き符号化ブロックも1つの輝度信号と2つの色差信号で構成される。符号化ブロックの最大サイズはツリーブロックのサイズと同一である。符号化ブロックの最小のサイズとなる符号化ブロックを最小符号化ブロックと呼び、2のべき乗のサイズで自由に設定することができる。
 図3においては、符号化ブロックAは、ツリーブロックを分割せず、1つの符号化ブロックとしたものである。符号化ブロックBは、ツリーブロックを4分割してできた符号化ブロックである。符号化ブロックCは、ツリーブロックを4分割してできたブロックをさらに4分割してできた符号化ブロックである。符号化ブロックDは、ツリーブロックを4分割してできたブロックをさらに階層的に2度4分割してできた符号化ブロックであり、最小サイズの符号化ブロックである。
 (予測モードについて)
 符号化ブロック単位で、符号化または復号対象ピクチャ内の符号化または復号済み(符号化処理においては符号化した信号を復号したピクチャ、予測ブロック、画像信号等に用い、復号処理においては復号したピクチャ、予測ブロック、画像信号等に用いる。以下、断りのない限り、この意味で用いる。)の周囲の画像信号から予測を行うイントラ予測(MODE_INTRA)、及び符号化または復号済みのピクチャの画像信号から予測を行うインター予測(MODE_INTER)を切り替える。このイントラ予測(MODE_INTRA)とインター予測(MODE_INTER)を識別するモードを予測モード(PredMode)と定義する。予測モード(PredMode)はイントラ予測(MODE_INTRA)、またはインター予測(MODE_INTER)を値として持ち、選択して符号化できる。
 (分割モード、予測ブロック、予測ユニットについて)
 ピクチャ内をブロックに分割してイントラ予測(MODE_INTRA)及びインター予測(MODE_INTER)を行う場合、イントラ予測及びインター予測の方法を切り替える単位をより小さくするために、必要に応じて符号化ブロックを分割して予測を行う。この符号化ブロックの輝度信号と色差信号の分割方法を識別するモードを分割モード(PartMode)と定義する。さらに、この分割されたブロックを予測ブロックと定義する。図4に示すように、符号化ブロックの輝度信号の分割方法に応じて8種類の分割モード(PartMode)を定義する。
 図4(a)に示す符号化ブロックの輝度信号を分割せず1つの予測ブロックとみなした分割モード(PartMode)を2N×2N分割(PART_2Nx2N)と定義する。図4(b)、(c)、(d)に示す符号化ブロックの輝度信号を上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)をそれぞれ2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)と定義する。ただし、2N×N分割(PART_2NxN)は上下に1:1の比率で分割した分割モードであり、2N×nU分割(PART_2NxnU)は上下に1:3の比率で分割した分割モードであり、2N×nD分割(PART_2NxnD)は上下に3:1の比率で分割した分割モードである。図4(e)、(f)、(g)に示す符号化ブロックの輝度信号を左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)をそれぞれN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)と定義する。ただし、N×2N分割(PART_Nx2N)は左右に1:1の比率で分割した分割モードであり、nL×2N分割(PART_nLx2N)は左右に1:3の比率で分割した分割モードであり、nR×2N分割(PART_nRx2N)は左右に3:1の比率で分割した分割モードである。図4(h)に示す符号化ブロックの輝度信号を上下左右に4分割して、4つの予測ブロックとした分割モード(PartMode)をN×N分割(PART_NxN)とそれぞれ定義する。
 なお、各分割モード(PartMode)毎に輝度信号の縦横の分割比率と同様に色差信号も分割する。
 符号化ブロック内部において、各予測ブロックを特定する為に、0から開始する番号を、符号化順序で、符号化ブロック内部に存在する予測ブロックに対して割り当てる。この番号を分割インデックスPartIdxと定義する。図4の符号化ブロックの各予測ブロックの中に記述された数字は、その予測ブロックの分割インデックスPartIdxを表す。図4(b)、(c)、(d)に示す2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では上の予測ブロックの分割インデックスPartIdxを0とし、下の予測ブロックの分割インデックスPartIdxを1とする。図4(e)、(f)、(g)に示すN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では左の予測ブロックの分割インデックスPartIdxを0とし、右の予測ブロックの分割インデックスPartIdxを1とする。図4(h)に示すN×N分割(PART_NxN)では、左上の予測ブロックの分割インデックスPartIdxを0とし、右上の予測ブロックの分割インデックスPartIdxを1とし、左下の予測ブロックの分割インデックスPartIdxを2とし、右下の予測ブロックの分割インデックスPartIdxを3とする。
 予測モード(PredMode)がインター予測(MODE_INTER)では、分割モード(PartMode)は2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、及びnR×2N分割(PART_nRx2N)を定義する。最小の符号化ブロックである符号化ブロックDのみ、分割モード(PartMode)は2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、及びnR×2N分割(PART_nRx2N)に加えてN×N分割(PART_NxN)を定義することもできるが、本実施の形態においては、分割モード(PartMode)がN×N分割(PART_NxN)を定義しないものとする。
 予測モード(PredMode)がイントラ予測(MODE_INTRA)では、最小の符号化ブロックである符号化ブロックD以外では、分割モード(PartMode)は2N×2N分割(PART_2Nx2N)だけを定義し、最小の符号化ブロックである符号化ブロックDのみ、分割モード(PartMode)は2N×2N分割(PART_2Nx2N)に加えてN×N分割(PART_NxN)を定義する。なお、最小の符号化ブロック以外にN×N分割(PART_NxN)を定義しない理由は最小の符号化ブロック以外では、符号化ブロックを4分割して小さな符号化ブロックを表現できるからである。
 (ツリーブロック、符号化ブロック、予測ブロック、変換ブロックの位置)
 本実施の形態のツリーブロック、符号化ブロック、予測ブロック、変換ブロックを始めとする各ブロックの位置は、輝度信号の画面の一番左上の輝度信号の画素の位置を原点(0,0)とし、それぞれのブロックの領域に含まれる一番左上の輝度信号の画素の位置を(x,y)の二次元座標で表す。座標軸の向きは水平方向に右の方向、垂直方向に下の方向をそれぞれ正の向きとし、単位は輝度信号の1画素単位である。輝度信号と色差信号で画像サイズ(画素数)が同じである色差フォーマットが4:4:4の場合ではもちろんのこと、輝度信号と色差信号で画像サイズ(画素数)が異なる色差フォーマットが4:2:0、4:2:2の場合でも色差信号の各ブロックの位置をそのブロックの領域に含まれる輝度信号の画素の座標で表し、単位は輝度信号の1画素である。この様にすることで、色差信号の各ブロックの位置が特定できるのはもちろんのこと、座標の値を比較するだけで、輝度信号のブロックと色差信号のブロックの位置の関係も明確となる。
 (インター予測モード、参照リストについて)
 本発明の実施の形態においては、復号済みのピクチャの画像信号から予測を行うインター予測では、複数の復号済みのピクチャを参照ピクチャとして用いることができる。複数の参照ピクチャから選択された参照ピクチャを特定するため、予測ブロック毎に参照インデックスを付ける。Bスライスでは予測ブロック毎に任意の2枚の参照ピクチャを選択してインター予測を行うことができ、インター予測モードとしてL0予測(Pred_L0)、L1予測(Pred_L1)、双予測(Pred_BI)がある。参照ピクチャはリスト構造のL0(参照リスト0)とL1(参照リスト1)で管理され、L0またはL1の参照インデックスを指定することにより参照ピクチャを特定することができる。L0予測(Pred_L0)はL0で管理されている参照ピクチャを参照するインター予測であり、L1予測(Pred_L1)はL1で管理されている参照ピクチャを参照するインター予測であり、双予測(Pred_BI)はL0予測とL1予測が共に行われ、L0とL1のそれぞれで管理されている1つずつの参照ピクチャを参照するインター予測である。Pスライスのインター予測ではL0予測のみが使用でき、Bスライスのインター予測ではL0予測、L1予測、L0予測とL1予測を平均または重み付け加算する双予測(Pred_BI)が使用できる。以降の処理において出力に添え字LXが付いている定数、変数に関しては、L0、L1ごとに処理が行われることを前提とする。
 (マージモード、マージ候補)
 マージモードとは、符号化または復号対象の予測ブロックの予測モード、参照インデックス、動きベクトル等のインター予測情報を符号化または復号するのではなく、符号化または復号対象の予測ブロックと同一ピクチャ内でその符号化または復号対象の予測ブロックに近接する予測ブロック、あるいは符号化または復号対象の予測ブロックと時間的に異なる復号済みのピクチャの符号化または復号対象の予測ブロックと同一位置あるいはその付近(近傍の位置)に存在する予測ブロックのインター予測情報から符号化または復号対象の予測ブロックのインター予測情報を導出することによりインター予測を行うモードである。符号化または復号対象の予測ブロックと同一ピクチャ内でその符号化または復号対象の予測ブロックに近接する予測ブロック及びその予測ブロックのインター予測情報を空間マージ候補、符号化または復号対象の予測ブロックと時間的に異なる符号化または復号済みのピクチャの符号化または復号対象の予測ブロックと同一位置あるいはその付近(近傍の位置)に存在する予測ブロック及びその予測ブロックのインター予測情報から導出されるインター予測情報を時間マージ候補とする。それぞれのマージ候補はマージ候補リストに登録され、マージインデックスによりインター予測で用いるマージ候補を特定する。
 (近接する予測ブロックについて)
 図5、図6、図7及び図8は空間マージ候補の導出、および時間マージ候補の参照インデックスの導出の際に参照する符号化または復号対象の予測ブロックと同一ピクチャ内でその符号化または復号対象の予測ブロックに近接する予測ブロックを説明する図である。図9は時間マージ候補の参照インデックスの導出の際に参照する符号化または復号対象の予測ブロックと時間的に異なる符号化または復号済みのピクチャにおいて、符号化または復号対象の予測ブロックと同一位置あるいはその付近に存在する既に符号化または復号済みの予測ブロックを説明する図である。図5、図6、図7、図8及び図9を用いて符号化または復号対象の予測ブロックの空間方向に近接する予測ブロック、及び異なる時間の同一位置の予測ブロックについて説明する。
 図5に示すように、符号化または復号対象の予測ブロックと同一ピクチャ内でその符号化または復号対象の予測ブロックの左側の辺に近接する予測ブロックA、上側の辺に近接する予測ブロックB、右上の頂点に近接する予測ブロックC、左下の頂点に近接する予測ブロックD、および左上の頂点に近接する予測ブロックEを空間方向に近接する予測ブロックと定義する。
 なお、図6に示すように、符号化または復号対象の予測ブロックの左側の辺に近接する予測ブロックのサイズが符号化または復号対象の予測ブロックより小さく、複数存在する場合には、本実施の形態においては左側の辺に近接する予測ブロックの中で最も下の予測ブロックA10を左側の辺に近接する予測ブロックAとする。
 同様に、符号化または復号対象の予測ブロックの上側の辺に近接する予測ブロックのサイズが符号化または復号対象の予測ブロックより小さく、複数存在する場合には、本実施の形態においては左側の辺に近接する予測ブロックの中で最も右の予測ブロックB10を上側の辺に近接する予測ブロックB1とする。
 なお、図7に示すように、符号化または復号対象の予測ブロックの左側に近接する予測ブロックFのサイズが符号化または復号対象の予測ブロックより大きい場合にも、前記条件に従い、左側に近接する予測ブロックAがその符号化または復号対象の予測ブロックの左側の辺に近接していれば予測ブロックAとし、符号化または復号対象の予測ブロックの左下の頂点に近接していれば予測ブロックDとし、符号化または復号対象の予測ブロックの左上の頂点に近接していれば予測ブロックEとする。図6の例では、予測ブロックA、予測ブロックE及び予測ブロックEは同一の予測ブロックとなる。
 なお、図8に示すように、符号化または復号対象の予測ブロックの上側に近接する予測ブロックGのサイズが符号化または復号対象の予測ブロックより大きい場合にも、前記条件に従い、上側に近接する予測ブロックGがその符号化または復号対象の予測ブロックの上側の辺に近接していれば予測ブロックBとし、符号化または復号対象の予測ブロックの右上の頂点に近接していれば予測ブロックCとし、符号化または復号対象の予測ブロックの左上の頂点に近接していれば予測ブロックEとする。図8の例では、予測ブロックB、予測ブロックC及び予測ブロックEは同一の予測ブロックとなる。
 図9に示すように、符号化または復号対象の予測ブロックと時間的に異なる復号済みのピクチャにおいて、符号化または復号対象の予測ブロックと同一位置あるいはその付近に存在する既に符号化または復号済みの予測ブロックT0およびT1を異なる時間の同一位置の予測ブロックと定義する。
 (POCについて)
 POCは符号化されるピクチャに関連付けられる変数とし、ピクチャの出力順序で1ずつ増加する値が設定される。POCの値によって、同じピクチャであるかを判別したり、出力順序でのピクチャ間の前後関係を判別したり、ピクチャ間の距離を導出したりすることができる。例えば、2つのピクチャのPOCが同じ値を持つ場合、同一のピクチャであると判断できる。2つのピクチャのPOCが違う値を持つ場合、POCの値が小さいピクチャのほうが、先に出力されるピクチャであると判断でき、2つのピクチャのPOCの差が時間軸方向でのピクチャ間距離を示す。
 以下、図面と共に本発明の実施の形態を説明する。図1は本発明の実施の形態に係る動画像符号化装置の構成を示すブロック図である。実施の形態の動画像符号化装置は、画像メモリ101、動きベクトル検出部102、差分動きベクトル算出部103、インター予測情報導出部104、動き補償予測部105、イントラ予測部106、予測方法決定部107、残差信号生成部108、直交変換・量子化部109、第1の符号化ビット列生成部110、第2の符号化ビット列生成部111、多重化部112、逆量子化・逆直交変換部113、復号画像信号重畳部114、符号化情報格納メモリ115、および復号画像メモリ116を備える。
 画像メモリ101は、撮影/表示時間順に供給された符号化対象のピクチャの画像信号を一時格納する。画像メモリ101は、格納された符号化対象のピクチャの画像信号を、所定の画素ブロック単位で、動きベクトル検出部102、予測方法決定部107、および残差信号生成部108に供給する。その際、撮影/表示時間順に格納されたピクチャの画像信号は、符号化順序に並べ替えられて、画素ブロック単位で、画像メモリ101から出力される。
 動きベクトル検出部102は、画像メモリ101から供給される画像信号と復号画像メモリ116から供給される参照ピクチャ間でブロックマッチング等により各予測ブロックサイズ、各予測モードのそれぞれの動きベクトルを各予測ブロック単位で検出し、検出された動きベクトルを動き補償予測部105、差分動きベクトル算出部103、および予測方法決定部107に供給する。
 差分動きベクトル算出部103は、符号化情報格納メモリ115に記憶されている既に符号化された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を算出して予測動きベクトルリストに登録し、予測動きベクトルリストに登録された複数の予測動きベクトルの候補の中から最適な予測動きベクトルを選択し、動きベクトル検出部102が検出した動きベクトルと予測動きベクトルから差分動きベクトルを算出し、算出された差分動きベクトルを予測方法決定部107に供給する。さらに、予測動きベクトルリストに登録された予測動きベクトルの候補から選択された予測動きベクトルを特定する予測動きベクトルインデックスを予測方法決定部107に供給する。
 インター予測情報導出部104は、マージモードでのマージ候補を導出する。符号化情報格納メモリ115に記憶されている既に符号化された予測ブロックの符号化情報を用いて、複数のマージ候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中から適したマージ候補を選択し、選択されたマージ候補の各予測ブロックのL0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を動き補償予測部105に供給するとともに、選択されたマージ候補を特定するマージインデックスを予測方法決定部107に供給する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。インター予測情報導出部104の詳細な構成と動作は後述する。
 動き補償予測部105は、動きベクトル検出部102およびインター予測情報導出部104により検出された動きベクトルを用いて参照ピクチャからインター予測(動き補償予測)により予測画像信号を生成し、予測画像信号を予測方法決定部107に供給する。なお、L0予測、及びL1予測では、片方向の予測を行う。双予測(Pred_BI)の場合は、双方向の予測を行い、L0予測、L1予測のそれぞれのインター予測された信号に適応的に重み係数を掛け算し、オフセット値を加算して重畳し、最終的な予測画像信号を生成する。
 イントラ予測部106は、各イントラ予測モードについてイントラ予測を行う。復号画像メモリ211に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、複数のイントラ予測モードの中から適したイントラ予測モードを選択し、選択されたイントラ予測モード、及び選択されたイントラ予測モードに応じた予測画像信号を予測方法決定部107に供給する。
 予測方法決定部107はそれぞれの予測方法毎に符号化情報及び残差信号の符号量、予測画像信号と画像信号との間の歪量等を評価することにより、複数の予測方法の中から、最適な符号化ブロック単位でインター予測(PRED_INTER)かイントラ予測(PRED_INTRA)かを判別する予測モードPredMode、分割モードPartModeを決定し、インター予測(PRED_INTER)では予測ブロック単位でマージモードか否かを決定し、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、L0、L1の参照インデックス、差分動きベクトル等を決定して、決定に応じた符号化情報を第1の符号化ビット列生成部110に供給する。
 さらに、予測方法決定部107は、決定された予測方法を示す情報、及び決定された予測方法に応じた動きベクトル等を含む符号化情報を符号化情報格納メモリ115に格納する。ここで格納する符号化情報は、各符号化ブロックの予測モードPredMode、分割モードPartMode、各予測ブロックのL0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。なお、予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]、L1予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は共に0である。一方、予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は0である。インター予測モードがL1予測(Pred_L1)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は1である。インター予測モードが双予測(Pred_BI)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]、L1予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は共に1である。予測方法決定部107は、決定された予測モードに応じた予測画像信号を残差信号生成部108と復号画像信号重畳部114に供給する。
 残差信号生成部108は、符号化する画像信号と予測画像信号との減算を行うことにより残差信号を生成し、直交変換・量子化部109に供給する。
 直交変換・量子化部109は、残差信号に対して量子化パラメータに応じて直交変換及び量子化を行い直交変換・量子化された残差信号を生成し、第2の符号化ビット列生成部111と逆量子化・逆直交変換部113に供給する。さらに、直交変換・量子化部109は、量子化パラメータを符号化情報格納メモリ115に格納する。
 第1の符号化ビット列生成部110は、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報に加えて、符号化ブロック及び予測ブロック毎に予測方法決定部107によって決定された予測方法に応じた符号化情報を符号化する。具体的には、符号化ブロック毎の予測モードPredMode、分割モードPartMode、インター予測(PRED_INTER)の場合、マージモードかどうかを判別するフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトルに関する情報等の符号化情報を後述する規定のシンタックス規則に従って符号化して第1の符号化ビット列を生成し、多重化部112に供給する。
 第2の符号化ビット列生成部111は、直交変換及び量子化された残差信号を規定のシンタックス規則に従ってエントロピー符号化して第2の符号化ビット列を生成し、多重化部112に供給する。多重化部112で、第1の符号化ビット列と第2の符号化ビット列を規定のシンタックス規則に従って多重化し、ビットストリームを出力する。
 逆量子化・逆直交変換部113は、直交変換・量子化部109から供給された直交変換・量子化された残差信号を逆量子化及び逆直交変換して残差信号を算出し、復号画像信号重畳部114に供給する。復号画像信号重畳部114は、予測方法決定部107による決定に応じた予測画像信号と逆量子化・逆直交変換部113で逆量子化及び逆直交変換された残差信号を重畳して復号画像を生成し、復号画像メモリ116に格納する。なお、復号画像に対して符号化によるブロック歪等の歪を減少させるフィルタリング処理を施して、復号画像メモリ116に格納されることもある。
 図2は図1の動画像符号化装置に対応した本発明の実施の形態に係る動画像復号装置の構成を示すブロックである。実施の形態の動画像復号装置は、分離部201、第1符号化ビット列復号部202、第2符号化ビット列復号部203、動きベクトル算出部204、インター予測情報導出部205、動き補償予測部206、イントラ予測部207、逆量子化・逆直交変換部208、復号画像信号重畳部209、符号化情報格納メモリ210、および復号画像メモリ211を備える。
 図2の動画像復号装置の復号処理は、図1の動画像符号化装置の内部に設けられている復号処理に対応するものであるから、図2の動き補償予測部206、逆量子化・逆直交変換部208、復号画像信号重畳部209、符号化情報格納メモリ210、および復号画像メモリ211の各構成は、図1の動画像符号化装置の動き補償予測部105、逆量子化・逆直交変換部113、復号画像信号重畳部114、符号化情報格納メモリ115、および復号画像メモリ116の各構成とそれぞれ対応する機能を有する。
 分離部201に供給されるビットストリームは規定のシンタックスの規則に従って分離し、分離された第1の符号化ビット列が第1符号化ビット列復号部202に供給され、第2の符号化ビット列が第2符号化ビット列復号部203に供給される。
 第1符号化ビット列復号部202は、供給された符号化ビット列を復号して、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報、及び、予測ブロック単位の符号化情報を得る。具体的には、符号化ブロック単位でインター予測(PRED_INTER)かイントラ予測(PRED_INTRA)かを判別する予測モードPredMode、分割モードPartMode、インター予測(PRED_INTER)の場合、マージモードかどうかを判別するフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトル等に関する符号化情報を後述する規定のシンタックス規則に従って復号し、符号化情報を動きベクトル算出部204、インター予測情報導出部205またはイントラ予測部207に供給する。
 第2符号化ビット列復号部203は、供給された符号化ビット列を復号して直交変換・量子化された残差信号を算出し、直交変換・量子化された残差信号を逆量子化・逆直交変換部208に供給する。
 動きベクトル算出部204は、復号対象の予測ブロックの予測モードPredModeがインター予測(PRED_INTER)でマージモードでない時に、符号化情報格納メモリ210に記憶されている既に復号された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を導出して後述する予測動きベクトルリストに登録し、予測動きベクトルリストに登録された複数の予測動きベクトルの候補の中から、第1符号化ビット列復号部202で復号され供給される予測動きベクトルインデックスに応じた予測動きベクトルを選択し、第1符号化ビット列復号部202で復号された差分ベクトルと選択された予測動きベクトルから動きベクトルを算出し、他の符号化情報とともに動き補償予測部206に供給するとともに、符号化情報格納メモリ210に格納する。ここで供給・格納する予測ブロックの符号化情報は、予測モードPredMode、分割モードPartMode、L0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0は1, L1予測を利用するかどうかを示すフラグpredFlagL1は0である。インター予測モードがL1予測(Pred_L1)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0は0, L1予測を利用するかどうかを示すフラグpredFlagL1は1である。インター予測モードが双予測(Pred_BI)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0、L1予測を利用するかどうかを示すフラグpredFlagL1は共に1である。
 インター予測情報導出部205は、復号対象の予測ブロックの予測モードPredModeがインター予測(PRED_INTER)でマージモードの時に、マージ候補を導出する。符号化情報格納メモリ115に記憶されている既に復号された予測ブロックの符号化情報を用いて、複数のマージの候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中から第1符号化ビット列復号部202で復号され供給されるマージインデックスに対応したマージ候補を選択し、選択されたマージ候補のL0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を動き補償予測部206に供給するとともに、符号化情報格納メモリ210に格納する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。インター予測情報導出部205の詳細な構成と動作は後述する。
 動き補償予測部206は、動きベクトル算出部204またはインター予測情報導出部205で算出されたインター予測情報を用いて復号画像メモリ211に格納されている参照ピクチャからインター予測(動き補償予測)により予測画像信号を生成し、予測画像信号を復号画像信号重畳部209に供給する。なお、双予測(Pred_BI)の場合は、L0予測、L1予測の2つの動き補償予測画像信号に適応的に重み係数を掛け算して重畳し、最終的な予測画像信号を生成する。
 イントラ予測部207は、復号対象の予測ブロックの予測モードPredModeがイントラ予測(PRED_INTRA)の時に、イントラ予測を行う。第1符号化ビット列復号部で復号された符号化情報にはイントラ予測モードが含まれており、イントラ予測モードに応じて、復号画像メモリ211に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、予測画像信号を復号画像信号重畳部209に供給する。L0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]を共に0に設定し、符号化情報格納メモリ210に格納する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。
 逆量子化・逆直交変換部208は、第1符号化ビット列復号部202で復号された直交変換・量子化された残差信号に対して逆直交変換及び逆量子化を行い、逆直交変換・逆量子化された残差信号を得る。
 復号画像信号重畳部209は、動き補償予測部206でインター予測された予測画像信号、またはイントラ予測部207でイントラ予測された予測画像信号と、逆量子化・逆直交変換部208により逆直交変換・逆量子化された残差信号とを重畳することにより、復号画像信号を復号し、復号画像メモリ211に格納する。復号画像メモリ211に格納する際には、復号画像に対して符号化によるブロック歪等を減少させるフィルタリング処理を施して、復号画像メモリ211に格納されることもある。
 (シンタックスについて)
 次に、本実施の形態に係る動きベクトルの予測方法を備える動画像符号化装置により符号化され、復号装置により復号される動画像のビットストリームの符号化および復号の共通規則であるシンタックスについて説明する。
 図10は本実施の形態により生成されるビットストリームのスライス単位でスライスヘッダーに記述される第1のシンタックス構造を示す。ただし、本実施の形態に関係のあるシンタックス要素のみを示している。スライスタイプがBスライスの場合は、時間方向の予測動きベクトルの候補、またはマージ候補を導出する際に用いる異なる時間のピクチャcolPicが処理対象の予測ブロックが含まれるピクチャのL0の参照リスト或いはL1の参照リストのどちらに登録されている参照ピクチャを使用するかを示すフラグcollocated_from_l0_flagが設置される。フラグcollocated_from_l0_flagの詳細については後述する。
 なお、以上のシンタックス要素はピクチャ単位で設定されるシンタックス要素を記述するピクチャ・パラメータ・セットに設置してもよい。
 図11は予測ブロック単位に記述されるシンタックスパターンを示す。予測ブロックの予測モードPredModeの値がインター予測(MODE_INTER)の場合、マージモードかどうかを示すmerge_flag[x0][y0]が設置される。ここで、x0、y0は輝度信号のピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、merge_flag[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのマージモードかどうかを示すフラグである。
 次に、merge_flag[x0][y0]が1の場合、マージモードであることを示し、参照するマージ候補のリストであるマージリストのインデックスのシンタックス要素merge_idx[x0][y0]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、merge_idx[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのマージインデックスである。図12はマージインデックスのシンタックス要素merge_idx[x0][y0]のエントロピー符号の一例である。本発明の本実施の形態においてはマージの候補数を5と設定する。マージインデックスが0, 1, 2, 3, 4の時、マージインデックスのシンタックス要素merge_idx[x0][y0]の符号はそれぞれ'0'、'10'、'110'、'1110'、'1111'となる。
 一方、merge_flag[x0][y0]が0の場合、マージモードでないことを示し、スライスタイプがBスライスの場合、インター予測モードを識別するシンタックス要素inter_pred_flag[x0][y0]が設置され、このシンタックス要素でL0予測(Pred_L0)、L1予測(Pred_L1)、双予測(Pred_BI)を識別する。L0、L1ごとに、参照ピクチャを特定するための参照インデックスのシンタックス要素ref_idx_l0[x0][y0]、ref_idx_l1[x0][y0]、動きベクトル検出にて求められた予測ブロックの動きベクトルと予測動きベクトルとの差分である差分動きベクトルのシンタックス要素mvd_l0[x0][y0][j]、mvd_l1[x0][y0][j]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、ref_idx_l0[x0][y0]、mvd_l0[x0][y0][j]はそれぞれピクチャ内の(x0, y0)に位置する予測ブロックのL0の参照インデックス、及び差分動きベクトルであり、ref_idx_l1[x0][y0]、mvd_l1[x0][y0][j]はそれぞれピクチャ内の(x0, y0)に位置する予測ブロックのL1の参照インデックス、及び差分動きベクトルである。また、jは差分動きベクトルの成分を表し、jが0はx成分を、jが1はy成分を表す。次に、参照する予測動きベクトルの候補のリストである予測動きベクトルリストのインデックスのシンタックス要素mvp_idx_l0[x0][y0]、mvp_idx_l1[x0][y0]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、mvp_idx_l0[x0][y0]、mvp_idx_l1[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのL0、L1の予測動きベクトルインデックスである。本発明の本実施の形態においてはこれらの候補数の値を2と設定する。
 実施の形態に係るインター予測情報導出方法は、図1の動画像符号化装置のインター予測情報導出部104及び図2の動画像復号装置のインター予測情報導出部205において実施される。
 次に、実施の形態に係るインター予測情報導出方法を図面を用いて説明する。インター予測情報導出方法は、符号化ブロックを構成する予測ブロック単位に、符号化及び復号の処理の何れでも実施される。予測ブロックの予測モードPredModeがインター予測(MODE_INTER)で、マージモードの場合に、符号化の場合、符号化済みの予測ブロックの予測モード、参照インデックス、動きベクトルを利用して符号化対象の予測ブロックの予測モード、参照インデックス、動きベクトルを導出する際、復号の場合、復号済みの予測ブロックの予測モード、参照インデックス、動きベクトルを利用して復号対象の予測ブロックの予測モード、参照インデックス、動きベクトルを導出する際に実施される。
 マージモードは図5、図6、図7及び図8を用いて説明した左に近接する予測ブロックA、上に近接する予測ブロックB、右上に近接する予測ブロックC、左下に近接する予測ブロックD、左上に近接する予測ブロックEの5つの予測ブロックに加えて、図9を用いて説明した異なる時間の同一位置あるいはその付近に存在する予測ブロックCol(T0、T1のいずれか)の予測ブロックからマージ候補を導出する。動画像符号化装置のインター予測情報導出部104、及び動画像復号装置のインター予測情報導出部205はそれらのマージ候補を符号化側と復号側で共通の規定の順序でマージ候補リストに登録し、動画像符号化装置のインター予測情報導出部104がマージ候補リストの要素を特定するマージインデックスを決定して第1の符号化ビット列生成部を経由して符号化し、動画像復号装置のインター予測情報導出部205は第1符号化ビット列復号部202で復号されたマージインデックスが供給されて、そのマージインデックスに応じた予測ブロックをマージ候補リストから選択し、その選択されたマージ候補の予測モード、参照インデックス、動きベクトル等のインター予測情報を用いて、動き補償予測を行う。
 図13は、図1の動画像符号化装置のインター予測情報導出部104の詳細な構成を示す図である。また、図14は、図2の動画像復号装置のインター予測情報導出部205の詳細な構成を示す図である。
 図13及び図14の太枠線で囲まれる部分はそれぞれ、動画像符号化装置のインター予測情報導出部104及び動画像復号装置のインター予測情報導出部205を示している。
 更に、それらの内部の太点線で囲まれる部分はそれぞれのマージ候補を導出してマージ候補リストを構築する動画像符号化装置のマージ候補リストの構築部120及び動画像復号装置のマージ候補リストの構築部220を示しており、実施の形態の動画像符号化装置と対応する動画像復号装置にも同様に設置され、符号化と復号で矛盾しない同一の導出結果を得られるようにしている。
 実施の形態に係るインター予測情報導出方法においては、動画像符号化装置のマージ候補リストの構築部120及び動画像復号装置のマージ候補リストの構築部220でのマージ候補導出及びマージ候補リスト構築処理において、処理対象となる予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる予測ブロックを参照せずに、処理対象の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うものとする。この様にすることで、符号化ブロックの分割モード(PartMode)が、2N×2N分割(PART_2Nx2N)でない場合、すなわち、符号化ブロック内に複数の予測ブロックが存在する場合に、符号化側で符号化ブロック内でそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。
 符号化ブロック内でのそれぞれの予測ブロックのマージ候補リストの構築の並列処理について、図15を用いて分割モード(PartMode)毎に説明する。図15は処理対象の符号化ブロックの分割モード(PartMode)毎に処理対象の予測ブロックに近接する予測ブロックを説明する図である。図15において、A0、B0、C0、D0、E0は分割インデックスPartIdxが0の処理対象の予測ブロックのそれぞれ左側の辺に近接する予測ブロックA、上側の辺に近接する予測ブロックB、右上の頂点に近接する予測ブロックC、左下の頂点に近接する予測ブロックD、および左上の頂点に近接する予測ブロックEを示し、A1、B1、C1、D1、E1は分割インデックスPartIdxが1の処理対象の予測ブロックのそれぞれ左側の辺に近接する予測ブロックA、上側の辺に近接する予測ブロックB、右上の頂点に近接する予測ブロックC、左下の頂点に近接する予測ブロックD、および左上の頂点に近接する予測ブロックEを示し、A2、B2、C2、D2、E2は分割インデックスPartIdxが2の処理対象の予測ブロックのそれぞれ左側の辺に近接する予測ブロックA、上側の辺に近接する予測ブロックB、右上の頂点に近接する予測ブロックC、左下の頂点に近接する予測ブロックD、および左上の頂点に近接する予測ブロックEを示し、A3、B3、C3、D3、E3は分割インデックスPartIdxが3の処理対象の予測ブロックのそれぞれ左側の辺に近接する予測ブロックA、上側の辺に近接する予測ブロックB、右上の頂点に近接する予測ブロックC、左下の頂点に近接する予測ブロックD、および左上の頂点に近接する予測ブロックEを示す。
 図15(b)、(c)、(d)は処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)での近接する予測ブロックを示す図である。PartIdxが1の処理対象の予測ブロックに近接する予測ブロックB1はPartIdxが0の予測ブロックである。したがって、予測ブロックB1を参照して、PartIdxが1の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うには、予測ブロックB1である同じ符号化ブロックに属するPartIdxが0の予測ブロックのマージ候補導出及びマージ候補リスト構築処理が完了し、利用するマージ候補を特定した後でないと、処理を行うことができない。したがって、実施の形態に係るインター予測情報導出方法においては、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)で、処理対象の予測ブロックのPartIdxが1では、処理対象の予測ブロックの上辺に近接し、処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれるPartIdxが0の予測ブロックである予測ブロックB1の符号化情報を参照せずに、処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれない予測ブロックA1、C1、D1またはE1の符号化情報を参照してPartIdxが1の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、符号化ブロック内の2つの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。
 図15(e)、(f)、(g)は処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割するモードを示す分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)での近接する予測ブロックを示す図である。PartIdxが1の処理対象の予測ブロックに近接する予測ブロックA1はPartIdxが0の予測ブロックである。したがって、予測ブロックA1を参照して、PartIdxが1の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うには、予測ブロックA1である同じ符号化ブロックに属するPartIdxが0の予測ブロックのマージ候補導出及びマージ候補リスト構築処理が完了し、利用するマージ候補を特定した後でないと、処理を行うことができない。したがって、実施の形態に係るインター予測情報導出方法においては、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で、処理対象の予測ブロックのPartIdxが1では、処理対象の予測ブロックの左辺に近接し、処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれるPartIdxが0の予測ブロックである予測ブロックA1の符号化情報を参照せずに、処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれない予測ブロックB1、C1、D1またはE1の符号化情報を参照してPartIdxが1の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。
 ここで、マージ候補導出及びマージ候補リストの構築処理の並列処理について説明する。図16は順次処理によるマージ候補導出及びマージ候補リストの構築処理を説明するフローチャートであり、図17は並列処理によるマージ候補導出及びマージ候補リストの構築処理を説明するフローチャートである。
 図16に示すマージ候補導出及びマージ候補リストの構築処理の順次処理において、処理対象となる符号化ブロックの分割インデックスPartIdxが0の予測ブロックのマージ候補の導出、及びマージ候補リストを構築する(ステップS101)。続いて、分割モード(PartMode)が2N×2N分割(PART_2Nx2N)である場合(ステップS102のNO)、本マージ候補導出及びマージ候補リストの構築処理を終了する。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)でない場合(ステップS102のNO)、すなわち、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)の場合、処理対象となる符号化ブロックの分割インデックスPartIdxが1の予測ブロックのマージ候補の導出、及びマージ候補リストを構築し(ステップS103)、本マージ候補導出及びマージ候補リストの構築処理を終了する。
 図17に示すマージ候補導出及びマージ候補リストの構築処理の並列処理において、処理対象となる符号化ブロックの分割インデックスPartIdxが0の予測ブロックのマージ候補の導出、及びマージ候補リストを構築する(ステップS101)。ステップS101と並行して、分割モード(PartMode)が2N×2N分割(PART_2Nx2N)でない場合(ステップS102のNO)、すなわち、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)の場合、処理対象となる符号化ブロックの分割インデックスPartIdxが1の予測ブロックのマージ候補の導出、及びマージ候補リストを構築する(ステップS103)。
 図17に示すマージ候補導出及びマージ候補リストの構築処理の並列処理においては、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)またはnR×2N分割(PART_nRx2N)の場合、同一符号化ブロック内のPartIdxが0の予測ブロックを参照せずに、PartIdxが1の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、分割インデックスPartIdxが0と1の2つの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を同時に開始することが可能となる。
 図16に示すマージ候補導出及びマージ候補リストの構築処理の順次処理においても、PartIdxが0の予測ブロックを参照せずに、PartIdxが1の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことが可能である。
 また、本実施の形態においては、分割モード(PartMode)がN×N分割(PART_NxN)を定義しないものとしているが、N×N分割(PART_NxN)を定義することもできる。図15(h)は処理対象の符号化ブロックの輝度信号を上下左右に4分割して4つの予測ブロックとした分割モード(PartMode)がN×N分割(PART_NxN)での近接する予測ブロックを示す図である。PartIdxが1の処理対象の予測ブロックに近接する予測ブロックA1はPartIdxが0の予測ブロックである。したがって、予測ブロックA1を参照してPartIdxが1の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うには、予測ブロックA1である同じ符号化ブロックに属するPartIdxが0の予測ブロックのマージ候補導出及びマージ候補リスト構築処理が完了し、利用するマージ候補を特定した後でないと、処理を行うことができない。したがって、実施の形態に係るインター予測情報導出方法においては、分割モード(PartMode)がN×N分割(PART_NxN)で、処理対象の予測ブロックのPartIdxが1では、PartIdxが0の予測ブロックである予測ブロックA1を参照せずに、PartIdxが1の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。PartIdxが2の処理対象の予測ブロックに近接する予測ブロックB2はPartIdxが0の予測ブロックであり、予測ブロックC2はPartIdxが1の予測ブロックである。したがって、予測ブロックB2及びC2を参照してPartIdxが2の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うには、予測ブロックB2及びC2である同じ符号化ブロックに属するPartIdxが0及び1の予測ブロックのマージ候補導出及びマージ候補リスト構築処理が完了し、利用するマージ候補を特定した後でないと、処理を行うことができない。したがって、実施の形態に係るインター予測情報導出方法においては、分割モード(PartMode)がN×N分割(PART_NxN)で、処理対象の予測ブロックのPartIdxが2では、PartIdxが0及び1の予測ブロックである予測ブロックB2及びC2を参照せずに、PartIdxが2の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。PartIdxが3の処理対象の予測ブロックに近接する予測ブロックE3はPartIdxが0の予測ブロックであり、予測ブロックB3はPartIdxが1の予測ブロックであり、予測ブロックA3はPartIdxが2の予測ブロックである。したがって、予測ブロックE3、B3及びA3を参照してPartIdxが3の予測ブロックのマージ候補導出及びマージ候補リスト構築処理を行うには、予測ブロックE3、B3及びA3である同じ符号化ブロックに属するPartIdxが0、1及び2の予測ブロックのマージ候補導出及びマージ候補リスト構築処理が完了し、利用するマージ候補を特定した後でないと、処理を行うことができない。したがって、実施の形態に係るインター予測情報導出方法においては、分割モード(PartMode)がN×N分割(PART_NxN)で、処理対象の予測ブロックのPartIdxが3では、PartIdxが0、1及び2の予測ブロックである予測ブロックE3、B3及びA3を参照せずに、PartIdxが3の予測ブロックのマージ候補導出及びマージ候補リストの構築処理を行うことにより、符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理を並列に処理することが可能となる。
 図13の動画像符号化装置のインター予測情報導出部104は、空間マージ候補生成部130、時間マージ候補の参照インデックス導出部131、時間マージ候補生成部132、マージ候補登録部133、マージ候補同一判定部134、マージ候補補充部135、および符号化情報選択部136を含む。
 図14の動画像復号装置のインター予測情報導出部205は、空間マージ候補生成部230、時間マージ候補の参照インデックス導出部231、時間マージ候補生成部232、マージ候補登録部233、マージ候補同一判定部234、マージ候補補充部235、および符号化情報選択部236を含む。
 図18は本発明の実施の形態による動画像符号化装置のインター予測情報導出部104及び動画像復号装置のインター予測情報導出部205とで共通する機能を有するマージ候補の導出処理及びマージ候補リストの構築処理の手順を説明するフローチャートである。以下、諸過程を順を追って説明する。なお、以下の説明においては特に断りのない限りスライスタイプslice_typeがBスライスの場合について説明するが、Pスライスの場合にも適用できる。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 動画像符号化装置のインター予測情報導出部104の空間マージ候補生成部130及び動画像復号装置のインター予測情報導出部205の空間マージ候補生成部230では、符号化または復号対象ブロックに近接するそれぞれの予測ブロックA,B,C,D,Eからの空間マージ候補A,B,C,D,Eを導出し、出力する。ここで、A,B,C,D,Eまたは時間マージ候補Colのいずれかを示すNを定義する。予測ブロックNのインター予測情報が空間マージ候補Nとして利用できるかどうかを示すフラグavailableFlagN、空間マージ候補NのL0の参照インデックスrefIdxL0N及びL1の参照インデックスrefIdxL1N、L0予測が行われるかどうかを示すL0予測フラグpredFlagL0NおよびL1予測が行われるかどうかを示すL1予測フラグpredFlagL1N、L0の動きベクトルmvL0N、L1の動きベクトルmvL1Nを出力する(ステップS201)。ただし、本実施の形態においては処理対象となる予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる予測ブロックを参照せずに、マージ候補を導出するので、処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる空間マージ候補は導出しない。ステップS201の詳細な処理手順については図19のフローチャートを用いて後ほど詳細に説明する。
 続いて、動画像符号化装置のインター予測情報導出部104の時間マージ候補の参照インデックス導出部131及び動画像復号装置のインター予測情報導出部205の時間マージ候補の参照インデックス導出部231では、符号化または復号対象ブロックに近接する予測ブロックから時間マージ候補の参照インデックスを導出して出力する(ステップS202)。ただし、本実施の形態においては処理対象となる予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる予測ブロックを参照せずに、時間マージ候補の参照インデックスを導出する。スライスタイプslice_typeがPスライスで時間マージ候補のインター予測情報を用いてインター予測を行う場合は、L0予測(Pred_L0)を行うために、L0の参照インデックスだけを導出し、スライスタイプslice_typeがBスライスで時間マージ候補のインター予測情報を用いてインター予測を行う場合は、双予測(Pred_BI)を行うために、L0とL1のそれぞれの参照インデックスを導出する。ステップS202の詳細な処理手順については図21、図23、図25、図27、図29、図30、図32のフローチャートを用いて後ほど詳細に説明する。
 続いて、動画像符号化装置のインター予測情報導出部104の時間マージ候補生成部132及び動画像復号装置のインター予測情報導出部205の時間マージ候補生成部232では、異なる時間のピクチャからの時間マージ候補を導出し、時間マージ候補を出力する。時間マージ候補が利用できるかどうかを示すフラグavailableFlagCol、時間マージ候補のL0予測が行われるかどうかを示すL0予測フラグpredFlagL0ColおよびL1予測が行われるかどうかを示すL1予測フラグpredFlagL1Col、及びL0の動きベクトルmvL0N、L1の動きベクトルmvL1Nを出力する(ステップS203)。ステップS203の詳細な処理手順については図34のフローチャートを用いて後ほど詳細に説明する。
 続いて、動画像符号化装置のインター予測情報導出部104のマージ候補登録部133及び動画像復号装置のインター予測情報導出部205のマージ候補登録部233では、マージ候補リストmergeCandListを作成し、マージ候補リストmergeCandListに空間マージ候補A,B,C,D,E,および時間マージ候補Colを追加することで、マージ候補リストmergeCandListを構築し、マージ候補リストmergeCandListを出力する(ステップS204)。ステップS204の詳細な処理手順については図41のフローチャートを用いて後ほど詳細に説明する。
 続いて、動画像符号化装置のインター予測情報導出部104のマージ候補同一判定部134及び動画像復号装置のインター予測情報導出部205のマージ候補同一判定部234では、マージ候補リストmergeCandList内で、マージ候補が同じ参照インデックスの動きベクトルが同じ値を持っている場合に、最も小さい順番のマージ候補を除いてそのマージ候補を取り除き、マージ候補リストmergeCandListを出力する(ステップS205)。
 続いて、動画像符号化装置のインター予測情報導出部104のマージ候補補充部135及び動画像復号装置のインター予測情報導出部205のマージ候補補充部235では、マージ候補リストmergeCandList内に登録されているマージ候補の数が規定数となるようにマージ候補を補充し、マージ候補リストmergeCandListを出力する(ステップS206)。なお、本実施の形態ではマージ候補の数を5と規定する。マージ候補リストmergeCandList内に登録されるマージ候補の数が5を上限として、すでに登録されているマージ候補同士のL0予測とL1予測の組み合わせを変更した予測モードが双予測(Pred_BI)のマージ候補や異なる参照インデックスで動きベクトルが(0,0)の値を持つ予測モードが双予測(Pred_BI)のマージ候補を追加する。
 次に、図18のステップS201の処理手順である符号化または復号対象ブロックに近接する予測ブロックNからのマージ候補Nの導出方法について詳細に説明する。図19は図18のステップS201の空間マージ候補導出処理手順を説明するフローチャートである。
Nには近接する予測ブロックの領域を表すA(左側)、B(上側)、C(右上)、D(左下)またはE(左上)が入る。なお、本実施の形態においては、近接する5つの予測ブロックから最大4つの空間マージ候補を導出する。
 図18で、変数NをAとして符号化または復号対象の予測ブロックの左側に近接する予測ブロックAの符号化情報を調べてマージ候補Aを導出し、変数NをBとして上側に近接する予測ブロックBの符号化情報を調べてマージ候補Bを導出し、変数NをCとして右上側に近接する予測ブロックCの符号化情報を調べてマージ候補Cを導出し、変数NをDとして左下側に近接する予測ブロックDの符号化情報を調べてマージ候補Dを導出し、変数NをEとして左上側に近接する予測ブロックEの符号化情報を調べてマージ候補Eを導出する(ステップS1101~ステップS1114)。
 まず、変数NがEで、フラグavailableFlagA, availableFlagB, availableFlagC, availableFlagDの値を加算して合計が4の場合(ステップS1102のYES)、すなわち4つの空間マージ候補が導出された場合、マージ候補EのフラグavailableFlagEを0に設定し(ステップS1107)、マージ候補Eの動きベクトルmvL0E, mvL1Eの値を共に(0,0)に設定し(ステップS1108)、マージ候補EのフラグpredFlagL0E、predFlagL1Eの値を共に0に設定し(ステップS1109)、本空間マージ候補導出処理を終了する。本実施の形態においては、近接する予測ブロックから4つのマージ候補を導出するので、既に4つの空間マージ候補が導出された場合はそれ以上の空間マージ候補の導出処理を行う必要がない。
 一方、変数NがEでないか、フラグavailableFlagA, availableFlagB, availableFlagC, availableFlagDの値を加算して合計が4でない場合(ステップS1102のNO)、ステップS1103に進む。近接する予測ブロックNが導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる場合(ステップS1103のYES)、マージ候補NのフラグavailableFlagNの値を0に設定し(ステップS1107)、マージ候補Nの動きベクトルmvL0N, mvL1Nの値を共に(0,0)に設定し(ステップS1108)、マージ候補NのフラグpredFlagL0N、predFlagL1Nの値を共に0に設定する(ステップS1109)。近接する予測ブロックNが導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる場合(ステップS1103のYES)、近接する予測ブロックNの符号化情報を参照せず、マージ候補NのフラグavailableFlagNの値を0に設定して空間マージ候補としないことで、同じ符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理の並列処理を可能とする。
 具体的には、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)または2N×nD分割(PART_2NxnD)で、処理対象の予測ブロックのPartIdxが1で、導出対象の予測ブロックの上辺に近接する予測ブロックBの場合が、近接する予測ブロックNが導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる場合である。この場合、導出対象の予測ブロックの上辺に近接する予測ブロックBは導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれるPartIdxが0の予測ブロックであるので、近接する予測ブロックBの符号化情報を参照せず、マージ候補BのフラグavailableFlagBの値を0に設定して空間マージ候補としないことで、同じ符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理の並列処理を可能とする。
 さらに、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)またはnR×2N分割(PART_nRx2N)で、処理対象の予測ブロックのPartIdxが1で、導出対象の予測ブロックの左辺に近接する予測ブロックAの場合も、近接する予測ブロックNが導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる場合である。この場合も、導出対象の予測ブロックの左辺に近接する予測ブロックAは導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれるPartIdxが0の予測ブロックであるので、近接する予測ブロックAの符号化情報を参照せず、マージ候補AのフラグavailableFlagAの値を0に設定して空間マージ候補としないことで、同じ符号化ブロック内のそれぞれの予測ブロックのマージ候補導出及びマージ候補リストの構築処理の並列処理を可能とする。
 さらに、本実施の形態では定義しないが、分割モード(PartMode)がN×N分割(PART_NxN)で、処理対象の予測ブロックのPartIdxが1、2または3の場合も、近接する予測ブロックNが導出対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれることがある。
 一方、近接する予測ブロックNが処理対象の予測ブロックを含む符号化ブロックと同じ符号化ブロックに含まれない場合(ステップS1103のNO)、符号化または復号対象の予測ブロックに近接する予測ブロックNを特定し、それぞれの予測ブロックNが利用できる場合は符号化情報格納メモリ115または210から予測ブロックNの符号化情報を取得する(ステップS1104)。
 近接する予測ブロックNが利用できないか(ステップS1105のNO)、予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)である場合(ステップS1106のNO)、マージ候補NのフラグavailableFlagNの値を0に設定し(ステップS1107)、マージ候補Nの動きベクトルmvL0N, mvL1Nの値を共に(0,0)に設定し(ステップS1108)、マージ候補NのフラグpredFlagL0N、predFlagL1Nの値を共に0に設定する(ステップS1109)。ここで、近接する予測ブロックNが利用できない場合とは、具体的には近接する予測ブロックNが符号化または復号対象スライスの外に位置する場合や、まだ符号化または復号処理順序で後のため、符号化または復号処理が完了していない場合等が該当する。
 一方、近接する予測ブロックNが導出対象の予測ブロックの符号化ブロックと同じ符号化ブロック外か(ステップS1104のYES)、近接する予測ブロックNが利用でき(ステップS1105のYES)、予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)でない場合(ステップS1106のYES)、予測ブロックNのインター予測情報をマージ候補Nのインター予測情報とする。マージ候補NのフラグavailableFlagNの値を1に設定し(ステップS1110)、マージ候補Nの動きベクトルmvL0N, mvL1Nをそれぞれ予測ブロックNの動きベクトルmvL0N[xN][yN], mvL1N[xN][yN]と同じ値に設定し(ステップS1111)、マージ候補Nの参照インデックスrefIdxL0N, refIdxL1Nをそれぞれ予測ブロックNの参照インデックスrefIdxL0[xN][yN], refIdxL1[xN][yN]と同じ値に設定し(ステップS1112)、マージ候補NのフラグpredFlagL0N, predFlagL1Nをそれぞれ予測ブロックNのフラグpredFlagL0[xN][yN], predFlagL1[xN][yN]に設定する(ステップS1113)。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。
 以上のステップS1102~ステップS1113の処理をN=A,B,C,D,Eについてそれぞれ繰り返す(ステップS1101~ステップS1114)。
 次に、図18のS202の時間マージ候補の参照インデックスを導出する方法について詳細に説明する。時間マージ候補のL0とL1のそれぞれの参照インデックスを導出する。
 本実施の形態においては、空間マージ候補の参照インデックス、即ち符号化または復号対象ブロックに近接する予測ブロックで利用された参照インデックスを利用して時間マージ候補の参照インデックスを導出する。これは、時間マージ候補が選択される場合において、符号化または復号対象の予測ブロックの参照インデックスは空間マージ候補となる符号化または復号対象ブロックに近接する予測ブロックの参照インデックスと高い相関を持つからである。特に、本実施の形態においては、後述する実施例6および実施例7を除いて、導出対象の予測ブロックの左の辺に近接する予測ブロックA、または上の辺に近接する予測ブロックBの参照インデックスだけを利用する。なぜなら、空間マージ候補でもある近接する予測ブロックA,B,C,D,Eの中でも符号化または復号対象の予測ブロックの辺に接している予測ブロックA,Bは、符号化または復号対象の予測ブロックの頂点のみに接している予測ブロックC,D,Eよりも相関が高いからである。相対的に相関の低い予測ブロックC,D,Eを利用せずに、利用する予測ブロックを予測ブロックA,Bに限定することで、時間マージ候補の参照インデックスの導出による符号化効率の改善効果を得るとともに、時間マージ候補の参照インデックス導出処理に関する演算量及びメモリアクセス量を削減する。
 実施例1
 以下、本実施の形態をいくつかの実施例に分けて説明する。まず、本実施の形態の実施例1について説明する。図20は本実施の形態の実施例1における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例1では、分割モード(PartMode)に応じて、導出対象の予測ブロックの左辺に近接する予測ブロックまたは上辺に近接する予測ブロックのどちらを参照するかを切り替える。符号化ブロック外となる辺に近接する予測ブロックを参照する。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)では、図20(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では、図20(b)、(c)、(d)に示すように、導出対象の予測ブロックの左辺に近接する予測ブロックを参照し、それぞれの時間マージ候補のLXの参照インデックスをそれぞれの導出対象の予測ブロックの左辺に近接する予測ブロックのLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは左に近接する予測ブロックA1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、A1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、図20(e)、(f)、(g)に示すように、導出対象の予測ブロックの上辺に近接する予測ブロックを参照し、それぞれの時間マージ候補のLXの参照インデックスをそれぞれの導出対象の予測ブロックの上辺に近接する予測ブロックのLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが0の予測ブロックでは上に近接する予測ブロックB0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB0、B1のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは上に近接する予測ブロックB1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB1のLXの参照インデックスの値に設定する。参照する予測ブロックB0、B1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックA、予測ブロックBがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックA、予測ブロックBがLX予測を行わない場合に時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図21は本実施の形態の実施例1の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)でない場合(ステップS2101のNO)、即ち2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)である場合、符号化情報格納メモリ115または210から左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)の場合(ステップS2101のYES)、符号化情報格納メモリ115または210から導出対象の予測ブロックの上に近接する予測ブロックBの符号化情報を取得する(ステップS2117)。
 続くステップS2119からステップS2121までの処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0でない場合(ステップS2119のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックBのLXの参照インデックスrefIdxLX[xB][yB]の値と同じ値に設定する(ステップS2120)。ここで、xB、yBはピクチャ内での予測ブロックBの左上の画素の位置を示すインデックスである。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0である場合(ステップS2119のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2119からステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 実施例2
 次に、本実施の形態の実施例2について説明する。図22は本実施の形態の実施例2における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例2では、符号化ブロックの分割モード(PartMode)と予測ブロックの分割インデックスPartIdxに応じて、導出対象の予測ブロックの左辺に近接する予測ブロックまたは上辺に近接する予測ブロックのどちらを参照するかを切り替える。符号化ブロック外となる辺に近接する予測ブロックを参照する。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)では、図22(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では、図22(b)、(c)、(d)に示すように、導出対象の予測ブロックの左辺に近接する予測ブロックを参照し、それぞれの時間マージ候補のLXの参照インデックスをそれぞれの導出対象の予測ブロックの左辺に近接する予測ブロックのLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは左に近接する予測ブロックA1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、A1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、図22(e)、(f)、(g)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは上に近接する予測ブロックB1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、B1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックA、予測ブロックBがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックA、予測ブロックBがLX予測を行わない場合に時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図23は本実施の形態の実施例2の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1でない場合(ステップS2102のNO)、即ち2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)であるか、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが0である場合、符号化情報格納メモリ115または210から導出対象の予測ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1である場合(ステップS2102のYES)、符号化情報格納メモリ115または210から導出対象の予測ブロックの上に近接する予測ブロックBの符号化情報を取得する(ステップS2117)。
 続くステップS2119からステップS2121までの処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0でない場合(ステップS2119のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックBのLXの参照インデックスrefIdxLX[xB][yB]の値と同じ値に設定する(ステップS2120)。ここで、xB、yBはピクチャ内での予測ブロックBの左上の画素の位置を示すインデックスである。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0である場合(ステップS2119のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2119からステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 実施例3
 次に、本実施の形態の実施例3について説明する。図24は本実施の形態の実施例3における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例3では、符号化ブロックの分割モード(PartMode)と予測ブロックの分割インデックスPartIdxに応じて、導出対象の予測ブロックの左辺に近接する予測ブロックまたは上辺に近接する予測ブロックのどちらを参照するかを切り替える。分割インデックスPartIdxが0の予測ブロックでは、より高い相関を持つ長い辺に近接する予測ブロックを参照し、分割インデックスPartIdxが1の予測ブロックでは、符号化ブロック外となる辺に近接する予測ブロックを参照する。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)では、図24(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では、図24(b)、(c)、(d)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは長い辺である上辺に近接する予測ブロックB0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは符号化ブロック外となる左辺に近接する予測ブロックA1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA1のLXの参照インデックスの値に設定する。参照する予測ブロックB0、A1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、図24(e)、(f)、(g)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは長い辺である左辺に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは符号化ブロック外となる上辺に近接する予測ブロックB1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、B1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックA、予測ブロックBがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックA、予測ブロックBがLX予測を行わない場合に時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図25は本実施の形態の実施例3の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)で分割インデックスPartIdxが0でなく、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1でない場合(ステップS2103のNO)、即ち2N×2N分割(PART_2Nx2N)であるか、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)で分割インデックスPartIdxが0であるか、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが0である場合、符号化情報格納メモリ115または210から導出対象の予測ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1である場合(ステップS2102のYES)、符号化情報格納メモリ115または210から導出対象の予測ブロックの上に近接する予測ブロックBの符号化情報を取得する(ステップS2117)。
 続くステップS2119からステップS2121までの処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0でない場合(ステップS2119のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックBのLXの参照インデックスrefIdxLX[xB][yB]の値と同じ値に設定する(ステップS2120)。ここで、xB、yBはピクチャ内での予測ブロックBの左上の画素の位置を示すインデックスである。
 予測ブロックBのLX予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が0である場合(ステップS2119のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2119からステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 実施例4
 次に、本実施の形態の実施例4について説明する。図26は本実施の形態の実施例4における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例4では、符号化ブロックの分割モード(PartMode)と予測ブロックの分割インデックスPartIdxに応じて、導出対象の予測ブロックの左辺に近接する予測ブロックを参照するかどうかを切り替える。左辺に近接する予測ブロックが符号化ブロック外となる場合に参照し、符号化ブロック内となる場合には参照せずデフォルト値とする。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)では、図26(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では、図26(b)、(c)、(d)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは左に近接する予測ブロックA1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、A1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、図26(e)、(f)、(g)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。参照する予測ブロックA0が符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックAがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックAがLX予測を行わない場合や導出対象の予測ブロックの分割インデックスPartIdxが1の場合に、時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図27は本実施の形態の実施例4の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1でない場合(ステップS2102のNO)、即ち2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)であるか、N×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが0である場合、符号化情報格納メモリ115または210から導出対象の予測ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)で分割インデックスPartIdxが1である場合(ステップS2102のYES)、続くステップS2121の処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 実施例5
 次に、本実施の形態の実施例5について説明する。図28は本実施の形態の実施例5における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例5では、分割モード(PartMode)に応じて、導出対象の予測ブロックの左辺に近接する予測ブロックを参照するかどうかを切り替える。符号化ブロック外となる辺に近接する予測ブロックを参照する。左辺に近接する予測ブロックが符号化ブロック外となる場合に参照し、符号化ブロック内となる場合には参照せずデフォルト値とする。分割モード(PartMode)が2N×2N分割(PART_2Nx2N)では、図28(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)では、図28(b)、(c)、(d)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは左に近接する予測ブロックA1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA1のLXの参照インデックスの値に設定する。参照する予測ブロックA0、A1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、導出対象の分割インデックスPartIdxが0および1の予測ブロックでは共に近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。処理対象の予測ブロックに近接する予測ブロックを参照しないので、符号化ブロック内の予測ブロックを参照することも無く、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックAがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックAがLX予測を行わない場合や導出対象の予測ブロックを含む符号化ブロックの分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)の場合に、時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図29は本実施の形態の実施例5の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)でない場合(ステップS2101のNO)、即ち2N×2N分割(PART_2Nx2N)、2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)である場合、符号化情報格納メモリ115または210から導出対象の予測ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)である場合(ステップS2101のYES)、続くステップS2121の処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 実施例6
 次に、本実施の形態の実施例6について説明する。本実施の形態の実施例6では、導出対象の予測モードを含む符号化ブロック(処理対象の符号化ブロック)の分割モード(PartMode)や導出対象の予測モードの分割インデックスPartIdxの値に関わらず、近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。処理対象の予測ブロックに近接する予測ブロックを参照しないので、符号化ブロック内の予測ブロックを参照することも無く、同じ符号化ブロックに含まれる分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補をそれぞれ並列に導出することができる。
 時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 さらに、実施例6は近接ブロックを参照せずに、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定するので、実施例1、2、3、4、5および後述する実施例7に比べて、導出処理を簡略化することができる。
 図30は本実施の形態の実施例6の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。
 ステップS2115の処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2115の処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 実施例7
 次に、本実施の形態の実施例7について説明する。図31は本実施の形態の実施例7における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例7では、導出対象の予測モードを含む符号化ブロック(処理対象の符号化ブロック)の分割モード(PartMode)や導出対象の予測モードの分割インデックスPartIdxの値に関わらず、図31(a)~(g)に示すように、処理対象の符号化ブロックの左に近接する予測ブロックAを参照し、時間マージ候補のLXの参照インデックスを予測ブロックAのLXの参照インデックスの値に設定する。参照する予測ブロックAが符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックAがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックAがLX予測を行わない場合に、時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 実施例7は符号化ブロック内のそれぞれの予測ブロックの時間マージ候補の参照インデックスが共通の値に設定されるので、符号化ブロック内のそれぞれの予測ブロック毎に時間マージ候補の参照インデックスを導出する必要が無く、導出処理を簡略化することができる。
 図32は本実施の形態の実施例7の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、符号化情報格納メモリ115または210から処理対象の符号化ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2131)。
 続くステップS2133からステップS2135までの処理をL0、L1それぞれにおいて行う(ステップS2132~S2136)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 処理対象の符号化ブロックの左に近接する予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2133のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2134)。ここで、xA、yAはピクチャ内での処理対象の符号化ブロックの左に近接する予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2133のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2135)。
 L0、L1それぞれにおいてステップS2133からステップS2135までの処理を行い(ステップS2132~S2136)、本参照インデックス導出処理を終了する。
 なお、実施例7においては導出対象の予測ブロックを含む符号化ブロックの左辺に近接する予測ブロックを参照するかどうかを切り替えたが、左辺に近接する予測ブロックの代わりに上辺に近接する予測ブロックを参照するかどうかを切り替えてもよい。
 実施例8
 次に、本実施の形態の実施例8について説明する。図43は本実施の形態の実施例8における時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを示す図である。本実施の形態の実施例8では、符号化ブロックの分割モード(PartMode)に関わらず、予測ブロックの分割インデックスPartIdxに応じて、導出対象の予測ブロックの左辺に近接する予測ブロックを参照するかどうかを切り替える。予測ブロックの分割インデックスPartIdxが0の場合は左辺に近接する予測ブロックを参照し、分割インデックスPartIdxが0以外の場合は近接する予測ブロックを参照せずデフォルト値とする。予測ブロックの分割インデックスPartIdxが0の場合はどの分割モード(PartMode)においても左辺に近接する予測ブロックは必ず符号化ブロック外となるが、予測ブロックの分割インデックスPartIdxが0以外の場合は分割モード(PartMode)よっては符号化ブロック内となる。図43(a)に示すように、導出対象の予測ブロックの左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。
 処理対象の符号化ブロックを上下に並ぶ2つの予測ブロックに分割する分割モード(PartMode)が2N×N分割(PART_2NxN)、2N×nU分割(PART_2NxnU)、2N×nD分割(PART_2NxnD)、および処理対象の符号化ブロックを左右に並ぶ2つの予測ブロックに分割する分割モード(PartMode)がN×2N分割(PART_Nx2N)、nL×2N分割(PART_nLx2N)、nR×2N分割(PART_nRx2N)では、図43(b)、(c)、(d)、(e)、(f)、(g)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。参照する予測ブロックA0が符号化ブロック外にあるので、分割インデックスPartIdxが0と1の2つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 ただし、近接する予測ブロックAがLX予測を行わない場合は時間マージ候補のLXの参照インデックスの値をデフォルト値の0とする。近接する予測ブロックAがLX予測を行わない場合や導出対象の予測ブロックの分割インデックスPartIdxが1の場合に、時間マージ候補のLXの参照インデックスのデフォルト値を0とする理由は、インター予測において参照インデックスの値が0に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を0以外の値(1、2など)としても良いし、シーケンスレベル、ピクチャレベル、またはスライスレベルで符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
 図44は本実施の形態の実施例8の方法による図18のステップS202の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、分割インデックスPartIdxが0である場合(ステップS2104のYES)、符号化情報格納メモリ115または210から導出対象の予測ブロックの左に近接する予測ブロックAの符号化情報を取得する(ステップS2111)。
 続くステップS2113からステップS2115までの処理をL0、L1それぞれにおいて行う(ステップS2112~S2116)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0でない場合(ステップS2113のYES)、時間マージ候補のLXの参照インデックスrefIdxLXColを予測ブロックAのLXの参照インデックスrefIdxLX[xA][yA]の値と同じ値に設定する(ステップS2114)。ここで、xA、yAはピクチャ内での予測ブロックAの左上の画素の位置を示すインデックスである。
 なお、本実施の形態においては、予測ブロックN(N=A,B)において、予測ブロックNが符号化または復号対象のスライス外で利用できない場合や予測ブロックNが符号化または復号順序で符号化または復号対象の予測ブロックよりも後のために符号化または復号されておらず利用できない場合や予測ブロックNの予測モードPredModeがイントラ予測(MODE_INTRA)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックNのL1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に0である。ここで、xN、yNはピクチャ内での予測ブロックNの左上の画素の位置を示すインデックスである。予測ブロックNの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は1, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は0である。予測ブロックNのインター予測モードがL1予測(Pred_L1)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は0, L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は1である。予測ブロックNのインター予測モードが双予測(Pred_BI)の場合、予測ブロックNのL0予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、L1予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に1である。
 予測ブロックAのLX予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が0である場合(ステップS2113のNO)、時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2115)。
 L0、L1それぞれにおいてステップS2113からステップS2115までの処理を行い(ステップS2112~S2116)、本参照インデックス導出処理を終了する。
 一方、分割インデックスPartIdxが0でない場合(ステップS2104のNO)、続くステップS2121の処理をL0、L1それぞれにおいて行う(ステップS2118~S2122)。なお、時間マージ候補のL0の参照インデックスを導出する際にはLXはL0に設定され、L1の参照インデックスを導出する際にはLXはL1に設定される。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。
 時間マージ候補のLXの参照インデックスrefIdxLXColをデフォルト値の0に設定する(ステップS2121)。
 L0、L1それぞれにおいてステップS2121までの処理を行い(ステップS2118~S2122)、本参照インデックス導出処理を終了する。
 なお、実施例8においては導出対象の予測ブロックの左辺に近接する予測ブロックを参照するかどうかを切り替えたが、左辺に近接する予測ブロックの代わりに上辺に近接する予測ブロックを参照するかどうかを切り替えてもよい。
 また、本実施の形態においては、符号化ブロックの分割モード(PartMode)がN×N分割(PART_NxN)を定義しないものとしているが、N×N分割(PART_NxN)を定義することもできる。符号化ブロックの分割モード(PartMode)がN×N分割(PART_NxN)においても、処理対象の符号化ブロックに含まれる予測ブロックの時間マージ候補の参照インデックスを導出する際には、処理対象の予測ブロックに含まれる符号化ブロックと同じ符号化ブロックに含まれる近接する予測ブロックを参照せずに導出することで、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 例えば、N×N分割(PART_NxN)では、近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。導出対象の予測ブロックに近接する予測ブロックを参照しないので、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 または、近接ブロックの参照インデックスを参照して、時間マージ候補の参照インデックスを導出することもできる。図33はN×N分割(PART_NxN)の符号化ブロックの時間マージ候補の参照インデックスの導出処理において参照する近接ブロックを説明する図である。
 図33(a)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1の予測ブロックでは上に近接する予測ブロックB1を参照し、時間マージ候補のLXの参照インデックスを予測ブロックB1のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが2の予測ブロックでは左に近接する予測ブロックA2を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA2のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが3の予測ブロックでは近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。処理対象の予測ブロックの左に近接する予測ブロックA0、A2、上に近接する予測ブロックB1が共に符号化ブロック外にあるので、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 または、図33(b)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが2の予測ブロックでは左に近接する予測ブロックA2を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA2のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが1または3の予測ブロックでは近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。処理対象の予測ブロックの左に近接する予測ブロックA0、A2が共に符号化ブロック外にあるので、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 または、図33(c)に示すように、処理対象の符号化ブロックの左に近接する予測ブロックAを参照し、時間マージ候補のLXの参照インデックスを予測ブロックAのLXの参照インデックスの値に設定する。処理対象の符号化ブロックの左に近接する予測ブロックAが符号化ブロック外にあるので、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 または、図33(d)に示すように、導出対象の分割インデックスPartIdxが0の予測ブロックでは左に近接する予測ブロックA0を参照し、時間マージ候補のLXの参照インデックスを予測ブロックA0のLXの参照インデックスの値に設定する。導出対象の分割インデックスPartIdxが0以外(PartIdxが1,2または3)の予測ブロックでは近接する予測ブロックを参照せず、時間マージ候補のLXの参照インデックスをデフォルト値の0に設定する。処理対象の予測ブロックの左に近接する予測ブロックA0符号化ブロック外にあるので、分割インデックスPartIdxが0、1、2、3の4つの予測ブロックの時間マージ候補の参照インデックスをそれぞれ並列に導出することができる。
 次に、図18のステップS203の異なる時間のピクチャのインター予測情報を用いるマージ候補の導出方法について詳細に説明する。図34は図18のステップS203の時間マージ候補導出処理手順を説明するフローチャートである。
 まず、スライスタイプslice_typeと前述のフラグcollocated_from_l0_flagにより、異なる時間のピクチャcolPicを導出する(ステップS3101)。
 図35は図34のステップS3101の異なる時間のピクチャcolPicの導出処理手順を説明するフローチャートである。スライスタイプslice_typeがBスライスで、前述のフラグcollocated_from_l0_flagが0の場合(ステップS3201のYES、ステップS3202のYES)、RefPicList1[0]、すなわち参照リストL1の参照インデックスが0のピクチャが異なる時間のピクチャcolPicとなる(ステップS3203)。そうでない場合、すなわちスライスタイプslice_typeがBスライスで前述のフラグcollocated_from_l0_flagが1の場合(ステップS3201のYES、ステップS3202のNO)、またはスライスタイプslice_typeがPスライスの場合(ステップS3201のNO、S3204のYES)、RefPicList0[0]、すなわち参照リストL0の参照インデックスが0のピクチャが異なる時間のピクチャcolPicとなる(ステップS3205)。
 次に、図34のフローチャートに戻り、異なる時間の予測ブロックcolPUを導出し、符号化情報を取得する(ステップS3102)。
 図36は図34のステップS3102の異なる時間のピクチャcolPicの予測ブロックcolPUの導出処理手順を説明するフローチャートである。
 まず、異なる時間のピクチャcolPic内で処理対象の予測ブロックと同一位置の右下(外側)に位置する予測ブロックを異なる時間の予測ブロックcolPUとする(ステップS3301)。この予測ブロックは図9の予測ブロックT0に相当する。
 次に、異なる時間の予測ブロックcolPUの符号化情報を取得する(ステップS3302)。異なる時間の予測ブロックcolPUのPredModeが利用できないか、異なる時間の予測ブロックcolPUの予測モードPredModeがイントラ予測(MODE_INTRA)である場合(ステップS3303のYES、ステップS3304のYES)、異なる時間のピクチャcolPic内で処理対象の予測ブロックと同一位置の中央左上に位置する予測ブロックを異なる時間の予測ブロックcolPUとする(ステップS3305)。この予測ブロックは図9の予測ブロックT1に相当する。
 次に、図34のフローチャートに戻り、符号化または復号対象の予測ブロックと同位置の他ピクチャの予測ブロックから導出されるL0の予測動きベクトルmvL0Colと時間マージ候補Colが有効か否かを示すフラグavailableFlagL0Colを導出するとともに(ステップS3103)、L1の予測動きベクトルmvL1Colと時間マージ候補Colが有効か否かを示すフラグavailableFlagL1Colを導出する。さらに、フラグavailableFlagL0Col またはフラグavailableFlagL1Colが1の場合に、時間マージ候補Colが有効か否かを示すフラグavailableFlagColを1に設定する。
 図37は図34のステップS3103、ステップS3104の時間マージ候補のインター予測情報の導出処理手順を説明するフローチャートである。L0またはL1で、時間マージ候補の導出対象のリストをLXとし、LXを用いた予測をLX予測とする。以下、断りのない限り、この意味で用いる。時間マージ候補のL0の導出処理であるステップS3103として呼び出される際には、LXがL0となり、時間マージ候補のL1の導出処理であるステップS3104として呼び出される際には、LXがL1となる。
 異なる時間の予測ブロックcolPUの予測モードPredModeがイントラ予測(MODE_INTRA)か、利用できない場合(ステップS3401のNO、ステップS3402のNO)、フラグavailableFlagLXColとフラグpredFlagLXColを共に0とし(ステップS3403)、動きベクトルmvLXColを(0,0)として(ステップS3404)、本時間マージ候補のインター予測情報の導出処理を終了する。
 予測ブロックcolPUが利用できて予測モードPredModeがイントラ予測(MODE_INTRA)でない場合(ステップS3401のYES、ステップS3402のYES)、以下の手順でmvColとrefIdxColとavailableFlagColを導出する。
 予測ブロックcolPUのL0予測が利用されているかどうかを示すフラグPredFlagL0[xPCol][yPCol]が0の場合(ステップS3405のYES)、予測ブロックcolPUの予測モードはPred_L1であるので、動きベクトルmvColが予測ブロックcolPUのL1の動きベクトルであるMvL1[xPCol][yPCol]と同じ値に設定され(ステップS3406)、参照インデックスrefIdxColがL1の参照インデックスRefIdxL1[xPCol][yPCol]と同じ値に設定され(ステップS3407)、リストListColがL1に設定される(ステップS3408)。ここで、xPCol、yPColは異なる時間のピクチャcolPic内での予測ブロックcolPUの左上の画素の位置を示すインデックスである。
 一方、予測ブロックcolPUのL0予測フラグPredFlagL0[xPCol][yPCol]が0でない場合(図37のステップS3405のNO)、予測ブロックcolPUのL1予測フラグPredFlagL1[xPCol][yPCol]が0かどうかを判定する。予測ブロックcolPUのL1予測フラグPredFlagL1[xPCol][yPCol]が0の場合(ステップS3409のYES)、動きベクトルmvColが予測ブロックcolPUのL0の動きベクトルであるMvL0[xPCol][yPCol]と同じ値に設定され(ステップS3410)、参照インデックスrefIdxColがL0の参照インデックスRefIdxL0[xPCol][yPCol]と同じ値に設定され(ステップS3411)、リストListColがL0に設定される(ステップS3412)。
 予測ブロックcolPUのL0予測フラグPredFlagL0[xPCol][yPCol]と予測ブロックcolPUのL1予測フラグPredFlagL1[xPCol][yPCol]が共に0でない場合(ステップS3405のNO、ステップS3409のNO)、予測ブロックcolPUのインター予測モードは双予測(Pred_BI)であるので、L0、L1の2つの動きベクトルから、一方を選択する(ステップS3413)。
 図38は予測ブロックcolPUのインター予測モードが双予測(Pred_BI)のときの時間マージ候補のインター予測情報の導出処理手順を示すフローチャートである。
 まず、すべての参照リストに登録されているすべてのピクチャのPOCが現在の符号化または復号対象ピクチャのPOCより小さいかどうかを判定し(ステップS3501)、予測ブロックcolPUのすべての参照リストであるL0及びL1に登録されているすべてのピクチャのPOCが現在の符号化または復号対象ピクチャのPOCより小さい場合で(ステップS3501のYES)、LXがL0、即ち符号化または復号対象ピクチャのL0の動きベクトルの予測ベクトル候補を導出している場合(ステップS3502のYES)、予測ブロックcolPUのL0の方のインター予測情報を選択し、LXがL1、即ち符号化または復号対象ピクチャのL1の動きベクトルの予測ベクトル候補を導出している場合(ステップS3502のNO)、予測ブロックcolPUのL1の方のインター予測情報を選択する。一方、予測ブロックcolPUのすべての参照リストL0及びL1に登録されているピクチャのPOCの少なくとも1つが現在の符号化または復号対象ピクチャのPOCより大きい場合で(ステップS3501のNO)、フラグcollocated_from_l0_flagが0の場合(ステップS3503のYES)、予測ブロックcolPUのL0の方のインター予測情報を選択し、フラグcollocated_from_l0_flagが1の場合(ステップS3503のNO)、予測ブロックcolPUのL1の方のインター予測情報を選択する。
 予測ブロックcolPUのL0の方のインター予測情報を選択する場合(ステップのYES、ステップS3503のYES)、動きベクトルmvColがMvL0[xPCol][yPCol]と同じ値に設定され(ステップS3504)、参照インデックスrefIdxColがRefIdxL0[xPCol][yPCol]と同じ値に設定され(ステップS3505)、リストListColがL0に設定される(ステップS3506)。
 予測ブロックcolPUのL1の方のインター予測情報を選択する場合(ステップS2502のNO、ステップS3503のNO)、動きベクトルmvColがMvL1[xPCol][yPCol]と同じ値に設定され(ステップS3507)、参照インデックスrefIdxColがRefIdxL1[xPCol][yPCol]と同じ値に設定され(ステップS3508)、リストListColがL1に設定される(ステップS3509)。
 図37に戻り、予測ブロックcolPUからインター予測情報が取得できたらフラグavailableFlagLXColとフラグpredFlagLXColを共に1とする(ステップS3414)。
 続いて、動きベクトルmvColをスケーリングして時間マージ候補のLXの動きベクトルmvLXColとする(ステップS3415)。この動きベクトルのスケーリング演算処理手順を図39及び図40を用いて説明する。
 図39は図34のステップS3105の動きベクトルのスケーリング演算処理手順を示すフローチャートである。
 異なる時間のピクチャcolPicのPOCから、予測ブロックcolPUのリストListColで参照する参照インデックスrefIdxColに対応する参照ピクチャのPOCを減算してピクチャ間距離tdを導出する(ステップS3601)。なお、異なる時間のピクチャcolPicよりも予測ブロックcolPUのリストListColで参照する参照ピクチャのPOCの方が表示順序で前の場合、ピクチャ間距離tdは正の値となり、異なる時間のピクチャcolPicよりも予測ブロックcolPUのリストListColで参照する参照ピクチャのPOCの方が表示順序で後の場合、ピクチャ間距離tdは負の値となる。
  td=異なる時間のピクチャcolPicのPOC-予測ブロックcolPUのリストListColで参照する参照ピクチャのPOC
 現在の符号化または復号対象ピクチャのPOCから図18のステップS202で導出された時間マージ候補のLXの参照インデックスに対応する参照ピクチャのPOCを減算してピクチャ間距離tbを導出する(ステップS3602)。なお、現在の符号化または復号対象ピクチャよりも現在の符号化または復号対象ピクチャのリストLXで参照する参照ピクチャの方が表示順序で前の場合、ピクチャ間距離tbは正の値となり、現在の符号化または復号対象ピクチャのリストLXで参照する参照ピクチャの方が表示順序で後の場合、ピクチャ間距離tbは負の値となる。
  tb=現在の符号化または復号対象ピクチャのPOC-時間マージ候補のLXの参照インデックスに対応する参照ピクチャのPOC
 続いて、ピクチャ間距離tdとtbを比較し(ステップS3603)、ピクチャ間距離tdとtbが等しい場合(ステップS3603のYES)、時間マージ候補のLXの動きベクトルmvLXColを動きベクトルmvColと同じ値に設定して(ステップS3604)、本スケーリング演算処理を終了する。
  mvLXCol=mvCol
 一方、ピクチャ間距離tdとtbが等しくない場合(ステップS3603のNO)、次式によりmvColにスケール係数tbまたはtdを乗じることでスケーリング演算処理を行い(ステップS3605)、スケーリングされた時間マージ候補のLXの動きベクトルmvLXColを得る。
  mvLXCol=tb または td * mvCol
 また、ステップS3605のスケーリング演算を整数精度の演算で行う場合の例を図40に示す。図40のステップS3606~ステップS3608の処理が、図39のステップS3605の処理に相当する。
 まず、図39のフローチャートと同様に、ピクチャ間距離tdとピクチャ間距離tbを導出する(ステップS3601、ステップS3602)。
 続いて、ピクチャ間距離tdとtbを比較し(ステップS3603)、ピクチャ間距離tdとtbが等しい場合(ステップS3603のYES)、図39のフローチャートと同様に、時間マージ候補のLXの動きベクトルmvLXColを動きベクトルmvColと同じ値に設定して(ステップS3604)、本スケーリング演算処理を終了する。
  mvLXCol=mvCol
 一方、ピクチャ間距離tdとtbが等しくない場合(ステップS3603のNO)、次式により変数txを導出する(ステップS3606)。
 tx = ( 16384 + Abs( td または 2 ) ) または td
 続いて、次式によりスケール係数DistScaleFactorを導出する(ステップS3607)。
 DistScaleFactor = ( tb * tx + 32 ) >> 6
 続いて、次式により、スケーリングされた時間マージ候補のLXの動きベクトルmvLXColを得る(ステップS3608)。
 mvLXCol = ClipMv( Sign( DistScaleFactor * mvCol ) * ( (Abs( DistScaleFactor * mvCol ) + 127 ) >> 8 ) )
 次に、図18のステップS204のマージ候補をマージ候補リストに登録し、マージ候補リストを構築する方法について詳細に説明する。図41はマージ候補リストの構築処理手順を示すフローチャートである。本方式では、優先順位をつけて、優先順位の高いものからマージ候補リストmergeCandListにマージ候補を登録することで、マージインデックスmerge_idx[x0][y0]の符号量を削減する。優先順位の高い要素をマージ候補リストの前方に配置することで、符号量を削減する。例えば、マージ候補リストmergeCandListの要素が5個の場合、マージ候補リストのインデックス0を「0」、インデックス1を「10」、インデックス2を「110」、インデックス3を「1110」、インデックス4を「11110」とすることで、インデックス0を表す符号量が1ビットとなり、インデックス0に発生頻度が高いと考えられる要素を登録することで、符号量を削減する。
 マージ候補リストmergeCandListはリスト構造を成し、マージ候補リスト内部の所在を示すマージインデックスと、インデックスに対応するマージ候補を要素として格納する記憶領域が設けられている。マージインデックスの数字は0から開始され、マージ候補リストmergeCandListの記憶領域に、マージ候補が格納される。以降の処理では、マージ候補リストmergeCandListに登録されたマージインデックスiのマージ候補となる予測ブロックは、mergeCandList[i]で表すこととし、マージ候補リストmergeCandListとは配列表記をすることで区別することとする。
 まず、availableFlagAが1の場合(ステップS4101のYES)、マージ候補リストmergeCandListの先頭にマージ候補Aを登録する(ステップS4102)。
 続いて、availableFlagBが1の場合(ステップS4103のYES)、マージ候補リストmergeCandListの最後にマージ候補Bを登録する(ステップS4104)。
 続いて、availableFlagCが1の場合(ステップS4105のYES)、マージ候補リストmergeCandListの最後にマージ候補Cを登録する(ステップS4106)。
 続いて、availableFlagDが1の場合(ステップS4107のYES)、マージ候補リストmergeCandListの最後にマージ候補Dを登録する(ステップS4108)。
 続いて、availableFlagEが1の場合(ステップS4109のYES)、マージ候補リストmergeCandListの最後にマージ候補Eを登録する(ステップS4110)。
 続いて、availableFlagColが1の場合(ステップS4109のYES)、マージ候補リストmergeCandListの最後にマージ候補Colを登録する(ステップS4110)。
 なお、マージモードにおいて、左に近接する予測ブロックA及び上に近接する予測ブロックBは符号化または復号対象の予測ブロックと一体となる動きになることが多いので、予測ブロックA、Bのインター予測情報が取得できる場合には、マージ候補A、Bを他のマージ候補C,D,E,Colよりも優先的にマージ候補リストの前方に登録する。
 図13において、動画像符号化装置のインター予測情報導出部104の符号化情報選択部136では、マージ候補リストに登録されているマージ候補の中から、マージ候補を選択し、マージインデックスおよびマージインデックスに対応するマージ候補のインター予測情報を動き補償予測部105に供給する。
 マージ候補の選択においては、予測方法決定部107と同様の方法を用いることができる。それぞれのマージ候補ごとに符号化情報及び残差信号の符号量と予測画像信号と画像信号との間の符号化歪を導出し、最も少ない発生符号量と符号化歪となるマージ候補が決定される。それぞれのマージ候補毎にマージモードの符号化情報であるマージインデックスのシンタックス要素merge_idxのエントロピー符号化を行い、符号化情報の符号量を算出する。さらに、それぞれのマージ候補毎に動き補償予測部105と同様の方法で各マージ候補のインター予測情報に応じて動き補償した予測画像信号と、画像メモリ101から供給される符号化対象の画像信号との予測残差信号を符号化した予測残差信号の符号量を算出する。符号化情報、即ちマージインデックスの符号量と予測残差信号の符号量とが加算された総発生符号量を算出し評価値とする。
 また、こうした予測残差信号を符号化後に、歪量評価の為に復号し、符号化により生じる元の画像信号との誤差を表す比率として符号化歪が算出される。これら総発生符号量と符号化歪とをマージ候補毎に比較することで、少ない発生符号量と符号化歪となる符号化情報が決定される。決定された符号化情報に対応するマージインデックスが、予測ブロック単位の第2のシンタックスパターンで表されるフラグmerge_idxとして符号化される。
 尚、ここで算出される発生符号量は、符号化過程をシミュレートしたものであることが望ましいが、簡便に近似したり、概算することも可能である。
 一方、図14において、動画像符号化装置のインター予測情報導出部205の符号化情報選択部236では、マージ候補リストに登録されているマージ候補の中から、供給されたマージインデックスに対応するマージ候補を選択し、マージ候補のインター予測情報を動き補償予測部206に供給するとともに、符号化情報格納メモリ210に格納する。
 以上述べた実施の形態の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有しており、動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。
 動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。
 動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。
 以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ROM(リード・オンリ・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。
 以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 101 画像メモリ、 102 動きベクトル検出部、 103 差分動きベクトル算出部、 104 インター予測情報導出部、 105 動き補償予測部、 106 イントラ予測部、 107 予測方法決定部、 108 残差信号生成部、 109 直交変換・量子化部、 110 第1の符号化ビット列生成部、 111 第2の符号化ビット列生成部、 112 多重化部、 130 空間マージ候補生成部、 131 時間マージ候補の参照インデックス導出部、 132 時間マージ候補生成部、 133 マージ候補登録部、 134 マージ候補同一判定部、 135 マージ候補補充部、 136 符号化情報選択部、 201 分離部、 202 第1符号化ビット列復号部、 203 第2符号化ビット列復号部、 204 動きベクトル算出部、 205 インター予測情報導出部、 206 動き補償予測部、 207 イントラ予測部、 208 逆量子化・逆直交変換部、 209 復号画像信号重畳部、 210 符号化情報格納メモリ、 211 復号画像メモリ、 230 空間マージ候補生成部、 231 時間マージ候補の参照インデックス導出部、 232 時間マージ候補生成部、 233 マージ候補登録部、 234 マージ候補同一判定部、 235 マージ候補補充部、 236 符号化情報選択部。
 本発明は、動き補償予測を利用した動画像符号化技術に利用できる。

Claims (26)

  1.  各ピクチャを分割した第1のブロックを1つまたは複数の第2のブロックに分割し、インター予測を用いて動画像を符号化する動画像符号化装置であって、
     符号化対象となるピクチャ内の、符号化対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出部と、
     前記符号化対象となるピクチャとは異なるピクチャ内の、前記符号化対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出部と、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築部と、
     前記予測情報候補リストにおける前記予測情報候補から、前記符号化対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択し、インター予測情報を示すインデックスを決定する選択部と、
     前記符号化対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを符号化する符号化部とを備え、
     前記第1予測情報導出部は、前記符号化対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像符号化装置。
  2.  前記第2予測情報導出部は、前記第5のブロックの符号化情報を参照せず、前記第2インター予測情報候補を導出することを特徴とする請求項1に記載の動画像符号化装置。
  3.  前記第1予測情報導出部は、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補としないことを特徴とする請求項1または2に記載の動画像符号化装置。
  4.  前記第2予測情報導出部は、前記第2インター予測情報候補を含む前記インター予測情報により前記符号化対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記符号化対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項3に記載の動画像符号化装置。
  5.  前記第2インター予測情報候補の前記参照インデックス情報に設定する前記デフォルト値は0であることを特徴とする請求項4に記載の動画像符号化装置。
  6.  分割モードに基づいて符号化ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う画像符号化装置であって、
     符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける、前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、時間マージ候補となるインター予測情報を導出し、その導出したインター予測情報により前記符号化対象の予測ブロックのインター予測を行うマージモードにおいて、前記符号化対象の予測ブロックで用いられる参照ピクチャを特定する参照インデックス情報として、時間マージ候補の参照インデックス情報を導出する参照インデックス導出部と、
     導出された前記参照インデックス情報に基づいた時間マージ候補のインター予測情報を導出する時間マージ候補生成部とを備え、
     前記参照インデックス導出部は、
     前記分割モードが前記符号化ブロックを水平境界で上下の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記符号化対象の予測ブロックの左辺に隣接する符号化済みの予測ブロックの参照インデックス情報の値に設定して出力し、
     前記分割モードが前記符号化ブロックを垂直境界で左右の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記符号化対象の予測ブロックの上辺に隣接する符号化済みの予測ブロックの参照インデックス情報の値に設定して出力することを特徴とする動画像符号化装置。
  7.  各ピクチャを分割した第1のブロックを1つまたは複数の第2のブロックに分割し、インター予測を用いて動画像を符号化する動画像符号化方法であって、
     符号化対象となるピクチャ内の、符号化対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、
     前記符号化対象となるピクチャとは異なるピクチャ内の、前記符号化対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、
     前記予測情報候補リストにおける前記予測情報候補から、前記符号化対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択し、インター予測情報を示すインデックスを決定する選択ステップと、
     前記符号化対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを符号化する符号化ステップとを備え、
     前記第1予測情報導出ステップは、前記符号化対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像符号化方法。
  8.  前記第2予測情報導出ステップは、前記第5のブロックの符号化情報を参照せず、前記第2インター予測情報候補を導出することを特徴とする請求項7に記載の動画像符号化方法。
  9.  前記第1予測情報導出ステップは、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補としないことを特徴とする請求項7または8に記載の動画像符号化方法。
  10.  前記第2予測情報導出ステップは、前記第2インター予測情報候補を含む前記インター予測情報により前記符号化対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記符号化対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項9に記載の動画像符号化方法。
  11.  前記第2インター予測情報候補の前記参照インデックス情報に設定する前記デフォルト値は0であることを特徴とする請求項10に記載の動画像符号化方法。
  12.  各ピクチャを分割した第1のブロックを1つまたは複数の第2のブロックに分割し、インター予測を用いて動画像を符号化する動画像符号化プログラムであって、
     符号化対象となるピクチャ内の、符号化対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、
     前記符号化対象となるピクチャとは異なるピクチャ内の、前記符号化対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、
     前記予測情報候補リストにおける前記予測情報候補から、前記符号化対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択し、インター予測情報を示すインデックスを決定する選択ステップと、
     前記符号化対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを符号化する符号化ステップとをコンピュータに実行させ、
     前記第1予測情報導出ステップは、前記符号化対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像符号化プログラム。
  13.  前記第1予測情報導出ステップは、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記符号化対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補とせず、
     前記第2予測情報導出ステップは、前記第2インター予測情報候補を含む前記インター予測情報により前記符号化対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記符号化対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項12に記載の動画像符号化プログラム。
  14.  各ピクチャが分割された第1のブロックが1つまたは複数の第2のブロックに分割され、インター予測により動画像が符号化された符号化ビット列を復号する動画像復号装置であって、
     復号対象となるピクチャ内の、復号対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出部と、
     前記復号対象となるピクチャとは異なるピクチャ内の、前記復号対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出部と、
     前記復号対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを復号する復号部と、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築部と、
     前記予測情報候補リストにおける前記予測情報候補から、前記インデックスが示す前記復号対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択する選択部とを備え、
     前記第1予測情報導出部は、前記復号対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像復号装置。
  15.  前記第2予測情報導出部は、前記第5のブロックの符号化情報を参照せず、前記第2インター予測情報候補を導出することを特徴とする請求項14に記載の動画像復号装置。
  16.  前記第1予測情報導出部は、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補としないことを特徴とする請求項14または15に記載の動画像復号装置。
  17.  前記第2予測情報導出部は、前記第2インター予測情報候補を含む前記インター予測情報により前記復号対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記復号対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項16に記載の動画像復号装置。
  18.  前記第2インター予測情報候補の前記参照インデックス情報に設定する前記デフォルト値は0であることを特徴とする請求項17に記載の動画像復号装置。
  19.  分割モードに基づいて復号ブロックを1つまたは複数の予測ブロックに分割して動き補償予測を行う画像復号装置であって、
     復号対象の予測ブロックと時間的に異なる復号済みのピクチャにおける、前記復号対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、時間マージ候補となるインター予測情報を導出し、その導出したインター予測情報により前記復号対象の予測ブロックのインター予測を行うマージモードにおいて、前記復号対象の予測ブロックで用いられる参照ピクチャを特定する参照インデックス情報として、時間マージ候補の参照インデックス情報を導出する参照インデックス導出部と、
     導出された前記参照インデックス情報に基づいた時間マージ候補のインター予測情報を導出する時間マージ候補生成部とを備え、
     前記参照インデックス導出部は、
     前記分割モードが前記復号ブロックを水平境界で上下の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記復号対象の予測ブロックの左辺に隣接する復号済みの予測ブロックの参照インデックス情報の値に設定して出力し、
     前記分割モードが前記復号ブロックを垂直境界で左右の予測ブロックに分割するモードである場合、時間マージ候補の参照インデックス情報を前記復号対象の予測ブロックの上辺に隣接する復号済みの予測ブロックの参照インデックス情報の値に設定して出力することを特徴とする動画像復号装置。
  20.  各ピクチャが分割された第1のブロックが1つまたは複数の第2のブロックに分割され、インター予測により動画像が符号化された符号化ビット列を復号する動画像復号方法であって、
     復号対象となるピクチャ内の、復号対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、
     前記復号対象となるピクチャとは異なるピクチャ内の、前記復号対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、
     前記復号対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを復号する復号ステップと、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、
     前記予測情報候補リストにおける前記予測情報候補から、前記インデックスが示す前記復号対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択する選択ステップとを備え、
     前記第1予測情報導出ステップは、前記復号対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像復号方法。
  21.  前記第2予測情報導出ステップは、前記第5のブロックの符号化情報を参照せず、前記第2インター予測情報候補を導出することを特徴とする請求項20に記載の動画像復号方法。
  22.  前記第1予測情報導出ステップは、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補としないことを特徴とする請求項20または21に記載の動画像復号方法。
  23.  前記第2予測情報導出ステップは、前記第2インター予測情報候補を含む前記インター予測情報により前記復号対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記復号対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項22に記載の動画像復号方法。
  24.  前記第2インター予測情報候補の前記参照インデックス情報に設定する前記デフォルト値は0であることを特徴とする請求項23に記載の動画像復号方法。
  25.  各ピクチャが分割された第1のブロックが1つまたは複数の第2のブロックに分割され、インター予測により動画像が符号化された符号化ビット列を復号する動画像復号プログラムであって、
     復号対象となるピクチャ内の、復号対象となる前記第2のブロックに近接する第3のブロックのインター予測情報から第1インター予測情報候補の導出を行う第1予測情報導出ステップと、
     前記復号対象となるピクチャとは異なるピクチャ内の、前記復号対象となる前記第2のブロックと同一位置またはその付近に存在する第4のブロックのインター予測情報から第2インター予測情報候補の導出を行う第2予測情報導出ステップと、
     前記復号対象となる前記第2のブロックのインター予測に用いるインター予測情報を示すインデックスを復号する復号ステップと、
     前記第1インター予測情報候補が導出された場合には、その導出された前記第1インター予測情報候補を、前記第2インター予測情報候補が導出された場合には、その導出された前記第2インター予測情報候補を、それぞれ加えた所定の予測情報候補からなる予測情報候補リストを構築する候補リスト構築ステップと、
     前記予測情報候補リストにおける前記予測情報候補から、前記インデックスが示す前記復号対象となる前記第2のブロックの前記インター予測に用いるインター予測情報の候補を選択する選択ステップとをコンピュータに実行させ、
     前記第1予測情報導出ステップは、前記復号対象となる前記第2のブロックを含む前記第1のブロックと同じ第1のブロックに含まれる第5のブロックの符号化情報を第1インター予測情報候補としないことを特徴とする動画像復号プログラム。
  26.  前記第1予測情報導出ステップは、前記第1のブロックを上側の第6のブロックと下側の第7のブロックの上下に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第7のブロックの場合、その第7のブロックの上辺に近接する前記第6のブロックの符号化情報を前記第1インター予測情報候補としないと共に、
    前記第1のブロックを左側の第8のブロックと右側の第9のブロックの左右に分割する分割モードで、前記復号対象となる前記第2のブロックが前記第9のブロックの場合、その第9のブロックの左辺に近接する前記第8のブロックの符号化情報を前記第1インター予測情報候補とせず、
     前記第2予測情報導出ステップは、前記第2インター予測情報候補を含む前記インター予測情報により前記復号対象となる前記第2のブロックの前記インター予測を行うマージモードにおいて、前記分割モードに関係なく、前記復号対象となる前記第2のブロックのいずれについても、前記第2インター予測情報候補における、参照ピクチャを特定するための参照インデックス情報をデフォルト値に設定し、前記デフォルト値に設定された前記参照インデックス情報に基づいて、前記第2インター予測情報候補を導出することを特徴とする請求項25に記載の動画像復号プログラム。
PCT/JP2012/008016 2011-12-16 2012-12-14 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム WO2013088738A1 (ja)

Priority Applications (20)

Application Number Priority Date Filing Date Title
RU2014129060/08A RU2598302C2 (ru) 2011-12-16 2012-12-14 Устройство кодирования движущегося изображения, способ кодирования движущегося изображения и программа кодирования движущегося изображения, а также устройство декодирования движущегося изображения, способ декодирования движущегося изображения и программа декодирования движущегося изображения
EP19156821.1A EP3503554B1 (en) 2011-12-16 2012-12-14 Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program
DK12857437.3T DK2802146T3 (en) 2011-12-16 2012-12-14 DYNAMIC PICTURE DECODING DEVICE, DYNAMIC PICTURE DECODING PROCEDURE AND DYNAMIC PICTURE DECODING PROGRAM
PL12857437T PL2802146T3 (pl) 2011-12-16 2012-12-14 Urządzenie do dekodowania dynamicznego obrazu, sposób dekodowania dynamicznego obrazu, i program do dekodowania dynamicznego obrazu
PL20169995T PL3703371T3 (pl) 2011-12-16 2012-12-14 Urządzenie do dynamicznego kodowania obrazu, sposób dynamicznego kodowania obrazu, program do dynamicznego kodowania obrazu, urządzenie do dynamicznego dekodowania obrazu, sposób dynamicznego dekodowania obrazu i program do dynamicznego dekodowania obrazu
EP20169994.9A EP3703370B1 (en) 2011-12-16 2012-12-14 Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program, dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
PL20169994T PL3703370T3 (pl) 2011-12-16 2012-12-14 Urządzenie do dynamicznego kodowania obrazu, sposób dynamicznego kodowania obrazu, program do dynamicznego kodowania obrazu, urządzenie do dynamicznego dekodowania obrazu, sposób dynamicznego dekodowania obrazu i program do dynamicznego dekodowania obrazu
EP21181798.6A EP3907997A1 (en) 2011-12-16 2012-12-14 Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program, dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
SI201231576T SI2802146T1 (sl) 2011-12-16 2012-12-14 Naprava za dekodiranje dinamične slike, metoda za dekodiranje dinamične slike in program za dekodiranje dinamične slike
BR112014013962A BR112014013962B1 (pt) 2011-12-16 2012-12-14 dispositivo de decodificação de imagem em movimento e método de decodificação de imagem em movimento
PL19156821T PL3503554T3 (pl) 2011-12-16 2012-12-14 Urządzenie do dynamicznego kodowania obrazu, sposób dynamicznego kodowania obrazu i program do dynamicznego kodowania obrazu
EP19217766.5A EP3654651B1 (en) 2011-12-16 2012-12-14 Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program, dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
EP12857437.3A EP2802146B1 (en) 2011-12-16 2012-12-14 Dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
PL19217766T PL3654651T3 (pl) 2011-12-16 2012-12-14 Urządzenie do dynamicznego kodowania obrazu, sposób dynamicznego kodowania obrazu, program do dynamicznego kodowania obrazu, urządzenie do dynamicznego dekodowania obrazu, sposób dynamicznego dekodowania obrazu i program do dynamicznego dekodowania obrazu
EP20169995.6A EP3703371B1 (en) 2011-12-16 2012-12-14 Dynamic image encoding device, dynamic image encoding method, dynamic image encoding program, dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
US14/298,635 US9674545B2 (en) 2011-12-16 2014-06-06 Moving picture encoding device, moving picture encoding method and moving picture encoding program, and moving picture decoding device, moving picture decoding method and moving picture decoding program
US15/196,872 US9743104B2 (en) 2011-12-16 2016-06-29 Moving picture encoding device, moving picture encoding method and moving picture encoding program, and moving picture decoding device, moving picture decoding method and moving picture decoding program
US15/583,577 US9906809B2 (en) 2011-12-16 2017-05-01 Moving picture decoding device, moving picture decoding method and moving picture decoding program
US15/583,601 US9906810B2 (en) 2011-12-16 2017-05-01 Moving picture decoding device, moving picture decoding method and moving picture decoding program
US15/583,616 US9906811B2 (en) 2011-12-16 2017-05-01 Moving picture decoding device, moving picture decoding method and moving picture decoding program

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP2011-276456 2011-12-16
JP2011276456 2011-12-16
JP2011276457 2011-12-16
JP2011-276457 2011-12-16
JP2011-289288 2011-12-28
JP2011289288 2011-12-28
JP2011289287 2011-12-28
JP2011-289287 2011-12-28
JP2012273314A JP5900308B2 (ja) 2011-12-16 2012-12-14 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2012-273315 2012-12-14
JP2012273315A JP5561348B2 (ja) 2011-12-16 2012-12-14 動画像復号装置、動画像復号方法、及び動画像復号プログラム、並びに、受信装置、受信方法、及び受信プログラム
JP2012-273314 2012-12-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/298,635 Continuation US9674545B2 (en) 2011-12-16 2014-06-06 Moving picture encoding device, moving picture encoding method and moving picture encoding program, and moving picture decoding device, moving picture decoding method and moving picture decoding program

Publications (1)

Publication Number Publication Date
WO2013088738A1 true WO2013088738A1 (ja) 2013-06-20

Family

ID=49479186

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/008016 WO2013088738A1 (ja) 2011-12-16 2012-12-14 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム

Country Status (12)

Country Link
US (5) US9674545B2 (ja)
EP (6) EP3703371B1 (ja)
BR (1) BR112014013962B1 (ja)
DK (5) DK3503554T3 (ja)
ES (3) ES2886342T3 (ja)
HR (1) HRP20211359T1 (ja)
HU (5) HUE047995T2 (ja)
PL (5) PL3703370T3 (ja)
RU (4) RU2598302C2 (ja)
SI (5) SI2802146T1 (ja)
TW (5) TWI607649B (ja)
WO (1) WO2013088738A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071456B (zh) 2011-09-23 2020-09-04 株式会社Kt 解码视频信号的方法
CN112188206B (zh) * 2014-10-31 2023-10-20 三星电子株式会社 使用高精度跳过编码的视频编码设备和视频解码设备及其方法
US10477233B2 (en) * 2015-09-30 2019-11-12 Apple Inc. Predictor candidates for motion estimation search systems and methods
CN116708782A (zh) * 2016-07-12 2023-09-05 韩国电子通信研究院 图像编码/解码方法以及用于该方法的记录介质
CN116506597A (zh) * 2016-08-03 2023-07-28 株式会社Kt 视频解码方法、视频编码方法和视频数据的传送方法
WO2019216325A1 (en) 2018-05-09 2019-11-14 Sharp Kabushiki Kaisha Systems and methods for performing motion vector prediction using a derived set of motion vectors
US10855986B2 (en) 2018-05-29 2020-12-01 Qualcomm Incorporated Bandwidth compression for neural network systems
CN114600454A (zh) * 2019-10-03 2022-06-07 华为技术有限公司 几何分割模式的译码过程
CN111263151B (zh) * 2020-04-26 2020-08-25 腾讯科技(深圳)有限公司 视频编码方法、装置、电子设备和计算机可读存储介质
US11949863B2 (en) * 2021-08-02 2024-04-02 Tencent America LLC Geometric partition mode with intra block copy
KR20240054296A (ko) * 2021-08-18 2024-04-25 엘지전자 주식회사 채널간 상관도에 기반한 피쳐 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129191A (ja) 2002-10-04 2004-04-22 Lg Electronics Inc Bピクチャのダイレクトモード動きベクトル演算方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3968712B2 (ja) * 2003-04-28 2007-08-29 ソニー株式会社 動き予測補償装置及びその方法
US7145950B2 (en) * 2003-07-14 2006-12-05 Primax Electronics Ltd. Method of motion vector determination in digital video compression
JP4591657B2 (ja) * 2003-12-22 2010-12-01 キヤノン株式会社 動画像符号化装置及びその制御方法、プログラム
CN103118252B (zh) * 2005-09-26 2016-12-07 三菱电机株式会社 运动图像编码装置以及运动图像译码装置
CN100525446C (zh) * 2005-12-26 2009-08-05 凌阳科技股份有限公司 可纵向译码输出的区块译码方法及装置
JP4790446B2 (ja) * 2006-03-01 2011-10-12 三菱電機株式会社 動画像復号装置及び動画像符号化装置
CA2665781C (en) * 2006-10-30 2014-02-18 Nippon Telegraph And Telephone Corporation Predicted reference information generating method, video encoding and decoding methods, apparatuses therefor, programs therefor, and storage media which store the programs
US7991237B2 (en) * 2007-06-28 2011-08-02 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
JP2009164880A (ja) * 2008-01-07 2009-07-23 Mitsubishi Electric Corp トランスコーダ及び受信機
JP5406465B2 (ja) * 2008-04-24 2014-02-05 株式会社Nttドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP5401071B2 (ja) * 2008-10-09 2014-01-29 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
EP2237557A1 (en) * 2009-04-03 2010-10-06 Panasonic Corporation Coding for filter coefficients
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US8971400B2 (en) * 2010-04-14 2015-03-03 Mediatek Inc. Method for performing hybrid multihypothesis prediction during video coding of a coding unit, and associated apparatus
US10171813B2 (en) 2011-02-24 2019-01-01 Qualcomm Incorporated Hierarchy of motion prediction video blocks
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
US9313494B2 (en) * 2011-06-20 2016-04-12 Qualcomm Incorporated Parallelization friendly merge candidates for video coding
KR20130050406A (ko) 2011-11-07 2013-05-16 오수미 머지 모드에서의 움직임 정보 생성 방법
KR20130050407A (ko) 2011-11-07 2013-05-16 오수미 인터 모드에서의 움직임 정보 생성 방법
JP5561348B2 (ja) 2011-12-16 2014-07-30 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、及び動画像復号プログラム、並びに、受信装置、受信方法、及び受信プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129191A (ja) 2002-10-04 2004-04-22 Lg Electronics Inc Bピクチャのダイレクトモード動きベクトル演算方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
See also references of EP2802146A4
YUNFEI ZHENG ET AL.: "Merge Candidate Selection in 2NxN, Nx2N, and NxN Mode", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, JCTVC-F302_R2, 6TH MEETING, July 2011 (2011-07-01), TORINO, IT, pages 1 - 6, XP030048499 *
YUNFEI ZHENG ET AL.: "Unified Motion Vector Predictor Selection for Merge and AMVP", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, JCTVC-E396, 5TH MEETING, March 2011 (2011-03-01), GENEVA, pages 1 - 5, XP030048499 *

Also Published As

Publication number Publication date
TWI578766B (zh) 2017-04-11
DK3503554T3 (da) 2020-05-11
SI3654651T1 (sl) 2021-08-31
RU2678507C9 (ru) 2020-11-12
PL3654651T3 (pl) 2021-09-27
SI3703371T1 (sl) 2021-11-30
ES2877369T3 (es) 2021-11-16
RU2598302C2 (ru) 2016-09-20
US20140286414A1 (en) 2014-09-25
TW201720163A (zh) 2017-06-01
HUE055993T2 (hu) 2022-01-28
EP3654651A1 (en) 2020-05-20
TWI593277B (zh) 2017-07-21
TWI607649B (zh) 2017-12-01
TWI559746B (zh) 2016-11-21
PL3703371T3 (pl) 2021-12-06
US20160309180A1 (en) 2016-10-20
PL3703370T3 (pl) 2021-12-06
US9743104B2 (en) 2017-08-22
EP3703371B1 (en) 2021-08-04
EP3503554B1 (en) 2020-02-05
EP2802146A4 (en) 2015-09-23
BR112014013962A2 (pt) 2017-06-13
US20170238008A1 (en) 2017-08-17
TW201642659A (zh) 2016-12-01
SI3703370T1 (sl) 2021-11-30
US9906811B2 (en) 2018-02-27
US20170238009A1 (en) 2017-08-17
DK3703370T3 (da) 2021-09-06
RU2014129060A (ru) 2016-02-10
TWI586153B (zh) 2017-06-01
RU2679552C1 (ru) 2019-02-11
HRP20211359T1 (hr) 2021-11-26
US9906809B2 (en) 2018-02-27
ES2888805T3 (es) 2022-01-07
TW201332375A (zh) 2013-08-01
US9906810B2 (en) 2018-02-27
HUE047995T2 (hu) 2020-05-28
ES2886342T3 (es) 2021-12-17
DK2802146T3 (en) 2019-04-15
SI2802146T1 (sl) 2019-07-31
RU2678507C1 (ru) 2019-01-29
EP2802146B1 (en) 2019-02-27
US9674545B2 (en) 2017-06-06
PL3503554T3 (pl) 2020-06-29
EP3654651B1 (en) 2021-04-21
US20170238010A1 (en) 2017-08-17
EP3703370A1 (en) 2020-09-02
TW201720165A (zh) 2017-06-01
BR112014013962B1 (pt) 2020-04-07
DK3703371T3 (da) 2021-09-06
TW201720164A (zh) 2017-06-01
HUE053940T2 (hu) 2021-08-30
HUE043876T2 (hu) 2019-09-30
RU2636688C1 (ru) 2017-11-27
PL2802146T3 (pl) 2019-07-31
HUE055991T2 (hu) 2022-01-28
EP2802146A1 (en) 2014-11-12
SI3503554T1 (sl) 2020-06-30
DK3654651T3 (da) 2021-05-31
EP3703370B1 (en) 2021-08-04
EP3907997A1 (en) 2021-11-10
EP3703371A1 (en) 2020-09-02
EP3503554A1 (en) 2019-06-26
BR112014013962A8 (pt) 2017-06-13

Similar Documents

Publication Publication Date Title
WO2013088738A1 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
JP6090512B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
JP6229806B2 (ja) 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
JP6644270B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
JP2013090032A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
WO2013065301A1 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム、並びに動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
JP2013102260A (ja) 動画像復号装置、動画像復号方法及び動画像復号プログラム
JP2013090033A (ja) 動画像復号装置、動画像復号方法及び動画像復号プログラム
JP2013098733A (ja) 動画像復号装置、動画像復号方法及び動画像復号プログラム
JP2013102259A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2013118624A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
JP2013098732A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12857437

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012857437

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2014129060

Country of ref document: RU

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112014013962

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112014013962

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20140609