WO2013065431A1 - Image decoding device, image decoding method, and image encoding device - Google Patents

Image decoding device, image decoding method, and image encoding device Download PDF

Info

Publication number
WO2013065431A1
WO2013065431A1 PCT/JP2012/075195 JP2012075195W WO2013065431A1 WO 2013065431 A1 WO2013065431 A1 WO 2013065431A1 JP 2012075195 W JP2012075195 W JP 2012075195W WO 2013065431 A1 WO2013065431 A1 WO 2013065431A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
unit
size
decoding
inter
Prior art date
Application number
PCT/JP2012/075195
Other languages
French (fr)
Japanese (ja)
Inventor
山本 智幸
知宏 猪飼
将伸 八杉
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Publication of WO2013065431A1 publication Critical patent/WO2013065431A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Definitions

  • the present invention relates to an image decoding apparatus that decodes encoded data representing an image, an image decoding method, and an image encoding apparatus that generates encoded data by encoding an image.
  • a moving image encoding device that generates encoded data by encoding the moving image, and a moving image that generates a decoded image by decoding the encoded data
  • An image decoding device is used.
  • the moving image encoding method include H.264. H.264 / MPEG-4.
  • KTA software which is a codec for joint development in AVC and VCEG (Video Coding Expert Group), a method adopted in TMuC (Test Model Under Software), and a successor codec, HEVC (High- The method proposed in (Efficiency ⁇ Video ⁇ Coding) (Non-Patent Documents 1 and 4) is included.
  • an image (picture) constituting a moving image is a slice obtained by dividing the image, a coding unit obtained by dividing the slice (Coding Unit) And is managed by a hierarchical structure composed of blocks and partitions obtained by dividing an encoding unit, and is normally encoded / decoded block by block.
  • a predicted image is usually generated based on a local decoded image obtained by encoding / decoding an input image, and the predicted image is generated from the input image (original image).
  • a prediction residual obtained by subtraction (sometimes referred to as “difference image” or “residual image”) is encoded.
  • examples of the method for generating a predicted image include inter-screen prediction (inter prediction) and intra-screen prediction (intra prediction).
  • predicted images in a corresponding frame are sequentially generated based on a locally decoded image in the same frame.
  • inter prediction by applying motion compensation using a motion vector to a reference image in a reference frame (decoded image) obtained by decoding the entire frame, a predicted image in a prediction target frame is converted into a prediction unit ( For example, it is generated for each block).
  • Non-Patent Document 2 when the partition type is an asymmetric partition, it has been proposed to perform non-square quadtree transformation (NSQT; Non-Square Quadtree Transform) (Non-Patent Document 2).
  • ⁇ WD4 Working Draft 4 of High-Efficiency Video Coding (JCTVC-F803_d1) '', Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11 6th etino: IT, 14-22 July, 2011 (released on September 8, 2011) “CE2: Non-Square Quadtree Transform for symmetric and asymmetric motion partition (JCTVC-F412)”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG116thoret , IT, 14-22 July, 2011 (released July 2, 2011) “CE2: Test results of asymmetric motion partition (AMP) (JCTVC-F379)”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1
  • the code amount of the side information is increased due to the addition of the asymmetric partition described above in inter prediction.
  • the newly added asymmetric partition has a problem that although the property is different from the conventional symmetric partition, the property is not sufficiently utilized in the encoding process.
  • the present invention has been made in view of the above problems, and an object of the present invention is to realize a reduction in code amount when an asymmetric partition is used and an efficient encoding / decoding process utilizing the characteristics of the asymmetric partition. It is an object to provide an image decoding apparatus, an image decoding method, and an image encoding apparatus.
  • an image decoding apparatus provides a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction.
  • the image decoding apparatus that decodes an image in a prediction unit using the bi-prediction restriction unit for restricting the bi-prediction to the prediction unit when the prediction unit is a prediction unit having a predetermined size or less. It is characterized by providing.
  • an image decoding method includes a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction.
  • the image decoding method for decoding an image in a prediction unit using the step determining whether or not the prediction unit is a prediction unit having a predetermined size or less, and not using the bi-prediction for the prediction unit And at least the step of limiting.
  • an image coding apparatus as a prediction method for inter-screen prediction, performs a single prediction that refers to one reference image or a bi-reference that refers to two reference images.
  • the prediction unit is a prediction unit having a size equal to or smaller than a predetermined size
  • the bi-prediction that restricts the bi-prediction to the prediction unit is limited.
  • a prediction limiting means is provided.
  • an image decoding apparatus divides the coding unit in an image decoding apparatus that decodes image coded data and generates a decoded image for each coding unit.
  • a CU information decoding unit that decodes information designating a division type to be performed, and an arithmetic decoding unit that decodes a binary value from the image encoded data by arithmetic decoding using context or arithmetic decoding without using context When the CU information decoding unit decodes information designating asymmetric division (AMP) as the division type, the arithmetic decoding unit performs arithmetic using the context according to the position of the binary value. Decoding is performed by switching between decoding and arithmetic decoding without using the context.
  • AMP asymmetric division
  • FIG. 3 is a diagram illustrating a data configuration of encoded data generated by a video encoding device according to an embodiment of the present invention and decoded by the video decoding device, wherein (a) to (d) are pictures, respectively. It is a figure which shows a layer, a slice layer, a tree block layer, and a CU layer. It is a figure which shows the pattern of PU division
  • (A) to (h) show partition shapes when PU partition types are 2N ⁇ N, 2N ⁇ nU, 2N ⁇ nD, 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD, respectively. .
  • FIG. (A) shows the case where the PU partition type is 2N ⁇ 2N
  • FIG. (B) shows the case where the PU partition type is 2N ⁇ nU.
  • FIG. (B) shows the case where the PU partition type is 2N ⁇ nU.
  • FIG. (B) shows the case where the PU partition type is 2N ⁇ nU.
  • FIG. 1 It is a flowchart which shows an example of the flow of a CU encoding process. It is the figure shown about the structure of the transmitter which mounts the said moving image encoder, and the receiver which mounts the said moving image decoder.
  • (A) shows a transmitting apparatus equipped with a moving picture coding apparatus, and (b) shows a receiving apparatus equipped with a moving picture decoding apparatus. It is the figure shown about the structure of the recording device which mounts the said moving image encoder, and the reproducing
  • (A) shows a recording apparatus equipped with a moving picture coding apparatus, and (b) shows a reproduction apparatus equipped with a moving picture decoding apparatus.
  • (C) is an example in which disable_bipred_size indicating the size of the PU for which bi-prediction is prohibited is included in the encoded data. It is a figure which shows the correspondence of the range which implements bi-prediction restriction
  • variable table (a) is a figure which shows the example of conversion variable table EncTable and reverse conversion variable table DecTable, (b) is a figure which shows reverse conversion variable table DecTable. . It is a figure explaining decoding inter_pred_flag regarding bi-prediction restriction. It is a figure explaining decoding of the joint joint inter prediction reference index flag combined_inter_pred_ref_idx regarding a bi-prediction restriction
  • Pseudo code showing the encoding process of combined_inter_pred_ref_idx when using the conversion variable table. It is a block diagram which shows the structure of a merge motion compensation parameter derivation
  • (A)-(c) is a figure explaining operation
  • (A), (b) is a figure explaining operation
  • FIG. 7 is a diagram for explaining an example of a bi-prediction restriction method, in which (a) uniformly applies a bi-prediction restriction of a basic inter PU, a bi-prediction restriction of a merge PU to a PU of a size of 4 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 8; It is a figure which shows the example which applies the skip of bi-predictive merge candidate derivation, (b), (c) is bi-prediction restriction
  • H. 2 is a table that defines level restrictions in H.264 / AVC.
  • H. 2 is a table that defines level restrictions in H.264 / AVC. It is the figure shown about adaptive PU size restrictions and bi-prediction restrictions. (A) shows the case of 16 ⁇ 16 CU, and (b) shows the case of 8 ⁇ 8 CU. It is a block diagram which shows the structural examples, such as a merge motion compensation parameter derivation
  • FIG. 6 is a block diagram which shows the structural examples, such as a merge motion compensation parameter production
  • limiting part. 6 is a block diagram illustrating another configuration of the PU information generation unit 30. FIG.
  • FIG. 2 is a functional block diagram showing a schematic configuration of the moving picture decoding apparatus 1.
  • VCEG Video Coding Expert Group
  • TMuC Transmission Model Underside
  • the video encoding device 2 generates encoded data # 1 by entropy encoding a syntax value defined to be transmitted from the encoder to the decoder in these video encoding schemes. .
  • CAVLC context-adaptive variable-length coding
  • CABAC context-adaptive binary arithmetic coding
  • the context is an encoding / decoding situation (context), and is determined by past encoding / decoding results of related syntax.
  • Examples of the related syntax include various syntaxes related to intra prediction and inter prediction, various syntaxes related to luminance (Luma) and color difference (Chroma), and various syntaxes related to CU (Coding Unit encoding unit) size.
  • CABAC the binary position to be encoded / decoded in binary data (binary string) corresponding to the syntax may be used as the context.
  • CABAC CABAC
  • binarization processing is performed on syntax that can take multiple values such as a prediction mode and a conversion coefficient, and binary data obtained by this binarization processing is adaptive according to the occurrence probability.
  • arithmetically encoded Specifically, multiple buffers that hold the occurrence probability of binary values (0 or 1) are prepared, one buffer is selected according to the context, and arithmetic coding is performed based on the occurrence probability recorded in the buffer I do. Further, by updating the occurrence probability of the buffer based on the binary value to be decoded / encoded, an appropriate occurrence probability can be maintained according to the context.
  • the moving picture decoding apparatus 1 receives encoded data # 1 obtained by encoding a moving picture by the moving picture encoding apparatus 2.
  • the video decoding device 1 decodes the input encoded data # 1 and outputs the video # 2 to the outside.
  • the configuration of the encoded data # 1 will be described below.
  • the encoded data # 1 exemplarily includes a sequence and a plurality of pictures constituting the sequence.
  • FIG. 3 shows the hierarchical structure below the picture layer in the encoded data # 1.
  • 3A to 3D are included in the picture layer that defines the picture PICT, the slice layer that defines the slice S, the tree block layer that defines the tree block TBLK, and the tree block TBLK, respectively.
  • Picture layer In the picture layer, a set of data referred to by the video decoding device 1 for decoding a picture PICT to be processed (hereinafter also referred to as a target picture) is defined. As shown in FIG. 3A, the picture PICT includes a picture header PH and slices S1 to SNS (NS is the total number of slices included in the picture PICT).
  • the picture header PH includes a coding parameter group referred to by the video decoding device 1 in order to determine a decoding method of the target picture.
  • the encoding mode information (entropy_coding_mode_flag) indicating the variable length encoding mode used in encoding by the moving image encoding device 2 is an example of an encoding parameter included in the picture header PH.
  • the picture PICT is encoded by CAVLC (Context-based Adaptive Variable Variable Length Coding).
  • CAVLC Context-based Adaptive Variable Variable Length Coding
  • CABAC Context-based Adaptive Binary Arithmetic Coding
  • picture header PH is also referred to as a picture parameter set (PPS).
  • PPS picture parameter set
  • slice layer In the slice layer, a set of data referred to by the video decoding device 1 for decoding the slice S to be processed (also referred to as a target slice) is defined. As shown in FIG. 3B, the slice S includes a slice header SH and tree blocks TBLK1 to TBLKNC (NC is the total number of tree blocks included in the slice S).
  • the slice header SH includes a coding parameter group that the moving image decoding apparatus 1 refers to in order to determine a decoding method of the target slice.
  • Slice type designation information (slice_type) for designating a slice type is an example of an encoding parameter included in the slice header SH.
  • the slice types that can be specified by the slice type specification information include (1) I slice that uses only intra prediction at the time of encoding, (2) P slice that uses single prediction or intra prediction at the time of encoding, ( 3) B-slice using single prediction, bi-prediction, or intra prediction at the time of encoding may be used.
  • the slice header SH may include a filter parameter referred to by a loop filter (not shown) included in the video decoding device 1.
  • Tree block layer In the tree block layer, a set of data referred to by the video decoding device 1 for decoding a processing target tree block TBLK (hereinafter also referred to as a target tree block) is defined.
  • the tree block TBLK includes a tree block header TBLKH and coding unit information CU1 to CUNL (NL is the total number of coding unit information included in the tree block TBLK).
  • NL is the total number of coding unit information included in the tree block TBLK.
  • the tree block TBLK is divided into units for specifying a block size for each process of intra prediction or inter prediction and conversion.
  • the above unit of the tree block TBLK is divided by recursive quadtree partitioning.
  • the tree structure obtained by this recursive quadtree partitioning is hereinafter referred to as a coding tree.
  • a unit corresponding to a leaf that is a node at the end of the coding tree is referred to as a coding node.
  • the encoding node is a basic unit of the encoding process, hereinafter, the encoding node is also referred to as an encoding unit (CU).
  • CU encoding unit
  • the coding unit information CU1 to CUNL is information corresponding to each coding node (coding unit) obtained by recursively dividing the tree block TBLK into quadtrees.
  • the root of the coding tree is associated with the tree block TBLK.
  • the tree block TBLK is associated with the highest node of the tree structure of the quadtree partition that recursively includes a plurality of encoding nodes.
  • each coding node is half the size of the coding node to which the coding node directly belongs (that is, the unit of the node one layer higher than the coding node).
  • the size that each coding node can take depends on the size designation information of the coding node and the maximum hierarchy depth (maximum hierarchical depth) included in the sequence parameter set SPS of the coded data # 1. For example, when the size of the tree block TBLK is 64 ⁇ 64 pixels and the maximum hierarchical depth is 3, the encoding nodes in the hierarchy below the tree block TBLK have four sizes, that is, 64 ⁇ 64. It can take any of a pixel, 32 ⁇ 32 pixel, 16 ⁇ 16 pixel, and 8 ⁇ 8 pixel.
  • the tree block header TBLKH includes an encoding parameter referred to by the video decoding device 1 in order to determine a decoding method of the target tree block. Specifically, as shown in (c) of FIG. 3, tree block division information SP_TBLK that designates a division pattern of the target tree block into each CU, and a quantization parameter difference that designates the size of the quantization step ⁇ qp (qp_delta) is included.
  • the tree block division information SP_TBLK is information representing a coding tree for dividing the tree block. Specifically, the shape and size of each CU included in the target tree block, and the position in the target tree block Is information to specify.
  • the tree block division information SP_TBLK may not explicitly include the shape or size of the CU.
  • the tree block division information SP_TBLK may be a set of flags (split_coding_unit_flag) indicating whether or not the entire target tree block or a partial area of the tree block is divided into four.
  • the shape and size of each CU can be specified by using the shape and size of the tree block together.
  • the quantization parameter difference ⁇ qp is a difference qp ⁇ qp ′ between the quantization parameter qp in the target tree block and the quantization parameter qp ′ in the tree block encoded immediately before the target tree block.
  • CU layer In the CU layer, a set of data referred to by the video decoding device 1 for decoding a CU to be processed (hereinafter also referred to as a target CU) is defined.
  • the encoding node is a node at the root of a prediction tree (PT) and a transformation tree (TT).
  • PT prediction tree
  • TT transformation tree
  • the encoding node is divided into one or a plurality of prediction blocks, and the position and size of each prediction block are defined.
  • the prediction block is one or a plurality of non-overlapping areas constituting the encoding node.
  • the prediction tree includes one or a plurality of prediction blocks obtained by the above division.
  • Prediction processing is performed for each prediction block.
  • a prediction block that is a unit of prediction is also referred to as a prediction unit (PU).
  • intra prediction There are roughly two types of division in the prediction tree: intra prediction and inter prediction.
  • inter prediction there are 2N ⁇ 2N (the same size as the encoding node), 2N ⁇ N, N ⁇ 2N, N ⁇ N, and the like.
  • the encoding node is divided into one or a plurality of transform blocks, and the position and size of each transform block are defined.
  • the transform block is one or a plurality of non-overlapping areas constituting the encoding node.
  • the conversion tree includes one or a plurality of conversion blocks obtained by the above division.
  • transform processing is performed for each conversion block.
  • the transform block which is a unit of transform is also referred to as a transform unit (TU).
  • the coding unit information CU specifically includes a skip mode flag SKIP, CU prediction type information Pred_type, PT information PTI, and TT information TTI.
  • the skip flag SKIP is a flag indicating whether or not the skip mode is applied to the target CU.
  • the value of the skip flag SKIP is 1, that is, when the skip mode is applied to the target CU, the code
  • the PT information PTI in the unit information CU is omitted. Note that the skip flag SKIP is omitted for the I slice.
  • the CU prediction type information Pred_type includes CU prediction method information PredMode and PU partition type information PartMode.
  • the CU prediction method information PredMode specifies whether to use intra prediction (intra CU) or inter prediction (inter CU) as a predicted image generation method for each PU included in the target CU.
  • intra prediction intra CU
  • inter CU inter prediction
  • the types of skip, intra prediction, and inter prediction in the target CU are referred to as a CU prediction mode.
  • the PU partition type information PartMode specifies a PU partition type that is a pattern of partitioning the target coding unit (CU) into each PU.
  • PU partition type dividing the target coding unit (CU) into each PU according to the PU division type in this way is referred to as PU division.
  • the PU partition type information PartMode may be an index indicating the type of PU partition pattern, and the shape, size, and position of each PU included in the target prediction tree may be It may be specified.
  • selectable PU partition types differ depending on the CU prediction method and the CU size. Furthermore, the PU partition types that can be selected are different in each case of inter prediction and intra prediction. Details of the PU partition type will be described later.
  • the value of the PU partition type information PartMode is specified by an index (cu_split_pred_part_mode) that specifies a combination of a tree block partition (partition), a prediction method, and a CU split (split) method. It may be.
  • the PT information PTI is information related to the PT included in the target CU.
  • the PT information PTI is a set of information on each of one or more PUs included in the PT.
  • the PT information PTI is referred to when the moving image decoding apparatus 1 generates a predicted image.
  • the PT information PTI includes PU information PUI1 to PUINP (NP is the total number of PUs included in the target PT) including prediction information in each PU.
  • the prediction information PUI includes intra prediction information or inter prediction information depending on which prediction method the prediction type information Pred_mode specifies.
  • a PU to which intra prediction is applied is also referred to as an intra PU
  • a PU to which inter prediction is applied is also referred to as an inter PU.
  • the inter prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an inter prediction image by inter prediction.
  • inter prediction parameters examples include a merge flag (merge_flag), a merge index (merge_idx), an estimated motion vector index (mvp_idx), a reference image index (ref_idx), an inter prediction flag (inter_pred_flag), and a motion vector residual (mvd). Is mentioned.
  • the intra prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an intra predicted image by intra prediction.
  • Examples of intra prediction parameters include an estimated prediction mode flag, an estimated prediction mode index, and a residual prediction mode index.
  • a PCM mode flag indicating whether to use the PCM mode may be encoded.
  • the prediction process (intra), the conversion process, and the entropy encoding process are omitted.
  • the TT information TTI is information regarding the TT included in the CU.
  • the TT information TTI is a set of information regarding each of one or a plurality of TUs included in the TT, and is referred to when the moving image decoding apparatus 1 decodes residual data.
  • a TU may be referred to as a block.
  • the TT information TTI includes TT division information SP_TU that designates a division pattern of the target CU into each transform block, and TU information TUI1 to TUINT (NT is included in the target CU). The total number of blocks).
  • TT division information SP_TU is information for determining the shape and size of each TU included in the target CU and the position in the target CU.
  • the TT division information SP_TU can be realized from information (split_transform_flag) indicating whether or not the target node is to be divided and information (trafoDepth) indicating the depth of the division.
  • each TU obtained by the division can take a size from 32 ⁇ 32 pixels to 4 ⁇ 4 pixels.
  • TU information TUI1 to TUINT are individual information regarding one or more TUs included in the TT.
  • the TU information TUI includes a quantized prediction residual.
  • Each quantized prediction residual is encoded data generated by the video encoding device 2 performing the following processes 1 to 3 on a target block that is a processing target block.
  • Process 1 DCT transform (Discrete Cosine Transform) of the prediction residual obtained by subtracting the prediction image from the encoding target image;
  • Process 2 Quantize the transform coefficient obtained in Process 1;
  • Process 3 Variable length coding is performed on the transform coefficient quantized in Process 2;
  • an area obtained by dividing the target CU is also referred to as a partition.
  • FIG. 4 specifically show the positions of the boundaries of PU division in the CU for each division type.
  • FIG. 4A shows a 2N ⁇ 2N PU partition type that does not perform CU partitioning.
  • FIG. 4 show the partition shapes when the PU partition types are 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD, respectively. ing.
  • partitions when the PU partition type is 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD are collectively referred to as a horizontally long partition.
  • FIG. 4 show the shapes of partitions when the PU partition types are N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N, respectively.
  • partitions when the PU partition type is N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N are collectively referred to as a vertically long partition.
  • the horizontally long partition and the vertically long partition are collectively referred to as a rectangular partition.
  • FIG. 4 shows the shape of the partition when the PU partition type is N ⁇ N.
  • the PU partition types shown in FIGS. 4A and 4H are also referred to as square partitioning based on the shape of the partition.
  • the PU partition types shown in FIGS. 4B to 4G are also referred to as non-square partitions.
  • the numbers given to the respective regions indicate the identification numbers of the regions, and the processing is performed on the regions in the order of the identification numbers. That is, the identification number represents the scan order of the area.
  • the upper left is the reference point (origin) of the CU.
  • Partition type for inter prediction In the inter PU, seven types other than N ⁇ N ((h) in FIG. 4) are defined among the above eight division types.
  • the four asymmetric partitions may be called AMP (Asymmetric Motion Partition).
  • a 128 ⁇ 128 pixel inter-CU includes 128 ⁇ 128 pixels, 128 ⁇ 64 pixels, 64 ⁇ 128 pixels, 64 ⁇ 64 pixels, 128 ⁇ 32 pixels, 128 ⁇ 96 pixels, 32 ⁇ 128 pixels, and 96 ⁇ It is possible to divide into 128-pixel inter PUs.
  • Partition type for intra prediction In the intra PU, the following two types of division patterns are defined. That is, there are a division pattern 2N ⁇ 2N in which the target CU is not divided, that is, the target CU itself is handled as one PU, and a pattern N ⁇ N in which the target CU is symmetrically divided into four PUs.
  • the division patterns (a) and (h) can be taken in the example shown in FIG.
  • an 128 ⁇ 128 pixel intra CU can be divided into 128 ⁇ 128 pixel and 64 ⁇ 64 pixel intra PUs.
  • the coding unit information CU may include an intra partition mode (intra_part_mode) for specifying the PU partition type PartMode.
  • intra_part_mode an intra partition mode for specifying the PU partition type PartMode.
  • the TU partition pattern is determined by the CU size, the partition depth (trafoDepth), and the PU partition type of the target PU.
  • TU partition patterns include square quadtree partition and non-square quadtree partition. Specific examples of the TU partition pattern are as shown in FIGS.
  • FIG. 18 shows a division method for dividing a square node into a square or a non-square by quadtree division.
  • FIG. 18 shows a division method in which a square node is divided into quadtrees into squares. Moreover, (b) of the same figure has shown the division
  • FIG. 19 shows a division method for dividing a non-square node into a square or non-square by quadtree division.
  • FIG. 19 shows a division method in which a horizontally long rectangular node is divided into quadrant trees into horizontally long rectangles.
  • (b) of the same figure has shown the division
  • (c) in the figure shows a division method in which a vertically long rectangular node is divided into quadrants into vertically long rectangles.
  • (d) of the figure has shown the division
  • FIG. 20 shows an example of 32 ⁇ 32 CU TU partitioning of PU partition type 2N ⁇ N.
  • depth indicates a division depth (trafoDepth).
  • split indicates the value of split_transform_flag in the depth. If “split” is “1”, TU partitioning is performed for the depth node, and if “0”, TU partitioning is not performed.
  • the video decoding device 1 generates a prediction image for each PU, generates a decoded image # 2 by adding the generated prediction image and a prediction residual decoded from the encoded data # 1, and generates The decoded image # 2 is output to the outside.
  • An encoding parameter is a parameter referred in order to generate a prediction image.
  • the encoding parameters include PU size and shape, block size and shape, and original image and Residual data with the predicted image is included.
  • side information a set of all information excluding the residual data among the information included in the encoding parameter.
  • a picture (frame), a slice, a tree block, a block, and a PU to be decoded are referred to as a target picture, a target slice, a target tree block, a target block, and a target PU, respectively.
  • the size of the tree block is, for example, 64 ⁇ 64 pixels
  • the size of the PU is, for example, 64 ⁇ 64 pixels, 32 ⁇ 32 pixels, 16 ⁇ 16 pixels, 8 ⁇ 8 pixels, 4 ⁇ 4 pixels, or the like.
  • these sizes are merely examples, and the sizes of the tree block and PU may be other than the sizes shown above.
  • FIG. 2 is a functional block diagram showing a schematic configuration of the moving picture decoding apparatus 1.
  • the moving picture decoding apparatus 1 includes a decoding module 10, a CU information decoding unit 11, a PU information decoding unit 12, a TU information decoding unit 13, a predicted image generation unit 14, an inverse quantization / inverse conversion unit 15, A frame memory 16 and an adder 17 are provided.
  • the decoding module 10 performs a decoding process for decoding a syntax value from binary. More specifically, the decoding module 10 decodes a syntax value encoded by an entropy encoding method such as CABAC and CAVLC based on encoded data and a syntax type supplied from a supplier, Returns the decrypted syntax value to the supplier.
  • an entropy encoding method such as CABAC and CAVLC
  • the sources of encoded data and syntax type are the CU information decoding unit 11, the PU information decoding unit 12, and the TU information decoding unit 13.
  • the decoding module 10 refers to the association between the bit string related to “split_coding_unit_flag” and the syntax value, derives the syntax value from the binary, and sends the derived syntax value to the CU information decoding unit 11. return.
  • the CU information decoding unit 11 uses the decoding module 10 to perform decoding processing at the tree block and CU level on the encoded data # 1 for one frame input from the moving image encoding device 2. Specifically, the CU information decoding unit 11 decodes the encoded data # 1 according to the following procedure.
  • the CU information decoding unit 11 refers to various headers included in the encoded data # 1, and sequentially separates the encoded data # 1 into slices and tree blocks.
  • the various headers include (1) information about the method of dividing the target picture into slices, and (2) information about the size, shape, and position of the tree block belonging to the target slice. .
  • the CU information decoding unit 11 divides the target tree block into CUs with reference to the tree block division information SP_TBLK included in the tree block header TBLKH.
  • the CU information decoding unit 11 acquires coding unit information (hereinafter referred to as CU information) corresponding to the CU obtained by the division.
  • the CU information decoding unit 11 performs the decoding process of the CU information corresponding to the target CU, with each CU included in the tree block as the target CU in order.
  • the CU information decoding unit 11 demultiplexes the TT information TTI related to the conversion tree obtained for the target CU and the PT information PTI related to the prediction tree obtained for the target CU.
  • the TT information TTI includes the TU information TUI corresponding to the TU included in the conversion tree as described above. Further, as described above, the PT information PTI includes the PU information PUI corresponding to the PU included in the target prediction tree.
  • the CU information decoding unit 11 supplies the PT information PTI obtained for the target CU to the PU information decoding unit 12. Further, the CU information decoding unit 11 supplies the TT information TTI obtained for the target CU to the TU information decoding unit 13.
  • the PU information decoding unit 12 uses the decoding module 10 to perform decoding processing at the PU level for the PT information PTI supplied from the CU information decoding unit 11. Specifically, the PU information decoding unit 12 decodes the PT information PTI by the following procedure.
  • the PU information decoding unit 12 refers to the PU partition type information Part_type, and determines the PU partition type in the target prediction tree. Subsequently, the PU information decoding unit 12 performs a decoding process of PU information corresponding to the target PU, with each PU included in the target prediction tree as a target PU in order.
  • the PU information decoding unit 12 performs a decoding process on each parameter used for generating a predicted image from PU information corresponding to the target PU.
  • the PU information decoding unit 12 supplies the PU information decoded for the target PU to the predicted image generation unit 14.
  • the TU information decoding unit 13 uses the decoding module 10 to perform decoding processing at the TU level for the TT information TTI supplied from the CU information decoding unit 11. Specifically, the TU information decoding unit 13 decodes the TT information TTI by the following procedure.
  • the TU information decoding unit 13 refers to the TT division information SP_TU and divides the target conversion tree into nodes or TUs. Note that the TU information decoding unit 13 recursively performs TU division processing if it is specified that further division is performed for the target node.
  • the TU information decoding unit 13 executes the decoding process of the TU information corresponding to the target TU, with each TU included in the target prediction tree as the target TU in order.
  • the TU information decoding unit 13 performs a decoding process on each parameter used for restoring the transform coefficient from the TU information corresponding to the target TU.
  • the TU information decoding unit 13 supplies the TU information decoded for the target TU to the inverse quantization / inverse transform unit 15.
  • the predicted image generation unit 14 generates a predicted image based on the PT information PTI for each PU included in the target CU. Specifically, the prediction image generation unit 14 performs intra prediction or inter prediction for each target PU included in the target prediction tree according to the parameters included in the PU information PUI corresponding to the target PU, thereby generating a decoded image. A predicted image Pred is generated from a certain local decoded image P ′. The predicted image generation unit 14 supplies the generated predicted image Pred to the adder 17.
  • a method in which the predicted image generation unit 14 generates a predicted image of a PU included in the target CU based on motion compensation prediction parameters is as follows.
  • the predicted image generation unit 14 When the inter prediction flag indicates single prediction, the predicted image generation unit 14 generates a predicted image corresponding to the decoded image located at the location indicated by the motion vector of the reference image indicated by the reference image index.
  • the predicted image generation unit 14 when the inter prediction flag indicates bi-prediction, the predicted image generation unit 14 generates a predicted image by motion compensation for each of the two sets of reference image indexes and motion vectors, and calculates an average.
  • the final predicted image is generated by weighting and adding each predicted image based on the display time interval between the target picture and each reference image.
  • the inverse quantization / inverse transform unit 15 performs an inverse quantization / inverse transform process on each TU included in the target CU based on the TT information TTI. Specifically, the inverse quantization / inverse transform unit 15 performs inverse quantization and inverse orthogonal transform on the quantization prediction residual included in the TU information TUI corresponding to the target TU for each target TU included in the target conversion tree. By doing so, the prediction residual D for each pixel is restored.
  • the orthogonal transform refers to an orthogonal transform from the pixel region to the frequency region. Therefore, the inverse orthogonal transform is a transform from the frequency domain to the pixel domain.
  • inverse orthogonal transform examples include inverse DCT transform (Inverse Discrete Cosine Transform), inverse DST transform (Inverse Discrete Sine Transform), and the like.
  • the inverse quantization / inverse transform unit 15 supplies the restored prediction residual D to the adder 17.
  • Decoded decoded images P are sequentially recorded in the frame memory 16 together with parameters used for decoding the decoded images P.
  • the frame memory 16 at the time of decoding the target tree block, decoded images corresponding to all tree blocks decoded before the target tree block (for example, all tree blocks preceding in the raster scan order) are stored. It is recorded. Examples of the decoding parameters recorded in the frame memory 16 include CU prediction method information PredMode.
  • the adder 17 adds the predicted image Pred supplied from the predicted image generation unit 14 and the prediction residual D supplied from the inverse quantization / inverse transform unit 15 to thereby obtain the decoded image P for the target CU. Generate.
  • Decoded image # 2 corresponding to # 1 is output to the outside.
  • FIG. 1 is a functional block diagram illustrating a configuration for decoding CU prediction information, that is, a configuration of a CU information decoding unit 11 and a decoding module 10 in the moving image decoding apparatus 1.
  • each unit will be described in the order of the CU information decoding unit 11 and the decoding module 10.
  • the CU information decoding unit 11 includes a CU prediction mode determination unit 111, a PU size determination unit 112, and a PU size table 113.
  • the CU prediction mode determination unit 111 supplies the encoded data and syntax type of the CU prediction mode and the encoded data and syntax type of the PU partition type to the decoding module 10. Further, the CU prediction mode determination unit 111 acquires the decoded CU prediction mode syntax value and the PU partition type syntax value from the decoding module 10.
  • the CU prediction mode determination unit 111 determines the CU prediction mode and the PU partition type as follows.
  • the CU prediction mode determination unit 111 decodes the skip flag SKIP by the decoding module 10 and determines whether or not the target CU is a skip CU.
  • the decoding module 10 decodes the CU prediction type information Pred_type. Moreover, while determining whether object CU is intra CU or inter CU based on CU prediction method information PredMode included in CU prediction type information Pred_type, PU partition type is determined based on PU partition type information PartMode.
  • the PU size determination unit 112 refers to the PU size table 113 and determines the number and size of PUs from the size of the target CU and the CU prediction type and PU partition type determined by the CU prediction mode determination unit 111. .
  • the PU size table 113 is a table that associates the number and size of PUs with a combination of a CU size and a CU prediction type-PU partition type.
  • the number and size of PUs are defined according to the CU size and the PU partition type (intra CU and inter CU). Note that “d” in the table indicates the division depth of the CU.
  • the number and size of PUs in each PU partition type are defined for the size of the CU.
  • the PU partition type of the skip CU is estimated to be 2N ⁇ 2N. Further, in the table, a portion indicated by “ ⁇ ” indicates that the PU partition type cannot be selected.
  • an N ⁇ N PU partition type can be selected only when the CU size is 8 ⁇ 8.
  • the decoding module 10 includes a CU prediction mode decoding unit (decoding unit, changing unit) 1011, a binarized information storage unit 1012, a context storage unit 1013, and a probability setting storage unit 1014.
  • the CU prediction mode decoding unit 1011 decodes the syntax value from the binary included in the encoded data according to the encoded data and the syntax type supplied from the CU prediction mode determination unit 111. Specifically, the CU prediction mode decoding unit 1011 performs CU prediction mode and PU partition type decoding processing according to the binarization information stored in the binarization information storage unit 1012. The CU prediction mode decoding unit 1011 performs a skip flag decoding process.
  • the binarization information storage unit 1012 stores binarization information for the CU prediction mode decoding unit 1011 to decode a syntax value from binary.
  • the binarization information is information indicating a correspondence between a binary (bin sequence) and a syntax value.
  • the context storage unit 1013 stores a context that the CU prediction mode decoding unit 1011 refers to in the decoding process.
  • the probability setting storage unit 1014 stores a probability setting value that is referenced when the CU prediction mode decoding unit 1011 decodes a bin sequence from the encoded data by arithmetic decoding processing.
  • the probability setting value includes a recording setting value corresponding to each context and a default probability setting value.
  • the probability setting value corresponding to each context is updated based on the result of arithmetic decoding.
  • the predetermined probability setting value is constant and is not updated by the result of arithmetic decoding. Note that the probability setting value may be expressed not in the probability value itself but in a state indicated by an integer value corresponding to the probability value.
  • [Specific configuration example] [1-1] Example of Configuration that Limits Reference of Context
  • the CU prediction mode decoding unit 1011 does not use information indicating the partition type of the asymmetric partition without using the CABAC context.
  • Decryption processing may be performed.
  • the probability setting value recorded for each context in the probability setting storage unit 1014 is not used.
  • Decoding processing may be performed using a probability setting value (for example, a probability setting value in which occurrence probabilities of 0 and 1 correspond to equal probabilities).
  • the CU prediction mode decoding unit 1011 decodes information indicating the type of asymmetric partition division assuming a specified probability.
  • FIG. 7 a more specific example of this configuration example is as follows.
  • the prefix portion indicates whether the division direction is horizontal (horizontal) or vertical (vertical), and the suffix portion indicates the type of division. Show.
  • the suffix part selects one of the three horizontally long partitions of 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD. Indicates.
  • the CU prediction mode decoding unit 1011 sets the probability setting storage unit 1014 instead of the probability setting value recorded for each context set in the probability setting storage unit 1014.
  • the probability setting value can be set assuming an equal probability, for example.
  • CABAC arithmetic decoding using context is a method of recording / updating the occurrence probability of binary value (indicating state) in accordance with the binary position (context), and performing arithmetic based on the occurrence probability (state). This refers to the process of decoding.
  • CABAC arithmetic decoding without using context refers to performing arithmetic decoding based on a fixed probability determined by a probability setting value without updating the occurrence probability (state) of a binary value.
  • the context is not used, the processing load is reduced and the throughput is improved because the occurrence probability (state) is not updated in the encoding process and the decoding process.
  • EP coding equal probability, Equal-Probability coding
  • Bypass bypass
  • 2N ⁇ N, 2N ⁇ nU, or 2N ⁇ nD is continuous in a situation where horizontal division is selected. Is selected. For example, 2N ⁇ N is selected in the prediction unit next to the prediction unit in which 2N ⁇ N is selected.
  • the partition is often set so as not to cross the edge boundary as shown in FIG.
  • the edge E1 exists near the center in the vertical direction of the region, and in CU20, the edge E1 exists above the region.
  • the CU 10 is divided into PU11 and PU12 that are symmetrical by the 2N ⁇ N PU partition type so as not to cross the edge E1.
  • the CU 20 is divided into asymmetric PU 21 and PU 22 by a 2N ⁇ nU division type so as not to cross the edge E1.
  • 2N ⁇ N, 2N ⁇ nU, or 2N ⁇ nD is not applicable when selected continuously. In such a case, the encoding efficiency may not be reduced without using a context.
  • decoding the above information assuming a prescribed probability for the prefix part can simplify the decoding process of pred_type while maintaining the encoding efficiency.
  • the image decoding apparatus is the image decoding apparatus that generates a prediction image and restores an image for each prediction unit obtained by dividing the coding unit into one or more numbers.
  • the division type into a rectangle includes a division into rectangular prediction units, and includes a code indicating whether the rectangle is vertically long or horizontally long, and a code indicating the type of the rectangle.
  • the code indicating the type of the rectangle is provided with decoding means for decoding without using the context.
  • the above example is a PU partition type set corresponding to PU partition including a plurality of rectangular partitions, and any PU partition in a PU partition type set including both symmetric partition and asymmetric partition types.
  • decoding information for selecting a type it may be expressed that decoding may be performed without using a context.
  • the context may be used for some bins instead of using the context for decoding all bins in the bin sequence corresponding to the information related to the selection of the asymmetric partition.
  • a division including a rectangular partition is selected with a CU larger than 8 ⁇ 8
  • a bin of up to two digits is decoded.
  • the first digit is information indicating symmetric division or asymmetric division.
  • the second digit is a bin that is decoded when the first digit indicates “0”, that is, an asymmetric division, and represents the positional relationship between a small PU and a large PU in the asymmetric division.
  • the small PU is locally on one side (for example, the second digit represents 2N ⁇ nU and 2N ⁇ nD selection information) , It is preferable to set a context.
  • the CU prediction mode decoding unit 1011 refers to the binarization information stored in the binarization information storage unit 1012 as described below. You may comprise so that prediction type information may be decoded.
  • FIG. 7 is a table showing an example of binarization information that defines associations between combinations of CU prediction types and PU partition types and bin sequences.
  • the binarization information is shown in a table format that associates a bin column with a CU prediction type-PU partition type, but is not limited thereto.
  • the binarization information may be a derivation formula for deriving the PU partition type and the CU prediction type. The same applies to binarization information described later.
  • the binarized information does not have to be stored as data, and may be realized as a program logic for performing a decoding process.
  • bin columns are associated according to the CU prediction type, the PU partition type, and the CU size.
  • the definition of the CU size will be described.
  • Two types of associations of 8 ⁇ 8 CU 1012A are defined.
  • bin sequence associated with each of the non-8 ⁇ 8 CU 1012B and the 8 ⁇ 8 CU 1012A includes a prefix part (prefix) and a suffix part (suffix).
  • association table BT1 for the definition of each CU size, two systems of the above-described intra CU (shown as “Intra”) and inter CU (shown as “Inter”) are defined as CU prediction types. . Furthermore, PU partition types are defined according to each CU prediction type.
  • 2N ⁇ 2N is described as follows.
  • the prefix part is “000” and the suffix part is “0”.
  • N ⁇ N is defined only in non-8 ⁇ 8CU1012B.
  • the prefix part is “000” and the suffix part is “1”.
  • the suffix part is “000”.
  • a common prefix part “01” is assigned to the PU partition type 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD of the horizontally long partition that performs horizontal partitioning.
  • suffix portions of 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD are “1”, “00”, and “01”, respectively.
  • a common prefix part “001” is assigned to the PU partition types of vertical partitions that perform vertical partitioning, N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N.
  • N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N are “1”, “00”, and “01”, respectively.
  • the suffix portion is the same as in the case of the PU partition type that performs the horizontal partition described above.
  • the suffix part represents the type of division. That is, in the case of symmetrical division, bin is “1”. “00” indicates that the boundary of the division is closer to the origin than in the case of symmetric division, and “01” indicates that the boundary of the division is further from the origin than in the case of symmetric division. Yes.
  • the prefix portion is defined for 2N ⁇ 2N, 2N ⁇ N, and N ⁇ 2N.
  • the prefix portions of 2N ⁇ 2N, 2N ⁇ N, and N ⁇ 2N are “1”, “01”, and “001”, respectively.
  • the CU prediction mode decoding unit 1011 may use different contexts for the respective bin positions of the prefix part and the suffix part in the decoding process according to the above binarization information.
  • the number of contexts is three.
  • the suffix part is one for 2N ⁇ 2N and N ⁇ N.
  • a horizontally long partition (2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD)
  • a vertically long partition N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N
  • the CU prediction mode decoding unit 1011 may be configured to decode a short code for intra CU in a small size CU.
  • the small size CU is a CU having a size equal to or smaller than a predetermined size. In the following, it is assumed to be an 8 ⁇ 8 size CU.
  • the binarization information stored in the binarization information storage unit 1012 may be configured as shown in FIG.
  • FIG. 8 shows another configuration example of 8 ⁇ 8 CU 1012A which is the definition of binarization information. That is, 8 ⁇ 8 CU 1012A_1 illustrated in FIG. 8 is another configuration example of 8 ⁇ 8 CU 1012A included in association table BT1 illustrated in FIG.
  • a short code is assigned to the intra CU in the 8 ⁇ 8 size CU that is a small size CU.
  • the large size CU is a CU that is not a small size CU, and specifically means a CU having a size larger than 8 ⁇ 8.
  • the code assigned to the intra CU is shorter than the code assigned to the inter CU.
  • a shorter code is assigned to an intra CU than other PU partition types that are not intra CUs.
  • a 1-bit code is assigned to the intra CU, and a 2-bit or 3-bit code is assigned to the inter CU.
  • intra prediction with a small CU tends to be used. Therefore, in a small CU, the usage rate of an intra CU is high.
  • a long code is assigned to the intra CU.
  • a short code is assigned to a small size intra CU.
  • the CU prediction mode decoding unit 1011 decodes a short code for a small size intra CU. Thereby, there exists an effect that encoding efficiency improves.
  • the CU prediction mode decoding unit 1011 sets different contexts for the prefix portion of the large CU and the prefix portion of the small CU.
  • an 8 ⁇ 8 CU prefix 1013A that is a context for decoding a prefix portion of a large CU and a non-8 ⁇ 8 CU prefix 1013B that is a context for decoding a prefix portion of a small CU May be stored.
  • the 8 ⁇ 8 CU prefix 1013A and the non-8 ⁇ 8 CU prefix 1013B have different contexts.
  • the first bit of the prefix portion is information indicating whether the CU prediction type is an intra CU or an inter CU in a small size CU, whereas 2N ⁇ 2N in a large size CU. This is information indicating whether it is an inter CU or other inter CU.
  • bins with different meanings have different appearance tendencies. For this reason, when the same context is set in both the large-size CU and the small-size CU, the appearance tendency of bins is different, which may reduce the coding efficiency.
  • FIG. 9 shows another configuration example of 8 ⁇ 8 CU 1012A which is the definition of binarization information. That is, 8 ⁇ 8 CU 1012A_2 illustrated in FIG. 9 is another configuration example of 8 ⁇ 8 CU 1012A included in association table BT1 illustrated in FIG.
  • the bin string is composed of three parts: a flag, a prefix part, and a suffix part.
  • the flag In the case of an intra CU, the flag is “1”, and in the case of an inter CU, the flag is “0”.
  • the suffix part is defined. That is, when the PU partition type is 2N ⁇ 2N, the suffix part is “0”, and when it is N ⁇ N, the suffix part is “1”.
  • a code shorter than the code allocated to the intra CU is allocated to the intra CU in the large size CU.
  • the assigned code is shorter than the code assigned to the inter CU.
  • the CU prediction mode decoding unit 1011 decodes a short code for a small size intra CU in a region where inter prediction is difficult to hit. Thereby, there exists an effect that encoding efficiency improves.
  • the prefix part it is preferable to set the same context between the small CU and the large CU.
  • the context storage unit 1013 may store one context in which the 8 ⁇ 8 CU prefix 1013A and the non-8 ⁇ 8 CU prefix 1013B are integrated.
  • each bin is designed to have the same meaning between the prefix portion of the small CU and the prefix portion of the large CU. For this reason, by setting the same context between the two, it is possible to improve the encoding efficiency of bin.
  • an image decoding apparatus provides, for each coding unit, an image decoding apparatus that restores an image by decoding information for restoring an image from image encoded data, For codes assigned to a combination with a prediction method applied to a coding unit, a combination other than the combination is applied to a combination in which a prediction method for intra prediction is applied to a coding unit having a size equal to or smaller than a predetermined size. It is the structure provided with the decoding means which decodes a code shorter than the code allocated to.
  • the CU prediction mode decoding unit 1011 changes the interpretation of a bin sequence with reference to a prediction parameter assigned to an adjacent region. It may be configured.
  • the binarization information stored in the binarization information storage unit 1012 may be configured as shown in FIG.
  • FIG. 10 is a diagram showing still another configuration example of the binarization information stored in the binarization information storage unit 1012.
  • the value of the prediction parameter of the adjacent region is obtained by replacing the 8 ⁇ 8 CU 1012A shown in FIG. 7 with the definition of the inter CU (1012D) and the definition of the intra CU (1012C). Depending on the case, the interpretation of the bin sequence is changed.
  • the inter CU 1012D that is the definition of binarization information when at least one of the adjacent CUs is an inter CU, and the adjacent CU are both intra CUs.
  • the interpretation of the bin sequence is changed with the intra CU 1012C which is the definition of the binarization information.
  • Inter CU 1012D (when at least one of adjacent CUs is an inter CU) interprets that the target CU is an intra CU (2N ⁇ 2N or N ⁇ N) and the prefix portion when the bin string of the prefix portion is “000”. When the bin string of “1” is “1”, it is interpreted that the target CU is 2N ⁇ 2N of the inter CU.
  • the target CU 1012C when both adjacent CUs are intra CUs, when the bin string of the prefix part is “1”, the target CU is interpreted as an intra CU (2N ⁇ 2N or N ⁇ N), and the prefix When the bin string of the part is “000”, it is interpreted that the target CU is 2N ⁇ 2N of the inter CU.
  • the code amount can be reduced by assigning a short code to the intra CU.
  • the frequency of intra CU generation is high. For this reason, in a small size CU, by assigning a short code to an intra CU, the encoding efficiency can be further improved.
  • a CU that is not a small-sized CU does not have a configuration of “assigning a short code to an intra CU when both adjacent CUs are intra” as shown in FIG. It doesn't matter. It can be determined according to the frequency of occurrence of intra CUs, in which size CU, a configuration in which “a short code is assigned to an intra CU when adjacent CUs are both intra” is applied. In general, the smaller the CU, the higher the intra CU selection rate tends to be. Therefore, a code shorter than the intra CU with a CU of a predetermined size (for example, 16 ⁇ 16) or less including the minimum size CU. Is preferably assigned.
  • a predetermined size for example, 16 ⁇ 16
  • the CU prediction mode decoding unit 1011 refers to the intra CU 1012C and assigns a short code to the intra CU.
  • the CU prediction mode decoding unit 1011 refers to the inter CU 1012D and assigns a short code to the inter CU.
  • the binarization information stored in the binarization information storage unit 1012 may be configured.
  • FIG. 11 is a diagram showing still another configuration example of the binarization information stored in the binarization information storage unit 1012.
  • the non-8 ⁇ 8 CU 1012B shown in FIG. 7 is defined as “upper CU size is larger than or equal to target CU” (1012B_1) and “upper CU size is smaller than the target CU. ] (1012B_2), the interpretation of the bin sequence is changed in accordance with the value of the prediction parameter of the adjacent region.
  • the bin string is interpreted between the case where the upper adjacent CU is larger than the target CU and the case where the upper adjacent CU is smaller than the target size. It is configured to change.
  • the size of the upper CU is equal to or larger than the target CU” 1012B_1 (when the upper adjacent CU is larger than the target CU), when the bin column of the prefix part is “001”, the target CU is interpreted as a vertically long partition. When the bin string in the prefix part is “01”, it is interpreted that the target CU is a horizontally long partition.
  • the target CU is a vertically long partition.
  • the bin string in the prefix part is “001”
  • the target CU is interpreted as a horizontally long partition.
  • the CU prediction mode decoding unit 1011 refers to “the size of the upper CU is smaller than the target CU” 1012B_2 and assigns a short code to the vertically long partition .
  • the CU prediction mode decoding unit 1011 refers to “the size of the upper CU is equal to or larger than the target CU” 1012B_1 and assigns a short code to the horizontally long partition. As a result, it is possible to reduce the code amount and improve the encoding efficiency.
  • the interpretation of the suffix part is the same without depending on the interpretation of the prefix part based on the adjacent CU.
  • the prefix part is independent of whether it is a vertically long partition or a horizontally long partition, and the interpretation of the same suffix part is the same.
  • the decoding process of the suffix part may not be changed depending on whether the prefix part is a vertically long partition or a horizontally long partition.
  • association table BT30 is configured such that the PU partition type (number of partitions) does not depend on the parameter to be referred to.
  • the suffix part can be decoded regardless of the size of the adjacent CU, the error resistance is improved without being influenced by the error of the adjacent parameter.
  • the decoding process can be simplified by omitting the interpretation switching process.
  • the size of the upper adjacent CU is smaller than the size of the target CU, there is a CU boundary in a positional relationship perpendicular to the upper side on the upper side (excluding the vertex) of the target CU.
  • a short code may be assigned to the vertically long partition.
  • the adjacent CU adjacent to the target CU has been described, but the present invention is not limited thereto. The same can be said for CUs located in the vicinity to such an extent that spatial correlation is recognized.
  • the above configuration can be generalized as follows. That is, the above configuration determines the priority order of the occurrence of pred_type according to the adjacent prediction parameter for a plurality of binary strings and a plurality of corresponding pred_types having the same number of divisions, and pred_type having a higher priority order. It is associated with a short binary string.
  • condition that the size of the upper adjacent CU is smaller than the size of the target CU can also be expressed as follows.
  • a CU including (xc, yc-1) is derived as the upper adjacent CU, and the upper left pixel of the upper adjacent CU is (xu, yu).
  • log2CUSize [xu] [yu] ⁇ log2CUSize [xc] [yc] it is determined that the size of the upper adjacent CU is smaller than the size of the target CU.
  • log2CUSize [x] [y] is a logarithmic value with 2 as the base of the size of the CU having the pixel (x, y) as the upper left pixel.
  • the case of the upper adjacent CU is described. However, even when determining the size of the left adjacent CU, only the size of the CU located to the left of the upper left pixel of the target CU is determined by comparison with the size of the target CU. It is preferable.
  • the above determination procedure (3) an example in which the value of the CU size is directly compared has been described. However, another value associated with the size of the CU may be compared.
  • the above condition (3) uses the value of CU division depth (cuDepth [x] [y]) corresponding to how many times a tree block (LCU) is divided, and “cuDepth [xu] [yu] >> cuDepth [xc] [yc] ”may be used for the determination.
  • an image decoding apparatus is an image decoding apparatus that generates a prediction image and restores an image for each prediction unit obtained by dividing an encoding unit into one or more numbers.
  • a plurality of codes associated with a plurality of combinations of a division type and a prediction scheme that is a type for dividing a target coding unit that is the coding unit into the prediction units It is a structure provided with the change means to change according to the decoded parameter allocated to the decoding prediction unit of the vicinity of the object prediction unit which is.
  • a shorter code can be assigned to a combination of a prediction method and a division type having a higher probability of occurrence according to a decoded parameter assigned to a neighboring decoded prediction unit, thereby improving coding efficiency. Can be made.
  • FIG. 12 is a functional block diagram illustrating the configuration for decoding motion information, that is, the configurations of the PU information decoding unit 12 and the decoding module 10 in the video decoding device 1.
  • each unit will be described in the order of the PU information decoding unit 12 and the decoding module 10.
  • the PU information decoding unit 12 includes a motion compensation parameter derivation unit (bi-prediction restriction unit, candidate determination unit, estimation unit) 121, a merge candidate priority order information storage unit 122, and a reference frame setting information storage unit. 123.
  • the motion compensation parameter deriving unit 121 derives the motion compensation parameter of each PU included in the target CU from the encoded data.
  • the motion compensation parameter deriving unit 121 derives a motion compensation parameter in the following procedure.
  • a skip index may be decoded instead of the merge index, and a prediction parameter in the skip CU may be derived based on the value.
  • the motion compensation parameter derivation unit 121 determines a skip flag. As a result, if the target CU is a non-skip CU, the motion information decoding unit 1021 is used to decode the merge flag.
  • the motion compensation parameter deriving unit 121 decodes the merge index, and based on the decoded merge index value, predictive parameters (motion vector, reference image index, Inter prediction flag) is derived.
  • the motion compensation parameter deriving unit 121 determines a merge candidate specified by the merge index according to the merge candidate information stored in the merge candidate priority information storage unit 122.
  • the motion compensation parameter derivation unit 121 decodes a prediction parameter (inter prediction flag, reference image index, motion vector difference, estimated motion vector index).
  • the motion compensation parameter deriving unit 121 derives an estimated motion vector based on the value of the estimated motion vector index, and derives a motion vector based on the motion vector difference and the estimated motion vector.
  • the merge candidate priority information storage unit 122 stores merge candidate information including information indicating which region is a merge candidate and information indicating the priority of the merge candidate.
  • the reference frame setting information storage unit 123 is used to determine which inter prediction prediction method to use, that is, single prediction referring to one reference image and bi-prediction referring to two reference images. Reference frame setting information is stored.
  • the decoding module 10 includes a motion information decoding unit 1021.
  • the motion information decoding unit 1021 decodes the syntax value from the binary included in the encoded data according to the encoded data and syntax type supplied from the motion compensation parameter deriving unit 121.
  • the motion compensation parameters decoded by the motion information decoding unit 1021 are a merge flag (merge_flag), a merge index (merge_idx), an estimated motion vector index (mvp_idx), a reference image index (ref_idx), an inter prediction flag (inter_pred_flag), and a motion vector difference. (Mvd).
  • the motion compensation parameter deriving unit 121 may be configured such that when the PU partition type is asymmetric, the priority order of the merge candidates is determined by a method different from that when the PU partition type is symmetric.
  • FIG. 13 shows a CU for which an asymmetric partition has been selected.
  • an edge E1 having an inclination exists in the region, and a 2N ⁇ nU PU partition type is selected.
  • the target CU includes PU31 and PU32.
  • the target PU is PU31.
  • An edge E1 having an inclination crosses the region of the target PU 31.
  • a motion vector assigned to the short side region is referred to, and in a large partition, a motion vector assigned to a region around the small partition.
  • the accuracy of the motion vector can be improved by referring to.
  • the merge candidate priority information stored in the merge candidate priority information storage unit 122 is configured to include two merge candidate priority information of a symmetric PU partition type 122A and an asymmetric PU partition type 122B.
  • the merge candidate priority information of the symmetric PU partition type 122A will be described with reference to FIG.
  • FIG. 14 shows a CU in which a symmetric partition is selected.
  • a 2N ⁇ N PU partition type is selected in the symmetric CU.
  • the target PU is indicated by “Curr PU”.
  • priorities are assigned in the order of left (L), top (U), top right (UR), bottom left (BL), top left (UL) as merge candidates.
  • the merge candidate priority information of the asymmetric PU partition type 122B will be described with reference to FIG. (A) and (b) of FIG. 15 show the setting of the priority in the smaller partition of 2N ⁇ nU and the larger partition of 2N ⁇ nU, respectively.
  • FIGS. 15C and 15D show setting of the priority order in the larger partition of 2N ⁇ nD and the smaller partition of 2N ⁇ nD, respectively.
  • the short side is adjacent (L)
  • the apex is adjacent (UR, BL, UL)
  • Priority is assigned to the long side in the order of adjacent (U).
  • a priority is assigned.
  • a small merge index is assigned to a candidate with high priority, and a short code is assigned to the small merge index. Moreover, it is good also as a merge candidate which can select only a high priority candidate.
  • prediction parameter derivation in the merge PU has been described.
  • a similar derivation method may be used for derivation of an estimated motion vector used for restoring a motion vector in a non-merged PU in an inter CU.
  • the above method can be applied when deriving an estimated value or predicted value of a motion parameter corresponding to an adjacent region in each PU in an asymmetric PU.
  • the image decoding apparatus generates an image by restoring a prediction image by using a prediction method for inter-screen prediction for each prediction unit obtained by dividing a coding unit into one or more numbers.
  • the division type into the prediction units includes asymmetric division that divides the coding unit into a plurality of prediction units of different sizes or symmetric division that divides the coding unit into a plurality of prediction units of the same size.
  • the division type is asymmetric division
  • the estimation parameter of the inter-screen prediction is estimated by a preferable estimation method according to the division type. There is an effect that it can be performed.
  • the motion compensation parameter derivation unit 121 depends on a combination of a CU size and whether or not the CU is a CU that performs skip / merge. It may be configured to change merge candidates. Accordingly, the merge candidate information stored in the merge candidate priority information storage unit 122 is configured to include two pieces of definition information of a small PU size 122C and a large PU size 122D.
  • the merge candidate information of the small PU size 122C defines the number of merge candidates applied to the small PU. Further, the merge information of the large PU size 122D defines the number of merge candidates applied to the large PU.
  • the number of merge candidates defined for the small PU size 122C (the number of merge candidates for the small PU) is the number of merge candidates defined for the large PU size 122D (the merge of large PUs). It is defined to be smaller than the number of candidates.
  • the number of merge candidates for small size PUs which often have complicated movements, is reduced compared to the number of merge candidates for large size PUs. it can.
  • the small size PU is a PU having at least one side smaller than a predetermined threshold (for example, 8), and the large size PU is a PU other than that.
  • a predetermined threshold for example, 8
  • the large size PU is a PU other than that.
  • PUs having a size of 16 ⁇ 4, 4 ⁇ 16, 8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4 are small size PUs
  • PUs having a size of 8 ⁇ 8 and 16 ⁇ 16 are large size PUs.
  • the small size PU is a PU whose area is smaller than a predetermined threshold (for example, 64), and the large size PU is any other PU.
  • a PU with a size of 8 ⁇ 4, 4 ⁇ 8, 4 ⁇ 4 is a small size PU
  • a PU with a size of 8 ⁇ 8, 16 ⁇ 4, 4 ⁇ 16, 16 ⁇ 16, etc. is a large size PU.
  • the small size PU is a PU included in a CU having a predetermined size (for example, 8 ⁇ 8) or less
  • the large size PU is a PU included in a larger CU.
  • 8 ⁇ 8, 8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4 size PUs included in the 8 ⁇ 8 CU are small size PUs.
  • a small size PU is a smaller PU in a CU to which asymmetric partitioning is applied
  • a large size PU is a larger PU in a CU to which asymmetric partitioning is applied.
  • the number of merge candidates by temporal prediction is smaller than the number of merge candidates by temporal prediction in a large PU.
  • the correlation between the correlated PU used for temporal prediction and the target PU is small, so the possibility that temporal prediction is selected is low. Therefore, it is preferable to reduce the number of merge candidates based on temporal prediction or not to include merge candidates based on temporal prediction.
  • the present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates an image by restoring a prediction image by using a prediction method for inter-screen prediction for each prediction unit obtained by dividing a coding unit into one or more numbers.
  • the target prediction unit which is the prediction unit to be decoded, is a prediction unit for estimating the prediction parameter of the target prediction unit from the prediction parameters assigned to the region in the vicinity of the target prediction unit. In some cases, it is configured to include candidate determination means for determining a candidate area to be used for estimation according to the size of the target prediction unit.
  • the motion compensation parameter derivation unit 121 may be configured as shown in [2-3-1] to [2-3-4] below. You may determine which prediction system of single prediction and bi-prediction is applied.
  • the motion compensation parameter derivation unit 121 refers to the reference frame setting information stored in the reference frame setting information storage unit 123, and performs single prediction and bi-prediction in inter prediction. You may determine which prediction system of prediction applies.
  • the motion compensation parameter deriving unit 121 may be configured to limit bi-prediction for small PUs. Therefore, the reference frame setting information is configured to include two definition information of the small PU size 123A and the large PU size 123B.
  • the large PU size 123B defines a prediction method that can be selected for a large PU.
  • the large PU size 123B is defined so that both bi-prediction and uni-prediction prediction methods can be selected without limitation for a large PU.
  • the small PU size 123A defines a prediction method that can be selected in a small PU.
  • the small PU size 123A is defined such that bi-prediction is limited in a small size PU.
  • An example of the definition of the small PU size 123A is a PU that is included in an inter CU and that does not apply merging and has a size less than 16 ⁇ 16, and the decoding of the inter prediction flag is omitted and single prediction is applied. Define this.
  • the small PU size 123A it is defined that the single prediction is applied to a PU that is included in the inter CU and to which merge is applied and whose size is less than 16 ⁇ 16.
  • weighted prediction is not applied to PUs included in the inter CU that do not apply merging and have a size of less than 16 ⁇ 16. That is, information regarding weighted prediction is omitted.
  • the PU type includes a PU for which the target CU is skipped (skip PU), a PU for which the target PU is adapted for merging (merge PU), and a PU that is neither skipped nor merged (basic inter PU or non-motion information) (Omitted PU).
  • basic inter PU an inter prediction flag indicating whether it is bi-prediction or uni-prediction is decoded from the encoded data, and a motion compensation parameter is derived.
  • motion compensation parameters are derived without decoding the inter prediction flag.
  • candidates for motion compensation are selected from skip candidates or merge candidates based on the skip index or merge index, and motion compensation parameters in the target PU are derived based on the motion compensation parameters in the selection candidates.
  • the motion compensation parameter derivation method of the skip PU is the same as that of the merge PU.
  • the same method as the basic inter PU may be used except that the motion vector residual (mvd) is not decoded.
  • the bi-prediction restriction operation of the skip PU is the same as that of the basic inter PU.
  • FIG. 35 (a) shows an example of bi-prediction restriction in each PU.
  • bi-prediction restriction is performed only on the basic inter PU, and bi-prediction restriction is performed on all PUs to which motion compensated prediction is applied.
  • the bi-prediction restriction is performed only on the basic inter PU, the bi-prediction restriction is not performed on the skip PU and the merge PU, but the bi-prediction restriction is performed only on the basic inter-PU.
  • bi-prediction restriction is applied only to the basic inter PU or bi-prediction restriction is applied to all PUs, it is possible to reduce the processing amount and the circuit scale in the video encoding device and the video decoding device. .
  • FIG. 35 (b) shows a bi-prediction restriction method for each PU.
  • bi-prediction restriction is performed by deriving information indicating that bi-prediction is not performed in motion compensation parameter derivation based on skip candidates or merge candidates.
  • bi-prediction restriction is performed by converting the value of the inter prediction flag included in the motion compensation parameter from bi-prediction to single prediction.
  • bi-prediction restriction is performed on a basic inter PU, whether or not bi-prediction restriction is applied is determined according to PU size information.
  • the bi-prediction restriction is not applied, the inter prediction flag is decoded.
  • decoding of the inter prediction flag is omitted, and further, a process of estimating the value of the inter prediction flag as single prediction is performed.
  • the PU size information is information for determining whether or not the PU is a small PU, and the size of the target CU and the PU partition type, or the size of the target CU and the number of PU partitions, or the width of the PU.
  • the height or the area of the PU can be used.
  • the skip PU and merge PU and the basic inter PU differ not only in the motion compensation parameter decoding method but also in the scenes used.
  • the skip PU and the merge PU reduce the code amount by limiting selectable motion compensation parameters.
  • Such a PU is mainly used in an area where the motion is uniform. When the motion is uniform, two prediction images are close to each other, and the noise removal effect by bi-prediction is often large. Therefore, compared with the bi-prediction restriction of the basic inter PU, the skip PU and the merge PU are likely to have a lower coding efficiency due to the bi-prediction restriction than the basic inter PU.
  • a restriction that uses bi-prediction only with the basic inter PU as described above, and a method that changes the PU size restricted with the basic inter PU, the skip PU, and the merge PU as described later are also suitable.
  • the bi-prediction restriction in the basic inter PU is more effective because there is a code amount reduction effect by not encoding the inter prediction flag from the viewpoint of the structure of the encoded data.
  • the motion compensation parameters of the PU are expressed by prediction list use flags predFlagL0 and predFlagL1, reference index numbers refIdxL0 and refIdxL1, and motion vectors mvL0 and mvL1.
  • the prediction list use flags predFlagL0 and predFlagL1 indicate whether or not a reference prediction list is used. In the following, 1 is used when using, and 0 when not using.
  • Whether or not bi-prediction is possible can also be expressed by an inter-prediction flag to be described later, and information on whether the number of reference pictures is 1 (uni-prediction) or 2 (bi-prediction) is decoded from encoded data. This is used in some cases.
  • the reference picture of the L0 list is specified by the reference index number refIdxL0, and the motion vector for the reference picture specified by the motion vector mvL0 is specified.
  • the prediction list use flag predFlagL1 is 1
  • the reference picture of the L1 list is specified by the reference index number refIdxL1
  • the motion vector for the reference picture specified by the motion vector mvL1 is specified.
  • the inter prediction flag inter_pred_flag is a binary flag indicating whether it is uni-prediction or bi-prediction, and selects a list of reference images (reference list) to be referred to in uni-prediction from a plurality of reference lists. May contain information.
  • the inter prediction flag may be defined as a ternary flag including a flag for selecting one of two types of reference lists (L0 list and L1 list).
  • L0 list and L1 list two types of reference lists
  • the decoding module 10 decodes the combined list flag ref_pic_list_combination_flag that selects whether to use the L0, L1 list as the reference frame list or the combined list (LC list) from the slice header or the like.
  • the reference frame determination method in the case of single prediction differs depending on the value of the combined list flag.
  • the combined list flag is 1, the combined list LC is used as a reference list used for specifying a single prediction reference frame, and a flag for specifying a reference list in each PU is unnecessary. Therefore, the inter prediction flag inter_pred_flag may be a binary flag.
  • the inter prediction flag inter_pred_flag is a ternary flag.
  • FIG. 32 (a) shows the meaning of the inter prediction flag when it is a binary flag
  • FIG. 32 (b) shows the meaning of the inter prediction flag when it is a ternary flag.
  • FIG. 31 is an example of a PU syntax table in the prior art, and shows a configuration of encoded data when bi-prediction restriction is not performed.
  • FIG. 33 is an example of a PU syntax table, and (a) and (b) each show a part of an inter prediction flag inter_pred_flag in the configuration of encoded data when bi-prediction restriction is performed.
  • (A) of FIG. 33 is an example of a syntax table when the inter prediction flag is always a binary flag.
  • two types of Pred_LC which means single prediction
  • Pred_Bi which means bi-prediction
  • FIG. 33B is an example of a syntax table when the inter prediction flag is a ternary flag.
  • inter_pred_flag distinguishes between Pred_LC, which means uni-prediction using one LC list reference frame, and Pred_Bi, which means bi-prediction.
  • Pred_L1 which means single prediction
  • Pred_L2 which means single prediction of the L1 list
  • Pred_Bi which means bi-prediction.
  • the encoded data includes the first inter prediction flag inter_pred_flag0 to specify uni-prediction and bi-prediction, and bi-prediction is not valid.
  • the encoded data includes a second inter prediction flag inter_pred_flag1 for specifying uni-prediction and bi-prediction for specifying the reference list only when the combined list is not used. More specifically, the case where the combined list is not used is determined by! UsePredRefLC &&! NoBackPredFlag as shown in FIG. That is, a flag UsePredRefLC (indicating that the combined list is to be used when the value of UsePredRefLC is true) and a flag NoBackPredFlag (NoBackPredFlag) indicating whether or not to use backward prediction are used. Indicates that backward prediction is not used when the value is true).
  • FIG. 34 is an example of a syntax table regarding bi-prediction restriction.
  • FIG. 34A shows a case where the sequence parameter set includes a flag disable_bipred_in_small_PU that restricts whether or not bi-prediction restriction is performed.
  • the bi-prediction restriction flag may be encoded independently of a flag disable_inter_4x4 that prohibits a small size PU (here, a 4 ⁇ 4 size PU).
  • FIG. 34B is an example in which a prediction constraint flag use_restricted_prediction is provided as a common flag. In this case, when the prediction constraint flag is true, the application of the small size PU and the bi-prediction in the small size PU are prohibited at the same time.
  • (C) of FIG. 34 is an example which includes disable_bipred_size indicating the size of the PU for which bi-prediction is prohibited in the encoded data.
  • a bi-prediction restriction determination method can be used such as a logarithmic value with a threshold TH of 2 which will be described later. Note that these flags may be encoded with a parameter set other than the sequence parameter set, or may be encoded with a slice header.
  • FIG. 33 is a syntax table in the case of CABAC.
  • FIG. 36 shows a syntax table including the case of CAVLC.
  • the combined_inter_pred_ref_idx in FIG. 36 is a flag obtained by combining the inter prediction flag inter_pred_flag and the reference picture index (ref_idx_l0, ref_idx_lc, ref_idx_l1). As shown in FIG.
  • the encoded data includes combined_inter_pred_ref_idx.
  • the encoded data further includes an inter prediction flag inter_pred_flag.
  • DisableBipred is set to true when the PU size is small.
  • FIG. 37 is a diagram for explaining the combined inter prediction reference index combined_inter_pred_ref_idx.
  • (A), (b), and (c) of FIG. 37 are diagrams for explaining an example of the value of combined_inter_pred_ref_idx.
  • FIG. 37 (d) shows a table TBL37 and pseudo code CODE37 showing a method for deriving the maximum value MaxPredRef of combined_inter_pred_ref_idx.
  • combined_inter_pred_ref_idx is used to encode a combination of an inter prediction flag inter_pred_flag having a high occurrence probability and a reference picture index with short bits.
  • the combined_inter_pred_ref_idx is an index used to select a reference picture managed in a reference list LC (C for LC is an abbreviation of combined) whose elements are combinations of reference pictures with a high probability of occurrence.
  • combinations that are likely to occur from 0 to 7 are assigned.
  • 8 MaxPredRef is assigned.
  • a method of deriving the maximum value MaxPredRef shown in (d) of FIG. 37 will be described later.
  • read_bits (1) is a function that reads a 1-bit binary from the encoded data and returns the value.
  • b read_bits (1)
  • codeNum leadingZeroBits
  • FIGS. 38A and 38B show examples of the conversion variable table EncTable and the inverse conversion variable table DecTable, respectively. As shown in the example of FIG.
  • FIG. 38B shows an inverse conversion variable table DecTable.
  • FIG. 29 shows the configuration of the motion compensation parameter derivation unit 121.
  • the motion compensation parameter derivation unit 121 includes a skip motion compensation parameter derivation unit 1211, a merge motion compensation parameter derivation unit 1212, a basic motion compensation parameter derivation unit 1213, a bi-prediction restricted PU determination unit 1218, and a bi-prediction conversion unit 1219. Is done.
  • the motion compensation parameter deriving unit 121 particularly performs bi-prediction restriction on skip PUs and merge PUs that are PUs when the inter prediction flag is not decoded.
  • the skip motion compensation parameter deriving unit 1211 derives a motion compensation parameter of the skip PU when the target CU is skipped, and inputs the motion compensation parameter to the bi-prediction transform unit 1219.
  • the bi-prediction conversion unit 1219 converts the motion compensation parameter in accordance with the bi-prediction limiting condition, and returns it to the skip motion compensation parameter derivation unit 1211.
  • the bi-prediction limited condition is a condition for determining whether or not bi-prediction restriction is performed, and the determination is performed by the bi-prediction restricted PU determination unit 1218 as described later. Details of a method (bi-prediction conversion method) in which the bi-prediction conversion unit 1219 converts bi-prediction into single prediction will be described later.
  • the skip motion compensation parameter deriving unit 1211 outputs the motion compensation parameter converted according to the bi-prediction restriction condition to the outside as the motion compensation parameter of the target PU.
  • the bi-predictive conversion unit 1219 may perform conversion for each skip candidate, and the converted skip candidate may be selected by the skip index.
  • the skip motion compensation parameter derivation unit 1211 is replaced with the merge motion compensation parameter derivation unit 1212, and the merge candidate is skip candidate. Derived by replacing with.
  • the merge motion compensation parameter deriving unit 1212 derives a motion compensation parameter of the target PU when the target PU is a merge, and inputs the motion compensation parameter of the target PU to the bi-predictive transformation unit 1219.
  • the bi-prediction conversion unit 1219 converts the motion compensation parameter according to the bi-prediction limited condition, and returns it to the merge motion compensation parameter derivation unit 1212.
  • the merge motion compensation parameter derivation unit 1212 outputs the motion compensation parameter converted according to the bi-prediction restriction condition to the outside as the motion compensation parameter of the target PU.
  • the bi-predictive conversion unit 1219 may perform conversion for each merge candidate, and the merge candidate after conversion may be selected by the merge index. .
  • the basic motion compensation parameter deriving unit 1213 derives the motion compensation parameter of the target PU when the target PU is neither skipped nor merged, and outputs it to the outside.
  • the bi-prediction restricted PU determination unit 1218 refers to the PU size information of the target PU, and determines whether to perform bi-prediction restriction that does not use bi-prediction in the target PU. Whether to perform bi-prediction restriction on skip CU and merge PU and whether to perform bi-prediction restriction on basic inter PU may be determined independently. For example, bi-prediction restriction may be performed using the same PU size as a threshold for all PUs, or bi-prediction restriction may be performed using a larger PU size as a threshold for skip PUs and merge PUs. Further, the skip prediction and the merge PU may not perform the bi-prediction restriction, and may perform the bi-prediction restriction only on the basic inter PU.
  • inter prediction flags with skip PUs such as when merging is restricted, whether or not bi-prediction restriction is performed on each of skip PUs, merge PUs, and basic inter PUs is determined independently. It is also possible to determine.
  • the bi-prediction / uni-prediction setting set in the skip motion compensation parameter deriving unit 1211 is determined based on the bi-prediction restricted PU determination unit 1218 in the bi-prediction conversion unit 1219.
  • the configuration may be such that the determination result of the bi-prediction restricted PU determination unit 1218 is directly input to the skip motion compensation parameter derivation unit 1211 and bi-prediction / uni-prediction is set.
  • FIG. 43 is a block diagram showing the configuration of the merge motion compensation parameter derivation unit 1212. When used in the case of a skip PU, the following merge candidates are replaced with skip candidates for operation.
  • the merge motion compensation parameter deriving unit 1212 includes an adjacent merge candidate deriving unit 1212A, a temporal merge candidate deriving unit 1212B, a unique candidate deriving unit 1212C, a combined bi-predictive merge candidate deriving unit 1212D, a non-scale bi-predictive merge candidate deriving unit 1212E, and zero.
  • a vector merge candidate derivation unit 1212F, a merge candidate derivation control unit 1212G, a merge candidate storage unit 1212H, and a merge candidate selection unit 1212J are configured. Although not shown in FIG.
  • the adjacent merge candidate deriving unit 1212A and the temporal merge candidate deriving unit 1212B have decoding parameters of the already decoded CU and PU stored in the frame memory 16, in particular, motion compensation in units of PUs. Parameters are supplied.
  • the unit 1212F is collectively referred to as merge candidate derivation means.
  • the merge candidate derivation control unit 1212G controls each merge candidate derivation unit, derives merge candidates of a predetermined number MRG_MAX_NUM_CANDS, and stores them in the merge candidate storage unit 1212H.
  • the merge candidate includes prediction list use flags predFlagL0 and predFlagL1, which are motion compensation parameters of the PU, reference index numbers refIdxL0 and refIdxL1, and motion vectors mvL0 and mvL1.
  • the merge candidate storage unit 1212H stores the set of motion parameters as a merge candidate.
  • the merge candidates to be stored are managed as a list (merge candidate list) ordered in the order of storage.
  • the merge candidate selection unit 1212J selects a merge candidate specified by the merge index and outputs it as prediction information PUI.
  • the combined bi-predictive merge candidate derivation unit 1212D and the non-scale bi-predictive merge candidate derivation unit 1212E particularly derive bi-predictive merge candidates, and are referred to as bi-predictive merge candidate derivation means.
  • FIG. 44 is a flowchart showing the operation of the merge motion compensation parameter derivation unit 1212.
  • a method in which each merge candidate deriving unit derives merge candidates will be described later with reference to another drawing.
  • merge candidates A0 to B2 are obtained using the motion compensation parameters of adjacent blocks (S101).
  • the temporal merge candidate derivation unit 1212B obtains a merge candidate T using the motion compensation parameter of the reference picture that has already been decoded (S102).
  • S103 duplicate merge candidates among the derived merge candidates A0 to T are removed and stored in the merge candidate storage unit 1212H.
  • the derivation of merge candidates is terminated (YES in S104). Otherwise (NO in S104), the process proceeds to S105. If it is a B slice (YES in S105), the process proceeds to S106. If not (NO in S105), S107 and S108 are skipped and the process proceeds to S109 (S105). When bi-prediction restriction is performed, the bi-prediction motion candidate derivation process of S107 and S108 is also skipped in the case of a small size PU corresponding to the case where bi-directional merge candidate derivation is skipped, and the process proceeds to S109 (S106). ).
  • the combined bi-predictive merge candidate derivation unit 1212D derives a combined bi-predictive merge candidate and stores it in the merge candidate storage unit 1212H.
  • the non-scale bi-predictive merge candidate derivation unit 1212E derives a non-scale bi-predictive merge candidate and stores it in the merge candidate storage unit 1212H. If the number of merge candidates is MRG_MAX_NUM_CANDS or more (YES in S109), the derivation of merge candidates is terminated. Although not shown, when the number of merge candidates reaches MRG_MAX_NUM_CANDS during the steps of S107 and S108, each process is stopped and the derivation of merge candidates is ended. In S110, the zero vector merge candidate deriving unit 1212F derives zero vector merge candidates until the number of merge candidates reaches MRG_MAX_NUM_CANDS, and stores it in the merge candidate storage unit 1212H.
  • the processing amount required for the merge candidate derivation can be reduced. Since the combined bi-predictive merge candidate derivation process (S107) and the non-scale bi-predictive merge candidate derivation process (S108) related to the bi-predictive merge candidate are heavy processes that require repeated determinations, the time required for decoding (process) The ability to omit the processing with a small size PU with a limited amount is particularly effective in a device that needs to perform a decoding process in real time.
  • bi-predictive merge candidates is not limited to the operations of the combined bi-predictive merge candidate derivation unit 1212D and the non-scale bi-predictive merge candidate derivation unit 1212E, and other merge candidate derivations that mainly generate bi-predictive merge candidates. It can also be applied to processing.
  • FIG. 45 is a diagram for explaining the operation of the adjacent merge candidate derivation unit 1212A.
  • each merge candidate is derived by copying the motion compensation parameters of adjacent blocks including the positions of A0, A1, B0, B1, and B2. Assume that the derivation order is A1, B1, B0, A0, B2.
  • the derived merge candidate is converted by the bi-predictive conversion unit 1219 and then stored in the merge candidate storage unit 1212H.
  • the bi-prediction conversion unit 1219 converts the input merge candidate into a single prediction when bi-prediction restriction is performed.
  • the plurality of merge candidates are stored in the merge candidate storage unit 1212H.
  • the fact that the output of the bi-predictive conversion unit 1219 may be a plurality of merge candidates is the same for other merge candidate derivation units described later.
  • the positions A0 to B1 can be expressed as follows, where the upper left coordinates of the PU are (xP, yP) and the PU sizes are nPSW and nPSH.
  • the motion compensation parameter of each merge candidate is the motion compensation parameter of the PU whose index is 0 Only when they do not match, the corresponding merge candidate is derived and stored in the merge candidate storage unit 1212H.
  • the operation of the function equalMotion (A, B) for determining the coincidence of the motion compensation parameters of the block A and the block B can be defined as follows.
  • predFlagL0A and predFlagL1A are 1 when the reference pictures L0 and L1 are used in the block A, respectively, and 0 otherwise.
  • mvL0 [0] and mvL0 [1] are the horizontal motion vector and vertical motion vector of L0
  • mvL1 [0] and mvL1 [1] are the horizontal motion vector and vertical motion vector of L1.
  • A is replaced with B.
  • FIG. 46 is a diagram for explaining the operation of the temporal merge candidate derivation unit 1212B.
  • the temporal merge candidate when the current picture is currPic, the temporal merge candidate is specified by a reference index number refIdxL0 that occupies almost the same spatial position as the target PU in the current picture. It is derived by copying the motion compensation parameter of the reference picture PU or the PU of the reference picture specified by the reference picture index number.
  • a method for deriving the reference index number refIdxL0 and the reference index number refIdxL1 will be described with reference to FIG.
  • the reference index number refIdxLX (where X is 0, 1 or C) is obtained as follows using the reference pictures refIdxLXA, refIdxLXB, and refIdxLXC of the adjacent PU, A, B, and C blocks of the target PU.
  • refIdxLX refIdxLXA
  • refIdxLXB refIdxLXC
  • refIdxLX refIdxLXA
  • refIdxLXB refIdxLXC
  • the coordinates of the blocks A and B are as follows.
  • the coordinates of the block C are any of the following C0, C1, and C2. If the PU corresponding to each position is available and other than intra, the refIdxLX of the PU at that position is set as refIdxLXC.
  • the L1 motion vector MvL1 of the PU is used as the temporal merge candidate LX motion vectors mvLXCol [0] and mvLXCol [1].
  • the L0 motion vector MvL0 of the PU is used as the LX motion vectors mvLXCol [0] and mvLXCol [1] of temporal merge candidates.
  • the motion vector is scaled using the POC (Picture Order Count) of the current frame and the POC of the reference picture.
  • the merge candidate is input to the bi-predictive conversion unit 1219 for conversion.
  • the merge candidate after conversion is stored in the merge candidate storage unit 1212H as a temporal merge candidate.
  • the unique candidate derivation unit 1212C updates the merge candidate list so that the merge candidates in the merge candidate list are unique to each other.
  • a unique merge candidate list can be obtained by the steps shown in the pseudo code of FIG.
  • S4701 All validity flags from index 0 to index CANDX are initialized to be valid.
  • motion_valid [] is an array for storing the validity flag.
  • S4703 The merge candidate motion_cand whose validity flag motion_valid is true is stored in the merge candidate list.
  • the merge candidate list is reconfigured by copying the merge candidate list in ascending order of numbers to a merge candidate list composed of an array of merge candidate motion_cands.
  • copy (A, B) is a function for copying B to A.
  • S4704 The validity flag motion_valid is reset.
  • S4705 The number of valid merge candidates NumCand is updated.
  • FIG. 48 is a diagram for explaining the operation of the combined bi-predictive merge candidate derivation unit 1212D.
  • the combined bi-predictive merge candidate uses the two reference merge candidates stored in the merge candidate list to copy the motion compensation parameter of the list L0 from one reference merge candidate and the motion of the list L1 from the other reference merge candidate Derived by copying the compensation parameters.
  • FIG. 48C is a table for determining two reference merge candidate lists to be extracted.
  • the index of the combined bi-predictive merge candidate to be derived is expressed by combCand k . Note that combCand k uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived.
  • k is an index starting from 0, and is incremented by 1 when a combined bi-predictive merge candidate is added to the merge candidate list.
  • the combIdx index is a temporary index used when deriving a combined bi-predictive merge candidate and has a value from 0 to 11.
  • the reference merge candidates of the indexes indicated by the two indexes l0CandIdx and l1CandIdx are selected from the merge candidate list.
  • FIG. 48A shows a determination formula for determining whether or not to derive a combined bi-predictive merge candidate.
  • the merge candidate L0 motion compensation parameters predFlagL0l0Cand, refIdxL0l0Cand, mvL0l0Cand selected by l0CandIdx, and the L1 merge candidate motion compensation parameters predFlagL1l1Cand, refIdxL1l1Cand, and mvL1l1 that satisfy all of the mvL1l1 formula If so, a combined bi-predictive merge candidate is derived.
  • FIG. 48B is a diagram illustrating a method for deriving the combined bi-predictive merge candidate indicated by the index combCand k .
  • Motion compensation parameters RefIdxL0combCand k of coupling bi-predictive merge candidates refIdxL1combCand k, predFlagL0combCand k, predFlagL1combCand k, mvL0combCand k [0], mvL0combCand k [1], mvL1combCand k [0], mvL1combCand k [1] the motion compensation of the L0 Derived by copying the parameter and the L1 motion compensation parameter.
  • the derived combined bi-predictive merge candidate does not match all merge candidates stored in the merge candidate list of the merge candidate storage unit 1212H, the combined bi-predictive merge candidate is stored at the end of the merge candidate list.
  • the function equalMotion described above is used.
  • the operation of the combined bi-predictive merge candidate derivation unit 1212D is terminated. If not reached, combIdx is incremented by 1, two reference merge candidates are extracted using the table of FIG. 48C, and merge candidate derivation is continued. When all the tables have been extracted, the operation of the combined bi-predictive merge candidate derivation unit 1212D is terminated.
  • FIG. 49 is a diagram for explaining derivation of the non-scale bi-predictive merge candidate derivation unit 1212E.
  • FIG. 49A shows a determination formula for determining whether to derive a non-scale bi-predictive merge candidate.
  • FIG. 49B is a diagram illustrating a method for deriving a non-scale bi-predictive merge candidate indicated by an index nscaleCand l .
  • the index nscaleCand l uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived.
  • l is an index starting from 0, and is incremented by 1 when a non-scale bi-predictive merge candidate is added to the merge candidate list.
  • the non-scale bi-predictive merge candidate derivation unit 1212E uses the merge candidate motion vectors already derived and stored in the merge candidate storage unit 1212H so that the motion vectors for the two reference pictures are in a relationship of reversing each other. Derive candidates.
  • the index of the merge candidate to be referenced is origCand and all the determination formulas in FIG. 49A are satisfied, the non-scale bi-predictive merge candidate is derived according to FIG. 49B.
  • the derived joint bi-predictive merge candidate is not matched with all the merge candidates stored in the merge candidate list of the merge candidate storage unit 1212H using the function equalMotion, the combined bi-prediction is performed.
  • the merge candidate is stored at the end of the merge candidate list. If the number of merge candidates has reached MRG_MAX_NUM_CANDS, the operation is terminated, and if not, the process is repeated.
  • FIG. 50 is a diagram illustrating the operation of the zero vector merge candidate derivation unit 1212F. If the number of merge candidates in the merge candidate storage unit 1212H has reached MRG_MAX_NUM_CANDS, no processing is performed. If not reached, zero vectors are stored until the number of merge candidates reaches MRG_MAX_NUM_CANDS.
  • the index of the merge candidate to be referenced is mvL0zeroCand m
  • the L0 motion vectors (mvL0zeroCand m [0], mvL0zeroCand m [1]) and L1 motion vectors (mvL1zeroCand m [0], mvL1zeroCand m [1]) are both A candidate such as 0 is derived.
  • the index zeroCand m uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived.
  • m is an index starting from 0, and is incremented by 1 when a zero vector prediction merge candidate is added to the merge candidate list.
  • the merge candidate derivation control unit 1212G performs the operation shown in the flowchart of FIG. 44 to derive merge candidates.
  • the merge candidate storage unit 1212H stores the derived merge candidate.
  • FIG. 54 is a block diagram showing the configuration of the basic motion compensation parameter derivation unit 1213.
  • the basic motion compensation parameter derivation unit 1213 includes an adjacent motion vector candidate derivation unit 1213A, a temporal motion vector candidate derivation unit 1213B, a zero vector merge candidate derivation unit 1213F, a motion vector candidate derivation control unit 1213G, a motion vector candidate storage unit 1213H, A vector candidate selection unit 1213I and a motion vector restoration unit 1213J are included.
  • the adjacent motion vector candidate derivation unit 1213A, the temporal motion vector candidate derivation unit 1213B, and the zero vector merge candidate derivation unit 1213F are collectively referred to as motion vector / merge candidate derivation means.
  • the motion vector candidate derivation control unit 1213G controls each motion vector / merge candidate derivation unit, derives a predetermined number of predicted motion vector candidates PMV_MAX_NUM_CANDS, and stores it in the motion vector candidate storage unit 1213H.
  • the predicted motion vector candidate is composed of motion vectors mvL0 and mvL1.
  • the motion vector candidate storage unit 1213H stores the set of motion parameters as a predicted motion vector candidate.
  • the predicted motion vector candidates to be stored are managed as a list (predicted motion vector candidate list) ordered in the order of storage.
  • the adjacent motion vector candidate derivation unit 1213A derives each motion vector predictor candidate by copying the motion compensation parameter of the adjacent block.
  • the temporal motion vector candidate derivation unit 1213B derives temporal prediction motion vector candidates by copying the motion compensation parameters of the already decoded pictures.
  • the zero vector merge candidate derivation unit 1213F derives a zero vector as a motion vector predictor candidate.
  • the motion vector candidate derivation control unit 1213G ends the derivation when a predetermined number of predicted motion vector candidates PMV_MAX_NUM_CANDS are derived. Also, using the internal unique candidate determination unit 1213C, motion vectors are used so that the motion vector predictors derived from the adjacent motion vector candidate derivation unit 1213A and the temporal motion vector candidate derivation unit 1213B do not match each other (become unique). Store in the candidate storage unit 1213H. Specifically, the motion vector candidate derivation control unit 1213G inputs the two motion vectors A and B to the unique candidate determination unit 1213C, and determines whether the motion vector A and the motion vector B match. Let it be judged. The unique candidate determination unit 1213C determines whether or not the two input motion vectors match each other.
  • bi-prediction restriction determination unit 1218 bi-prediction restriction determination method
  • a preferred example of a method for determining whether or not the bi-prediction restricted PU determination unit 1218 is a small-size PU that should be subjected to bi-prediction restriction will be described below.
  • the determination method is not limited to the following example, and other parameters can be used as PU size information.
  • Example 1 of determination method when the threshold used for PU size determination is TH, bi-prediction restriction is performed for a PU less than THxTH.
  • the determination formula using the target CU size (here, CU Width) and the PU partition type at this time is as follows.
  • TH 16
  • bi-prediction restriction is performed in each PU of 16 ⁇ 8, 8 ⁇ 16, 12 ⁇ 16, 4 ⁇ 16, 16 ⁇ 12, 16 ⁇ 4, 8 ⁇ 8, 8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4.
  • bi-prediction restriction is performed in each of 8x4, 4x8, and 4x4 PUs.
  • a logarithm log2CUSize in which the base of the CU size (CU Width) is 2 may be used instead of CU Width as the CU size used for the PU size determination.
  • the determination formula when the bi-prediction restriction is applied to 16 ⁇ 8, 8 ⁇ 16, 12 ⁇ 16, 4 ⁇ 16, 16 ⁇ 12, 16 ⁇ 4, 8 ⁇ 8, 8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4 is as follows.
  • bi-prediction restriction is performed on a PU of THxTH or less. The judgment formula at this time is as follows.
  • TH 16
  • bi-prediction restriction is performed in each of 16x16, 16x8, 8x16, 12x16, 4x16, 16x12, 16x4, 8x8, 8x4, 4x8, and 4x4 PUs.
  • bi-prediction restriction is performed in a 4 ⁇ 4 PU.
  • the 4x4 judgment formula is as follows.
  • different PU sizes (threshold values TH) may be used for the skip PU, the merge PU, and the basic inter PU. Further, as already shown in FIG. 34C, the PU size (threshold value TH) used for the determination may be encoded.
  • the bi-prediction conversion unit 1219 can switch between a plurality of bi-prediction conversion methods, and bi-prediction conversion may be performed using the bi-prediction conversion method specified by the merge candidate derivation unit. In addition, it may be input to the bi-predictive conversion unit 1219 whether or not bi-predictive conversion is performed, and switching may be performed accordingly.
  • the bi-prediction conversion unit 1219 may sequentially output two motion compensation parameters when the input motion compensation parameter is bi-prediction.
  • the motion compensation parameter is an inter prediction flag inter_pred_flag of a motion compensation parameter derived from a copy of a motion compensation parameter of a temporally and spatially close PU or a combination of motion compensation parameters of a temporally and spatially close PU. Is 2 indicating bi-prediction, it is converted to 1 indicating uni-prediction. Further, when the inter prediction flag (internal inter prediction flag) used for the internal processing is a flag including 1 indicating L0 prediction, 2 indicating L1 prediction, and 3 indicating bi-prediction, the following operation is performed. When the internal inter prediction flag is 3, the value of the internal inter prediction flag is converted to 1 meaning L0 prediction or 2 meaning L1 prediction.
  • the motion compensation parameter related to L1 prediction when converting to L0 prediction, it is possible to refresh the motion compensation parameter related to L1 prediction to, for example, zero. In the case of conversion to L1 prediction, the motion compensation parameter related to L0 prediction can be refreshed to, for example, zero.
  • the relationship between the internal inter prediction flag and the prediction list use flags predFlagL0 and predFlagL1 can be mutually converted as follows.
  • the prediction list This can also be done by converting one of the usage flags to 0, which indicates that one of the usage flags is not used.
  • FIG. 51 is a diagram for explaining an example of a method of conversion to single prediction (bi-predictive conversion method).
  • the L0 selection changes the prediction list use flag predFlagL1 to 0.
  • L1 selection changes the prediction list use flag predFlagL0 to 0.
  • the prediction list use flag of the list having the larger value among the reference index number refIdxL0 and the reference index number refIdxL1 is changed to 0.
  • the list with the smaller reference index number is used.
  • the POC selection includes the difference between the POC (POC_curr) of the current picture and the POC (POC_L0) of the reference picture indicated by the reference index number refIdxL0, the POC of the current picture, and the POC of the reference picture indicated by the reference index number refIdxL1 (POC_L1). ),
  • the prediction list use flag of the list with the larger value is changed to 0.
  • X (
  • )? 0: 1, predFlagLX 0.
  • a reference picture having a POC close to that of the current picture is used.
  • Both selections use both the case where the L0 motion compensation parameter is used and the case where the L1 motion compensation parameter is used as candidates.
  • the bi-prediction is limited when the PU size is 8 ⁇ 4 and 4 ⁇ 8, and the decrease in coding efficiency is almost zero in the method of performing L1 selection for the bi-predictive transformation.
  • the bi-predictive transformation can be expressed as follows.
  • the prediction list usage flag predFlagL0 is set to 0 when both the prediction list usage flag predFlagL0 and the prediction list usage flag predFlagL1 are 1.
  • reference pictures in the L0 list are often given priority.
  • reference pictures in the L1 list instead of reference pictures in the L0 list, it is possible to differentiate from the derivation process that prioritizes these L0 lists.
  • a plurality of derivation processes can be selected according to a certain encoding parameter, assuming that a derivation process for a certain group is L0 list priority and a derivation process for other groups is L1 list priority, the respective derivation processes are used in a complementary manner. Therefore, it works effectively in sequences and areas with more motion properties. Therefore, in bi-predictive transformation, high encoding efficiency can be obtained by using the L1 list.
  • bi-prediction merge candidate when bi-prediction (both predFlagL0 and predFlagL1 are 1), it may be switched whether predFlagL1 is set to 0 (L0 list is used).
  • the L0 list is used for one of the merge candidates A0 and A1 calculated from the blocks adjacent in the left direction and the merge candidates B0 and B1 calculated from the blocks adjacent in the upward direction.
  • the opposite reference list may be used for each index in the order of derivation or when storing in the merge candidate list.
  • the bi-prediction conversion unit 1219 may be configured as means included in the skip motion compensation parameter derivation unit 1211 and the merge motion compensation parameter derivation unit 1212. In addition, when bi-prediction restriction is performed only on the basic inter PU, a configuration without the bi-uni prediction conversion unit 1219 may be used.
  • FIG. 30 is a block diagram illustrating a configuration of the motion information decoding unit 1021.
  • the motion information decoding unit 1021 includes at least an inter prediction flag decoding unit 1028.
  • the motion information decoding unit 1021 performs bi-prediction restriction on a basic inter PU that is a PU when decoding an inter prediction flag.
  • the inter prediction flag decoding unit 1028 changes whether or not to decode the inter prediction flag depending on whether or not the bi-prediction restricted PU determination unit 1218 described above performs bi-prediction restriction on the basic inter PU.
  • FIG. 39 is a flowchart showing the operation of the inter prediction flag decoding unit 1028 in the case of CABAC.
  • the inter prediction flag decoding unit 1028 proceeds to S132. Otherwise (NO in S131), the process ends without decoding the inter prediction flag inter_pred_flag.
  • FIG. 40 is a flowchart showing the operation of the inter prediction flag decoding unit 1028 in the case of CAVLC. If the slice is a B slice (YES in S141), the inter prediction flag decoding unit 1028 proceeds to S142. Otherwise (NO in S141), the process ends without decoding the inter prediction flag inter_pred_flag.
  • the PU size is a small PU size (YES in S142)
  • the combined inter prediction reference index combined_inter_pred_ref_idx is decoded through S146, S147, and S148.
  • the maximum value MaxPredRef is calculated.
  • the maximum value MaxPredRef is as shown in the table TBL37 and the pseudo code CODE37 in FIG. Specifically, the maximum value MaxPredRef for non-small PUs, that is, when there is no bi-prediction restriction (DisableBiPred!
  • num_ref_idx_lc_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers managed by the reference list LC (size of the reference list LC). When num_ref_idx_lc_active_minus1 is greater than 0, it indicates that the reference list LC is used.
  • num_ref_idx_l0_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers managed in the reference list L0 (size of the reference list L0), and indicates that the reference list L0 is used.
  • num_ref_idx_l1_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers (size of the reference list L1) managed in the reference list L1.
  • the number of combined reference picture sets for uni-prediction is determined as the number of clipped reference list sizes with the maximum value (4 for the reference list LC and 2 for the other reference lists) as in the following equation.
  • NumPredRefLC Min (° 4, ° num_ref_idx_lc_active_minus1 ° + ° 1 °)
  • NumPredRefL0 Min (° 2, ° num_ref_idx_l0_active_minus1 ° + ° 1 °)
  • NumPredRefL1 Min (° 2, ° num_ref_idx_l1_active_minus1 ° + ° 1 °)
  • codeNum is converted into combined_inter_pred_ref_idx.
  • simple decoding is performed by not using the inverse transformation variable table in the small size PU.
  • the combined_inter_pred_ref_idx used can also be decoded.
  • the reverse conversion variable table and the conversion variable table use the same table when the bi-prediction restriction is used and when it is not used.
  • the entry corresponding to the bi-prediction is invalid among the table entries. Therefore, it is necessary to skip invalid entries.
  • the decoding unit scans the entries in the inverse conversion variable table DecTable in descending order of occurrence probability, that is, in order from the smallest number to the largest.
  • FIG. 41 is a pseudo code illustrating a decoding process of combined_inter_pred_ref_idx when the inverse transformation variable table is used. Hereinafter, each step S of the pseudo code illustrated in FIG. 41 will be described.
  • FIG. 41 is a pseudo code illustrating a decoding process of combined_inter_pred_ref_idx when the inverse transformation variable table is used.
  • the maximum value MaxPredRef is represented as uiMaxVal for convenience of coding style.
  • NumPredRefLC, NumPredRefL0, and NumPredRefL1 are written as uiValNumRefIdx0fLC, uiValNumRefIdx0fL0, and uiValNumRefIdx0fL1, respectively.
  • S502 The maximum values MaxPredRef and uiBipredVal for bi-prediction restriction are obtained.
  • S504 Combined_inter_pred_ref_idx is obtained from the code number tmp using the reverse conversion variable table m_uiMITableD. When bi-prediction restriction is not performed, this value is the final combined_inter_pred_ref_idx value.
  • S505 This is a branch for entering the process of obtaining combined_inter_pred_ref_idx from the code number when bi-prediction restriction is performed.
  • S506 A maximum value MaxPredRef when bi-prediction restriction is not performed is obtained for later use in the determination in S509.
  • S507 Processing is performed from 0 to the maximum value MaxPredRef using the temporary code number tmp2 as a loop variable.
  • the second temporary code number cx is processed into 0.
  • S508 A temporary combined_inter_pred_ref_idx value x obtained by converting the temporary code number tmp2 with the inverse conversion variable table is obtained.
  • S509 It is determined whether or not the value x of the temporary combined_inter_pred_ref_idx is within the valid range. The cases where the maximum value uiBipredVal when the bi-prediction restriction is performed are not exceeded and the maximum value MaxPredRef when the bi-prediction restriction is not performed are valid.
  • S510 When the second temporary code number cx matches the decoded code number tmp, the loop is terminated.
  • the temporary code number tmp2 at the time of ending the loop corresponds to the code number when bi-prediction restriction is not performed. Therefore, it is assigned to the code number tmp.
  • S513 The process adaptCodeword for updating the inverse transformation variable table is called using the code number tmp when the bi-prediction restriction is not performed.
  • FIG. 42 is a pseudo code showing the encoding process of combined_inter_pred_ref_idx when a variable table is used.
  • bi-prediction restriction of basic inter PU change of decoding method of inter prediction flag and joint inter prediction reference index
  • bi-prediction restriction of merge PU bi-prediction in merge candidate derivation
  • skip prediction of bi-predictive merge candidate calculation has been described, but these limitations may be used alone, or PU sizes for performing these limitations may be different values.
  • 52 and 53 show an example of bi-prediction processing amount reduction. In the figure, ⁇ indicates that the process is performed, and x in the figure indicates that the process is not performed.
  • FIG. 52A applies the basic inter-PU bi-prediction restriction, the merge PU bi-prediction restriction, and the bi-prediction merge candidate derivation skip uniformly to PUs of 4 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 8 sizes. It is an example.
  • (B) and (c) of FIG. 52 are examples in which bi-prediction restriction of merge PUs and bi-prediction merge candidate derivation skipping are not performed and bi-prediction restriction is performed only on basic inter PUs. In general, when the bi-prediction restriction of the merge PU is performed, there is a case where the encoding efficiency is lowered. Therefore, an example in which the bi-prediction restriction is applied only to the basic inter PU is appropriate.
  • FIG. 52 (d) shows a bi-prediction restriction for a basic inter PU uniformly for a PU of size 4x4, 4x8, 4x8, a bi-prediction restriction for a merge PU for a PU of size 8x8, and bi-prediction. It is an example which applies the skip of merge candidate derivation. It is appropriate in terms of coding efficiency to loosen the bi-prediction restriction of the merge PU compared to the bi-prediction restriction of the basic inter PU.
  • FIG. 53A is an example in which bi-prediction restriction of basic inter PU and bi-prediction merge candidate derivation skip are applied to 4x4, 4x8, 4x8, and 8x8.
  • the bi-prediction restriction of the merge PU is not performed, the processing amount related to the bi-prediction in the merge PU can be reduced by simplifying the merge candidate derivation used as the motion compensation parameter of the merge PU.
  • FIG. 53 (b) is an example in which the bi-predictive merge candidate derivation skip is applied to 4x4, 4x8, 4x8, and 8x8.
  • the bi-predictive merge candidate derivation skip can be used alone.
  • the determination method may be managed with another flag.
  • flags DisableBiPredFlag, DisableBiPredMerge, and DisableBiPredMergeDerive indicating that prediction restrictions for each are performed are provided, and these can be performed by the following operations.
  • the bi-prediction restricted PU determination unit 1218 derives three flags DisableBiPredFlag, DisableBiPredMerge, and DisableBiPredMergeDerive, respectively.
  • the example shown in FIG. 52D can be derived as follows.
  • the inter prediction flag decoding unit 1028 changes the decoding method of the inter prediction flag and the combined inter prediction reference index when DisableBiPredFlag is true.
  • the merge motion compensation parameter derivation unit 1212 performs bi-prediction conversion using the bi-prediction conversion unit 1219 in merging candidate derivation when DisableBiPredMerge is true.
  • the merge motion compensation parameter derivation unit 1212 skips the bi-predictive merge candidate derivation in the merge candidate derivation when DisableBiPredMergeDerive is true.
  • Actions and effects obtained when the motion compensation parameter deriving unit 121 performs bi-prediction restriction with reference to the small PU size 123A are as follows.
  • Bi-prediction has a larger processing amount than single prediction, and a small PU has a larger processing amount per unit area than a large PU. Therefore, bi-prediction in a small PU can be a processing bottleneck. For this reason, in small PU, it can suppress that processing amount increases excessively by suppressing bi-prediction. In particular, the worst-case processing amount for processing the smallest size PU can be suppressed.
  • the inter prediction flag is supplemented as follows.
  • the inter prediction flag (inter_pred_flag) is basically a flag for selecting bi-prediction or uni-prediction.
  • a flag for selecting either L0 or L1 may be transmitted by inter_pred_flag as a reference frame list used for single prediction.
  • the present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention provides an image in a prediction unit between any one of screens of uni-prediction that refers to one reference image and bi-prediction that refers to two reference images.
  • bi-prediction restriction means is provided for restricting bi-prediction for a target prediction unit that is a prediction unit having a size of a predetermined size or less to which the inter-screen prediction is applied. It is a configuration.
  • FIG. 58 and FIG. 2 is a table that defines level restrictions in H.264 / AVC.
  • the level restriction will be described with reference to FIG.
  • the level in the level regulation defines the performance of the decoder and the complexity of the bit stream.
  • the level is specified by an integer part and a non-integer part.
  • the level of the integer part mainly represents a rough division according to the resolution of the image to be handled. As shown in FIG. 58, a number from 1 to 5 is designated as the integer.
  • Level 1, level 2, and level 3 correspond to the resolutions of QICF, CIF, and SDTV (standard television), respectively.
  • Level 4 corresponds to the resolution of HDTV (high definition television).
  • Level 5 corresponds to Super HDTV resolution.
  • an intermediate level may be further specified by a non-integer part (see the item “LevelLnumber” indicated by COL581).
  • the parameters defined in the table shown in FIG. 58 are MaxMBPS, MaxFS, MaxDPB, MaxBR, MaxCPB, MaxVmvR, MinCR, MaxMvsPer2Mb in order from the Level number (COL581) to the right side in the table.
  • MaxFS indicated by the reference number COL582 will be described as follows. MaxFS defines the maximum frame size by the number of macroblocks (MBs).
  • MaxFS determines which level these screen sizes can be processed.
  • FIG. 58 screen sizes that can be processed at each level of 4 to 5.1 are shown on the right side of the table.
  • level 4 to 4.2 1080p can be processed.
  • level 5 2560 ⁇ 1600, which is the size used in the PC display, can be processed.
  • level 5.1 4k can be processed.
  • the minimum block size allowed for luminance bi-prediction is 8 ⁇ 8 (MinLumaBiPredSize). . That is, bi-prediction in sub-macroblock units (8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4) is prohibited at level 3.1 or higher.
  • H. A macroblock in H.264 / AVC is a unit corresponding to CU, TU, and PU in HEVC.
  • H. In H.264 / AVC only bi-prediction is restricted, but with a small size PU, the processing amount required for filter processing for motion compensation and the transfer amount of reference pixels are large even in single prediction. Therefore, it is appropriate to limit the small PU size simultaneously with the bi-prediction limitation of the small PU size. Note that as the level increases, the resolution (image size) that is basically used increases, but the processing amount and transfer amount become more severe as the resolution increases. At the same time, when the resolution is high, the object size also increases accordingly (because the spatial correlation of motion increases), so that a high coding efficiency can be realized even with a relatively large PU alone.
  • the use of a small PU size and the bi-prediction with a small PU size can be limited without a significant decrease in coding efficiency.
  • the resolution basically corresponds to the level
  • the PU size to be constrained and the prediction unit (PU) to limit the bi-prediction differ depending on the level.
  • level 3.1 720P
  • level 5 (equivalent to 2560 ⁇ 1600 and 4k)
  • the minimum CU size can be controlled by a value log2_min_coding_block_size_minus3 in encoded data, which will be described later, but the purpose of reducing the minimum CU size is to reduce the processing amount and the transfer amount. It is appropriate to limit the bi-prediction that greatly affects the quantity at the same time.
  • An example of adaptive restriction / limitation will be described with reference to FIG.
  • FIG. 60A illustrates the limitation of bi-prediction in the case of 16 ⁇ 16 CU.
  • FIG. 60 illustrates the limitation of bi-prediction in the case of 8 ⁇ 8 CU.
  • 16 ⁇ 16 PU, 16 ⁇ 8 PU, 8 ⁇ 16 PU, 8 ⁇ 8 PU, and the like can be taken.
  • bi-prediction restriction is not performed on 16 ⁇ 16 PU, 16 ⁇ 8 PU, and 8 ⁇ 16 PU, while bi-prediction restriction is performed on 8 ⁇ 8 PU.
  • 8 ⁇ 8 PU, 8 ⁇ 4 PU, and 4 ⁇ 8 PU can be taken.
  • bi-prediction restriction is not performed on 8 ⁇ 8 PU
  • bi-prediction restriction is performed on 8 ⁇ 4 PU and 4 ⁇ 8 PU.
  • the adaptive restriction / limitation as shown in FIG. 60 is a value of the motion compensation parameter derived when decoding the encoded data according to the level, even if the moving image decoding apparatus 1 is not specially configured. It can also be realized by level regulation that limits the above.
  • FIG. 84 is an example of the level restriction of the present invention.
  • MaxLog2MinCUSize, MinPUSize, and MinBipredPUSize are respectively the logarithmic value of the minimum CU size, the minimum PU size, and the minimum bi-predicted PU size, and the minimum CU size and PU size that can be used at a specific level. Indicates the value. As shown in FIG.
  • the logarithmic value of the minimum CU size and the minimum PU size are 3, 4 ⁇ 4, respectively, and are not particularly limited.
  • the minimum bi-prediction PU size is 8 ⁇ 4, 4 ⁇ 8, and 4 ⁇ 4 PU bi-prediction is disabled.
  • the logarithmic value of the minimum CU size (logarithm of the minimum PU size) is 3, which is not particularly limited. 8 ⁇ 4 and 4 ⁇ 8. That is, 4 ⁇ 4 PU cannot be used.
  • the minimum bi-prediction PU size is 8 ⁇ 4 and 4 ⁇ 8, and bi-prediction of 4 ⁇ 4 PU is disabled.
  • the logarithmic value of the minimum CU size is 4, and the minimum PU size is limited to 8 ⁇ 8. That is, 8 ⁇ 4 PU, 4 ⁇ 8 PU, and 4 ⁇ 4 PU are disabled.
  • the minimum bi-prediction PU size is 16 ⁇ 8, and bi-prediction of 8 ⁇ 8 PU is disabled. Note that bi-prediction of 8 ⁇ 4 PU, 4 ⁇ 8 PU, and 4 ⁇ 4 PU cannot be used due to the minimum PU size restriction.
  • the threshold TH1 is suitably level 2.1, which is a 720P line
  • the threshold TH2 is suitably level 5, which is a line equivalent to 2560 ⁇ 1600, but other thresholds may be used.
  • FIG. 85 is another example of level regulation according to the present invention.
  • the level level_idc is less than the predetermined threshold value TH0
  • the logarithmic value of the minimum CU size, the minimum PU size, and the minimum bi-predicted PU size are 3 and 4 respectively.
  • ⁇ 4, 4 ⁇ 4 all without restrictions.
  • the level restriction only restricts encoded data, that is, skipping decoding of inter prediction flags, bi-transforming merge candidates, and skipping bi-predictive merge candidate derivation in merge candidate derivation in a small PU size. It is not necessary to perform part or all.
  • some or all of the skip of decoding of the inter prediction flag, the bi-conversion of merge candidates, and the skip of bi-prediction merge candidate derivation in merge candidate derivation in the small PU size may be used together.
  • both the usable PU size and the usable bi-predictive PU size are switched according to the level using the same threshold value.
  • the minimum PU size MinPUSize is changed before and after the threshold TH1
  • the minimum bi-predicted PU size MinBipredPUSize is changed using the same threshold TH1.
  • the processing amount and the transfer amount are appropriately set. Can be limited. It also makes it clear at what level the required limit changes.
  • FIGS. 62 to 70 in addition to FIG. 61, a configuration for determining a size for performing bi-prediction restriction will be described.
  • the configuration shown in FIG. 61 is obtained by changing the bi-prediction restricted PU determination unit 1218 to the bi-prediction restricted PU determination unit 1218A in the configuration shown in FIG.
  • the bi-prediction restriction PU determination unit 1218A determines the bi-prediction restriction condition, and determines whether or not bi-prediction restriction that does not use bi-prediction is performed in the target PU.
  • the bi-prediction restricted PU determination unit 1218A may independently determine whether to perform bi-prediction restriction on the skip CU and the merge PU and whether to perform bi-prediction restriction on the basic inter PU.
  • inter prediction flags with skip PUs such as when merging is restricted, whether or not bi-prediction restriction is performed on each of skip PUs, merge PUs, and basic inter PUs is determined independently. It is also possible to determine.
  • the bi-prediction / uni-prediction setting set in the skip motion compensation parameter deriving unit 1211 is transferred to the bi-prediction restricted PU determination unit 1218A in the bi-prediction conversion unit 1219A.
  • a configuration based on the determination may be used.
  • the configuration is not limited thereto, and for example, a configuration in which the determination result of the bi-prediction restricted PU determination unit 1218A is directly input to the skip motion compensation parameter derivation unit 1211 and bi-prediction / uni-prediction setting is performed may be used.
  • the determination of the bi-prediction limited condition performed by the bi-prediction limited PU determination unit 1218A is performed based on various flags and parameters set from the encoder side.
  • the bi-prediction restricted PU determination unit 1218A can be configured as exemplified in the following (1A) to (1E).
  • each configuration example (1A) to (1E) will be described with reference to a syntax table and pseudo code. Note that the level regulation and each configuration example are not in conflict and can be used together.
  • FIG. 62 is a diagram illustrating an example of a syntax table related to bi-prediction restriction. As shown in FIG.
  • log2_min_coding_block_size_minus3 SYN621
  • inter_4x4_enabled_flag SYN622
  • restrict_bipred_flag SYN623
  • log2_min_bipred_min3_coding_25_S3 log2_min_bipred_min3_coding_25_S3 .
  • Log2_min_coding_block_size_minus3 is a flag for determining the minimum CU size.
  • Inter_4x4_enabled_flag is a flag that prohibits inter 4 ⁇ 4 PU as the name suggests.
  • Log2_min_coding_block_size_minus3 and inter_4x4_enabled_flag indicate the logarithm value Log2MinCUSize of the minimum CU size and 4 ⁇ 4 PU availability, respectively, and constrain the size of the usable PU.
  • “Restrict_bipred_flag” is a flag indicating whether or not bi-prediction should be restricted. The value of this flag is determined in accordance with the level in the video encoding device 2. When restrict_bipred_flag is “1”, it indicates that bi-prediction is restricted. Further, when restrict_bipred_flag is “0”, it indicates that bi-prediction is not restricted.
  • Log2_min_bipred_coding_block_size_minus3 directly specifies the minimum CU size for which bi-prediction restriction is performed (hereinafter referred to as the minimum bi-prediction restriction CU size).
  • the method of specifying the size in log2_min_bipred_coding_block_size_minus3 is the same as in log2_min_coding_block_size_minus3.
  • log2_min_bipred_coding_block_size_minus3 is decoded when restrict_bipred_flag is encoded (SYN625).
  • the bi-prediction restricted PU determination unit 1218A determines whether or not restrict_bipred_flag is “0”.
  • S632 When restrict_bipred_flag is “0”, the bi-prediction restricted PU determination unit 1218A sets “0” in the DisableBipred variable.
  • the DisableBipred variable is a variable indicating whether or not bi-prediction restriction is performed. When “0” is set in the DisableBipred variable, bi-prediction is not restricted. If the DisableBipred variable is set to “1”, bi-prediction restriction can be performed.
  • the bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinBipredCUSize and the PU mode is N ⁇ N.
  • S635 may be modified as in the following S635 '.
  • log2CUSize When the logarithm of the CU size (log2CUSize) matches Log2MinBipredCUSize and the PU mode is N ⁇ N” or “The logarithm of the CU size (log2CUSize) is smaller than Log2MinBipredCUSize To limit bi-prediction.
  • the bi-prediction restriction can be adaptively performed according to the intention of the moving image encoding device 2 (information included in the encoded data).
  • the moving image encoding device 2 may encode information regarding the bi-prediction restriction in accordance with, for example, the resolution of the moving image and the performance of the moving image decoding device 1.
  • the moving picture decoding apparatus 1 can finely adjust the bi-prediction restriction in accordance with the resolution of the moving picture and the performance of the moving picture decoding apparatus 1.
  • FIG. 64 is a diagram illustrating another example of the syntax table regarding the bi-prediction restriction. As shown in FIG. 64, log2_min_coding_block_size_minus3 only needs to be encoded in the RBSP of the sequence parameter set of encoded data (SYN641).
  • S651 The bi-prediction restricted PU determination unit 1218A determines whether or not Log2MinCUSize is “3”.
  • Log2MinCUSize log2_min_coding_block_size_minus3 + 3. That is, in S651, it is determined whether or not the minimum CU size is 8 ⁇ 8 CU.
  • the bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N ⁇ N.
  • FIG. 66 is a diagram illustrating another example of the syntax table regarding the bi-prediction restriction.
  • log2_min_coding_block_size_minus3 SYN661
  • restrict_bipred_flag SYN663
  • inter_4x4_enabled_flag may be encoded in the RBSP of the sequence parameter set of encoded data (SYN 662).
  • the bi-prediction restricted PU determination unit 1218A determines whether or not restrict_bipred_flag is “0”.
  • the bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N ⁇ N.
  • bi-prediction restriction is performed in accordance with the minimum CU size in accordance with determination of a flag indicating whether or not bi-prediction restriction is performed. Therefore, it is possible to limit bi-prediction without additional encoding of information regarding bi-prediction restriction that directly specifies the minimum bi-prediction restriction CU size.
  • both the usable PU size and the usable bi-predicted PU size are controlled by the same Log2MinCUSize flag, so the processing amount and transfer amount associated with bi-prediction and the processing amount and transfer amount associated with single prediction are reduced. It is possible to limit in a balanced manner.
  • log2CUSize When the logarithmic value of CU size (log2CUSize) matches Log2MinCUSize and the PU mode is other than 2N ⁇ 2N” or “The logarithmic value of CU size (log2CUSize) is smaller than Log2MinCUSize "If", restrict bi-prediction.
  • restrict_bipred_flag is configured as a ternary flag, so that finer adjustment regarding bi-prediction restriction can be realized.
  • bi-prediction limitation in 8 ⁇ 8 PU can be performed, or bi-prediction limitation in 8 ⁇ 8 PU, 16 ⁇ 8 PU, and 8 ⁇ 16 PU can be performed.
  • bi-prediction limitation in 8 ⁇ 8 PU, 16 ⁇ 8 PU, and 8 ⁇ 16 PU can be performed.
  • a wide range of options can be provided for bi-prediction restriction.
  • FIG. 69 is a diagram illustrating still another example of the syntax table for bi-prediction restriction.
  • log2_min_coding_block_size_minus3 (SYN691) and restrict_motion_compensation_flag (SYN692) are encoded in the RBSP of the sequence parameter set of encoded data.
  • restrict_motion_compensation_flag is a combination of! Inter_4x4_enabled_flag (“!” Represents a logical negation logical operator) and restrict_motion_compensation_flag. That is, restrict_motion_compensation_flag is a flag indicating whether or not inter 4 ⁇ 4 is prohibited, and is also a flag indicating whether or not bi-prediction should be limited.
  • the bi-prediction restricted PU determination unit 1218A determines whether or not restrict_motion_compensation_flag is “0”.
  • the bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N ⁇ N.
  • a flag indicating whether or not bi-prediction restriction is performed also serves as a flag indicating that inter 4 ⁇ 4 PU is prohibited. According to this configuration example, the number of flags can be reduced, and bi-prediction restriction can be realized relatively easily.
  • the bi-prediction restricted PU determination unit 1218A determines whether the value of the level level_idc is less than a predetermined threshold value TH1.
  • the bi-prediction restricted PU determination unit 1218A further determines whether or not the level level_idc value is less than a predetermined threshold value TH2.
  • adaptive constraints and restrictions as shown in FIG. 60 can be realized.
  • the adaptive restriction / restriction as shown in FIG. 60 can also be realized by the level restriction that the encoded data restricts.
  • the bi-prediction conversion unit 1219A performs partial bi-prediction restriction on the derived merge candidate. More specifically, it is as shown below.
  • the bi-prediction conversion unit 1219A acquires the merge candidates derived by the adjacent merge candidate derivation unit 1212A and the temporal merge candidate derivation unit 1212B, respectively.
  • the bi-uni prediction conversion unit 1219A has obtained Limit bi-prediction for at least some of the merge candidates.
  • the bi-prediction conversion unit 1219A may select, for example, one head or two head merge candidates (bi-prediction) from adjacent merge candidates.
  • one or two of the adjacent merge candidates and one of the temporal merge candidates may be selected.
  • the inventors' experiments have shown that it is useful to perform bi-single transformation of temporal merge candidates, so bi-transformation is performed among the merge candidates.
  • a configuration in which a temporal merge candidate is included in a merge candidate is effective.
  • the bi-prediction conversion unit 1219A performs bi-conversion on the selected merge candidate. Since the dual conversion is as described above, the description thereof is omitted here.
  • FIG. 71 is a flowchart illustrating an example of a process flow of the merge motion compensation parameter derivation unit 1212 and the bi-prediction conversion unit 1219A.
  • the bi-predictive conversion unit 1219A performs bi-single conversion processing on the derived adjacent merge candidate (S714). .
  • S714 when it is determined that the bi-prediction restriction PU determination unit 1218A performs the bi-prediction restriction, the bi-prediction conversion unit 1219A performs a bi-conversion process on the first N adjacent merge candidates.
  • the dotted line indicates that S714 is executed in parallel with the processing of S711 to S713.
  • the bi-predictive conversion unit 1219A sequentially acquires the derived merge candidates one by one from the adjacent merge candidate deriving unit 1212A.
  • the present invention is not limited to this, and the bi-prediction conversion unit 1219A may acquire all the merge candidates derived in the adjacent merge candidate deriving unit 1212A in a lump.
  • the bi-predictive conversion unit 1219A performs bi-single conversion processing on the derived temporal merge candidate (S714).
  • the bi-prediction conversion unit 1219A may perform bi-single conversion processing on the first N temporal merge candidates, or may perform bi-single conversion processing on all temporal merge candidates.
  • the bi-single conversion process may be omitted.
  • the bi-prediction conversion unit 1219A sequentially acquires adjacent merge candidates from the adjacent merge candidate derivation unit 1212A.
  • the bi-prediction conversion unit 1219A performs bi-single conversion processing on the first N merge candidates. .
  • the bi-single conversion process is performed for some merge candidates, so that the processing load of the bi-single conversion process is reduced as compared with the case where the bi-single conversion process is performed for all merge candidates.
  • bi-conversion is performed on at least one temporal merge candidate, even if bi-prediction restriction is performed on an 8 ⁇ 8 PU having a relatively large PU size, an 8 ⁇ 8 PU temporal merge candidate is Since it is guaranteed that it is uni-prediction, that is, usable, it is possible to minimize a decrease in coding efficiency.
  • the merge candidate derivation process and the bi-single conversion process are executed in parallel, the process can be performed efficiently.
  • the bi-prediction conversion unit 1219A may be configured to perform bi-prediction processing after all merge candidates are derived and the merge candidate list is stored in the merge candidate storage unit 1212H.
  • the configuration shown in FIG. 72 is the merge candidate stored in the merge candidate storage unit 1212H based on the merge candidate list completion notification from the merge candidate derivation control unit 1212G in the configuration shown in FIG.
  • This is a bi-predictive conversion unit 1219B that performs bi-single conversion processing on the list.
  • FIG. 73 is a flowchart illustrating an example of a processing flow of the merge motion compensation parameter derivation unit 1212 and the bi-prediction conversion unit 1219B.
  • the bi-prediction restricted PU determination unit 1218A determines whether or not bi-prediction restriction is performed (S735).
  • the bi-prediction conversion unit 1219B When performing bi-prediction restriction (YES in S735), the bi-prediction conversion unit 1219B performs bi-conversion of the first N merge candidates in the merge candidate list (S736). Then, after execution of bi-single conversion, other merge candidates are derived (S737).
  • the bi-single conversion process is performed for some merge candidates, so that the processing load of the bi-single conversion process is reduced as compared with the case where the bi-single conversion process is performed for all merge candidates.
  • S731 to S733 can be configured in the same manner as S101 to S103, the configuration of the merge candidate generation process does not need to be significantly changed from FIG. Thus, a partial bi-prediction restriction process can be realized by a simple configuration change.
  • FIGS. 61 and 71 are configurations in which merge candidate derivation processing and bi-single conversion processing are executed in parallel, as already described.
  • a time table for a series of processes is, for example, as shown in FIG.
  • merge candidates A to E are derived.
  • two merge candidates are bi-transformed due to the restriction of bi-prediction. Further, it is assumed that it takes more time to derive merge candidates C and E than to derive merge candidates A, B, and D.
  • the merge candidates A and B are the first two merge candidates in the merge candidates A to E, and thus are subject to bi-serial conversion.
  • the bi-conversion of the merge candidates A and B is performed in parallel while the merge candidates C and E having a long processing time are being executed. For this reason, in the example shown in FIG. 74, when the derivation process of the merge candidates C and D ends, the list creation process is started, and the entire process ends when the list creation process ends.
  • the configuration shown in FIGS. 72 and 73 is a configuration that performs bi-single conversion processing after the merge candidate list is generated.
  • FIG. 75 a time chart of a series of processing is as shown in FIG. 75, for example.
  • merge candidates A to E are derived as in FIG. 74, and two of these merge candidates are bi-transformed due to the restriction of bi-prediction. Further, it is assumed that it takes more time to derive merge candidates C and E than to derive merge candidates A, B, and D.
  • the merge candidate list is completed, and then bi-serial conversion is performed.
  • the unique check is performed after the merge candidates after bi-serial conversion are stored in the merge candidate storage unit 1212H as a merge candidate list. Therefore, as shown in FIG. 75, in the example shown in FIG. 73, in the merge candidate included in the merge candidate list, the merge candidate included in the merge candidate list is compared with the merge candidate included in the merge candidate list. Candidate uniqueness is maintained.
  • a configuration of a type in which the bi-predictive conversion unit 1219A and the bi-predictive conversion unit 1219B are combined may be employed. That is, only a temporal merge candidate may be configured such that bi-serial conversion is performed when a merge candidate is derived (before the merge candidate list is stored), and bi-conversion is performed after the merge candidate list is stored for other merge candidates. In this case, it is possible to perform the bi-single conversion with a simple configuration while ensuring that the bi-single conversion is performed with the temporal merge candidate effective in the bi-prediction restriction in 8 ⁇ 8 PU.
  • bi-prediction conversion unit 1219B In the bi-prediction conversion unit 1219B, bi-uniform conversion may be performed according to the number of single predictions included in the merge candidate list.
  • the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion depending on whether or not the two motion vectors for the bi-prediction merge candidate are non-integer motion vectors.
  • the non-integer motion vector means that at least a part of the motion vector component is represented by a non-integer when the pixel position is expressed as an integer value.
  • a component in which all the motion vector components are represented by integers is called an integer motion vector.
  • an interpolation filter for generating an interpolated image is applied, which increases the processing load and increases the reference pixel range necessary for motion compensation.
  • the transfer amount tends to be high.
  • such filter processing is not essential.
  • the reference range required for motion compensation is the same as that of the target block. Therefore, when an integer motion vector is included in bi-prediction, even if bi-prediction is performed, the transfer amount and the processing amount do not increase so much.
  • the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may omit bi-conversion when at least one of the two motion vectors for the bi-prediction merge candidate is an integer motion vector.
  • the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion only when the two motion vectors for the bi-prediction merge candidate are both non-integer motion vectors.
  • bi-predictive conversion unit 1219A or the bi-predictive conversion unit 1219B may be configured as follows. In other words, bi-prediction conversion unit 1219A or bi-prediction conversion unit 1219B may omit bi-conversion when both motion vectors for bi-prediction merge candidates are both integer motion vectors.
  • the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion when at least one of the two motion vectors for the bi-prediction merge candidate is a non-integer motion vector.
  • the motion vector integer converting unit 1220 converts at least one component of one or more non-integer components included in the non-integer motion vector into an integer component.
  • the conversion by the motion vector integer converting unit 1220 is referred to as motion vector integer conversion.
  • the motion vector integer converting unit 1220 includes a bi-prediction when the merge candidate input from the adjacent merge candidate derivation unit 1212A or the temporal merge candidate derivation 1212B includes the bi-prediction. It is determined whether the two motion vectors for prediction are non-integer motion vectors. Then, when at least one of the two motion vectors of bi-prediction is a non-integer motion vector, the motion vector integerization unit 1220 converts the non-integer motion vector into an integer.
  • FIGS. 77 to 80 are diagrams illustrating specific examples of the integer processing in the motion vector integer converting unit 1220.
  • the motion vector is represented by a two-dimensional coordinate display of (X, Y).
  • the non-integer motion vector refers to a non-integer motion vector in which both the X component and the Y component are non-integers.
  • the motion vector integer converting unit 1220 may convert the X coordinate of the motion vector into an integer as illustrated in FIG.
  • each step S of the pseudo code illustrated in FIG. 77 will be described.
  • the motion vector integer converting unit 1220 may convert the Y coordinate of the motion vector into an integer as illustrated in FIG.
  • each step S of the pseudo code illustrated in FIG. 78 will be described.
  • the motion vector integer converting unit 1220 may convert the X coordinate and Y coordinate of the motion vector into integers as illustrated in FIG.
  • each step S of the pseudo code illustrated in FIG. 79 will be described.
  • the motion vector integer converting unit 1220 may convert the X coordinate and Y coordinate of the motion vector of one list into integers.
  • each step S of the pseudo code illustrated in FIG. 80 will be described.
  • At least one of the bi-prediction motion vectors is a non-integer motion vector in which both the X coordinate and the Y coordinate are non-integer components
  • at least one of the non-integer motion vectors having both the X coordinate and the Y coordinate has a non-integer component. If the non-integer component can be converted into the integer component, the processing amount and the transfer amount may be suppressed as compared with the case where the non-integer motion vector is processed as it is.
  • the reference range matches the target block, so that the processing amount and the transfer amount can be further reduced.
  • the motion vector integerization unit 1220 may apply the integer processing to a non-integer motion vector in which either one of the X coordinate and the Y coordinate is not a non-integer component.
  • FIG. 16 illustrates the configuration for performing the TU division decoding process, the transform coefficient decoding process, and the prediction residual derivation process in the moving image decoding apparatus 1, that is, the configurations of the TU information decoding unit 13 and the decoding module 10. It is a functional block diagram.
  • each unit will be described in the order of the TU information decoding unit 13 and the decoding module 10.
  • the TU information decoding unit 13 includes a TU partition setting unit 131 and a transform coefficient restoration unit 132.
  • the TU partition setting unit 131 sets the TU partition method based on the parameters decoded from the encoded data, the CU size, and the PU partition type. Further, the transform coefficient restoration unit 132 restores the prediction residual of each TU according to the TU partition set by the TU partition setting unit 131.
  • the TU division setting unit 131 includes a target region setting unit 1311, a division determination unit 1312, a division region setting unit (conversion unit division unit, division unit) 1313, and a conversion size determination information storage unit 1314.
  • the target area setting unit 1311 sets a target node that is a target area.
  • the target area setting unit 1311 sets the entire target CU as the initial value of the target area when the TU partitioning process is started for the target conversion tree.
  • the division depth is set to “0”.
  • the division determination unit 1312 uses the region division flag decoding unit 1031 to decode information (split_transform_flag) indicating whether or not to divide the target node set by the target region setting unit 1311, and based on the decoded information, Decide whether to split the node.
  • decode information split_transform_flag
  • the divided region setting unit 1313 sets a divided region for the target node determined to be divided by the division determining unit 1312. Specifically, the divided region setting unit 1313 adds 1 to the division depth for the target node determined to be divided, and based on the converted size determination information stored in the converted size determination information storage unit 1314. Divide the target node.
  • each target node obtained by the division is further set as a target region by the target region setting unit 1311.
  • target region setting “partition determination”, and “partition region setting” are performed by the target region setting unit 1311, the partition determination unit 1312, and the partition region setting unit 1313 for the target node that has been split.
  • a series of processes is repeated recursively.
  • the conversion size determination information storage unit 1314 stores conversion size determination information indicating the division method of the target node.
  • the transform size determination information is information that defines the correspondence between the CU size, the TU partition depth (trafoDepth), the PU partition type of the target PU, and the TU partition pattern.
  • TU partition patterns are defined according to the CU size, the TU partition depth (trafoDepth), and the PU partition type of the target PU. Note that “d” in the table indicates the division depth of the CU.
  • selectable PU partition types are defined according to the size of the CU.
  • the PU partition types are 2N ⁇ 2N, 2N ⁇ nU, 2N ⁇ nD, N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N. Either of these can be selected.
  • any of 2N ⁇ 2N, 2N ⁇ N, and N ⁇ 2N can be selected as the PU partition type.
  • a TU partition pattern at each TU partition depth is defined according to the CU size and PU partition type.
  • the size of the CU is 64 ⁇ 64, it is as follows. First, the TU division depth “0” is not defined, and a 64 ⁇ 64 CU is forcibly divided (indicated by * 1 in FIG. 17). This is because the maximum size of the conversion unit is defined as 32 ⁇ 32.
  • TU partition depths “1” and “2” define different TU partition patterns depending on whether only square quadtree partitioning is included or only non-square quadtree partitioning is included.
  • TU partition pattern in which the PU partition type is 2N ⁇ 2N and includes only a square quadtree partition, with a TU partition depth “1”, a 32 ⁇ 32 square quadtree partition, a TU partition depth “2” "Defines a 16x16 square quadtree partition.
  • PU partition type is any of 2N ⁇ 2N, 2N ⁇ nU, 2N ⁇ nD, N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N and includes only non-square quadtree partition Is as follows.
  • a 32 ⁇ 32 square quadtree partition is defined with a TU partition depth “1”. Subsequently, for the TU partition depth “2”, a 32 ⁇ 8 non-square quadtree partition is defined for the PU partition types: 2N ⁇ 2N, 2N ⁇ nU, and 2N ⁇ nD. : 8 ⁇ 32 non-square quadtree partitioning is defined for N ⁇ 2N, nL ⁇ 2N, and nR ⁇ 2N.
  • the case where the size of the CU is 8 ⁇ 8 is exemplified as follows.
  • selectable PU partition types are 2N ⁇ 2N, 2N ⁇ 2, and N ⁇ 2N.
  • an 8 ⁇ 8 square quadtree partition is defined at a TU partition depth “1”
  • a 4 ⁇ 4 square quadtree partition is defined at a TU partition depth “2”.
  • the TU division depth “3” is not defined, and is forcibly non-division (indicated by * 2 in FIG. 17).
  • FIG. 20 is a diagram illustrating an example of TU partitioning when the CU size is 32 ⁇ 32 and the PU partitioning type is 2N ⁇ N.
  • depth 0, the PU boundary B1 is indicated by a dotted line at the center in the region vertical direction.
  • the division determination unit 1312 determines whether or not the target node needs to be split based on information (split_transform_flag) indicating whether or not the target node is to be split.
  • the division determination unit 1312 determines to divide the target node.
  • the division area setting unit 1313 adds 1 to the depth, and sets a TU division pattern for the target node based on the conversion size determination information.
  • the target node is divided into four horizontally long rectangular regions TU0, TU1, TU2, and TU3 by the division method shown in FIG.
  • the division determination unit 1312 determines to divide TU1.
  • the target node TU1 is divided into four horizontally long rectangular areas TU1-0, TU1-1, TU1-2, and TU1-3 in the division method shown in FIG. .
  • a small PU size 1314A and a large PU size 1314B which are definition information, are provided.
  • the small PU size 1314A is defined such that rectangular transformation is applied to a PU having a small size among PUs divided asymmetrically.
  • the large PU size 1314B is defined such that square transformation is applied to a PU having a large size among PUs asymmetrically divided.
  • the divided region setting unit 1313 sets a divided region by referring to either the definition information of the small PU size 1314A or the definition information of the large PU size 1314B according to the size of the asymmetrically divided PU. To do.
  • FIG. 21 is a diagram illustrating an example of TU partitioning according to the above configuration example when the PU partition type is 2N ⁇ nU.
  • depth 0, the PU boundary B2 is indicated by a dotted line above the center in the region vertical direction.
  • the division determination unit 1312 determines whether or not the target node needs to be split based on information (split_transform_flag) indicating whether or not the target node is to be split.
  • the division determination unit 1312 determines to divide the target node.
  • the division area setting unit 1313 adds 1 to the depth, and sets a TU division pattern for the target node based on the conversion size determination information.
  • the divided region setting unit 1313 performs a horizontally-long rectangular TU partition for a small size PU among the PUs asymmetrically divided according to the small PU size 1314A.
  • the divided region setting unit 1313 includes a square TU partition for a large size PU among the PUs asymmetrically divided according to the large PU size 1314B. Note that the divided region setting unit 1313 may include a rectangular TU divided region as shown in FIG. 21 for the region located on the PU boundary side.
  • the target node is divided into four regions of horizontally long rectangular TU0 and TU1 and square TU2 and TU3.
  • the division determination unit 1312 determines to divide TU0 and TU2.
  • TU0 is divided into four horizontally long rectangular areas, TU0-0, TU0-1, TU0-2, and TU0-3.
  • TU2 is divided into four horizontally long rectangular areas, TU2-0, TU2-1, TU2-2, and TU2-3.
  • the present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers. In the image decoding apparatus that decodes the prediction residual for each transform unit obtained in this way and restores the image by adding the prediction residual to the predicted image, the division type into the prediction units is different from the encoding unit.
  • a division type of a target coding unit that is the above-mentioned coding unit to be decoded including asymmetrical division that divides a size into prediction units or a symmetric division that divides a coding unit into a plurality of prediction units of the same size
  • the division type is asymmetric division, it is possible to select a conversion unit division method that can efficiently remove the correlation according to the size of the prediction unit included in the target coding unit.
  • the division region setting unit 1313 may divide the target node into non-squares.
  • the partition region setting unit 1313 refers to the square PU partition type 1314C and divides the target node into a non-square.
  • the partition region setting unit 1313 may divide the region into 32 ⁇ 8 nodes in the TU partition.
  • the partition region setting unit 1313 additionally decodes information indicating the TU partitioning scheme, and decodes the information. May be divided into any of 32 ⁇ 8, 16 ⁇ 16, and 8 ⁇ 32 nodes.
  • the divided region setting unit 1313 divides the target CU based on the size of the adjacent CU and the PU division type when the CU size is 32 ⁇ 32 size and the PU division type is 2N ⁇ 2N.
  • the TU size may be estimated. Further, the divided region setting unit 1313 may perform estimation as described in (i) to (iii) below.
  • the present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers.
  • the division method into the conversion units includes square and rectangular divisions
  • the unit includes a dividing unit that divides the target conversion unit by a rectangular division method.
  • a square prediction unit may be selected even though an edge exists in the region and the image has directionality. For example, when an object having a large number of horizontal edges is moving, since the motion is uniform within the object, a square prediction unit is selected. However, in such a case, in the conversion process, it is desirable to apply a conversion unit having a shape that is long in the horizontal direction along the horizontal edge.
  • the target conversion unit is divided by a rectangular division method.
  • the divided region setting unit 1313 divides as follows at each division depth when the CU size is 16 ⁇ 16 size and the PU division type is 2N ⁇ 2N. I do.
  • Dividing depth 1 ... Divide into 16x4 TUs.
  • Dividing depth 2 ... Divide into 4x4 TUs.
  • the scan order is unified without depending on the 16 ⁇ 16 CU PU partition type. Since the 4 ⁇ 4 TU has different PU partition types of 16 ⁇ 16 CU, and the scan order is not unified, the scan processing must be changed according to the PU partition type of 16 ⁇ 16 CU. It becomes complicated. Therefore, such ununiformity in scan order can be a bottleneck in processing.
  • the processing order can be simplified by unifying the scan order.
  • FIG. 22 shows the flow of TU partitioning when partitioning is performed according to the transform size determination information shown in FIG.
  • the partition region setting unit 1313 performs quadtree partitioning of the target node square.
  • the divided region setting unit 1313 further performs square quadtree division for each node divided into squares.
  • a recursive z-scan is used as the scan order. Specifically, it is as illustrated in FIG.
  • the partition region setting unit 1313 performs horizontally-long rectangular quadtree partitioning on the target node.
  • the divided region setting unit 1313 further performs square quadtree division on each node divided into horizontally long rectangles.
  • raster scan is used as the scan order of each TU. Specifically, it is as illustrated in FIG.
  • FIG. 23 shows the flow of TU partitioning when a region of PU partition type 2N ⁇ 2N is performed according to the square PU partition type 1314C.
  • the partition region setting unit 1313 performs horizontally-long rectangular quadtree partitioning on the target node.
  • the divided region setting unit 1313 further performs square quadtree division on each node divided into horizontally long rectangles.
  • the scan order can be unified to the raster scan between the case where the PU division type is 2N ⁇ nU and the case where it is 2N ⁇ 2N.
  • transform coefficient restoration unit includes a non-zero coefficient determination unit 1321 and a transform coefficient derivation unit 1322.
  • the non-zero coefficient determination unit 1321 uses the determination information decoding unit (coefficient decoding unit) 1032 to decode the presence / absence information of the non-zero conversion coefficient for each TU or conversion tree included in the target CU, and non-zero for each TU. It is determined whether a conversion coefficient exists.
  • the transform coefficient deriving unit 1322 uses the transform coefficient decoding unit (coefficient decoding unit) 1033 to restore the transform coefficient of each TU in which the non-zero transform coefficient exists, while the transform coefficient of each TU in which the non-zero transform coefficient does not exist. Is set to 0 (zero).
  • the decoding module 10 includes a region division flag decoding unit 1031, a determination information decoding unit 1032, a transform coefficient decoding unit 1033, and a context storage unit 1034.
  • the region division flag decoding unit 1031 decodes the syntax value from the binary included in the encoded data according to the encoded data and syntax type supplied from the division determination unit 1312.
  • the area division flag decoding unit 1031 decodes information (split_transform_flag) indicating whether or not to divide the target node.
  • the determination information decoding unit 1032 decodes the syntax value from the binary included in the encoded data according to the encoded data and the syntax type of the non-zero transform coefficient existence information supplied from the transform coefficient deriving unit 1322. Do.
  • the syntax decoded by the determination information decoding unit 1032 is specifically no_residual_data_flag, cbf_luma, cbf_cb, cbf_cr, and cbp.
  • the transform coefficient decoding unit 1033 decodes the syntax value from the binary included in the encoded data according to the encoded data of the transform coefficient supplied from the transform coefficient deriving unit 1322 and the syntax type.
  • the syntax decoded by the transform coefficient decoding unit 1033 is a level (level) that is an absolute value of the transform coefficient, a sign of the transform coefficient (sign), a length of run of consecutive zeros (run), and the like. is there.
  • the context storage unit 1034 stores a context that the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 refer to in the decoding process.
  • each of the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 includes a TU included in the smaller PU.
  • the syntax value related to the transform coefficient may be decoded using different contexts for the TU included in the larger PU.
  • such syntax types include non-zero transform coefficient flags, transform coefficient levels, transform coefficient runs, and non-zero transform coefficient presence / absence information at each node of the TU tree.
  • a combination of the syntaxes may be included.
  • the context storage unit 1034 includes the small PU size 1034A, which is a probability setting value corresponding to various syntax values related to transform coefficients in the context referred to in the TU included in the smaller PU, and the larger PU.
  • the large PU size 1034B that is the probability setting value in the context referred to in the TU to be stored may be stored.
  • the small PU size 1034A and the large PU size 1034B are probability setting values corresponding to different contexts.
  • the determination information decoding unit 1032 refers to the small PU size 1034A when the target TU is included in the small PU, while referring to the large PU size 1034B when the target TU is included in the larger PU.
  • Cbf (cbf_luma, cbf_cb, cbf_cr, etc.) in the TU is arithmetically decoded.
  • the transform coefficient decoding unit 1033 refers to the small PU size 1034A when the target TU is included in a small PU, and refers to the large PU size 1034B when the target TU is included in a larger PU. , Arithmetically decode transform coefficients (level, sign, run, etc.) in the target TU.
  • the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 have a small PU size when the target TU is included in the larger PU and the target TU is located closer to the smaller PU. Reference may be made to 1034A.
  • the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 have the small PU size.
  • variable-length decoding can be performed according to the occurrence probability of a transform coefficient in each region. .
  • the present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers.
  • the division type into the prediction units is a prediction unit of a different size.
  • the division type of the target prediction unit that is the prediction unit to be decoded is division into the asymmetric form
  • coefficient decoding means is provided for decoding transform coefficients with reference to different contexts between the small prediction unit and the large prediction unit obtained by the division.
  • variable length decoding according to the probability of occurrence of transform coefficients in the respective regions of transform units included in a small prediction unit and transform units included in a large prediction unit.
  • FIG. 24 is a flowchart illustrating an example of a flow of CU decoding processing (inter / skip CU) in the video decoding device 1.
  • the CU information decoding unit 11 decodes the CU prediction information for the target CU using the decoding module 10 (S11). This process is performed on a CU basis.
  • the CU prediction mode determination unit 111 decodes the skip flag SKIP using the decoding module 10. If the skip flag does not indicate a skip CU, the CU prediction mode determination unit 111 further decodes the CU prediction type information Pred_type using the decoding module 10.
  • the motion compensation parameter deriving unit 121 included in the PU information decoding unit 12 decodes the motion information (S12), and the predicted image generation unit 14 generates a predicted image by inter prediction based on the decoded motion information. (S13).
  • the TU information decoding unit 13 performs a TU division decoding process (S14). Specifically, in the TU information decoding unit 13, the TU partition setting unit 131 sets the TU partitioning method based on the parameters decoded from the encoded data, the CU size, and the PU partition type. This process is performed on a CU basis.
  • the TU information decoding unit 13 decodes the transform coefficient (S15), and the inverse quantization / inverse transform unit 15 derives a prediction residual from the decoded transform coefficient (S16).
  • the adder 17 adds the predicted image and the prediction residual to generate a decoded image (S17). This process is performed on a CU basis.
  • the moving image encoding device 2 is a device that generates and outputs encoded data # 1 by encoding the input image # 10.
  • FIG. 25 is a functional block diagram illustrating the configuration of the moving image encoding device 2.
  • the moving image encoding apparatus 2 includes an encoding setting unit 21, an inverse quantization / inverse conversion unit 22, a predicted image generation unit 23, an adder 24, a frame memory 25, a subtractor 26, A quantization unit 27 and an encoded data generation unit (encoding means) 29 are provided.
  • the encoding setting unit 21 generates image data related to encoding and various setting information based on the input image # 10.
  • the encoding setting unit 21 generates the next image data and setting information.
  • the encoding setting unit 21 generates the CU image # 100 for the target CU by sequentially dividing the input image # 10 into slice units and tree block units.
  • the encoding setting unit 21 generates header information H ′ based on the result of the division process.
  • the header information H ′ includes (1) information on the size and shape of the tree block belonging to the target slice and the position in the target slice, and (2) the size, shape and shape of the CU belonging to each tree block.
  • the encoding setting unit 21 refers to the CU image # 100 and the CU information CU 'to generate PT setting information PTI'.
  • the PT setting information PTI ' includes information on all combinations of (1) possible division patterns of the target CU for each PU and (2) prediction modes that can be assigned to each PU.
  • the encoding setting unit 21 calculates the cost of the combination of each division pattern and each prediction mode, and determines the lowest cost division pattern and prediction mode.
  • the encoding setting unit 21 supplies the CU image # 100 to the subtractor 26. In addition, the encoding setting unit 21 supplies the header information H ′ to the encoded data generation unit 29. Also, the encoding setting unit 21 supplies the PT setting information PTI ′ to the predicted image generation unit 23.
  • the inverse quantization / inverse transform unit 22 performs inverse quantization and inverse orthogonal transform on the quantized prediction residual for each block supplied from the transform / quantization unit 27, thereby predicting the prediction residual for each block. To restore.
  • the inverse orthogonal transform is as already described for the inverse quantization / inverse transform unit 15 shown in FIG.
  • the inverse quantization / inverse transform unit 22 integrates the prediction residual for each block according to the division pattern specified by the TT division information (described later), and generates the prediction residual D for the target CU.
  • the inverse quantization / inverse transform unit 22 supplies the prediction residual D for the generated target CU to the adder 24.
  • the predicted image generation unit 23 refers to the local decoded image P ′ and the PT setting information PTI ′ recorded in the frame memory 25 to generate a predicted image Pred for the target CU.
  • the predicted image generation unit 23 sets the prediction parameter obtained by the predicted image generation process in the PT setting information PTI ′, and transfers the set PT setting information PTI ′ to the encoded data generation unit 29. Note that the predicted image generation process performed by the predicted image generation unit 23 is the same as that performed by the predicted image generation unit 14 included in the video decoding device 1, and thus description thereof is omitted here.
  • the adder 24 adds the predicted image Pred supplied from the predicted image generation unit 23 and the prediction residual D supplied from the inverse quantization / inverse transform unit 22 to thereby obtain the decoded image P for the target CU. Generate.
  • Decoded decoded image P is sequentially recorded in the frame memory 25.
  • decoded images corresponding to all tree blocks decoded prior to the target tree block for example, all tree blocks preceding in the raster scan order
  • the subtractor 26 generates a prediction residual D for the target CU by subtracting the prediction image Pred from the CU image # 100.
  • the subtractor 26 supplies the generated prediction residual D to the transform / quantization unit 27.
  • the transform / quantization unit 27 generates a quantized prediction residual by performing orthogonal transform and quantization on the prediction residual D.
  • the orthogonal transform refers to an orthogonal transform from the pixel region to the frequency region.
  • Examples of inverse orthogonal transformation include DCT transformation (DiscretecreCosine Transform), DST transformation (Discrete Sine Transform), and the like.
  • the transform / quantization unit 27 refers to the CU image # 100 and the CU information CU 'and determines a division pattern of the target CU into one or a plurality of blocks. Further, according to the determined division pattern, the prediction residual D is divided into prediction residuals for each block.
  • the transform / quantization unit 27 generates a prediction residual in the frequency domain by orthogonally transforming the prediction residual for each block, and then quantizes the prediction residual in the frequency domain to Generate quantized prediction residuals.
  • the transform / quantization unit 27 generates the quantization prediction residual for each block, TT division information that specifies the division pattern of the target CU, information about all possible division patterns for each block of the target CU, and TT setting information TTI ′ including is generated.
  • the transform / quantization unit 27 supplies the generated TT setting information TTI ′ to the inverse quantization / inverse transform unit 22 and the encoded data generation unit 29.
  • the PU information generation unit 30 encodes the PT setting information PTI 'and derives the PT setting information PTI when the prediction type indicated in the PT setting information PTI' is inter prediction. Further, PTI setting information PTI ′ for the merge candidate is generated and supplied to the encoding setting unit 21.
  • the encoded data generation unit 29 encodes header information H ′, TT setting information TTI ′, and PT setting information PTI ′, and multiplexes the encoded header information H, TT setting information TTI, and PT setting information PTI. Coded data # 1 is generated and output.
  • the video encoding device 2 includes a configuration corresponding to each configuration of the video decoding device 1.
  • “correspondence” means that the same processing or the reverse processing is performed.
  • the prediction image generation process of the prediction image generation unit 14 included in the video decoding device 1 and the prediction image generation process of the prediction image generation unit 23 included in the video encoding device 2 are the same. .
  • the process of decoding a syntax value from a bit string in the video decoding device 1 corresponds to a process opposite to the process of encoding a bit string from a syntax value in the video encoding device 2. Yes.
  • each configuration in the video encoding device 2 corresponds to the CU information decoding unit 11, the PU information decoding unit 12, and the TU information decoding unit 13 of the video decoding device 1. . Thereby, the operation and function of each component in the moving image encoding device 2 will be clarified in more detail.
  • the encoded data generation unit 29 corresponds to the decoding module 10. More specifically, the decoding module 10 derives a syntax value based on the encoded data and the syntax type, whereas the encoded data generation unit 29 encodes the code based on the syntax value and the syntax type. Generate data.
  • the encoding setting unit 21 corresponds to the CU information decoding unit 11 of the video decoding device 1.
  • a comparison between the encoding setting unit 21 and the CU information decoding unit 11 is as follows.
  • the CU information decoding unit 11 supplies the encoded data and syntax type related to the CU prediction type information to the decoding module 10, and determines the PU partition type based on the CU prediction type information decoded by the decoding module 10.
  • the encoding setting unit 21 determines the PU partition type, generates CU prediction type information, and supplies the syntax value and syntax type related to the CU prediction type information to the encoded data generation unit 29. To do.
  • the encoded data generation unit 29 may have the same configuration as the binarized information storage unit 1012, the context storage unit 1013, and the probability setting storage unit 1014 included in the decoding module 10.
  • the PU information generation unit 30 and the predicted image generation unit 23 correspond to the PU information decoding unit 12 and the predicted image generation unit 14 of the video decoding device 1. These are compared as follows.
  • the PU information decoding unit 12 supplies the encoded data related to the motion information and the syntax type to the decoding module 10 and derives a motion compensation parameter based on the motion information decoded by the decoding module 10. Further, the predicted image generation unit 14 generates a predicted image based on the derived motion compensation parameter.
  • the PU information generation unit 30 and the predicted image generation unit 23 determine a motion compensation parameter in the predicted image generation process, and generate a syntax value and syntax type related to the motion compensation parameter as an encoded data generation unit. 29.
  • the PU information generation unit 30 and the predicted image generation unit 23 may have the same configuration as the merge candidate priority information storage unit 122 and the reference frame setting information storage unit 123 included in the PU information decoding unit 12.
  • the transform / quantization unit 27 corresponds to the TU information decoding unit 13 and the inverse quantization / inverse transform unit 15 of the video decoding device 1. These are compared as follows.
  • the TU division setting unit 131 included in the TU information decoding unit 13 supplies the encoded data and syntax type related to information indicating whether or not to perform node division to the decoding module 10, and the node decoded by the decoding module 10 TU partitioning is performed based on information indicating whether to perform the partitioning.
  • the transform coefficient restoration unit 132 included in the TU information decoding unit 13 supplies the determination information and the encoded data related to the transform coefficient and the syntax type to the decoding module 10, and the determination information and the transform coefficient decoded by the decoding module 10. Based on the above, a conversion coefficient is derived.
  • the transform / quantization unit 27 determines the division method of the TU division, and sends the syntax value and the syntax type related to the information indicating whether or not to perform node division to the encoded data generation unit 29. Supply.
  • the transform / quantization unit 27 supplies the encoded data generation unit 29 with syntax values and syntax types related to the quantized transform coefficients obtained by transforming and quantizing the prediction residual.
  • transform / quantization unit 27 may have the same configuration as the transform size determination information storage unit 1314 included in the TU partition setting unit 131.
  • the encoded data generation unit 29 may have the same configuration as the context storage unit 1034 included in the decoding module 10.
  • FIG. 55 is a block diagram illustrating a configuration of the PU information generation unit 30.
  • the PU information generation unit 30 includes a motion compensation parameter generation unit 301 for generating a motion compensation parameter.
  • the motion compensation parameter generation unit 301 includes a bi-prediction restricted PU determination unit 1218, a bi-prediction conversion unit 1219, a merge motion compensation parameter generation unit 3012, and a basic motion compensation parameter generation unit 3013.
  • the merge motion compensation parameter generation unit 3012 generates merge candidates and supplies the merge candidates to the encoding setting unit 21 as PTI setting information PTI ′.
  • the merge motion compensation parameter generation unit 3012 outputs an index for selecting a merge candidate as PT setting information PTI.
  • the basic motion compensation parameter generation unit 3013 encodes the P setting information PTI from the input PTI setting information PTI ′, here the motion compensation parameter.
  • FIG. 56 is a block diagram illustrating a configuration of the merge motion compensation parameter generation unit 3012. Note that the motion parameter derivation of the skip PU is also performed by the merge motion compensation parameter generation unit 3012.
  • the merge motion compensation parameter generation unit 3012 includes an adjacent merge candidate derivation unit 1212A, a temporal merge candidate derivation unit 1212B, a unique candidate derivation unit 1212C, a combined bi-prediction merge candidate derivation unit 1212D, a non-scale bi-prediction merge candidate derivation unit 1212E, and zero.
  • a vector merge candidate derivation unit 1212F, a merge candidate derivation control unit 1212G, and a merge candidate storage unit 1212H are included.
  • the merge candidate derivation process uses the bi-prediction conversion unit 1219 for a small size PU that is determined to be subjected to bi-prediction restriction by the bi-prediction restricted PU determination unit 1218.
  • bi-prediction only a single prediction merge candidate is derived by converting the motion compensation parameter into a single prediction. Details of each part have already been described and will be omitted.
  • the merge motion compensation parameter generation unit 3012 generates merge candidates and supplies them to the encoding setting unit 21 as PTI setting information PTI '. Further, the merge index is supplied to the encoded data generation unit 29 as PT setting information PTI.
  • FIG. 57 is a block diagram showing a configuration of the basic motion compensation parameter generation unit 3013.
  • the basic motion compensation parameter generation unit 3013 includes an adjacent motion vector candidate derivation unit 1213A, a temporal motion vector candidate derivation unit 1213B, a zero vector merge candidate derivation unit 1213F, a motion vector candidate derivation control unit 1213G, a motion vector candidate storage unit 1213H, A vector candidate selection unit 3013A and a difference motion vector calculation unit 3013B are included.
  • the process of deriving the predicted motion vector candidate is the same as that of the basic motion compensation parameter deriving unit 1213 shown in FIG.
  • the motion vector candidate selection unit 3013A selects a predicted motion vector candidate closest to the supplied predicted motion vector from the predicted motion vector candidates stored in the motion vector candidate storage unit 1213H, and derives the index as a predicted motion vector index. To do.
  • the selected prediction motion vector is supplied to the difference motion vector calculation unit 3013B.
  • the difference motion vector calculation unit 3013B calculates a difference between the supplied motion vector and the predicted motion vector as a difference motion vector.
  • the inter prediction flag, the reference index number, the derived prediction motion vector index, and the difference motion vector are supplied to the encoded data generation unit 29 as PT setting information PT.
  • the encoded data generation unit 29 Information indicating the type of division may be encoded without using the CABAC context.
  • the specific configuration is the same as that described in, for example, the configuration example [1-1] of the video decoding device 1, and thus the description thereof is omitted here.
  • the “CU prediction mode decoding unit 1011”, the “probability setting storage unit 1014”, and the “decoding (performing)” in the description of the configuration example [1-1] are respectively referred to as “encoded data generation unit 29”, “ The “configuration corresponding to the probability setting storage unit 1014” and “encoding (perform)” shall be read.
  • the encoded data generation unit 29 may be configured to encode CU prediction type information with reference to binarization information.
  • the specific configuration is the same as that described in, for example, the configuration example [1-2] of the video decoding device 1, and thus the description thereof is omitted here.
  • “CU prediction mode decoding unit 1011”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of configuration example [1-2] are respectively referred to as “encoded data generation unit 29”.
  • the encoded data generation unit 29 may be configured to encode a short code for an intra CU in a small size CU. Good.
  • CU prediction mode decoding unit 1011 “context storage unit 1013”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of the configuration example [1-3] are “ It shall be read as “encoded data generation unit 29”, “configuration corresponding to context storage unit 1013”, “configuration corresponding to binarized information storage unit 1012”, and “encoding (perform)”.
  • the encoded data generation unit 29 changes the interpretation of the bin sequence with reference to the prediction parameter assigned to the adjacent region You may comprise.
  • the specific configuration is the same as that described in, for example, the configuration example [1-4] of the video decoding device 1, and thus the description thereof is omitted here.
  • “CU prediction mode decoding unit 1011”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of the configuration example [1-4] are respectively referred to as “encoded data generation unit 29”.
  • the PU information generation unit 30 has a symmetric PU partition type when the PU partition type is asymmetric.
  • the priorities of the merge candidates may be determined by a method different from that in the case of.
  • the specific configuration is the same as that described in, for example, the configuration example [2-1] of the video decoding device 1, and thus the description thereof is omitted here.
  • the “motion compensation parameter derivation unit 121” and the “merge candidate priority information storage unit 122” in the description of the configuration example [2-1] are referred to as the “motion compensation parameter generation unit 301” and the “merge candidate priority”, respectively. It shall be read as “a configuration corresponding to the rank information storage unit 122”.
  • the PU information generation unit 30 depends on a combination of a CU size and whether or not the CU is a CU that performs skip / merge. It may be configured to change merge candidates.
  • the specific configuration is the same as that described in, for example, the configuration example [2-2] of the video decoding device 1, and thus the description thereof is omitted here.
  • the “motion compensation parameter derivation unit 121” and the “merge candidate priority information storage unit 122” in the description of the configuration example [2-2] are referred to as the “motion compensation parameter generation unit 301” and the “merge candidate priority”, respectively. It shall be read as “a configuration corresponding to the rank information storage unit 122”.
  • [2-3] ′ Determination of Reference Frame Number
  • the motion compensation parameter generation unit 301 may be configured as shown in the following [2-3-1] ′ to [2-3-4] ′, thereby You may determine which prediction system of single prediction and bi-prediction is applied in inter prediction.
  • the motion compensation parameter generation unit 301 refers to the reference frame setting information, and applies which prediction method of uni-prediction or bi-prediction in inter prediction May be determined.
  • the specific configuration is the same as that described in, for example, the configuration example [2-3-1] of the video decoding device 1, and thus the description thereof is omitted here.
  • the “motion compensation parameter derivation unit 121” and the “reference frame setting information storage unit 123” in the description of the configuration example [2-3-1] are referred to as the “motion compensation parameter generation unit 301” and the “reference frame”, respectively. It shall be read as “a configuration corresponding to the setting information storage unit 123”.
  • the small-size prediction direction to single prediction, it is possible to significantly reduce the amount of processing required for predictive image generation in the motion compensation parameter generation unit 301. Further, by limiting the merge candidates to single prediction in a small size PU, it is possible to reduce the amount of processing necessary for predictive image generation. Furthermore, by omitting the derivation of bi-predictive merge candidates in a small size PU, it is possible to reduce the amount of processing necessary for derivation of merge candidates.
  • the PU information generation unit 30 may determine and code the size to limit bi-prediction.
  • a specific configuration is as shown in FIG.
  • the configuration shown in FIG. 81 is obtained by changing the bi-prediction restricted PU determination unit 1218 to a bi-prediction restricted PU determination unit 1218A in the PU information generation unit 30 shown in FIGS.
  • the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-2] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
  • the PU information generation unit 30 may perform partial bi-prediction restriction.
  • a specific configuration is as shown in FIG. 81 and FIG.
  • the configuration shown in FIG. 81 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219A in the PU information generation unit 30 shown in FIGS.
  • the configuration shown in FIG. 82 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219B in the PU information generation unit 30 shown in FIGS.
  • the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-3] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
  • the PU information generation unit 30 may perform motion vector integer conversion.
  • a specific configuration is as shown in FIG.
  • the configuration shown in FIG. 83 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219A in the PU information generation unit 30 shown in FIGS.
  • the configuration shown in FIG. 82 is obtained by changing the bi-prediction conversion unit 1219 to a motion vector integer conversion unit 1220 in the PU information generation unit 30 shown in FIGS.
  • the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-4] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
  • the moving picture encoding apparatus 2 of this configuration uses a PU information generation unit 30 shown in FIG.
  • the PU information generation unit 30 includes a motion compensation parameter generation unit 301.
  • the motion compensation parameter generation unit 301 includes a merge motion compensation parameter generation unit 3012 and a basic motion compensation parameter generation unit 3013.
  • a motion compensation parameter restriction unit 3014 is provided instead of the prediction restriction PU determination unit 1218.
  • bi-prediction conversion unit 1219 is not included because bi-conversion of merge candidates is not performed.
  • bi-prediction conversion unit 1219 is included to perform bi-single conversion of merge candidates in the case of a small PU size. It may be configured.
  • the motion compensation parameter restriction unit 3014 receives PU size information and PTI setting information PTI ', and calculates an additional cost according to the motion compensation parameter of the PTI setting information PTI'.
  • the additional cost is transmitted to the encoding setting unit 21. Since the transmitted additional cost is added to the minimum cost, selection of a specific motion compensation parameter can be prevented by setting a large additional cost.
  • the motion compensation parameter restriction unit 3014 determines whether the value of the level level_idc is less than a predetermined threshold value TH1.
  • the motion compensation parameter restriction unit 3014 further determines whether the value of the level level_idc is less than a predetermined threshold TH2.
  • the additional cost is set sufficiently large. If not, the additional cost is set to zero.
  • inter_4x4_enable_flag is used as a flag for limiting the motion compensation parameter, but other flags (for example, use_restricted_prediction) for limiting the use of 4 ⁇ 4 PU may be used.
  • the additional cost is set sufficiently large. If not, the additional cost is set to zero.
  • the motion compensation parameter restriction unit 3014 restricts the usable PU size by restricting the usable CU size. That is, the logarithmic value Log2MinCuSize of the CU size is limited to 4 or more. Limit log2_min_cu_size_minus3 to 1 or more.
  • the transform / quantization unit 27 has a PU partition type of In the case of asymmetrical configuration, a rectangular (non-square) transformation may be applied to the smaller PU, while a square transformation may be applied to the larger PU.
  • the specific configuration is the same as that described in, for example, the configuration example [3-1] of the video decoding device 1, and thus the description thereof is omitted here.
  • “target region setting unit 1311”, “division determining unit 1312”, and “divided region setting unit 1313” in the description of the configuration example [3-1] shall be read as “transformation / quantization unit 27”.
  • the “conversion size determination information storage unit 1314” in the description of the configuration example [3-1] is replaced with “a configuration corresponding to the conversion size determination information storage unit 1314”.
  • [3-2] Example of configuration in which non-rectangular transformation is applied when some of the PU partition types are square partitions.
  • the transform / quantization unit 27 The structure divided
  • the transform / quantization unit 27 has a uniform scan order at each division depth when the CU size is 16 ⁇ 16 size and the PU division type is 2N ⁇ 2N.
  • the configuration may be such that the division is performed as possible.
  • the specific configuration is the same as that described in, for example, the configuration example [3-2] of the video decoding device 1, and thus the description thereof is omitted here.
  • the “partition area setting unit 1313” and the “transformed size determination information storage unit 1314” in the description of the configuration example [3-2] are the “transformation / quantization unit 27” and the “transformed size determination information storage”, respectively. It should be read as “a configuration corresponding to the unit 1314”.
  • the encoded data generation unit 29 includes a TU included in a smaller PU and a larger PU.
  • the configuration may be such that at least one of the non-zero transform coefficient presence information and the transform coefficient is encoded using a different context for the TU included in the.
  • the specific configuration is the same as that described in, for example, the configuration example [3-3] of the video decoding device 1, and thus the description thereof is omitted here.
  • “determination information decoding unit 1032” and “transform coefficient decoding unit 1033” in the description of the configuration example [3-3] should be read as “encoded data generation unit 29”.
  • “decoding (perform)” and “context storage unit 1034” in the description of the configuration example [3-3] are referred to as “encoding (perform)” and “configuration corresponding to the context storage unit 1034”, respectively. It shall be replaced.
  • FIG. 24 is a flowchart illustrating an example of a flow of CU encoding processing (inter / skip CU) in the moving image encoding device 2.
  • the encoding setting unit 21 determines CU prediction information for the target CU, and the encoded data generation unit 29 encodes the CU prediction information determined by the encoding setting unit 21. (S21). This process is performed on a CU basis.
  • the encoding setting unit 21 determines whether or not the target CU is a skip CU. When the target CU is a skip CU, the encoding setting unit 21 causes the encoded data generation unit 20 to encode the skip flag SKIP. When the target CU is not a skip CU, the encoding setting unit 21 causes the encoded data generation unit 20 to encode the CU prediction type information Pred_type.
  • the predicted image generation unit 23 derives motion information
  • the encoded data generation unit 29 encodes the motion information derived by the predicted image generation unit 23 (S22).
  • the predicted image generation unit 14 generates a predicted image by inter prediction based on the derived motion information (S23).
  • the transform / quantization unit 27 performs TU division coding processing (S24). Specifically, the transform / quantization unit 27 sets a TU partitioning scheme based on the CU size and PU partition type of the target CU. This process is performed on a CU basis.
  • the transform / quantization unit 27 transforms / quantizes the prediction residual into transform coefficients (S25), and the encoded data generation unit 29 encodes the transformed / quantized transform coefficients (S26).
  • the inverse quantization / inverse transform unit 22 performs inverse quantization / inverse transform on the transformed / quantized transform coefficient to restore the prediction residual, and the adder 24 restores the predicted image and the prediction residual. Is added to generate a decoded image (S27). This process is performed on a CU basis.
  • the above-described moving image encoding device 2 and moving image decoding device 1 can be used by being mounted on various devices that perform transmission, reception, recording, and reproduction of moving images.
  • the moving image may be a natural moving image captured by a camera or the like, or may be an artificial moving image (including CG and GUI) generated by a computer or the like.
  • moving image encoding device 2 and moving image decoding device 1 can be used for transmission and reception of moving images.
  • FIG. 27 is a block diagram illustrating a configuration of a transmission device PROD_A in which the moving image encoding device 2 is mounted.
  • the transmission apparatus PROD_A modulates a carrier wave with an encoding unit PROD_A1 that obtains encoded data by encoding a moving image, and with the encoded data obtained by the encoding unit PROD_A1.
  • a modulation unit PROD_A2 that obtains a modulation signal and a transmission unit PROD_A3 that transmits the modulation signal obtained by the modulation unit PROD_A2 are provided.
  • the moving image encoding apparatus 2 described above is used as the encoding unit PROD_A1.
  • the transmission device PROD_A is a camera PROD_A4 that captures a moving image, a recording medium PROD_A5 that records the moving image, an input terminal PROD_A6 that inputs the moving image from the outside, as a supply source of the moving image input to the encoding unit PROD_A1.
  • An image processing unit A7 that generates or processes an image may be further provided.
  • FIG. 27A illustrates a configuration in which the transmission apparatus PROD_A includes all of these, but a part may be omitted.
  • the recording medium PROD_A5 may be a recording of a non-encoded moving image, or a recording of a moving image encoded by a recording encoding scheme different from the transmission encoding scheme. It may be a thing. In the latter case, a decoding unit (not shown) for decoding the encoded data read from the recording medium PROD_A5 according to the recording encoding method may be interposed between the recording medium PROD_A5 and the encoding unit PROD_A1.
  • FIG. 27 is a block diagram illustrating a configuration of the receiving device PROD_B in which the moving image decoding device 1 is mounted.
  • the receiving device PROD_B includes a receiving unit PROD_B1 that receives a modulated signal, a demodulating unit PROD_B2 that obtains encoded data by demodulating the modulated signal received by the receiving unit PROD_B1, and a demodulator.
  • a decoding unit PROD_B3 that obtains a moving image by decoding the encoded data obtained by the unit PROD_B2.
  • the moving picture decoding apparatus 1 described above is used as the decoding unit PROD_B3.
  • the receiving device PROD_B has a display PROD_B4 for displaying a moving image, a recording medium PROD_B5 for recording the moving image, and an output terminal for outputting the moving image to the outside as a supply destination of the moving image output by the decoding unit PROD_B3.
  • PROD_B6 may be further provided.
  • FIG. 27B illustrates a configuration in which the reception apparatus PROD_B includes all of these, but a part of the configuration may be omitted.
  • the recording medium PROD_B5 may be used for recording a non-encoded moving image, or may be encoded using a recording encoding method different from the transmission encoding method. May be. In the latter case, an encoding unit (not shown) for encoding the moving image acquired from the decoding unit PROD_B3 according to the recording encoding method may be interposed between the decoding unit PROD_B3 and the recording medium PROD_B5.
  • the transmission medium for transmitting the modulation signal may be wireless or wired.
  • the transmission mode for transmitting the modulated signal may be broadcasting (here, a transmission mode in which the transmission destination is not specified in advance) or communication (here, transmission in which the transmission destination is specified in advance). Refers to the embodiment). That is, the transmission of the modulation signal may be realized by any of wireless broadcasting, wired broadcasting, wireless communication, and wired communication.
  • a terrestrial digital broadcast broadcasting station (broadcasting equipment or the like) / receiving station (such as a television receiver) is an example of a transmitting device PROD_A / receiving device PROD_B that transmits and receives a modulated signal by wireless broadcasting.
  • a broadcasting station (such as broadcasting equipment) / receiving station (such as a television receiver) of cable television broadcasting is an example of a transmitting device PROD_A / receiving device PROD_B that transmits and receives a modulated signal by cable broadcasting.
  • a server workstation etc.
  • Client television receiver, personal computer, smart phone etc.
  • VOD Video On Demand
  • video sharing service using the Internet is a transmitting device for transmitting and receiving modulated signals by communication.
  • PROD_A / reception device PROD_B usually, either a wireless or wired transmission medium is used in a LAN, and a wired transmission medium is used in a WAN.
  • the personal computer includes a desktop PC, a laptop PC, and a tablet PC.
  • the smartphone also includes a multi-function mobile phone terminal.
  • the video sharing service client has a function of encoding a moving image captured by the camera and uploading it to the server. That is, the client of the video sharing service functions as both the transmission device PROD_A and the reception device PROD_B.
  • moving image encoding device 2 and moving image decoding device 1 can be used for recording and reproduction of moving images.
  • FIG. 28 is a block diagram showing a configuration of a recording apparatus PROD_C in which the above-described moving picture encoding apparatus 2 is mounted.
  • the recording device PROD_C includes an encoding unit PROD_C1 that obtains encoded data by encoding a moving image, and the encoded data obtained by the encoding unit PROD_C1 on the recording medium PROD_M.
  • the moving image encoding apparatus 2 described above is used as the encoding unit PROD_C1.
  • the recording medium PROD_M may be of a type built in the recording device PROD_C, such as (1) HDD (Hard Disk Drive) or SSD (Solid State Drive), or (2) SD memory. It may be of the type connected to the recording device PROD_C, such as a card or USB (Universal Serial Bus) flash memory, or (3) DVD (Digital Versatile Disc) or BD (Blu-ray Disc: registration) Or a drive device (not shown) built in the recording device PROD_C.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • SD memory such as a card or USB (Universal Serial Bus) flash memory, or (3) DVD (Digital Versatile Disc) or BD (Blu-ray Disc: registration) Or a drive device (not shown) built in the recording device PROD_C.
  • the recording device PROD_C is a camera PROD_C3 that captures moving images as a supply source of moving images to be input to the encoding unit PROD_C1, an input terminal PROD_C4 for inputting moving images from the outside, and reception for receiving moving images.
  • the unit PROD_C5 and an image processing unit C6 that generates or processes an image may be further provided.
  • FIG. 28A a configuration in which the recording apparatus PROD_C includes all of these is illustrated, but a part of the configuration may be omitted.
  • the receiving unit PROD_C5 may receive a non-encoded moving image, or may receive encoded data encoded by a transmission encoding scheme different from the recording encoding scheme. You may do. In the latter case, a transmission decoding unit (not shown) that decodes encoded data encoded by the transmission encoding method may be interposed between the reception unit PROD_C5 and the encoding unit PROD_C1.
  • Examples of such a recording device PROD_C include a DVD recorder, a BD recorder, and an HDD (Hard Disk Drive) recorder (in this case, the input terminal PROD_C4 or the receiving unit PROD_C5 is a main supply source of moving images).
  • a camcorder in this case, the camera PROD_C3 is a main source of moving images
  • a personal computer in this case, the receiving unit PROD_C5 or the image processing unit C6 is a main source of moving images
  • a smartphone is also an example of such a recording device PROD_C.
  • FIG. 28 (B) of FIG. 28 is a block showing a configuration of a playback device PROD_D equipped with the above-described video decoding device 1.
  • the playback device PROD_D reads a moving image by decoding a read unit PROD_D1 that reads encoded data written to the recording medium PROD_M and a coded data read by the read unit PROD_D1. And a decoding unit PROD_D2 to be obtained.
  • the moving picture decoding apparatus 1 described above is used as the decoding unit PROD_D2.
  • the recording medium PROD_M may be of the type built into the playback device PROD_D, such as (1) HDD or SSD, or (2) such as an SD memory card or USB flash memory, It may be of a type connected to the playback device PROD_D, or (3) may be loaded into a drive device (not shown) built in the playback device PROD_D, such as DVD or BD. Good.
  • the playback device PROD_D has a display PROD_D3 that displays a moving image, an output terminal PROD_D4 that outputs the moving image to the outside, and a transmission unit that transmits the moving image as a supply destination of the moving image output by the decoding unit PROD_D2.
  • PROD_D5 may be further provided.
  • FIG. 28B illustrates a configuration in which the playback apparatus PROD_D includes all of these, but some of the configurations may be omitted.
  • the transmission unit PROD_D5 may transmit an unencoded moving image, or transmits encoded data encoded by a transmission encoding method different from the recording encoding method. You may do. In the latter case, it is preferable to interpose an encoding unit (not shown) that encodes a moving image using an encoding method for transmission between the decoding unit PROD_D2 and the transmission unit PROD_D5.
  • Examples of such a playback device PROD_D include a DVD player, a BD player, and an HDD player (in this case, an output terminal PROD_D4 to which a television receiver or the like is connected is a main supply destination of moving images).
  • a television receiver in this case, the display PROD_D3 is a main supply destination of moving images
  • a digital signage also referred to as an electronic signboard or an electronic bulletin board
  • the display PROD_D3 or the transmission unit PROD_D5 is the main supply of moving images.
  • An image decoding apparatus uses a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction.
  • a bi-prediction restriction unit is provided for restricting the bi-prediction to the prediction unit.
  • An image decoding apparatus includes a merge candidate derivation unit that derives a merge candidate based on a motion compensation parameter of an adjacent prediction unit in a process of deriving a motion compensation parameter of a prediction unit as a merge candidate. If the merge candidate to be derived is the bi-prediction, the bi-prediction restriction unit converts the bi-prediction into the single prediction.
  • the image decoding apparatus uses at least two prediction list usage flags indicating whether or not a reference picture list is used, and the at least two prediction list usage flags indicate the reference picture list.
  • the bi-prediction restriction unit converts one of the at least two prediction list use flags to indicate that the reference picture list is not used.
  • the bi-prediction restriction unit does not use the prediction list use flag indicating that the L1 list that is one of the reference picture lists is used. As shown.
  • the size of the prediction unit is calculated using the width and height of the prediction unit.
  • the bi-prediction restriction unit decodes information indicating whether to perform the bi-prediction or the uni-prediction when the prediction unit is larger than a predetermined size, When the prediction unit is a predetermined size or less, decoding of information indicating whether to perform the bi-prediction or the single prediction is omitted, and the single prediction is performed.
  • An image decoding method uses, as a prediction method for inter-screen prediction, a single prediction that refers to one reference image or bi-prediction that refers to two reference images to generate an image in a prediction unit.
  • a step of determining whether or not the prediction unit is a prediction unit of a predetermined size or less and a step of restricting the bi-prediction from being used for the prediction unit are included. .
  • An image coding apparatus uses, as a prediction method for inter-screen prediction, uni-prediction that refers to one reference image or bi-prediction that refers to two reference images.
  • a bi-prediction restriction unit is provided for restricting the bi-prediction to the prediction unit.
  • An image decoding apparatus provides, in an image decoding apparatus that decodes image encoded data and generates a decoded image for each encoding unit, information that specifies a division type for dividing the encoding unit.
  • the arithmetic decoding unit performs arithmetic decoding using the context and arithmetic not using the context according to the position of the binary value. Decoding is switched to decoding.
  • an image decoding apparatus provides, for each coding unit, an image decoding apparatus that restores an image by decoding information for restoring an image from image encoded data, For codes assigned to a combination with a prediction method applied to a coding unit, a combination other than the combination is applied to a combination in which a prediction method for intra prediction is applied to a coding unit having a size equal to or smaller than a predetermined size. And a decoding means for decoding a code shorter than the code assigned to.
  • a coding unit having a size equal to or smaller than a predetermined size is a coding unit having a size such that inter prediction is difficult to hit in a coding unit having a size larger than the predetermined size.
  • a coding unit having a size larger than the predetermined size is referred to as a large coding unit.
  • the coding unit having a size equal to or smaller than the predetermined size is, for example, a coding unit having a minimum size and an 8 ⁇ 8 pixel coding unit.
  • a code having a smaller coding size and a prediction method of intra prediction is assigned a shorter code than the other combinations.
  • the decoding unit is assigned to the combination in which the prediction method for intra prediction is applied to the encoding unit having a size larger than the predetermined size. It is preferable to decode short codes compared to existing codes.
  • the prediction method for intra prediction in a small coding unit that is likely to hit in-screen prediction is larger than the case where the prediction method for intra-screen prediction is applied in a large coding unit that is difficult to hit within the screen.
  • shorter codes are decoded.
  • the decoding unit allocates, to the combination, a combination in which a prediction method other than intra prediction is applied to an encoding unit having the same size as the predetermined size. It is preferable to decode a short code compared to the code being used.
  • An image decoding apparatus performs inter-screen prediction of an image in a prediction unit, either uni-prediction referring to one reference image or bi-prediction referring to two reference images.
  • the image decoding apparatus includes bi-prediction restriction means for restricting bi-prediction for a target prediction unit that is a prediction unit having a size of a predetermined size or less to which the inter-screen prediction is applied.
  • Bi-prediction requires more processing than single prediction. Note that bi-prediction is a prediction method that uses two images referred to in inter-screen prediction. The image to be referred to may be temporally forward or backward with respect to the target frame.
  • a small prediction unit having a size smaller than or equal to a predetermined size has a larger processing amount per unit area than a large prediction unit having a size larger than the predetermined size.
  • bi-prediction is limited in a small prediction unit.
  • the restriction includes omitting a part of processing in bi-prediction and not performing bi-prediction processing.
  • the bi-prediction restriction unit is a prediction unit that does not omit decoding at least a part of a motion vector used for generating a predicted image in the target prediction unit, and It is preferable to perform the above restriction on the target prediction unit that does not estimate the prediction parameter assigned to the target prediction unit from the prediction parameters assigned to the prediction unit in the vicinity of the target prediction unit.
  • the bi-prediction restriction unit performs single prediction by omitting decoding of information indicating whether bi-prediction or single prediction is performed.
  • the decoding process in the target prediction unit that restricts bi-prediction can be simplified. Further, it is possible to avoid the overhead of decoding information indicating whether to perform bi-prediction or uni-prediction, although it is determined in advance that uni-prediction is performed.
  • the bi-prediction restriction unit omits processing of information related to weighted prediction in bi-prediction.
  • the amount of processing in bi-prediction can be reduced by omitting processing of information related to weighted prediction in bi-prediction.
  • the image decoding device includes a merge candidate derivation unit that derives a merge candidate from a motion compensation parameter used for decoding a decoded prediction unit
  • the bi-prediction restriction unit includes: When the merge candidate derived by the merge candidate deriving means is bi-prediction, bi-prediction conversion means for converting the bi-prediction into single prediction may be provided.
  • the bi-prediction conversion unit uses two prediction list use flags that are flags indicating whether or not a reference picture list is used
  • the two prediction list use flags When both indicate that the reference picture list is used, one of the two prediction list use flags may be converted to indicate that the reference picture list is not used. Good.
  • bi-prediction can be limited in the image decoding apparatus that controls whether bi-prediction or uni-prediction is performed using the prediction list use flag, and the decoding process in the target prediction unit is simplified.
  • the bi-predictive conversion unit converts the flag of the reference picture list indicating that the L0 list is used so as to indicate that the L0 list is not used. There may be.
  • bi-prediction can be limited while maintaining coding efficiency.
  • the decoding process in the prediction unit can be simplified.
  • the L0 list is a list of pictures mainly used for forward prediction.
  • reference pictures in the L0 list are often given priority.
  • reference pictures in the L1 list instead of reference pictures in the L0 list, it is possible to differentiate from the derivation process that prioritizes these L0 lists.
  • a plurality of derivation processes can be selected according to a certain encoding parameter, assuming that a derivation process for a certain group is L0 list priority and a derivation process for other groups is L1 list priority, the respective derivation processes are used in a complementary manner. Therefore, it works effectively in sequences and areas with more motion properties. Therefore, in bi-predictive transformation, high encoding efficiency can be obtained by using the L1 list.
  • the bi-prediction conversion unit converts the flag indicating whether or not the reference picture list is used so as to indicate that the reference picture list is not used, the reference The index number and the motion vector may not be refreshed.
  • the reference index number and the motion vector value of the restricted one can be used in the subsequent processing. Therefore, bi-prediction can be restricted while maintaining encoding efficiency as compared with the case where refresh is performed, and decoding processing in the target prediction unit can be simplified.
  • the bi-prediction restriction unit decodes the code number corresponding to the combined inter prediction reference index
  • the maximum value of the code number value is restricted when bi-prediction is restricted.
  • it is set to the sum of the number of combined reference picture sets for uni-prediction and the number of combined reference picture sets for bi-prediction. Also good.
  • the bi-prediction restriction unit decodes the joint inter prediction reference index
  • the joint inter prediction is performed using a variable table from a code number.
  • the reference index is derived and not limited, the combined inter prediction reference index may be derived from the code number without using the variable table.
  • bi-prediction restriction unit restricts bi-prediction when the decoded combined inter-prediction reference index indicates other than a combined reference picture set
  • bi-prediction and single prediction are performed.
  • decoding is performed by omitting decoding of information indicating which one is to be performed and bi-prediction is not limited, information indicating whether bi-prediction or single prediction is to be performed may be decoded.
  • the image decoding apparatus includes merge candidate derivation means for deriving merge candidates that are motion compensation parameter candidates when merge processing is used for decoding a predicted image in a target prediction unit.
  • the merge candidate derivation means includes an adjacent merge candidate derivation means for deriving a merge candidate from a motion compensation parameter used for decoding an adjacent target prediction unit adjacent to the target prediction unit, and a merge candidate from a plurality of reference pictures.
  • a bi-predictive merge candidate deriving unit for deriving the bi-predictive merge candidate, and the merge candidate deriving unit may not use the merge candidate by the bi-predictive merge candidate deriving unit when the target prediction unit has a predetermined size. .
  • derivation of merge candidates can be simplified by omitting derivation of merge candidates for bi-prediction.
  • An image decoding apparatus is an image decoding apparatus that generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and restores the image, and is a decoding target.
  • a plurality of codes associated with a plurality of sets of a division type and a prediction method, which is a type for dividing a target coding unit that is a coding unit into the prediction units, are the prediction units to be decoded. It is characterized by comprising changing means for changing according to a decoded parameter assigned to a decoded prediction unit in the vicinity of the target prediction unit.
  • the unit for generating the predicted image is determined based on the encoding unit that is the unit of the encoding process. Specifically, the same region as the coding unit or a region obtained by dividing the coding unit is set as the prediction unit.
  • the division type into the prediction units may include division into a square and division into a non-square.
  • the division into squares is a case where the prediction unit obtained by the division is a square.
  • this is the case when a square coding unit is divided into four squares. This also applies to the case of non-division using a region having the same size as the square coding unit as a prediction unit.
  • the division type in the case of non-division is generally expressed as 2N ⁇ 2N.
  • ⁇ Division into non-square> is when the prediction unit obtained by the division is non-square. For example, this is the case when the coding unit area is divided into a large rectangle and a small rectangle.
  • the sign means a binary string of encoded parameter values.
  • the binary sequence may be directly encoded or may be encoded by arithmetic encoding.
  • the prediction method is either inter-screen prediction or intra-screen prediction.
  • the set of the prediction method and the division type is, for example, (intra-screen prediction, non-division), and may be represented by a parameter value called pred_type.
  • a code is associated with a set of prediction scheme and division type on a one-to-one basis.
  • the association is changed according to the decoded parameter.
  • the interpretation of which prediction scheme and division type pair is shown is changed according to the decoded parameters.
  • a shorter code can be assigned to a combination of a prediction method and a division type having a higher occurrence probability.
  • the target coding unit is likely to be used for intra prediction.
  • a shorter code is assigned to a set of a prediction method and a division type having a higher probability of occurrence according to a decoded parameter assigned to a neighboring decoded prediction unit. Can be improved.
  • the changing unit allocates an intra-screen prediction prediction method to a decoded coding unit in the vicinity of the target coding unit, the prediction of the intra-screen prediction is performed. It is preferable to change the code associated with the set including the method to a short code.
  • a code associated with a set including the prediction scheme for intra prediction is Change to a shorter code.
  • the prediction method for intra-screen prediction only needs to be assigned to one or both of the upper adjacent coding unit and the left adjacent coding unit.
  • the prediction method for intra prediction is assigned to a decoded encoding unit in the vicinity of the target encoding unit, it is highly likely that the target encoding unit is also assigned intra prediction.
  • the changing unit performs division in an adjacent direction when a decoded coding unit adjacent to the target coding unit is smaller than the target coding unit. It is preferable to change the code associated with the set including the division type to be performed to a short code.
  • the decoding encoding unit adjacent to the said object encoding unit is smaller than the said object encoding unit, it is matched with the group containing the division type which performs a division
  • the direction is perpendicular to the boundary between the target coding unit and the adjacent decoded coding unit.
  • An edge is likely to exist. That is, an edge often appears in a direction in which the target coding unit is adjacent to the decoded coding unit.
  • An image decoding apparatus generates an image by using a prediction method for inter-frame prediction for each prediction unit obtained by dividing an encoding unit into one or more numbers, and restores the image.
  • the target prediction unit which is the prediction unit to be decoded, is a prediction unit for estimating the prediction parameter of the target prediction unit from the prediction parameters assigned to the area in the vicinity of the target prediction unit.
  • the apparatus further comprises candidate determining means for determining a candidate area to be used for estimation according to the size of the target prediction unit.
  • a candidate for a region used for so-called skip or merge is determined according to the size of the target prediction unit.
  • an area candidate used for deriving an estimated motion vector used for restoring the motion vector is set together with the decoded difference motion vector.
  • the correlation of motion vectors for inter-screen prediction varies depending on the size of the target prediction unit. For example, in a region where a small prediction unit of a predetermined size or less is selected, the motion of the object is often complicated, and the correlation between the motion vectors is small.
  • the number of candidates can be reduced according to the complexity of the movement. Thereby, side information can be reduced and, as a result, encoding efficiency can be improved.
  • the candidate determination unit is configured such that the number of candidates for a small prediction unit equal to or smaller than a predetermined size is smaller than the number of candidates for a prediction unit larger than the small prediction unit. It is preferable to do.
  • the number of candidates for a small prediction unit of a predetermined size or less is made smaller than the number of candidates for a prediction unit larger than the small prediction unit.
  • the candidate determination unit does not include temporal prediction in the candidates in a small prediction unit of a predetermined size or less.
  • temporal prediction is not included in the candidates in a small prediction unit of a predetermined size or less.
  • temporal prediction In a region where the motion is complex such that a small prediction unit is selected, the correlation between the related prediction unit (collocated PU) used for temporal prediction and the target prediction unit is small, and therefore the possibility that temporal prediction is selected is small. Therefore, in such a region, it is preferable not to include temporal prediction as a merge candidate.
  • An image decoding apparatus provides an image decoding apparatus that generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and restores the image.
  • the division type includes dividing the rectangle into prediction units, and includes dividing the rectangle into prediction units including a code indicating whether the rectangle is vertically long or horizontally and a code indicating the type of the rectangle.
  • a decoding means for decoding a code indicating the type of the rectangle without using a context is provided.
  • the code indicating the type of rectangle is decoded without using a context.
  • the types of rectangles are, for example, three types of 2N ⁇ N, 2N ⁇ nU, and 2N ⁇ nD when the division type is horizontal rectangular division.
  • the division of the prediction unit is often performed so as not to cross the edge existing in the coding unit area.
  • an edge having an inclination exists in a region, the same rectangular type may not be selected continuously. In such an area, even if decoding processing is performed using a context, the encoding efficiency may not be improved.
  • An image decoding apparatus generates an image by using a prediction method for inter-frame prediction for each prediction unit obtained by dividing an encoding unit into one or more numbers, and restores the image.
  • the division type into prediction units includes an asymmetric division that divides the coding unit into a plurality of prediction units of different sizes or a symmetric division that divides the coding unit into a plurality of prediction units of the same size,
  • an estimation unit is provided that estimates a prediction parameter for inter-screen prediction by an estimation method different from that when the division type is symmetric division.
  • the prediction parameter for inter-screen prediction is estimated by an estimation method different from that when the division type is symmetric division.
  • the coding unit for which asymmetric division is selected is divided asymmetrically into a smaller prediction unit and a larger prediction unit in the division for obtaining the prediction unit.

Abstract

The purpose is to achieve a reduction in the amount of encoding needed when employing asymmetric partitions, and an efficient encoding/decoding process that utilizes the properties of asymmetric partitions. Provided is an image decoding device for decoding images in prediction units, that employs as the prediction mode for inter-image prediction either a single prediction mode involving referring to a single reference image or a double prediction mode involving referring to two reference images, equipped with a double prediction mode restricting means for restricting performance of double prediction on prediction units when the prediction units are a predetermined size or smaller.

Description

画像復号装置、画像復号方法および画像符号化装置Image decoding apparatus, image decoding method, and image encoding apparatus
 本発明は、画像を表す符号化データを復号する画像復号装置、および、画像復号方法、ならびに、画像を符号化することによって符号化データを生成する画像符号化装置に関する。 The present invention relates to an image decoding apparatus that decodes encoded data representing an image, an image decoding method, and an image encoding apparatus that generates encoded data by encoding an image.
 動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置が用いられている。 In order to efficiently transmit or record a moving image, a moving image encoding device that generates encoded data by encoding the moving image, and a moving image that generates a decoded image by decoding the encoded data An image decoding device is used.
 具体的な動画像符号化方式としては、例えば、H.264/MPEG-4.AVC、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、TMuC(Test Model under Consideration)ソフトウェアに採用されている方式や、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている方式(非特許文献1、4)などが挙げられる。 Specific examples of the moving image encoding method include H.264. H.264 / MPEG-4. A method adopted in KTA software, which is a codec for joint development in AVC and VCEG (Video Coding Expert Group), a method adopted in TMuC (Test Model Under Software), and a successor codec, HEVC (High- The method proposed in (Efficiency 特許 Video 文献 Coding) (Non-Patent Documents 1 and 4) is included.
 このような動画像符号化方式においては、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化単位(コーディングユニット(Coding Unit)と呼ばれることもある)、及び、符号化単位を分割することより得られるブロックおよびパーティションからなる階層構造により管理され、普通、ブロックごとに符号化/復号される。 In such a moving image coding system, an image (picture) constituting a moving image is a slice obtained by dividing the image, a coding unit obtained by dividing the slice (Coding Unit) And is managed by a hierarchical structure composed of blocks and partitions obtained by dividing an encoding unit, and is normally encoded / decoded block by block.
 また、このような動画像符号化方式においては、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。 In such a moving image coding method, a predicted image is usually generated based on a local decoded image obtained by encoding / decoding an input image, and the predicted image is generated from the input image (original image). A prediction residual obtained by subtraction (sometimes referred to as “difference image” or “residual image”) is encoded. In addition, examples of the method for generating a predicted image include inter-screen prediction (inter prediction) and intra-screen prediction (intra prediction).
 イントラ予測においては、同一フレーム内の局所復号画像に基づいて、当該フレームにおける予測画像が順次生成される。 In intra prediction, predicted images in a corresponding frame are sequentially generated based on a locally decoded image in the same frame.
 一方、インター予測においては、フレーム全体が復号された参照フレーム(復号画像)内の参照画像に対し、動きベクトルを用いた動き補償を適用することによって、予測対象フレーム内の予測画像が予測単位(例えば、ブロック)毎に生成される。 On the other hand, in inter prediction, by applying motion compensation using a motion vector to a reference image in a reference frame (decoded image) obtained by decoding the entire frame, a predicted image in a prediction target frame is converted into a prediction unit ( For example, it is generated for each block).
 インター予測については、近時開催されたJCT-VCの第6回会合(Torino, IT, 14-22 July, 2011)において、インター予測を用いる場合において、符号化処理の単位となる符号化単位を非対称のパーティション(PU)に分割する技術が採用されている(AMP; Asymmetric Motion Partition,非特許文献2、3)。 For inter prediction, at the 6th meeting of JCT-VC recently held (Torino, IT, 14-22 July, 2011), when using inter prediction, the encoding unit that becomes the unit of the encoding process is selected. A technique of dividing into an asymmetric partition (PU) is adopted (AMP; Asymmetric Motion Partition, Non-Patent Documents 2 and 3).
 また、パーティションのタイプが、非対称パーティションである場合、非正方形の4分木変換(NSQT; Non-Square Quadtree Transform)を行うことが提案されている(非特許文献2)。 In addition, when the partition type is an asymmetric partition, it has been proposed to perform non-square quadtree transformation (NSQT; Non-Square Quadtree Transform) (Non-Patent Document 2).
 しかしながら、インター予測において、上述した非対称パーティションが新たに追加されることによりサイド情報の符号量は増加している。また、新たに追加された非対称パーティションは、従来の対称パーティションと性質が異なっているにもかかわらず、その性質が符号化処理において十分に活用されていないという課題がある。 However, the code amount of the side information is increased due to the addition of the asymmetric partition described above in inter prediction. In addition, the newly added asymmetric partition has a problem that although the property is different from the conventional symmetric partition, the property is not sufficiently utilized in the encoding process.
 本発明は、上記問題を鑑みてなされたものであり、その目的は、非対称パーティションを用いる場合における符号量の削減と、非対称パーティションの性質を活用した効率のよい符号化/復号処理を実現することができる画像復号装置、画像復号方法および画像符号化装置を提供することにある。 The present invention has been made in view of the above problems, and an object of the present invention is to realize a reduction in code amount when an asymmetric partition is used and an efficient encoding / decoding process utilizing the characteristics of the asymmetric partition. It is an object to provide an image decoding apparatus, an image decoding method, and an image encoding apparatus.
 上記の課題を解決するために、本発明の一態様に係る画像復号装置は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号装置において、前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備えることを特徴とする。 In order to solve the above problem, an image decoding apparatus according to an aspect of the present invention provides a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction. In the image decoding apparatus that decodes an image in a prediction unit using the bi-prediction restriction unit for restricting the bi-prediction to the prediction unit when the prediction unit is a prediction unit having a predetermined size or less. It is characterized by providing.
 上記の課題を解決するために、本発明の一態様に係る画像復号方法は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号方法において、前記予測単位が所定のサイズ以下の予測単位であるか否かを判定するステップと、前記予測単位に対して前記双予測を使用しないように制限するステップとを少なくとも含むことを特徴とする。 In order to solve the above-described problem, an image decoding method according to an aspect of the present invention includes a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction. In the image decoding method for decoding an image in a prediction unit using the step, determining whether or not the prediction unit is a prediction unit having a predetermined size or less, and not using the bi-prediction for the prediction unit And at least the step of limiting.
 上記の課題を解決するために、本発明の一態様に係る画像符号化装置は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を符号化する画像符号化装置において、前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備えることを特徴とする。 In order to solve the above-described problem, an image coding apparatus according to an aspect of the present invention, as a prediction method for inter-screen prediction, performs a single prediction that refers to one reference image or a bi-reference that refers to two reference images. In an image encoding apparatus that encodes an image in a prediction unit using prediction, when the prediction unit is a prediction unit having a size equal to or smaller than a predetermined size, the bi-prediction that restricts the bi-prediction to the prediction unit is limited. A prediction limiting means is provided.
 上記課題を解決するために、本発明の一態様に係る画像復号装置は、符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号装置において、前記符号化単位を分割する分割タイプを指定する情報を復号するCU情報復号部と、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号する算術復号部とを備え、前記CU情報復号部が、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を復号する場合、前記算術復号部は、前記バイナリ値の位置に応じて、前記コンテキストを用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号することを特徴とする。 In order to solve the above-described problem, an image decoding apparatus according to an aspect of the present invention divides the coding unit in an image decoding apparatus that decodes image coded data and generates a decoded image for each coding unit. A CU information decoding unit that decodes information designating a division type to be performed, and an arithmetic decoding unit that decodes a binary value from the image encoded data by arithmetic decoding using context or arithmetic decoding without using context, When the CU information decoding unit decodes information designating asymmetric division (AMP) as the division type, the arithmetic decoding unit performs arithmetic using the context according to the position of the binary value. Decoding is performed by switching between decoding and arithmetic decoding without using the context.
 本発明の一態様によれば、非対称パーティションを用いる場合における符号量の削減と、非対称パーティションの性質を活用した効率のよい符号化/復号処理を実現することができる。 According to one aspect of the present invention, it is possible to realize a reduction in the amount of code when using an asymmetric partition and an efficient encoding / decoding process utilizing the characteristics of the asymmetric partition.
本発明の一実施形態に係る動画像復号装置が備えるCU情報復号部および復号モジュールの構成例について示す機能ブロック図である。It is a functional block diagram shown about the structural example of the CU information decoding part with which the moving image decoding apparatus which concerns on one Embodiment of this invention is provided, and a decoding module. 上記動画像復号装置の概略的構成について示した機能ブロック図である。It is the functional block diagram shown about the schematic structure of the said moving image decoding apparatus. 本発明の一実施形態に係る動画像符号化装置によって生成され、上記動画像復号装置によって復号される符号化データのデータ構成を示す図であり、(a)~(d)は、それぞれ、ピクチャレイヤ、スライスレイヤ、ツリーブロックレイヤ、およびCUレイヤを示す図である。FIG. 3 is a diagram illustrating a data configuration of encoded data generated by a video encoding device according to an embodiment of the present invention and decoded by the video decoding device, wherein (a) to (d) are pictures, respectively. It is a figure which shows a layer, a slice layer, a tree block layer, and a CU layer. PU分割タイプのパターンを示す図である。(a)~(h)は、それぞれ、PU分割タイプが、2N×N、2N×nU、2N×nD、2N×N、2N×nU、および、2N×nDの場合のパーティション形状について示している。It is a figure which shows the pattern of PU division | segmentation type. (A) to (h) show partition shapes when PU partition types are 2N × N, 2N × nU, 2N × nD, 2N × N, 2N × nU, and 2N × nD, respectively. . CUのサイズおよびPU分割タイプに対応付けて、PUの個数およびサイズが定義されているPUサイズテーブルの具体的な構成例を示す図である。It is a figure which shows the specific structural example of PU size table in which the number and size of PU are defined in correlation with the size of CU and PU division | segmentation type. 傾斜を有するエッジが存在する2N×NのCUおよび2N×nUのCUを示す図である。It is a figure which shows 2NxN CU and 2NxnU CU in which the edge which has an inclination exists. CU予測タイプおよびPU分割タイプの組み合わせと、bin列との対応付けを定義する二値化情報の一例を示すテーブルである。It is a table which shows an example of the binarization information which defines matching with the combination of a CU prediction type and PU division | segmentation type, and a bin string. 8×8サイズのCUについて定義する上記二値化情報の一例を示す図である。It is a figure which shows an example of the said binarization information defined about CU of 8x8 size. 8×8サイズのCUについて定義する上記二値化情報の他の例を示す図である。It is a figure which shows the other example of the said binarization information defined about CU of 8x8 size. CU予測タイプおよびPU分割タイプの組み合わせと、bin列との対応付けを定義する二値化情報の他の例を示すテーブルである。It is a table which shows the other example of the binarization information which defines the correlation with the combination of a CU prediction type and PU division type, and a bin string. CU予測タイプおよびPU分割タイプの組み合わせと、bin列との対応付けを定義する二値化情報の別の例を示すテーブルである。It is a table which shows another example of the binarization information which defines matching with the combination of a CU prediction type and PU division | segmentation type, and a bin string. 上記動画像復号装置が備えるPU情報復号部および復号モジュールの構成例について示す機能ブロック図である。It is a functional block diagram shown about the structural example of PU information decoding part with which the said moving image decoding apparatus is provided, and a decoding module. 非対称パーティションが選択されたCUを示す図である。It is a figure which shows CU with which the asymmetric partition was selected. 対称パーティションが選択されたCUにおけるマージ候補の優先順位を示す図である。It is a figure which shows the priority of the merge candidate in CU with which the symmetrical partition was selected. 非対称パーティションが選択されたCUにおけるマージ候補の優先順位を示す図である。(a)および(b)は、いずれも、PU分割タイプが2N×nUである場合のCUを示している。(a)は、小さい方のパーティションにおけるマージ候補の優先順位について示しており、(b)は、大きい方のパーティションにおけるマージ候補の優先順位について示している。また、(c)および(d)は、いずれも、PU分割タイプが2N×nDである場合のCUを示している。また、(c)は、大きい方のパーティションにおけるマージ候補の優先順位について示しており、(d)は、小さい方のパーティションにおけるマージ候補の優先順位について示している。It is a figure which shows the priority of the merge candidate in CU with which the asymmetric partition was selected. Both (a) and (b) show CUs when the PU partition type is 2N × nU. (A) shows the priority order of merge candidates in the smaller partition, and (b) shows the priority order of merge candidates in the larger partition. Further, (c) and (d) both indicate a CU when the PU partition type is 2N × nD. (C) shows the priority of merge candidates in the larger partition, and (d) shows the priority of merge candidates in the smaller partition. 上記動画像復号装置が備えるTU情報復号部および復号モジュールの構成例について示す機能ブロック図である。It is a functional block diagram shown about the structural example of the TU information decoding part with which the said moving image decoding apparatus is provided, and a decoding module. CUのサイズ、TU分割の深度(trafoDepth)、および対象PUのPU分割タイプに応じて、TU分割パターンが定義される変換サイズ決定情報の一例を示す図である。It is a figure which shows an example of the conversion size determination information in which a TU division | segmentation pattern is defined according to the size of CU, the depth (trafoDepth) of TU division | segmentation, and PU division | segmentation type of object PU. 正方形のノードを正方形または非正方形に4分木分割する分割方式について示す図である。(a)は、正方形の分割、(b)は、横長の長方形の分割、および、(c)は、縦長の長方形の分割を示している。It is a figure which shows about the division | segmentation system which divides a square node into a square or a non-square by quadtree division. (A) shows square division, (b) shows horizontal rectangular division, and (c) shows vertical rectangular division. 正方形のノードを正方形または非正方形に4分木分割する分割方式について示す図である。(a)は、横長のノードの横長の分割、(b)は、横長のノードの正方形の分割、(c)は、縦長のノードの縦長の分割、および(d)は、縦長のノードの正方形の分割を示している。It is a figure which shows about the division | segmentation system which divides a square node into a square or a non-square by quadtree division. (A) is a horizontal division of a horizontal node, (b) is a square division of a horizontal node, (c) is a vertical division of a vertical node, and (d) is a square of a vertical node. Shows the division of. PU分割タイプ2N×Nの32×32CUにおけるTU分割の例を示す図である。It is a figure which shows the example of TU division | segmentation in 32 * 32CU of PU division | segmentation type 2N * N. PU分割タイプ2N×nUの32×32CUにおけるTU分割の例を示す図である。It is a figure which shows the example of TU division | segmentation in 32 * 32CU of PU division | segmentation type 2NxnU. 図17に示す変換サイズ決定情報に従って分割を行った場合のTU分割の流れを示す図である。(a)は、PU分割タイプが、2N×2Nの場合を示しており、(b)は、PU分割タイプが、2N×nUの場合を示している。It is a figure which shows the flow of TU division | segmentation at the time of dividing | segmenting according to the conversion size determination information shown in FIG. (A) shows the case where the PU partition type is 2N × 2N, and (b) shows the case where the PU partition type is 2N × nU. PU分割タイプが2N×2Nの領域の分割を行った場合のTU分割の流れの一例を示す図である。It is a figure which shows an example of the flow of TU division | segmentation at the time of dividing | segmenting the area | region whose PU division | segmentation type is 2Nx2N. CU復号処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of a CU decoding process. 本発明の一実施形態に係る動画像符号化装置の概略的構成について示した機能ブロック図である。It is the functional block diagram shown about the schematic structure of the moving image encoder which concerns on one Embodiment of this invention. CU符号化処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of a CU encoding process. 上記動画像符号化装置を搭載した送信装置、および、上記動画像復号装置を搭載した受信装置の構成について示した図である。(a)は、動画像符号化装置を搭載した送信装置を示しており、(b)は、動画像復号装置を搭載した受信装置を示している。It is the figure shown about the structure of the transmitter which mounts the said moving image encoder, and the receiver which mounts the said moving image decoder. (A) shows a transmitting apparatus equipped with a moving picture coding apparatus, and (b) shows a receiving apparatus equipped with a moving picture decoding apparatus. 上記動画像符号化装置を搭載した記録装置、および、上記動画像復号装置を搭載した再生装置の構成について示した図である。(a)は、動画像符号化装置を搭載した記録装置を示しており、(b)は、動画像復号装置を搭載した再生装置を示している。It is the figure shown about the structure of the recording device which mounts the said moving image encoder, and the reproducing | regenerating apparatus which mounts the said moving image decoder. (A) shows a recording apparatus equipped with a moving picture coding apparatus, and (b) shows a reproduction apparatus equipped with a moving picture decoding apparatus. 上記動画像復号装置が備えるPU情報復号部の動き補償パラメータ導出部の詳細な構成例について示す機能ブロック図である。It is a functional block diagram shown about the detailed structural example of the motion compensation parameter derivation | leading-out part of the PU information decoding part with which the said moving image decoding apparatus is provided. 上記動画像復号装置が備える復号モジュールの動き情報復号部の詳細な構成例について示す機能ブロック図である。It is a functional block diagram shown about the detailed structural example of the motion information decoding part of the decoding module with which the said moving image decoding apparatus is provided. 従来技術におけるPUのシンタックステーブルの例であり、双予測制限を行わない場合の符号化データの構成を示す図である。It is an example of the syntax table of PU in a prior art, and is a figure which shows the structure of the coding data when not performing bi-prediction restriction | limiting. インター予測フラグの意味について示す図である。(a)は、2値フラグである場合のインター予測フラグの意味を示し、(b)は、3値フラグである場合のインター予測フラグの意味を示す。It is a figure shown about the meaning of the inter prediction flag. (A) shows the meaning of the inter prediction flag when it is a binary flag, and (b) shows the meaning of the inter prediction flag when it is a ternary flag. PUのシンタックステーブルの例を示す図であり、(a)および(b)は各々双予測制限を行う場合の符号化データの構成の特にインター予測フラグinter_pred_flagの部分を示す。It is a figure which shows the example of the syntax table of PU, (a) And (b) shows the part of inter prediction flag inter_pred_flag especially of the structure of the coding data in the case of performing bi-prediction restriction | limiting, respectively. 双予測制限に関するシンタックステーブルの例を示す図である。(a)は、シーケンスパラメータセットが双予測制限をするか否かを制限するフラグdisable_bipred_in_small_PUを含む場合を示す。(b)は、共通のフラグとして予測制約フラグuse_restricted_predictionを設ける例である。(c)は、双予測を禁止するPUのサイズを示すdisable_bipred_sizeを符号化データに含める例である。It is a figure which shows the example of the syntax table regarding bi-prediction restriction | limiting. (A) shows a case where the sequence parameter set includes a flag disable_bipred_in_small_PU that restricts whether or not to restrict bi-prediction. (B) is an example in which a prediction constraint flag use_restricted_prediction is provided as a common flag. (C) is an example in which disable_bipred_size indicating the size of the PU for which bi-prediction is prohibited is included in the encoded data. 双予測制限を実施する範囲および双予測制限方法の対応関係を示す図である。It is a figure which shows the correspondence of the range which implements bi-prediction restriction | limiting, and a bi-prediction restriction | limiting method. 双予測制限に関するシンタックステーブルの例を示す図である。It is a figure which shows the example of the syntax table regarding bi-prediction restriction | limiting. 双予測制限に関するコンバインドテーブルを説明する図であり、(a)、(b)、(c)は、combined_inter_pred_ref_idxの値の例を説明するための図であり、(d)は最大値MaxPredRefの導出方法を示すテーブルおよび擬似コードを示す図である。It is a figure explaining the combined table regarding a bi-prediction restriction | limiting, (a), (b), (c) is a figure for demonstrating the example of the value of combined_inter_pred_ref_idx, (d) is the derivation method of the maximum value MaxPredRef. It is a figure which shows the table and pseudo code which show. コンバインドテーブルに対する可変テーブルを説明する図であり、(a)は、変換可変テーブルEncTableと逆変換可変テーブルDecTableの例を示す図であり、(b)は、逆変換可変テーブルDecTableを示す図である。It is a figure explaining the variable table with respect to a combined table, (a) is a figure which shows the example of conversion variable table EncTable and reverse conversion variable table DecTable, (b) is a figure which shows reverse conversion variable table DecTable. . 双予測制限に関するinter_pred_flagを復号を説明する図である。It is a figure explaining decoding inter_pred_flag regarding bi-prediction restriction. 双予測制限に関する結合結合インター予測参照インデックスフラグcombined_inter_pred_ref_idxの復号を説明する図である。It is a figure explaining decoding of the joint joint inter prediction reference index flag combined_inter_pred_ref_idx regarding a bi-prediction restriction | limiting. 逆変換可変テーブルを用いる場合のcombined_inter_pred_ref_idxの復号処理を示す擬似コード。Pseudo code showing decoding processing of combined_inter_pred_ref_idx when using an inverse transformation variable table. 変換可変テーブルを用いる場合のcombined_inter_pred_ref_idxの符号化処理を示す擬似コード。Pseudo code showing the encoding process of combined_inter_pred_ref_idx when using the conversion variable table. マージ動き補償パラメータ導出部の構成を示すブロック図である。It is a block diagram which shows the structure of a merge motion compensation parameter derivation | leading-out part. マージ動き補償パラメータ導出部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a merge motion compensation parameter derivation | leading-out part. 隣接マージ候補導出部1212Aの動作を説明する図である。It is a figure explaining operation | movement of the adjacent merge candidate derivation | leading-out part 1212A. (a)~(c)は、時間的マージ候補導出部1212Bの動作を説明する図である。(A)-(c) is a figure explaining operation | movement of the temporal merge candidate derivation | leading-out part 1212B. ユニーク候補導出部1212Cの動作を説明する図である。It is a figure explaining operation | movement of the unique candidate derivation | leading-out part 1212C. (a)~(c)は、結合双予測マージ候補導出部1212Dの動作を説明する図である。(A)-(c) is a figure explaining operation | movement of combined bi-prediction merge candidate derivation | leading-out part 1212D. (a)、(b)は、非スケール双予測マージ候補導出部1212Eの動作を説明する図である。(A), (b) is a figure explaining operation | movement of the non-scale bi-predictive merge candidate derivation | leading-out part 1212E. ゼロベクトルマージ候補導出部1212Fの動作を説明する図である。It is a figure explaining operation | movement of the zero vector merge candidate derivation | leading-out part 1212F. 双単予測変換の動作を説明する図である。It is a figure explaining operation | movement of bi-predictive transformation. 双予測制限方法の例を説明する図であり、(a)は、4x4、4x8、4x8のサイズのPUに対して、一様に、基本インターPUの双予測制限、マージPUの双予測制限、双予測マージ候補導出のスキップを適用する例を示す図であり、(b)、(c)は、マージPUの双予測制限、双予測マージ候補導出のスキップは行わず基本インターPUにのみ双予測制限を行う例を示す図であり、(d)は、4x4、4x8、4x8のサイズのPUに対して、一様に、基本インターPUの双予測制限、8x8のサイズのPUに対してマージPUの双予測制限、双予測マージ候補導出のスキップを適用する例を示す図である。FIG. 7 is a diagram for explaining an example of a bi-prediction restriction method, in which (a) uniformly applies a bi-prediction restriction of a basic inter PU, a bi-prediction restriction of a merge PU to a PU of a size of 4 × 4, 4 × 8, and 4 × 8; It is a figure which shows the example which applies the skip of bi-predictive merge candidate derivation, (b), (c) is bi-prediction restriction | limiting of merge PU, and skip of bi-predictive merge candidate derivation is not performed, but bi-prediction only to basic inter PU It is a figure which shows the example which performs a restriction | limiting, (d) is the merge PU with respect to PU of the size of 4x4, 4x8, and 4x8 uniformly with respect to the bi-prediction restriction | limiting of a basic inter PU, and the size of 8x8. It is a figure which shows the example which applies the bi-prediction restriction | limiting of this, and the skip of bi-prediction merge candidate derivation | leading-out. 双予測制限方法の例を説明する図であり、(a)は、4x4、4x8、4x8、8x8に対して、基本インターPUの双予測制限と双予測マージ候補導出のスキップを適用する例を示す図であり、(b)は、4x4、4x8、4x8、8x8に対して、双予測マージ候補導出のスキップを適用する例を示す図である。It is a figure explaining the example of the bi-prediction restriction | limiting method, (a) shows the example which applies the bi-prediction restriction | limiting of basic inter-PU, and the skip of bi-prediction merge candidate derivation with respect to 4x4, 4x8, 4x8, 8x8. (B) is a figure which shows the example which applies the skip of bi-predictive merge candidate derivation | leading-out with respect to 4x4, 4x8, 4x8, 8x8. 基本動き補償パラメータ導出部の構成を示すブロック図である。It is a block diagram which shows the structure of a basic motion compensation parameter derivation | leading-out part. PU情報生成部の構成を示すブロック図である。It is a block diagram which shows the structure of a PU information generation part. マージ動き補償パラメータ生成部の構成を示すブロック図である。It is a block diagram which shows the structure of a merge motion compensation parameter production | generation part. 基本動き補償パラメータ生成部の構成を示すブロック図である。It is a block diagram which shows the structure of a basic motion compensation parameter production | generation part. H.264/AVCにおけるレベル規制を定義するテーブルである。H. 2 is a table that defines level restrictions in H.264 / AVC. H.264/AVCにおけるレベル規制を定義するテーブルである。H. 2 is a table that defines level restrictions in H.264 / AVC. 適応的なPUサイズ制約および双予測制限について示した図である。(a)は、16×16CUの場合について示しており、(b)は、8×8CUの場合について示している。It is the figure shown about adaptive PU size restrictions and bi-prediction restrictions. (A) shows the case of 16 × 16 CU, and (b) shows the case of 8 × 8 CU. PU情報復号部が備えるマージ動き補償パラメータ導出部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter derivation | leading-out part with which a PU information decoding part is provided. 双予測制限に関するシンタックステーブルの一例を示す図である。It is a figure which shows an example of the syntax table regarding bi-prediction restriction | limiting. 双予測制限PU判定部の動作について示した疑似コードの一例を示す図である。It is a figure which shows an example of the pseudo code shown about operation | movement of the bi prediction restriction | limiting PU determination part. 双予測制限に関するシンタックステーブルの他の例を示す図である。It is a figure which shows the other example of the syntax table regarding bi-prediction restriction | limiting. 双予測制限PU判定部の動作について示した疑似コードの他の例を示す図である。It is a figure which shows the other example of the pseudo code shown about operation | movement of the bi prediction restriction | limiting PU determination part. 双予測制限に関するシンタックステーブルの別の例を示す図である。It is a figure which shows another example of the syntax table regarding a bi-prediction restriction | limiting. 双予測制限PU判定部の動作について示した疑似コードの別の例を示す図である。It is a figure which shows another example of the pseudo code shown about operation | movement of the bi-prediction restriction | limiting PU determination part. 双予測制限PU判定部の動作について示した疑似コードの別の例の変形例を示す図である。It is a figure which shows the modification of another example of the pseudo code shown about operation | movement of the bi prediction restriction | limiting PU determination part. 双予測制限に関するシンタックステーブルのさらに別の例を示す図である。It is a figure which shows another example of the syntax table regarding bi-prediction restriction | limiting. 双予測制限PU判定部の動作について示した疑似コードのさらに別の例を示す図である。It is a figure which shows another example of the pseudo code shown about operation | movement of the bi-prediction restriction | limiting PU determination part. マージ動き補償パラメータ導出部および双単予測変換部の処理の流れの一例について示すフローチャートである。It is a flowchart shown about an example of the flow of a process of a merge motion compensation parameter derivation | leading-out part and a bi-prediction conversion part. PU情報復号部が備えるマージ動き補償パラメータ導出部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter derivation | leading-out part with which a PU information decoding part is provided. マージ動き補償パラメータ導出部および双単予測変換部の処理の流れの変形例について示すフローチャートである。It is a flowchart shown about the modification of the flow of a process of a merge motion compensation parameter derivation | leading-out part and a bi-prediction conversion part. マージ候補導出処理と、双単変換処理と、リスト作成処理とからなる一連の処理のタイムチャートである。It is a time chart of a series of processing consisting of merge candidate derivation processing, bi-single conversion processing, and list creation processing. マージ候補導出処理と、双単変換処理と、リスト作成処理とからなる一連の処理のタイムチャートである。It is a time chart of a series of processing consisting of merge candidate derivation processing, bi-single conversion processing, and list creation processing. PU情報復号部が備えるマージ動き補償パラメータ導出部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter derivation | leading-out part with which a PU information decoding part is provided. X座標を整数化する整数化処理の具体例について説明する図である。It is a figure explaining the specific example of the integer conversion process which converts X coordinate into an integer. Y座標を整数化する整数化処理の具体例について説明する図である。It is a figure explaining the specific example of the integer conversion process which converts Y coordinate into an integer. X座標およびY座標を整数化する整数化処理の具体例について説明する図である。It is a figure explaining the specific example of the integer-ized process which converts X coordinate and Y coordinate into an integer. 片方のリストのみX座標およびY座標を整数化する整数化処理の具体例について説明する図である。It is a figure explaining the specific example of the integer-ized process which converts the X coordinate and Y coordinate into an integer only for one list. PU情報生成部が備えるマージ動き補償パラメータ生成部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter production | generation part with which a PU information generation part is provided. PU情報生成部が備えるマージ動き補償パラメータ生成部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter production | generation part with which a PU information generation part is provided. PU情報生成部が備えるマージ動き補償パラメータ生成部等の構成例を示すブロック図である。It is a block diagram which shows the structural examples, such as a merge motion compensation parameter production | generation part with which a PU information generation part is provided. 本発明におけるレベル規制を定義するテーブルである。It is a table which defines level regulation in the present invention. 本発明におけるレベル規制の別の例を定義するテーブルである。It is a table which defines another example of level regulation in the present invention. 双予測制限PU判定部の動作について示した疑似コードの別の例の変形例を示す図である。It is a figure which shows the modification of another example of the pseudo code shown about operation | movement of the bi prediction restriction | limiting PU determination part. 動き補償パラメータ制限部の動作について示した疑似コードの例を示す図である。It is a figure which shows the example of the pseudo code shown about operation | movement of the motion compensation parameter restriction | limiting part. PU情報生成部30の別の構成を示すブロック図である。6 is a block diagram illustrating another configuration of the PU information generation unit 30. FIG.
 本発明の一実施形態について図1~図24を参照して説明する。まず、図2を参照しながら、動画像復号装置(画像復号装置)1および動画像符号化装置(画像符号化装置)2の概要について説明する。図2は、動画像復号装置1の概略的構成を示す機能ブロック図である。 An embodiment of the present invention will be described with reference to FIGS. First, an overview of the moving picture decoding apparatus (image decoding apparatus) 1 and the moving picture encoding apparatus (image encoding apparatus) 2 will be described with reference to FIG. FIG. 2 is a functional block diagram showing a schematic configuration of the moving picture decoding apparatus 1.
 図2に示す動画像復号装置1および動画像符号化装置2は、H.264/MPEG-4 AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、および、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている技術を実装している。 The video decoding device 1 and the video encoding device 2 shown in FIG. H.264 / MPEG-4 AVC standard technology, VCEG (Video Coding Expert Group) technology used in KTA software, which is a joint development codec, TMuC (Test Model Underside) software The technology and the technology proposed by HEVC (High-Efficiency Video Coding), which is the successor codec, are implemented.
 動画像符号化装置2は、これらの動画像符号化方式において、エンコーダからデコーダに伝送されることが規定されているシンタックス(syntax)の値をエントロピー符号化して符号化データ#1を生成する。 The video encoding device 2 generates encoded data # 1 by entropy encoding a syntax value defined to be transmitted from the encoder to the decoder in these video encoding schemes. .
 エントロピー符号化方式としては、コンテキスト適応型可変長符号化(CAVLC:Context-based Adaptive Variable Length Coding)、および、コンテキスト適応型2値算術符号化(CABAC:Context-based Adaptive Binary Arithmetic Coding)が知られている。 As entropy coding methods, context-adaptive variable-length coding (CAVLC) and context-adaptive binary arithmetic coding (CABAC) are known. ing.
 CAVLCおよびCABACによる符号化/復号においては、コンテキストに適応した処理が行われる。コンテキストとは、符号化/復号の状況(文脈)のことであり、関連シンタックスの過去の符号化/復号結果により定まるものである。関連シンタックスとしては、例えば、イントラ予測、インター予測に関する各種シンタックス、輝度(Luma)、色差(Chroma)に関する各種シンタックス、およびCU(Coding Unit 符号化単位)サイズに関する各種シンタックスなどがある。また、CABACでは、シンタックスに対応する2値データ(バイナリ列)における、符号化/復号対象となるバイナリの位置をコンテキストとして用いる場合もある。 In encoding / decoding by CAVLC and CABAC, processing adapted to the context is performed. The context is an encoding / decoding situation (context), and is determined by past encoding / decoding results of related syntax. Examples of the related syntax include various syntaxes related to intra prediction and inter prediction, various syntaxes related to luminance (Luma) and color difference (Chroma), and various syntaxes related to CU (Coding Unit encoding unit) size. In CABAC, the binary position to be encoded / decoded in binary data (binary string) corresponding to the syntax may be used as the context.
 CAVLCでは、符号化に用いるVLCテーブルを適応的に変更して、各種シンタックスが符号化される。一方、CABACでは、予測モードおよび変換係数等の多値を取り得るシンタックスに対して2値化処理が施され、この2値化処理によって得られた2値データが発生確率に応じて適応的に算術符号化される。具体的には、バイナリ値(0または1)の発生確率を保持するバッファを複数用意し、コンテキストに応じて一つのバッファを選択し、当該バッファに記録されている発生確率に基づいて算術符号化を行う。また、復号/符号化するバイナリ値に基づいて、当該バッファの発生確率を更新することで、コンテキストに応じて適切な発生確率を維持できる。 In CAVLC, various syntaxes are encoded by adaptively changing the VLC table used for encoding. On the other hand, in CABAC, binarization processing is performed on syntax that can take multiple values such as a prediction mode and a conversion coefficient, and binary data obtained by this binarization processing is adaptive according to the occurrence probability. Are arithmetically encoded. Specifically, multiple buffers that hold the occurrence probability of binary values (0 or 1) are prepared, one buffer is selected according to the context, and arithmetic coding is performed based on the occurrence probability recorded in the buffer I do. Further, by updating the occurrence probability of the buffer based on the binary value to be decoded / encoded, an appropriate occurrence probability can be maintained according to the context.
 動画像復号装置1には、動画像符号化装置2が動画像を符号化した符号化データ#1が入力される。動画像復号装置1は、入力された符号化データ#1を復号して動画像#2を外部に出力する。動画像復号装置1の詳細な説明に先立ち、符号化データ#1の構成を以下に説明する。 The moving picture decoding apparatus 1 receives encoded data # 1 obtained by encoding a moving picture by the moving picture encoding apparatus 2. The video decoding device 1 decodes the input encoded data # 1 and outputs the video # 2 to the outside. Prior to detailed description of the moving picture decoding apparatus 1, the configuration of the encoded data # 1 will be described below.
 〔符号化データの構成〕
 図3を用いて、動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データ#1の構成例について説明する。符号化データ#1は、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
[Configuration of encoded data]
A configuration example of encoded data # 1 that is generated by the video encoding device 2 and decoded by the video decoding device 1 will be described with reference to FIG. The encoded data # 1 exemplarily includes a sequence and a plurality of pictures constituting the sequence.
 符号化データ#1におけるピクチャレイヤ以下の階層の構造を図3に示す。図3の(a)~(d)は、それぞれ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤ、ツリーブロックTBLKに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。 FIG. 3 shows the hierarchical structure below the picture layer in the encoded data # 1. 3A to 3D are included in the picture layer that defines the picture PICT, the slice layer that defines the slice S, the tree block layer that defines the tree block TBLK, and the tree block TBLK, respectively. It is a figure which shows the CU layer which prescribes | regulates a coding unit (Coding | union Unit; CU).
  (ピクチャレイヤ)
 ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図3の(a)に示すように、ピクチャヘッダPH、及び、スライスS1~SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
(Picture layer)
In the picture layer, a set of data referred to by the video decoding device 1 for decoding a picture PICT to be processed (hereinafter also referred to as a target picture) is defined. As shown in FIG. 3A, the picture PICT includes a picture header PH and slices S1 to SNS (NS is the total number of slices included in the picture PICT).
 なお、以下、スライスS1~SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化データ#1に含まれるデータであって、添え字を付している他のデータについても同様である。 In the following description, if it is not necessary to distinguish each of the slices S1 to SNS, the subscripts may be omitted. The same applies to other data with subscripts included in encoded data # 1 described below.
 ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報(entropy_coding_mode_flag)は、ピクチャヘッダPHに含まれる符号化パラメータの一例である。 The picture header PH includes a coding parameter group referred to by the video decoding device 1 in order to determine a decoding method of the target picture. For example, the encoding mode information (entropy_coding_mode_flag) indicating the variable length encoding mode used in encoding by the moving image encoding device 2 is an example of an encoding parameter included in the picture header PH.
 entropy_coding_mode_flagが0の場合、当該ピクチャPICTは、CAVLC(Context-based Adaptive Variable Length Coding)によって符号化されている。また、entropy_coding_mode_flagが1である場合、当該ピクチャPICTは、CABAC(Context-based Adaptive Binary Arithmetic Coding)によって符号化されている。 When entropy_coding_mode_flag is 0, the picture PICT is encoded by CAVLC (Context-based Adaptive Variable Variable Length Coding). When entropy_coding_mode_flag is 1, the picture PICT is encoded by CABAC (Context-based Adaptive Binary Arithmetic Coding).
 なお、ピクチャヘッダPHは、ピクチャー・パラメーター・セット(PPS:Picture Parameter Set)とも称される。 Note that the picture header PH is also referred to as a picture parameter set (PPS).
  (スライスレイヤ)
 スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図3の(b)に示すように、スライスヘッダSH、及び、ツリーブロックTBLK1~TBLKNC(NCはスライスSに含まれるツリーブロックの総数)を含んでいる。
(Slice layer)
In the slice layer, a set of data referred to by the video decoding device 1 for decoding the slice S to be processed (also referred to as a target slice) is defined. As shown in FIG. 3B, the slice S includes a slice header SH and tree blocks TBLK1 to TBLKNC (NC is the total number of tree blocks included in the slice S).
 スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。 The slice header SH includes a coding parameter group that the moving image decoding apparatus 1 refers to in order to determine a decoding method of the target slice. Slice type designation information (slice_type) for designating a slice type is an example of an encoding parameter included in the slice header SH.
 スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単予測、双予測、又は、イントラ予測を用いるBスライスなどが挙げられる。 The slice types that can be specified by the slice type specification information include (1) I slice that uses only intra prediction at the time of encoding, (2) P slice that uses single prediction or intra prediction at the time of encoding, ( 3) B-slice using single prediction, bi-prediction, or intra prediction at the time of encoding may be used.
 また、スライスヘッダSHには、動画像復号装置1の備えるループフィルタ(不図示)によって参照されるフィルタパラメータが含まれていてもよい。 Further, the slice header SH may include a filter parameter referred to by a loop filter (not shown) included in the video decoding device 1.
  (ツリーブロックレイヤ)
 ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
(Tree block layer)
In the tree block layer, a set of data referred to by the video decoding device 1 for decoding a processing target tree block TBLK (hereinafter also referred to as a target tree block) is defined.
 ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU1~CUNL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。 The tree block TBLK includes a tree block header TBLKH and coding unit information CU1 to CUNL (NL is the total number of coding unit information included in the tree block TBLK). Here, first, a relationship between the tree block TBLK and the coding unit information CU will be described as follows.
 ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのユニットに分割される。 The tree block TBLK is divided into units for specifying a block size for each process of intra prediction or inter prediction and conversion.
 ツリーブロックTBLKの上記ユニットは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。 The above unit of the tree block TBLK is divided by recursive quadtree partitioning. The tree structure obtained by this recursive quadtree partitioning is hereinafter referred to as a coding tree.
 以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するユニットを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。 Hereinafter, a unit corresponding to a leaf that is a node at the end of the coding tree is referred to as a coding node. In addition, since the encoding node is a basic unit of the encoding process, hereinafter, the encoding node is also referred to as an encoding unit (CU).
 つまり、符号化単位情報CU1~CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。 That is, the coding unit information CU1 to CUNL is information corresponding to each coding node (coding unit) obtained by recursively dividing the tree block TBLK into quadtrees.
 また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。 Also, the root of the coding tree is associated with the tree block TBLK. In other words, the tree block TBLK is associated with the highest node of the tree structure of the quadtree partition that recursively includes a plurality of encoding nodes.
 なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのユニット)のサイズの縦横とも半分である。 Note that the size of each coding node is half the size of the coding node to which the coding node directly belongs (that is, the unit of the node one layer higher than the coding node).
 また、各符号化ノードの取り得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBLKのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTBLK以下の階層における符号化ノードは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および8×8画素の何れかを取り得る。 Also, the size that each coding node can take depends on the size designation information of the coding node and the maximum hierarchy depth (maximum hierarchical depth) included in the sequence parameter set SPS of the coded data # 1. For example, when the size of the tree block TBLK is 64 × 64 pixels and the maximum hierarchical depth is 3, the encoding nodes in the hierarchy below the tree block TBLK have four sizes, that is, 64 × 64. It can take any of a pixel, 32 × 32 pixel, 16 × 16 pixel, and 8 × 8 pixel.
  (ツリーブロックヘッダ)
 ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図3の(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
(Tree block header)
The tree block header TBLKH includes an encoding parameter referred to by the video decoding device 1 in order to determine a decoding method of the target tree block. Specifically, as shown in (c) of FIG. 3, tree block division information SP_TBLK that designates a division pattern of the target tree block into each CU, and a quantization parameter difference that designates the size of the quantization step Δqp (qp_delta) is included.
 ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。 The tree block division information SP_TBLK is information representing a coding tree for dividing the tree block. Specifically, the shape and size of each CU included in the target tree block, and the position in the target tree block Is information to specify.
 なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグ(split_coding_unit_flag)の集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。 Note that the tree block division information SP_TBLK may not explicitly include the shape or size of the CU. For example, the tree block division information SP_TBLK may be a set of flags (split_coding_unit_flag) indicating whether or not the entire target tree block or a partial area of the tree block is divided into four. In that case, the shape and size of each CU can be specified by using the shape and size of the tree block together.
 また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp-qp’である。 Further, the quantization parameter difference Δqp is a difference qp−qp ′ between the quantization parameter qp in the target tree block and the quantization parameter qp ′ in the tree block encoded immediately before the target tree block.
  (CUレイヤ)
 CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
(CU layer)
In the CU layer, a set of data referred to by the video decoding device 1 for decoding a CU to be processed (hereinafter also referred to as a target CU) is defined.
 ここで、符号化単位情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。 Here, before explaining the specific contents of the data included in the coding unit information CU, the tree structure of the data included in the CU will be described. The encoding node is a node at the root of a prediction tree (PT) and a transformation tree (TT). The prediction tree and the conversion tree are described as follows.
 予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。 In the prediction tree, the encoding node is divided into one or a plurality of prediction blocks, and the position and size of each prediction block are defined. In other words, the prediction block is one or a plurality of non-overlapping areas constituting the encoding node. The prediction tree includes one or a plurality of prediction blocks obtained by the above division.
 予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。 Prediction processing is performed for each prediction block. Hereinafter, a prediction block that is a unit of prediction is also referred to as a prediction unit (PU).
 予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。 There are roughly two types of division in the prediction tree: intra prediction and inter prediction.
 イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。 In the case of intra prediction, there are 2N × 2N (the same size as the encoding node) and N × N division methods.
 また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、N×2N、および、N×Nなどがある。 In the case of inter prediction, there are 2N × 2N (the same size as the encoding node), 2N × N, N × 2N, N × N, and the like.
 また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。 Also, in the transform tree, the encoding node is divided into one or a plurality of transform blocks, and the position and size of each transform block are defined. In other words, the transform block is one or a plurality of non-overlapping areas constituting the encoding node. The conversion tree includes one or a plurality of conversion blocks obtained by the above division.
 変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。 Conversion processing is performed for each conversion block. Hereinafter, the transform block which is a unit of transform is also referred to as a transform unit (TU).
  (符号化単位情報のデータ構造)
 続いて、図3の(d)を参照しながら符号化単位情報CUに含まれるデータの具体的な内容について説明する。図3の(d)に示すように、符号化単位情報CUは、具体的には、スキップモードフラグSKIP、CU予測タイプ情報Pred_type、PT情報PTI、および、TT情報TTIを含む。
(Data structure of encoding unit information)
Next, specific contents of data included in the coding unit information CU will be described with reference to FIG. As shown in FIG. 3D, the coding unit information CU specifically includes a skip mode flag SKIP, CU prediction type information Pred_type, PT information PTI, and TT information TTI.
   [スキップフラグ]
 スキップフラグSKIPは、対象CUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、その符号化単位情報CUにおけるPT情報PTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[Skip flag]
The skip flag SKIP is a flag indicating whether or not the skip mode is applied to the target CU. When the value of the skip flag SKIP is 1, that is, when the skip mode is applied to the target CU, the code The PT information PTI in the unit information CU is omitted. Note that the skip flag SKIP is omitted for the I slice.
   [CU予測タイプ情報]
 CU予測タイプ情報Pred_typeは、CU予測方式情報PredModeおよびPU分割タイプ情報PartModeを含む。
[CU prediction type information]
The CU prediction type information Pred_type includes CU prediction method information PredMode and PU partition type information PartMode.
 CU予測方式情報PredModeは、対象CUに含まれる各PUについての予測画像生成方法として、イントラ予測(イントラCU)、および、インター予測(インターCU)のいずれを用いるのかを指定するものである。なお、以下では、対象CUにおける、スキップ、イントラ予測、および、インター予測の種別を、CU予測モードと称する。 The CU prediction method information PredMode specifies whether to use intra prediction (intra CU) or inter prediction (inter CU) as a predicted image generation method for each PU included in the target CU. Hereinafter, the types of skip, intra prediction, and inter prediction in the target CU are referred to as a CU prediction mode.
 PU分割タイプ情報PartModeは、対象符号化単位(CU)の各PUへの分割のパターンであるPU分割タイプを指定するものである。以下、このように、PU分割タイプに従って、対象符号化単位(CU)を各PUへ分割することをPU分割と称する。 The PU partition type information PartMode specifies a PU partition type that is a pattern of partitioning the target coding unit (CU) into each PU. Hereinafter, dividing the target coding unit (CU) into each PU according to the PU division type in this way is referred to as PU division.
 PU分割タイプ情報PartModeは、例示的には、PU分割パターンの種類を示すインデックスであってもよいし、対象予測ツリーに含まれる各PUの形状、サイズ、および、対象予測ツリー内での位置が指定されていてもよい。 For example, the PU partition type information PartMode may be an index indicating the type of PU partition pattern, and the shape, size, and position of each PU included in the target prediction tree may be It may be specified.
 なお、選択可能なPU分割タイプは、CU予測方式とCUサイズに応じて異なる。また、さらにいえば、選択可能できるPU分割タイプは、インター予測およびイントラ予測それぞれの場合において異なる。また、PU分割タイプの詳細については後述する。 Note that selectable PU partition types differ depending on the CU prediction method and the CU size. Furthermore, the PU partition types that can be selected are different in each case of inter prediction and intra prediction. Details of the PU partition type will be described later.
 また、Iスライスでない場合、PU分割タイプ情報PartModeの値は、ツリーブロックの分割(partition)、予測方式、およびCUの分割(split)の方法の組み合わせを指定するインデックス(cu_split_pred_part_mode)によって特定されるようになっていてもよい。 If the slice is not an I slice, the value of the PU partition type information PartMode is specified by an index (cu_split_pred_part_mode) that specifies a combination of a tree block partition (partition), a prediction method, and a CU split (split) method. It may be.
   [PT情報]
 PT情報PTIは、対象CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合である。上述のとおり予測画像の生成は、PUを単位として行われるので、PT情報PTIは、動画像復号装置1によって予測画像が生成される際に参照される。PT情報PTIは、図3の(d)に示すように、各PUにおける予測情報等を含むPU情報PUI1~PUINP(NPは、対象PTに含まれるPUの総数)を含む。
[PT information]
The PT information PTI is information related to the PT included in the target CU. In other words, the PT information PTI is a set of information on each of one or more PUs included in the PT. As described above, since the generation of the predicted image is performed in units of PUs, the PT information PTI is referred to when the moving image decoding apparatus 1 generates a predicted image. As shown in FIG. 3 (d), the PT information PTI includes PU information PUI1 to PUINP (NP is the total number of PUs included in the target PT) including prediction information in each PU.
 予測情報PUIは、予測タイプ情報Pred_modeが何れの予測方法を指定するのかに応じて、イントラ予測情報、または、インター予測情報を含む。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。 The prediction information PUI includes intra prediction information or inter prediction information depending on which prediction method the prediction type information Pred_mode specifies. Hereinafter, a PU to which intra prediction is applied is also referred to as an intra PU, and a PU to which inter prediction is applied is also referred to as an inter PU.
 インター予測情報は、動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータを含む。 The inter prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an inter prediction image by inter prediction.
 インター予測パラメータとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)が挙げられる。 Examples of the inter prediction parameters include a merge flag (merge_flag), a merge index (merge_idx), an estimated motion vector index (mvp_idx), a reference image index (ref_idx), an inter prediction flag (inter_pred_flag), and a motion vector residual (mvd). Is mentioned.
 イントラ予測情報は、動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。 The intra prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an intra predicted image by intra prediction.
 イントラ予測パラメータとしては、例えば、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスが挙げられる。 Examples of intra prediction parameters include an estimated prediction mode flag, an estimated prediction mode index, and a residual prediction mode index.
 なお、イントラ予測情報では、PCMモードを用いるか否かを示すPCMモードフラグが符号化されていてもよい。PCMモードフラグが符号化されている場合であって、PCMモードフラグがPCMモードを用いることを示しているときには、予測処理(イントラ)、変換処理、および、エントロピー符号化の各処理が省略される。 In the intra prediction information, a PCM mode flag indicating whether to use the PCM mode may be encoded. When the PCM mode flag is encoded and the PCM mode flag indicates that the PCM mode is used, the prediction process (intra), the conversion process, and the entropy encoding process are omitted. .
   [TT情報]
 TT情報TTIは、CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
[TT information]
The TT information TTI is information regarding the TT included in the CU. In other words, the TT information TTI is a set of information regarding each of one or a plurality of TUs included in the TT, and is referred to when the moving image decoding apparatus 1 decodes residual data. Hereinafter, a TU may be referred to as a block.
 TT情報TTIは、図3の(d)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TU、および、TU情報TUI1~TUINT(NTは、対象CUに含まれるブロックの総数)を含んでいる。 As shown in FIG. 3 (d), the TT information TTI includes TT division information SP_TU that designates a division pattern of the target CU into each transform block, and TU information TUI1 to TUINT (NT is included in the target CU). The total number of blocks).
 TT分割情報SP_TUは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TUは、対象となるノードの分割を行うのか否かを示す情報(split_transform_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。 TT division information SP_TU is information for determining the shape and size of each TU included in the target CU and the position in the target CU. For example, the TT division information SP_TU can be realized from information (split_transform_flag) indicating whether or not the target node is to be divided and information (trafoDepth) indicating the depth of the division.
 また、例えば、CUのサイズが、64×64の場合、分割により得られる各TUは、32×32画素から4×4画素までのサイズを取り得る。 Also, for example, when the size of the CU is 64 × 64, each TU obtained by the division can take a size from 32 × 32 pixels to 4 × 4 pixels.
 TU情報TUI1~TUINTは、TTに含まれる1または複数のTUそれぞれに関する個別の情報である。例えば、TU情報TUIは、量子化予測残差を含んでいる。 TU information TUI1 to TUINT are individual information regarding one or more TUs included in the TT. For example, the TU information TUI includes a quantized prediction residual.
 各量子化予測残差は、動画像符号化装置2が以下の処理1~3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。 Each quantized prediction residual is encoded data generated by the video encoding device 2 performing the following processes 1 to 3 on a target block that is a processing target block.
 処理1:符号化対象画像から予測画像を減算した予測残差をDCT変換(Discrete Cosine Transform)する;
 処理2:処理1にて得られた変換係数を量子化する;
 処理3:処理2にて量子化された変換係数を可変長符号化する;
 なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
Process 1: DCT transform (Discrete Cosine Transform) of the prediction residual obtained by subtracting the prediction image from the encoding target image;
Process 2: Quantize the transform coefficient obtained in Process 1;
Process 3: Variable length coding is performed on the transform coefficient quantized in Process 2;
The quantization parameter qp described above represents the magnitude of the quantization step QP used when the moving image coding apparatus 2 quantizes the transform coefficient (QP = 2 qp / 6 ).
  (PU分割タイプ)
 PU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2(mは1以上の任意の整数)を意味している。以下、対象CUを分割して得られる領域のことをパーティションとも称する。
(PU split type)
In the PU division type, if the size of the target CU is 2N × 2N pixels, there are the following eight patterns in total. That is, 4 symmetric splittings of 2N × 2N pixels, 2N × N pixels, N × 2N pixels, and N × N pixels, and 2N × nU pixels, 2N × nD pixels, nL × 2N pixels, And four asymmetric splittings of nR × 2N pixels. N = 2 m (m is an arbitrary integer of 1 or more). Hereinafter, an area obtained by dividing the target CU is also referred to as a partition.
 図4の(a)~(h)に、それぞれの分割タイプについて、CUにおけるPU分割の境界の位置を具体的に図示している。 (A) to (h) of FIG. 4 specifically show the positions of the boundaries of PU division in the CU for each division type.
 なお、図4の(a)は、CUの分割を行わない2N×2NのPU分割タイプを示している。 FIG. 4A shows a 2N × 2N PU partition type that does not perform CU partitioning.
 また、図4の(b)、(c)、および(d)は、それぞれ、PU分割タイプが、それぞれ、2N×N、2N×nU、および、2N×nDである場合のパーティションの形状について示している。以下、PU分割タイプが、2N×N、2N×nU、および、2N×nDである場合のパーティションを、まとめて横長パーティションと称する。 Also, (b), (c), and (d) of FIG. 4 show the partition shapes when the PU partition types are 2N × N, 2N × nU, and 2N × nD, respectively. ing. Hereinafter, partitions when the PU partition type is 2N × N, 2N × nU, and 2N × nD are collectively referred to as a horizontally long partition.
 また、図4の(e)、(f)、および(g)は、それぞれ、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションの形状について示している。以下、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションを、まとめて縦長パーティションと称する。 Further, (e), (f), and (g) of FIG. 4 show the shapes of partitions when the PU partition types are N × 2N, nL × 2N, and nR × 2N, respectively. . Hereinafter, partitions when the PU partition type is N × 2N, nL × 2N, and nR × 2N are collectively referred to as a vertically long partition.
 また、横長パーティションおよび縦長パーティションをまとめて長方形パーティションと称する。 Also, the horizontally long partition and the vertically long partition are collectively referred to as a rectangular partition.
 また、図4の(h)は、PU分割タイプが、N×Nである場合のパーティションの形状を示している。図4の(a)および(h)のPU分割タイプのことを、そのパーティションの形状に基づいて、正方形分割とも称する。また、図4の(b)~(g)のPU分割タイプのことは、非正方形分割とも称する。 Further, (h) in FIG. 4 shows the shape of the partition when the PU partition type is N × N. The PU partition types shown in FIGS. 4A and 4H are also referred to as square partitioning based on the shape of the partition. The PU partition types shown in FIGS. 4B to 4G are also referred to as non-square partitions.
 また、図4の(a)~(h)において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。 Also, in (a) to (h) of FIG. 4, the numbers given to the respective regions indicate the identification numbers of the regions, and the processing is performed on the regions in the order of the identification numbers. That is, the identification number represents the scan order of the area.
 また、図4の(a)~(h)において、左上がCUの基準点(原点)であるとする。 In FIGS. 4A to 4H, the upper left is the reference point (origin) of the CU.
   [インター予測の場合の分割タイプ]
 インターPUでは、上記8種類の分割タイプのうち、N×N(図4の(h))以外の7種類が定義されている。なお、上記4つの非対称的分割は、AMP(Asymmetric Motion Partition)と呼ばれることもある。
[Partition type for inter prediction]
In the inter PU, seven types other than N × N ((h) in FIG. 4) are defined among the above eight division types. The four asymmetric partitions may be called AMP (Asymmetric Motion Partition).
 なお、上述のNの具体的な値は、当該PUが属するCUのサイズによって規定され、nU、nD、nL、および、nRの具体的な値は、Nの値に応じて定められる。例えば、128×128画素のインターCUは、128×128画素、128×64画素、64×128画素、64×64画素、128×32画素、128×96画素、32×128画素、および、96×128画素のインターPUへ分割することが可能である。 The specific value of N described above is defined by the size of the CU to which the PU belongs, and specific values of nU, nD, nL, and nR are determined according to the value of N. For example, a 128 × 128 pixel inter-CU includes 128 × 128 pixels, 128 × 64 pixels, 64 × 128 pixels, 64 × 64 pixels, 128 × 32 pixels, 128 × 96 pixels, 32 × 128 pixels, and 96 × It is possible to divide into 128-pixel inter PUs.
   [イントラ予測の場合の分割タイプ]
 イントラPUでは、次の2種類の分割パターンが定義されている。すなわち、対象CUを分割しない、すなわち対象CU自身が1つのPUとして取り扱われる分割パターン2N×2Nと、対象CUを、4つのPUへと対称的に分割するパターンN×Nと、である。
[Partition type for intra prediction]
In the intra PU, the following two types of division patterns are defined. That is, there are a division pattern 2N × 2N in which the target CU is not divided, that is, the target CU itself is handled as one PU, and a pattern N × N in which the target CU is symmetrically divided into four PUs.
 したがって、イントラPUでは、図4に示した例でいえば、(a)および(h)の分割パターンを取ることができる。 Therefore, in the intra PU, the division patterns (a) and (h) can be taken in the example shown in FIG.
 例えば、128×128画素のイントラCUは、128×128画素、および、64×64画素のイントラPUへ分割することが可能である。 For example, an 128 × 128 pixel intra CU can be divided into 128 × 128 pixel and 64 × 64 pixel intra PUs.
 なお、Iスライスの場合、符号化単位情報CUにおいて、PU分割タイプPartModeを特定するためのイントラ分割モード(intra_part_mode)が含まれていてもよい。 In the case of an I slice, the coding unit information CU may include an intra partition mode (intra_part_mode) for specifying the PU partition type PartMode.
  (TU分割およびノード内のTUの順序)
 次に、図18~図20を用いて、TU分割およびノード内のTUの順序について説明する。TU分割のパターンは、CUのサイズ、分割の深度(trafoDepth)、および対象PUのPU分割タイプにより定まる。
(TU partitioning and TU order within a node)
Next, TU partitioning and the order of TUs within a node will be described with reference to FIGS. The TU partition pattern is determined by the CU size, the partition depth (trafoDepth), and the PU partition type of the target PU.
 また、TU分割のパターンには、正方形の4分木分割と、非正方形の4分木分割とが含まれる。TU分割のパターンの具体例は、図18および図19に示すとおりである。 TU partition patterns include square quadtree partition and non-square quadtree partition. Specific examples of the TU partition pattern are as shown in FIGS.
 図18は、正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。 FIG. 18 shows a division method for dividing a square node into a square or a non-square by quadtree division.
 図18の(a)は、正方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(b)は、正方形のノードを横長の長方形に4分木分割する分割方式を示している。そして、同図の(c)は、正方形のノードを縦長の長方形に4分木分割する分割方式を示している。 (A) in FIG. 18 shows a division method in which a square node is divided into quadtrees into squares. Moreover, (b) of the same figure has shown the division | segmentation system which divides a square node into a horizontally long rectangle by quadtree division. And (c) of the same figure has shown the division | segmentation system which divides a square node into a quadrangle | longitudinal rectangle by quadtree division.
 また、図19は、非正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。 Further, FIG. 19 shows a division method for dividing a non-square node into a square or non-square by quadtree division.
 図19の(a)は、横長の長方形のノードを横長の長方形に4分木分割する分割方式を示している。また、同図の(b)は、横長の長方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(c)は、縦長の長方形のノードを縦長の長方形に4分木分割する分割方式を示している。そして、同図の(d)は、縦長の長方形のノードを正方形に4分木分割する分割方式を示している。 (A) of FIG. 19 shows a division method in which a horizontally long rectangular node is divided into quadrant trees into horizontally long rectangles. Moreover, (b) of the same figure has shown the division | segmentation system which divides a horizontally long rectangular node into a quadtree in a square. In addition, (c) in the figure shows a division method in which a vertically long rectangular node is divided into quadrants into vertically long rectangles. And (d) of the figure has shown the division | segmentation system which divides a vertically long rectangular node into a quadtree into a square.
 また、図20に、PU分割タイプ2N×Nの32×32CUのTU分割の例を示している。同図において、“depth”は、分割の深度(trafoDepth)を示している。また、“split”は、当該depthにおけるsplit_transform_flagの値を示している。“split”が“1”であれば、当該depthのノードについてTU分割を行い、“0”であれば、TU分割を行わない。 FIG. 20 shows an example of 32 × 32 CU TU partitioning of PU partition type 2N × N. In the drawing, “depth” indicates a division depth (trafoDepth). Further, “split” indicates the value of split_transform_flag in the depth. If “split” is “1”, TU partitioning is performed for the depth node, and if “0”, TU partitioning is not performed.
 CUのサイズ、分割の深度(trafoDepth)、および対象PUのPU分割タイプと、TU分割パターンとの対応関係の詳細については後述する。 Details of the correspondence between the CU size, the division depth (trafoDepth), the PU division type of the target PU, and the TU division pattern will be described later.
 〔動画像復号装置〕
 以下では、本実施形態に係る動画像復号装置1の構成について、図1~図24を参照して説明する。
[Video decoding device]
Hereinafter, the configuration of the video decoding device 1 according to the present embodiment will be described with reference to FIGS.
  (動画像復号装置の概要)
 動画像復号装置1は、PU毎に予測画像を生成し、生成された予測画像と、符号化データ#1から復号された予測残差とを加算することによって復号画像#2を生成し、生成された復号画像#2を外部に出力する。
(Outline of video decoding device)
The video decoding device 1 generates a prediction image for each PU, generates a decoded image # 2 by adding the generated prediction image and a prediction residual decoded from the encoded data # 1, and generates The decoded image # 2 is output to the outside.
 ここで、予測画像の生成は、符号化データ#1を復号することによって得られる符号化パラメータを参照して行われる。符号化パラメータとは、予測画像を生成するために参照されるパラメータのことである。符号化パラメータには、画面間予測において参照される動きベクトルや画面内予測において参照される予測モードなどの予測パラメータに加えて、PUのサイズや形状、ブロックのサイズや形状、および、原画像と予測画像との残差データなどが含まれる。以下では、符号化パラメータに含まれる情報のうち、上記残差データを除く全ての情報の集合を、サイド情報と呼ぶ。 Here, the generation of the predicted image is performed with reference to the encoding parameter obtained by decoding the encoded data # 1. An encoding parameter is a parameter referred in order to generate a prediction image. In addition to prediction parameters such as a motion vector referred to in inter-screen prediction and a prediction mode referred to in intra-screen prediction, the encoding parameters include PU size and shape, block size and shape, and original image and Residual data with the predicted image is included. Hereinafter, a set of all information excluding the residual data among the information included in the encoding parameter is referred to as side information.
 また、以下では、復号の対象となるピクチャ(フレーム)、スライス、ツリーブロック、ブロック、および、PUをそれぞれ、対象ピクチャ、対象スライス、対象ツリーブロック、対象ブロック、および、対象PUと呼ぶことにする。 In the following, a picture (frame), a slice, a tree block, a block, and a PU to be decoded are referred to as a target picture, a target slice, a target tree block, a target block, and a target PU, respectively. .
 なお、ツリーブロックのサイズは、例えば64×64画素であり、PUのサイズは、例えば、64×64画素、32×32画素、16×16画素、8×8画素や4×4画素などである。しかしながら、これらのサイズは、単なる例示であり、ツリーブロックおよびPUのサイズは以上に示したサイズ以外のサイズであってもよい。 Note that the size of the tree block is, for example, 64 × 64 pixels, and the size of the PU is, for example, 64 × 64 pixels, 32 × 32 pixels, 16 × 16 pixels, 8 × 8 pixels, 4 × 4 pixels, or the like. . However, these sizes are merely examples, and the sizes of the tree block and PU may be other than the sizes shown above.
  (動画像復号装置の構成)
 再び、図2を参照して、動画像復号装置1の概略的構成について説明すると次のとおりである。図2は、動画像復号装置1の概略的構成について示した機能ブロック図である。
(Configuration of video decoding device)
Referring to FIG. 2 again, the schematic configuration of the moving picture decoding apparatus 1 will be described as follows. FIG. 2 is a functional block diagram showing a schematic configuration of the moving picture decoding apparatus 1.
 図2に示すように動画像復号装置1は、復号モジュール10、CU情報復号部11、PU情報復号部12、TU情報復号部13、予測画像生成部14、逆量子化・逆変換部15、フレームメモリ16および加算器17を備えている。 As shown in FIG. 2, the moving picture decoding apparatus 1 includes a decoding module 10, a CU information decoding unit 11, a PU information decoding unit 12, a TU information decoding unit 13, a predicted image generation unit 14, an inverse quantization / inverse conversion unit 15, A frame memory 16 and an adder 17 are provided.
   [復号モジュール]
 復号モジュール10は、バイナリからシンタックス値を復号する復号処理を行う。復号モジュール10は、より具体的には、供給元から供給される符号化データおよびシンタックス種別に基づいて、CABACおよびCAVLC等のエントロピー符号化方式により符号化されているシンタックス値を復号し、復号したシンタックス値を供給元に返す。
[Decryption module]
The decoding module 10 performs a decoding process for decoding a syntax value from binary. More specifically, the decoding module 10 decodes a syntax value encoded by an entropy encoding method such as CABAC and CAVLC based on encoded data and a syntax type supplied from a supplier, Returns the decrypted syntax value to the supplier.
 以下に示す例では、符号化データおよびシンタックス種別の供給元は、CU情報復号部11、PU情報復号部12、およびTU情報復号部13である。 In the example shown below, the sources of encoded data and syntax type are the CU information decoding unit 11, the PU information decoding unit 12, and the TU information decoding unit 13.
 復号モジュール10における復号処理の例として、CU情報復号部11から、復号モジュール10に対して、符号化データのバイナリ(ビット列)と、シンタックス種別“split_coding_unit_flag”とが供給された場合について説明すると次のとおりである。すなわち、この場合、復号モジュール10は、“split_coding_unit_flag”に関するビット列とシンタックス値との対応付けを参照して、バイナリからシンタックス値を導出して、導出したシンタックス値をCU情報復号部11に返す。 As an example of the decoding process in the decoding module 10, a case where a binary (bit string) of encoded data and a syntax type “split_coding_unit_flag” are supplied from the CU information decoding unit 11 to the decoding module 10 will be described next. It is as follows. That is, in this case, the decoding module 10 refers to the association between the bit string related to “split_coding_unit_flag” and the syntax value, derives the syntax value from the binary, and sends the derived syntax value to the CU information decoding unit 11. return.
   [CU情報復号部]
 CU情報復号部11は、復号モジュール10を用いて、動画像符号化装置2から入力された1フレーム分の符号化データ#1について、ツリーブロックおよびCUレベルでの復号処理を行う。CU情報復号部11は、具体的には、以下の手順により符号化データ#1を復号する。
[CU information decoding unit]
The CU information decoding unit 11 uses the decoding module 10 to perform decoding processing at the tree block and CU level on the encoded data # 1 for one frame input from the moving image encoding device 2. Specifically, the CU information decoding unit 11 decodes the encoded data # 1 according to the following procedure.
 まず、CU情報復号部11は、符号化データ#1に含まれる各種ヘッダを参照して、符号化データ#1を、スライス、ツリーブロックに順次分離する。 First, the CU information decoding unit 11 refers to various headers included in the encoded data # 1, and sequentially separates the encoded data # 1 into slices and tree blocks.
 ここで、各種ヘッダには、(1)対象ピクチャのスライスへの分割方法についての情報、および(2)対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報が含まれる。 Here, the various headers include (1) information about the method of dividing the target picture into slices, and (2) information about the size, shape, and position of the tree block belonging to the target slice. .
 そして、CU情報復号部11は、ツリーブロックヘッダTBLKHに含まれるツリーブロック分割情報SP_TBLKを参照して、対象ツリーブロックをCUに分割する。 Then, the CU information decoding unit 11 divides the target tree block into CUs with reference to the tree block division information SP_TBLK included in the tree block header TBLKH.
 次に、CU情報復号部11は、分割により得られたCUに対応する符号化単位情報(以下、CU情報と称する)を取得する。CU情報復号部11は、ツリーブロックに含まれる各CUを順に対象CUとして、対象CUに対応するCU情報の復号処理を実行する。 Next, the CU information decoding unit 11 acquires coding unit information (hereinafter referred to as CU information) corresponding to the CU obtained by the division. The CU information decoding unit 11 performs the decoding process of the CU information corresponding to the target CU, with each CU included in the tree block as the target CU in order.
 すなわち、CU情報復号部11は、対象CUについて得られる変換ツリーに関するTT情報TTI、および、対象CUについて得られる予測ツリーに関するPT情報PTIを逆多重化する。 That is, the CU information decoding unit 11 demultiplexes the TT information TTI related to the conversion tree obtained for the target CU and the PT information PTI related to the prediction tree obtained for the target CU.
 なお、TT情報TTIには、上述のとおり、変換ツリーに含まれるTUに対応するTU情報TUIが含まれる。また、PT情報PTIには、上述のとおり、対象予測ツリーに含まれるPUに対応するPU情報PUIが含まれる。 The TT information TTI includes the TU information TUI corresponding to the TU included in the conversion tree as described above. Further, as described above, the PT information PTI includes the PU information PUI corresponding to the PU included in the target prediction tree.
 CU情報復号部11は、対象CUについて得られたPT情報PTIをPU情報復号部12に供給する。また、CU情報復号部11は、対象CUについて得られたTT情報TTIをTU情報復号部13に供給する。 The CU information decoding unit 11 supplies the PT information PTI obtained for the target CU to the PU information decoding unit 12. Further, the CU information decoding unit 11 supplies the TT information TTI obtained for the target CU to the TU information decoding unit 13.
   [PU情報復号部]
 PU情報復号部12は、復号モジュール10を用いて、CU情報復号部11から供給されるPT情報PTIについて、PUレベルでの復号処理を行う。PU情報復号部12は、具体的には、以下の手順によりPT情報PTIを復号する。
[PU information decoding unit]
The PU information decoding unit 12 uses the decoding module 10 to perform decoding processing at the PU level for the PT information PTI supplied from the CU information decoding unit 11. Specifically, the PU information decoding unit 12 decodes the PT information PTI by the following procedure.
 PU情報復号部12は、PU分割タイプ情報Part_typeを参照して、対象予測ツリーにおけるPU分割タイプを決定する。続いて、PU情報復号部12は、対象予測ツリーに含まれる各PUを順に対象PUとして、対象PUに対応するPU情報の復号処理を実行する。 The PU information decoding unit 12 refers to the PU partition type information Part_type, and determines the PU partition type in the target prediction tree. Subsequently, the PU information decoding unit 12 performs a decoding process of PU information corresponding to the target PU, with each PU included in the target prediction tree as a target PU in order.
 すなわち、PU情報復号部12は、対象PUに対応するPU情報から、予測画像の生成に用いられる各パラメータの復号処理を行う。 That is, the PU information decoding unit 12 performs a decoding process on each parameter used for generating a predicted image from PU information corresponding to the target PU.
 PU情報復号部12は、対象PUについて復号したPU情報を、予測画像生成部14に供給する。 The PU information decoding unit 12 supplies the PU information decoded for the target PU to the predicted image generation unit 14.
   [TU情報復号部]
 TU情報復号部13は、復号モジュール10を用いて、CU情報復号部11から供給されるTT情報TTIについて、TUレベルでの復号処理を行う。TU情報復号部13は、具体的には、以下の手順によりTT情報TTIを復号する。
[TU information decoding unit]
The TU information decoding unit 13 uses the decoding module 10 to perform decoding processing at the TU level for the TT information TTI supplied from the CU information decoding unit 11. Specifically, the TU information decoding unit 13 decodes the TT information TTI by the following procedure.
 TU情報復号部13は、TT分割情報SP_TUを参照して、対象変換ツリーをノードまたはTUに分割する。なお、TU情報復号部13は、対象ノードについて、さらに分割を行うことが指定されていれば、再帰的にTUの分割処理を行う。 The TU information decoding unit 13 refers to the TT division information SP_TU and divides the target conversion tree into nodes or TUs. Note that the TU information decoding unit 13 recursively performs TU division processing if it is specified that further division is performed for the target node.
 分割処理が終了すると、TU情報復号部13は、対象予測ツリーに含まれる各TUを順に対象TUとして、対象TUに対応するTU情報の復号処理を実行する。 When the division process ends, the TU information decoding unit 13 executes the decoding process of the TU information corresponding to the target TU, with each TU included in the target prediction tree as the target TU in order.
 すなわち、TU情報復号部13は、対象TUに対応するTU情報から、変換係数の復元に用いられる各パラメータの復号処理を行う。 That is, the TU information decoding unit 13 performs a decoding process on each parameter used for restoring the transform coefficient from the TU information corresponding to the target TU.
 TU情報復号部13は、対象TUについて復号したTU情報を、逆量子化・逆変換部15に供給する。 The TU information decoding unit 13 supplies the TU information decoded for the target TU to the inverse quantization / inverse transform unit 15.
   [予測画像生成部]
 予測画像生成部14は、対象CUに含まれる各PUについて、PT情報PTIに基づいて予測画像を生成する。具体的には、予測画像生成部14は、対象予測ツリーに含まれる各対象PUについて、対象PUに対応するPU情報PUIに含まれるパラメータに従ってイントラ予測またはインター予測を行うことにより、復号済み画像である局所復号画像P’から予測画像Predを生成する。予測画像生成部14は、生成した予測画像Predを加算器17に供給する。
[Predicted image generator]
The predicted image generation unit 14 generates a predicted image based on the PT information PTI for each PU included in the target CU. Specifically, the prediction image generation unit 14 performs intra prediction or inter prediction for each target PU included in the target prediction tree according to the parameters included in the PU information PUI corresponding to the target PU, thereby generating a decoded image. A predicted image Pred is generated from a certain local decoded image P ′. The predicted image generation unit 14 supplies the generated predicted image Pred to the adder 17.
 なお、予測画像生成部14が、動き補償予測パラメータ(動きベクトル、参照画像インデックス、インター予測フラグ)に基づいて対象CUに含まれるPUの予測画像を生成する手法について説明すると以下のとおりである。 Note that a method in which the predicted image generation unit 14 generates a predicted image of a PU included in the target CU based on motion compensation prediction parameters (motion vector, reference image index, inter prediction flag) is as follows.
 インター予測フラグが単予測を示す場合、予測画像生成部14は、参照画像インデックスの示す参照画像の動きベクトルが示す場所に位置する復号画像に相当する予測画像を生成する。 When the inter prediction flag indicates single prediction, the predicted image generation unit 14 generates a predicted image corresponding to the decoded image located at the location indicated by the motion vector of the reference image indicated by the reference image index.
 一方、インター予測フラグが双予測を示す場合には、予測画像生成部14は、2組の参照画像インデックスと動きベクトルとの組み合わせのそれぞれについて動き補償により予測画像を生成し、平均を算出することで、もしくは、各予測画像を対象ピクチャと各参照画像との表示時間間隔に基づいて重み付け加算することで、最終的な予測画像を生成する。 On the other hand, when the inter prediction flag indicates bi-prediction, the predicted image generation unit 14 generates a predicted image by motion compensation for each of the two sets of reference image indexes and motion vectors, and calculates an average. Alternatively, the final predicted image is generated by weighting and adding each predicted image based on the display time interval between the target picture and each reference image.
   [逆量子化・逆変換部]
 逆量子化・逆変換部15は、対象CUに含まれる各TUについて、TT情報TTIに基づいて逆量子化・逆変換処理を実行する。具体的には、逆量子化・逆変換部15は、対象変換ツリーに含まれる各対象TUについて、対象TUに対応するTU情報TUIに含まれる量子化予測残差を逆量子化および逆直交変換することによって、画素毎の予測残差Dを復元する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことを指す。したがって、逆直交変換は、周波数領域から画素領域への変換である。また、逆直交変換の例としては、逆DCT変換(Inverse Discrete Cosine Transform)、および逆DST変換(Inverse Discrete Sine Transform)等が挙げられる。逆量子化・逆変換部15は、復元した予測残差Dを加算器17に供給する。
[Inverse quantization / inverse transform unit]
The inverse quantization / inverse transform unit 15 performs an inverse quantization / inverse transform process on each TU included in the target CU based on the TT information TTI. Specifically, the inverse quantization / inverse transform unit 15 performs inverse quantization and inverse orthogonal transform on the quantization prediction residual included in the TU information TUI corresponding to the target TU for each target TU included in the target conversion tree. By doing so, the prediction residual D for each pixel is restored. Here, the orthogonal transform refers to an orthogonal transform from the pixel region to the frequency region. Therefore, the inverse orthogonal transform is a transform from the frequency domain to the pixel domain. Examples of inverse orthogonal transform include inverse DCT transform (Inverse Discrete Cosine Transform), inverse DST transform (Inverse Discrete Sine Transform), and the like. The inverse quantization / inverse transform unit 15 supplies the restored prediction residual D to the adder 17.
   [フレームメモリ]
 フレームメモリ16には、復号された復号画像Pが、当該復号画像Pの復号に用いられたパラメータと共に、順次記録される。フレームメモリ16には、対象ツリーブロックを復号する時点において、当該対象ツリーブロックよりも先に復号された全てのツリーブロック(例えば、ラスタスキャン順で先行する全てのツリーブロック)に対応する復号画像が記録されている。フレームメモリ16に記録される復号パラメータの例としては、CU予測方式情報PredModeなどが挙げられる。
[Frame memory]
Decoded decoded images P are sequentially recorded in the frame memory 16 together with parameters used for decoding the decoded images P. In the frame memory 16, at the time of decoding the target tree block, decoded images corresponding to all tree blocks decoded before the target tree block (for example, all tree blocks preceding in the raster scan order) are stored. It is recorded. Examples of the decoding parameters recorded in the frame memory 16 include CU prediction method information PredMode.
   [加算器]
 加算器17は、予測画像生成部14より供給される予測画像Predと、逆量子化・逆変換部15より供給される予測残差Dとを加算することによって、対象CUについての復号画像Pを生成する。
[Adder]
The adder 17 adds the predicted image Pred supplied from the predicted image generation unit 14 and the prediction residual D supplied from the inverse quantization / inverse transform unit 15 to thereby obtain the decoded image P for the target CU. Generate.
 なお、動画像復号装置1において、画像内の全てのツリーブロックに対して、ツリーブロック単位の復号画像生成処理が終わった時点で、動画像復号装置1に入力された1フレーム分の符号化データ#1に対応する復号画像#2が外部に出力される。 In the video decoding device 1, the encoded data for one frame input to the video decoding device 1 at the time when the decoded image generation processing for each tree block is completed for all tree blocks in the image. Decoded image # 2 corresponding to # 1 is output to the outside.
 以下では、(1)CU情報復号部11、(2)PU情報復号部12、および(3)TU情報復号部13の構成について、それぞれの構成に対応する復号モジュール10の構成と共に詳細に説明する。 Hereinafter, the configurations of (1) CU information decoding unit 11, (2) PU information decoding unit 12, and (3) TU information decoding unit 13 will be described in detail together with the configuration of decoding module 10 corresponding to each configuration. .
  (1)CU情報復号部の詳細
 次に、図1を用いて、CU情報復号部11および復号モジュール10の構成例について説明する。図1は、動画像復号装置1において、CU予測情報を復号するための構成、すなわちCU情報復号部11および復号モジュール10の構成について例示する機能ブロック図である。
(1) Details of CU Information Decoding Unit Next, configuration examples of the CU information decoding unit 11 and the decoding module 10 will be described with reference to FIG. FIG. 1 is a functional block diagram illustrating a configuration for decoding CU prediction information, that is, a configuration of a CU information decoding unit 11 and a decoding module 10 in the moving image decoding apparatus 1.
 以下、CU情報復号部11および復号モジュール10の順で、各部の構成について説明する。 Hereinafter, the configuration of each unit will be described in the order of the CU information decoding unit 11 and the decoding module 10.
   (CU情報復号部)
 図1に示すように、CU情報復号部11は、CU予測モード決定部111、PUサイズ決定部112、およびPUサイズテーブル113を備える。
(CU information decoding unit)
As illustrated in FIG. 1, the CU information decoding unit 11 includes a CU prediction mode determination unit 111, a PU size determination unit 112, and a PU size table 113.
 CU予測モード決定部111は、CU予測モードの符号化データおよびシンタックス種別と、PU分割タイプの符号化データおよびシンタックス種別とを、復号モジュール10に供給する。また、CU予測モード決定部111は、復号モジュール10から、復号されたCU予測モードのシンタックス値と、PU分割タイプのシンタックス値とを取得する。 The CU prediction mode determination unit 111 supplies the encoded data and syntax type of the CU prediction mode and the encoded data and syntax type of the PU partition type to the decoding module 10. Further, the CU prediction mode determination unit 111 acquires the decoded CU prediction mode syntax value and the PU partition type syntax value from the decoding module 10.
 具体的には、CU予測モード決定部111は、次のようにして、CU予測モードおよびPU分割タイプを決定する。 Specifically, the CU prediction mode determination unit 111 determines the CU prediction mode and the PU partition type as follows.
 まず、CU予測モード決定部111は、スキップフラグSKIPを復号モジュール10により復号して、対象CUがスキップCUであるか否かを決定する。 First, the CU prediction mode determination unit 111 decodes the skip flag SKIP by the decoding module 10 and determines whether or not the target CU is a skip CU.
 対象CUがスキップCUでない場合、CU予測タイプ情報Pred_typeを復号モジュール10により復号する。また、CU予測タイプ情報Pred_typeに含まれるCU予測方式情報PredModeに基づいて、対象CUがイントラCUか、インターCUかを決定するとともに、PU分割タイプ情報PartModeに基づいてPU分割タイプを決定する。 If the target CU is not a skip CU, the decoding module 10 decodes the CU prediction type information Pred_type. Moreover, while determining whether object CU is intra CU or inter CU based on CU prediction method information PredMode included in CU prediction type information Pred_type, PU partition type is determined based on PU partition type information PartMode.
 PUサイズ決定部112は、PUサイズテーブル113を参照して、対象CUのサイズと、CU予測モード決定部111において決定されたCU予測タイプおよびPU分割タイプとから、PUの個数およびサイズを決定する。 The PU size determination unit 112 refers to the PU size table 113 and determines the number and size of PUs from the size of the target CU and the CU prediction type and PU partition type determined by the CU prediction mode determination unit 111. .
 PUサイズテーブル113は、CUのサイズとCU予測タイプ-PU分割タイプとの組み合わせにPUの個数およびサイズを対応付けるテーブルである。 The PU size table 113 is a table that associates the number and size of PUs with a combination of a CU size and a CU prediction type-PU partition type.
 ここで、図5を用いて、PUサイズテーブル113の具体的な構成例について説明すると次のとおりである。 Here, a specific configuration example of the PU size table 113 will be described with reference to FIG.
 図5に示すPUサイズテーブル113では、CUのサイズと、PU分割タイプ(イントラCUおよびインターCU)に応じて、PUの個数およびサイズが定義されている。なお、表中の“d”は、CUの分割深度を示す。 In the PU size table 113 shown in FIG. 5, the number and size of PUs are defined according to the CU size and the PU partition type (intra CU and inter CU). Note that “d” in the table indicates the division depth of the CU.
 PUサイズテーブル113では、CUのサイズとして、64×64、32×32、16×16、および8×8の4つが定義されている。 In the PU size table 113, four sizes of 64 × 64, 32 × 32, 16 × 16, and 8 × 8 are defined as CU sizes.
 また、PUサイズテーブル113では、CUのサイズに対して、各PU分割タイプにおけるPUの個数およびサイズが定義されている。 In the PU size table 113, the number and size of PUs in each PU partition type are defined for the size of the CU.
 例えば、64×64のインターCUであって、2N×N分割である場合は、PUは2個でサイズは共に64×32である。 For example, in the case of a 64 × 64 inter CU and 2N × N division, there are two PUs and the size is both 64 × 32.
 また、64×64のインターCUであって、2N×nU分割である場合は、PUは2個でサイズは64×16と64×48とである。 Further, in the case of a 64 × 64 inter CU and 2N × nU division, there are two PUs and the sizes are 64 × 16 and 64 × 48.
 また、8×8のイントラCUであって、N×N分割である場合は、PUは4個でサイズはすべて4×4である。 Also, in the case of an 8 × 8 intra CU and N × N division, there are 4 PUs and all the sizes are 4 × 4.
 なお、スキップCUのPU分割タイプは、2N×2Nと推定される。また、表中、“-”で示している箇所は、選択できないPU分割タイプであることを示している。 Note that the PU partition type of the skip CU is estimated to be 2N × 2N. Further, in the table, a portion indicated by “−” indicates that the PU partition type cannot be selected.
 すなわち、CUサイズが、8×8の場合、インターCUにおいて、非対称パーティション(2N×nU、2N×nD、nL×2N、およびnR×2N)のPU分割タイプは選択不可である。また、インターCUの場合、N×NのPU分割タイプは、選択不可である。 That is, when the CU size is 8 × 8, PU partition types of asymmetric partitions (2N × nU, 2N × nD, nL × 2N, and nR × 2N) cannot be selected in the inter CU. In the case of an inter CU, an N × N PU partition type cannot be selected.
 また、イントラ予測では、CUサイズが、8×8の場合のみ、N×NのPU分割タイプを選択することが可能である。 In intra prediction, an N × N PU partition type can be selected only when the CU size is 8 × 8.
   (復号モジュール)
 図1に示すように、復号モジュール10は、CU予測モード復号部(復号手段、変更手段)1011、二値化情報記憶部1012、コンテキスト記憶部1013、および確率設定記憶部1014を備える。
(Decryption module)
As shown in FIG. 1, the decoding module 10 includes a CU prediction mode decoding unit (decoding unit, changing unit) 1011, a binarized information storage unit 1012, a context storage unit 1013, and a probability setting storage unit 1014.
 CU予測モード復号部1011は、CU予測モード決定部111から供給される符号化データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。具体的には、CU予測モード復号部1011は、二値化情報記憶部1012に記憶されている二値化情報に従って、CU予測モードおよびPU分割タイプの復号処理を行う。また、CU予測モード復号部1011は、スキップフラグの復号処理を行う。 The CU prediction mode decoding unit 1011 decodes the syntax value from the binary included in the encoded data according to the encoded data and the syntax type supplied from the CU prediction mode determination unit 111. Specifically, the CU prediction mode decoding unit 1011 performs CU prediction mode and PU partition type decoding processing according to the binarization information stored in the binarization information storage unit 1012. The CU prediction mode decoding unit 1011 performs a skip flag decoding process.
 二値化情報記憶部1012には、CU予測モード復号部1011が、バイナリから、シンタックス値を復号するための二値化情報が記憶されている。二値化情報は、バイナリ(bin列)と、シンタックス値との対応付けを示す情報である。 The binarization information storage unit 1012 stores binarization information for the CU prediction mode decoding unit 1011 to decode a syntax value from binary. The binarization information is information indicating a correspondence between a binary (bin sequence) and a syntax value.
 コンテキスト記憶部1013には、CU予測モード復号部1011が、復号処理の際に参照するコンテキストが記憶されている。 The context storage unit 1013 stores a context that the CU prediction mode decoding unit 1011 refers to in the decoding process.
 確率設定記憶部1014には、CU予測モード復号部1011が、符号化データから算術復号処理によりbin列を復号する際に参照する確率設定値が記録されている。なお、確率設定値は、各コンテキストに対応する記録設定値と、既定の確率設定値がある。各コンテキストに対応する確率設定値は、算術復号の結果に基づいて更新される。一方、既定の確率設定値は一定であり、算術復号の結果により更新されない。なお、確率設定値は、確率の値自体ではなく、確率の値に対応する整数値で示される状態で表現しても良い。 The probability setting storage unit 1014 stores a probability setting value that is referenced when the CU prediction mode decoding unit 1011 decodes a bin sequence from the encoded data by arithmetic decoding processing. The probability setting value includes a recording setting value corresponding to each context and a default probability setting value. The probability setting value corresponding to each context is updated based on the result of arithmetic decoding. On the other hand, the predetermined probability setting value is constant and is not updated by the result of arithmetic decoding. Note that the probability setting value may be expressed not in the probability value itself but in a state indicated by an integer value corresponding to the probability value.
    [具体的構成例]
    [1-1]コンテキストの参照を制限する構成の例
 CU予測モード復号部1011は、PU分割タイプが非対称パーティションであるとき、非対称パーティションの分割の種類を示す情報を、CABACのコンテキストを用いないで復号処理を行ってもかまわない。言い換えると、非対称パーティションの分割の種類を示す情報に対応するbin列を算術復号により符号化データから復号する際に、確率設定記憶部1014にコンテキスト毎に記録された確率設定値を用いず、既定の確率設定値(例えば0,1の発生確率が等確率に対応する確率設定値)を用いて復号処理を行ってもかまわない。
[Specific configuration example]
[1-1] Example of Configuration that Limits Reference of Context When the PU partition type is an asymmetric partition, the CU prediction mode decoding unit 1011 does not use information indicating the partition type of the asymmetric partition without using the CABAC context. Decryption processing may be performed. In other words, when decoding a bin string corresponding to information indicating the type of division of an asymmetric partition from encoded data by arithmetic decoding, the probability setting value recorded for each context in the probability setting storage unit 1014 is not used. Decoding processing may be performed using a probability setting value (for example, a probability setting value in which occurrence probabilities of 0 and 1 correspond to equal probabilities).
 以下、図7を参照しながら、このようにコンテキストの参照の制限を行う構成について例示する。 Hereinafter, with reference to FIG. 7, an example of a configuration for restricting context reference in this way will be described.
 CU予測モード復号部1011は、規定の確率を仮定して非対称パーティションの分割の種類を示す情報を復号する。 The CU prediction mode decoding unit 1011 decodes information indicating the type of asymmetric partition division assuming a specified probability.
 図7を参照しながら、本構成例についてさらに具体的に例示すると次のとおりである。図7に示す対応付けテーブルBT1では、長方形の分割について、プレフィックス部は、分割の方向が横長(水平)および縦長(垂直)のいずれであるかを示しており、サフィックス部は、分割の種類を示している。 Referring to FIG. 7, a more specific example of this configuration example is as follows. In the association table BT1 shown in FIG. 7, for the rectangular division, the prefix portion indicates whether the division direction is horizontal (horizontal) or vertical (vertical), and the suffix portion indicates the type of division. Show.
 例えば、プレフィックス部が、PU分割タイプが横長の分割であることを示すとき、サフィックス部は、2N×N、2N×nU、および2N×nDの3つの横長の分割のうち、いずれを選択するかを示す。 For example, when the prefix part indicates that the PU partition type is a horizontally long partition, the suffix part selects one of the three horizontally long partitions of 2N × N, 2N × nU, and 2N × nD. Indicates.
 CU予測モード復号部1011は、PU分割タイプが、長方形の分割である場合、確率設定記憶部1014に設定されているコンテキスト毎に記録された確率設定値の代わりに、確率設定記憶部1014に設定されている既定の確率設定値を参照して、サフィックス部の各binの算術復号を行う。なお、当該確率設定値は、例えば、等確率を仮定して設定しておくことができる。 When the PU partition type is rectangular partitioning, the CU prediction mode decoding unit 1011 sets the probability setting storage unit 1014 instead of the probability setting value recorded for each context set in the probability setting storage unit 1014. Referring to the predetermined probability setting value, arithmetic decoding of each bin of the suffix part is performed. Note that the probability setting value can be set assuming an equal probability, for example.
 ここで、コンテキストを用いたCABACの算術復号とは、バイナリの位置(コンテキスト)に応じてバイナリ値の発生確率(を示す状態)を記録・更新しておき、その発生確率(状態)に基づき算術復号を行う処理のことを言う。一方、コンテキストを用いないCABACの算術復号とは、バイナリ値の発生確率(状態)の更新を行わず確率設定値により定まる固定確率に基づき算術復号を行うことを言う。コンテキストを用いない場合には、符号化処理、復号処理における発生確率(状態)の更新が不要である分、処理負荷が低減されスループットが向上する。またコンテキストに応じた発生確率(状態)を蓄積するメモリが不要になる。固定確率として、確率0.5を用いる場合は、EP符号化(等確率、Equal Probability符号化)もしくはBypass(バイパス)と呼ばれることがある。 Here, CABAC arithmetic decoding using context is a method of recording / updating the occurrence probability of binary value (indicating state) in accordance with the binary position (context), and performing arithmetic based on the occurrence probability (state). This refers to the process of decoding. On the other hand, CABAC arithmetic decoding without using context refers to performing arithmetic decoding based on a fixed probability determined by a probability setting value without updating the occurrence probability (state) of a binary value. When the context is not used, the processing load is reduced and the throughput is improved because the occurrence probability (state) is not updated in the encoding process and the decoding process. In addition, a memory for accumulating occurrence probabilities (states) corresponding to the context is not necessary. When a probability of 0.5 is used as a fixed probability, it may be called EP coding (equal probability, Equal-Probability coding) or Bypass (bypass).
 図6を用いて、上記構成による作用・効果を説明する。まず、コンテキストが符号化効率の向上に有効なのは、特定の状況において、同一の符号が連続して発生する場合である。コンテキストを参照してサフィックス部を復号することで符号化効率が向上するのは、具体的には、横長の分割が選択された状況において、2N×N、2N×nU、または2N×nDが連続して選択される場合である。例えば、2N×Nが選択された予測単位の次の予測単位において、2N×Nが選択されるような場合である。 The operation and effect of the above configuration will be described with reference to FIG. First, the context is effective for improving the coding efficiency when the same code is generated continuously in a specific situation. The decoding efficiency is improved by decoding the suffix part with reference to the context. Specifically, 2N × N, 2N × nU, or 2N × nD is continuous in a situation where horizontal division is selected. Is selected. For example, 2N × N is selected in the prediction unit next to the prediction unit in which 2N × N is selected.
 一方、パーティションは、図6に示すようにエッジ境界をまたがないように設定される場合が多い。 On the other hand, the partition is often set so as not to cross the edge boundary as shown in FIG.
 すなわち、図6に示すように、傾斜を有するエッジE1が領域内に存在するとき、当該エッジE1をまたがないように、CU10およびC20のPU分割タイプが決定される。 That is, as shown in FIG. 6, when an edge E1 having an inclination exists in the region, the PU partition types of the CUs 10 and C20 are determined so as not to cross the edge E1.
 より詳細には、CU10では、エッジE1は、領域の垂直方向中央寄りに存在し、CU20では、エッジE1が領域上方に存在する。 More specifically, in CU10, the edge E1 exists near the center in the vertical direction of the region, and in CU20, the edge E1 exists above the region.
 このように傾斜を有するエッジE1が領域内に存在する場合、CU10は、エッジE1をまたがないように、2N×NのPU分割タイプにより対称なPU11およびPU12分割される。 When the edge E1 having such an inclination exists in the region, the CU 10 is divided into PU11 and PU12 that are symmetrical by the 2N × N PU partition type so as not to cross the edge E1.
 また、CU20は、エッジE1をまたがないように、2N×nUの分割タイプにより、非対称なPU21およびPU22に分割される。 In addition, the CU 20 is divided into asymmetric PU 21 and PU 22 by a 2N × nU division type so as not to cross the edge E1.
 このように、傾斜を有するエッジE1が、領域内に存在する場合、同一の形状のパーティションが連続して出現しないときがある。 In this way, when the edge E1 having an inclination exists in the region, the same shape partition may not appear continuously.
 このような場合は、2N×N、2N×nU、または2N×nDが連続して選択される場合に該当しない。このような場合には、コンテキストを用いなくても符号化効率が低下しない場合がある。 In this case, 2N × N, 2N × nU, or 2N × nD is not applicable when selected continuously. In such a case, the encoding efficiency may not be reduced without using a context.
 上記構成のように、プレフィックス部を規定の確率を仮定して上記情報を復号することで、符号化効率を維持しつつ、pred_typeの復号処理を簡略化することができる。 As in the above configuration, decoding the above information assuming a prescribed probability for the prefix part can simplify the decoding process of pred_type while maintaining the encoding efficiency.
   [作用・効果]
 本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、長方形の予測単位への分割を含み、上記長方形が縦長および横長のいずれであるかを示す符号と、上記長方形の種類を示す符号とを含む、上記長方形の予測単位への分割を特定するための符号のうち、上記長方形の種類を示す符号を、コンテキストを用いずに復号する復号手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention is the image decoding apparatus that generates a prediction image and restores an image for each prediction unit obtained by dividing the coding unit into one or more numbers. The division type into a rectangle includes a division into rectangular prediction units, and includes a code indicating whether the rectangle is vertically long or horizontally long, and a code indicating the type of the rectangle. Of the codes for specifying the division, the code indicating the type of the rectangle is provided with decoding means for decoding without using the context.
 よって、符号化効率を維持しつつ、コンテキストを参照しないことによる処理の簡略化を図ることができる。 Therefore, it is possible to simplify the processing by not referring to the context while maintaining the encoding efficiency.
 なお、上記の例は、複数の長方形パーティションを含むPU分割に対応するPU分割タイプの集合であって、対称分割と非対称分割の分割タイプを共に含むPU分割タイプの集合において、何れかのPU分割タイプを選択するための情報を復号する際に、コンテキストを用いずに復号してもよい、と表現することもできる。 Note that the above example is a PU partition type set corresponding to PU partition including a plurality of rectangular partitions, and any PU partition in a PU partition type set including both symmetric partition and asymmetric partition types. When decoding information for selecting a type, it may be expressed that decoding may be performed without using a context.
 また、上記の例において、非対称パーティションの選択に係る情報に対応するbin列のうち、全てのbinの復号にコンテキストを用いないのではなく、一部のbinにコンテキストを用いてもよい。例えば、上述した図7の例では、8×8より大きいCUで長方形パーティションを含む分割が選択された場合、最大2桁のbinが複号される。このうち1桁目は対称分割か非対称分割かを示す情報である。2桁目は、1桁目が‘0’すなわち非対称分割であることを示す場合に複号されるbinであって、非対称分割における小さいPUと大きいPUの位置関係を表す。1桁目については、前述の図6に基づき説明した理由から同一の符号が連続しない場合もあるため、コンテキストを設定しないことが好ましい。一方、2桁目については、非対称パーティションが利用されるという前提条件が成立した状態において、小さいPUは局所的には片側の辺(例えば2桁目が2NxnUと2N×nDの選択情報を表す場合、上方側または下方側の何れか)に寄りやすい傾向があるため、コンテキストを設定することが好ましい。 Further, in the above example, the context may be used for some bins instead of using the context for decoding all bins in the bin sequence corresponding to the information related to the selection of the asymmetric partition. For example, in the example of FIG. 7 described above, when a division including a rectangular partition is selected with a CU larger than 8 × 8, a bin of up to two digits is decoded. Of these, the first digit is information indicating symmetric division or asymmetric division. The second digit is a bin that is decoded when the first digit indicates “0”, that is, an asymmetric division, and represents the positional relationship between a small PU and a large PU in the asymmetric division. For the first digit, it is preferable not to set a context because the same code may not be continuous for the reason described with reference to FIG. On the other hand, for the second digit, in the state where the precondition that an asymmetric partition is used is satisfied, the small PU is locally on one side (for example, the second digit represents 2N × nU and 2N × nD selection information) , It is preferable to set a context.
    [1-2]CU予測タイプ情報(pred_type)を復号する構成
 CU予測モード復号部1011は、以下に示すように、二値化情報記憶部1012に記憶される二値化情報を参照してCU予測タイプ情報を復号するよう構成してもよい。
[1-2] Configuration for Decoding CU Prediction Type Information (pred_type) The CU prediction mode decoding unit 1011 refers to the binarization information stored in the binarization information storage unit 1012 as described below. You may comprise so that prediction type information may be decoded.
 図7を用いて、二値化情報記憶部1012に記憶される二値化情報の構成例について説明する。図7は、CU予測タイプおよびPU分割タイプの組み合わせと、bin列との対応付けを定義する二値化情報の一例を示すテーブルである。 A configuration example of the binarized information stored in the binarized information storage unit 1012 will be described with reference to FIG. FIG. 7 is a table showing an example of binarization information that defines associations between combinations of CU prediction types and PU partition types and bin sequences.
 なお、図7では、例示的に、二値化情報を、bin列と、CU予測タイプ-PU分割タイプとを対応付けるテーブル形式にて示しているが、これに限られない。二値化情報は、PU分割タイプと、CU予測タイプとを導出するための導出式であってもかまわない。後に説明する二値化情報についても同様である。 In FIG. 7, for example, the binarization information is shown in a table format that associates a bin column with a CU prediction type-PU partition type, but is not limited thereto. The binarization information may be a derivation formula for deriving the PU partition type and the CU prediction type. The same applies to binarization information described later.
 また、二値化情報は、データとして記憶されていなければならないわけではなく、復号処理を行うプログラムのロジックとして実現されていてもかまわない。 In addition, the binarized information does not have to be stored as data, and may be realized as a program logic for performing a decoding process.
 図7に例示する対応付けテーブルBT1では、CU予測タイプおよびPU分割タイプと、CUサイズとに応じて、bin列が対応付けられている。 In the association table BT1 illustrated in FIG. 7, bin columns are associated according to the CU prediction type, the PU partition type, and the CU size.
 まず、CUサイズの定義について説明する。対応付けテーブルBT1では、CUサイズの定義として、CUサイズが8×8より大きい場合(CU>8×8)の非8×8CU1012Bと、CUサイズが8×8(CU==8×8)の場合の8×8CU1012Aの2種類の対応付けが定義されている。 First, the definition of the CU size will be described. In the association table BT1, as the definition of the CU size, when the CU size is larger than 8 × 8 (CU> 8 × 8), the CU size is 8 × 8 (CU == 8 × 8). Two types of associations of 8 × 8 CU 1012A are defined.
 なお、非8×8CU1012Bおよび8×8CU1012Aそれぞれにおいて対応付けられているbin列は、プレフィックス部(prefix)とサフィックス部(suffix)とから構成される。 Note that the bin sequence associated with each of the non-8 × 8 CU 1012B and the 8 × 8 CU 1012A includes a prefix part (prefix) and a suffix part (suffix).
 また、対応付けテーブルBT1では、それぞれのCUサイズの定義について、CU予測タイプとして、前述のイントラCU(“Intra”と図示)およびインターCU(“Inter”と図示)の2系統が定義されている。さらに、それぞれのCU予測タイプに応じて、PU分割タイプが定義されている。 In addition, in the association table BT1, for the definition of each CU size, two systems of the above-described intra CU (shown as “Intra”) and inter CU (shown as “Inter”) are defined as CU prediction types. . Furthermore, PU partition types are defined according to each CU prediction type.
 具体的には、以下のとおりである。まず、イントラCUの場合、2N×2NおよびN×Nの2種類のPU分割タイプについて定義されている。 Specifically, it is as follows. First, in the case of an intra CU, two PU partition types of 2N × 2N and N × N are defined.
 2N×2Nについて説明すると次のとおりである。非8×8CU1012Bでは、プレフィックス部のみが定義されており、bin列は、“000”である。サフィックス部は、符号化されていない。また、8×8CU1012Aでは、プレフィックス部は、“000”であり、サフィックス部は、“0”である。 2N × 2N is described as follows. In the non-8 × 8 CU 1012B, only the prefix part is defined, and the bin string is “000”. The suffix part is not encoded. In the 8 × 8 CU 1012A, the prefix part is “000” and the suffix part is “0”.
 一方、N×Nについては、非8×8CU1012Bにのみ定義されている。この場合、プレフィックス部は、“000”であり、サフィックス部は、“1”である。 On the other hand, N × N is defined only in non-8 × 8CU1012B. In this case, the prefix part is “000” and the suffix part is “1”.
 このように、イントラCUの場合は、サフィックス部については、“000”で共通である。 Thus, in the case of an intra CU, the suffix part is “000”.
 次に、インターCUの場合、2N×2N、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2Nの7つのPU分割タイプについて定義されている。 Next, in the case of an inter CU, seven PU partition types of 2N × 2N, 2N × N, 2N × nU, 2N × nD, N × 2N, nL × 2N, and nR × 2N are defined.
 PU分割タイプが、2N×2Nのときは、非8×8CU1012Bおよび8×8CU1012Aのいずれにおいても、プレフィックス部のみが定義されており、bin列は、“1”である。 When the PU partition type is 2N × 2N, only the prefix part is defined in both the non-8 × 8 CU 1012B and the 8 × 8 CU 1012A, and the bin string is “1”.
 非8×8CU1012Bでは、水平方向の分割を行う横長パーティションのPU分割タイプ、2N×N、2N×nU、および、2N×nDについて、共通のプレフィックス部“01”が割り当てられている。 In the non-8 × 8 CU 1012B, a common prefix part “01” is assigned to the PU partition type 2N × N, 2N × nU, and 2N × nD of the horizontally long partition that performs horizontal partitioning.
 また、2N×N、2N×nU、および、2N×nDのサフィックス部は、それぞれ、“1”、“00”、および“01”である。 Also, the suffix portions of 2N × N, 2N × nU, and 2N × nD are “1”, “00”, and “01”, respectively.
 また、垂直方向の分割を行う縦長パーティションのPU分割タイプ、N×2N、nL×2N、および、nR×2Nについて、共通のプレフィックス部“001”が割り当てられている。 Also, a common prefix part “001” is assigned to the PU partition types of vertical partitions that perform vertical partitioning, N × 2N, nL × 2N, and nR × 2N.
 N×2N、nL×2N、および、nR×2Nのサフィックス部は、それぞれ、“1”、“00”、および“01”である。サフィックス部については、上述の水平方向の分割を行うPU分割タイプの場合と同様である。 The suffix parts of N × 2N, nL × 2N, and nR × 2N are “1”, “00”, and “01”, respectively. The suffix portion is the same as in the case of the PU partition type that performs the horizontal partition described above.
 つまり、横長パーティションおよび縦長パーティションの定義では、サフィックス部は、分割の種類を表している。すなわち、対称分割である場合、binは、“1”である。また、“00”は、分割の境界が対称分割のときよりも原点側にあることを示し、“01”は、分割の境界が対称分割のときよりも原点から遠い側にあることを示している。 That is, in the definition of a horizontally long partition and a vertically long partition, the suffix part represents the type of division. That is, in the case of symmetrical division, bin is “1”. “00” indicates that the boundary of the division is closer to the origin than in the case of symmetric division, and “01” indicates that the boundary of the division is further from the origin than in the case of symmetric division. Yes.
 続いて、8×8CU1012Aでは、2N×2N、2N×N、および、N×2Nについてプレフィックス部のみが定義されている。2N×2N、2N×N、および、N×2Nのプレフィックス部は、それぞれ、“1”、“01”、および、“001”である。 Subsequently, in the 8 × 8 CU 1012A, only the prefix portion is defined for 2N × 2N, 2N × N, and N × 2N. The prefix portions of 2N × 2N, 2N × N, and N × 2N are “1”, “01”, and “001”, respectively.
 CU予測モード復号部1011は、上記の二値化情報に従った復号処理において、プレフィックス部およびサフィックス部の各bin位置に対して異なるコンテキストを用いてもよい。 The CU prediction mode decoding unit 1011 may use different contexts for the respective bin positions of the prefix part and the suffix part in the decoding process according to the above binarization information.
 プレフィックス部およびサフィックス部の各bin位置に対して異なるコンテキストを用いる場合、コンテキストは、以下の合計8個になる。 When different contexts are used for each bin position of the prefix part and the suffix part, there are a total of eight contexts as follows.
 まず、プレフィックス部は、最大3ビットのbinが定義されているため、コンテキストの数は、3個である。 First, since the prefix part defines bins with a maximum of 3 bits, the number of contexts is three.
 以下、サフィックス部については、まず、2N×2NおよびN×Nの場合、1個である。そして、横長パーティション(2N×N、2N×nU、および、2N×nD)の場合、2個であり、縦長パーティション(N×2N、nL×2N、および、nR×2N)の場合、2個である。 Hereinafter, the suffix part is one for 2N × 2N and N × N. And in the case of a horizontally long partition (2N × N, 2N × nU, and 2N × nD), there are two, and in the case of a vertically long partition (N × 2N, nL × 2N, and nR × 2N), two is there.
    [1-3]小サイズのCUにおいて、イントラCUについて短い符号を復号する構成
 CU予測モード復号部1011は、小サイズのCUにおいて、イントラCUについて短い符号を復号するよう構成してもよい。小サイズのCUとは、所定サイズ以下のサイズのCUであるが、以下では、例示的に、8×8サイズのCUとする。
[1-3] Configuration of decoding short code for intra CU in small size CU The CU prediction mode decoding unit 1011 may be configured to decode a short code for intra CU in a small size CU. The small size CU is a CU having a size equal to or smaller than a predetermined size. In the following, it is assumed to be an 8 × 8 size CU.
    [構成例1-3-1]
 そこで、図8に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。図8は、二値化情報の定義である8×8CU1012Aの他の構成例を示している。すなわち、図8に示す8×8CU1012A_1は、図7に示す対応付けテーブルBT1に含まれる8×8CU1012Aの他の構成例である。
[Configuration Example 1-3-1]
Therefore, the binarization information stored in the binarization information storage unit 1012 may be configured as shown in FIG. FIG. 8 shows another configuration example of 8 × 8 CU 1012A which is the definition of binarization information. That is, 8 × 8 CU 1012A_1 illustrated in FIG. 8 is another configuration example of 8 × 8 CU 1012A included in association table BT1 illustrated in FIG.
 図8に示すように、二値化情報の定義である8×8CU1012A_1では、小サイズのCUである8×8サイズのCUにおいて、イントラCUに短い符号を割り当てる。 As shown in FIG. 8, in the 8 × 8 CU 1012A_1 that is the definition of the binarization information, a short code is assigned to the intra CU in the 8 × 8 size CU that is a small size CU.
 図8に示す8×8CU1012A_1では、大サイズのCUにおいてイントラCUに対して割り当てられている符号に比べて短い符号が割り当てられている(図7の非8×8CU1012Bを参照)。なお、大サイズのCUとは、小サイズのCUでないCUのことであり、具体的には、サイズが8×8より大きいCUのことを意味する。 In the 8 × 8 CU 1012A_1 shown in FIG. 8, a code shorter than the code assigned to the intra CU is assigned in a large CU (see the non-8 × 8 CU 1012B in FIG. 7). The large size CU is a CU that is not a small size CU, and specifically means a CU having a size larger than 8 × 8.
 また、8×8CU1012A_1では、イントラCUに割り当てられている符号のほうが、インターCUに割り当てられている符号よりも短い。言い換えれば、同一サイズのCUにおいては、イントラCUでない他のPU分割タイプに比べて、イントラCUに短い符号が割り当てられる。 Also, in 8 × 8 CU 1012A_1, the code assigned to the intra CU is shorter than the code assigned to the inter CU. In other words, in a CU of the same size, a shorter code is assigned to an intra CU than other PU partition types that are not intra CUs.
 例えば、8×8CU1012A_1では、イントラCUには、1ビットの符号が割り当てられており、インターCUには、2ビットまたは3ビットの符号が割り当てられている。 For example, in the 8 × 8 CU 1012A_1, a 1-bit code is assigned to the intra CU, and a 2-bit or 3-bit code is assigned to the inter CU.
 インター予測が当たりにくい領域では、小さいCUのイントラ予測が用いられる傾向がある。そのため、小さいCUでは、イントラCUの使用率が高い。一方、図7に示す構成例では、イントラCUに長い符号が割り当てられている。これに対して、上記データ構成によれば、小さいサイズのイントラCUに短い符号が割り当てられるようにする。 In the region where inter prediction is difficult to hit, intra prediction with a small CU tends to be used. Therefore, in a small CU, the usage rate of an intra CU is high. On the other hand, in the configuration example shown in FIG. 7, a long code is assigned to the intra CU. On the other hand, according to the above data configuration, a short code is assigned to a small size intra CU.
 これにより、インター予測が当たりにくい領域では、CU予測モード復号部1011は、小さいサイズのイントラCUについて、短い符号を復号する。これにより、符号化効率が向上するという効果を奏する。 Thereby, in a region where inter prediction is difficult to hit, the CU prediction mode decoding unit 1011 decodes a short code for a small size intra CU. Thereby, there exists an effect that encoding efficiency improves.
 なお、上記構成では、CU予測モード復号部1011は、大サイズのCUのプレフィックス部と、小サイズのCUのプレフィックス部とで、異なるコンテキストを設定することが好ましい。 In the above configuration, it is preferable that the CU prediction mode decoding unit 1011 sets different contexts for the prefix portion of the large CU and the prefix portion of the small CU.
 そこで、コンテキスト記憶部1013において、大サイズのCUのプレフィックス部を復号するためのコンテキストである8×8CU prefix1013Aと、小サイズのCUのプレフィックス部を復号するためのコンテキストである非8×8CU prefix1013Bとが記憶されていてもよい。ここで、8×8CU prefix1013Aと、非8×8CU prefix1013Bとは異なるコンテキストである。 Therefore, in the context storage unit 1013, an 8 × 8 CU prefix 1013A that is a context for decoding a prefix portion of a large CU and a non-8 × 8 CU prefix 1013B that is a context for decoding a prefix portion of a small CU May be stored. Here, the 8 × 8 CU prefix 1013A and the non-8 × 8 CU prefix 1013B have different contexts.
 小サイズのCU(CU==8×8)と、大サイズのCU(CU>8×8)との間で、プレフィックス部の各binの意味が異なる。 The meaning of each bin in the prefix portion is different between a small size CU (CU == 8 × 8) and a large size CU (CU> 8 × 8).
 例えば、プレフィックス部の1ビット目は、小サイズのCUでは、CU予測タイプが、イントラCUおよびインターCUのいずれであるかを示す情報であるのに対して、大サイズのCUでは、2N×2NのインターCUであるか、それとも、それ以外のインターCUであるかを示す情報である。 For example, the first bit of the prefix portion is information indicating whether the CU prediction type is an intra CU or an inter CU in a small size CU, whereas 2N × 2N in a large size CU. This is information indicating whether it is an inter CU or other inter CU.
 また、意味が異なるbinは、出現傾向が異なる。このため、大サイズのCUおよび小サイズのCU、双方のプレフィックス部に、同一のコンテキストを設定した場合、binの出現傾向が異なるため、符号化効率が低下するおそれがある。 Also, bins with different meanings have different appearance tendencies. For this reason, when the same context is set in both the large-size CU and the small-size CU, the appearance tendency of bins is different, which may reduce the coding efficiency.
 上記構成によれば、出現傾向が異なるbinに合わせて、異なるコンテキストを設定することができるため、binの符号化効率を向上させることができる。 According to the above configuration, since different contexts can be set according to bins having different appearance tendencies, the encoding efficiency of bins can be improved.
    [構成例1-3-2]
 また、図9に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。図9は、二値化情報の定義である8×8CU1012Aの別の構成例を示している。すなわち、図9に示す8×8CU1012A_2は、図7に示す対応付けテーブルBT1に含まれる8×8CU1012Aの別の構成例である。
[Configuration Example 1-3-2]
Further, as shown in FIG. 9, the binarization information stored in the binarization information storage unit 1012 may be configured. FIG. 9 shows another configuration example of 8 × 8 CU 1012A which is the definition of binarization information. That is, 8 × 8 CU 1012A_2 illustrated in FIG. 9 is another configuration example of 8 × 8 CU 1012A included in association table BT1 illustrated in FIG.
 図9に示す8×8CU1012A_2では、bin列が、フラグ(flag)、プレフィックス部およびサフィックス部の3つの部分から構成されている。 In the 8 × 8 CU 1012A_2 shown in FIG. 9, the bin string is composed of three parts: a flag, a prefix part, and a suffix part.
 イントラCUの場合、フラグは、“1”であり、インターCUの場合、フラグは、“0”である。 In the case of an intra CU, the flag is “1”, and in the case of an inter CU, the flag is “0”.
 また、イントラCUの場合、サフィックス部のみが定義されている。すなわち、PU分割タイプが、2N×2Nのときは、サフィックス部が“0”であり、N×Nのときは、サフィックス部が“1”である。 Also, in the case of intra CU, only the suffix part is defined. That is, when the PU partition type is 2N × 2N, the suffix part is “0”, and when it is N × N, the suffix part is “1”.
 一方、インターCUの場合、プレフィックス部のみが定義されている。すなわち、2N×2N、2N×N、および、N×2Nのとき、それぞれ、“1”、“01”、および、“00”である。 On the other hand, in the case of inter CU, only the prefix part is defined. That is, when 2N × 2N, 2N × N, and N × 2N, they are “1”, “01”, and “00”, respectively.
 図9に示す8×8CU1012A_2では、図8に示した8×8CU1012A_1と同様、大サイズのCUにおいてイントラCUに対して割り当てられている符号に比べて短い符号が割り当てられているとともに、イントラCUに割り当てられている符号のほうが、インターCUに割り当てられている符号よりも短い。 In the 8 × 8 CU 1012A_2 illustrated in FIG. 9, as in the 8 × 8 CU 1012A_1 illustrated in FIG. 8, a code shorter than the code allocated to the intra CU is allocated to the intra CU in the large size CU. The assigned code is shorter than the code assigned to the inter CU.
 図9に示すように8×8CU1012A_2を構成することで、インター予測が当たりにくい領域では、CU予測モード復号部1011は、小さいサイズのイントラCUについて、短い符号を復号する。これにより、符号化効率が向上するという効果を奏する。 As shown in FIG. 9, by configuring the 8 × 8 CU 1012A_2, the CU prediction mode decoding unit 1011 decodes a short code for a small size intra CU in a region where inter prediction is difficult to hit. Thereby, there exists an effect that encoding efficiency improves.
 なお、上記構成では、フラグに、プレフィックス部およびサフィックス部に設定されているコンテキストとは別の独自のコンテキストを設定することが好ましい。また、プレフィックス部には、小サイズのCUおよび大サイズのCUの間で、同一のコンテキストを設定することが好ましい。 In the above configuration, it is preferable to set a unique context different from the context set in the prefix part and the suffix part in the flag. In the prefix part, it is preferable to set the same context between the small CU and the large CU.
 例えば、コンテキスト記憶部1013において、8×8CU prefix1013Aと、非8×8CU prefix1013Bとを統合した一つのコンテキストを記憶しておけばよい。 For example, the context storage unit 1013 may store one context in which the 8 × 8 CU prefix 1013A and the non-8 × 8 CU prefix 1013B are integrated.
 上記構成では、小サイズのCUのプレフィックス部と、大サイズのCUのプレフィックス部との間で、各binが、同じ意味となるよう設計されている。このため、両者の間で、同一のコンテキストを設定することで、binの符号化効率を向上させることができる。 In the above configuration, each bin is designed to have the same meaning between the prefix portion of the small CU and the prefix portion of the large CU. For this reason, by setting the same context between the two, it is possible to improve the encoding efficiency of bin.
    [作用・効果]
 本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位毎に、画像を復元するための情報を画像符号化データから復号して画像を復元する画像復号装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を復号する復号手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, an image decoding apparatus according to an aspect of the present invention provides, for each coding unit, an image decoding apparatus that restores an image by decoding information for restoring an image from image encoded data, For codes assigned to a combination with a prediction method applied to a coding unit, a combination other than the combination is applied to a combination in which a prediction method for intra prediction is applied to a coding unit having a size equal to or smaller than a predetermined size. It is the structure provided with the decoding means which decodes a code shorter than the code allocated to.
 よって、所定サイズ以下のサイズの符号化単位において発生確率が高い組み合わせに短い符号を割り当てることができ、符号化効率が向上するという効果を奏する。 Therefore, it is possible to assign a short code to a combination having a high probability of occurrence in a coding unit having a size equal to or smaller than a predetermined size, and the effect of improving the coding efficiency is achieved.
    [1-4]近傍の予測パラメータに応じてbin列の解釈を変更する構成
 CU予測モード復号部1011は、隣接領域に割り付けられている予測パラメータを参照して、bin列の解釈を変更するよう構成してもよい。
[1-4] Configuration for Changing the Interpretation of a Bin Sequence According to a Prediction Prediction Parameter The CU prediction mode decoding unit 1011 changes the interpretation of a bin sequence with reference to a prediction parameter assigned to an adjacent region. It may be configured.
    [構成例1-4-1]
 そこで、図10に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
[Configuration Example 1-4-1]
Therefore, the binarization information stored in the binarization information storage unit 1012 may be configured as shown in FIG.
 図10は、二値化情報記憶部1012に記憶される二値化情報のさらに別の構成例を示す図である。 FIG. 10 is a diagram showing still another configuration example of the binarization information stored in the binarization information storage unit 1012.
 図10に示す二値化情報対応付けテーブルBT20では、図7に示す8×8CU1012Aを、インターCUの定義(1012D)およびイントラCUの定義(1012C)に置き換えることで、隣接領域の予測パラメータの値に応じて、bin列の解釈が変わるように構成されている。 In the binarized information association table BT20 shown in FIG. 10, the value of the prediction parameter of the adjacent region is obtained by replacing the 8 × 8 CU 1012A shown in FIG. 7 with the definition of the inter CU (1012D) and the definition of the intra CU (1012C). Depending on the case, the interpretation of the bin sequence is changed.
 具体的には、対応付けテーブルBT20では、小サイズのCUについての定義において、隣接CUの少なくとも一方がインターCUの場合における二値化情報の定義であるインターCU1012Dと、隣接CUが共にイントラCUの場合における二値化情報の定義であるイントラCU1012Cとの間で、bin列の解釈が変わるように構成されている。 Specifically, in the association table BT20, in the definition of a small size CU, the inter CU 1012D that is the definition of binarization information when at least one of the adjacent CUs is an inter CU, and the adjacent CU are both intra CUs. In this case, the interpretation of the bin sequence is changed with the intra CU 1012C which is the definition of the binarization information.
 インターCU1012D(隣接CUの少なくとも一方がインターCUの場合)では、プレフィックス部のbin列が“000”のとき、対象CUがイントラCU(2N×2NまたはN×N)であると解釈し、プレフィックス部のbin列が“1”のとき、対象CUがインターCUの2N×2Nであると解釈する。 Inter CU 1012D (when at least one of adjacent CUs is an inter CU) interprets that the target CU is an intra CU (2N × 2N or N × N) and the prefix portion when the bin string of the prefix portion is “000”. When the bin string of “1” is “1”, it is interpreted that the target CU is 2N × 2N of the inter CU.
 一方、イントラCU1012C(隣接CUが共にイントラCUの場合)では、プレフィックス部のbin列が“1”であるとき、対象CUがイントラCU(2N×2NまたはN×N)であると解釈し、プレフィックス部のbin列が“000”のとき、対象CUがインターCUの2N×2Nであると解釈する。 On the other hand, in the intra CU 1012C (when both adjacent CUs are intra CUs), when the bin string of the prefix part is “1”, the target CU is interpreted as an intra CU (2N × 2N or N × N), and the prefix When the bin string of the part is “000”, it is interpreted that the target CU is 2N × 2N of the inter CU.
 近傍のCUが、イントラCUである場合、空間相関性により、対象CUもイントラCUである可能性が高い。よって、近傍のCUがイントラCUである場合に、イントラCUに対して、短い符号に割り当てることで、符号量を削減することができる。 When a nearby CU is an intra CU, there is a high possibility that the target CU is also an intra CU due to spatial correlation. Therefore, when the neighboring CU is an intra CU, the code amount can be reduced by assigning a short code to the intra CU.
 また、小サイズのCUでは、イントラCUの発生頻度が高くなる。このため、小さいサイズのCUにおいて、イントラCUに対して短い符号に割り当てることで、符号化効率のより一層の向上を図ることができる。 In addition, in a small size CU, the frequency of intra CU generation is high. For this reason, in a small size CU, by assigning a short code to an intra CU, the encoding efficiency can be further improved.
 これに対して、小サイズのCUでないCU(例えば、大サイズのCU)では、図10に示すように、“隣接CUが共にイントラの場合、イントラCUに対して短い符号に割り当てる”構成でなくてもかまわない。どのサイズのCUにおいて、“隣接CUが共にイントラの場合、イントラCUに対して短い符号に割り当てる”構成を適用するかは、イントラCUの発生頻度に応じて決定することができる。一般には、小さいサイズのCUほどイントラCUの選択率が高い傾向があるため、最小サイズのCUを含め、所定の大きさ(例えば16×16)以下のサイズのCUでイントラCUに対して短い符号を割り当てる構成とすることが好ましい。上記構成によれば、近傍のCUがイントラCUである場合、CU予測モード復号部1011が、イントラCU1012Cを参照し、イントラCUに対して、短い符号に割り当てる。一方、近傍のCUにインターCUが含まれている場合、CU予測モード復号部1011が、インターCU1012Dを参照し、インターCUに対して、短い符号に割り当てる。その結果、符号量を削減し、符号化効率の向上を図ることができる。 On the other hand, a CU that is not a small-sized CU (for example, a large-sized CU) does not have a configuration of “assigning a short code to an intra CU when both adjacent CUs are intra” as shown in FIG. It doesn't matter. It can be determined according to the frequency of occurrence of intra CUs, in which size CU, a configuration in which “a short code is assigned to an intra CU when adjacent CUs are both intra” is applied. In general, the smaller the CU, the higher the intra CU selection rate tends to be. Therefore, a code shorter than the intra CU with a CU of a predetermined size (for example, 16 × 16) or less including the minimum size CU. Is preferably assigned. According to the above configuration, when the neighboring CU is an intra CU, the CU prediction mode decoding unit 1011 refers to the intra CU 1012C and assigns a short code to the intra CU. On the other hand, when an inter CU is included in a neighboring CU, the CU prediction mode decoding unit 1011 refers to the inter CU 1012D and assigns a short code to the inter CU. As a result, it is possible to reduce the code amount and improve the encoding efficiency.
    [構成例1-4-2]
 また、図11に示すように二値化情報記憶部1012に記憶される二値化情報を構成してもよい。
[Configuration Example 1-4-2]
Further, as shown in FIG. 11, the binarization information stored in the binarization information storage unit 1012 may be configured.
 図11は、二値化情報記憶部1012に記憶される二値化情報のさらに別の構成例を示す図である。 FIG. 11 is a diagram showing still another configuration example of the binarization information stored in the binarization information storage unit 1012.
 図11に示す二値化情報対応付けテーブルBT30では、図7に示す非8×8CU1012Bを、『上CUのサイズが対象CU以上』の定義(1012B_1)および『上CUのサイズが対象CUより小さい』の定義(1012B_2)に置き換えることで、隣接領域の予測パラメータの値に応じて、bin列の解釈が変わるように構成されている。 In the binarized information association table BT30 shown in FIG. 11, the non-8 × 8 CU 1012B shown in FIG. 7 is defined as “upper CU size is larger than or equal to target CU” (1012B_1) and “upper CU size is smaller than the target CU. ] (1012B_2), the interpretation of the bin sequence is changed in accordance with the value of the prediction parameter of the adjacent region.
 すなわち、対応付けテーブルBT30では、大サイズのCUについての定義において、上隣接CUが対象CU以上のサイズである場合と、上隣接CUが対象サイズより小さい場合との間で、bin列の解釈が変わるように構成されている。 That is, in the association table BT30, in the definition for a large CU, the bin string is interpreted between the case where the upper adjacent CU is larger than the target CU and the case where the upper adjacent CU is smaller than the target size. It is configured to change.
 『上CUのサイズが対象CU以上』1012B_1(上隣接CUが対象CU以上のサイズである場合)では、プレフィックス部のbin列が“001”のとき、対象CUが縦長パーティションであると解釈し、プレフィックス部のbin列が“01”のとき、対象CUが横長パーティションであると解釈する。 In “the size of the upper CU is equal to or larger than the target CU” 1012B_1 (when the upper adjacent CU is larger than the target CU), when the bin column of the prefix part is “001”, the target CU is interpreted as a vertically long partition. When the bin string in the prefix part is “01”, it is interpreted that the target CU is a horizontally long partition.
 一方、『上CUのサイズが対象CUより小さい』1012B_2(上隣接CUが対象CUより小さいサイズである場合)では、プレフィックス部のbin列が“01”のとき、対象CUが縦長パーティションであると解釈し、プレフィックス部のbin列が“001”のとき、対象CUが横長パーティションであると解釈する。 On the other hand, in “the size of the upper CU is smaller than the target CU” 1012B_2 (when the upper adjacent CU is smaller than the target CU), when the bin column of the prefix part is “01”, the target CU is a vertically long partition. When the bin string in the prefix part is “001”, the target CU is interpreted as a horizontally long partition.
 隣接CUのサイズが対象CUより小さい場合、当該隣接CU内にエッジが存在する可能性が高い。 When the size of the adjacent CU is smaller than the target CU, there is a high possibility that an edge exists in the adjacent CU.
 従って、このような場合、対象CUは、隣接CUとの境界にあたる辺と垂直な方向にパーティション分割される可能性が高い。このため、上隣接CUが対象CUより小さいサイズである場合、縦長パーティションが選択される可能性が高い。 Therefore, in such a case, there is a high possibility that the target CU is partitioned in a direction perpendicular to the side corresponding to the boundary with the adjacent CU. For this reason, when the upper adjacent CU is smaller than the target CU, there is a high possibility that the vertically long partition is selected.
 よって、上隣接CUが対象CUより小さいサイズである場合、選択される可能性が高い縦長パーティションに短い符号を割り当てることで符号化効率を向上させることができる。 Therefore, when the upper adjacent CU is smaller than the target CU, encoding efficiency can be improved by assigning a short code to a vertically long partition that is highly likely to be selected.
 上記構成によれば、上隣接CUが対象CUより小さいサイズである場合、CU予測モード復号部1011が、『上CUのサイズが対象CUより小さい』1012B_2を参照し、縦長パーティションに短い符号を割り当てる。 According to the above configuration, when the upper adjacent CU is smaller than the target CU, the CU prediction mode decoding unit 1011 refers to “the size of the upper CU is smaller than the target CU” 1012B_2 and assigns a short code to the vertically long partition .
 一方、上隣接CUが対象CU以上のサイズである場合、CU予測モード復号部1011が、『上CUのサイズが対象CU以上』1012B_1を参照し、横長パーティションに短い符号を割り当てる。その結果、符号量を削減し、符号化効率の向上を図ることができる。 On the other hand, when the upper adjacent CU has a size larger than the target CU, the CU prediction mode decoding unit 1011 refers to “the size of the upper CU is equal to or larger than the target CU” 1012B_1 and assigns a short code to the horizontally long partition. As a result, it is possible to reduce the code amount and improve the encoding efficiency.
 さらにいえば、隣接CUに基づくプレフィックス部の解釈に依存せず、サフィックス部の解釈が同じであることが好ましい。対応付けテーブルBT30では、プレフィックス部が、縦長パーティションか、横長パーティションかに依存せず、同一のサフィックス部の解釈は同じである。すなわち、対応付けテーブルBT30の例では、プレフィックス部が、縦長パーティションか、横長パーティションかに応じて、サフィックス部の復号処理を変更しなくてもかまわない。 Furthermore, it is preferable that the interpretation of the suffix part is the same without depending on the interpretation of the prefix part based on the adjacent CU. In the association table BT30, the prefix part is independent of whether it is a vertically long partition or a horizontally long partition, and the interpretation of the same suffix part is the same. In other words, in the example of the association table BT30, the decoding process of the suffix part may not be changed depending on whether the prefix part is a vertically long partition or a horizontally long partition.
 すなわち、対応付けテーブルBT30では、PU分割タイプ(分割数)が、参照するパラメータに依存しないように構成されている。 That is, the association table BT30 is configured such that the PU partition type (number of partitions) does not depend on the parameter to be referred to.
 分割数が、参照するパラメータの値に依存しないため、参照パラメータにエラーが生じている場合でも、以降の可変長復号処理への影響が少ない。具体的には、隣接CUのサイズに誤りがあり、プレフィックス部が縦長と横長何れのパーティションを示すかの解釈が誤った場合でも、サフィックス部を含め、後続のシンタックスの復号を継続できる。 Since the number of divisions does not depend on the value of the parameter to be referenced, even if an error has occurred in the reference parameter, there is little effect on the subsequent variable length decoding process. Specifically, even when there is an error in the size of the adjacent CU and the interpretation of whether the prefix portion indicates a vertically long or horizontally long partition is incorrect, decoding of the subsequent syntax including the suffix portion can be continued.
 すなわち、隣接CUのサイズによらずサフィックス部の復号処理が可能となるため、隣接パラメータのエラーに影響されなくなりエラー耐性が向上する。 That is, since the suffix part can be decoded regardless of the size of the adjacent CU, the error resistance is improved without being influenced by the error of the adjacent parameter.
 なお、左隣接CUが対象CUより小さいサイズである場合、横長パーティションが選択される可能性が高い。よって、左隣接CUが対象CUより小さいサイズである場合、選択されやすい横長パーティションに短い符号を割り当てるようにしてもよい。これにより上記と同様の効果を得る事ができる。 In addition, when the left adjacent CU is smaller than the target CU, there is a high possibility that the horizontally long partition is selected. Therefore, when the left adjacent CU is smaller than the target CU, a short code may be assigned to a horizontally long partition that is easily selected. As a result, the same effect as described above can be obtained.
 また、最小サイズのCUに対しては、隣接CUのサイズに基づく解釈の切り替え処理を行わないことが好ましい。対象CUが最小サイズのCUである場合、常に対象CUは、隣接CU以下のサイズであるため、解釈の切り替え処理を省略することで、復号処理を簡略化することができる。 In addition, it is preferable not to perform the interpretation switching process based on the size of the adjacent CU for the minimum size CU. When the target CU is a CU having the minimum size, the target CU is always smaller than or equal to the adjacent CU. Therefore, the decoding process can be simplified by omitting the interpretation switching process.
 なお、上隣接CUのサイズが対象CUのサイズより小さいとは、対象CUの上辺(頂点を除く)において、当該上辺に対して垂直な位置関係にあるCU境界が存在するとも言える。 In addition, it can be said that the size of the upper adjacent CU is smaller than the size of the target CU, there is a CU boundary in a positional relationship perpendicular to the upper side on the upper side (excluding the vertex) of the target CU.
 よって、対象CUの上辺(頂点を除く)において、当該上辺に対して垂直な位置関係にあるCU境界またはPU境界が存在する場合、縦長パーティションに短い符号を割り当ててもよい。 Therefore, when there is a CU boundary or PU boundary that is perpendicular to the upper side of the target CU (excluding the vertex), a short code may be assigned to the vertically long partition.
 また、以上では、対象CUに隣接する隣接CUについて説明したがこれに限られない。空間相関性が認められる程度に近傍に位置するCUについても同様のことがいえる。 In the above description, the adjacent CU adjacent to the target CU has been described, but the present invention is not limited thereto. The same can be said for CUs located in the vicinity to such an extent that spatial correlation is recognized.
 以上の構成を、より一般化して言えば次のとおりである。すなわち、以上の構成は、複数のバイナリ列と、複数の対応する分割数が互いに等しいpred_typeについて、隣接の予測パラメータに応じてpred_typeの発生可能性の優先順位を決定し、優先順位の高いpred_typeほど短いバイナリ列に関連付けるものである。 The above configuration can be generalized as follows. That is, the above configuration determines the priority order of the occurrence of pred_type according to the adjacent prediction parameter for a plurality of binary strings and a plurality of corresponding pred_types having the same number of divisions, and pred_type having a higher priority order. It is associated with a short binary string.
 なお、上記説明における、上側隣接CUのサイズが対象CUのサイズより小さい、という条件は、次のように表現することもできる。 In the above description, the condition that the size of the upper adjacent CU is smaller than the size of the target CU can also be expressed as follows.
 (1)対象CU内の左上画素を(xc,yc)とする。 (1) Let the upper left pixel in the target CU be (xc, yc).
 (2)上側隣接CUとして、(xc,yc-1)を含むCUを導出して、当該上側隣接CUの左上画素を(xu,yu)とする。 (2) A CU including (xc, yc-1) is derived as the upper adjacent CU, and the upper left pixel of the upper adjacent CU is (xu, yu).
 (3)「log2CUSize[xu][yu] < log2CUSize[xc][yc] 」が成り立つならば、上側隣接CUのサイズが対象CUのサイズより小さいと判定する。ここで、log2CUSize[x][y]は、(x,y)の画素を左上画素とするCUのサイズの2を底とする対数値である。 (3) If “log2CUSize [xu] [yu] <log2CUSize [xc] [yc]” holds, it is determined that the size of the upper adjacent CU is smaller than the size of the target CU. Here, log2CUSize [x] [y] is a logarithmic value with 2 as the base of the size of the CU having the pixel (x, y) as the upper left pixel.
 ここで、上記のように対象CUの左上画素の上に位置するCUのサイズのみを対象CUのサイズと比較して判定することが好ましい。 Here, it is preferable that only the size of the CU positioned above the upper left pixel of the target CU is compared with the size of the target CU as described above.
 以上では、上側隣接CUの場合について記載したが、左側隣接CUのサイズを判定する場合にも、対象CUの左上画素の左に位置するCUのサイズのみを対象CUのサイズと比較して判定することが好ましい。 In the above description, the case of the upper adjacent CU is described. However, even when determining the size of the left adjacent CU, only the size of the CU located to the left of the upper left pixel of the target CU is determined by comparison with the size of the target CU. It is preferable.
 なお、上記判定手順の(3)ではCUのサイズの値を直接比較する例を挙げたが、CUのサイズと関連付けられた別の値を比較してもよい。例えば、上記(3)の条件は、ツリーブロック(LCU)を何回分割するかに対応するCU分割深度(cuDepth[x][y])の値を用いて、「cuDepth[xu][yu] > cuDepth[xc][yc]」という式により判定してもよい。 In the above determination procedure (3), an example in which the value of the CU size is directly compared has been described. However, another value associated with the size of the CU may be compared. For example, the above condition (3) uses the value of CU division depth (cuDepth [x] [y]) corresponding to how many times a tree block (LCU) is divided, and “cuDepth [xu] [yu] >> cuDepth [xc] [yc] ”may be used for the determination.
    [作用・効果]
 本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、復号対象となる上記符号化単位である対象符号化単位を上記予測単位へ分割するタイプである分割タイプと予測方式との複数の組に対して対応付けられる複数の符号を、復号の対象となる上記予測単位である対象予測単位の近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて変更する変更手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, an image decoding apparatus according to an aspect of the present invention is an image decoding apparatus that generates a prediction image and restores an image for each prediction unit obtained by dividing an encoding unit into one or more numbers. A plurality of codes associated with a plurality of combinations of a division type and a prediction scheme that is a type for dividing a target coding unit that is the coding unit into the prediction units It is a structure provided with the change means to change according to the decoded parameter allocated to the decoding prediction unit of the vicinity of the object prediction unit which is.
 よって、近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てることができ、これにより符号化効率を向上させることができる。 Therefore, a shorter code can be assigned to a combination of a prediction method and a division type having a higher probability of occurrence according to a decoded parameter assigned to a neighboring decoded prediction unit, thereby improving coding efficiency. Can be made.
  (2)PU情報復号部の詳細
 次に、図12を用いて、PU情報復号部12および復号モジュール10の構成例について説明する。図12は、動画像復号装置1において、動き情報を復号するための構成、すなわちPU情報復号部12および復号モジュール10の構成について例示する機能ブロック図である。
(2) Details of PU Information Decoding Unit Next, configuration examples of the PU information decoding unit 12 and the decoding module 10 will be described with reference to FIG. FIG. 12 is a functional block diagram illustrating the configuration for decoding motion information, that is, the configurations of the PU information decoding unit 12 and the decoding module 10 in the video decoding device 1.
 以下、PU情報復号部12および復号モジュール10の順で、各部の構成について説明する。 Hereinafter, the configuration of each unit will be described in the order of the PU information decoding unit 12 and the decoding module 10.
  (PU情報復号部)
 図12に示すように、PU情報復号部12は、動き補償パラメータ導出部(双予測制限手段、候補決定手段、推定手段)121、マージ候補優先順位情報記憶部122、および参照フレーム設定情報記憶部123を備える。
(PU information decoding unit)
As shown in FIG. 12, the PU information decoding unit 12 includes a motion compensation parameter derivation unit (bi-prediction restriction unit, candidate determination unit, estimation unit) 121, a merge candidate priority order information storage unit 122, and a reference frame setting information storage unit. 123.
 動き補償パラメータ導出部121は、符号化データから対象CUに含まれる各PUの動き補償パラメータを導出する。 The motion compensation parameter deriving unit 121 derives the motion compensation parameter of each PU included in the target CU from the encoded data.
 動き補償パラメータ導出部121は、具体的には、以下の手順にて、動き補償パラメータを導出する。ここで、対象CUがスキップCUである場合に、マージインデックスの代わりに、スキップインデックスを復号し、その値に基づいてスキップCUにおける予測パラメータを導出してもよい。 Specifically, the motion compensation parameter deriving unit 121 derives a motion compensation parameter in the following procedure. Here, when the target CU is a skip CU, a skip index may be decoded instead of the merge index, and a prediction parameter in the skip CU may be derived based on the value.
 まず、動き補償パラメータ導出部121は、スキップフラグを判定する。その結果、対象CUが非スキップCUであれば、動き情報復号部1021を用いて、マージフラグを復号する。 First, the motion compensation parameter derivation unit 121 determines a skip flag. As a result, if the target CU is a non-skip CU, the motion information decoding unit 1021 is used to decode the merge flag.
 ここで、対象CUが、スキップCUまたはマージPUである場合、動き補償パラメータ導出部121は、マージインデックスを復号して、復号したマージインデックスの値に基づいて予測パラメータ(動きベクトル、参照画像インデックス、インター予測フラグ)を導出する。なお、動き補償パラメータ導出部121は、マージ候補優先順位情報記憶部122に記憶されているマージ候補情報に従って、マージインデックスで指定されるマージ候補を決定する。 Here, when the target CU is a skip CU or a merge PU, the motion compensation parameter deriving unit 121 decodes the merge index, and based on the decoded merge index value, predictive parameters (motion vector, reference image index, Inter prediction flag) is derived. The motion compensation parameter deriving unit 121 determines a merge candidate specified by the merge index according to the merge candidate information stored in the merge candidate priority information storage unit 122.
 一方、対象CUが、スキップCUおよびマージPUのいずれでもない場合、動き補償パラメータ導出部121は、予測パラメータ(インター予測フラグ、参照画像インデックス、動きベクトル差分、推定動きベクトルインデックス)を復号する。 On the other hand, when the target CU is neither a skip CU nor a merge PU, the motion compensation parameter derivation unit 121 decodes a prediction parameter (inter prediction flag, reference image index, motion vector difference, estimated motion vector index).
 さらに、動き補償パラメータ導出部121は、推定動きベクトルインデックスの値に基づいて、推定動きベクトルを導出するとともに、動きベクトル差分と推定動きベクトルとに基づいて動きベクトルを導出する。 Furthermore, the motion compensation parameter deriving unit 121 derives an estimated motion vector based on the value of the estimated motion vector index, and derives a motion vector based on the motion vector difference and the estimated motion vector.
 マージ候補優先順位情報記憶部122には、いずれの領域をマージ候補とするかを示す情報およびマージ候補の優先順位を示す情報を含むマージ候補情報が記憶されている。 The merge candidate priority information storage unit 122 stores merge candidate information including information indicating which region is a merge candidate and information indicating the priority of the merge candidate.
 参照フレーム設定情報記憶部123には、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れの画面間予測の予測方式を用いるかを決定するための参照フレーム設定情報が記憶されている。 The reference frame setting information storage unit 123 is used to determine which inter prediction prediction method to use, that is, single prediction referring to one reference image and bi-prediction referring to two reference images. Reference frame setting information is stored.
  (復号モジュール)
 図12に示すように、復号モジュール10は、動き情報復号部1021を備える。動き情報復号部1021は、動き補償パラメータ導出部121から供給される符号化データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。動き情報復号部1021が復号する動き補償パラメータは、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、動きベクトル差分(mvd)である。
(Decryption module)
As illustrated in FIG. 12, the decoding module 10 includes a motion information decoding unit 1021. The motion information decoding unit 1021 decodes the syntax value from the binary included in the encoded data according to the encoded data and syntax type supplied from the motion compensation parameter deriving unit 121. The motion compensation parameters decoded by the motion information decoding unit 1021 are a merge flag (merge_flag), a merge index (merge_idx), an estimated motion vector index (mvp_idx), a reference image index (ref_idx), an inter prediction flag (inter_pred_flag), and a motion vector difference. (Mvd).
  [マージPUにおいて予測パラメータを導出するための構成例]
  [2-1]マージ候補の位置および優先順位の例
 図13~図15を用いて、マージPUにおける予測パラメータ導出について説明する。
[Configuration Example for Deriving Prediction Parameters in Merge PU]
[2-1] Example of Merge Candidate Position and Priority Order Derivation of prediction parameters in the merge PU will be described with reference to FIGS. 13 to 15.
 動き補償パラメータ導出部121は、PU分割タイプが非対称である場合、PU分割タイプが対称である場合と異なる方法でマージ候補の優先順位を決定する構成であってもよい。 The motion compensation parameter deriving unit 121 may be configured such that when the PU partition type is asymmetric, the priority order of the merge candidates is determined by a method different from that when the PU partition type is symmetric.
 まず、非対称パーティションの特性について説明する。非対称パーティションでは、小さい方のパーティションに、長辺方向のエッジが存在する可能性が高い。また、エッジが存在する領域は、正確な動きベクトルが導出されている可能性が高い。 First, the characteristics of the asymmetric partition will be described. In an asymmetric partition, there is a high possibility that an edge in the long side direction exists in the smaller partition. In addition, there is a high possibility that an accurate motion vector is derived in a region where an edge exists.
 図13を用いて、具体的に説明すると次のとおりである。図13は、非対称パーティションが選択されたCUを示している。図13に示すように、対象CU30では、傾斜を有するエッジE1が領域内に存在し、2N×nUのPU分割タイプが選択されている。 It will be described in detail with reference to FIG. FIG. 13 shows a CU for which an asymmetric partition has been selected. As illustrated in FIG. 13, in the target CU 30, an edge E1 having an inclination exists in the region, and a 2N × nU PU partition type is selected.
 対象CUには、PU31とPU32とが含まれる。ここで、対象PUをPU31とする。傾斜を有するエッジE1が、対象PU31の領域内を横断している。 The target CU includes PU31 and PU32. Here, the target PU is PU31. An edge E1 having an inclination crosses the region of the target PU 31.
 図13に示す例では、対象PU31の短辺側付近の領域R10にも、対象PU31の領域内に存在するエッジと同じエッジが存在する可能性が高い。従って、対象PU31と同じ動きベクトル(mv)が割り付けられている可能性が高い。 In the example shown in FIG. 13, there is a high possibility that the same edge as the edge existing in the region of the target PU 31 exists also in the region R <b> 10 near the short side of the target PU 31. Therefore, there is a high possibility that the same motion vector (mv) as that of the target PU 31 is assigned.
 従って、エッジが存在する可能性の高い領域、すなわち小さいパーティションでは、短辺側の領域に割り付けられている動きベクトルを参照し、大きいパーティションでは、小さいパーティションの周辺の領域に割り付けられている動きベクトルを参照することで、動きベクトルの精度を高めることができる。 Therefore, in a region where an edge is likely to exist, that is, in a small partition, a motion vector assigned to the short side region is referred to, and in a large partition, a motion vector assigned to a region around the small partition. The accuracy of the motion vector can be improved by referring to.
 そこで、マージ候補優先順位情報記憶部122において記憶されているマージ候補優先順位情報を、対称PU分割タイプ122Aおよび非対称PU分割タイプ122Bの2つのマージ候補優先順位情報を含む構成とする。 Therefore, the merge candidate priority information stored in the merge candidate priority information storage unit 122 is configured to include two merge candidate priority information of a symmetric PU partition type 122A and an asymmetric PU partition type 122B.
 図14を用いて、対称PU分割タイプ122Aのマージ候補優先順位情報について説明すると次のとおりである。 The merge candidate priority information of the symmetric PU partition type 122A will be described with reference to FIG.
 図14は、対称パーティションが選択されたCUを示している。図14に示すように、対称CUでは、2N×NのPU分割タイプが選択されている。また、同図では、対象PUを、“Curr PU”にて示している。対象PUでは、マージ候補として、左(L)、上(U)、右上(UR)、左下(BL)、左上(UL)の順に優先順位が割り当てられている。 FIG. 14 shows a CU in which a symmetric partition is selected. As shown in FIG. 14, a 2N × N PU partition type is selected in the symmetric CU. In the same figure, the target PU is indicated by “Curr PU”. In the target PU, priorities are assigned in the order of left (L), top (U), top right (UR), bottom left (BL), top left (UL) as merge candidates.
 また、図15を用いて、非対称PU分割タイプ122Bのマージ候補優先順位情報について説明すると次のとおりである。図15の(a)および(b)は、それぞれ、2N×nUの小さい方のパーティション、および、2N×nUの大きい方のパーティションにおける優先順位の設定について示している。また、図15の(c)および(d)は、それぞれ、2N×nDの大きい方のパーティション、および、2N×nDの小さい方のパーティションにおける優先順位の設定について示している。 The merge candidate priority information of the asymmetric PU partition type 122B will be described with reference to FIG. (A) and (b) of FIG. 15 show the setting of the priority in the smaller partition of 2N × nU and the larger partition of 2N × nU, respectively. FIGS. 15C and 15D show setting of the priority order in the larger partition of 2N × nD and the smaller partition of 2N × nD, respectively.
 図15の(a)および(d)に示すように、非対称パーティション内の小さい方のパーティションでは、短辺側のマージ候補に高い優先順位を割り当てる。 As shown in FIGS. 15A and 15D, in the smaller partition in the asymmetric partition, a higher priority is assigned to the merge candidate on the short side.
 具体的には、2N×nUおよび2N×nDの小さい方のPUでは、それぞれ(a)および(d)に示すように、短辺に、隣接(L)、頂点に隣接(UR、BL、UL)、長辺に隣接(U)の順に優先順位が割り当てられている。 Specifically, in the smaller PU of 2N × nU and 2N × nD, as shown in (a) and (d) respectively, the short side is adjacent (L), and the apex is adjacent (UR, BL, UL) ), Priority is assigned to the long side in the order of adjacent (U).
 また、図15の(b)および(c)に示すように、非対称パーティション内の大きい方のパーティションでは、小さい方のパーティションに近い位置のマージ候補に高い優先順位を割り当てる。 Further, as shown in FIGS. 15B and 15C, in the larger partition in the asymmetric partition, a higher priority is assigned to the merge candidate located near the smaller partition.
 具体的には、2N×nUの大きい方のPUでは、図15の(b)に示すように、小さい方のPU内におけるマージ候補(U)、小さい方のPUに近いマージ候補(UR、UL)、それ以外のマージ候補(L、BL)の順に優先度が割り当てられている。 Specifically, in the larger PU of 2N × nU, as shown in FIG. 15B, the merge candidate (U) in the smaller PU and the merge candidate (UR, UL) closer to the smaller PU ) And priorities are assigned in the order of the other merge candidates (L, BL).
 また、2N×nDの大きい方のPUでは、図15の(c)に示すように、小さい方のPUに近いマージ候補(L、BL)それ以外のマージ候補(U、BL、UL)の順に優先順位が割り当てられている。 Further, in the larger PU of 2N × nD, as shown in FIG. 15C, the merge candidates (L, BL) closer to the smaller PU and the other merge candidates (U, BL, UL) in this order. A priority is assigned.
 なお、優先順位の高い候補に対して小さいマージインデックスを割り当て、小さいマージインデックスに短い符号を割り当てる。また、優先順位の高い候補のみを選択可能なマージ候補としてもよい。 Note that a small merge index is assigned to a candidate with high priority, and a short code is assigned to the small merge index. Moreover, it is good also as a merge candidate which can select only a high priority candidate.
 なお、上記の説明は、マージPUにおける予測パラメータ導出について記載したが、同様の導出方法をインターCU内の非マージPUにおいて動きベクトルの復元に用いる推定動きベクトルの導出に用いても良い。一般的には、非対称PU内の各PUにおいて、隣接領域に対応する動きパラメータの推定値または予測値を導出する際に、上記方式が適応できる。 In the above description, prediction parameter derivation in the merge PU has been described. However, a similar derivation method may be used for derivation of an estimated motion vector used for restoring a motion vector in a non-merged PU in an inter CU. In general, the above method can be applied when deriving an estimated value or predicted value of a motion parameter corresponding to an adjacent region in each PU in an asymmetric PU.
   [作用・効果]
 本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、上記分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う推定手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates an image by restoring a prediction image by using a prediction method for inter-screen prediction for each prediction unit obtained by dividing a coding unit into one or more numbers. In the decoding device, the division type into the prediction units includes asymmetric division that divides the coding unit into a plurality of prediction units of different sizes or symmetric division that divides the coding unit into a plurality of prediction units of the same size. In addition, in the case where the division type is asymmetric division, there is provided an estimation means for estimating a prediction parameter for inter-screen prediction by an estimation method different from that in the case where the division type is symmetric division.
 よって、分割タイプが非対称分割である場合と、上記分割タイプが対称分割である場合とで異なる推定方法を変更することで、分割タイプに応じた好ましい推定方法により画面間予測の予測パラメータの推定を行うことができるという効果を奏する。 Therefore, by changing the estimation method that is different between the case where the division type is asymmetric division and the case where the division type is symmetric division, the estimation parameter of the inter-screen prediction is estimated by a preferable estimation method according to the division type. There is an effect that it can be performed.
  [2-2]CUサイズとスキップ/マージとの組み合わせによるマージ候補の変更
 動き補償パラメータ導出部121は、CUサイズと、当該CUがスキップ/マージを行うCUであるか否かとの組み合わせに応じてマージ候補を変更する構成であってもよい。そこで、マージ候補優先順位情報記憶部122に記憶されるマージ候補情報を、小PUサイズ122Cおよび大PUサイズ122Dの2つの定義情報を含む構成とする。
[2-2] Change of Merge Candidate by Combination of CU Size and Skip / Merge The motion compensation parameter derivation unit 121 depends on a combination of a CU size and whether or not the CU is a CU that performs skip / merge. It may be configured to change merge candidates. Accordingly, the merge candidate information stored in the merge candidate priority information storage unit 122 is configured to include two pieces of definition information of a small PU size 122C and a large PU size 122D.
 小PUサイズ122Cのマージ候補情報は、小サイズのPUに適用されるマージ候補数を定義する。また、大PUサイズ122Dのマージ情報は、大サイズのPUに適用されるマージ候補数を定義する。 The merge candidate information of the small PU size 122C defines the number of merge candidates applied to the small PU. Further, the merge information of the large PU size 122D defines the number of merge candidates applied to the large PU.
 一例としては、マージ候補情報において、小PUサイズ122Cに定義されるマージ候補数(小サイズのPUのマージ候補数)が、大PUサイズ122Dに定義されるマージ候補数(大サイズのPUのマージ候補数)に比べて少なくなるよう定義する。 As an example, in the merge candidate information, the number of merge candidates defined for the small PU size 122C (the number of merge candidates for the small PU) is the number of merge candidates defined for the large PU size 122D (the merge of large PUs). It is defined to be smaller than the number of candidates.
 小サイズのPUが選択される領域では、動きが複雑な場合が多い。このため、近傍のPUに割り付けられる動きベクトルの相関が小さくなる傾向がある。 In the area where a small PU is selected, the movement is often complicated. For this reason, there is a tendency that the correlation of motion vectors assigned to neighboring PUs becomes small.
 このため、マージ候補を増やしても大サイズのPUの場合に比べて推定精度の向上が少ない場合がある。 For this reason, even if merge candidates are increased, the estimation accuracy may not be improved as compared with a large PU.
 よって、マージ候補数を少なくすることにより、サイド情報の符号量を削減するほうが好ましい。 Therefore, it is preferable to reduce the code amount of the side information by reducing the number of merge candidates.
 上記例では、マージ候補情報において、動きが複雑な場合が多い小サイズのPUのマージ候補数を大サイズのPUのマージ候補数に比べて少なくするため、サイド情報の符号量を削減することができる。 In the above example, in the merge candidate information, the number of merge candidates for small size PUs, which often have complicated movements, is reduced compared to the number of merge candidates for large size PUs. it can.
 小サイズPUと大サイズPUの組み合わせの例について列挙すると以下の通りである。
・小サイズPUは少なくとも一辺が所定の閾値(例えば8)より小さいPUであり、大サイズPUはそれ以外のPUである。例えば、16×4、4×16、8×4、4×8、4×4のサイズのPUは小サイズPUであり、8×8、16×16のサイズのPUが大サイズPUとなる。
・小サイズPUは面積が所定の閾値(例えば64)より小さいPUであり、大サイズPUはそれ以外のPUである。例えば、8×4、4×8、4×4のサイズのPUは小サイズPUであり、8×8、16×4、4×16、16×16等のサイズのPUが大サイズPUとなる。
・小サイズPUは所定のサイズ(例えば8×8)以下のCUに含まれるPUであり、大サイズPUはそれより大きいCUに含まれるPUである。例えば、8×8CUに含まれる8×8、8×4、4×8、4×4のサイズのPUは小サイズPUである。
・小サイズPUは、非対称分割が適応されるCUにおいて、小さい方のPUであり、大サイズPUは、非対称分割が適応されるCUにおいて、大きい方のPUである。
Examples of combinations of small size PUs and large size PUs are listed below.
The small size PU is a PU having at least one side smaller than a predetermined threshold (for example, 8), and the large size PU is a PU other than that. For example, PUs having a size of 16 × 4, 4 × 16, 8 × 4, 4 × 8, and 4 × 4 are small size PUs, and PUs having a size of 8 × 8 and 16 × 16 are large size PUs.
The small size PU is a PU whose area is smaller than a predetermined threshold (for example, 64), and the large size PU is any other PU. For example, a PU with a size of 8 × 4, 4 × 8, 4 × 4 is a small size PU, and a PU with a size of 8 × 8, 16 × 4, 4 × 16, 16 × 16, etc. is a large size PU. .
The small size PU is a PU included in a CU having a predetermined size (for example, 8 × 8) or less, and the large size PU is a PU included in a larger CU. For example, 8 × 8, 8 × 4, 4 × 8, and 4 × 4 size PUs included in the 8 × 8 CU are small size PUs.
A small size PU is a smaller PU in a CU to which asymmetric partitioning is applied, and a large size PU is a larger PU in a CU to which asymmetric partitioning is applied.
 また、他の例としては、マージ候補情報において、小さいPUでは、時間予測によるマージ候補の数を、大きいPUにおける時間予測によるマージ候補の数に比べて少なくすることが好ましい。小さいPUでは、マージ候補情報において時間予測によるマージ候補を含めないように定義してもよい。 As another example, in the merge candidate information, in a small PU, it is preferable that the number of merge candidates by temporal prediction is smaller than the number of merge candidates by temporal prediction in a large PU. In small PU, you may define so that the merge candidate by temporal prediction may not be included in merge candidate information.
 また、小サイズのPUが選択されるような、動きが複雑な領域では、時間予測に使用されるcollocated PUと、対象PUとの相関が小さいため、時間予測が選択される可能性が低い。よって、時間予測によるマージ候補の数を減らす、または、時間予測によるマージ候補を含めないことが好ましい。 Also, in a region where the motion is complex such that a small size PU is selected, the correlation between the correlated PU used for temporal prediction and the target PU is small, so the possibility that temporal prediction is selected is low. Therefore, it is preferable to reduce the number of merge candidates based on temporal prediction or not to include merge candidates based on temporal prediction.
  [作用・効果]
 本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、復号の対象となる上記予測単位である対象予測単位が、該対象予測単位の近傍の領域に割り付けられている予測パラメータから、該対象予測単位の予測パラメータの推定を行う予測単位である場合、該対象予測単位のサイズに応じて、推定に用いる領域の候補を決定する候補決定手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates an image by restoring a prediction image by using a prediction method for inter-screen prediction for each prediction unit obtained by dividing a coding unit into one or more numbers. In the decoding apparatus, the target prediction unit, which is the prediction unit to be decoded, is a prediction unit for estimating the prediction parameter of the target prediction unit from the prediction parameters assigned to the region in the vicinity of the target prediction unit. In some cases, it is configured to include candidate determination means for determining a candidate area to be used for estimation according to the size of the target prediction unit.
 よって、候補数を削減することによりサイド情報を削減することができ、その結果、符号化効率を向上させることができる。 Therefore, side information can be reduced by reducing the number of candidates, and as a result, encoding efficiency can be improved.
  [2-3]参照フレーム数の決定
 動き補償パラメータ導出部121を、以下の[2-3-1]~[2-3-4]に示すように構成してもよく、これによりインター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
[2-3] Determination of the number of reference frames The motion compensation parameter derivation unit 121 may be configured as shown in [2-3-1] to [2-3-4] below. You may determine which prediction system of single prediction and bi-prediction is applied.
  [2-3-1]小サイズPUでの双予測制限
 動き補償パラメータ導出部121は、参照フレーム設定情報記憶部123に記憶される参照フレーム設定情報を参照して、インター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
[2-3-1] Bi-Prediction Restriction in Small Size PU The motion compensation parameter derivation unit 121 refers to the reference frame setting information stored in the reference frame setting information storage unit 123, and performs single prediction and bi-prediction in inter prediction. You may determine which prediction system of prediction applies.
 動き補償パラメータ導出部121は、小サイズのPUでは、双予測を制限する構成であってもよい。そこで、参照フレーム設定情報を、小PUサイズ123Aおよび大PUサイズ123Bの2つの定義情報を含む構成とする。 The motion compensation parameter deriving unit 121 may be configured to limit bi-prediction for small PUs. Therefore, the reference frame setting information is configured to include two definition information of the small PU size 123A and the large PU size 123B.
 大PUサイズ123Bは、大きいサイズのPUにおいて選択可能な予測方式が定義される。大PUサイズ123Bでは、大きいサイズのPUにおいて双予測および単予測いずれの予測方式も制限なく選択できるよう定義される。 The large PU size 123B defines a prediction method that can be selected for a large PU. The large PU size 123B is defined so that both bi-prediction and uni-prediction prediction methods can be selected without limitation for a large PU.
 小PUサイズ123Aは、小さいサイズのPUにおいて選択可能な予測方式が定義される。小PUサイズ123Aでは、小さいサイズのPUにおいて双予測が制限されるよう定義される。 The small PU size 123A defines a prediction method that can be selected in a small PU. The small PU size 123A is defined such that bi-prediction is limited in a small size PU.
 小PUサイズ123Aの定義の一例としては、インターCUに含まれる、マージを適用しないPUであって、サイズが16×16未満のPUにおいて、インター予測フラグの復号を省略して単予測を適用する旨定義する。 An example of the definition of the small PU size 123A is a PU that is included in an inter CU and that does not apply merging and has a size less than 16 × 16, and the decoding of the inter prediction flag is omitted and single prediction is applied. Define this.
 また、小PUサイズ123Aの定義の他の例としては、インターCUに含まれる、マージを適用するPUであって、サイズが16×16未満のPUにおいて、単予測を適用する旨定義する。 Further, as another example of the definition of the small PU size 123A, it is defined that the single prediction is applied to a PU that is included in the inter CU and to which merge is applied and whose size is less than 16 × 16.
 また、小PUサイズ123Aの定義の別の例としては、スキップCUに含まれる各PUにおいて単予測を適用する。 Also, as another example of the definition of the small PU size 123A, single prediction is applied to each PU included in the skip CU.
 また、小PUサイズ123Aの定義のさらに別の例としては、インターCUに含まれる、マージを適用しないPUであって、サイズが16×16未満のPUにおいて、重み付け予測を適用しない。すなわち、重み付け予測に関する情報を省略する。 As yet another example of the definition of the small PU size 123A, weighted prediction is not applied to PUs included in the inter CU that do not apply merging and have a size of less than 16 × 16. That is, information regarding weighted prediction is omitted.
 以下、参照フレーム設定情報に基づき双予測を制限する場合に関し、シンタックステーブル及びブロック図を用いて、さらに、符号化データの構成、及び、動画像復号装置の構成の詳細を説明する。 Hereinafter, regarding the case where bi-prediction is limited based on the reference frame setting information, details of the configuration of the encoded data and the configuration of the video decoding device will be described using a syntax table and a block diagram.
 (双予測制限の種類)
 PUの種類には、対象CUがスキップであるPU(スキップPU)、対象PUがマージを適応するPU(マージPU)、対象PUがスキップでもマージでもないPU(基本インターPU、または、非動き情報省略PU)がある。基本インターPUでは、双予測であるか単予測であるかを示すインター予測フラグを符号化データから復号し、動き補償パラメータを導出する。それに対して、スキップPU及びマージPUでは、インター予測フラグを復号せずに動き補償パラメータを導出する。これらのPUでは、スキップ候補、または、マージ候補から、動き補償に用いる候補をスキップインデックスまたはマージインデックスに基づき選択し、当該選択候補における動き補償パラメータに基づいて、対象PUにおける動き補償パラメータを導出する。通常、スキップPUの動き補償パラメータの導出方法は、マージPUと同様である。なお、シーケンスパラメータセットのフラグなどを用いてマージの利用を制限する場合には、動きベクトル残差(mvd)を復号しない点を除き、基本インターPUと同一の方法を用いてもよい。この場合、スキップPUの双予測制限の動作は、基本インターPUと同じ動作を行う。
(Type of bi-prediction restriction)
The PU type includes a PU for which the target CU is skipped (skip PU), a PU for which the target PU is adapted for merging (merge PU), and a PU that is neither skipped nor merged (basic inter PU or non-motion information) (Omitted PU). In the basic inter PU, an inter prediction flag indicating whether it is bi-prediction or uni-prediction is decoded from the encoded data, and a motion compensation parameter is derived. On the other hand, in the skip PU and merge PU, motion compensation parameters are derived without decoding the inter prediction flag. In these PUs, candidates for motion compensation are selected from skip candidates or merge candidates based on the skip index or merge index, and motion compensation parameters in the target PU are derived based on the motion compensation parameters in the selection candidates. . Usually, the motion compensation parameter derivation method of the skip PU is the same as that of the merge PU. When the use of merging is restricted by using a sequence parameter set flag or the like, the same method as the basic inter PU may be used except that the motion vector residual (mvd) is not decoded. In this case, the bi-prediction restriction operation of the skip PU is the same as that of the basic inter PU.
 図35の(a)は、各PUにおける双予測制限の例を示す。場合としては、基本インターPUのみに双予測制限を行う場合と、動き補償予測を適用する全PUに双予測制限を行う場合がある。基本インターPUのみに双予測制限を行う場合には、スキップPU及びマージPUでは双予測制限を行わず、基本インターPUのみに双予測制限を行う。基本インターPUのみに双予測制限を行う場合にも、全PUに双予測制限を行う場合にも、動画像符号化装置および動画像復号装置における処理量の低減と回路規模の削減が可能である。 FIG. 35 (a) shows an example of bi-prediction restriction in each PU. In some cases, bi-prediction restriction is performed only on the basic inter PU, and bi-prediction restriction is performed on all PUs to which motion compensated prediction is applied. When the bi-prediction restriction is performed only on the basic inter PU, the bi-prediction restriction is not performed on the skip PU and the merge PU, but the bi-prediction restriction is performed only on the basic inter-PU. Whether bi-prediction restriction is applied only to the basic inter PU or bi-prediction restriction is applied to all PUs, it is possible to reduce the processing amount and the circuit scale in the video encoding device and the video decoding device. .
 図35の(b)は、各PUにおける双予測制限の方法を示す。スキップPU及びマージPUの場合には、スキップ候補またはマージ候補に基づく動き補償パラメータ導出において双予測を行わないことを示す情報を導出することによって、双予測制限を行う。具体的には、動き補償パラメータ導出部で後述するように、動き補償パラメータに含まれるインター予測フラグの値を双予測から単予測に変換することで双予測制限を行う。基本インターPUに対して双予測制限を行う場合には、PUサイズ情報に応じて双予測制限の適用有無を判定する。双予測制限を適用しない場合にはインター予測フラグの復号を行う。また、双予測制限を適用する場合にはインター予測フラグの復号を省略するとともに、さらにインター予測フラグの値を単予測と推定する処理を行う。 FIG. 35 (b) shows a bi-prediction restriction method for each PU. In the case of skip PUs and merge PUs, bi-prediction restriction is performed by deriving information indicating that bi-prediction is not performed in motion compensation parameter derivation based on skip candidates or merge candidates. Specifically, as will be described later in the motion compensation parameter derivation unit, bi-prediction restriction is performed by converting the value of the inter prediction flag included in the motion compensation parameter from bi-prediction to single prediction. When bi-prediction restriction is performed on a basic inter PU, whether or not bi-prediction restriction is applied is determined according to PU size information. When the bi-prediction restriction is not applied, the inter prediction flag is decoded. In addition, when the bi-prediction restriction is applied, decoding of the inter prediction flag is omitted, and further, a process of estimating the value of the inter prediction flag as single prediction is performed.
 ここで、PUサイズ情報とは、小さなPUであるか否かを判定するための情報であり、対象CUのサイズとPU分割タイプ、もしくは、対象CUのサイズとPU分割数、もしくは、PUの幅もしくは高さ、もしくはPUの面積などを用いることができる。 Here, the PU size information is information for determining whether or not the PU is a small PU, and the size of the target CU and the PU partition type, or the size of the target CU and the number of PU partitions, or the width of the PU. Alternatively, the height or the area of the PU can be used.
 スキップPU及びマージPUと、基本インターPUは、動き補償パラメータの復号方法だけでなく用いられる場面も異なる。スキップPUとマージPUは、選択可能な動き補償パラメータを制限することによって符号量の低減を行う。このようなPUでは、動きが一様であるような領域で主に用いられる。動きが一様である場合には、2つの予測画像が近く双予測によるノイズ除去効果が大きいことが多い。そのため、基本インターPUの双予測制限に比べると、スキップPU及びマージPUでは、基本インターPUと比較して双予測制限により符号化効率が低下する場合が生じやすい。そのため、上述のように基本インターPUのみで双予測を用いる制限や、後述のように、基本インターPUと、スキップPUおよびマージPUで制限するPUサイズを変更する方法も好適である。また、基本インターPUでの双予測制限は、符号化データの構造の観点からみると、インター予測フラグを符号化しないことによる符号量低減効果があるためにより有効である。 The skip PU and merge PU and the basic inter PU differ not only in the motion compensation parameter decoding method but also in the scenes used. The skip PU and the merge PU reduce the code amount by limiting selectable motion compensation parameters. Such a PU is mainly used in an area where the motion is uniform. When the motion is uniform, two prediction images are close to each other, and the noise removal effect by bi-prediction is often large. Therefore, compared with the bi-prediction restriction of the basic inter PU, the skip PU and the merge PU are likely to have a lower coding efficiency due to the bi-prediction restriction than the basic inter PU. Therefore, a restriction that uses bi-prediction only with the basic inter PU as described above, and a method that changes the PU size restricted with the basic inter PU, the skip PU, and the merge PU as described later are also suitable. In addition, the bi-prediction restriction in the basic inter PU is more effective because there is a code amount reduction effect by not encoding the inter prediction flag from the viewpoint of the structure of the encoded data.
 (PUの動き補償パラメータ)
 PUの動き補償パラメータは、予測リスト利用フラグpredFlagL0およびpredFlagL1と、参照インデックス番号refIdxL0およびrefIdxL1と動きベクトルmvL0およびmvL1と、で表現される。予測リスト利用フラグpredFlagL0、predFlagL1は、参照予測リストが用いられるか否かを示す。以下、利用する場合を1、利用しない場合を0で示す。2つの参照予測リストを用いる場合、predFlagL0=1, predFlagL1=1の場合が双予測に対応し、1つの参照予測リストを用いる場合、すなわち(predFlagL0, predFlagL1) = (1, 0)もしくは(predFlagL0, predFlagL1) = (0, 1)の場合が単予測に対応する。なお、双予測であるか否かは、後述のインター予測フラグで表現することもでき、符号化データから、参照ピクチャの数が1(単予測)か2(双予測)かの情報を復号する場合にはこちらが用いられる。
(PU motion compensation parameters)
The motion compensation parameters of the PU are expressed by prediction list use flags predFlagL0 and predFlagL1, reference index numbers refIdxL0 and refIdxL1, and motion vectors mvL0 and mvL1. The prediction list use flags predFlagL0 and predFlagL1 indicate whether or not a reference prediction list is used. In the following, 1 is used when using, and 0 when not using. When two reference prediction lists are used, the case of predFlagL0 = 1 and predFlagL1 = 1 corresponds to bi-prediction, and when one reference prediction list is used, that is, (predFlagL0, predFlagL1) = (1, 0) or (predFlagL0, The case of predFlagL1) = (0, 1) corresponds to single prediction. Whether or not bi-prediction is possible can also be expressed by an inter-prediction flag to be described later, and information on whether the number of reference pictures is 1 (uni-prediction) or 2 (bi-prediction) is decoded from encoded data. This is used in some cases.
 予測リスト利用フラグpredFlagL0が1の場合には、参照インデックス番号refIdxL0によってL0リストの参照ピクチャを指定し、動きベクトルmvL0によって指定された参照ピクチャに対する動きベクトルを指定する。 When the prediction list use flag predFlagL0 is 1, the reference picture of the L0 list is specified by the reference index number refIdxL0, and the motion vector for the reference picture specified by the motion vector mvL0 is specified.
 予測リスト利用フラグpredFlagL1が1の場合には、参照インデックス番号refIdxL1によってL1リストの参照ピクチャを指定し、動きベクトルmvL1によって指定された参照ピクチャに対する動きベクトルを指定する。 When the prediction list use flag predFlagL1 is 1, the reference picture of the L1 list is specified by the reference index number refIdxL1, and the motion vector for the reference picture specified by the motion vector mvL1 is specified.
 なお、リストXを使用しない場合(Xは0もしくは1)、すなわち、予測リスト利用フラグpredFlagLXが0の場合には、基本的には参照インデックス番号refIdxLXの値を-1、動きベクトルmvL1の値を(0, 0)とする。 When the list X is not used (X is 0 or 1), that is, when the prediction list use flag predFlagLX is 0, basically, the value of the reference index number refIdxLX is -1 and the value of the motion vector mvL1 is (0, 0).
 (インター予測フラグの詳細)
 ここでは、インター予測フラグの詳細を説明する。インター予測フラグinter_pred_flagは、単予測であるか双予測であるかを示す2値フラグである場合の他、単予測において参照する参照画像のリスト(参照リスト)を複数の参照リストの中から選択する情報を含む場合がある。例えば、2種類の参照リスト(L0リストとL1リスト)のいずれかを選択するフラグを含む3値フラグとしてインター予測フラグが定義されていてもよい。以下、各々の場合を説明する。
(Details of inter prediction flag)
Here, details of the inter prediction flag will be described. The inter prediction flag inter_pred_flag is a binary flag indicating whether it is uni-prediction or bi-prediction, and selects a list of reference images (reference list) to be referred to in uni-prediction from a plurality of reference lists. May contain information. For example, the inter prediction flag may be defined as a ternary flag including a flag for selecting one of two types of reference lists (L0 list and L1 list). Hereinafter, each case will be described.
 復号モジュール10では、スライスヘッダ等から参照フレームリストとしてL0、L1リストを用いるか、コンバインドリスト(LCリスト)を用いるかを選択するコンバインドリストフラグref_pic_list_combination_flagを復号する。単予測の場合の参照フレーム決定方法は、コンバインドリストフラグの値に応じて異なる。コンバインドリストフラグが1の場合には、単予測の参照フレームの指定に用いる参照リストとしてコンバインドリストLCを用い、各PUにおいて参照リストを指定するためのフラグは不要である。そのためインター予測フラグinter_pred_flagは2値フラグで良い。コンバインドリストフラグが0の場合には、各PUにおいて、参照リストをL0リストもしくはL1リストから選択する必要がある、そのためインター予測フラグinter_pred_flagは3値フラグとなる。 The decoding module 10 decodes the combined list flag ref_pic_list_combination_flag that selects whether to use the L0, L1 list as the reference frame list or the combined list (LC list) from the slice header or the like. The reference frame determination method in the case of single prediction differs depending on the value of the combined list flag. When the combined list flag is 1, the combined list LC is used as a reference list used for specifying a single prediction reference frame, and a flag for specifying a reference list in each PU is unnecessary. Therefore, the inter prediction flag inter_pred_flag may be a binary flag. When the combined list flag is 0, it is necessary to select the reference list from the L0 list or the L1 list in each PU. Therefore, the inter prediction flag inter_pred_flag is a ternary flag.
 図32の(a)は、2値フラグである場合のインター予測フラグの意味を示し、図32の(b)は、3値フラグである場合のインター予測フラグの意味を示す。 32 (a) shows the meaning of the inter prediction flag when it is a binary flag, and FIG. 32 (b) shows the meaning of the inter prediction flag when it is a ternary flag.
 (双予測制限におけるシンタックステーブル例)
 図31は、従来技術におけるPUのシンタックステーブルの例であり双予測制限を行わない場合の符号化データの構成を示す。図33は、PUのシンタックステーブルの例であり、(a)および(b)は各々双予測制限を行う場合の符号化データの構成の特にインター予測フラグinter_pred_flagの部分を示す。図33の(a)は、インター予測フラグが常に2値フラグである場合のシンタックステーブルの例である。この場合、inter_pred_flagにより単予測を意味するPred_LCと、双予測を意味するPred_Biの2つを区別する。スライスがBスライスでかつ双予測が有効である場合(DisableBiPred = false)には、単予測と双予測を区別するために符号化データは、インター予測フラグinter_pred_flagを含み、双予測が有効ではない場合(DisableBiPred = true)には、常に単予測であるからインター予測フラグinter_pred_flagを含まない。
(Example of syntax table in bi-prediction restriction)
FIG. 31 is an example of a PU syntax table in the prior art, and shows a configuration of encoded data when bi-prediction restriction is not performed. FIG. 33 is an example of a PU syntax table, and (a) and (b) each show a part of an inter prediction flag inter_pred_flag in the configuration of encoded data when bi-prediction restriction is performed. (A) of FIG. 33 is an example of a syntax table when the inter prediction flag is always a binary flag. In this case, two types of Pred_LC, which means single prediction, and Pred_Bi, which means bi-prediction, are distinguished by inter_pred_flag. When the slice is a B slice and bi-prediction is valid (DisableBiPred = false), the encoded data includes the inter prediction flag inter_pred_flag to distinguish between single prediction and bi-prediction, and bi-prediction is not valid. Since (DisableBiPred = true) is always single prediction, the inter prediction flag inter_pred_flag is not included.
 図33の(b)は、インター予測フラグが3値フラグである場合のシンタックステーブルの例である。コンバインドリストを利用する場合にはinter_pred_flagによりLCリストの参照フレームを1つ用いる単予測を意味するPred_LCと、双予測を意味するPred_Biの2つを区別するが、そうでない場合には、L1リストの単予測を意味するPred_L1、L1リストの単予測を意味するPred_L2と、双予測を意味するPred_Biの3つを区別する。スライスがBスライスでかつ双予測が有効である場合(DisableBiPred = false)には、符号化データは単予測と双予測を指定するために第1のインター予測フラグinter_pred_flag0を含み、双予測が有効ではない場合には、コンバインドリストを用いない場合に限り、符号化データは、参照リストを指定するための単予測と双予測を指定するために第2のインター予測フラグinter_pred_flag1を含む。コンバインドリストを用いない場合とは詳細には図33の(a)に示すように!UsePredRefLC && !NoBackPredFlagにより判定する。すなわち、コンバインドリストを使用するか否かを指定するフラグUsePredRefLC(UsePredRefLCの値が真の場合にコンバインドリストを使用することを示す)と、後方向予測を用いるか否かを示すフラグNoBackPredFlag(NoBackPredFlagの値が真の場合に後方向予測を用いないことを示す)により指定される。コンバインドリストを利用する場合には、リスト選択をせずともコンバインドリストであることが分かる。後方向予測を用いない場合にはPred_L1を禁止することであるから、第2のインター予測フラグinter_pred_flag1を符号化しない場合にも使用するリストが、コンバインドリストであるか(Pred_LC)、L0リストであるかPred_L0が分かる。なお、NoBackPredFlagの代わりにL1リストを用いないという意味でNoL1PredFlagという表現を用いることもできる。 FIG. 33B is an example of a syntax table when the inter prediction flag is a ternary flag. When using a combined list, inter_pred_flag distinguishes between Pred_LC, which means uni-prediction using one LC list reference frame, and Pred_Bi, which means bi-prediction. Three types are distinguished: Pred_L1, which means single prediction, Pred_L2, which means single prediction of the L1 list, and Pred_Bi, which means bi-prediction. When the slice is a B slice and bi-prediction is enabled (DisableBiPredPre = false), the encoded data includes the first inter prediction flag inter_pred_flag0 to specify uni-prediction and bi-prediction, and bi-prediction is not valid. If not, the encoded data includes a second inter prediction flag inter_pred_flag1 for specifying uni-prediction and bi-prediction for specifying the reference list only when the combined list is not used. More specifically, the case where the combined list is not used is determined by! UsePredRefLC &&! NoBackPredFlag as shown in FIG. That is, a flag UsePredRefLC (indicating that the combined list is to be used when the value of UsePredRefLC is true) and a flag NoBackPredFlag (NoBackPredFlag) indicating whether or not to use backward prediction are used. Indicates that backward prediction is not used when the value is true). In the case of using a combined list, it can be seen that it is a combined list without selecting a list. When backward prediction is not used, Pred_L1 is prohibited. Therefore, the list used even when the second inter prediction flag inter_pred_flag1 is not encoded is a combined list (Pred_LC) or an L0 list. Or Pred_L0. Note that the expression NoL1PredFlag can also be used in the sense that the L1 list is not used instead of NoBackPredFlag.
 双予測制限を行うか否か、もしくは、双予測制限を行う場合のPUサイズの判定に用いる閾値を符号化データに含めても構わない。図34は、双予測制限に関するシンタックステーブルの例である。図34の(a)は、シーケンスパラメータセットが双予測制限をするか否かを制限するフラグdisable_bipred_in_small_PUを含む場合を示す。図に示すように、双予測制限のフラグは、小サイズのPU(ここでは4x4サイズのPU)を禁止するフラグdisable_inter_4x4と独立に符号化しても良い。なお、小サイズのPUを禁止するフラグの目的も、双予測制限と同じく、PU予測画像を生成する場合における最悪の処理量の低減であるから、小サイズのPUを禁止するフラグと小サイズの双予測を禁止するフラグを共通フラグとしても用いても良い。図34の(b)は、共通のフラグとして予測制約フラグuse_restricted_predictionを設ける例である。この場合には、予測制約フラグがtrueの場合には、小サイズのPUの適用と小サイズPUにおける双予測を同時に禁止する。図34の(c)は、双予測を禁止するPUのサイズを示すdisable_bipred_sizeを符号化データに含める例である。disable_bipred_sizeとしては双予測制限の判定方法で後述する閾値THの2を底とする対数の値等を用いることなどができる。なお、これらのフラグは、シーケンスパラメータセット以外のパラメータセットで符号化しても構わないし、スライスヘッダで符号化しても構わない。 Whether the bi-prediction restriction is to be performed or a threshold value used for determining the PU size when the bi-prediction restriction is to be performed may be included in the encoded data. FIG. 34 is an example of a syntax table regarding bi-prediction restriction. FIG. 34A shows a case where the sequence parameter set includes a flag disable_bipred_in_small_PU that restricts whether or not bi-prediction restriction is performed. As shown in the figure, the bi-prediction restriction flag may be encoded independently of a flag disable_inter_4x4 that prohibits a small size PU (here, a 4 × 4 size PU). Note that the purpose of the flag prohibiting a small PU is to reduce the worst processing amount when generating a PU prediction image, as in the case of bi-prediction restriction. A flag prohibiting bi-prediction may be used as a common flag. FIG. 34B is an example in which a prediction constraint flag use_restricted_prediction is provided as a common flag. In this case, when the prediction constraint flag is true, the application of the small size PU and the bi-prediction in the small size PU are prohibited at the same time. (C) of FIG. 34 is an example which includes disable_bipred_size indicating the size of the PU for which bi-prediction is prohibited in the encoded data. As disable_bipred_size, a bi-prediction restriction determination method can be used such as a logarithmic value with a threshold TH of 2 which will be described later. Note that these flags may be encoded with a parameter set other than the sequence parameter set, or may be encoded with a slice header.
 以上において、CABACの場合のシンタックスについて説明したが、続いて、CAVLCの場合のシンタックスについて説明する。上述のとおり図33はCABACの場合のシンタックステーブルである。それに対し図36はCAVLCの場合を含むシンタックステーブルである。図36中のcombined_inter_pred_ref_idxは、インター予測フラグinter_pred_flagと参照ピクチャインデックス(ref_idx_l0、ref_idx_lc、ref_idx_l1)を結合したフラグである。図36に示すように、符号化モード情報(entropy_coding_mode_flag)が0、すなわちCAVLCの場合には、インター予測フラグinter_pred_flagと参照ピクチャインデックスを別々に符号化、復号するのではなく、結合フラグであるcombined_inter_pred_ref_idxを符号化する。従って、符号化データはcombined_inter_pred_ref_idxを含む。 In the above, the syntax in the case of CABAC has been described. Subsequently, the syntax in the case of CAVLC will be described. As described above, FIG. 33 is a syntax table in the case of CABAC. On the other hand, FIG. 36 shows a syntax table including the case of CAVLC. The combined_inter_pred_ref_idx in FIG. 36 is a flag obtained by combining the inter prediction flag inter_pred_flag and the reference picture index (ref_idx_l0, ref_idx_lc, ref_idx_l1). As shown in FIG. 36, when the encoding mode information (entropy_coding_mode_flag) is 0, that is, CAVLC, the inter prediction flag inter_pred_flag and the reference picture index are not separately encoded and decoded, but combined_inter_pred_ref_idx that is a combined flag is used. Encode. Therefore, the encoded data includes combined_inter_pred_ref_idx.
 さらに双予測が使用可能な場合(双予測制限を示すフラグDisableBipredがfalseである場合)で、かつcombined_inter_pred_ref_idxが所定の値MaxPredRef(後述)であれば、符号化データはインター予測フラグinter_pred_flagをさらに含む。DisableBipredは、PUサイズが小サイズである場合にtrueとする。図36のDisableBipredの導出方法は一例であり、この場合、4x4、4x8、8x4のPUサイズの場合にDisableBipred=trueとなる。 Further, when bi-prediction is available (when bi-prediction restriction flag DisableBipred is false) and combined_inter_pred_ref_idx is a predetermined value MaxPredRef (described later), the encoded data further includes an inter prediction flag inter_pred_flag. DisableBipred is set to true when the PU size is small. The method of deriving DisableBipred in FIG. 36 is an example. In this case, DisableBipred = true is set for 4 × 4, 4 × 8, and 8 × 4 PU sizes.
 (結合インター予      測参照インデックス)
 図37は、結合インター予測参照インデックスcombined_inter_pred_ref_idxを説明するための図である。図37の(a)、(b)、(c)は、combined_inter_pred_ref_idxの値の例を説明するための図である。図37の(d)は、combined_inter_pred_ref_idxの最大値MaxPredRefの導出方法を示すテーブルTBL37および擬似コードCODE37である。combined_inter_pred_ref_idxは、発生確率の高いインター予測フラグinter_pred_flagと参照ピクチャインデックスの組み合わせを短いビットで符号化するために用いられる。combined_inter_pred_ref_idxは、発生確率の高い参照ピクチャの組み合わせを要素にもつ参照リストLC(LCのCはcombinedの略)で管理される参照ピクチャを選択するために用いられるインデックスである。
(Join inter prediction reference index)
FIG. 37 is a diagram for explaining the combined inter prediction reference index combined_inter_pred_ref_idx. (A), (b), and (c) of FIG. 37 are diagrams for explaining an example of the value of combined_inter_pred_ref_idx. FIG. 37 (d) shows a table TBL37 and pseudo code CODE37 showing a method for deriving the maximum value MaxPredRef of combined_inter_pred_ref_idx. combined_inter_pred_ref_idx is used to encode a combination of an inter prediction flag inter_pred_flag having a high occurrence probability and a reference picture index with short bits. The combined_inter_pred_ref_idx is an index used to select a reference picture managed in a reference list LC (C for LC is an abbreviation of combined) whose elements are combinations of reference pictures with a high probability of occurrence.
 図37の(a)、(c)の例では、combined_inter_pred_ref_idxの値の範囲は0から8(=MaxPredRef)である。図37の(c)に示す通り、0から7に発生しやすい組み合わせ(結合参照ピクチャセット)が割り当てられる。インター予測フラグinter_pred_flagと参照ピクチャインデックスの組み合わせがそれ以外の場合には、8(=MaxPredRef)が割り当てられる。図37の(d)に示す最大値MaxPredRefの導出方法については、後に説明する。 In the example of FIGS. 37A and 37C, the value range of combined_inter_pred_ref_idx is 0 to 8 (= MaxPredRef). As shown in FIG. 37 (c), combinations (joined reference picture sets) that are likely to occur from 0 to 7 are assigned. When the combination of the inter prediction flag inter_pred_flag and the reference picture index is other than that, 8 (= MaxPredRef) is assigned. A method of deriving the maximum value MaxPredRef shown in (d) of FIG. 37 will be described later.
 CAVLCでは、combined_inter_pred_ref_idxは、変換可変テーブルEncTableと呼ばれるテーブルでコード番号codeNumに変換され、コード番号codeNumがMaxPredRefを最大値としたtruncated unary codeで符号化される。すなわち、codeNum = EncTable[combined_inter_pred_ref_idx]が符号化される。truncated unary codeでは小さい値ほど短いビット数で符号化される。また最大値を明示的に用いることで無駄なビットなく符号化できる。なお、最大値cMaxの場合のtruncated unary codeによるコード番号(codeNum)の復号は次の擬似コードに規定される処理により実現できる。ここで、read_bits(1)は符号化データから1bitのバイナリを読み出してその値を返す関数である。
leadingZeroBits = -1
for( b = 0; !b && leadingZeroBits < cMax; leadingZeroBits++ )
      b = read_bits( 1 )
codeNum = leadingZeroBits
 図38の(a)および(b)に、それぞれ、変換可変テーブルEncTableと逆変換可変テーブルDecTableの例を示す。図38の(a)の例に示されるように、変換可変テーブルEncTableを用いることにより、結合参照ピクチャセットの中で、さらに、発生しやすい組み合わせに小さい値が割り振られ、短い符号長で符号化される。変換可変テーブル及び逆変換可変テーブルは、1つのcombined_inter_pred_ref_idxを符号化、復号する度に、発生した値が短いコード番号となるように更新される。これにより固定的な可変テーブルを用いる場合に比べさらに短い符号長で符号化できる。図38の(b)は、逆変換可変テーブルDecTableを示す。復号されたcodeNumはDecTableによりcombined_inter_pred_ref_idxに直される。すなわち、combined_inter_pred_ref_idx = DecTable[combined_inter_pred_ref_idx]である。復号動作の詳細はインター予測フラグ復号部1028の説明で後述する。
In CAVLC, combined_inter_pred_ref_idx is converted into a code number codeNum in a table called a conversion variable table EncTable, and the code number codeNum is encoded with a truncated unary code with MaxPredRef as the maximum value. That is, codeNum = EncTable [combined_inter_pred_ref_idx] is encoded. In truncated unary code, the smaller the value, the shorter the number of bits. Also, by explicitly using the maximum value, encoding can be performed without wasted bits. Note that the decoding of the code number (codeNum) by the truncated unary code in the case of the maximum value cMax can be realized by the process defined by the following pseudo code. Here, read_bits (1) is a function that reads a 1-bit binary from the encoded data and returns the value.
leadingZeroBits = -1
for (b = 0;! b && leadingZeroBits <cMax; leadingZeroBits ++)
b = read_bits (1)
codeNum = leadingZeroBits
FIGS. 38A and 38B show examples of the conversion variable table EncTable and the inverse conversion variable table DecTable, respectively. As shown in the example of FIG. 38 (a), by using the conversion variable table EncTable, small values are assigned to combinations that are more likely to occur in the combined reference picture set, and encoding is performed with a short code length. Is done. The conversion variable table and the inverse conversion variable table are updated so that the generated value becomes a short code number each time one combined_inter_pred_ref_idx is encoded and decoded. As a result, encoding can be performed with a shorter code length than when a fixed variable table is used. FIG. 38B shows an inverse conversion variable table DecTable. The decoded codeNum is corrected to combined_inter_pred_ref_idx by DecTable. That is, combined_inter_pred_ref_idx = DecTable [combined_inter_pred_ref_idx]. Details of the decoding operation will be described later in the description of the inter prediction flag decoding unit 1028.
 (双予測制限における動き補償パラメータ導出部)
 図29は、動き補償パラメータ導出部121の構成を示す。動き補償パラメータ導出部121は、スキップ動き補償パラメータ導出部1211、マージ動き補償パラメータ導出部1212、基本動き補償パラメータ導出部1213、双予測制限PU判定部1218、および、双単予測変換部1219から構成される。
(Motion compensation parameter derivation unit for bi-prediction restriction)
FIG. 29 shows the configuration of the motion compensation parameter derivation unit 121. The motion compensation parameter derivation unit 121 includes a skip motion compensation parameter derivation unit 1211, a merge motion compensation parameter derivation unit 1212, a basic motion compensation parameter derivation unit 1213, a bi-prediction restricted PU determination unit 1218, and a bi-prediction conversion unit 1219. Is done.
 動き補償パラメータ導出部121では、特に、インター予測フラグを復号しない場合のPUであるスキップPUとマージPUの双予測制限を行う。 The motion compensation parameter deriving unit 121 particularly performs bi-prediction restriction on skip PUs and merge PUs that are PUs when the inter prediction flag is not decoded.
 スキップ動き補償パラメータ導出部1211は、対象CUがスキップの場合に、スキップPUの動き補償パラメータを導出し、双単予測変換部1219に入力する。双単予測変換部1219は、双予測限定条件に応じて動き補償パラメータを変換し、スキップ動き補償パラメータ導出部1211に戻す。双予測限定条件とは、双予測制限を行うか否かを決定するための条件であり、その判定は、後述のとおり、双予測制限PU判定部1218が行う。また、双単予測変換部1219が、双予測を単予測へ変換する方法(双予測変換方法)の詳細については後述する。スキップ動き補償パラメータ導出部1211は、双予測限定条件に応じて変換された動き補償パラメータを、対象PUの動き補償パラメータとして外部に出力する。なお、スキップインデックスによって、動き補償パラメータが定まる場合には、スキップ候補の各々に対して、双単予測変換部1219で変換を行い、変換後のスキップ候補をスキップインデックスで選択する構成でも構わない。なお、スキップPUのスキップ候補導出と、マージPUのマージ候補導出の導出方法とが同じ場合には、スキップ動き補償パラメータ導出部1211をマージ動き補償パラメータ導出部1212に置き換えて、マージ候補をスキップ候補に置き換えて導出する。 The skip motion compensation parameter deriving unit 1211 derives a motion compensation parameter of the skip PU when the target CU is skipped, and inputs the motion compensation parameter to the bi-prediction transform unit 1219. The bi-prediction conversion unit 1219 converts the motion compensation parameter in accordance with the bi-prediction limiting condition, and returns it to the skip motion compensation parameter derivation unit 1211. The bi-prediction limited condition is a condition for determining whether or not bi-prediction restriction is performed, and the determination is performed by the bi-prediction restricted PU determination unit 1218 as described later. Details of a method (bi-prediction conversion method) in which the bi-prediction conversion unit 1219 converts bi-prediction into single prediction will be described later. The skip motion compensation parameter deriving unit 1211 outputs the motion compensation parameter converted according to the bi-prediction restriction condition to the outside as the motion compensation parameter of the target PU. When the motion compensation parameter is determined by the skip index, the bi-predictive conversion unit 1219 may perform conversion for each skip candidate, and the converted skip candidate may be selected by the skip index. When the skip candidate derivation of the skip PU and the merge candidate derivation derivation method of the merge PU are the same, the skip motion compensation parameter derivation unit 1211 is replaced with the merge motion compensation parameter derivation unit 1212, and the merge candidate is skip candidate. Derived by replacing with.
 マージ動き補償パラメータ導出部1212は、対象PUがマージの場合に、対象PUの動き補償パラメータを導出し、双単予測変換部1219に入力する。双単予測変換部1219は、双予測限定条件に応じて動き補償パラメータを変換し、マージ動き補償パラメータ導出部1212に戻す。マージ動き補償パラメータ導出部1212は、双予測限定条件に応じて変換された動き補償パラメータを、対象PUの動き補償パラメータとして外部に出力する。なお、マージインデックスによって、動き補償パラメータが定まる場合には、マージ候補の各々に対して、双単予測変換部1219で変換を行い、変換後のマージ候補を、マージインデックスで選択する構成でも構わない。 The merge motion compensation parameter deriving unit 1212 derives a motion compensation parameter of the target PU when the target PU is a merge, and inputs the motion compensation parameter of the target PU to the bi-predictive transformation unit 1219. The bi-prediction conversion unit 1219 converts the motion compensation parameter according to the bi-prediction limited condition, and returns it to the merge motion compensation parameter derivation unit 1212. The merge motion compensation parameter derivation unit 1212 outputs the motion compensation parameter converted according to the bi-prediction restriction condition to the outside as the motion compensation parameter of the target PU. When motion compensation parameters are determined by the merge index, the bi-predictive conversion unit 1219 may perform conversion for each merge candidate, and the merge candidate after conversion may be selected by the merge index. .
 基本動き補償パラメータ導出部1213は、対象PUがスキップでも、マージでもない場合において、対象PUの動き補償パラメータを導出し、外部に出力する。 The basic motion compensation parameter deriving unit 1213 derives the motion compensation parameter of the target PU when the target PU is neither skipped nor merged, and outputs it to the outside.
 双予測制限PU判定部1218は、対象PUのPUサイズ情報を参照し、対象PUにおいて双予測を用いない双予測制限を行うか否かを判定する。スキップCU及びマージPUの双予測制限を行うか否か、及び、基本インターPUの双予測制限を行うか否かを、独立に判定しても良い。例えば、全てのPUを同じPUサイズを閾値として双予測制限を行って良いし、スキップPU及びマージPUの方が大きなPUサイズを閾値として双予測制限を行っても良い。またスキップPU及びマージPUは双予測制限を行わず、基本インターPUにのみ双予測制限を行っても良い。 The bi-prediction restricted PU determination unit 1218 refers to the PU size information of the target PU, and determines whether to perform bi-prediction restriction that does not use bi-prediction in the target PU. Whether to perform bi-prediction restriction on skip CU and merge PU and whether to perform bi-prediction restriction on basic inter PU may be determined independently. For example, bi-prediction restriction may be performed using the same PU size as a threshold for all PUs, or bi-prediction restriction may be performed using a larger PU size as a threshold for skip PUs and merge PUs. Further, the skip prediction and the merge PU may not perform the bi-prediction restriction, and may perform the bi-prediction restriction only on the basic inter PU.
 なお、マージの利用を制限する場合のように、スキップPUでインター予測フラグを復号する場合には、スキップPU、マージPU、基本インターPUの各々で双予測制限を行うか否かを、独立に判定することも可能である。 Note that when decoding inter prediction flags with skip PUs, such as when merging is restricted, whether or not bi-prediction restriction is performed on each of skip PUs, merge PUs, and basic inter PUs is determined independently. It is also possible to determine.
 また、上記の構成では、スキップ動き補償パラメータ導出部1211において設定された双予測・単予測の設定を双単予測変換部1219において双予測制限PU判定部1218に基づき判定すると説明したが、この構成に限らない。例えば、双予測制限PU判定部1218の判定結果を直接スキップ動き補償パラメータ導出部1211に入力し、双予測・単予測の設定を行う構成でも構わない。 In the above configuration, the bi-prediction / uni-prediction setting set in the skip motion compensation parameter deriving unit 1211 is determined based on the bi-prediction restricted PU determination unit 1218 in the bi-prediction conversion unit 1219. Not limited to. For example, the configuration may be such that the determination result of the bi-prediction restricted PU determination unit 1218 is directly input to the skip motion compensation parameter derivation unit 1211 and bi-prediction / uni-prediction is set.
 以下では、上記動き補償パラメータ導出部121の各構成のうち、マージ動き補償パラメータ導出部1212、基本動き補償パラメータ導出部1213、双予測制限PU判定部1218、および、双単予測変換部1219の詳細について、順に説明する。 Hereinafter, among the components of the motion compensation parameter derivation unit 121, details of the merge motion compensation parameter derivation unit 1212, the basic motion compensation parameter derivation unit 1213, the bi-prediction restricted PU determination unit 1218, and the bi-uni prediction conversion unit 1219 will be described. Will be described in order.
 (マージ動き補償パラメータ導出部1212の詳細)
 図43は、マージ動き補償パラメータ導出部1212の構成を示すブロック図である。なお、スキップPUの場合に用いられる場合には、以下のマージ候補をスキップ候補に置き換えて動作させる。
(Details of merge motion compensation parameter deriving unit 1212)
FIG. 43 is a block diagram showing the configuration of the merge motion compensation parameter derivation unit 1212. When used in the case of a skip PU, the following merge candidates are replaced with skip candidates for operation.
 マージ動き補償パラメータ導出部1212は、隣接マージ候補導出部1212A、時間的マージ候補導出部1212B、ユニーク候補導出部1212C、結合双予測マージ候補導出部1212D、非スケール双予測マージ候補導出部1212E、ゼロベクトルマージ候補導出部1212F、マージ候補導出制御部1212G、マージ候補格納部1212H、マージ候補選択部1212Jから構成される。図43では図示しないが、隣接マージ候補導出部1212Aおよび時間的マージ候補導出部1212Bには、フレームメモリ16に格納されている既に復号されたCU及びPUの復号パラメータ、特に、PU単位の動き補償パラメータが供給される。なお、以下では、隣接マージ候補導出部1212A、時間的マージ候補導出部1212B、ユニーク候補導出部1212C、結合双予測マージ候補導出部1212D、非スケール双予測マージ候補導出部1212E、ゼロベクトルマージ候補導出部1212Fのことを、まとめて、マージ候補導出手段と称する。 The merge motion compensation parameter deriving unit 1212 includes an adjacent merge candidate deriving unit 1212A, a temporal merge candidate deriving unit 1212B, a unique candidate deriving unit 1212C, a combined bi-predictive merge candidate deriving unit 1212D, a non-scale bi-predictive merge candidate deriving unit 1212E, and zero. A vector merge candidate derivation unit 1212F, a merge candidate derivation control unit 1212G, a merge candidate storage unit 1212H, and a merge candidate selection unit 1212J are configured. Although not shown in FIG. 43, the adjacent merge candidate deriving unit 1212A and the temporal merge candidate deriving unit 1212B have decoding parameters of the already decoded CU and PU stored in the frame memory 16, in particular, motion compensation in units of PUs. Parameters are supplied. In the following, adjacent merge candidate derivation unit 1212A, temporal merge candidate derivation unit 1212B, unique candidate derivation unit 1212C, combined bi-prediction merge candidate derivation unit 1212D, non-scale bi-prediction merge candidate derivation unit 1212E, zero vector merge candidate derivation The unit 1212F is collectively referred to as merge candidate derivation means.
 マージ動き補償パラメータ導出部1212においては、マージ候補導出制御部1212Gが、各マージ候補導出手段を制御し、所定の数MRG_MAX_NUM_CANDSのマージ候補を導出しマージ候補格納部1212Hに格納する。ここで、マージ候補は、PUの動き補償パラメータである予測リスト利用フラグpredFlagL0とpredFlagL1、参照インデックス番号refIdxL0とrefIdxL1、動きベクトルmvL0とmvL1から構成される。マージ候補格納部1212Hには、上記動きパラメータの組がマージ候補として格納される。格納するマージ候補は格納順に順序づけられたリスト(マージ候補リスト)として管理される。マージ候補選択部1212Jは、マージインデックスで指定されるマージ候補を選択し予測情報PUIとして出力する。 In the merge motion compensation parameter derivation unit 1212, the merge candidate derivation control unit 1212G controls each merge candidate derivation unit, derives merge candidates of a predetermined number MRG_MAX_NUM_CANDS, and stores them in the merge candidate storage unit 1212H. Here, the merge candidate includes prediction list use flags predFlagL0 and predFlagL1, which are motion compensation parameters of the PU, reference index numbers refIdxL0 and refIdxL1, and motion vectors mvL0 and mvL1. The merge candidate storage unit 1212H stores the set of motion parameters as a merge candidate. The merge candidates to be stored are managed as a list (merge candidate list) ordered in the order of storage. The merge candidate selection unit 1212J selects a merge candidate specified by the merge index and outputs it as prediction information PUI.
 結合双予測マージ候補導出部1212D、非スケール双予測マージ候補導出部1212Eは、特に、双予測のマージ候補を導出するので、双予測マージ候補導出手段と呼ぶ。 The combined bi-predictive merge candidate derivation unit 1212D and the non-scale bi-predictive merge candidate derivation unit 1212E particularly derive bi-predictive merge candidates, and are referred to as bi-predictive merge candidate derivation means.
 図44は、マージ動き補償パラメータ導出部1212の動作を示すフロー図である。なお、各マージ候補導出手段が、マージ候補を導出する手法については、別の図を用いて後述する。始めに、隣接マージ候補導出部1212Aにおいて、隣接ブロックの動き補償パラメータを用いてマージ候補A0~マージ候補B2が求められる(S101)。続いて、時間的マージ候補導出部1212Bにおいて、既に復号した参照ピクチャの動き補償パラメータを用いてマージ候補Tが求められる(S102)。S103では、導出したマージ候補A0~マージ候補Tの中で重複するマージ候補が取り除かれ、マージ候補格納部1212Hに格納される。ここで重複しないマージ候補数がMRG_MAX_NUM_CANDS個以上であれば、マージ候補の導出を終了する(S104でYES)。それ以外であれば(S104でNO)、S105に遷移する。Bスライスであれば(S105でYES)、S106に遷移し、そうではなければ(S105でNO)、S107、S108をスキップしS109に遷移する(S105)。双予測制限を行う場合、ここでは、双方向マージ候補導出をスキップする場合に相当する小サイズPUの場合も、S107、S108の双予測動き候補導出の処理をスキップし、S109に遷移する(S106)。S107では、結合双予測マージ候補導出部1212Dにおいて、結合双予測マージ候補が導出されマージ候補格納部1212Hに格納される。S108では、非スケール双予測マージ候補導出部1212Eにおいて、非スケール双予測マージ候補が導出されマージ候補格納部1212Hに格納される。ここでマージ候補数がMRG_MAX_NUM_CANDS個以上であれば(S109でYES)、マージ候補の導出を終了する。また、図示しないが、S107及びS108のステップ中に、マージ候補数がMRG_MAX_NUM_CANDS個に到達した時点で、各処理を停止し、マージ候補の導出を終了する。S110では、ゼロベクトルマージ候補導出部1212Fにおいて、マージ候補数がMRG_MAX_NUM_CANDS個に到達するまでゼロベクトルのマージ候補が導出され、マージ候補格納部1212Hに格納される。 FIG. 44 is a flowchart showing the operation of the merge motion compensation parameter derivation unit 1212. A method in which each merge candidate deriving unit derives merge candidates will be described later with reference to another drawing. First, in the adjacent merge candidate derivation unit 1212A, merge candidates A0 to B2 are obtained using the motion compensation parameters of adjacent blocks (S101). Subsequently, the temporal merge candidate derivation unit 1212B obtains a merge candidate T using the motion compensation parameter of the reference picture that has already been decoded (S102). In S103, duplicate merge candidates among the derived merge candidates A0 to T are removed and stored in the merge candidate storage unit 1212H. If the number of merge candidates that do not overlap here is MRG_MAX_NUM_CANDS or more, the derivation of merge candidates is terminated (YES in S104). Otherwise (NO in S104), the process proceeds to S105. If it is a B slice (YES in S105), the process proceeds to S106. If not (NO in S105), S107 and S108 are skipped and the process proceeds to S109 (S105). When bi-prediction restriction is performed, the bi-prediction motion candidate derivation process of S107 and S108 is also skipped in the case of a small size PU corresponding to the case where bi-directional merge candidate derivation is skipped, and the process proceeds to S109 (S106). ). In S107, the combined bi-predictive merge candidate derivation unit 1212D derives a combined bi-predictive merge candidate and stores it in the merge candidate storage unit 1212H. In S108, the non-scale bi-predictive merge candidate derivation unit 1212E derives a non-scale bi-predictive merge candidate and stores it in the merge candidate storage unit 1212H. If the number of merge candidates is MRG_MAX_NUM_CANDS or more (YES in S109), the derivation of merge candidates is terminated. Although not shown, when the number of merge candidates reaches MRG_MAX_NUM_CANDS during the steps of S107 and S108, each process is stopped and the derivation of merge candidates is ended. In S110, the zero vector merge candidate deriving unit 1212F derives zero vector merge candidates until the number of merge candidates reaches MRG_MAX_NUM_CANDS, and stores it in the merge candidate storage unit 1212H.
 上記処理では、小サイズPUにおいて、双予測マージ候補に関わるマージ候補導出処理が省略されるため、マージ候補導出に掛る処理量を低減することができる。双予測マージ候補に関わる結合双予測マージ候補導出処理(S107)および非スケール双予測マージ候補導出処理(S108)は繰り返し複数の判定を行う必要がある重い処理であるため、復号にかけられる時間(処理量)が限られる小サイズPUで処理を省略できることは、実時間で復号処理を行う必要がある機器おいて特に有効である。なお、双予測のマージ候補の省略は、結合双予測マージ候補導出部1212D、非スケール双予測マージ候補導出部1212Eの動作に限らず、双予測のマージ候補を主に生成する他のマージ候補導出処理にも適用可能である。 In the above process, since the merge candidate derivation process related to the bi-predictive merge candidate is omitted in the small size PU, the processing amount required for the merge candidate derivation can be reduced. Since the combined bi-predictive merge candidate derivation process (S107) and the non-scale bi-predictive merge candidate derivation process (S108) related to the bi-predictive merge candidate are heavy processes that require repeated determinations, the time required for decoding (process) The ability to omit the processing with a small size PU with a limited amount is particularly effective in a device that needs to perform a decoding process in real time. The omission of bi-predictive merge candidates is not limited to the operations of the combined bi-predictive merge candidate derivation unit 1212D and the non-scale bi-predictive merge candidate derivation unit 1212E, and other merge candidate derivations that mainly generate bi-predictive merge candidates. It can also be applied to processing.
 以下、各マージ候補導出手段の詳細を説明する。図45は、隣接マージ候補導出部1212Aの動作を説明するための図である。図45に示すとおり、A0、A1、B0、B1、B2の位置を含む隣接ブロックの動き補償パラメータを、コピーすることにより、各マージ候補を導出する。導出する順序は、A1、B1、B0、A0、B2であるとする。導出されたマージ候補は、双単予測変換部1219で変換後、マージ候補格納部1212Hに格納する。双単予測変換部1219は、双予測制限が行われる場合に、入力されるマージ候補を単予測に変換する。単予測に変換されたマージ候補が複数になる場合(例えばL0予測とL1予測の2つ)には、その複数のマージ候補を、マージ候補格納部1212Hに格納する。双単予測変換部1219の出力が複数のマージ候補で良いというのは、以後、説明する他のマージ候補導出部でも同様である。 Hereinafter, the details of each merge candidate derivation means will be described. FIG. 45 is a diagram for explaining the operation of the adjacent merge candidate derivation unit 1212A. As shown in FIG. 45, each merge candidate is derived by copying the motion compensation parameters of adjacent blocks including the positions of A0, A1, B0, B1, and B2. Assume that the derivation order is A1, B1, B0, A0, B2. The derived merge candidate is converted by the bi-predictive conversion unit 1219 and then stored in the merge candidate storage unit 1212H. The bi-prediction conversion unit 1219 converts the input merge candidate into a single prediction when bi-prediction restriction is performed. When there are a plurality of merge candidates converted to single prediction (for example, two of L0 prediction and L1 prediction), the plurality of merge candidates are stored in the merge candidate storage unit 1212H. The fact that the output of the bi-predictive conversion unit 1219 may be a plurality of merge candidates is the same for other merge candidate derivation units described later.
 なお、隣接ブロックが、availableではない場合(unavailable)やイントラブロックの場合には、対応するマージ候補は導出されない。なお、availableではない場合とは、画面外にある場合、スライス外にある場合、ブロックのスキャン順からみて、未復号である場合である。A0~B1の位置は、PUの左上座標を(xP,yP)、PUのサイズnPSW、nPSHとして、以下のように表現できる。
A0:(xP - 1,yP + nPSH)
A1:(xP - 1,yP + nPSH - 1)
B0:(xP + nPSH,yP - 1)
B1:(xP + nPSH - 1,yP - 1)
B2:(xP - 1,yP - 1)
 なお、A0、A1、B0、B1の位置に対応するマージ候補が全て導出された場合には、B2の位置に対応するマージ候補は導出されない。PUの分割タイプが、2N×NもしくはN×2Nの場合でPUのインデックスが1である場合のマージ候補の導出においては、各マージ候補の動き補償パラメータが、インデックスが0のPUの動き補償パラメータと一致しない場合に限り、対応するマージ候補が導出されマージ候補格納部1212Hに格納される。ブロックA、ブロックBの動き補償パラメータの一致判定を行う関数equalMotion(A、B)の動作は、以下のように規定できる。
If the adjacent block is not available (unavailable) or is an intra block, a corresponding merge candidate is not derived. Note that the case where it is not available is the case where it is outside the screen, outside the slice, or not decoded in view of the block scan order. The positions A0 to B1 can be expressed as follows, where the upper left coordinates of the PU are (xP, yP) and the PU sizes are nPSW and nPSH.
A0: (xP-1, yP + nPSH)
A1: (xP-1, yP + nPSH-1)
B0: (xP + nPSH, yP-1)
B1: (xP + nPSH-1, yP-1)
B2: (xP-1, yP-1)
When all merge candidates corresponding to the positions A0, A1, B0, and B1 are derived, the merge candidates corresponding to the position B2 are not derived. In the derivation of merge candidates when the PU partition type is 2N × N or N × 2N and the PU index is 1, the motion compensation parameter of each merge candidate is the motion compensation parameter of the PU whose index is 0 Only when they do not match, the corresponding merge candidate is derived and stored in the merge candidate storage unit 1212H. The operation of the function equalMotion (A, B) for determining the coincidence of the motion compensation parameters of the block A and the block B can be defined as follows.
 equalMotion(A, B) = (predFlagL0A == predFlagL0B) && (predFlagL1A == predFlagL1B) && mvL0A[0] == mvL0B[0] && mvL0A[1] == mvL0B[1] && mvL1A[0] == mvL1B[0] && mvL1A[1] == mvL1B[1])
ここで、predFlagL0A、predFlagL1Aは、各々、ブロックAにおいてL0、L1の参照ピクチャが用いられる場合に1、それ以外は0となる。mvL0[0]、mvL0[1]は、L0の水平動きベクトル、垂直動きベクトル、mvL1[0]、mvL1[1]は、L1の水平動きベクトル、垂直動きベクトルである。なお、ブロックBの場合には、上記AをBに置き換える。
equalMotion (A, B) = (predFlagL0A == predFlagL0B) && (predFlagL1A == predFlagL1B) && mvL0A [0] == mvL0B [0] && mvL0A [1] == mvL0B [1] && mvL1A [1] = [0] && mvL1A [1] == mvL1B [1])
Here, predFlagL0A and predFlagL1A are 1 when the reference pictures L0 and L1 are used in the block A, respectively, and 0 otherwise. mvL0 [0] and mvL0 [1] are the horizontal motion vector and vertical motion vector of L0, and mvL1 [0] and mvL1 [1] are the horizontal motion vector and vertical motion vector of L1. In the case of block B, A is replaced with B.
 図46は、時間的マージ候補導出部1212Bの動作を説明する図である。図46の(a)を参照すると、時間的マージ候補は、現ピクチャがcurrPicである場合、現ピクチャ内における対象PUの空間的位置とほぼ同じ空間的位置を占める参照インデックス番号refIdxL0で指定される参照ピクチャPU、もしくは、参照ピクチャインデックス番号で指定される参照ピクチャのPUの動き補償パラメータをコピーすることにより、導出される。図46の(b)を参照して、参照インデックス番号refIdxL0、参照インデックス番号refIdxL1の導出方法を説明する。参照インデックス番号refIdxLX(ここでXは0もしくは1もしくはC)は、対象PUの隣接PU、A、B、Cのブロックの参照ピクチャrefIdxLXA、refIdxLXB、refIdxLXCを用いて以下のように求められる。
(1)refIdxLXA = refIdxLXB = refIdxLXCの場合、
  refIdxLXA = -1のとき、refIdxLX = 0
  それ以外のとき、refIdxLX = refIdxLXA
(2)refIdxLXA = refIdxLXBの場合、
  refIdxLXA = -1のとき、refIdxLX = refIdxLXC  それ以外のとき、refIdxLX = refIdxLXA
(3)refIdxLXB = refIdxLXCの場合、
  refIdxLXB = -1のとき、refIdxLX = refIdxLXA
  それ以外のとき、refIdxLX = refIdxLXB
(4)refIdxLXA = refIdxLXCの場合、
  refIdxLXA = -1のとき、refIdxLX = refIdxLXB
  それ以外のとき、refIdxLX = refIdxLXA
(5)refIdxLXA = -1の場合、
  refIdxLX = min( refIdxLXB, refIdxLXC)
(6)refIdxLXB = -1の場合、
  refIdxLX = min( refIdxLXA, refIdxLXC)
(7)refIdxLXC = -1の場合、
  refIdxLX = min( refIdxLXA, refIdxLXB)
(8)その他の場合、
  refIdxLX = min( refIdxLXA, refIdxLXB, refIdxLXC)
ここで、minは最小値をとる関数である。
なお、ブロックA、Bの座標は、以下の通りである。
A:(xP - 1,yP + nPSH - 1)
B:(xP + nPSW - 1,yP - 1)
ブロックCの座標は、下記C0、C1、C2の何れかである。C0からC2の順に走査し、各位置に対応するPUが、availableであり、イントラ以外である場合に、その位置のPUのrefIdxLXを、refIdxLXCとする。
C0:(xP + nPSW - 1,yP - 1)
C1:(xP - 1,yP + nPSH)
C2:(xP - 1,yP - 1)
 上記のようにrefIdxL0、refIdxL1が導出されると、refIdxL0で示される参照ピクチャの位置(xP +nPSW、yP +nPSH)の動き補償パラメータを用いて、L0の動きベクトルを定め、refIdxL1で示される参照ピクチャの位置(xP +nPSW、yP +nPSH)の動き補償パラメータを用いて、L1の動きベクトルを定めることにより、時間的マージ候補を導出する。すなわち、各参照ピクチャリストLX(X=0、X=1もしくはX=C)に対する動きベクトルmvLXCol[0]、mvLXCol[0]を、LXリスト及びrefIdxLXで示される参照ピクチャから算出する。具体的には、refIdxLXで示される参照ピクチャの位置(xP +nPSW、yP +nPSH)のPUがunavailableである、もしくは、イントラ予測モードである場合には、時間的マージ候補のLXの動きベクトルmvLXCol[0]、mvLXCol[1]を0に定める。それ以外、すなわち、該PUのPredFlagL0が0である場合には、該PUのL1の動きベクトルMvL1を、時間的マージ候補のLXの動きベクトルmvLXCol[0]、mvLXCol[1]として用いる。それ以外の場合には、該PUのL0の動きベクトルMvL0を、時間的マージ候補のLXの動きベクトルmvLXCol[0]、mvLXCol[1]として用いる。
FIG. 46 is a diagram for explaining the operation of the temporal merge candidate derivation unit 1212B. Referring to (a) of FIG. 46, when the current picture is currPic, the temporal merge candidate is specified by a reference index number refIdxL0 that occupies almost the same spatial position as the target PU in the current picture. It is derived by copying the motion compensation parameter of the reference picture PU or the PU of the reference picture specified by the reference picture index number. A method for deriving the reference index number refIdxL0 and the reference index number refIdxL1 will be described with reference to FIG. The reference index number refIdxLX (where X is 0, 1 or C) is obtained as follows using the reference pictures refIdxLXA, refIdxLXB, and refIdxLXC of the adjacent PU, A, B, and C blocks of the target PU.
(1) If refIdxLXA = refIdxLXB = refIdxLXC,
When refIdxLXA = -1, refIdxLX = 0
Otherwise, refIdxLX = refIdxLXA
(2) When refIdxLXA = refIdxLXB
When refIdxLXA = -1, refIdxLX = refIdxLXC Otherwise, refIdxLX = refIdxLXA
(3) If refIdxLXB = refIdxLXC,
When refIdxLXB = -1, refIdxLX = refIdxLXA
Otherwise, refIdxLX = refIdxLXB
(4) When refIdxLXA = refIdxLXC
When refIdxLXA = -1, refIdxLX = refIdxLXB
Otherwise, refIdxLX = refIdxLXA
(5) When refIdxLXA = -1,
refIdxLX = min (refIdxLXB, refIdxLXC)
(6) When refIdxLXB = -1,
refIdxLX = min (refIdxLXA, refIdxLXC)
(7) When refIdxLXC = -1,
refIdxLX = min (refIdxLXA, refIdxLXB)
(8) In other cases,
refIdxLX = min (refIdxLXA, refIdxLXB, refIdxLXC)
Here, min is a function that takes a minimum value.
The coordinates of the blocks A and B are as follows.
A: (xP-1, yP + nPSH-1)
B: (xP + nPSW-1, yP-1)
The coordinates of the block C are any of the following C0, C1, and C2. If the PU corresponding to each position is available and other than intra, the refIdxLX of the PU at that position is set as refIdxLXC.
C0: (xP + nPSW-1, yP-1)
C1: (xP-1, yP + nPSH)
C2: (xP-1, yP-1)
When refIdxL0 and refIdxL1 are derived as described above, the motion compensation parameter of the position of the reference picture (xP + nPSW, yP + nPSH) indicated by refIdxL0 is used to determine the L0 motion vector, and the reference indicated by refIdxL1 A temporal merge candidate is derived by determining the L1 motion vector using the motion compensation parameter of the picture position (xP + nPSW, yP + nPSH). That is, the motion vectors mvLXCol [0] and mvLXCol [0] for each reference picture list LX (X = 0, X = 1 or X = C) are calculated from the reference picture indicated by the LX list and refIdxLX. Specifically, if the PU at the position of the reference picture (xP + nPSW, yP + nPSH) indicated by refIdxLX is unavailable or in the intra prediction mode, the motion vector mvLXCol of the temporal merge candidate LX [0], mvLXCol [1] is set to 0. Otherwise, that is, when PredFlagL0 of the PU is 0, the L1 motion vector MvL1 of the PU is used as the temporal merge candidate LX motion vectors mvLXCol [0] and mvLXCol [1]. In other cases, the L0 motion vector MvL0 of the PU is used as the LX motion vectors mvLXCol [0] and mvLXCol [1] of temporal merge candidates.
 続いて、現フレームのPOC(Picture Order Count)と参照ピクチャのPOCを用いて、動きベクトルのスケーリングを行う。時間的マージ候補においても隣接マージ候補と同様に、マージ候補をマージ候補格納部1212Hに格納する前に、双単予測変換部1219にマージ候補を入力し変換する。変換後のマージ候補が時間的マージ候補として、マージ候補格納部1212Hに格納される。 Subsequently, the motion vector is scaled using the POC (Picture Order Count) of the current frame and the POC of the reference picture. Also in the temporal merge candidate, like the adjacent merge candidate, before the merge candidate is stored in the merge candidate storage unit 1212H, the merge candidate is input to the bi-predictive conversion unit 1219 for conversion. The merge candidate after conversion is stored in the merge candidate storage unit 1212H as a temporal merge candidate.
 ユニーク候補導出部1212Cは、マージ候補リストの各マージ候補が互いにユニークになるように、マージ候補リストを更新する。マージ候補リストに格納されたマージ候補がインデックス0~インデックスCANDXまでである場合、図47の擬似コードに示すステップによりユニークなマージ候補リストを得ることができる。なお、マージ候補リストは、マージ候補を格納する配列motion_cand[]を用いて管理する。また、マージ候補数をNumcandとすると、CANDX=Numcand-1である。図47の擬似コードの各ステップSについて、以下に説明する。
S4701:インデックス0からインデックスCANDXの有効性フラグを全て有効に初期化する。ここでmotion_valid[]は有効性フラグを格納する配列である。
S4702:ループ変数i(i=1からCANDX)に対して、iのマージ候補motion_cand[i]と同じ動き補償パラメータが、iより小さい番号のインデックスj(0<=j<i)のmotion_cand[j]で出現していたら、iの有効性フラグmotion_valid[i]を無効にする。S4702-1では、インデックスiとjの動き補償パラメータを比較する。動き補償パラメータの比較には、equalMotion関数を用いる。ここでequalMotion(A, B)は、入力された動き補償パラメータAとBとの同一性を判定する関数である(同図においては、“hasEqualMotion”と表記している)。動き補償パラメータが一致していたら、iの有効性フラグmotion_valid[i]を無効にする。
S4703:有効性フラグmotion_validがtrueのマージ候補motion_candをマージ候補リストに格納する。このマージ候補リストの再構成は、マージ候補motion_candの配列から構成されるマージ候補リストに番号が小さい順にコピーすることで行う。ここでcopy(A, B)はBをAにコピーする関数である。
S4704:有効性フラグmotion_validを再設定する。
S4705:有効なマージ候補数NumCandを更新する。
The unique candidate derivation unit 1212C updates the merge candidate list so that the merge candidates in the merge candidate list are unique to each other. When the merge candidates stored in the merge candidate list are from index 0 to index CANDX, a unique merge candidate list can be obtained by the steps shown in the pseudo code of FIG. The merge candidate list is managed using an array motion_cand [] that stores merge candidates. If the number of merge candidates is Numcand, CANDX = Numcand−1. Each step S of the pseudo code in FIG. 47 will be described below.
S4701: All validity flags from index 0 to index CANDX are initialized to be valid. Here, motion_valid [] is an array for storing the validity flag.
S4702: For loop variable i (i = 1 to CANDX), motion_cand [j of index j (0 <= j <i) having the same motion compensation parameter as i merge candidate motion_cand [i] is smaller than i. ], The validity flag motion_valid [i] of i is invalidated. In S4702-1, the motion compensation parameters of indexes i and j are compared. The equalMotion function is used to compare the motion compensation parameters. Here, equalMotion (A, B) is a function for determining the identity between the input motion compensation parameters A and B (in the figure, expressed as “hasEqualMotion”). If the motion compensation parameters match, the i validity flag motion_valid [i] is invalidated.
S4703: The merge candidate motion_cand whose validity flag motion_valid is true is stored in the merge candidate list. The merge candidate list is reconfigured by copying the merge candidate list in ascending order of numbers to a merge candidate list composed of an array of merge candidate motion_cands. Here, copy (A, B) is a function for copying B to A.
S4704: The validity flag motion_valid is reset.
S4705: The number of valid merge candidates NumCand is updated.
 図48は、結合双予測マージ候補導出部1212Dの動作を説明する図である。結合双予測マージ候補は、マージ候補リストに格納された2つの参照マージ候補を用いて、一方の参照マージ候補からリストL0の動き補償パラメータをコピーし、もう一方の参照マージ候補からリストL1の動き補償パラメータをコピーすることで導出される。図48の(c)は、抽出する2つの参照マージ候補リストを決定するためのテーブルである。導出する結合双予測マージ候補のインデックスをcombCandk で表現する。なお、combCandkは、既に導出されたマージ候補リストの最後のインデックスの値に1を加えた値を用いる。kは、0から開始するインデックスであり、結合双予測マージ候補をマージ候補リストに追加する際に1ずつインクリメントする。また、combIdxインデックスは、結合双予測マージ候補の導出の際に用いられる一時的なインデックスで0から11までの値を持つ。0から11までのcombIdxインデックスについて、2つのインデックスl0CandIdx及びl1CandIdxで示されるインデックスの参照マージ候補をマージ候補リストから選択する。ここでインデックスlXCandIdx(X=0もしくはX=1)のインデックスの候補を選択するとは、マージ候補リストに格納されたインデックス0~CANDXまでのマージ候補の内、インデックスlXCandIdxで示される候補を抽出することを言う。図48の(a)は、結合双予測マージ候補を導出するか否かを判定する判定式を示す。l0CandIdxで選択されたマージ候補のL0の動き補償パラメータpredFlagL0l0Cand、refIdxL0l0Cand、mvL0l0Candと、l1CandIdxで選択されたL1のマージ候補の動き補償パラメータpredFlagL1l1Cand、refIdxL1l1Cand、mvL1l1Candが図48(a)の判定式を全て満たす場合に、結合双予測マージ候補が導出される。図48の(b)は、インデックスcombCandkで示される結合双予測マージ候補の導出方法を示す図である。結合双予測マージ候補の動き補償パラメータrefIdxL0combCandk、refIdxL1combCandk、predFlagL0combCandk、predFlagL1combCandk、mvL0combCandk[0]、mvL0combCandk[1]、mvL1combCandk[0]、mvL1combCandk[1]を上記L0の動き補償パラメータと上記L1の動き補償パラメータをコピーすることにより導出する。導出された結合双予測マージ候補がマージ候補格納部1212Hのマージ候補リストに格納された全てのマージ候補と一致しない場合に、結合双予測マージ候補をマージ候補リストの最後に格納する。一致判定は既に説明した関数equalMotionを用いる。 FIG. 48 is a diagram for explaining the operation of the combined bi-predictive merge candidate derivation unit 1212D. The combined bi-predictive merge candidate uses the two reference merge candidates stored in the merge candidate list to copy the motion compensation parameter of the list L0 from one reference merge candidate and the motion of the list L1 from the other reference merge candidate Derived by copying the compensation parameters. FIG. 48C is a table for determining two reference merge candidate lists to be extracted. The index of the combined bi-predictive merge candidate to be derived is expressed by combCand k . Note that combCand k uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived. k is an index starting from 0, and is incremented by 1 when a combined bi-predictive merge candidate is added to the merge candidate list. The combIdx index is a temporary index used when deriving a combined bi-predictive merge candidate and has a value from 0 to 11. For the combIdx indexes from 0 to 11, the reference merge candidates of the indexes indicated by the two indexes l0CandIdx and l1CandIdx are selected from the merge candidate list. Here, selecting an index candidate of index lXCandIdx (X = 0 or X = 1) means extracting a candidate indicated by index lXCandIdx from the merge candidates from index 0 to CANDX stored in the merge candidate list. Say. FIG. 48A shows a determination formula for determining whether or not to derive a combined bi-predictive merge candidate. The merge candidate L0 motion compensation parameters predFlagL0l0Cand, refIdxL0l0Cand, mvL0l0Cand selected by l0CandIdx, and the L1 merge candidate motion compensation parameters predFlagL1l1Cand, refIdxL1l1Cand, and mvL1l1 that satisfy all of the mvL1l1 formula If so, a combined bi-predictive merge candidate is derived. FIG. 48B is a diagram illustrating a method for deriving the combined bi-predictive merge candidate indicated by the index combCand k . Motion compensation parameters RefIdxL0combCand k of coupling bi-predictive merge candidates, refIdxL1combCand k, predFlagL0combCand k, predFlagL1combCand k, mvL0combCand k [0], mvL0combCand k [1], mvL1combCand k [0], mvL1combCand k [1] the motion compensation of the L0 Derived by copying the parameter and the L1 motion compensation parameter. When the derived combined bi-predictive merge candidate does not match all merge candidates stored in the merge candidate list of the merge candidate storage unit 1212H, the combined bi-predictive merge candidate is stored at the end of the merge candidate list. For the coincidence determination, the function equalMotion described above is used.
 マージ候補数が、MRG_MAX_NUM_CANDS個に到達していれば、結合双予測マージ候補導出部1212Dの動作を終了する。到達していなければcombIdxを1だけインクリメントし、図48の(c)のテーブルを用いて2つの参照マージ候補を抽出し、マージ候補導出を継続する。全てのテーブルについて抽出した時点で、結合双予測マージ候補導出部1212Dの動作を終了する。 If the number of merge candidates has reached MRG_MAX_NUM_CANDS, the operation of the combined bi-predictive merge candidate derivation unit 1212D is terminated. If not reached, combIdx is incremented by 1, two reference merge candidates are extracted using the table of FIG. 48C, and merge candidate derivation is continued. When all the tables have been extracted, the operation of the combined bi-predictive merge candidate derivation unit 1212D is terminated.
 図49は、非スケール双予測マージ候補導出部1212Eの導出を説明する図である。図49の(a)は、非スケール双予測マージ候補を導出するか否かを判定する判定式を示す。図49の(b)は、インデックスnscaleCandlで示される非スケール双予測マージ候補の導出方法を示す図である。ここで、インデックスnscaleCandlは、既に導出されたマージ候補リストの最後のインデックスの値に1を加えた値を用いる。lは、0から開始するインデックスであり、非スケール双予測マージ候補をマージ候補リストに追加する際に1ずつインクリメントする。非スケール双予測マージ候補導出部1212Eは、既に導出されマージ候補格納部1212Hに格納されたマージ候補の動きベクトルを利用して、2つの参照ピクチャに対する動きベクトルが互いに反転する関係になるようなマージ候補を導出する。参照するマージ候補のインデックスをorigCandとして、図49の(a)の判定式を全て満たす場合に、図49の(b)に従い非スケール双予測マージ候補の導出が行われる。非スケール双予測マージ候補についても、関数equalMotionを用いて、導出された結合双予測マージ候補がマージ候補格納部1212Hのマージ候補リストに格納された全てのマージ候補と一致しない場合に、結合双予測マージ候補をマージ候補リストの最後に格納する。マージ候補数が、MRG_MAX_NUM_CANDS個に到達していれば動作を終了し、到達していなければ処理を繰り返す。 FIG. 49 is a diagram for explaining derivation of the non-scale bi-predictive merge candidate derivation unit 1212E. FIG. 49A shows a determination formula for determining whether to derive a non-scale bi-predictive merge candidate. FIG. 49B is a diagram illustrating a method for deriving a non-scale bi-predictive merge candidate indicated by an index nscaleCand l . Here, the index nscaleCand l uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived. l is an index starting from 0, and is incremented by 1 when a non-scale bi-predictive merge candidate is added to the merge candidate list. The non-scale bi-predictive merge candidate derivation unit 1212E uses the merge candidate motion vectors already derived and stored in the merge candidate storage unit 1212H so that the motion vectors for the two reference pictures are in a relationship of reversing each other. Derive candidates. When the index of the merge candidate to be referenced is origCand and all the determination formulas in FIG. 49A are satisfied, the non-scale bi-predictive merge candidate is derived according to FIG. 49B. Also for non-scale bi-predictive merge candidates, if the derived joint bi-predictive merge candidate is not matched with all the merge candidates stored in the merge candidate list of the merge candidate storage unit 1212H using the function equalMotion, the combined bi-prediction is performed. The merge candidate is stored at the end of the merge candidate list. If the number of merge candidates has reached MRG_MAX_NUM_CANDS, the operation is terminated, and if not, the process is repeated.
 図50は、ゼロベクトルマージ候補導出部1212Fの動作を示す図である。マージ候補格納部1212Hのマージ候補数が、MRG_MAX_NUM_CANDS個に到達していれば処理を行わない。到達していなければ、マージ候補数が、MRG_MAX_NUM_CANDS個に到達するまでゼロベクトルを格納する。すなわち、参照するマージ候補のインデックスをmvL0zeroCandmとして、L0の動きベクトル(mvL0zeroCandm[0]、mvL0zeroCandm[1])、L1の動きベクトル(mvL1zeroCandm[0]、mvL1zeroCandm[1])が共に0となるような候補を導出する。ここで、インデックスzeroCandmは、既に導出されたマージ候補リストの最後のインデックスの値に1を加えた値を用いる。mは、0から開始するインデックスであり、ゼロベクトル予測マージ候補をマージ候補リストに追加する際に1ずつインクリメントする。なお、ゼロベクトルマージ候補導出部1212Fにおいても、2つの参照ピクチャを用いるマージ候補、すなわちpredFlagL1=1、predFlagL1=1のマージ候補を導出することが可能であるが、マージPUの双予測制限を行う場合には、双予測制限を行う小サイズのPUにおいて、単予測のマージ候補のみを導出することとする。 FIG. 50 is a diagram illustrating the operation of the zero vector merge candidate derivation unit 1212F. If the number of merge candidates in the merge candidate storage unit 1212H has reached MRG_MAX_NUM_CANDS, no processing is performed. If not reached, zero vectors are stored until the number of merge candidates reaches MRG_MAX_NUM_CANDS. That is, the index of the merge candidate to be referenced is mvL0zeroCand m , and the L0 motion vectors (mvL0zeroCand m [0], mvL0zeroCand m [1]) and L1 motion vectors (mvL1zeroCand m [0], mvL1zeroCand m [1]) are both A candidate such as 0 is derived. Here, the index zeroCand m uses a value obtained by adding 1 to the value of the last index of the merge candidate list already derived. m is an index starting from 0, and is incremented by 1 when a zero vector prediction merge candidate is added to the merge candidate list. Note that the zero vector merge candidate derivation unit 1212F can also derive merge candidates using two reference pictures, that is, merge candidates with predFlagL1 = 1 and predFlagL1 = 1, but perform bi-prediction restriction on merge PUs. In this case, only a single prediction merge candidate is derived in a small size PU for which bi-prediction restriction is performed.
 マージ候補導出制御部1212Gは、図44のフローチャートで示した動作を行い、マージ候補を導出する。 The merge candidate derivation control unit 1212G performs the operation shown in the flowchart of FIG. 44 to derive merge candidates.
 マージ候補格納部1212Hは、導出したマージ候補を保存する。 The merge candidate storage unit 1212H stores the derived merge candidate.
 (基本動き補償パラメータ導出部1213の詳細)
 図54は、基本動き補償パラメータ導出部1213の構成を示すブロック図である。基本動き補償パラメータ導出部1213は、隣接動きベクトル候補導出部1213A、時間的動きベクトル候補導出部1213B、ゼロベクトルマージ候補導出部1213F、動きベクトル候補導出制御部1213G、動きベクトル候補格納部1213H、動きベクトル候補選択部1213I、動きベクトル復元部1213Jから構成される。なお、以下では、隣接動きベクトル候補導出部1213A、時間的動きベクトル候補導出部1213B、ゼロベクトルマージ候補導出部1213Fのことを、まとめて、動きベクトル/マージ候補導出手段と称する。
(Details of Basic Motion Compensation Parameter Deriving Unit 1213)
FIG. 54 is a block diagram showing the configuration of the basic motion compensation parameter derivation unit 1213. The basic motion compensation parameter derivation unit 1213 includes an adjacent motion vector candidate derivation unit 1213A, a temporal motion vector candidate derivation unit 1213B, a zero vector merge candidate derivation unit 1213F, a motion vector candidate derivation control unit 1213G, a motion vector candidate storage unit 1213H, A vector candidate selection unit 1213I and a motion vector restoration unit 1213J are included. Hereinafter, the adjacent motion vector candidate derivation unit 1213A, the temporal motion vector candidate derivation unit 1213B, and the zero vector merge candidate derivation unit 1213F are collectively referred to as motion vector / merge candidate derivation means.
 基本動き補償パラメータ導出部1213においては、動きベクトル候補導出制御部1213Gが、各動きベクトル/マージ候補導出手段を制御し、所定の数PMV_MAX_NUM_CANDSの予測動きベクトル候補を導出し動きベクトル候補格納部1213Hに格納する。ここで、予測動きベクトル候補は、動きベクトルmvL0とmvL1とから構成される。動きベクトル候補格納部1213Hには、上記動きパラメータの組が予測動きベクトル候補として格納される。格納する予測動きベクトル候補は格納順に順序づけられたリスト(予測動きベクトル候補リスト)として管理される。 In the basic motion compensation parameter derivation unit 1213, the motion vector candidate derivation control unit 1213G controls each motion vector / merge candidate derivation unit, derives a predetermined number of predicted motion vector candidates PMV_MAX_NUM_CANDS, and stores it in the motion vector candidate storage unit 1213H. Store. Here, the predicted motion vector candidate is composed of motion vectors mvL0 and mvL1. The motion vector candidate storage unit 1213H stores the set of motion parameters as a predicted motion vector candidate. The predicted motion vector candidates to be stored are managed as a list (predicted motion vector candidate list) ordered in the order of storage.
 隣接動きベクトル候補導出部1213Aは、隣接マージ候補導出部1212Aと同様に、隣接ブロックの動き補償パラメータを、コピーすることにより、各予測動きベクトル候補を導出する。 Similar to the adjacent merge candidate derivation unit 1212A, the adjacent motion vector candidate derivation unit 1213A derives each motion vector predictor candidate by copying the motion compensation parameter of the adjacent block.
 時間的動きベクトル候補導出部1213Bは、時間的マージ候補導出部1212Bと同様に、既に復号済みのピクチャの動き補償パラメータを、コピーすることにより、時間的予測動きベクトル候補を導出する。 Similar to the temporal merge candidate derivation unit 1212B, the temporal motion vector candidate derivation unit 1213B derives temporal prediction motion vector candidates by copying the motion compensation parameters of the already decoded pictures.
 ゼロベクトルマージ候補導出部1213Fは、ゼロベクトルを予測動きベクトル候補として導出する。 The zero vector merge candidate derivation unit 1213F derives a zero vector as a motion vector predictor candidate.
 動きベクトル候補導出制御部1213Gは、所定の数PMV_MAX_NUM_CANDSの予測動きベクトル候補が導出された時点で導出を終了する。また、内部のユニーク候補判定部1213Cを用いて、隣接動きベクトル候補導出部1213Aおよび時間的動きベクトル候補導出部1213Bから導出される予測動きベクトルが互いに一致しない(ユニークになる)ように、動きベクトル候補格納部1213Hに格納する。具体的には、動きベクトル候補導出制御部1213Gは、ユニーク候補判定部1213Cに2つの動きベクトルAと動きベクトルBとを入力し、動きベクトルAと動きベクトルとBが一致しているか否かを判定させる。ユニーク候補判定部1213Cは入力された2つの動きベクトルが互いに一致しているが否かを判定する。 The motion vector candidate derivation control unit 1213G ends the derivation when a predetermined number of predicted motion vector candidates PMV_MAX_NUM_CANDS are derived. Also, using the internal unique candidate determination unit 1213C, motion vectors are used so that the motion vector predictors derived from the adjacent motion vector candidate derivation unit 1213A and the temporal motion vector candidate derivation unit 1213B do not match each other (become unique). Store in the candidate storage unit 1213H. Specifically, the motion vector candidate derivation control unit 1213G inputs the two motion vectors A and B to the unique candidate determination unit 1213C, and determines whether the motion vector A and the motion vector B match. Let it be judged. The unique candidate determination unit 1213C determines whether or not the two input motion vectors match each other.
 (双予測制限PU判定部1218の詳細:双予測制限の判定方法)
 双予測制限PU判定部1218において、双予測制限を行うべき小サイズのPUであるか否かを判定する方法の好適な例を以下に説明する。なお、判定方法は以下の例に限定されるものではなく、PUサイズ情報として他のパラメータを用いることも可能である。
(Details of bi-prediction restriction PU determination unit 1218: bi-prediction restriction determination method)
A preferred example of a method for determining whether or not the bi-prediction restricted PU determination unit 1218 is a small-size PU that should be subjected to bi-prediction restriction will be described below. The determination method is not limited to the following example, and other parameters can be used as PU size information.
  (判定方法の例1)
 判定方法の例1では、PUサイズの判定に用いる閾値をTHとした場合に、THxTH未満のPUの場合に双予測制限を行う。この時の対象CUサイズ(ここではCU Width)とPU分割タイプを用いた判定式は以下の通りである。
(Example 1 of determination method)
In example 1 of the determination method, when the threshold used for PU size determination is TH, bi-prediction restriction is performed for a PU less than THxTH. The determination formula using the target CU size (here, CU Width) and the PU partition type at this time is as follows.
 DisableBiPred = ((CU Width == TH && PU分割タイプ != 2Nx2N) || CU Width < TH) ? true : false
 具体的には、
TH = 16の場合には、16x8、8x16、12x16、4x16、16x12、16x4、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
TH = 8の場合には、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
DisableBiPred = ((CU Width == TH && PU split type! = 2Nx2N) || CU Width <TH)? True: false
In particular,
In the case of TH = 16, bi-prediction restriction is performed in each PU of 16 × 8, 8 × 16, 12 × 16, 4 × 16, 16 × 12, 16 × 4, 8 × 8, 8 × 4, 4 × 8, and 4 × 4.
In the case of TH = 8, bi-prediction restriction is performed in each of 8x4, 4x8, and 4x4 PUs.
 なお、PUサイズの判定に用いるCUサイズとしてCU Widthの代わりに、CUサイズ(CU Width)の底を2とする対数log2CUSizeを用いても良い。この場合、16x8、8x16、12x16、4x16、16x12、16x4、8x8、8x4、4x8、4x4を双予測制限する場合の判定式は、以下になる。 A logarithm log2CUSize in which the base of the CU size (CU Width) is 2 may be used instead of CU Width as the CU size used for the PU size determination. In this case, the determination formula when the bi-prediction restriction is applied to 16 × 8, 8 × 16, 12 × 16, 4 × 16, 16 × 12, 16 × 4, 8 × 8, 8 × 4, 4 × 8, and 4 × 4 is as follows.
 DisableBiPred = ((log2CUSize == 4 && PU分割タイプ != 2Nx2N) || log2CUSize < 4) ? true : false
 また、8x4、4x8、4x4を双予測制限する場合の判定式は、以下になる。
DisableBiPred = ((log2CUSize == 4 && PU partition type! = 2Nx2N) || log2CUSize <4)? True: false
Also, the judgment formula when bi-prediction restriction is applied to 8x4, 4x8, and 4x4 is as follows.
 DisableBiPred = (log2CUSize == 3 && PU分割タイプ != 2Nx2N)
 なお、対象CUサイズとPU分割タイプ以外のパラメータを用いて判定を行うことも可能である。例えば、PU分割数NumPartを用いて以下のような判定も可能である。
DisableBiPred = (log2CUSize == 3 && PU partition type! = 2Nx2N)
It is also possible to perform determination using parameters other than the target CU size and the PU partition type. For example, the following determination is also possible using the PU division number NumPart.
 DisableBiPred = ((CU Width == TH && NumPart > 1) && CU Width < TH) ? true : false
  (判定方法の例2)
 判定方法の例2では、THxTH以下のPUにおいて双予測制限を行う。この時の判定式は以下の通りである。
DisableBiPred = ((CU Width == TH &&NumPart> 1) && CU Width <TH)? True: false
(Example 2 of determination method)
In the determination method example 2, bi-prediction restriction is performed on a PU of THxTH or less. The judgment formula at this time is as follows.
 DisableBiPred = ((CU Width == 2*TH && PU分割タイプ == NxN) || CU Width < 2*TH) ? true : false
具体的には、
TH = 16の場合には、16x16、16x8、8x16、12x16、4x16、16x12、16x4、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
TH = 8の場合には、8x8、8x4、4x8、4x4の各PUにおいて双予測制限が行われる。
TH = 4の場合には、4x4のPUにおいて双予測制限が行われる。
DisableBiPred = ((CU Width == 2 * TH && PU partition type == NxN) || CU Width <2 * TH)? True: false
In particular,
When TH = 16, bi-prediction restriction is performed in each of 16x16, 16x8, 8x16, 12x16, 4x16, 16x12, 16x4, 8x8, 8x4, 4x8, and 4x4 PUs.
In the case of TH = 8, bi-prediction restriction is performed in each of 8x8, 8x4, 4x8, and 4x4 PUs.
In the case of TH = 4, bi-prediction restriction is performed in a 4 × 4 PU.
 なお、PUサイズの判定にlog2CUSize を用いる場合、8x8、8x4、4x8、4x4を双予測制限する場合の判定式は、以下になる。 When log2CUSize is used for PU size determination, the determination formula when bi-prediction restriction is applied to 8x8, 8x4, 4x8, and 4x4 is as follows.
 DisableBiPred = ((log2CUSize == 4 && PU分割タイプ == NxN) || log2CUSize < 4) ? true : false
 4x4の判定式は、以下になる。
DisableBiPred = ((log2CUSize == 4 && PU partition type == NxN) || log2CUSize <4)? True: false
The 4x4 judgment formula is as follows.
 DisableBiPred = ((log2CUSize == 3 && PU分割タイプ == NxN)) ? true : false
 なお、PUの分割数NumPartを用いて以下のような判定も可能である。
DisableBiPred = ((log2CUSize == 3 && PU partition type == NxN))? True: false
The following determination can also be made using the PU division number NumPart.
 DisableBiPred = ((CU Width == 2*TH && NumPart != 4) || CU Width < 2*TH) ? true : false
 なお、上述の例においてスキップPU及びマージPUと、基本インターPUとで異なるPUサイズ(閾値TH)を用いても構わない。また、図34の(c)で既に示したように、判定に用いるPUサイズ(閾値TH)を符号化しても良い。
DisableBiPred = ((CU Width == 2 * TH && NumPart! = 4) || CU Width <2 * TH)? True: false
In the above example, different PU sizes (threshold values TH) may be used for the skip PU, the merge PU, and the basic inter PU. Further, as already shown in FIG. 34C, the PU size (threshold value TH) used for the determination may be encoded.
 (双単予測変換部1219の詳細)
 双単予測変換部1219は、入力された動き補償パラメータが双予測を示しており、さらに、双予測制限PU判定部においてスキップPU及びマージPUの双予測制限を行うと判定された場合において、双単予測変換部1219に入力される動き補償パラメータを単予測に変換する。
(Details of bi-predictive conversion unit 1219)
If the input motion compensation parameter indicates bi-prediction, and the bi-prediction conversion unit 1219 determines that the bi-prediction restriction of the skip PU and merge PU is to be performed by the bi-prediction restricted PU determination unit, the bi-prediction conversion unit 1219 The motion compensation parameter input to the single prediction conversion unit 1219 is converted into single prediction.
 なお、双単予測変換部1219は複数の双予測変換方法を切り替えることが可能であり、マージ候補導出部の指定する双予測変換方法を用いて双単予測変換を行っても構わない。また、双単予測変換部1219に、双単予測変換を行うか否かを入力し、それに合わせて切り替えを行っても構わない。 The bi-prediction conversion unit 1219 can switch between a plurality of bi-prediction conversion methods, and bi-prediction conversion may be performed using the bi-prediction conversion method specified by the merge candidate derivation unit. In addition, it may be input to the bi-predictive conversion unit 1219 whether or not bi-predictive conversion is performed, and switching may be performed accordingly.
 また、後述するように、双単予測変換部1219は、入力された動き補償パラメータが双予測の場合には、2つの動き補償パラメータを順次、出力しても良い。 Also, as will be described later, the bi-prediction conversion unit 1219 may sequentially output two motion compensation parameters when the input motion compensation parameter is bi-prediction.
 動き補償パラメータは、時間的及び空間的に近接するPUの動き補償パラメータのコピー、もしくは、時間的及び空間的に近接するPUの動き補償パラメータの組み合わせから導出される動き補償パラメータのインター予測フラグinter_pred_flagが双予測を示す2である場合には、単予測を示す1に変換する。また、内部の処理に用いるインター予測フラグ(内部インター予測フラグ)がL0予測を示す1、L1予測を示す2、双予測を示す3からなるフラグである場合には、以下の動作を行う。内部インター予測フラグが3である場合には、内部インター予測フラグの値がL0予測を意味する1、もしくは、L1予測を意味する2に変換する。また、L0予測に変換する場合にはL1予測に関する動き補償パラメータを例えばゼロにリフレッシュすることも可能である。L1予測に変換する場合には、L0予測に関する動き補償パラメータを例えばゼロにリフレッシュすることも可能である。なお、内部インター予測フラグと、予測リスト利用フラグpredFlagL0、predFlagL1の関係は以下のように相互に変換可能である。 The motion compensation parameter is an inter prediction flag inter_pred_flag of a motion compensation parameter derived from a copy of a motion compensation parameter of a temporally and spatially close PU or a combination of motion compensation parameters of a temporally and spatially close PU. Is 2 indicating bi-prediction, it is converted to 1 indicating uni-prediction. Further, when the inter prediction flag (internal inter prediction flag) used for the internal processing is a flag including 1 indicating L0 prediction, 2 indicating L1 prediction, and 3 indicating bi-prediction, the following operation is performed. When the internal inter prediction flag is 3, the value of the internal inter prediction flag is converted to 1 meaning L0 prediction or 2 meaning L1 prediction. In addition, when converting to L0 prediction, it is possible to refresh the motion compensation parameter related to L1 prediction to, for example, zero. In the case of conversion to L1 prediction, the motion compensation parameter related to L0 prediction can be refreshed to, for example, zero. Note that the relationship between the internal inter prediction flag and the prediction list use flags predFlagL0 and predFlagL1 can be mutually converted as follows.
 内部インター予測フラグ = (predFlagL1<<1) + predFlagL0
 predFlagL0 =内部インター予測フラグ & 1
 predFlagL1 =内部インター予測フラグ >> 1
 単予測に変換する方法としては、インター予測フラグ(及び内部インター予測フラグ)を変更する方法の他、予測リスト利用フラグpredFlagL0、predFlagL1の両者が利用するを示す値である1の場合に、予測リスト利用フラグの一方を使用しないことを示す値の0に変換すること、で行うこともできる。
Internal inter prediction flag = (predFlagL1 << 1) + predFlagL0
predFlagL0 = Internal inter prediction flag & 1
predFlagL1 = Internal inter prediction flag >> 1
As a method of converting to single prediction, in addition to the method of changing the inter prediction flag (and the internal inter prediction flag), in the case of 1 which is a value indicating that both of the prediction list use flags predFlagL0 and predFlagL1 are used, the prediction list This can also be done by converting one of the usage flags to 0, which indicates that one of the usage flags is not used.
 図51は、単予測への変換の方法(双予測変換方法)の例を説明する図である。L0選択は、予測リスト利用フラグpredFlagL1を0に変更する。L1選択は、予測リスト利用フラグpredFlagL0を0に変更する。参照インデックス番号選択は、参照インデックス番号refIdxL0、参照インデックス番号refIdxL1の内、値が大きい方のリストの予測リスト利用フラグを0に変更する。式としては、X = (ref_idx_L1 < ref_idx_L0) ? 0 : 1、predFlagLX = 0。これにより、参照インデックス番号が小さい方のリストが使用される。POC選択は、現ピクチャのPOC(POC_curr)と、参照インデックス番号refIdxL0で示される参照ピクチャのPOC(POC_L0)の差分と、現ピクチャのPOCと、参照インデックス番号refIdxL1で示される参照ピクチャのPOC(POC_L1)の絶対値差分との内、値が大きい方のリストの予測リスト利用フラグを0に変更する。X = (|POC_L1 ‐ POC_curr| < |POC_L0 ‐ POC_curr| ) ? 0 : 1、predFlagLX = 0。これにより現ピクチャに対してPOCが近い参照ピクチャが用いられる。 FIG. 51 is a diagram for explaining an example of a method of conversion to single prediction (bi-predictive conversion method). The L0 selection changes the prediction list use flag predFlagL1 to 0. L1 selection changes the prediction list use flag predFlagL0 to 0. In the reference index number selection, the prediction list use flag of the list having the larger value among the reference index number refIdxL0 and the reference index number refIdxL1 is changed to 0. As an expression, X = (ref_idx_L1 <ref_idx_L0)? 0: 1, predFlagLX = 0. Thereby, the list with the smaller reference index number is used. The POC selection includes the difference between the POC (POC_curr) of the current picture and the POC (POC_L0) of the reference picture indicated by the reference index number refIdxL0, the POC of the current picture, and the POC of the reference picture indicated by the reference index number refIdxL1 (POC_L1). ), The prediction list use flag of the list with the larger value is changed to 0. X = (| POC_L1 - POC_curr | <| POC_L0 - POC_curr |)? 0: 1, predFlagLX = 0. As a result, a reference picture having a POC close to that of the current picture is used.
 両選択は、L0の動き補償パラメータを用いる場合とL1の動き補償パラメータを用いる場合の両方を候補として用いる。すなわち、入力されたマージ候補が双予測の場合には、predFlagL1 = 0のようにL0を用いるように変更されたマージ候補と、predFlagL0 = 0のように変更されたマージ候補の2つを、入力元であるマージ候補導出部に出力する。 Both selections use both the case where the L0 motion compensation parameter is used and the case where the L1 motion compensation parameter is used as candidates. In other words, when the input merge candidate is bi-prediction, the merge candidate changed to use L0 such as predFlagL1 = 0 and the merge candidate changed so that predFlagL0 = 0 are input. Output to the original merge candidate derivation unit.
 発明者による実験では、PUサイズが8×4、4×8の場合に双予測を制限する場合で、双単予測変換にL1選択を行う方法において、符号化効率の低下がほぼゼロであることを確認している。この場合、双単予測変換は、以下のように表現できる。CUサイズlog2CUSizeが3、かつ、PU分割タイプPartModeが2N×2N以外の場合において、予測リスト利用フラグpredFlagL0と予測リスト利用フラグpredFlagL1の両者が1である場合には、予測リスト利用フラグpredFlagL0を0に設定する。 In the experiment by the inventor, the bi-prediction is limited when the PU size is 8 × 4 and 4 × 8, and the decrease in coding efficiency is almost zero in the method of performing L1 selection for the bi-predictive transformation. Have confirmed. In this case, the bi-predictive transformation can be expressed as follows. When the CU size log2CUSize is 3 and the PU partition type PartMode is other than 2N × 2N, the prediction list usage flag predFlagL0 is set to 0 when both the prediction list usage flag predFlagL0 and the prediction list usage flag predFlagL1 are 1. Set.
 一般に、動き補償パラメータの導出では、L0リストの参照ピクチャを優先することが多い。逆に、L0リストの参照ピクチャの代わりにL1リストの参照ピクチャを使用することによれば、これらのL0リストを優先する導出処理と差別化することができる。ある符号化パラメータにより複数の導出処理が選択可能な場合において、あるグループの導出処理をL0リスト優先、他のグループの導出処理をL1リスト優先とすると、各々の導出処理は互いに相補的に用いることができるため、より多くの動きの性質のシーケンスや領域において有効に作用する。そのため、双単予測変換においては、L1リストを用いることによって高い符号化効率を得ることができる。 Generally, in deriving motion compensation parameters, reference pictures in the L0 list are often given priority. Conversely, by using reference pictures in the L1 list instead of reference pictures in the L0 list, it is possible to differentiate from the derivation process that prioritizes these L0 lists. When a plurality of derivation processes can be selected according to a certain encoding parameter, assuming that a derivation process for a certain group is L0 list priority and a derivation process for other groups is L1 list priority, the respective derivation processes are used in a complementary manner. Therefore, it works effectively in sequences and areas with more motion properties. Therefore, in bi-predictive transformation, high encoding efficiency can be obtained by using the L1 list.
 図51の例以外の単予測への変換の方法の例をさらに説明する。双予測マージ候補毎に、双予測である(predFlagL0とpredFlagL1が共に1)である場合に、predFlagL1を0にする(L0リストを用いる)かを切り替えても良い。例えば、隣接マージ候補導出部1212Aでは、A1、B1、B0、A0、B2の順にマージ候補を導出するが、A1、B0、B2でpredFlagL1=0、B1、A0でpredFlagL1=1とする方法がある。この例では、マージ候補を導出する毎に、L0リストを用いる場合とL1リストを用いる場合を交互に選択する。また、この例では、左方向に隣接するブロックから算出されるマージ候補A0、A1および上方向に隣接するブロックから算出されるマージ候補B0、B1の各々に対して、一方についてL0リストを用いる場合とし、もう一方についてL1リストを用いる場合とする。このように、隣接マージ候補の一部をpredFlagL1=0、一部をpredFlagL0=0により、単予測に変換する場合には、各々の参照リストの動き補償パラメータをバランスよく使用することができるため、高い符号化効率が得られる。また、隣接方向が右方向(A0、A1)、上方向(B0、B1、B2)であるマージ候補は互いに異なる参照リストを選択するようにすることが好ましい。なお、どのマージ候補をpredFlagL1=0として、どのマージ候補をpredFlagL0=0とするかについては上記以外の方法でも良い。例えば、A1、B0、B2でpredFlagL1=1、B1、A0でpredFlagL1=0としても良い。また、導出する順番もしくはマージ候補リストに格納する場合のインデックス毎に、反対の参照リストを用いるようにしても良い。 An example of a method for conversion to single prediction other than the example of FIG. 51 will be further described. For each bi-prediction merge candidate, when bi-prediction (both predFlagL0 and predFlagL1 are 1), it may be switched whether predFlagL1 is set to 0 (L0 list is used). For example, the adjacent merge candidate derivation unit 1212A derives merge candidates in the order of A1, B1, B0, A0, and B2, but there is a method of setting predFlagL1 = 0 in A1, B0, and B2, and predFlagL1 = 1 in B1 and A0. . In this example, every time a merge candidate is derived, the case where the L0 list is used and the case where the L1 list is used are alternately selected. In this example, the L0 list is used for one of the merge candidates A0 and A1 calculated from the blocks adjacent in the left direction and the merge candidates B0 and B1 calculated from the blocks adjacent in the upward direction. Suppose that the L1 list is used for the other. In this way, when converting some of the adjacent merge candidates to uni-prediction with predFlagL1 = 0 and some with predFlagL0 = 0, the motion compensation parameters of each reference list can be used in a balanced manner. High encoding efficiency can be obtained. In addition, it is preferable to select different reference lists for merge candidates whose adjacent directions are the right direction (A0, A1) and the upward direction (B0, B1, B2). It should be noted that other merge methods may be used as to which merge candidate predFlagL1 = 0 and which merge candidate predFlagL0 = 0. For example, predFlagL1 = 1 may be set for A1, B0, and B2, and predFlagL1 = 0 may be set for B1 and A0. Also, the opposite reference list may be used for each index in the order of derivation or when storing in the merge candidate list.
 また、参照リストXの予測リスト利用フラグpredFlagLXを0にすることで、双単予測変換を行う場合に、参照インデックス番号refIdxLXの値を-1、動きベクトルmvL1の値を(0, 0)などの初期値にリフレッシュしないこととするが、リフレッシュすることも可能である。発明者による実験では、これらの値はリフレッシュを行わない方が高い符号化効率が得られることを確認している。リフレッシュしない場合においては、参照ピクチャリストの使用を制限した場合においても、後続の処理において、制限した方の、参照インデックス番号および動きベクトルの値を使用することができる。そのため、高い符号化効率が得られる。 In addition, when bipredictive conversion is performed by setting the prediction list use flag predFlagLX of the reference list X to 0, the value of the reference index number refIdxLX is set to -1, the value of the motion vector mvL1 is set to (0, 0), etc. The initial value is not refreshed, but it is also possible to refresh. Experiments by the inventor have confirmed that these values can achieve higher encoding efficiency without refreshing. In the case of not refreshing, even when the use of the reference picture list is restricted, the reference index number and the motion vector value of the restricted one can be used in the subsequent processing. Therefore, high encoding efficiency can be obtained.
 なお、双単予測変換部1219は、スキップ動き補償パラメータ導出部1211及びマージ動き補償パラメータ導出部1212の内部に備える手段として構成しても構わない。また、基本インターPUのみに双予測制限を行う場合には、双単予測変換部1219を備えない構成でも良い。 Note that the bi-prediction conversion unit 1219 may be configured as means included in the skip motion compensation parameter derivation unit 1211 and the merge motion compensation parameter derivation unit 1212. In addition, when bi-prediction restriction is performed only on the basic inter PU, a configuration without the bi-uni prediction conversion unit 1219 may be used.
 (双予測制限における動き情報復号部1021)
 図30は、動き情報復号部1021の構成を示すブロック図である。動き情報復号部1021は少なくともインター予測フラグ復号部1028を備える。動き情報復号部1021では、特に、インター予測フラグを復号する場合のPUである基本インターPUの双予測制限を行う。インター予測フラグ復号部1028は、上述の双予測制限PU判定部1218で、基本インターPUの双予測制限を行うか否かに応じて、インター予測フラグの復号を行うか否かを変更する。
(Motion information decoding unit 1021 in bi-prediction restriction)
FIG. 30 is a block diagram illustrating a configuration of the motion information decoding unit 1021. The motion information decoding unit 1021 includes at least an inter prediction flag decoding unit 1028. In particular, the motion information decoding unit 1021 performs bi-prediction restriction on a basic inter PU that is a PU when decoding an inter prediction flag. The inter prediction flag decoding unit 1028 changes whether or not to decode the inter prediction flag depending on whether or not the bi-prediction restricted PU determination unit 1218 described above performs bi-prediction restriction on the basic inter PU.
 なお、マージの利用を制限する場合のように、スキップPUでインター予測フラグを復号する場合には、スキップPUの双予測制限を行う。 Note that when the inter prediction flag is decoded with the skip PU as in the case where the use of the merge is restricted, the bi-prediction restriction of the skip PU is performed.
  (インター予測フラグ復号部1028)
 図39は、CABACの場合のインター予測フラグ復号部1028の動作を示すフロー図である。インター予測フラグ復号部1028は、スライスがBスライスの場合(S131でYES)には、S132に遷移する。それ以外では(S131でNO)、インター予測フラグinter_pred_flagを復号せずに終了する。PUサイズが小PUサイズの場合(DisableBiPred = trueの場合)には(S132でYES)、インター予測フラグinter_pred_flagを復号せずに終了する。それ以外の場合には(S132でNO)、インター予測フラグinter_pred_flagを復号する(S133)。
(Inter prediction flag decoding unit 1028)
FIG. 39 is a flowchart showing the operation of the inter prediction flag decoding unit 1028 in the case of CABAC. When the slice is a B slice (YES in S131), the inter prediction flag decoding unit 1028 proceeds to S132. Otherwise (NO in S131), the process ends without decoding the inter prediction flag inter_pred_flag. When the PU size is a small PU size (when DisableBiPred = true) (YES in S132), the process ends without decoding the inter prediction flag inter_pred_flag. In other cases (NO in S132), the inter prediction flag inter_pred_flag is decoded (S133).
 図40は、CAVLCの場合のインター予測フラグ復号部1028の動作を示すフロー図である。インター予測フラグ復号部1028は、スライスがBスライスの場合(S141でYES)には、S142に遷移する。それ以外では(S141でNO)、インター予測フラグinter_pred_flagを復号せずに終了する。PUサイズが小PUサイズ以外の場合(DisableBiPred != trueの場合)には(S142でNO)、S143、S144、145により、結合インター予測参照インデックスcombined_inter_pred_ref_idxを復号する。PUサイズが小PUサイズの場合には(S142でYES)、S146、S147、S148により、結合インター予測参照インデックスcombined_inter_pred_ref_idxを復号する。 FIG. 40 is a flowchart showing the operation of the inter prediction flag decoding unit 1028 in the case of CAVLC. If the slice is a B slice (YES in S141), the inter prediction flag decoding unit 1028 proceeds to S142. Otherwise (NO in S141), the process ends without decoding the inter prediction flag inter_pred_flag. When the PU size is other than the small PU size (when DisableBiPred! = True) (NO in S142), the combined inter prediction reference index combined_inter_pred_ref_idx is decoded through S143, S144, and 145. When the PU size is a small PU size (YES in S142), the combined inter prediction reference index combined_inter_pred_ref_idx is decoded through S146, S147, and S148.
 S143およびS146では、最大値MaxPredRefを算出する。最大値MaxPredRefは、図37の(d)のテーブルTBL37および擬似コードCODE37に示す通りである。具体的には、小サイズPU以外の場合、すなわち、双予測制限なしの場合(DisableBiPred != true)の最大値MaxPredRefは、NumPredRefLC+NumPredRefL0*NumPredRefL1もしくは、NumPredRefL0+NumPredRefL0*NumPredRefL1、すなわち、単予測の結合参照ピクチャセットの数(NumPredRefLC、もしくはNumPredRefL0)と双予測の結合参照ピクチャセットの数(NumPredRefL0*NumPredRefL1)の和で算出する(S143)。双予測制限ありの場合(DisableBiPred = true)の最大値MaxPredRefは、NumPredRefLCもしくは、NumPredRefL0、すなわち、単予測の結合参照ピクチャセットの数(NumPredRefLC、もしくはNumPredRefL0)で算出し、双予測の結合参照ピクチャセットを含まない(S146)。これにより、無駄な符号を排除することができる。なお、num_ref_idx_lc_active_minus1は、参照リストLCで管理される参照リスト番号の数(参照リストLCのサイズ)から1を引いた数である。num_ref_idx_lc_active_minus1が0より大きいことは、参照リストLCが用いられることを示す。同様に、num_ref_idx_l0_active_minus1は参照リストL0で管理される参照リスト番号の数(参照リストL0のサイズ)から1を引いた数であり、参照リストL0が用いられることを示す。同様に、num_ref_idx_l1_active_minus1は参照リストL1で管理される参照リスト番号の数(参照リストL1のサイズ)から1を引いた数である。なお、単予測の結合参照ピクチャセットの数は、以下の式のように、参照リストのサイズを最大値(参照リストLCは4、それ以外の参照リストは2)でクリップした数として定められる。
NumPredRefLC = Min(°4,°num_ref_idx_lc_active_minus1°+°1°)
NumPredRefL0 = Min(°2,°num_ref_idx_l0_active_minus1°+°1°)
NumPredRefL1 = Min(°2,°num_ref_idx_l1_active_minus1°+°1°)
 S144、S147における、combined_inter_pred_ref_idxの復号では、最大値をMaxPredRefとするunary codeで符号化されたcodeNumを復号する。S145、S148において、codeNumはcombined_inter_pred_ref_idxに変換される。小サイズPU以外の場合には、逆変換可変テーブルDecTableによってcombined_inter_pred_ref_idxに変換する。すなわち、combined_inter_pred_ref_idx = DecTable[codeNum]である(S145)。小サイズPUの場合には、codeNumをcombined_inter_pred_ref_idxの値としてそのまま用いる。すなわち、combined_inter_pred_ref_idx = codeNumである(S148)。そして、combined_inter_pred_ref_idxが最大値MaxPredRefに一致するか否かを判定する(S149)。一致する場合で(S149でYES)、さらに、小サイズPU以外の場合には、inter_pred_flagを復号する(S150)。この動作は、図36に示すシンタックステーブルの復号に対応する。
In S143 and S146, the maximum value MaxPredRef is calculated. The maximum value MaxPredRef is as shown in the table TBL37 and the pseudo code CODE37 in FIG. Specifically, the maximum value MaxPredRef for non-small PUs, that is, when there is no bi-prediction restriction (DisableBiPred! = True) is NumPredRefLC + NumPredRefL0 * NumPredRefL0 + NumPredRefL0 + NumPredRefL0 * NumPredRefL1, that is, combined reference picture set for single prediction (NumPredRefLC or NumPredRefL0) and the number of bi-predicted combined reference picture sets (NumPredRefL0 * NumPredRefL1) (S143). The maximum value MaxPredRef with bi-prediction restriction (DisableBiPred = true) is calculated by NumPredRefLC or NumPredRefL0, that is, the number of combined reference picture sets for single prediction (NumPredRefLC or NumPredRefL0), and combined reference picture set for bi-prediction Is not included (S146). Thereby, useless codes can be eliminated. Note that num_ref_idx_lc_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers managed by the reference list LC (size of the reference list LC). When num_ref_idx_lc_active_minus1 is greater than 0, it indicates that the reference list LC is used. Similarly, num_ref_idx_l0_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers managed in the reference list L0 (size of the reference list L0), and indicates that the reference list L0 is used. Similarly, num_ref_idx_l1_active_minus1 is a number obtained by subtracting 1 from the number of reference list numbers (size of the reference list L1) managed in the reference list L1. The number of combined reference picture sets for uni-prediction is determined as the number of clipped reference list sizes with the maximum value (4 for the reference list LC and 2 for the other reference lists) as in the following equation.
NumPredRefLC = Min (° 4, ° num_ref_idx_lc_active_minus1 ° + ° 1 °)
NumPredRefL0 = Min (° 2, ° num_ref_idx_l0_active_minus1 ° + ° 1 °)
NumPredRefL1 = Min (° 2, ° num_ref_idx_l1_active_minus1 ° + ° 1 °)
In decoding of combined_inter_pred_ref_idx in S144 and S147, codeNum encoded with unary code having the maximum value as MaxPredRef is decoded. In S145 and S148, codeNum is converted into combined_inter_pred_ref_idx. In the case of other than the small size PU, it is converted into combined_inter_pred_ref_idx by the reverse conversion variable table DecTable. That is, combined_inter_pred_ref_idx = DecTable [codeNum] (S145). In the case of a small size PU, codeNum is used as it is as the value of combined_inter_pred_ref_idx. That is, combined_inter_pred_ref_idx = codeNum (S148). Then, it is determined whether combined_inter_pred_ref_idx matches the maximum value MaxPredRef (S149). If they match (YES in S149), and if the size is not a small size PU, inter_pred_flag is decoded (S150). This operation corresponds to the decoding of the syntax table shown in FIG.
 上記の例では、小サイズPUでは逆変換可変テーブルを用いないことで簡易な復号を行っているが、上記S148のステップを図41の擬似コードで示す処理に置き換えることにより、逆変換可変テーブルを用いたcombined_inter_pred_ref_idxの復号も可能である。逆変換可変テーブル及び変換可変テーブルは、双予測制限を用いる場合と用いない場合とで同一のテーブルを用いる。双予測テーブルを用いない場合には、テーブルのエントリの内、双予測に対応するエントリは無効である。そのため、無効なエントリをスキップする処理が必要になる。具体的には復号部では、コード番号を復号した後、逆変換可変テーブルDecTableのエントリを発生確率の高い順、すなわち、番号が小さい方から大きい方にむけて順にスキャンする。エントリの内容が双予測である、すなわち、2つの予測リストを用いる場合には無効であるのでスキップし、有効である場合のみをカウントする。このカウント値が復号したコード番号に一致する場合に、このカウント値のエントリのパラメータを復号すべきcombined_inter_pred_ref_idxの値とする。また、逆変換可変テーブルDecTableの更新は、無効なカウントを含めたカウント値をコード番号とみなして行われる。具体的には図41の動作を行う。図41は、逆変換可変テーブルを用いる場合のcombined_inter_pred_ref_idxの復号処理を示す擬似コードである。以下に、図41に示す擬似コードの各ステップSについて説明する。なお、図41では、コーディングスタイルの都合により、最大値MaxPredRefを、uiMaxValと表記している。また、NumPredRefLC、NumPredRefL0、および、NumPredRefL1は、それぞれ、uiValNumRefIdx0fLC、uiValNumRefIdx0fL0、および、uiValNumRefIdx0fL1と表記している。
S501:最大値MaxPredRefを得る。
S502:双予測制限を行う場合の最大値MaxPredRefとuiBipredValを得る。
S503:最大値MaxPredRefを引数としてunary復号処理xReadUnaryMaxSymbolを呼び出すことにより、コード番号tmpを得る。
S504:逆変換可変テーブルm_uiMITableDを用いてコード番号tmpからcombined_inter_pred_ref_idxを得る。双予測制限を行わない場合はこの値が最終的なcombined_inter_pred_ref_idxの値である。
S505:双予測制限を行う場合においてコード番号からcombined_inter_pred_ref_idxを得る処理に入る分岐である。
S506:後に、S509での判定に用いるため、双予測制限を行わない場合の最大値MaxPredRefを得る。
S507:仮のコード番号tmp2をループ変数として0から最大値MaxPredRefまで処理を行う。第2の仮のコード番号cxは0に処理化しておく。
S508:仮のコード番号tmp2を逆変換可変テーブルで変換して得られる仮のcombined_inter_pred_ref_idxの値xを得る。
S509:仮のcombined_inter_pred_ref_idxの値xが、有効範囲であるか否かを判定する。有効であるのは、双予測制限を行う場合の最大値uiBipredValを超えない場合と、双予測制限を行わない場合の最大値MaxPredRefである場合である。
S510:第2の仮のコード番号cxが、復号したコード番号tmpに一致する場合にループを終了する。ループを終了する時点の仮のコード番号tmp2は、双予測制限を行わない場合のコード番号に対応する。よって、コード番号tmpに代入する。
S511:第2の仮のコード番号cxをインクリメントする。
S512:ループを終了した時点の仮のcombined_inter_pred_ref_idxの値xをcombined_inter_pred_ref_idxの復号値として得る。
S513:双予測制限を行わない場合のコード番号tmpを用いて、逆変換可変テーブルを更新する処理adaptCodewordを呼び出す。
In the above example, simple decoding is performed by not using the inverse transformation variable table in the small size PU. However, by replacing the step of S148 with the process shown by the pseudo code in FIG. The combined_inter_pred_ref_idx used can also be decoded. The reverse conversion variable table and the conversion variable table use the same table when the bi-prediction restriction is used and when it is not used. When the bi-prediction table is not used, the entry corresponding to the bi-prediction is invalid among the table entries. Therefore, it is necessary to skip invalid entries. Specifically, after decoding the code number, the decoding unit scans the entries in the inverse conversion variable table DecTable in descending order of occurrence probability, that is, in order from the smallest number to the largest. Since the entry content is bi-predicted, that is, when two prediction lists are used, it is invalid and is skipped, and only the case where it is valid is counted. If this count value matches the decoded code number, the parameter of this count value entry is set to the value of combined_inter_pred_ref_idx to be decoded. Further, the reverse conversion variable table DecTable is updated by regarding the count value including the invalid count as the code number. Specifically, the operation of FIG. 41 is performed. FIG. 41 is a pseudo code illustrating a decoding process of combined_inter_pred_ref_idx when the inverse transformation variable table is used. Hereinafter, each step S of the pseudo code illustrated in FIG. 41 will be described. In FIG. 41, the maximum value MaxPredRef is represented as uiMaxVal for convenience of coding style. NumPredRefLC, NumPredRefL0, and NumPredRefL1 are written as uiValNumRefIdx0fLC, uiValNumRefIdx0fL0, and uiValNumRefIdx0fL1, respectively.
S501: A maximum value MaxPredRef is obtained.
S502: The maximum values MaxPredRef and uiBipredVal for bi-prediction restriction are obtained.
S503: The code number tmp is obtained by calling the unary decoding process xReadUnaryMaxSymbol with the maximum value MaxPredRef as an argument.
S504: Combined_inter_pred_ref_idx is obtained from the code number tmp using the reverse conversion variable table m_uiMITableD. When bi-prediction restriction is not performed, this value is the final combined_inter_pred_ref_idx value.
S505: This is a branch for entering the process of obtaining combined_inter_pred_ref_idx from the code number when bi-prediction restriction is performed.
S506: A maximum value MaxPredRef when bi-prediction restriction is not performed is obtained for later use in the determination in S509.
S507: Processing is performed from 0 to the maximum value MaxPredRef using the temporary code number tmp2 as a loop variable. The second temporary code number cx is processed into 0.
S508: A temporary combined_inter_pred_ref_idx value x obtained by converting the temporary code number tmp2 with the inverse conversion variable table is obtained.
S509: It is determined whether or not the value x of the temporary combined_inter_pred_ref_idx is within the valid range. The cases where the maximum value uiBipredVal when the bi-prediction restriction is performed are not exceeded and the maximum value MaxPredRef when the bi-prediction restriction is not performed are valid.
S510: When the second temporary code number cx matches the decoded code number tmp, the loop is terminated. The temporary code number tmp2 at the time of ending the loop corresponds to the code number when bi-prediction restriction is not performed. Therefore, it is assigned to the code number tmp.
S511: The second temporary code number cx is incremented.
S512: The provisional combined_inter_pred_ref_idx value x at the end of the loop is obtained as the decoded value of combined_inter_pred_ref_idx.
S513: The process adaptCodeword for updating the inverse transformation variable table is called using the code number tmp when the bi-prediction restriction is not performed.
 なお、図42は、可変テーブルを用いる場合のcombined_inter_pred_ref_idxの符号化処理を示す擬似コードである。 FIG. 42 is a pseudo code showing the encoding process of combined_inter_pred_ref_idx when a variable table is used.
 以上、小PUサイズの処理量削減方法として、基本インターPUの双予測制限(インター予測フラグ、結合インター予測参照インデックスの復号方法の変更)、マージPUの双予測制限(マージ候補導出における双単予測変換)、双予測マージ候補算出のスキップ を説明したが、これら制限を単独で用いる、もしくは、これら制限を行うPUサイズを各々異なる値としても良い。図52、図53は、双予測の処理量低減の例を示すものである。なお、図中の○はその処理を行うことを示し、図中の×はその処理を行わないことを示す。 As described above, as a method of reducing the processing amount of the small PU size, bi-prediction restriction of basic inter PU (change of decoding method of inter prediction flag and joint inter prediction reference index), bi-prediction restriction of merge PU (bi-prediction in merge candidate derivation) (Conversion), skip prediction of bi-predictive merge candidate calculation has been described, but these limitations may be used alone, or PU sizes for performing these limitations may be different values. 52 and 53 show an example of bi-prediction processing amount reduction. In the figure, ◯ indicates that the process is performed, and x in the figure indicates that the process is not performed.
 図52の(a)は、4x4、4x8、4x8のサイズのPUに対して、一様に、基本インターPUの双予測制限、マージPUの双予測制限、双予測マージ候補導出のスキップを適用する例である。図52の(b)、(c)は、マージPUの双予測制限、双予測マージ候補導出のスキップは行わず基本インターPUにのみ双予測制限を行う例である。一般にマージPUの双予測制限を行うと符号化効率の低下が生じる場合があるため、基本インターPUにのみ双予測制限を行う例は適当である。 52A applies the basic inter-PU bi-prediction restriction, the merge PU bi-prediction restriction, and the bi-prediction merge candidate derivation skip uniformly to PUs of 4 × 4, 4 × 8, and 4 × 8 sizes. It is an example. (B) and (c) of FIG. 52 are examples in which bi-prediction restriction of merge PUs and bi-prediction merge candidate derivation skipping are not performed and bi-prediction restriction is performed only on basic inter PUs. In general, when the bi-prediction restriction of the merge PU is performed, there is a case where the encoding efficiency is lowered. Therefore, an example in which the bi-prediction restriction is applied only to the basic inter PU is appropriate.
 図52の(d)は、4x4、4x8、4x8のサイズのPUに対して、一様に、基本インターPUの双予測制限、8x8のサイズのPUに対してマージPUの双予測制限、双予測マージ候補導出のスキップを適用する例である。基本インターPUの双予測制限に比べ、マージPUの双予測制限を緩くすることは符号化効率上適当である。 FIG. 52 (d) shows a bi-prediction restriction for a basic inter PU uniformly for a PU of size 4x4, 4x8, 4x8, a bi-prediction restriction for a merge PU for a PU of size 8x8, and bi-prediction. It is an example which applies the skip of merge candidate derivation. It is appropriate in terms of coding efficiency to loosen the bi-prediction restriction of the merge PU compared to the bi-prediction restriction of the basic inter PU.
 図53の(a)は、4x4、4x8、4x8、8x8に対して、基本インターPUの双予測制限と双予測マージ候補導出のスキップを適用する例である。マージPUの双予測制限は行わないが、マージPUの動き補償パラメータとして用いられるマージ候補導出を簡略化することにより、マージPUにおける双予測関連の処理量を低下させることができる。図53の(b)は、4x4、4x8、4x8、8x8に対して、双予測マージ候補導出のスキップを適用する例である。このように、双予測マージ候補導出のスキップを単独で用いることもできる。 53A is an example in which bi-prediction restriction of basic inter PU and bi-prediction merge candidate derivation skip are applied to 4x4, 4x8, 4x8, and 8x8. Although the bi-prediction restriction of the merge PU is not performed, the processing amount related to the bi-prediction in the merge PU can be reduced by simplifying the merge candidate derivation used as the motion compensation parameter of the merge PU. FIG. 53 (b) is an example in which the bi-predictive merge candidate derivation skip is applied to 4x4, 4x8, 4x8, and 8x8. Thus, the bi-predictive merge candidate derivation skip can be used alone.
 このような場合の実現には、判定方法を別のフラグで管理すればよい。例えば、各用予測制限を行うことを示すフラグDisableBiPredFlag、DisableBiPredMerge、DisableBiPredMergeDeriveを設け、以下に示す動作によりこれらが可能である。 In order to realize such a case, the determination method may be managed with another flag. For example, flags DisableBiPredFlag, DisableBiPredMerge, and DisableBiPredMergeDerive indicating that prediction restrictions for each are performed are provided, and these can be performed by the following operations.
 例えば、双予測制限PU判定部1218では、3つのフラグDisableBiPredFlag、DisableBiPredMerge、DisableBiPredMergeDeriveを各々導出する。図52の(d)に示す例であれば、以下で導出できる。 For example, the bi-prediction restricted PU determination unit 1218 derives three flags DisableBiPredFlag, DisableBiPredMerge, and DisableBiPredMergeDerive, respectively. The example shown in FIG. 52D can be derived as follows.
 DisableBiPredFlag = (log2CUSize == 3 && PU分割タイプ != 2Nx2N) ? true : false
 DisableBiPredMerge、DisableBiPredMergeDerive =((log2CUSize == 4 && PU分割タイプ == NxN) || log2CUSize < 4) ? true : false
 インター予測フラグ復号部1028では、DisableBiPredFlagが真の場合に、インター予測フラグ、結合インター予測参照インデックスの復号方法の変更を行う。
DisableBiPredFlag = (log2CUSize == 3 && PU partition type! = 2Nx2N)? True: false
DisableBiPredMerge, DisableBiPredMergeDerive = ((log2CUSize == 4 && PU partition type == NxN) || log2CUSize <4)? True: false
The inter prediction flag decoding unit 1028 changes the decoding method of the inter prediction flag and the combined inter prediction reference index when DisableBiPredFlag is true.
 マージ動き補償パラメータ導出部1212では、DisableBiPredMergeが真の場合に、マージ候補導出において、双単予測変換部 1219を用いて双単予測変換を行う。 The merge motion compensation parameter derivation unit 1212 performs bi-prediction conversion using the bi-prediction conversion unit 1219 in merging candidate derivation when DisableBiPredMerge is true.
 マージ動き補償パラメータ導出部1212では、DisableBiPredMergeDeriveが真の場合に、マージ候補導出において、双予測マージ候補導出のスキップを行う。 The merge motion compensation parameter derivation unit 1212 skips the bi-predictive merge candidate derivation in the merge candidate derivation when DisableBiPredMergeDerive is true.
 動き補償パラメータ導出部121が、小PUサイズ123Aを参照して双予測制限を行うことによる作用・効果は以下のとおりである。双予測は、単予測よりも処理量が大きく、また小サイズのPUは、大サイズのPUに比べて単位面積あたりの処理量が大きい。従って、小サイズのPUにおける双予測は、処理のボトルネックとなりかねない。このため、小サイズのPUでは、双予測を抑制することで、処理量が過度に増大することを抑えることができる。とくに、最も小さいサイズのPUを処理するような最悪ケースの処理量を抑制することができる。 Actions and effects obtained when the motion compensation parameter deriving unit 121 performs bi-prediction restriction with reference to the small PU size 123A are as follows. Bi-prediction has a larger processing amount than single prediction, and a small PU has a larger processing amount per unit area than a large PU. Therefore, bi-prediction in a small PU can be a processing bottleneck. For this reason, in small PU, it can suppress that processing amount increases excessively by suppressing bi-prediction. In particular, the worst-case processing amount for processing the smallest size PU can be suppressed.
 なお、インター予測フラグについて補足しておくと次のとおりである。非特許文献1では、インター予測フラグ(inter_pred_flag)は、基本的には、双予測か単予測かを選択するフラグとなっている。しかし、コンバインドリストを使用せず、後方予測禁止フラグが禁止でない場合には、単予測に用いる参照フレームリストとしてL0、L1のいずれかを選択するためのフラグをinter_pred_flagにより送信する場合もある。 Note that the inter prediction flag is supplemented as follows. In Non-Patent Document 1, the inter prediction flag (inter_pred_flag) is basically a flag for selecting bi-prediction or uni-prediction. However, when the combined list is not used and the backward prediction prohibition flag is not prohibited, a flag for selecting either L0 or L1 may be transmitted by inter_pred_flag as a reference frame list used for single prediction.
  [作用・効果]
 本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、上記画面間予測が適用される、所定サイズ以下のサイズの予測単位である対象予測単位について、双予測を行うことを制限する双予測制限手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention provides an image in a prediction unit between any one of screens of uni-prediction that refers to one reference image and bi-prediction that refers to two reference images. In an image decoding apparatus that restores using a prediction prediction method, bi-prediction restriction means is provided for restricting bi-prediction for a target prediction unit that is a prediction unit having a size of a predetermined size or less to which the inter-screen prediction is applied. It is a configuration.
 上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができるという効果を奏する。 By performing the above restriction, there is an effect that it is possible to reduce the amount of processing that becomes a bottleneck of decoding processing.
  [2-3-2]双予測の制限を行うサイズの決定
 以下では、図58~図70を用いて、双予測の制限を行うサイズを決定するための構成について開示する。
[2-3-2] Determination of Size for Limiting Bi-Prediction Hereinafter, a configuration for determining the size for limiting bi-prediction will be disclosed using FIGS. 58 to 70. FIG.
   (レベル規制)
 まず、図58および図59を用いて、H.264/AVCにおけるレベル規制(level limit)について説明する。図58および図59は、H.264/AVCにおけるレベル規制を定義するテーブルである。
(Level regulation)
First, referring to FIG. 58 and FIG. A level limit in H.264 / AVC will be described. 58 and FIG. 2 is a table that defines level restrictions in H.264 / AVC.
 図58を参照しながら、レベル規制について説明する。レベル規制におけるレベルとは、デコーダの性能や、ビット・ストリームの複雑さを規定するものである。 The level restriction will be described with reference to FIG. The level in the level regulation defines the performance of the decoder and the complexity of the bit stream.
 レベルは、整数部と、非整数部とにより指定される。整数部のレベルは、主として、取り扱う画像の解像度に応じた大まかな区分を表している。図58に示すように、整数には、1~5までの数が指定される。レベル1、レベル2、およびレベル3は、それぞれQICF、CIF、SDTV(標準テレビ)の解像度に対応している。 The level is specified by an integer part and a non-integer part. The level of the integer part mainly represents a rough division according to the resolution of the image to be handled. As shown in FIG. 58, a number from 1 to 5 is designated as the integer. Level 1, level 2, and level 3 correspond to the resolutions of QICF, CIF, and SDTV (standard television), respectively.
 また、レベル4は、HDTV(高精細テレビ)の解像度に対応している。そして、レベル5は、スーパーHDTVの解像度への対応している。 Level 4 corresponds to the resolution of HDTV (high definition television). Level 5 corresponds to Super HDTV resolution.
 また、図58に示すように、各整数レベルでは、さらに、非整数部によって、中間レベルが指定される場合がある(COL581で示す“Level number”の項目を参照)。 Further, as shown in FIG. 58, in each integer level, an intermediate level may be further specified by a non-integer part (see the item “LevelLnumber” indicated by COL581).
 これらのレベル指定に対し、デコーダの性能や、ビット・ストリームの複雑さを表すパラメータが定義される。 ∙ For these level specifications, parameters representing decoder performance and bit stream complexity are defined.
 図58に示す表に規定されるパラメータは、Level number(COL581)から、表中、右側に向けて順に、MaxMBPS、MaxFS、MaxDPB、MaxBR、MaxCPB、MaxVmvR、MinCR、MaxMvsPer2Mbである。 58. The parameters defined in the table shown in FIG. 58 are MaxMBPS, MaxFS, MaxDPB, MaxBR, MaxCPB, MaxVmvR, MinCR, MaxMvsPer2Mb in order from the Level number (COL581) to the right side in the table.
 ここで、参照番号COL582で示すMaxFSについて、説明すると次のとおりである。MaxFSは、最大のフレーム・サイズを、マクロブロックの数(MBs)で規定するものである。 Here, MaxFS indicated by the reference number COL582 will be described as follows. MaxFS defines the maximum frame size by the number of macroblocks (MBs).
 例えば、レベル2.2および3では、MaxFS=1620である。また、レベル3.1では、MaxFS=3600であり、レベル3.2では、MaxFS=5120である。 For example, at levels 2.2 and 3, MaxFS = 1620. Further, at level 3.1, MaxFS = 3600, and at level 3.2, MaxFS = 5120.
 画面サイズには、480p、720p、1080p、4kなどがあるが、これらの画面サイズが、どのレベルで処理可能かは、MaxFSにより定まる。 There are 480p, 720p, 1080p, 4k, etc. as screen sizes, and MaxFS determines which level these screen sizes can be processed.
 1つのマクロブロックは、16×16=256画素から構成される。よって、例えば、480p(720×480)に含まれるマクロブロックの数は、720×480/256=1350(MBs)である。上述のとおりレベル2.2では、MaxFS=1620であるので、480pを処理することが可能である。 One macro block is composed of 16 × 16 = 256 pixels. Therefore, for example, the number of macroblocks included in 480p (720 × 480) is 720 × 480/256 = 1350 (MBs). As described above, at level 2.2, since MaxFS = 1620, 480p can be processed.
 また、例えば、720p(1280×720)については、1フレームあたり1280×720/256=3600(MBs)のマクロブロックを処理できればよい。よって、レベル3.1および3.2では、720pを処理することが可能である。なお、画像サイズの処理能力の計算において、16で割り切れない画像サイズが対象となる場合、画像サイズを16で割り切れる値に切り上げて計算が行われる。例えば、「1080p」は1920x1088に相当する画面としてマクロブロック分割されてから計算が行われる。 For example, for 720p (1280 × 720), it is only necessary to process 1280 × 720/256 = 3600 (MBs) macroblocks per frame. Therefore, at levels 3.1 and 3.2, 720p can be processed. In the calculation of the processing capability of the image size, when an image size that is not divisible by 16 is a target, the calculation is performed by rounding up the image size to a value divisible by 16. For example, “1080p” is calculated after being divided into macroblocks as a screen corresponding to 1920 × 1088.
 以下、図58において、4~5.1の各レベルにおいて処理可能な画面サイズを、表の右側に示している。 In the following, in FIG. 58, screen sizes that can be processed at each level of 4 to 5.1 are shown on the right side of the table.
 レベル4~4.2では、1080pを処理可能である。また、レベル5では、PCディスプレイで使用されるサイズである2560x1600が処理可能である。また、レベル5.1では、4kが処理可能である。 In level 4 to 4.2, 1080p can be processed. At level 5, 2560 × 1600, which is the size used in the PC display, can be processed. At level 5.1, 4k can be processed.
 なお、図59において参照番号COL591に示すように、レベル3.1以上(720p以上の画面サイズ)においては、輝度の双予測が許容される最小のブロックサイズは、8×8である(MinLumaBiPredSize)。つまり、レベル3.1以上では、サブマクロブロック単位(8×4、4×8、および4×4)での双予測は禁止される。 As indicated by reference numeral COL591 in FIG. 59, at a level of 3.1 or higher (screen size of 720p or higher), the minimum block size allowed for luminance bi-prediction is 8 × 8 (MinLumaBiPredSize). . That is, bi-prediction in sub-macroblock units (8 × 4, 4 × 8, and 4 × 4) is prohibited at level 3.1 or higher.
 H.264/AVCにおけるマクロブロックは、HEVCでは、CU、TUおよびPUに相当する単位である。 H. A macroblock in H.264 / AVC is a unit corresponding to CU, TU, and PU in HEVC.
 ところで、H.264/AVCでは双予測のみが制限されているが、小サイズのPUでは単予測においても、動き補償のためのフィルタ処理に必要な処理量および参照画素の転送量が大きくなる。従って、小PUサイズの双予測制限と同時に、小PUサイズの制限が適当である。なお、レベルが大きくなるにつれて、基本的に使用される解像度(画像サイズ)が大きくなるが、解像度が大きくなるほど処理量および転送量が厳しくなる。同時に解像度が大きい場合は、オブジェクトサイズもそれに応じて大きくなるため(動きの空間相関が大きくなるため)、比較的大きなPUだけでも高い符号化効率が実現できる。逆に符号化効率の大きな低下なく、小PUサイズの使用、および、小PUサイズでの双予測を制限できるようになる。解像度は基本的にレベルに対応するため、レベルに応じて、制約を設けたいPUサイズおよび双予測の制限を行いたい予測単位(PU)は異なる。例えば、level 3.1(720P)では、4×4PUに制約を設けるとともに、8×4PU、および4×8PUにおいて双予測の制限を行うことが好ましい。また、level 5(2560×1600相当および4k相当)では、8×4PUおよび4×8PUに制約を設けるとともに、8×8PUにおいて双予測の制限を行うことが好ましい。 By the way, H. In H.264 / AVC, only bi-prediction is restricted, but with a small size PU, the processing amount required for filter processing for motion compensation and the transfer amount of reference pixels are large even in single prediction. Therefore, it is appropriate to limit the small PU size simultaneously with the bi-prediction limitation of the small PU size. Note that as the level increases, the resolution (image size) that is basically used increases, but the processing amount and transfer amount become more severe as the resolution increases. At the same time, when the resolution is high, the object size also increases accordingly (because the spatial correlation of motion increases), so that a high coding efficiency can be realized even with a relatively large PU alone. Conversely, the use of a small PU size and the bi-prediction with a small PU size can be limited without a significant decrease in coding efficiency. Since the resolution basically corresponds to the level, the PU size to be constrained and the prediction unit (PU) to limit the bi-prediction differ depending on the level. For example, in level 3.1 (720P), it is preferable to provide restrictions on 4 × 4 PU and restrict bi-prediction on 8 × 4 PU and 4 × 8 PU. Further, in level 5 (equivalent to 2560 × 1600 and 4k), it is preferable to restrict 8 × 4 PU and 4 × 8 PU and limit bi-prediction in 8 × 8 PU.
 また、HEVCでは、後述する符号化データ中の値log2_min_coding_block_size_minus3により、最小のCUサイズを制御できるが、最小のCUサイズを小さくする目的は、処理量および転送量の削減であるから、処理量および転送量に大きな影響を与える双予測も同時に制限することが適当である。また、制限したい処理量および転送量の度合いは、最小のCUサイズ毎に代わることから、最小のCUサイズに応じて、双予測の制限を適応的に変更することが好ましい。図60を用いて、適応的な制約・制限の例について説明する。図60の(a)は、16×16CUの場合の双予測の制限を例示している。また、図60の(b)は、8×8CUの場合の双予測の制限を例示している。図60の(a)に例示するように、16×16CUについては、16×16PU、16×8PU、8×16PU、および8×8PU等を取り得る。ここで、16×16PU、16×8PU、8×16PUには双予測制限を行わない一方で、8×8PUには双予測制限を行う。 In HEVC, the minimum CU size can be controlled by a value log2_min_coding_block_size_minus3 in encoded data, which will be described later, but the purpose of reducing the minimum CU size is to reduce the processing amount and the transfer amount. It is appropriate to limit the bi-prediction that greatly affects the quantity at the same time. In addition, since the degree of processing amount and transfer amount to be restricted changes for each minimum CU size, it is preferable to adaptively change the restriction of bi-prediction according to the minimum CU size. An example of adaptive restriction / limitation will be described with reference to FIG. FIG. 60A illustrates the limitation of bi-prediction in the case of 16 × 16 CU. Moreover, (b) of FIG. 60 illustrates the limitation of bi-prediction in the case of 8 × 8 CU. As illustrated in FIG. 60A, for a 16 × 16 CU, 16 × 16 PU, 16 × 8 PU, 8 × 16 PU, 8 × 8 PU, and the like can be taken. Here, bi-prediction restriction is not performed on 16 × 16 PU, 16 × 8 PU, and 8 × 16 PU, while bi-prediction restriction is performed on 8 × 8 PU.
 また、図60の(b)に例示するように、8×8CUについては、8×8PU、8×4PU、および4×8PUを取り得る。ここで、8×8PUには双予測制限を行わない一方で、8×4PU、および4×8PUには双予測制限を行う。 Also, as illustrated in FIG. 60B, for an 8 × 8 CU, 8 × 8 PU, 8 × 4 PU, and 4 × 8 PU can be taken. Here, while bi-prediction restriction is not performed on 8 × 8 PU, bi-prediction restriction is performed on 8 × 4 PU and 4 × 8 PU.
   (レベル規制による符号化データの制限)
 図60に示したような適応的な制約・制限は、動画像復号装置1に特別な構成を施さずとも、レベルに応じて、符号化データを復号する際に導出される動き補償パラメータの値を制限するレベル規制によっても実現することができる。図84は、本発明のレベル規制の一例である。図84のテーブル中の、MaxLog2MinCUSize、MinPUSize、およびMinBipredPUSizeは、各々、最小CUサイズの対数値、最小PUサイズ、および最小双予測PUサイズであり、特定レベルにおいて使用可能なCUサイズおよびPUサイズの最小値を示す。図84のように、レベルlevel_idcが所定の閾値TH1未満である場合には、最小CUサイズの対数値、最小PUサイズは各々3、4×4であり特に制限しない。最小双予測PUサイズは8×4、4×8であり、4×4PUの双予測を使用不可とする。続いて、レベルlevel_idcが所定の閾値TH1以上、所定の閾値TH2未満の場合には、最小CUサイズの対数値(最小PUサイズの対数値)は、3であり特に制限しないが、最小PUサイズは8×4、4×8とする。すなわち4×4PUを使用不可とする。さらに、最小双予測PUサイズは8×4、4×8であり、4×4PUの双予測を使用不可とする。続いて、所定の閾値TH2以上の場合には、最小CUサイズの対数値は4であり最小PUサイズは8×8に制限する。すなわち、8×4PU、4×8PU、4×4PUを使用不可とする。さらに、最小双予測PUサイズは16×8であり、8×8PUの双予測を使用不可とする。なお、8×4PU、4×8PU、4×4PUの双予測も最小PUサイズ制限により使用不可である。なお、閾値TH1は720Pのラインであるレベル2.1、閾値TH2は、2560×1600相当のラインであるレベル5とすることが適当であるが、他の閾値を用いても良い。
(Restriction of encoded data due to level restrictions)
The adaptive restriction / limitation as shown in FIG. 60 is a value of the motion compensation parameter derived when decoding the encoded data according to the level, even if the moving image decoding apparatus 1 is not specially configured. It can also be realized by level regulation that limits the above. FIG. 84 is an example of the level restriction of the present invention. In the table of FIG. 84, MaxLog2MinCUSize, MinPUSize, and MinBipredPUSize are respectively the logarithmic value of the minimum CU size, the minimum PU size, and the minimum bi-predicted PU size, and the minimum CU size and PU size that can be used at a specific level. Indicates the value. As shown in FIG. 84, when the level level_idc is less than the predetermined threshold TH1, the logarithmic value of the minimum CU size and the minimum PU size are 3, 4 × 4, respectively, and are not particularly limited. The minimum bi-prediction PU size is 8 × 4, 4 × 8, and 4 × 4 PU bi-prediction is disabled. Subsequently, when the level level_idc is equal to or higher than the predetermined threshold TH1 and lower than the predetermined threshold TH2, the logarithmic value of the minimum CU size (logarithm of the minimum PU size) is 3, which is not particularly limited. 8 × 4 and 4 × 8. That is, 4 × 4 PU cannot be used. Furthermore, the minimum bi-prediction PU size is 8 × 4 and 4 × 8, and bi-prediction of 4 × 4 PU is disabled. Subsequently, when the threshold value is equal to or greater than the predetermined threshold TH2, the logarithmic value of the minimum CU size is 4, and the minimum PU size is limited to 8 × 8. That is, 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU are disabled. Furthermore, the minimum bi-prediction PU size is 16 × 8, and bi-prediction of 8 × 8 PU is disabled. Note that bi-prediction of 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU cannot be used due to the minimum PU size restriction. The threshold TH1 is suitably level 2.1, which is a 720P line, and the threshold TH2 is suitably level 5, which is a line equivalent to 2560 × 1600, but other thresholds may be used.
 図85は、本発明のレベル規制の別の例である。本例では、図84の例とほぼ同一であるが、レベルlevel_idcが所定の閾値TH0未満である場合には、最小CUサイズの対数値、最小PUサイズ、最小双予測PUサイズは各々3、4×4、4×4であり全て制限を加えない。このように、制限を加えないレベルを設けても良い。なお、レベル規制は、符号化データの制限を行うだけ、すなわち、小PUサイズにおける、インター予測フラグの復号のスキップ、マージ候補の双単変換、マージ候補導出における双予測マージ候補導出のスキップの一部、もしくは、全部を行わなくても良い。また逆に、小PUサイズにおける、インター予測フラグの復号のスキップ、マージ候補の双単変換、マージ候補導出における双予測マージ候補導出のスキップの一部もしくは全部を併用しても良い。 FIG. 85 is another example of level regulation according to the present invention. In this example, it is almost the same as the example of FIG. 84, but when the level level_idc is less than the predetermined threshold value TH0, the logarithmic value of the minimum CU size, the minimum PU size, and the minimum bi-predicted PU size are 3 and 4 respectively. × 4, 4 × 4, all without restrictions. In this way, a level that does not impose restrictions may be provided. The level restriction only restricts encoded data, that is, skipping decoding of inter prediction flags, bi-transforming merge candidates, and skipping bi-predictive merge candidate derivation in merge candidate derivation in a small PU size. It is not necessary to perform part or all. Conversely, some or all of the skip of decoding of the inter prediction flag, the bi-conversion of merge candidates, and the skip of bi-prediction merge candidate derivation in merge candidate derivation in the small PU size may be used together.
  [作用・効果]
 本レベル規制によれば、使用可能なPUサイズと使用可能な双予測PUサイズの両者をレベルに応じて制限するため、動き補償のためのフィルタ処理に必要な処理量および参照画素の転送量を適切に制限することができる。H.264/AVCにおけるレベル規制のように、使用可能な双予測PUサイズだけを制限する場合には、使用可能なPUサイズの制限を行わないため、小PUの場合に、単予測においても双予測の場合と同様に大きな処理量および転送量が必要となるという課題がある。すなわち、本レベル規制によれば、双予測に伴う処理量および転送量は制限されるが、単予測の処理量および転送量は制限されないというアンバランスがなくなる。
[Action / Effect]
According to this level regulation, since both the usable PU size and the usable bi-predictive PU size are limited according to the level, the processing amount required for the filter processing for motion compensation and the transfer amount of the reference pixel are reduced. It can be limited appropriately. H. In the case of restricting only the usable bi-predicted PU size, as in the level restriction in H.264 / AVC, the usable PU size is not restricted. As in the case, there is a problem that a large processing amount and transfer amount are required. That is, according to this level regulation, the amount of processing and the amount of transfer associated with bi-prediction are limited, but there is no unbalance that the amount of processing and the amount of transfer for single prediction are not limited.
 さらに、本レベル規制によれば、同じ閾値を用いて、使用可能なPUサイズと使用可能な双予測PUサイズの両者をレベルに応じて切り替える。例えば、閾値TH1の前後で、最小PUサイズMinPUSizeを変更する場合には、同じ閾値TH1を用いて最小双予測PUサイズMinBipredPUSizeを変更する。このように、使用可能なPUサイズと使用可能な双予測PUサイズの閾値を同じ値を用いることで、特定のレベル以下の復号をサポートする動画像復号手段において、処理量および転送量を適切に制限することができる。また、どのレベルで必要な制限が変化するかが簡明となる。 Furthermore, according to this level regulation, both the usable PU size and the usable bi-predictive PU size are switched according to the level using the same threshold value. For example, when the minimum PU size MinPUSize is changed before and after the threshold TH1, the minimum bi-predicted PU size MinBipredPUSize is changed using the same threshold TH1. In this way, by using the same threshold value for the usable PU size and the usable bi-predictive PU size, in the moving picture decoding means that supports decoding below a specific level, the processing amount and the transfer amount are appropriately set. Can be limited. It also makes it clear at what level the required limit changes.
 さらに、本レベル規制によれば、以下の使用可能なPUサイズと使用可能な双予測PUサイズとして以下の組み合わせを用いる。 Furthermore, according to this level regulation, the following combinations are used as the following usable PU sizes and usable bi-predictive PU sizes.
 4×4PU制限と8×4PU双予測制限
  8×4PU制限と8×8PU双予測制限
 本組み合わせのPU制限および双予測制限は互いに同程度の処理量および転送量の制限を行うことになるので、バランスが良い。
4 × 4 PU restriction and 8 × 4 PU bi-prediction restriction 8 × 4 PU restriction and 8 × 8 PU bi-prediction restriction The PU restriction and bi-prediction restriction of this combination will limit the amount of processing and the transfer amount to the same extent. Good balance.
   (構成の説明)
 まず、図61に加えて、図62~図70を参照しながら、双予測の制限を行うサイズを決定するための構成について説明する。図61に示す構成は、図43に示した構成において、双予測制限PU判定部1218を双予測制限PU判定部1218Aに変更したものである。
(Description of configuration)
First, referring to FIGS. 62 to 70 in addition to FIG. 61, a configuration for determining a size for performing bi-prediction restriction will be described. The configuration shown in FIG. 61 is obtained by changing the bi-prediction restricted PU determination unit 1218 to the bi-prediction restricted PU determination unit 1218A in the configuration shown in FIG.
 双予測制限PU判定部1218Aは、双予測限定条件を判定し、対象PUにおいて双予測を用いない双予測制限を行うか否かを判定する。双予測制限PU判定部1218Aは、スキップCU及びマージPUの双予測制限を行うか否か、及び、基本インターPUの双予測制限を行うか否かを、独立に判定しても良い。 The bi-prediction restriction PU determination unit 1218A determines the bi-prediction restriction condition, and determines whether or not bi-prediction restriction that does not use bi-prediction is performed in the target PU. The bi-prediction restricted PU determination unit 1218A may independently determine whether to perform bi-prediction restriction on the skip CU and the merge PU and whether to perform bi-prediction restriction on the basic inter PU.
 なお、マージの利用を制限する場合のように、スキップPUでインター予測フラグを復号する場合には、スキップPU、マージPU、基本インターPUの各々で双予測制限を行うか否かを、独立に判定することも可能である。 Note that when decoding inter prediction flags with skip PUs, such as when merging is restricted, whether or not bi-prediction restriction is performed on each of skip PUs, merge PUs, and basic inter PUs is determined independently. It is also possible to determine.
 また、図43に示した構成と同様、上記の構成では、スキップ動き補償パラメータ導出部1211において設定された双予測・単予測の設定を双単予測変換部1219Aにおいて双予測制限PU判定部1218Aに基づき判定する構成でもよい。また、これに限られず、例えば、双予測制限PU判定部1218Aの判定結果を直接スキップ動き補償パラメータ導出部1211に入力し、双予測・単予測の設定を行う構成でも構わない。 Similarly to the configuration shown in FIG. 43, in the above configuration, the bi-prediction / uni-prediction setting set in the skip motion compensation parameter deriving unit 1211 is transferred to the bi-prediction restricted PU determination unit 1218A in the bi-prediction conversion unit 1219A. A configuration based on the determination may be used. In addition, the configuration is not limited thereto, and for example, a configuration in which the determination result of the bi-prediction restricted PU determination unit 1218A is directly input to the skip motion compensation parameter derivation unit 1211 and bi-prediction / uni-prediction setting is performed may be used.
 双予測制限PU判定部1218Aが行う双予測限定条件の判定は、エンコーダ側から設定された各種のフラグ・パラメータに基づいて行われる。双予測制限PU判定部1218Aは、具体的には、以下の(1A)~(1E)に例示するように構成することが可能である。以下において、(1A)~(1E)の各構成例について、シンタックステーブルと、疑似コードとを示しながら説明する。なお、レベル規制と各構成例は対立するものではなく、併用することも可能である。 The determination of the bi-prediction limited condition performed by the bi-prediction limited PU determination unit 1218A is performed based on various flags and parameters set from the encoder side. Specifically, the bi-prediction restricted PU determination unit 1218A can be configured as exemplified in the following (1A) to (1E). In the following, each configuration example (1A) to (1E) will be described with reference to a syntax table and pseudo code. Note that the level regulation and each configuration example are not in conflict and can be used together.
 (1A)双予測制限を行うか否かを示すフラグを設けて、双予測制限のサイズを直接指定する
  [シンタックステーブル]
 図62を用いて、双予測制限に関するシンタックステーブルの一例について説明する。図62は、双予測制限に関するシンタックステーブルの一例を示す図である。図62に示すように、符号化データのシーケンスパラメータセットのRBSP(Raw Byte Sequence Payload)では、log2_min_coding_block_size_minus3(SYN621)、inter_4x4_enabled_flag(SYN622)、restrict_bipred_flag(SYN623)、および、log2_min_bipred_coding_block_size_minus3(SYN625)が符号化される。
(1A) Provide a flag indicating whether or not to restrict bi-prediction, and directly specify the size of the bi-prediction restriction [Syntax table]
An example of a syntax table related to bi-prediction restriction will be described with reference to FIG. FIG. 62 is a diagram illustrating an example of a syntax table related to bi-prediction restriction. As shown in FIG. 62, in the RBSP (Raw Byte Sequence Payload) of the sequence parameter set of the encoded data, log2_min_coding_block_size_minus3 (SYN621), inter_4x4_enabled_flag (SYN622), restrict_bipred_flag (SYN623), and log2_min_bipred_min3_coding_25_S3 .
 log2_min_coding_block_size_minus3は、最小CUサイズを決定するフラグである。log2_min_coding_block_size_minus3には、指定したい最小CUサイズの対数値から3を差し引いた値が格納される。例えば、最小CUサイズが8×8の場合、log2_min_coding_block_size_minus3 = 0であり、最小CUサイズが16×16の場合、log2_min_coding_block_size_minus3 = 1である。 Log2_min_coding_block_size_minus3 is a flag for determining the minimum CU size. In log2_min_coding_block_size_minus3, a value obtained by subtracting 3 from the logarithmic value of the minimum CU size to be specified is stored. For example, when the minimum CU size is 8 × 8, log2_min_coding_block_size_minus3 = 0, and when the minimum CU size is 16 × 16, log2_min_coding_block_size_minus3 = 1.
 inter_4x4_enabled_flagは、その名称のとおり、インター4×4PUを禁止するフラグである。 Inter_4x4_enabled_flag is a flag that prohibits inter 4 × 4 PU as the name suggests.
 log2_min_coding_block_size_minus3およびinter_4x4_enabled_flagは、各々、最小CUサイズの対数値Log2MinCUSizeと4×4PU使用可能性を示し、使用可能なPUのサイズを制約する。最小CUサイズの対数値Log2MinCUSizeは、log2_min_coding_block_size_minus3+3により導出される。例えば、Log2MinCUSize=3の場合には最小CUサイズは8×8であり、Log2MinCUSize=4の場合には最小CUサイズは16×16になる。最小CUサイズが8×8の場合には、最小CUを分割して得られるPUである、8×4PU、4×8PU、4×4PUが使用可能である。但し、inter_4x4_enabled_flagが0の場合には4×4PUは使用不可となる。 Log2_min_coding_block_size_minus3 and inter_4x4_enabled_flag indicate the logarithm value Log2MinCUSize of the minimum CU size and 4 × 4 PU availability, respectively, and constrain the size of the usable PU. The logarithmic value Log2MinCUSize of the minimum CU size is derived by log2_min_coding_block_size_minus3 + 3. For example, when Log2MinCUSize = 3, the minimum CU size is 8 × 8, and when Log2MinCUSize = 4, the minimum CU size is 16 × 16. When the minimum CU size is 8 × 8, 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU, which are PUs obtained by dividing the minimum CU, can be used. However, when inter_4x4_enabled_flag is 0, 4 × 4 PU cannot be used.
 また、例えば、Log2MinCUSize=4(log2_min_coding_block_size_minus3=1)のとき、すなわち、最小CUサイズが16×16CUであるときには、8×8のCUサイズは使用できない。よって、8×8PUは、使用可能であるが、8×8を分割してのみ得られるPUである8×4PU、4×8PU、4×4PUは、使用不可となる。 Also, for example, when Log2MinCUSize = 4 (log2_min_coding_block_size_minus3 = 1), that is, when the minimum CU size is 16 × 16 CU, an 8 × 8 CU size cannot be used. Therefore, 8 × 8 PU can be used, but 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU, which are PUs obtained only by dividing 8 × 8, cannot be used.
 restrict_bipred_flagおよびlog2_min_bipred_coding_block_size_minus3は、双予測制限に関する情報である。 “Restrict_bipred_flag” and “log2_min_bipred_coding_block_size_minus3” are information on bi-prediction restriction.
 restrict_bipred_flagは、双予測を制限すべきか否かを示すフラグである。このフラグの値は、動画像符号化装置2において、レベルに応じて決定される。restrict_bipred_flagが、“1”である場合、双予測の制限をすることを示す。また、restrict_bipred_flagが、“0”である場合、双予測の制限をしないことを示す。 “Restrict_bipred_flag” is a flag indicating whether or not bi-prediction should be restricted. The value of this flag is determined in accordance with the level in the video encoding device 2. When restrict_bipred_flag is “1”, it indicates that bi-prediction is restricted. Further, when restrict_bipred_flag is “0”, it indicates that bi-prediction is not restricted.
 log2_min_bipred_coding_block_size_minus3は、双予測制限を行う最小のCUサイズ(以下、最小双予測制限CUサイズと称する)を直接指定するものである。log2_min_bipred_coding_block_size_minus3におけるサイズの指定の仕方は、log2_min_coding_block_size_minus3と同様である。また、log2_min_bipred_coding_block_size_minus3は、restrict_bipred_flagが符号化されている場合に復号される(SYN625)。 Log2_min_bipred_coding_block_size_minus3 directly specifies the minimum CU size for which bi-prediction restriction is performed (hereinafter referred to as the minimum bi-prediction restriction CU size). The method of specifying the size in log2_min_bipred_coding_block_size_minus3 is the same as in log2_min_coding_block_size_minus3. Also, log2_min_bipred_coding_block_size_minus3 is decoded when restrict_bipred_flag is encoded (SYN625).
  [疑似コード]
 続いて、図63に示す疑似コードを用いて、双予測制限PU判定部1218Aの動作について説明する。以下に、図63に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the bi-prediction restricted PU determination unit 1218A will be described using the pseudo code illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 63 will be described.
 S631:双予測制限PU判定部1218Aは、restrict_bipred_flagが“0”か否かを判定する。 S631: The bi-prediction restricted PU determination unit 1218A determines whether or not restrict_bipred_flag is “0”.
 S632:restrict_bipred_flagが“0”である場合、双予測制限PU判定部1218Aは、DisableBipred変数に、“0”を設定する。DisableBipred変数は、双予測の制限を行うか否かを示す変数である。DisableBipred変数に、“0”が設定されている場合、双予測の制限は行れない。DisableBipred変数に、“1”が設定されている場合、双予測の制限が行れる。 S632: When restrict_bipred_flag is “0”, the bi-prediction restricted PU determination unit 1218A sets “0” in the DisableBipred variable. The DisableBipred variable is a variable indicating whether or not bi-prediction restriction is performed. When “0” is set in the DisableBipred variable, bi-prediction is not restricted. If the DisableBipred variable is set to “1”, bi-prediction restriction can be performed.
 S633:一方、restrict_bipred_flagが“0”でない場合、双予測制限PU判定部1218Aは、さらにLog2MinBipredCUSizeが“3”であるか否かを判定する。なお、ここで、Log2MinBipredCUSize = log2_min_bipred_coding_block_size_minus3 + 3である。すなわち、S633では、双予測制限を行う最小CUサイズが8×8CUであるか否かを判定している。 S633: On the other hand, when restrict_bipred_flag is not “0”, the bi-prediction restricted PU determination unit 1218A further determines whether or not Log2MinBipredCUSize is “3”. Here, Log2MinBipredCUSizered = log2_min_bipred_coding_block_size_minus3 + 3. That is, in S633, it is determined whether or not the minimum CU size for performing bi-prediction restriction is 8 × 8 CU.
 S634:Log2MinBipredCUSizeが“3”である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S634: When Log2MinBipredCUSize is “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinBipredCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinBipredCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S634では、最小双予測制限CUサイズが8×8CUの場合、8×8CUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S634, when the minimum bi-prediction restricted CU size is 8 × 8 CU, bi-prediction in a PU other than 8 × 8 PU (2N × 2N) is limited for 8 × 8 CU.
 なお、S634において、“&&”の演算子は、論理積を示している。すなわち、“&&”の左項においては、対象ブロックのCUサイズの対数値(log2CUSize)が、Log2MinBipredCUSize(ここでは、“3”)と一致するか否かを判定している。また、“&&”の右項においては、PUのモード(PartMode)が、2N×2Nでないことを判定している。なお、“!=”は、「等しくない」関係を示す関係演算子である。 In S634, the operator “&&” indicates a logical product. That is, in the left term of “&&”, it is determined whether or not the logarithmic value (log2CUSize) of the CU size of the target block matches Log2MinBipredCUSize (here, “3”). In the right term of “&&”, it is determined that the PU mode (PartMode) is not 2N × 2N. Note that “! =” Is a relational operator indicating an “not equal” relationship.
 S635:一方、Log2MinBipredCUSizeが“3”でない場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S635: On the other hand, when Log2MinBipredCUSize is not “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinBipredCUSizeと一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinBipredCUSize and the PU mode is N × N.
 すなわち、S635では、最小双予測制限CUサイズが8×8以外(例えば、16×16)の場合には、最小双予測制限CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。図中、“Bを制限する”と記載しているのは、“双予測(Bi-predictive prediction)を制限する”の意味である。 That is, in S635, when the minimum bi-prediction restricted CU size is other than 8 × 8 (for example, 16 × 16), the CU having a size that matches the minimum bi-prediction restricted CU size is the minimum PU (N × N). Limiting bi-prediction. In the figure, “restrict B” means “restrict bi-predictive prediction”.
 なお、S635は、次のS635’のように変形しても構わない。 Note that S635 may be modified as in the following S635 '.
 S635’:Log2MinBipredCUSizeが“3”でない場合、双予測制限PU判定部1218Aは、DisableBiPred変数を次のように設定する。 S635 ': When Log2MinBipredCUSize is not "3", the bi-prediction restricted PU determination unit 1218A sets the DisableBiPred variable as follows.
 「CUサイズの対数値(log2CUSize)が、Log2MinBipredCUSizeと一致しており、かつ、PUのモードが、N×Nである場合」または、「CUサイズの対数値(log2CUSize)が、Log2MinBipredCUSizeよりも小さい場合」に、双予測を制限する。 “When the logarithm of the CU size (log2CUSize) matches Log2MinBipredCUSize and the PU mode is N × N” or “The logarithm of the CU size (log2CUSize) is smaller than Log2MinBipredCUSize To limit bi-prediction.
 S635’では、S635における制限に加えて、最小双予測制限CUサイズよりも小さいCUサイズの場合、すべてのモードについて双予測を制限する。 In S635 ', in addition to the restriction in S635, bi-prediction is restricted for all modes when the CU size is smaller than the minimum bi-prediction restriction CU size.
  [作用・効果]
 本構成例では、動画像符号化装置2の意図(符号化データに含まれる情報)に合わせて適応的に双予測制限を行うことができる。
[Action / Effect]
In the present configuration example, the bi-prediction restriction can be adaptively performed according to the intention of the moving image encoding device 2 (information included in the encoded data).
 動画像符号化装置2は、例えば、動画像の解像度や動画像復号装置1の性能に合わせて、双予測制限に関する情報を符号化すればよい。 The moving image encoding device 2 may encode information regarding the bi-prediction restriction in accordance with, for example, the resolution of the moving image and the performance of the moving image decoding device 1.
 これにより、動画像復号装置1において、動画像の解像度や動画像復号装置1の性能に合わせて、双予測制限に関する細かい調整が可能となる。 Thereby, the moving picture decoding apparatus 1 can finely adjust the bi-prediction restriction in accordance with the resolution of the moving picture and the performance of the moving picture decoding apparatus 1.
 (1B)双予測制限に関する追加のフラグを設けないで、最小CUサイズに連動して双予測制限のサイズを決定する
  [シンタックステーブル]
 図64を用いて、双予測制限に関するシンタックステーブルの他の例について説明する。図64は、双予測制限に関するシンタックステーブルの他の例を示す図である。図64に示すように、符号化データのシーケンスパラメータセットのRBSPでは、log2_min_coding_block_size_minus3が符号化されていればよい(SYN641)。
(1B) The size of the bi-prediction restriction is determined in conjunction with the minimum CU size without providing an additional flag related to the bi-prediction restriction [Syntax table]
Another example of the syntax table related to bi-prediction restriction will be described with reference to FIG. FIG. 64 is a diagram illustrating another example of the syntax table regarding the bi-prediction restriction. As shown in FIG. 64, log2_min_coding_block_size_minus3 only needs to be encoded in the RBSP of the sequence parameter set of encoded data (SYN641).
  [疑似コード]
 続いて、図65に示す疑似コードを用いて、双予測制限PU判定部1218Aの動作について説明する。以下に、図65に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the bi-prediction restricted PU determination unit 1218A will be described using the pseudo code illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 65 will be described.
 S651:双予測制限PU判定部1218Aは、Log2MinCUSizeが“3”であるか否かを判定する。ここで、Log2MinCUSize = log2_min_coding_block_size_minus3 + 3である。すなわち、S651では、最小CUサイズが8×8CUであるか否かを判定している。 S651: The bi-prediction restricted PU determination unit 1218A determines whether or not Log2MinCUSize is “3”. Here, Log2MinCUSize = log2_min_coding_block_size_minus3 + 3. That is, in S651, it is determined whether or not the minimum CU size is 8 × 8 CU.
 S652:Log2MinCUSizeが“3”である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S652: When Log2MinCUSize is “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S652では、CUサイズが8×8CUの場合、最小CUサイズと一致するサイズのCUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S652, when the CU size is 8 × 8 CU, bi-prediction in a PU other than 8 × 8 PU (2N × 2N) is limited for a CU having a size that matches the minimum CU size.
 S653:一方、Log2MinCUSizeが“3”でない場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S653: On the other hand, when Log2MinCUSize is not "3", the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSizeと一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N × N.
 すなわち、S653では、最小CUサイズが、8×8以外(例えば、16×16)の場合、最小CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。 That is, in S653, when the minimum CU size is other than 8 × 8 (for example, 16 × 16), bi-prediction at the minimum PU (N × N) is limited for a CU having a size that matches the minimum CU size. .
  [作用・効果]
 本構成例では、最小CUサイズに合わせて、双予測の制限を行う。よって、双予測制限に関する情報を追加で符号化することなく双予測の制限が可能となる。
[Action / Effect]
In this configuration example, bi-prediction is restricted according to the minimum CU size. Therefore, it is possible to restrict bi-prediction without additionally encoding information related to bi-prediction restriction.
 (1C)双予測制限を行うか否かを示すフラグを設けて、最小CUサイズに連動して双予測制限のサイズを決定する
  [シンタックステーブル]
 図66を用いて、双予測制限に関するシンタックステーブルの別の例について説明する。図66は、双予測制限に関するシンタックステーブルの別の例を示す図である。図66に示すように、符号化データのシーケンスパラメータセットのRBSPでは、log2_min_coding_block_size_minus3(SYN661)、restrict_bipred_flag(SYN663)を符号化する。なお、符号化データのシーケンスパラメータセットのRBSPにおいて、inter_4x4_enabled_flagが符号化されていてもよい(SYN662)。
(1C) A flag indicating whether or not to perform bi-prediction restriction is provided, and the size of the bi-prediction restriction is determined in conjunction with the minimum CU size [Syntax table]
Another example of the syntax table related to bi-prediction restriction will be described with reference to FIG. FIG. 66 is a diagram illustrating another example of the syntax table regarding the bi-prediction restriction. As shown in FIG. 66, in the RBSP of the sequence parameter set of encoded data, log2_min_coding_block_size_minus3 (SYN661) and restrict_bipred_flag (SYN663) are encoded. Note that inter_4x4_enabled_flag may be encoded in the RBSP of the sequence parameter set of encoded data (SYN 662).
  [疑似コード]
 続いて、図67に示す疑似コードを用いて、双予測制限PU判定部1218Aの動作について説明する。以下に、図67に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the bi-prediction restricted PU determination unit 1218A will be described using the pseudo code illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 67 will be described.
 S671:双予測制限PU判定部1218Aは、restrict_bipred_flagが“0”か否かを判定する。 S671: The bi-prediction restricted PU determination unit 1218A determines whether or not restrict_bipred_flag is “0”.
 S672:restrict_bipred_flagが“0”である場合、双予測制限PU判定部1218Aは、DisableBipred変数に、“0”を設定する。 S672: When restrict_bipred_flag is “0”, the bi-prediction restricted PU determination unit 1218A sets “0” in the DisableBipred variable.
 S673:一方、restrict_bipred_flagが“0”でない場合、双予測制限PU判定部1218Aは、さらにLog2MinCUSizeが“3”であるか否かを判定する。 S673: On the other hand, if restrict_bipred_flag is not “0”, the bi-prediction restricted PU determination unit 1218A further determines whether or not Log2MinCUSize is “3”.
 S674:Log2CUMinSizeが“3”である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S674: When Log2CUMinSize is “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S674では、S652と同様、CUサイズが8×8CUの場合、最小CUサイズと一致するサイズのCUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S674, similarly to S652, when the CU size is 8 × 8 CU, bi-prediction in a PU other than 8 × 8 PU (2N × 2N) is limited for a CU having a size that matches the minimum CU size.
 S675:Log2MinCUSizeが“3”でない場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S675: When Log2MinCUSize is not “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSizeと一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N × N.
 すなわち、S675では、S653と同様、最小CUサイズが、8×8以外(例えば、16×16)の場合、最小CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。 That is, in S675, as in S653, when the minimum CU size is other than 8 × 8 (for example, 16 × 16), bi-prediction at the minimum PU (N × N) is performed for a CU having a size that matches the minimum CU size. Restricted.
  [作用・効果]
 本構成例では、双予測制限を行うか否かを示すフラグの判定に応じて、最小CUサイズに合わせて、双予測の制限を行う。よって、最小双予測制限CUサイズを直接指定する双予測制限に関する情報については、追加で符号化することなく双予測の制限が可能となる。本構成例では、使用可能なPUサイズと使用可能な双予測PUサイズの両者を同じLog2MinCUSizeフラグによって制御するため、双予測に伴う処理量および転送量と、単予測に伴う処理量および転送量をバランスよく制限することができる。
[Action / Effect]
In this configuration example, bi-prediction restriction is performed in accordance with the minimum CU size in accordance with determination of a flag indicating whether or not bi-prediction restriction is performed. Therefore, it is possible to limit bi-prediction without additional encoding of information regarding bi-prediction restriction that directly specifies the minimum bi-prediction restriction CU size. In this configuration example, both the usable PU size and the usable bi-predicted PU size are controlled by the same Log2MinCUSize flag, so the processing amount and transfer amount associated with bi-prediction and the processing amount and transfer amount associated with single prediction are reduced. It is possible to limit in a balanced manner.
 なお、本構成例は、以下に示す(1C’)のように変形してもよい。 Note that this configuration example may be modified as shown below (1C ').
 (1C’)1Cにおいて、双予測制限を行うか否かを示すフラグを3値のフラグに変更する
 以下では、図68に示す疑似コードを用いて、1Cにおいて、restrict_bipred_flagを3値フラグとする変形例について説明する。本変形例では、restrict_bipred_flagは、0、1、および、これら以外の値(例えば、2)を取り得るものとする。以下に、図67に示す擬似コードの各ステップSについて説明する。
(1C ′) In 1C, the flag indicating whether or not bi-prediction restriction is to be performed is changed to a ternary flag. In the following, using pseudo code shown in FIG. 68, in 1C, change_bipred_flag is changed to a ternary flag. An example will be described. In this modification, it is assumed that restrict_bipred_flag can take 0, 1 and other values (for example, 2). Hereinafter, each step S of the pseudo code illustrated in FIG. 67 will be described.
 S681:restrict_bipred_flagが“0”である場合、双予測制限PU判定部1218Aは、DisableBipred変数に、“0”を設定する。 S681: When restrict_bipred_flag is “0”, the bi-prediction restricted PU determination unit 1218A sets “0” in the DisableBipred variable.
 S682:restrict_bipred_flagが“1”である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S682: When restrict_bipred_flag is “1”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 「CUサイズの対数値(log2CUSize)が、Log2MinCUSizeと一致しており、かつ、PUのモードが、2N×2N以外である場合」または、「CUサイズの対数値(log2CUSize)が、Log2MinCUSizeよりも小さい場合」に、双予測を制限する。 “When the logarithmic value of CU size (log2CUSize) matches Log2MinCUSize and the PU mode is other than 2N × 2N” or “The logarithmic value of CU size (log2CUSize) is smaller than Log2MinCUSize "If", restrict bi-prediction.
 S682:restrict_bipred_flagが、上記以外の値である場合(例えば、“2”の場合)、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S682: When restrict_bipred_flag is a value other than the above (for example, “2”), the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 「CUサイズの対数値(log2CUSize)が、Log2MinCUSizeと一致しており、かつ、PUのモードが、N×Nである場合」または、「CUサイズの対数値(log2CUSize)が、Log2MinCUSizeよりも小さい場合」に、双予測を制限する。 “When the logarithmic value of CU size (log2CUSize) matches Log2MinCUSize and the PU mode is N × N” or “When the logarithmic value of CU size (log2CUSize) is smaller than Log2MinCUSize To limit bi-prediction.
  [作用・効果]
 本変形例によれば、restrict_bipred_flagを3値フラグとして構成しているので、双予測制限に関するより細かい調整を実現することができる。
[Action / Effect]
According to this modification, restrict_bipred_flag is configured as a ternary flag, so that finer adjustment regarding bi-prediction restriction can be realized.
 例えば、16×16CUにおいて、8×8PUにおける双予測制限のみを行うことや、8×8PU、16×8PU、および8×16PUにおける双予測制限を行うことができる。このように、本変形例によれば、双予測制限に関し、幅広い選択肢を提供することができる。 For example, in 16 × 16 CU, only bi-prediction limitation in 8 × 8 PU can be performed, or bi-prediction limitation in 8 × 8 PU, 16 × 8 PU, and 8 × 16 PU can be performed. Thus, according to the present modification, a wide range of options can be provided for bi-prediction restriction.
 (1D)双予測制限を行うか否かを示すフラグが、インター4×4PUを禁止することを示すフラグを兼ねる
  [シンタックステーブル]
 図69を用いて、双予測制限に関するシンタックステーブルのさらに別の例について説明する。図69は、双予測制限に関するシンタックステーブルのさらに別の例を示す図である。図69に示すように、符号化データのシーケンスパラメータセットのRBSPでは、log2_min_coding_block_size_minus3(SYN691)およびrestrict_motion_compensation_flag(SYN692)が符号化される。
(1D) A flag indicating whether or not to perform bi-prediction restriction also serves as a flag indicating that inter 4 × 4 PU is prohibited [syntax table]
With reference to FIG. 69, another example of the syntax table regarding the bi-prediction restriction will be described. FIG. 69 is a diagram illustrating still another example of the syntax table for bi-prediction restriction. As illustrated in FIG. 69, log2_min_coding_block_size_minus3 (SYN691) and restrict_motion_compensation_flag (SYN692) are encoded in the RBSP of the sequence parameter set of encoded data.
 ここで、図66に示した(1C)のシンタックステーブルと、図69に示す(1D)のシンタックステーブルとの比較を行うと次のとおりである。 Here, a comparison between the (1C) syntax table shown in FIG. 66 and the (1D) syntax table shown in FIG. 69 is as follows.
 すなわち、本構成例に係る符号化データのシーケンスパラメータセットのRBSPでは、図66に示すinter_4x4_enabled_flag(SYN662)およびrestrict_bipred_flag(SYN663)に替えて、restrict_motion_compensation_flag(SYN692)が符号化される。 That is, in the RBSP of the sequence parameter set of encoded data according to this configuration example, instead of inter_4x4_enabled_flag (SYN 662) and restrict_bipred_flag (SYN 663) illustrated in FIG. 66, restrict_motion_compensation_flag (SYN 692) is encoded.
 restrict_motion_compensation_flagは、!inter_4x4_enabled_flag(“!”は、論理否定の論理演算子を表す)およびrestrict_motion_compensation_flagを共通化したものである。すなわち、restrict_motion_compensation_flagは、インター4×4を禁止するか否かを示すフラグでもあり、双予測を制限すべきか否かを示すフラグでもある。 “Restrict_motion_compensation_flag” is a combination of! Inter_4x4_enabled_flag (“!” Represents a logical negation logical operator) and restrict_motion_compensation_flag. That is, restrict_motion_compensation_flag is a flag indicating whether or not inter 4 × 4 is prohibited, and is also a flag indicating whether or not bi-prediction should be limited.
  [疑似コード]
 続いて、図70に示す疑似コードを用いて、双予測制限PU判定部1218Aの動作について説明する。以下に、図70に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the bi-prediction restricted PU determination unit 1218A will be described using the pseudo code illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 70 will be described.
 S701:双予測制限PU判定部1218Aは、restrict_motion_compensation_flagが“0”か否かを判定する。 S701: The bi-prediction restricted PU determination unit 1218A determines whether or not restrict_motion_compensation_flag is “0”.
 S702:restrict_motion_compensation_flagが“0”である場合、双予測制限PU判定部1218Aは、DisableBipred変数に、“0”を設定する。 S702: When restrict_motion_compensation_flag is “0”, the bi-prediction restricted PU determination unit 1218A sets “0” in the DisableBipred variable.
 S703:一方、restrict_motion_compensation_flagが“0”でない場合、双予測制限PU判定部1218Aは、さらにLog2MinCUSizeが“3”であるか否かを判定する。 S703: On the other hand, when restrict_motion_compensation_flag is not “0”, the bi-prediction restricted PU determination unit 1218A further determines whether or not Log2MinCUSize is “3”.
 S704:Log2CUSizeが“3”である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S704: When Log2CUSize is “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S704では、S674と同様、CUサイズが8×8CUの場合、最小CUサイズと一致するサイズのCUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S704, similarly to S674, when the CU size is 8 × 8 CU, bi-prediction in PUs other than 8 × 8 PUs (2N × 2N) is limited for CUs having a size that matches the minimum CU size.
 S705:Log2CUSizeが“3”でない場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S705: When Log2CUSize is not “3”, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSizeと一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize and the PU mode is N × N.
 すなわち、S705では、S675と同様、最小CUサイズが、8×8以外(例えば、16×16)の場合、最小CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。 That is, in S705, as in S675, when the minimum CU size is other than 8 × 8 (for example, 16 × 16), bi-prediction at the minimum PU (N × N) is performed for a CU having a size that matches the minimum CU size. Restricted.
  [作用・効果]
 本構成例では、双予測制限を行うか否かを示すフラグが、インター4×4PUを禁止することを示すフラグを兼ねる。本構成例によれば、フラグの数を削減することができ、比較的簡易に双予測の制限を実現することができる。
[Action / Effect]
In this configuration example, a flag indicating whether or not bi-prediction restriction is performed also serves as a flag indicating that inter 4 × 4 PU is prohibited. According to this configuration example, the number of flags can be reduced, and bi-prediction restriction can be realized relatively easily.
 (1E)レベルの値に基づいて双予測制限のサイズを決定する
  [シンタックステーブル]
 図64のシンタックステーブルを用いる。図64に示すように、符号化データのシーケンスパラメータセットのRBSPでは、level_idcが符号化されていればよい(SYN642)。
(1E) Determine the size of the bi-prediction restriction based on the level value [Syntax Table]
The syntax table of FIG. 64 is used. As shown in FIG. 64, level_idc need only be encoded in the RBSP of the sequence parameter set of encoded data (SYN642).
  [疑似コード]
 続いて、図86に示す疑似コードを用いて、双予測制限PU判定部1218Aの動作について説明する。以下に、図86に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the bi-prediction restricted PU determination unit 1218A will be described using the pseudo code illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 86 will be described.
 S861:双予測制限PU判定部1218Aは、レベルlevel_idcの値が所定の閾値TH1未満であるか否かを判定する。 S861: The bi-prediction restricted PU determination unit 1218A determines whether the value of the level level_idc is less than a predetermined threshold value TH1.
 S862:レベルlevel_idcの値がTH1未満である場合、双予測制限PU判定部1218Aは、特に処理は行わない。 S862: When the value of the level level_idc is less than TH1, the bi-prediction restricted PU determination unit 1218A performs no particular process.
 S863:一方、レベルlevel_idcの値がTH1未満でない場合、双予測制限PU判定部1218Aは、さらにレベルlevel_idcの値が所定の閾値TH2未満か否かを判定する。 S863: On the other hand, when the level level_idc value is not less than TH1, the bi-prediction restricted PU determination unit 1218A further determines whether or not the level level_idc value is less than a predetermined threshold value TH2.
 S864:レベルlevel_idcの値がTH2未満である場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S864: When the value of the level level_idc is less than TH2, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S864では、最小CUサイズである8×8のCUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S864, bi-prediction in PUs other than 8 × 8 PUs (2N × 2N) is limited for the 8 × 8 CU that is the minimum CU size.
 S865:レベルlevel_idcの値がTH2未満でない場合、双予測制限PU判定部1218Aは、DisableBipred変数を次のように設定する。 S865: When the value of the level level_idc is not less than TH2, the bi-prediction restricted PU determination unit 1218A sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=4)と一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 4) and the PU mode is N × N.
 すなわち、S865では、最小CUサイズが、8×8以外(例えば、16×16)の場合、最小CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。なお、S864およびS865において、双予測制限PU判定部1218Aは、レベルlevel_idcの値に応じて、図84のテーブルのMaxLog2MinCUSizeを参照して、Log2MinCUSizeを決定してもよい。例えば、図84に示すように、レベルlevel_idcの値がTH1以上、TH2未満である場合、MaxLog2MinCuSize=3であるので、S864において、双予測制限PU判定部1218Aは、Log2MinCUSizeの値として、MaxLog2MinCuSize=3を用いることができる。S865においても同様に、双予測制限PU判定部1218Aは、Log2MinCUSizeの値として、MaxLog2MinCuSize=4を用いることができる。 That is, in S865, when the minimum CU size is other than 8 × 8 (for example, 16 × 16), bi-prediction at the minimum PU (N × N) is limited for a CU having a size that matches the minimum CU size. . In S864 and S865, the bi-prediction restricted PU determination unit 1218A may determine Log2MinCUSize with reference to MaxLog2MinCUSize in the table of FIG. 84 according to the value of the level level_idc. For example, as shown in FIG. 84, when the level level_idc value is greater than or equal to TH1 and less than TH2, MaxLog2MinCuSize = 3. Therefore, in S864, the bi-prediction restricted PU determination unit 1218A sets MaxLog2MinCuSize = 3 Can be used. Similarly, in S865, the bi-prediction restricted PU determination unit 1218A can use MaxLog2MinCuSize = 4 as the value of Log2MinCUSize.
  [作用・効果]
 本構成例では、レベルの値に応じて、双予測制限を行うサイズを変更する。本構成例によれば、双予測制限を行うフラグを用いることなく、レベルで示される目的の環境に合わせて双予測の制限を実現することができる。
[Action / Effect]
In this configuration example, the size for performing bi-prediction restriction is changed according to the level value. According to this configuration example, it is possible to realize the restriction of bi-prediction according to the target environment indicated by the level without using a flag for performing the restriction of bi-prediction.
 以上の(1A)~(1E)に示したように構成することで、図60に示したような、適応的な制約・制限を実現することができる。なお、図84、図85で示すように、符号化データの制限するレベル規制によっても、図60に示したような、適応的な制約・制限を実現することができる。 By configuring as shown in the above (1A) to (1E), adaptive constraints and restrictions as shown in FIG. 60 can be realized. As shown in FIGS. 84 and 85, the adaptive restriction / restriction as shown in FIG. 60 can also be realized by the level restriction that the encoded data restricts.
  [2-3-3] 部分的な双予測制限を行うための構成
 以下では、再び図61を参照しながら、部分的な双予測制限を行うための構成について説明する。図61に示す構成は、図43に示した構成において、双単予測変換部1219を、双単予測変換部1219Aに変更したものである。
[2-3-3] Configuration for Performing Partial Bi-Prediction Restriction Hereinafter, a configuration for performing partial bi-prediction restriction will be described with reference to FIG. 61 again. The configuration shown in FIG. 61 is obtained by changing the bi-prediction conversion unit 1219 to a bi-prediction conversion unit 1219A in the configuration shown in FIG.
 双単予測変換部1219Aは、導出されたマージ候補に対して、部分的な双予測制限を行う。より具体的には、以下に示すとおりである。 The bi-prediction conversion unit 1219A performs partial bi-prediction restriction on the derived merge candidate. More specifically, it is as shown below.
 まず、双単予測変換部1219Aは、隣接マージ候補導出部1212A、時間的マージ候補導出部1212Bが導出したマージ候補を、それぞれ取得する。 First, the bi-prediction conversion unit 1219A acquires the merge candidates derived by the adjacent merge candidate derivation unit 1212A and the temporal merge candidate derivation unit 1212B, respectively.
 そして、取得したマージ候補の動き補償パラメータが双予測を示しており、さらに、双予測制限PU判定部1218Aにおいて双予測制限を行うと判定されている場合、双単予測変換部1219Aは、取得したマージ候補の少なくとも一部について双予測を制限する。 Then, when the motion compensation parameter of the acquired merge candidate indicates bi-prediction and is further determined to perform bi-prediction restriction in the bi-prediction restricted PU determination unit 1218A, the bi-uni prediction conversion unit 1219A has obtained Limit bi-prediction for at least some of the merge candidates.
 ここで、取得したマージ候補から双予測を制限するマージ候補を選択する方法としては、先頭N個のマージ候補を選択する方法が挙げられる。双単予測変換部1219Aは、例えば、隣接マージ候補から、先頭1つ、または、先頭2つのマージ候補(双予測)を選択してもよい。 Here, as a method of selecting a merge candidate that restricts bi-prediction from the acquired merge candidates, a method of selecting the first N merge candidates can be cited. The bi-prediction conversion unit 1219A may select, for example, one head or two head merge candidates (bi-prediction) from adjacent merge candidates.
 また、隣接マージ候補から1つまたは2つ、及び、時間的マージ候補から1つを選択しても良い。8×8PUの双予測においては、発明者らの実験により、時間的マージ候補を双単変換することが有用であるとの知見が得られているため、マージ候補のうち、双単変換を行うマージ候補に時間的マージ候補を含める構成は有効である。 Alternatively, one or two of the adjacent merge candidates and one of the temporal merge candidates may be selected. In bi-prediction of 8 × 8 PU, the inventors' experiments have shown that it is useful to perform bi-single transformation of temporal merge candidates, so bi-transformation is performed among the merge candidates. A configuration in which a temporal merge candidate is included in a merge candidate is effective.
 つまり、双単予測変換部1219Aは、選択したマージ候補に対して双単変換を行う。双単変換については上述したとおりであるので、ここではその説明を省略する。 That is, the bi-prediction conversion unit 1219A performs bi-conversion on the selected merge candidate. Since the dual conversion is as described above, the description thereof is omitted here.
  [処理の流れ]
 図71を用いて、双単予測変換部1219Aの処理の流れについて説明すると、以下のとおりである。図71は、マージ動き補償パラメータ導出部1212および双単予測変換部1219Aの処理の流れの一例について示すフローチャートである。
[Process flow]
The processing flow of the bi-predictive conversion unit 1219A will be described with reference to FIG. FIG. 71 is a flowchart illustrating an example of a process flow of the merge motion compensation parameter derivation unit 1212 and the bi-prediction conversion unit 1219A.
 図71に示すように、隣接マージ候補導出部1212Aが隣接マージ候補を導出すると(S711)、双単予測変換部1219Aが、導出された隣接マージ候補に対して双単変換処理を行う(S714)。S714では、双予測制限PU判定部1218Aにおいて双予測制限を行うと判定されている場合、双単予測変換部1219Aが、先頭N個の隣接マージ候補について双単変換処理を行う。なお、図71の図中、点線は、S711~S713の処理と、並行してS714が実行されることを示している。また、双単予測変換部1219Aは、隣接マージ候補導出部1212Aから、導出されたマージ候補を1つずつ逐次取得することとする。しかしながらこれに限られず、双単予測変換部1219Aは、隣接マージ候補導出部1212Aにおいて導出されるマージ候補すべてを一括で取得してもよい。 As shown in FIG. 71, when the adjacent merge candidate deriving unit 1212A derives an adjacent merge candidate (S711), the bi-predictive conversion unit 1219A performs bi-single conversion processing on the derived adjacent merge candidate (S714). . In S714, when it is determined that the bi-prediction restriction PU determination unit 1218A performs the bi-prediction restriction, the bi-prediction conversion unit 1219A performs a bi-conversion process on the first N adjacent merge candidates. In FIG. 71, the dotted line indicates that S714 is executed in parallel with the processing of S711 to S713. In addition, the bi-predictive conversion unit 1219A sequentially acquires the derived merge candidates one by one from the adjacent merge candidate deriving unit 1212A. However, the present invention is not limited to this, and the bi-prediction conversion unit 1219A may acquire all the merge candidates derived in the adjacent merge candidate deriving unit 1212A in a lump.
 続いて、時間的マージ候補導出部1212B、時間的マージ候補を導出すると(S712)、双単予測変換部1219Aが、導出された時間的マージ候補に対して双単変換処理を行う(S714)。このとき、S714では、双単予測変換部1219Aが、先頭N個の時間的マージ候補について双単変換処理を行ってもよいし、すべての時間的マージ候補について双単変換処理を行ってもよいし、また、双単変換処理を省略してもよい。 Subsequently, when the temporal merge candidate deriving unit 1212B derives the temporal merge candidate (S712), the bi-predictive conversion unit 1219A performs bi-single conversion processing on the derived temporal merge candidate (S714). At this time, in S714, the bi-prediction conversion unit 1219A may perform bi-single conversion processing on the first N temporal merge candidates, or may perform bi-single conversion processing on all temporal merge candidates. In addition, the bi-single conversion process may be omitted.
 そして、その他のマージ候補が導出され(S713)、双単予測変換部1219Aにおける双単変換処理が完了すると処理は終了する。 Then, other merge candidates are derived (S713), and the process ends when the bi-single conversion process in the bi-predictive conversion unit 1219A is completed.
  [作用・効果]
 双単予測変換部1219Aは、隣接マージ候補導出部1212Aから、逐次、隣接マージ候補を取得し、双予測制限が制限されている場合には、先頭N個のマージ候補について双単変換処理を行う。
[Action / Effect]
The bi-prediction conversion unit 1219A sequentially acquires adjacent merge candidates from the adjacent merge candidate derivation unit 1212A. When the bi-prediction restriction is limited, the bi-prediction conversion unit 1219A performs bi-single conversion processing on the first N merge candidates. .
 上記構成によれば、一部のマージ候補について、双単変換処理を行うので、すべてのマージ候補について双単変換処理を行う場合に比べれば、双単変換処理の処理負荷が軽減される。また、少なくとも1つの時間的マージ候補において双単変換を行う構成とすれば、比較的大きいPUサイズである8×8PUにおいて双予測制限を行った場合にも、8×8PUの時間的マージ候補は単予測である、すなわち使用可能であることが保証されるため、符号化効率の低下を最小限に抑えることができる。また、マージ候補導出処理と、双単変換処理とを並行して実行するので、効率的に処理を行うことができる。 According to the above configuration, the bi-single conversion process is performed for some merge candidates, so that the processing load of the bi-single conversion process is reduced as compared with the case where the bi-single conversion process is performed for all merge candidates. In addition, if bi-conversion is performed on at least one temporal merge candidate, even if bi-prediction restriction is performed on an 8 × 8 PU having a relatively large PU size, an 8 × 8 PU temporal merge candidate is Since it is guaranteed that it is uni-prediction, that is, usable, it is possible to minimize a decrease in coding efficiency. In addition, since the merge candidate derivation process and the bi-single conversion process are executed in parallel, the process can be performed efficiently.
 (変形例)
 本構成の好ましい変形例1~3を説明する。
(Modification)
Preferred modifications 1 to 3 of this configuration will be described.
  (変形例1)
 双単予測変換部1219Aは、すべてのマージ候補が導出され、マージ候補リストが、マージ候補格納部1212Hに格納されてから、双単予測処理を行う構成であってもよい。
(Modification 1)
The bi-prediction conversion unit 1219A may be configured to perform bi-prediction processing after all merge candidates are derived and the merge candidate list is stored in the merge candidate storage unit 1212H.
 そこで、図72に示すように構成変更する。図72に示す構成は、図61に示す構成において、双単予測変換部1219Aを、マージ候補導出制御部1212Gからのマージ候補リスト完成通知に基づいてマージ候補格納部1212Hに格納されているマージ候補リストに対して双単変換処理を行う双単予測変換部1219Bに変更したものである。 Therefore, the configuration is changed as shown in FIG. The configuration shown in FIG. 72 is the merge candidate stored in the merge candidate storage unit 1212H based on the merge candidate list completion notification from the merge candidate derivation control unit 1212G in the configuration shown in FIG. This is a bi-predictive conversion unit 1219B that performs bi-single conversion processing on the list.
 なお、双単予測変換部1219Bにおける双単変換処理自体は、双単予測変換部1219Aと同様であるのでその説明を省略する。 In addition, since the bi-single conversion process itself in the bi-predictive conversion unit 1219B is the same as that of the bi-predictive conversion unit 1219A, the description thereof is omitted.
   [処理の流れ]
 図73を用いて、図72に示す双単予測変換部1219Bの処理の流れについて説明すると、以下のとおりである。図73は、マージ動き補償パラメータ導出部1212および双単予測変換部1219Bの処理の流れの一例について示すフローチャートである。
[Process flow]
The process flow of the bi-predictive conversion unit 1219B shown in FIG. 72 will be described with reference to FIG. FIG. 73 is a flowchart illustrating an example of a processing flow of the merge motion compensation parameter derivation unit 1212 and the bi-prediction conversion unit 1219B.
 S731~S733は、図44を用いて示したS101~S103と同様であるので、その説明を省略する。 Since S731 to S733 are the same as S101 to S103 shown in FIG. 44, description thereof is omitted.
 S733に続くS734において、Bスライスであれば(S734においてYES)、双予測制限PU判定部1218Aが、双予測制限を行うか否かを判定する(S735)。 If it is a B slice in S734 following S733 (YES in S734), the bi-prediction restricted PU determination unit 1218A determines whether or not bi-prediction restriction is performed (S735).
 双予測制限を行う場合(S735においてYES)、双単予測変換部1219Bは、マージ候補リストの先頭N個のマージ候補の双単変換を行う(S736)。そして、双単変換の実行後、その他のマージ候補が導出される(S737)。 When performing bi-prediction restriction (YES in S735), the bi-prediction conversion unit 1219B performs bi-conversion of the first N merge candidates in the merge candidate list (S736). Then, after execution of bi-single conversion, other merge candidates are derived (S737).
 これに対して、Bスライスでない(S734においてNO)、または、双予測制限を行わない場合(S735においてNO)には、双単変換を行うことなくその他のマージ候補が導出される(S737)。 On the other hand, when the slice is not a B slice (NO in S734) or when bi-prediction restriction is not performed (NO in S735), other merge candidates are derived without performing bi-single conversion (S737).
   [作用・効果]
 双単予測変換部1219Bは、S731~S733が実行されることで、マージ候補格納部1212Hにマージ候補リストが生成された後、双予測制限が制限されている場合には、マージ候補リストの先頭N個のマージ候補について双単変換処理を行う。
[Action / Effect]
When the bi-prediction restriction is limited after the merge candidate list is generated in the merge candidate storage unit 1212H by executing S731 to S733, the bi-predictive conversion unit 1219B starts the merge candidate list. A bi-single conversion process is performed for N merge candidates.
 上記構成によれば、一部のマージ候補について、双単変換処理を行うので、すべてのマージ候補について双単変換処理を行う場合に比べれば、双単変換処理の処理負荷が軽減される。 According to the above configuration, the bi-single conversion process is performed for some merge candidates, so that the processing load of the bi-single conversion process is reduced as compared with the case where the bi-single conversion process is performed for all merge candidates.
 また、S731~S733は、S101~S103と同様に構成することができるので、マージ候補生成処理に関しては、図44から構成を大幅に変更しなくても済む。このように、簡易な構成変更により部分的な双予測制限処理を実現することができる。 In addition, since S731 to S733 can be configured in the same manner as S101 to S103, the configuration of the merge candidate generation process does not need to be significantly changed from FIG. Thus, a partial bi-prediction restriction process can be realized by a simple configuration change.
  (比較)
 ここで、図61、図71に示した構成と、図72、図73に示した構成との比較を行うと次のとおりである。
(Comparison)
Here, a comparison between the configuration shown in FIGS. 61 and 71 and the configuration shown in FIGS. 72 and 73 is as follows.
 図61、図71に示した構成は、すでに説明したとおり、マージ候補導出処理と、双単変換処理とを並行して実行する構成である。 The configurations shown in FIGS. 61 and 71 are configurations in which merge candidate derivation processing and bi-single conversion processing are executed in parallel, as already described.
 従って、一連の処理のタイムテーブルは、例えば、図74に示すとおりになる。図74に示すタイムチャートでは、マージ候補A~Eが導出されており、このうち、双予測の制限により、2個のマージ候補を双単変換することにしている。また、マージ候補A、B、およびDの導出よりも、マージ候補C、Eの導出に、より時間がかかるとする。 Therefore, a time table for a series of processes is, for example, as shown in FIG. In the time chart shown in FIG. 74, merge candidates A to E are derived. Of these, two merge candidates are bi-transformed due to the restriction of bi-prediction. Further, it is assumed that it takes more time to derive merge candidates C and E than to derive merge candidates A, B, and D.
 図74に示すように、マージ候補A、Bが、マージ候補A~Eにおける先頭2個のマージ候補であるので、双単変換の対象となる。マージ候補A、Bの双単変換は、処理時間の長いマージ候補C、Eの実行中に並行して行われる。このため、図74に示す例では、マージ候補C、Dの導出処理が終了すると、リスト作成処理が開始され、リスト作成処理が終了することで処理全体が終了する。 74. As shown in FIG. 74, the merge candidates A and B are the first two merge candidates in the merge candidates A to E, and thus are subject to bi-serial conversion. The bi-conversion of the merge candidates A and B is performed in parallel while the merge candidates C and E having a long processing time are being executed. For this reason, in the example shown in FIG. 74, when the derivation process of the merge candidates C and D ends, the list creation process is started, and the entire process ends when the list creation process ends.
 これに対して、図72、図73に示した構成は、マージ候補リストが生成された後、双単変換処理を行う構成である。 On the other hand, the configuration shown in FIGS. 72 and 73 is a configuration that performs bi-single conversion processing after the merge candidate list is generated.
 従って、一連の処理のタイムチャートは、例えば、図75に示すとおりになる。図75に示すタイムチャートも、図74と同様、マージ候補A~Eが導出されており、このうち、双予測の制限により、2個のマージ候補を双単変換することにしている。また、マージ候補A、B、およびDの導出よりも、マージ候補C、Eの導出に、より時間がかかるとする。 Therefore, a time chart of a series of processing is as shown in FIG. 75, for example. In the time chart shown in FIG. 75, merge candidates A to E are derived as in FIG. 74, and two of these merge candidates are bi-transformed due to the restriction of bi-prediction. Further, it is assumed that it takes more time to derive merge candidates C and E than to derive merge candidates A, B, and D.
 図75に示す例では、マージ候補A~Eが導出された後、マージ候補リストが完成してから、双単変換を行っている。 In the example shown in FIG. 75, after the merge candidates A to E are derived, the merge candidate list is completed, and then bi-serial conversion is performed.
 よって、図74および図75に示す例を比較すると、図75に示す例では、双単変換を行う処理時間の分だけ、図74に示す例よりも処理全体が終了する時間が遅れる。 Therefore, comparing the examples shown in FIG. 74 and FIG. 75, in the example shown in FIG. 75, the time for completing the entire process is delayed from the example shown in FIG.
 一方、図75に示す例は、双単変換を行う処理を、マージ候補リスト作成後に追加するだけで済み、マージ候補導出からマージ候補リスト作成までのロジックを変更しなくても済む。 On the other hand, in the example shown in FIG. 75, it is only necessary to add the bi-conversion processing after the merge candidate list is created, and it is not necessary to change the logic from merge candidate derivation to merge candidate list creation.
 また、図74に示す例では、双単変換後のマージ候補をマージ候補リストとしてマージ候補格納部1212Hに格納したあと、ユニークチェックが行われる。よって、図75に示したように、作成後のマージ候補リストに含まれるマージ候補に対して、双単変換を行う場合に比較すれば、図73に示す例では、マージ候補リストに含まれるマージ候補のユニーク性が保たれる。 In the example shown in FIG. 74, the unique check is performed after the merge candidates after bi-serial conversion are stored in the merge candidate storage unit 1212H as a merge candidate list. Therefore, as shown in FIG. 75, in the example shown in FIG. 73, in the merge candidate included in the merge candidate list, the merge candidate included in the merge candidate list is compared with the merge candidate included in the merge candidate list. Candidate uniqueness is maintained.
 また、タイムチャート上は不利ではあるが、双単予測変換部1219Aと双単予測変換部1219Bを組み合わせたタイプの構成としても良い。すなわち、時間的マージ候補に限り、マージ候補導出時(マージ候補リスト格納前)に双単変換を行い、それ以外のマージ候補については、マージ候補リスト格納後に双単変換を行う構成としても良い。この場合には、8×8PUにおける双予測制限において有効な時間的マージ候補で双単変換を行うことを保証しつつ、簡易な構成で双単変換を行うことが可能になる。 Moreover, although it is disadvantageous on the time chart, a configuration of a type in which the bi-predictive conversion unit 1219A and the bi-predictive conversion unit 1219B are combined may be employed. That is, only a temporal merge candidate may be configured such that bi-serial conversion is performed when a merge candidate is derived (before the merge candidate list is stored), and bi-conversion is performed after the merge candidate list is stored for other merge candidates. In this case, it is possible to perform the bi-single conversion with a simple configuration while ensuring that the bi-single conversion is performed with the temporal merge candidate effective in the bi-prediction restriction in 8 × 8 PU.
  (変形例2)
 双単予測変換部1219Bにおいて、マージ候補リストに含まれる単予測の数に応じて双単変換を行ってもよい。
(Modification 2)
In the bi-prediction conversion unit 1219B, bi-uniform conversion may be performed according to the number of single predictions included in the merge candidate list.
 具体的には、双単予測変換部1219Bにおいて、マージ候補導出時に単予測の数をカウントし、マージ候補リストにおいてN個以上の単予測がない場合に限り、先頭N個のマージ候補を双単変換してもよい。なお、Nは、正の整数であり、例えば、N=1とすることができる。 Specifically, the bi-prediction conversion unit 1219B counts the number of uni-predictions at the time of merging candidate derivation, and only if there are no N or more uni-predictions in the merge candidate list, the first N merge candidates are bi-directional. It may be converted. Note that N is a positive integer, for example, N = 1.
 上記構成によれば、マージ候補リストにN個以上の単予測が存在する場合には、双単変換を行わなくてもよいので、マージ候補導出処理の負荷軽減を図ることができる。 According to the above configuration, when there are N or more uni-predictions in the merge candidate list, it is not necessary to perform bi-single conversion, so the load of merge candidate derivation processing can be reduced.
  (変形例3)
 双単予測変換部1219Aまたは双単予測変換部1219Bは、双予測のマージ候補についての2つの動きベクトルが非整数動きベクトルであるか否かに応じて、双単変換を行ってもよい。
(Modification 3)
The bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion depending on whether or not the two motion vectors for the bi-prediction merge candidate are non-integer motion vectors.
 ここで、非整数動きベクトルとは、画素位置を整数値として表現したときに、少なくとも一部の該動きベクトルの成分が非整数によって表されるものを指す。これに対して、画素位置を整数値として表現したときに、該動きベクトルの成分がすべて整数によって表されるものを整数動きベクトルと称する。 Here, the non-integer motion vector means that at least a part of the motion vector component is represented by a non-integer when the pixel position is expressed as an integer value. On the other hand, when the pixel position is expressed as an integer value, a component in which all the motion vector components are represented by integers is called an integer motion vector.
 非整数動きベクトルに対しては、補間画像を生成するための補間フィルタを適用するため、処理負荷が高くなり、また動き補償に必要な参照画素の範囲が大きくなるため、参照画素の転送のため転送量が高くなる傾向がある。これに対して、整数動きベクトルの場合には、このようなフィルタ処理は必須ではない。 For non-integer motion vectors, an interpolation filter for generating an interpolated image is applied, which increases the processing load and increases the reference pixel range necessary for motion compensation. The transfer amount tends to be high. On the other hand, in the case of an integer motion vector, such filter processing is not essential.
 また、整数動きベクトルの場合、動き補償で必要とされる参照範囲は、対象ブロックと同一となる。よって、双予測に整数動きベクトルが含まれる場合、双予測を行っても、転送量および処理量はそれほどに多くはならない。 In the case of integer motion vectors, the reference range required for motion compensation is the same as that of the target block. Therefore, when an integer motion vector is included in bi-prediction, even if bi-prediction is performed, the transfer amount and the processing amount do not increase so much.
 そこで、双単予測変換部1219Aまたは双単予測変換部1219Bは、双予測のマージ候補についての2つの動きベクトルの少なくとも一方が整数動きベクトルである場合、双単変換を省略してもよい。 Therefore, the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may omit bi-conversion when at least one of the two motion vectors for the bi-prediction merge candidate is an integer motion vector.
 すなわち、双単予測変換部1219Aまたは双単予測変換部1219Bは、双予測のマージ候補についての2つの動きベクトルがともに非整数動きベクトルである場合に限り、双単変換を行ってもよい。 That is, the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion only when the two motion vectors for the bi-prediction merge candidate are both non-integer motion vectors.
 また、双単予測変換部1219Aまたは双単予測変換部1219Bを次のように構成してもよい。すなわち、双単予測変換部1219Aまたは双単予測変換部1219Bは、双予測のマージ候補についての2つの動きベクトルがともに整数動きベクトルである場合、双単変換を省略してもよい。 Further, the bi-predictive conversion unit 1219A or the bi-predictive conversion unit 1219B may be configured as follows. In other words, bi-prediction conversion unit 1219A or bi-prediction conversion unit 1219B may omit bi-conversion when both motion vectors for bi-prediction merge candidates are both integer motion vectors.
 また、双単予測変換部1219Aまたは双単予測変換部1219Bは、双予測のマージ候補についての2つの動きベクトルの少なくとも一方が非整数動きベクトルである場合、双単変換を行ってもよい。 In addition, the bi-prediction conversion unit 1219A or the bi-prediction conversion unit 1219B may perform bi-conversion when at least one of the two motion vectors for the bi-prediction merge candidate is a non-integer motion vector.
 上記構成によれば、双予測のすべてについて双単変換をしなくても済むため、双予測制限に関わるマージ候補の変換を最小限におさえることができる。 According to the above configuration, since it is not necessary to perform bi-single conversion for all of bi-prediction, conversion of merge candidates related to bi-prediction restriction can be minimized.
  [2-3-4] 動きベクトルの整数化
 以下では、図76~図80を用いて、動きベクトルの整数化について説明する。まず、図76を用いて、動きベクトルの整数化を行うための構成について開示する。図76に示す構成は、図61に示した構成において、双単予測変換部1219Aを動きベクトル整数化部1220に変更したものである。
[2-3-4] Conversion of Motion Vectors into Integers Hereinafter, the conversion of motion vectors into integers will be described with reference to FIGS. First, a configuration for converting a motion vector into an integer will be disclosed with reference to FIG. The configuration shown in FIG. 76 is obtained by changing the bi-predictive conversion unit 1219A to a motion vector integer converting unit 1220 in the configuration shown in FIG.
 動きベクトル整数化部1220は、非整数動きベクトルに含まれる1以上の非整数の成分のうち、少なくとも1つの成分を整数の成分に変換する。以下、動きベクトル整数化部1220による上記変換を、動きベクトルの整数化と称する。 The motion vector integer converting unit 1220 converts at least one component of one or more non-integer components included in the non-integer motion vector into an integer component. Hereinafter, the conversion by the motion vector integer converting unit 1220 is referred to as motion vector integer conversion.
 より具体的には、動きベクトル整数化部1220は、双予測が制限される場合、隣接マージ候補導出部1212Aまたは時間的マージ候補導出1212Bから入力されるマージ候補に双予測が含まれるとき、双予測の2つの動きベクトルが非整数動きベクトルであるか否かを判定する。そして、双予測の2つの動きベクトルのうち、少なくとも一方が非整数動きベクトルである場合、動きベクトル整数化部1220は、当該非整数動きベクトルを整数化する。 More specifically, when the bi-prediction is limited, the motion vector integer converting unit 1220 includes a bi-prediction when the merge candidate input from the adjacent merge candidate derivation unit 1212A or the temporal merge candidate derivation 1212B includes the bi-prediction. It is determined whether the two motion vectors for prediction are non-integer motion vectors. Then, when at least one of the two motion vectors of bi-prediction is a non-integer motion vector, the motion vector integerization unit 1220 converts the non-integer motion vector into an integer.
 次に、図77~図80を用いて、整数化処理の具体例について説明する。図77~図80は、動きベクトル整数化部1220における整数化処理の具体例を示す図である。 Next, a specific example of the integer processing will be described with reference to FIGS. 77 to 80. 77 to 80 are diagrams illustrating specific examples of the integer processing in the motion vector integer converting unit 1220.
 なお、以下では、動きベクトルが(X,Y)の2次元座標表示により表されるものとする。また、以下の説明では、説明の便宜上、非整数動きベクトルとは、X成分、Y成分ともに、非整数である非整数動きベクトルを指すものとする。また、mv_Lxは、リストLx(x=0 or 1)の動きベクトルを示す。また、mv_Lx[0]は、動きベクトルのX成分を示しており、mv_Lx[1]は、動きベクトルのY成分を示している。 In the following, it is assumed that the motion vector is represented by a two-dimensional coordinate display of (X, Y). In the following description, for convenience of explanation, the non-integer motion vector refers to a non-integer motion vector in which both the X component and the Y component are non-integers. Mv_Lx indicates a motion vector of the list Lx (x = 0xor 1). Further, mv_Lx [0] indicates the X component of the motion vector, and mv_Lx [1] indicates the Y component of the motion vector.
   [X座標を整数化する]
 動きベクトル整数化部1220は、図77に例示するように、動きベクトルのX座標を整数化してもよい。以下に、図77に示す擬似コードの各ステップSについて説明する。
[Make X coordinate integer]
The motion vector integer converting unit 1220 may convert the X coordinate of the motion vector into an integer as illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 77 will be described.
 S771:L0の動きベクトルが、非整数ベクトルであるか否かを判定する。なお、動きベクトルの座標成分の下位2ビットは、小数位置を表すビットである。“mv_L0[x] & 3”(x=0 or 1)は、座標成分の下位2ビットが“11(3)”であるか否かを判定しており、座標位置が小数位置を示しているかどうかを判定している。 S771: It is determined whether or not the motion vector of L0 is a non-integer vector. The lower 2 bits of the coordinate component of the motion vector are bits representing the decimal position. “Mv_L0 [x] & 3” (x = 0 or 1) determines whether the lower 2 bits of the coordinate component are “11 (3)”, and does the coordinate position indicate a decimal position? Judgment is made.
 S772:L0の動きベクトルが、非整数ベクトルである場合、L0のX座標の下位2ビットを“00”に設定することでL0の動きベクトルのX座標の整数化を行う。なお、“~”は、ビット否定の演算子であr、“~3”は、“11”のビット否定、すなわち“00”を示す。また、“&=”は、ビット積代入の演算子である。例えば、“A &= B”は、“A = A & B”を意味する。 S772: When the motion vector of L0 is a non-integer vector, the X coordinate of the L0 motion vector is converted to an integer by setting the lower 2 bits of the X coordinate of L0 to “00”. Note that “˜” is a bit negation operator r, and “˜3” is a bit negation of “11”, that is, “00”. “& =” Is a bit product substitution operator. For example, “A & = B” means “A = A & B”.
 S773:L1の動きベクトルが、非整数ベクトルであるか否かを判定する。 S773: It is determined whether or not the motion vector of L1 is a non-integer vector.
 S774:L1の動きベクトルが、非整数ベクトルである場合、L1の動きベクトルのX座標の整数化を行う。 S774: If the L1 motion vector is a non-integer vector, the X coordinate of the L1 motion vector is converted to an integer.
   [Y座標を整数化する]
 また、動きベクトル整数化部1220は、図78に例示するように、動きベクトルのY座標を整数化してもよい。以下に、図78に示す擬似コードの各ステップSについて説明する。
[Make Y coordinate integer]
The motion vector integer converting unit 1220 may convert the Y coordinate of the motion vector into an integer as illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 78 will be described.
 S781:L0の動きベクトルが、非整数ベクトルであるか否かを判定する。 S781: It is determined whether or not the motion vector of L0 is a non-integer vector.
 S782:L0の動きベクトルが、非整数ベクトルである場合、L0の動きベクトルのY座標の整数化を行う。 S782: When the motion vector of L0 is a non-integer vector, the Y coordinate of the motion vector of L0 is converted to an integer.
 S783:L1の動きベクトルが、非整数ベクトルであるか否かを判定する。 S783: It is determined whether or not the motion vector of L1 is a non-integer vector.
 S784:L1の動きベクトルが、非整数ベクトルである場合、L1の動きベクトルのY座標の整数化を行う。 S784: If the L1 motion vector is a non-integer vector, the Y coordinate of the L1 motion vector is converted to an integer.
   [X座標およびY座標を整数化する]
 また、動きベクトル整数化部1220は、図79に例示するように、動きベクトルのX座標およびY座標を整数化してもよい。以下に、図79に示す擬似コードの各ステップSについて説明する。
[X and Y coordinates are converted into integers]
Further, the motion vector integer converting unit 1220 may convert the X coordinate and Y coordinate of the motion vector into integers as illustrated in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 79 will be described.
 S791:L0の動きベクトルが、非整数ベクトルであるか否かを判定する。 S791: It is determined whether or not the motion vector of L0 is a non-integer vector.
 S792:L0の動きベクトルが、非整数ベクトルである場合、L0の動きベクトルのX座標およびY座標の整数化を行う。 S792: When the motion vector of L0 is a non-integer vector, the X coordinate and the Y coordinate of the motion vector of L0 are converted into integers.
 S793:L1の動きベクトルが、非整数ベクトルであるか否かを判定する。 S793: It is determined whether or not the motion vector of L1 is a non-integer vector.
 S794:L1の動きベクトルが、非整数ベクトルである場合、L1の動きベクトルのX座標およびY座標の整数化を行う。 S794: When the motion vector of L1 is a non-integer vector, the X coordinate and the Y coordinate of the motion vector of L1 are converted into integers.
   [片方のリストのみX座標およびY座標を整数化する]
 また、動きベクトル整数化部1220は、図80に例示するように、片方のリストの動きベクトルのX座標およびY座標を整数化してもよい。以下に、図80に示す擬似コードの各ステップSについて説明する。
[X and Y coordinates are converted to integers for only one list]
Further, as illustrated in FIG. 80, the motion vector integer converting unit 1220 may convert the X coordinate and Y coordinate of the motion vector of one list into integers. Hereinafter, each step S of the pseudo code illustrated in FIG. 80 will be described.
 S801:LXの動きベクトルが、非整数ベクトルであるか否かを判定する(ただし、X=0or 1)。 S801: It is determined whether or not the motion vector of LX is a non-integer vector (where X = 0 or 1).
 S802:LXの動きベクトルが、非整数ベクトルである場合、LXの動きベクトルのX座標およびY座標の整数化を行う。 S802: If the LX motion vector is a non-integer vector, the X and Y coordinates of the LX motion vector are converted to integers.
   [作用・効果]
 すでに説明したとおり、整数動きベクトルの場合には、補間フィルタによるフィルタ処理を行わなくても済む。よって、動き補償で参照される参照範囲は、対象ブロックと一致する。このため、双予測を行っても、フィルタ処理の処理量および参照画素の転送量は、それほど多くはならない。
[Action / Effect]
As already described, in the case of an integer motion vector, it is not necessary to perform filter processing using an interpolation filter. Therefore, the reference range referenced in motion compensation matches the target block. For this reason, even if bi-prediction is performed, the processing amount of filter processing and the transfer amount of reference pixels do not increase so much.
 このため、双予測の動きベクトルの少なくとも一方が、X座標およびY座標ともに非整数成分である非整数動きベクトルである場合、X座標およびY座標ともに非整数成分を有する非整数動きベクトルの少なくとも一方の非整数成分を、整数成分に変換することができれば、非整数動きベクトルをそのまま処理するよりも、処理量および転送量を抑えられる場合がある。 Therefore, when at least one of the bi-prediction motion vectors is a non-integer motion vector in which both the X coordinate and the Y coordinate are non-integer components, at least one of the non-integer motion vectors having both the X coordinate and the Y coordinate has a non-integer component. If the non-integer component can be converted into the integer component, the processing amount and the transfer amount may be suppressed as compared with the case where the non-integer motion vector is processed as it is.
 また、非整数動きベクトルを、整数動きベクトルに変換すれば、参照範囲が、対象ブロックと一致するので、より一層、処理量および転送量の軽減を図ることができる。 Also, if the non-integer motion vector is converted to an integer motion vector, the reference range matches the target block, so that the processing amount and the transfer amount can be further reduced.
 なお、動きベクトル整数化部1220は、X座標およびY座標のいずれか一方が非整数成分でない非整数動きベクトルに対して上記整数化処理を適用しても構わない。 Note that the motion vector integerization unit 1220 may apply the integer processing to a non-integer motion vector in which either one of the X coordinate and the Y coordinate is not a non-integer component.
  (3)TU情報復号部の詳細
 次に、図16を用いて、TU情報復号部13および復号モジュール10の構成例について説明する。図16は、動画像復号装置1において、TU分割復号処理、変換係数復号処理、および、予測残差導出処理を行うための構成、すなわち、TU情報復号部13および復号モジュール10の構成について例示する機能ブロック図である。
(3) Details of TU Information Decoding Unit Next, configuration examples of the TU information decoding unit 13 and the decoding module 10 will be described with reference to FIG. FIG. 16 illustrates the configuration for performing the TU division decoding process, the transform coefficient decoding process, and the prediction residual derivation process in the moving image decoding apparatus 1, that is, the configurations of the TU information decoding unit 13 and the decoding module 10. It is a functional block diagram.
 以下、TU情報復号部13および復号モジュール10の順で、各部の構成について説明する。 Hereinafter, the configuration of each unit will be described in the order of the TU information decoding unit 13 and the decoding module 10.
   [TU情報復号部]
 図16に示すように、TU情報復号部13は、TU分割設定部131および変換係数復元部132を備える。
[TU information decoding unit]
As illustrated in FIG. 16, the TU information decoding unit 13 includes a TU partition setting unit 131 and a transform coefficient restoration unit 132.
 TU分割設定部131は、符号化データから復号したパラメータとCUサイズおよびPU分割タイプとに基づいて、TU分割の方式を設定するものである。また、変換係数復元部132は、TU分割設定部131によって設定されたTU分割に従って、各TUの予測残差を復元するものである。 The TU partition setting unit 131 sets the TU partition method based on the parameters decoded from the encoded data, the CU size, and the PU partition type. Further, the transform coefficient restoration unit 132 restores the prediction residual of each TU according to the TU partition set by the TU partition setting unit 131.
   [TU分割設定部]
 まず、図16を参照しながら、TU分割設定部131の詳細について説明する。TU分割設定部131は、より詳細には、対象領域設定部1311、分割決定部1312、分割領域設定部(変換単位分割手段、分割手段)1313、および変換サイズ決定情報記憶部1314を備える。
[TU division setting section]
First, the details of the TU partition setting unit 131 will be described with reference to FIG. More specifically, the TU division setting unit 131 includes a target region setting unit 1311, a division determination unit 1312, a division region setting unit (conversion unit division unit, division unit) 1313, and a conversion size determination information storage unit 1314.
 対象領域設定部1311は、対象領域となるノードである対象ノードを設定する。対象領域設定部1311は、対象変換ツリーについてTU分割の処理が開始されたとき、対象領域の初期値として、対象CU全体を設定する。また、分割の深度は、“0”に設定する。 The target area setting unit 1311 sets a target node that is a target area. The target area setting unit 1311 sets the entire target CU as the initial value of the target area when the TU partitioning process is started for the target conversion tree. The division depth is set to “0”.
 分割決定部1312は、領域分割フラグ復号部1031を用いて、対象領域設定部1311によって設定された対象ノードを分割するか否かを示す情報(split_transform_flag)を復号し、復号した情報に基づいて対象ノードの分割要否を決定する。 The division determination unit 1312 uses the region division flag decoding unit 1031 to decode information (split_transform_flag) indicating whether or not to divide the target node set by the target region setting unit 1311, and based on the decoded information, Decide whether to split the node.
 分割領域設定部1313は、分割決定部1312によって分割要と決定された対象ノードについて分割領域を設定する。具体的には、分割領域設定部1313は、分割要と決定された対象ノードについて、分割の深度を1加算するとともに、変換サイズ決定情報記憶部1314に記憶されている変換サイズ決定情報に基づいて対象ノードを分割する。 The divided region setting unit 1313 sets a divided region for the target node determined to be divided by the division determining unit 1312. Specifically, the divided region setting unit 1313 adds 1 to the division depth for the target node determined to be divided, and based on the converted size determination information stored in the converted size determination information storage unit 1314. Divide the target node.
 なお、分割により得られた各対象ノードは、対象領域設定部1311によりさらに対象領域として設定される。 Note that each target node obtained by the division is further set as a target region by the target region setting unit 1311.
 すなわち、TU分割では、分割した対象ノードについて、対象領域設定部1311、分割決定部1312および分割領域設定部1313によって、“対象領域の設定”、“分割の決定”、および“分割領域の設定”の一連の処理が、再帰的に繰り返される。 That is, in the TU partitioning, “target region setting”, “partition determination”, and “partition region setting” are performed by the target region setting unit 1311, the partition determination unit 1312, and the partition region setting unit 1313 for the target node that has been split. A series of processes is repeated recursively.
 変換サイズ決定情報記憶部1314には、対象ノードの分割方式を示す変換サイズ決定情報が記憶されている。変換サイズ決定情報は、具体的には、CUのサイズ、TU分割の深度(trafoDepth)、および対象PUのPU分割タイプと、TU分割パターンとの対応関係を定義する情報である。 The conversion size determination information storage unit 1314 stores conversion size determination information indicating the division method of the target node. Specifically, the transform size determination information is information that defines the correspondence between the CU size, the TU partition depth (trafoDepth), the PU partition type of the target PU, and the TU partition pattern.
 ここで、図17を用いて、変換サイズ決定情報の具体的な構成例について説明すると次のとおりである。図17に示す変換サイズ決定情報では、CUのサイズ、TU分割の深度(trafoDepth)、および対象PUのPU分割タイプに応じて、TU分割パターンが定義されている。なお、なお、表中の“d”は、CUの分割深度を示す。 Here, a specific configuration example of the conversion size determination information will be described with reference to FIG. In the transform size determination information shown in FIG. 17, TU partition patterns are defined according to the CU size, the TU partition depth (trafoDepth), and the PU partition type of the target PU. Note that “d” in the table indicates the division depth of the CU.
 変換サイズ決定情報では、CUのサイズとして、64×64、32×32、16×16、および8×8の4つが定義されている。 In the conversion size determination information, four sizes of 64 × 64, 32 × 32, 16 × 16, and 8 × 8 are defined as CU sizes.
 また、変換サイズ決定情報では、CUのサイズに応じて、選択可能なPU分割タイプが定義されている。 In the conversion size determination information, selectable PU partition types are defined according to the size of the CU.
 CUのサイズが、64×64、32×32、および16×16である場合、PU分割タイプとして、2N×2N、2N×nU、2N×nD、N×2N、nL×2N、およびnR×2Nのいずれかを選択可能である。 When the size of the CU is 64 × 64, 32 × 32, and 16 × 16, the PU partition types are 2N × 2N, 2N × nU, 2N × nD, N × 2N, nL × 2N, and nR × 2N. Either of these can be selected.
 また、CUのサイズが、8×8である場合、PU分割タイプとして、2N×2N、2N×NおよびN×2Nのいずれかを選択可能である。 Also, when the size of the CU is 8 × 8, any of 2N × 2N, 2N × N, and N × 2N can be selected as the PU partition type.
 また、変換サイズ決定情報では、CUのサイズおよびPU分割タイプに応じて、各TU分割の深度におけるTU分割パターンが定義されている。 Also, in the transform size determination information, a TU partition pattern at each TU partition depth is defined according to the CU size and PU partition type.
 例えば、CUのサイズが64×64である場合、次のとおりである。まず、TU分割の深度“0”は定義されておらず、64×64のCUは、強制的に分割が行われる(図17において※1にて示している)。これは、変換単位の最大サイズが32×32と定義されているためである。 For example, when the size of the CU is 64 × 64, it is as follows. First, the TU division depth “0” is not defined, and a 64 × 64 CU is forcibly divided (indicated by * 1 in FIG. 17). This is because the maximum size of the conversion unit is defined as 32 × 32.
 TU分割深度“1”および“2”では、正方形の4分木分割のみを含む場合と、非正方形の4分木分割のみを含む場合とで異なるTU分割パターンが定義されている。 TU partition depths “1” and “2” define different TU partition patterns depending on whether only square quadtree partitioning is included or only non-square quadtree partitioning is included.
 PU分割タイプが2N×2Nであり、かつ、正方形の4分木分割のみを含むTU分割パターンの場合、TU分割深度“1”では、32×32の正方形4分木分割、TU分割深度“2”では、16×16の正方形4分木分割が定義されている。 In the case of a TU partition pattern in which the PU partition type is 2N × 2N and includes only a square quadtree partition, with a TU partition depth “1”, a 32 × 32 square quadtree partition, a TU partition depth “2” "Defines a 16x16 square quadtree partition.
 PU分割タイプが、2N×2N、2N×nU、2N×nD、N×2N、nL×2N、およびnR×2Nのいずれかであり、かつ、非正方形の4分木分割のみを含む場合の定義は次のとおりである。 Definition when PU partition type is any of 2N × 2N, 2N × nU, 2N × nD, N × 2N, nL × 2N, and nR × 2N and includes only non-square quadtree partition Is as follows.
 まず、TU分割深度“1”では、32×32の正方形4分木分割が定義されている。続いて、TU分割深度“2”では、PU分割タイプ:2N×2N、2N×nU、2N×nDに対しては、32×8の非正方形4分木分割が定義されており、PU分割タイプ:N×2N、nL×2N、nR×2Nに対しては、8×32の非正方形4分木分割が定義されている。 First, a 32 × 32 square quadtree partition is defined with a TU partition depth “1”. Subsequently, for the TU partition depth “2”, a 32 × 8 non-square quadtree partition is defined for the PU partition types: 2N × 2N, 2N × nU, and 2N × nD. : 8 × 32 non-square quadtree partitioning is defined for N × 2N, nL × 2N, and nR × 2N.
 さらに、CUのサイズが8×8である場合について例示すれば次のとおりである。CUのサイズが8×8である場合、選択可能なPU分割タイプは、2N×2N、2N×2、およびN×2Nである。それぞれのPU分割タイプについて、TU分割深度“1”では、8×8の正方形4分木分割、TU分割深度“2”では、4×4の正方形4分木分割が定義されている。なお、TU分割の深度“3”は定義されておらず、強制的に非分割である(図17において、※2にて示している)。 Furthermore, the case where the size of the CU is 8 × 8 is exemplified as follows. When the size of the CU is 8 × 8, selectable PU partition types are 2N × 2N, 2N × 2, and N × 2N. For each PU partition type, an 8 × 8 square quadtree partition is defined at a TU partition depth “1”, and a 4 × 4 square quadtree partition is defined at a TU partition depth “2”. Note that the TU division depth “3” is not defined, and is forcibly non-division (indicated by * 2 in FIG. 17).
 ここで、図20を用いて、TU分割設定部131におけるTU分割について詳細について説明すると次のとおりである。図20は、CUのサイズが32×32であり、かつ、PU分割タイプが2N×Nである場合のTU分割の例を示す図である。 Here, the details of the TU partitioning in the TU partition setting unit 131 will be described with reference to FIG. FIG. 20 is a diagram illustrating an example of TU partitioning when the CU size is 32 × 32 and the PU partitioning type is 2N × N.
 まず、対象領域設定部1311は、TU分割処理が開始されると、対象CU全体を、対象領域の初期値として設定するとともに、depth=0とする。なお、depth=0では、領域垂直方向中央において点線にて、PU境界B1を示している。 First, when the TU partitioning process is started, the target area setting unit 1311 sets the entire target CU as an initial value of the target area and sets depth = 0. When depth = 0, the PU boundary B1 is indicated by a dotted line at the center in the region vertical direction.
 次に、分割決定部1312が、対象ノードを分割するか否かを示す情報(split_transform_flag)に基づいて、対象ノードの分割要否を決定する。 Next, the division determination unit 1312 determines whether or not the target node needs to be split based on information (split_transform_flag) indicating whether or not the target node is to be split.
 split=1であるので、分割決定部1312は、対象ノードを分割することを決定する。 Since split = 1, the division determination unit 1312 determines to divide the target node.
 分割領域設定部1313は、depthを1加算し、変換サイズ決定情報に基づいて、対象ノードについて、TU分割パターンを設定する。分割領域設定部1313は、対象領域である対象CUについて、depth=1のTU分割を実行する。 The division area setting unit 1313 adds 1 to the depth, and sets a TU division pattern for the target node based on the conversion size determination information. The divided region setting unit 1313 performs TU division with depth = 1 for the target CU that is the target region.
 図17に示す変換サイズ決定情報の定義に従って、分割領域設定部1313は、depth=1では、対象ノードを32×8の領域に四分木分割する。 17, according to the definition of the transform size determination information shown in FIG. 17, the division region setting unit 1313 divides the target node into quadrants into 32 × 8 regions when depth = 1.
 これにより、対象ノードは、図18の(b)に示す分割方式で、TU0、TU1、TU2、および、TU3の4つの横長の長方形領域に分割される。 Thereby, the target node is divided into four horizontally long rectangular regions TU0, TU1, TU2, and TU3 by the division method shown in FIG.
 さらに対象領域設定部1311は、depth=1の分割深度において、TU0、TU1、TU2、および、TU3の各ノードを、順に対象領域に設定する。 Further, the target area setting unit 1311 sets each node of TU0, TU1, TU2, and TU3 as target areas in order at the division depth of depth = 1.
 ここで、TU1について、split=1が設定されているので、分割決定部1312は、TU1を分割する事を決定する。 Here, since split = 1 is set for TU1, the division determination unit 1312 determines to divide TU1.
 分割領域設定部1313は、TU1について、depth=2のTU分割を実行する。図17に示す変換サイズ決定情報の定義に従って、分割領域設定部1313は、depth=2では、対象ノードを16×4の領域に四分木分割する。 The division area setting unit 1313 executes TU division with depth = 2 for TU1. In accordance with the definition of the transform size determination information illustrated in FIG. 17, the divided region setting unit 1313 divides the target node into a 16 × 4 region by quadtree division when depth = 2.
 これにより、対象ノードであるTU1は、図19の(a)に示す分割方式で、TU1-0、TU1-1、TU1-2、およびTU1-3の4つに横長の長方形領域に分割される。 As a result, the target node TU1 is divided into four horizontally long rectangular areas TU1-0, TU1-1, TU1-2, and TU1-3 in the division method shown in FIG. .
   [3-1]PU分割タイプが非対称の場合において分割領域サイズを導出する構成の例
 分割領域設定部1313は、PU分割タイプが非対称の場合、小さい方のPUでは、長方形(非正方形)の変換を適用する一方で、大きい方のPUの少なくとも一部では、正方形の変換を適用する構成であってもよい。
[3-1] Example of Configuration for Deriving Partition Area Size When PU Partition Type is Asymmetric The partition area setting unit 1313 converts a rectangle (non-square) in the smaller PU when the PU partition type is asymmetric. On the other hand, at least a part of the larger PU may be configured to apply a square transformation.
 例えば、変換サイズ決定情報記憶部1314に記憶される変換サイズ決定情報において、定義情報である小PUサイズ1314Aと、大PUサイズ1314Bとを設ける。 For example, in the conversion size determination information stored in the conversion size determination information storage unit 1314, a small PU size 1314A and a large PU size 1314B, which are definition information, are provided.
 小PUサイズ1314Aでは、非対称に分割されたPUのうち、小さいサイズのPUにおいて、長方形の変換が適用されるよう定義する。 The small PU size 1314A is defined such that rectangular transformation is applied to a PU having a small size among PUs divided asymmetrically.
 大PUサイズ1314Bは、非対称に分割されたPUのうち、大きいサイズのPUにおいて、正方形の変換が適用されるよう定義する。 The large PU size 1314B is defined such that square transformation is applied to a PU having a large size among PUs asymmetrically divided.
 また、分割領域設定部1313は、非対称に分割されたPUのサイズに応じて、小PUサイズ1314Aの定義情報と、大PUサイズ1314Bの定義情報とのいずれか一方を参照し、分割領域を設定する。 Also, the divided region setting unit 1313 sets a divided region by referring to either the definition information of the small PU size 1314A or the definition information of the large PU size 1314B according to the size of the asymmetrically divided PU. To do.
 図21を用いて、上記構成例によるTU分割について説明すると次のとおりである。 The TU partitioning according to the above configuration example will be described with reference to FIG.
 図21は、PU分割タイプが2N×nUである場合の上記構成例によるTU分割の例を示す図である。 FIG. 21 is a diagram illustrating an example of TU partitioning according to the above configuration example when the PU partition type is 2N × nU.
 まず、対象領域設定部1311は、TU分割処理が開始されると、対象CU全体を、対象領域の初期値として設定するとともに、depth=0とする。なお、depth=0では、領域垂直方向中央より上方において点線にて、PU境界B2を示している。 First, when the TU partitioning process is started, the target area setting unit 1311 sets the entire target CU as an initial value of the target area and sets depth = 0. When depth = 0, the PU boundary B2 is indicated by a dotted line above the center in the region vertical direction.
 次に、分割決定部1312が、対象ノードを分割するか否かを示す情報(split_transform_flag)に基づいて、対象ノードの分割要否を決定する。 Next, the division determination unit 1312 determines whether or not the target node needs to be split based on information (split_transform_flag) indicating whether or not the target node is to be split.
 split=1であるので、分割決定部1312は、対象ノードを分割することを決定する。 Since split = 1, the division determination unit 1312 determines to divide the target node.
 分割領域設定部1313は、depthを1加算し、変換サイズ決定情報に基づいて、対象ノードについて、TU分割パターンを設定する。分割領域設定部1313は、対象領域である対象CUについて、depth=1のTU分割を実行する。 The division area setting unit 1313 adds 1 to the depth, and sets a TU division pattern for the target node based on the conversion size determination information. The divided region setting unit 1313 performs TU division with depth = 1 for the target CU that is the target region.
 ここで、分割領域設定部1313は、小PUサイズ1314Aに従って、非対称に分割されたPUのうち、小さいサイズのPUについて、横長の長方形のTU分割を行う。 Here, the divided region setting unit 1313 performs a horizontally-long rectangular TU partition for a small size PU among the PUs asymmetrically divided according to the small PU size 1314A.
 また、分割領域設定部1313は、大PUサイズ1314Bに従って、非対称に分割されたPUのうち、大きいサイズのPUについて、正方形のTU分割を含める。なお、分割領域設定部1313は、PU境界側に位置する領域については、図21に示すように長方形のTU分割領域を含めてもかまわない。 Further, the divided region setting unit 1313 includes a square TU partition for a large size PU among the PUs asymmetrically divided according to the large PU size 1314B. Note that the divided region setting unit 1313 may include a rectangular TU divided region as shown in FIG. 21 for the region located on the PU boundary side.
 結果として、分割領域設定部1313は、depth=1では、対象ノードを、2つの長方形のノードおよび2つの正方形のノードに四分木分割する。 As a result, the divided region setting unit 1313 divides the target node into quadrants into two rectangular nodes and two square nodes when depth = 1.
 これにより、対象ノードは、横長の長方形のTU0およびTU1と、正方形のTU2およびTU3との4つの領域に分割される。 Thereby, the target node is divided into four regions of horizontally long rectangular TU0 and TU1 and square TU2 and TU3.
 さらに対象領域設定部1311は、depth=1の分割深度において、TU0、TU1、TU2、および、TU3の各ノードを、順に対象領域に設定する。 Further, the target area setting unit 1311 sets each node of TU0, TU1, TU2, and TU3 as target areas in order at the division depth of depth = 1.
 ここで、TU0およびTU2について、split=1が設定されているので、分割決定部1312は、TU0およびTU2を分割する事を決定する。 Here, since split = 1 is set for TU0 and TU2, the division determination unit 1312 determines to divide TU0 and TU2.
 分割領域設定部1313は、TU0およびTU2について、depth=2のTU分割を実行する。分割領域設定部1313は、depth=2では、TU0を、4つの横長の長方形にTU分割し、TU2を、4つの正方形にTU分割する。 The division region setting unit 1313 executes TU division with depth = 2 for TU0 and TU2. The division region setting unit 1313 TU-divides TU0 into four horizontally long rectangles and TU-divides TU2 into four squares when depth = 2.
 これにより、TU0は、TU0-0、TU0-1、TU0-2、およびTU0-3の4つに横長の長方形領域に分割される。また、TU2は、TU2-0、TU2-1、TU2-2、およびTU2-3の4つに横長の長方形領域に分割される。 Thus, TU0 is divided into four horizontally long rectangular areas, TU0-0, TU0-1, TU0-2, and TU0-3. In addition, TU2 is divided into four horizontally long rectangular areas, TU2-0, TU2-1, TU2-2, and TU2-3.
 なお、上記のようにPU分割タイプが非対称のCUにおけるTU分割を行う場合、パーティションがPU境界をまたがず、かつ、分割後の各TU分割領域の面積が同一となるよう分割することが好ましい。 When performing TU partitioning in a CU with an asymmetric PU partition type as described above, it is preferable to partition so that the partition does not cross the PU boundary and the area of each divided TU partition region is the same. .
   [作用・効果]
 本発明は以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する変換単位分割手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers. In the image decoding apparatus that decodes the prediction residual for each transform unit obtained in this way and restores the image by adding the prediction residual to the predicted image, the division type into the prediction units is different from the encoding unit. A division type of a target coding unit that is the above-mentioned coding unit to be decoded, including asymmetrical division that divides a size into prediction units or a symmetric division that divides a coding unit into a plurality of prediction units of the same size Is a unit comprising a transform unit dividing means for determining a transform unit division method according to the size of the prediction unit included in the target coding unit.
 よって、分割タイプが非対称分割であるときは、上記対象符号化単位に含まれる予測単位の大きさに応じて、効率よく相関を除去できるような変換単位の分割方式を選択することができる。 Therefore, when the division type is asymmetric division, it is possible to select a conversion unit division method that can efficiently remove the correlation according to the size of the prediction unit included in the target coding unit.
   [3-2]一部のCUサイズにおいて、PU分割タイプが正方形の分割であるとき非矩形変換を適用する構成の例
   [構成例3-2-1]
 分割領域設定部1313は、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割してもよい。
[3-2] Example of configuration in which non-rectangular transformation is applied when the PU partition type is a square partition in some CU sizes [Configuration Example 3-2-1]
When the PU division type is square division, the division region setting unit 1313 may divide the target node into non-squares.
 そこで、変換サイズ決定情報記憶部1314に記憶される変換サイズ決定情報において、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割する旨定義する正方形PU分割タイプ1314Cが定義されていてもよい。 Therefore, in the transform size determination information stored in the transform size determination information storage unit 1314, when the PU partition type is square partition, a square PU partition type 1314C that defines that the target node is split into non-squares is defined. May be.
 そして、分割領域設定部1313は、PU分割タイプが正方形の分割である場合、正方形PU分割タイプ1314Cを参照して対象ノードを非正方形に分割する。 Then, when the PU partition type is square partition, the partition region setting unit 1313 refers to the square PU partition type 1314C and divides the target node into a non-square.
 分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、TU分割において領域を32×8のノードに分割してもよい。 When the CU size is 32 × 32 size and the PU partition type is 2N × 2N, the partition region setting unit 1313 may divide the region into 32 × 8 nodes in the TU partition.
 また、分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、TU分割の分割方式を示す情報を追加で復号し、復号した情報に基づいて32×8、16×16、8×32のいずれかのノードに分割してもよい。 In addition, when the CU size is 32 × 32 size and the PU partition type is 2N × 2N, the partition region setting unit 1313 additionally decodes information indicating the TU partitioning scheme, and decodes the information. May be divided into any of 32 × 8, 16 × 16, and 8 × 32 nodes.
 また、分割領域設定部1313は、CUサイズが、32×32サイズであり、かつPU分割タイプが、2N×2Nである場合、隣接CUのサイズおよびPU分割タイプに基づいて、対象CUを分割するTUサイズを推定してもよい。また、分割領域設定部1313は、以下の(i)~(iii)のとおり推定を行ってもよい。 Also, the divided region setting unit 1313 divides the target CU based on the size of the adjacent CU and the PU division type when the CU size is 32 × 32 size and the PU division type is 2N × 2N. The TU size may be estimated. Further, the divided region setting unit 1313 may perform estimation as described in (i) to (iii) below.
 (i)  左辺にCU境界またはPU境界が存在し、上辺にはCU境界およびPU境界の境界が存在しない場合、32×8を選択。 (I) If there is a CU boundary or PU boundary on the left side, and no CU boundary or PU boundary exists on the upper side, select 32x8.
 (ii) 上辺にCU境界またはPU境界が存在し、左辺にはCU境界およびPU境界の境界が存在しない場合、8×32を選択。 (Ii) If there is a CU boundary or PU boundary on the upper side and no CU boundary or PU boundary on the left side, select 8x32.
 (iii) 上記(i)および(ii)以外(左辺または上辺に境界が存在するか、左辺および上辺のいずれにも境界が存在しない場合)、16×16を選択。 (Iii) Other than the above (i) and (ii) (when there is a boundary on the left side or the upper side, or there is no boundary on either the left side or the upper side), 16 × 16 is selected.
   [作用・効果]
 本発明は、以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記変換単位への分割方式は、正方形および長方形の分割を含み、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する分割手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers. In the image decoding apparatus that decodes the prediction residual for each conversion unit obtained in this way and restores the image by adding the prediction residual to the prediction image, the division method into the conversion units includes square and rectangular divisions When the shape of the target prediction unit, which is the prediction unit to be decoded, is a square, the unit includes a dividing unit that divides the target conversion unit by a rectangular division method.
 上記構成による作用・効果は以下のとおりである。領域内にエッジが存在し、画像に方向性があるにもかかわらず、正方形の予測単位が選択される場合がある。例えば、多数の横エッジが存在するオブジェクトが移動している場合、オブジェクト内では、動きは一様であるため、正方形の予測単位が選択される。しかしながら、このような場合は、変換処理では、横エッジに沿った、水平方向に長い形状の変換単位を適用することが望ましい。 The actions and effects of the above configuration are as follows. A square prediction unit may be selected even though an edge exists in the region and the image has directionality. For example, when an object having a large number of horizontal edges is moving, since the motion is uniform within the object, a square prediction unit is selected. However, in such a case, in the conversion process, it is desirable to apply a conversion unit having a shape that is long in the horizontal direction along the horizontal edge.
 上記構成によれば、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。 According to the above configuration, when the shape of the target prediction unit that is the prediction unit to be decoded is a square, the target conversion unit is divided by a rectangular division method.
 よって、正方形の符号化単位においても、長方形の変換単位を選択することができ、このため上記のような領域に対する符号化効率を向上させることができる。 Therefore, even in the square coding unit, a rectangular conversion unit can be selected, and thus the coding efficiency for the region as described above can be improved.
   [構成例3-2-2]
 上記構成3-2-1に加えて、分割領域設定部1313は、CUサイズが、16×16サイズであり、かつPU分割タイプが、2N×2Nである場合、各分割深度において以下のとおり分割を行う。
[Configuration Example 3-2-2]
In addition to the configuration 3-2-1 above, the divided region setting unit 1313 divides as follows at each division depth when the CU size is 16 × 16 size and the PU division type is 2N × 2N. I do.
 分割深度=1 … 16×4のTUに分割する。 Dividing depth = 1 ... Divide into 16x4 TUs.
 分割深度=2 … 4×4のTUに分割する。 Dividing depth = 2 ... Divide into 4x4 TUs.
 上記構成によれば、4×4のTUにおいて、16×16CUのPU分割タイプに依存せず、スキャン順が統一される。4×4のTUにおいて、16×16CUのPU分割タイプが異なることで、スキャン順が統一されていないと、16×16CUのPU分割タイプに応じてスキャン処理を変更しなければならないため、処理が複雑となる。よって、このようなスキャン順の不統一は、処理のボトルネックとなり得る。 According to the above configuration, in the 4 × 4 TU, the scan order is unified without depending on the 16 × 16 CU PU partition type. Since the 4 × 4 TU has different PU partition types of 16 × 16 CU, and the scan order is not unified, the scan processing must be changed according to the PU partition type of 16 × 16 CU. It becomes complicated. Therefore, such ununiformity in scan order can be a bottleneck in processing.
 上記構成によれば、スキャン順が統一されることにより、処理を簡略化できるという効果を奏する。 According to the above configuration, the processing order can be simplified by unifying the scan order.
 図22および図23を用いて、より具体的に説明すると、以下のとおりである。まず、図22に示すTU分割から説明する。図22は、図17に示した変換サイズ決定情報に従って分割を行った場合のTU分割の流れを示している。 More specific description will be made with reference to FIGS. 22 and 23 as follows. First, the TU division shown in FIG. 22 will be described. FIG. 22 shows the flow of TU partitioning when partitioning is performed according to the transform size determination information shown in FIG.
 図22の(a)に示すように、PU分割タイプが2N×2Nの場合 … depth=1において、分割領域設定部1313は、対象ノードの正方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、正方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。ここで、スキャン順は、再帰的なzスキャンが用いられる。具体的には、図22に図示するとおりである。 22A, when the PU partition type is 2N × 2N. When depth = 1, the partition region setting unit 1313 performs quadtree partitioning of the target node square. In addition, at depth = 2, the divided region setting unit 1313 further performs square quadtree division for each node divided into squares. Here, a recursive z-scan is used as the scan order. Specifically, it is as illustrated in FIG.
 図22の(b)に示すように、PU分割タイプが2N×nUの場合 … depth=1において、分割領域設定部1313は、対象ノードに対して、横長の長方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、横長の長方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。ここで、各TUのスキャン順は、ラスタスキャンが用いられる。具体的には、図22に図示するとおりである。 22B, when the PU partition type is 2N × nU. When depth = 1, the partition region setting unit 1313 performs horizontally-long rectangular quadtree partitioning on the target node. In addition, at depth = 2, the divided region setting unit 1313 further performs square quadtree division on each node divided into horizontally long rectangles. Here, raster scan is used as the scan order of each TU. Specifically, it is as illustrated in FIG.
 次に、図23に示すTU分割について説明する。図23は、正方形PU分割タイプ1314Cに従って、PU分割タイプが2N×2Nの領域の分割を行った場合のTU分割の流れを示している。 Next, the TU division shown in FIG. 23 will be described. FIG. 23 shows the flow of TU partitioning when a region of PU partition type 2N × 2N is performed according to the square PU partition type 1314C.
 PU分割タイプ:2N×2Nの場合 … depth=1において、分割領域設定部1313は、対象ノードに対して、横長の長方形の4分木分割を行う。また、depth=2において、分割領域設定部1313は、横長の長方形に分割された各ノードに対して、さらに正方形の4分木分割を行う。 PU partition type: 2N × 2N ... When depth = 1, the partition region setting unit 1313 performs horizontally-long rectangular quadtree partitioning on the target node. In addition, at depth = 2, the divided region setting unit 1313 further performs square quadtree division on each node divided into horizontally long rectangles.
 その結果、スキャン順は、ラスタスキャンが用いられる。よって、PU分割タイプが2N×nUである場合と、2N×2Nである場合との間で、スキャン順をラスタスキャンに統一することができる。 As a result, raster scan is used as the scan order. Therefore, the scan order can be unified to the raster scan between the case where the PU division type is 2N × nU and the case where it is 2N × 2N.
   [変換係数復元部]
 次に、再び図16を参照しながら、変換係数復元部132の詳細について説明する。変換係数復元部132は、より詳細には、非ゼロ係数判定部1321および変換係数導出部1322を備える。
[Transform coefficient restoration unit]
Next, details of the transform coefficient restoration unit 132 will be described with reference to FIG. 16 again. More specifically, the transform coefficient restoration unit 132 includes a non-zero coefficient determination unit 1321 and a transform coefficient derivation unit 1322.
 非ゼロ係数判定部1321は、判定情報復号部(係数復号手段)1032を用いて、対象CUに含まれる各TUまたは変換ツリーについての非ゼロ変換係数の存否情報を復号し、各TUに非ゼロ変換係数が存在するか否かを判定する。 The non-zero coefficient determination unit 1321 uses the determination information decoding unit (coefficient decoding unit) 1032 to decode the presence / absence information of the non-zero conversion coefficient for each TU or conversion tree included in the target CU, and non-zero for each TU. It is determined whether a conversion coefficient exists.
 変換係数導出部1322は、変換係数復号部(係数復号手段)1033を用いて非ゼロ変換係数が存在する各TUの変換係数を復元する一方で、非ゼロ変換係数が存在しない各TUの変換係数を0(ゼロ)に設定する。 The transform coefficient deriving unit 1322 uses the transform coefficient decoding unit (coefficient decoding unit) 1033 to restore the transform coefficient of each TU in which the non-zero transform coefficient exists, while the transform coefficient of each TU in which the non-zero transform coefficient does not exist. Is set to 0 (zero).
   [復号モジュール]
 図16に示すように、復号モジュール10は、領域分割フラグ復号部1031、判定情報復号部1032、変換係数復号部1033、およびコンテキスト記憶部1034を備える。
[Decryption module]
As illustrated in FIG. 16, the decoding module 10 includes a region division flag decoding unit 1031, a determination information decoding unit 1032, a transform coefficient decoding unit 1033, and a context storage unit 1034.
 領域分割フラグ復号部1031は、分割決定部1312から供給される符号化データおよびシンタックス種別に応じて、符号化データに含まれるバイナリからシンタックス値の復号を行う。領域分割フラグ復号部1031は、対象ノードを分割するか否かを示す情報(split_transform_flag)を復号する。 The region division flag decoding unit 1031 decodes the syntax value from the binary included in the encoded data according to the encoded data and syntax type supplied from the division determination unit 1312. The area division flag decoding unit 1031 decodes information (split_transform_flag) indicating whether or not to divide the target node.
 判定情報復号部1032は、変換係数導出部1322から供給される非ゼロ変換係数の存否情報の符号化データおよびシンタックス種別に応じて、当該符号化データに含まれるバイナリからシンタックス値の復号を行う。判定情報復号部1032が復号するシンタックスは、具体的には、no_residual_data_flag、cbf_luma、cbf_cb、cbf_cr、およびcbp等である。 The determination information decoding unit 1032 decodes the syntax value from the binary included in the encoded data according to the encoded data and the syntax type of the non-zero transform coefficient existence information supplied from the transform coefficient deriving unit 1322. Do. The syntax decoded by the determination information decoding unit 1032 is specifically no_residual_data_flag, cbf_luma, cbf_cb, cbf_cr, and cbp.
 変換係数復号部1033は、変換係数導出部1322から供給される変換係数の符号化データおよびシンタックス種別に応じて、当該符号化データに含まれるバイナリからシンタックス値の復号を行う。変換係数復号部1033が復号するシンタックスは、具体的には、変換係数の絶対値であるレベル(level)、変換係数の符号(sign)、連続するゼロのランの長さ(run)などである。 The transform coefficient decoding unit 1033 decodes the syntax value from the binary included in the encoded data according to the encoded data of the transform coefficient supplied from the transform coefficient deriving unit 1322 and the syntax type. Specifically, the syntax decoded by the transform coefficient decoding unit 1033 is a level (level) that is an absolute value of the transform coefficient, a sign of the transform coefficient (sign), a length of run of consecutive zeros (run), and the like. is there.
 コンテキスト記憶部1034は、判定情報復号部1032および変換係数復号部1033が、復号処理の際に参照するコンテキストが記憶されている。 The context storage unit 1034 stores a context that the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 refer to in the decoding process.
   [3-3]変換係数復号時にコンテキストを参照する具体的構成
 判定情報復号部1032および変換係数復号部1033は、それぞれ、PU分割タイプが非対称分割である場合、小さい方のPUに含まれるTUと、大きい方のPUに含まれるTUとで異なるコンテキストを用いて、変換係数に係るシンタックス値を復号する構成であってもよい。例えば、そのようなシンタックスの種類として、非ゼロ変換係数フラグ、変換係数レベル、変換係数のラン、TUツリーの各ノードにおける非ゼロ変換係数の存否情報が含まれる。前記シンタックスの組み合わせを含んでいてもよい。
[3-3] Specific Configuration Referencing Context at Transform Coefficient Decoding When the PU partition type is asymmetric partition, each of the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 includes a TU included in the smaller PU. The syntax value related to the transform coefficient may be decoded using different contexts for the TU included in the larger PU. For example, such syntax types include non-zero transform coefficient flags, transform coefficient levels, transform coefficient runs, and non-zero transform coefficient presence / absence information at each node of the TU tree. A combination of the syntaxes may be included.
 そこで、コンテキスト記憶部1034では、小さい方のPUに含まれるTUにおいて参照されるコンテキストにおける変換係数に係る各種シンタックス値に対応する確率設定値である小PUサイズ1034Aと、大きい方のPUに含まれるTUにおいて参照されるコンテキストにおける確率設定値である大PUサイズ1034Bとが記憶されていてもよい。ここで、小PUサイズ1034Aおよび大PUサイズ1034Bは異なるコンテキストに対応する確率設定値である。 Therefore, the context storage unit 1034 includes the small PU size 1034A, which is a probability setting value corresponding to various syntax values related to transform coefficients in the context referred to in the TU included in the smaller PU, and the larger PU. The large PU size 1034B that is the probability setting value in the context referred to in the TU to be stored may be stored. Here, the small PU size 1034A and the large PU size 1034B are probability setting values corresponding to different contexts.
 判定情報復号部1032は、対象TUが、小さいPUに含まれる場合、小PUサイズ1034Aを参照する一方で、対象TUが、大きい方のPUに含まれる場合、大PUサイズ1034Bを参照し、対象TUにおけるCbf(cbf_luma、cbf_cb、cbf_cr等)を算術復号する。 The determination information decoding unit 1032 refers to the small PU size 1034A when the target TU is included in the small PU, while referring to the large PU size 1034B when the target TU is included in the larger PU. Cbf (cbf_luma, cbf_cb, cbf_cr, etc.) in the TU is arithmetically decoded.
 また、変換係数復号部1033は、対象TUが、小さいPUに含まれる場合、小PUサイズ1034Aを参照する一方で、対象TUが、大きい方のPUに含まれる場合、大PUサイズ1034Bを参照し、対象TUにおける変換係数(level、sign、run等)を算術復号する。 Also, the transform coefficient decoding unit 1033 refers to the small PU size 1034A when the target TU is included in a small PU, and refers to the large PU size 1034B when the target TU is included in a larger PU. , Arithmetically decode transform coefficients (level, sign, run, etc.) in the target TU.
 なお、判定情報復号部1032および変換係数復号部1033は、対象TUが、大きい方のPUに含まれる場合であって、対象TUが、小さい方のPUに近い側に位置するとき、小PUサイズ1034Aを参照してもかまわない。 Note that the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 have a small PU size when the target TU is included in the larger PU and the target TU is located closer to the smaller PU. Reference may be made to 1034A.
 言い換えれば、対象TUが、大きい方のPUに含まれる場合であっても、対象TUがPU境界の近傍に位置している場合、判定情報復号部1032および変換係数復号部1033は、小PUサイズ1034Aを参照してもかまわない。 In other words, even when the target TU is included in the larger PU, if the target TU is located near the PU boundary, the determination information decoding unit 1032 and the transform coefficient decoding unit 1033 have the small PU size. Reference may be made to 1034A.
 小さい方のPUには、エッジが存在する可能性が高く変換係数が発生しやすい。これに対して、大きい方のPUでは変換係数が発生しにくい。対象TUが、小さいPUに含まれる場合と大きい方のPUに含まれる場合とで、異なるコンテキストを用いることで、それぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。 The smaller PU is likely to have an edge, and conversion coefficients are likely to occur. On the other hand, conversion coefficients are less likely to occur in the larger PU. By using different contexts depending on whether the target TU is included in a small PU or a larger PU, variable-length decoding can be performed according to the occurrence probability of a transform coefficient in each region. .
   [作用・効果]
 本発明は、以下のとおり表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、異なる大きさの予測単位に分割する非対称形への分割および同一の大きさの予測単位に分割する対称形への分割を含み、復号の対象となる上記予測単位である対象予測単位の分割タイプが非対称形への分割であるとき、該分割により得られた小さい予測単位および大きい予測単位の間で、異なるコンテキストを参照して変換係数を復号する係数復号手段を備える構成である。
[Action / Effect]
The present invention can also be expressed as follows. That is, the image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and divides the coding unit into one or more numbers. In the image decoding apparatus that decodes the prediction residual for each conversion unit obtained in this way and restores the image by adding the prediction residual to the prediction image, the division type into the prediction units is a prediction unit of a different size. Including the division into the asymmetric form to be divided and the division into the symmetric form to be divided into prediction units of the same size, the division type of the target prediction unit that is the prediction unit to be decoded is division into the asymmetric form In some cases, coefficient decoding means is provided for decoding transform coefficients with reference to different contexts between the small prediction unit and the large prediction unit obtained by the division.
 よって、小さい予測単位に含まれる変換単位および大きい予測単位に含まれる変換単位のそれぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。 Therefore, it is possible to perform variable length decoding according to the probability of occurrence of transform coefficients in the respective regions of transform units included in a small prediction unit and transform units included in a large prediction unit.
  (処理の流れ)
 図24を用いて、動画像復号装置1におけるCU復号処理について説明すると以下のとおりである。なお、以下では、対象CUは、インターCU、または、スキップCUであるとする。図24は、動画像復号装置1におけるCU復号処理(インター/スキップCU)の流れの一例について示すフローチャートである。
(Process flow)
The CU decoding process in the moving image decoding apparatus 1 will be described with reference to FIG. In the following, it is assumed that the target CU is an inter CU or a skip CU. FIG. 24 is a flowchart illustrating an example of a flow of CU decoding processing (inter / skip CU) in the video decoding device 1.
 CU復号処理が開始されると、CU情報復号部11が、復号モジュール10を用いて、対象CUについてCU予測情報を復号する(S11)。この処理は、CU単位で行われる。 When the CU decoding process is started, the CU information decoding unit 11 decodes the CU prediction information for the target CU using the decoding module 10 (S11). This process is performed on a CU basis.
 具体的には、CU情報復号部11において、CU予測モード決定部111が、復号モジュール10を用いて、スキップフラグSKIPを復号する。また、スキップフラグがスキップCUであることを示していなければ、さらに、CU予測モード決定部111は、復号モジュール10を用いて、CU予測タイプ情報Pred_typeを復号する。 Specifically, in the CU information decoding unit 11, the CU prediction mode determination unit 111 decodes the skip flag SKIP using the decoding module 10. If the skip flag does not indicate a skip CU, the CU prediction mode determination unit 111 further decodes the CU prediction type information Pred_type using the decoding module 10.
 次に、PU単位の処理が行われる。すなわち、PU情報復号部12が備える動き補償パラメータ導出部121が、動き情報を復号するとともに(S12)、予測画像生成部14が、復号された当該動き情報に基づいてインター予測により予測画像を生成する(S13)。 Next, PU unit processing is performed. That is, the motion compensation parameter deriving unit 121 included in the PU information decoding unit 12 decodes the motion information (S12), and the predicted image generation unit 14 generates a predicted image by inter prediction based on the decoded motion information. (S13).
 次に、TU情報復号部13が、TU分割復号処理を行う(S14)。具体的には、TU情報復号部13において、TU分割設定部131が、符号化データから復号したパラメータとCUサイズおよびPU分割タイプとに基づいて、TU分割の方式を設定する。この処理は、CU単位で行われる。 Next, the TU information decoding unit 13 performs a TU division decoding process (S14). Specifically, in the TU information decoding unit 13, the TU partition setting unit 131 sets the TU partitioning method based on the parameters decoded from the encoded data, the CU size, and the PU partition type. This process is performed on a CU basis.
 次に、TU単位の処理が行われる。すなわち、TU情報復号部13が、変換係数を復号し(S15)、逆量子化・逆変換部15が、復号された変換係数から予測残差を導出する(S16)。 Next, TU unit processing is performed. That is, the TU information decoding unit 13 decodes the transform coefficient (S15), and the inverse quantization / inverse transform unit 15 derives a prediction residual from the decoded transform coefficient (S16).
 次に、加算器17において、予測画像と予測残差とが加算されることにより、復号画像が生成される(S17)。この処理は、CU単位で行われる。 Next, the adder 17 adds the predicted image and the prediction residual to generate a decoded image (S17). This process is performed on a CU basis.
 〔動画像符号化装置〕
 以下において、本実施形態に係る動画像符号化装置2について、図25および図26を参照して説明する。
[Moving picture encoding device]
Hereinafter, the moving picture coding apparatus 2 according to the present embodiment will be described with reference to FIGS. 25 and 26.
  (動画像符号化装置の概要)
 動画像符号化装置2は、概略的に言えば、入力画像#10を符号化することによって符号化データ#1を生成し、出力する装置である。
(Outline of video encoding device)
Generally speaking, the moving image encoding device 2 is a device that generates and outputs encoded data # 1 by encoding the input image # 10.
  (動画像符号化装置の構成)
 まず、図25を用いて、動画像符号化装置2の構成例について説明する。図25は、動画像符号化装置2の構成について示す機能ブロック図である。図25に示すように、動画像符号化装置2は、符号化設定部21、逆量子化・逆変換部22、予測画像生成部23、加算器24、フレームメモリ25、減算器26、変換・量子化部27、および符号化データ生成部(符号化手段)29を備えている。
(Configuration of video encoding device)
First, a configuration example of the video encoding device 2 will be described with reference to FIG. FIG. 25 is a functional block diagram illustrating the configuration of the moving image encoding device 2. As shown in FIG. 25, the moving image encoding apparatus 2 includes an encoding setting unit 21, an inverse quantization / inverse conversion unit 22, a predicted image generation unit 23, an adder 24, a frame memory 25, a subtractor 26, A quantization unit 27 and an encoded data generation unit (encoding means) 29 are provided.
 符号化設定部21は、入力画像#10に基づいて、符号化に関する画像データおよび各種の設定情報を生成する。 The encoding setting unit 21 generates image data related to encoding and various setting information based on the input image # 10.
 具体的には、符号化設定部21は、次の画像データおよび設定情報を生成する。 Specifically, the encoding setting unit 21 generates the next image data and setting information.
 まず、符号化設定部21は、入力画像#10を、スライス単位、ツリーブロック単位に順次分割することにより、対象CUについてのCU画像#100を生成する。 First, the encoding setting unit 21 generates the CU image # 100 for the target CU by sequentially dividing the input image # 10 into slice units and tree block units.
 また、符号化設定部21は、分割処理の結果に基づいて、ヘッダ情報H’を生成する。ヘッダ情報H’は、(1)対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報、並びに、(2)各ツリーブロックに属するCUのサイズ、形状および対象ツリーブロック内での位置についてのCU情報CU’を含んでいる。 Also, the encoding setting unit 21 generates header information H ′ based on the result of the division process. The header information H ′ includes (1) information on the size and shape of the tree block belonging to the target slice and the position in the target slice, and (2) the size, shape and shape of the CU belonging to each tree block. CU information CU ′ for the position at
 さらに、符号化設定部21は、CU画像#100、および、CU情報CU’を参照して、PT設定情報PTI’を生成する。PT設定情報PTI’には、(1)対象CUの各PUへの可能な分割パターン、および、(2)各PUに割り付ける可能な予測モード、の全ての組み合わせに関する情報が含まれる。 Further, the encoding setting unit 21 refers to the CU image # 100 and the CU information CU 'to generate PT setting information PTI'. The PT setting information PTI 'includes information on all combinations of (1) possible division patterns of the target CU for each PU and (2) prediction modes that can be assigned to each PU.
 符号化設定部21は、各分割パターンおよび各予測モードの組み合わせのコストを算出し、最低コストの分割パターンおよび予測モードを決定する。 The encoding setting unit 21 calculates the cost of the combination of each division pattern and each prediction mode, and determines the lowest cost division pattern and prediction mode.
 符号化設定部21は、CU画像#100を減算器26に供給する。また、符号化設定部21は、ヘッダ情報H’を符号化データ生成部29に供給する。また、符号化設定部21は、PT設定情報PTI’を予測画像生成部23に供給する。 The encoding setting unit 21 supplies the CU image # 100 to the subtractor 26. In addition, the encoding setting unit 21 supplies the header information H ′ to the encoded data generation unit 29. Also, the encoding setting unit 21 supplies the PT setting information PTI ′ to the predicted image generation unit 23.
 逆量子化・逆変換部22は、変換・量子化部27より供給される、ブロック毎の量子化予測残差を、逆量子化、および、逆直交変換することによって、ブロック毎の予測残差を復元する。逆直交変換については、図2に示す逆量子化・逆変換部15について、既に説明したとおりであるので、ここではその説明を省略する。 The inverse quantization / inverse transform unit 22 performs inverse quantization and inverse orthogonal transform on the quantized prediction residual for each block supplied from the transform / quantization unit 27, thereby predicting the prediction residual for each block. To restore. The inverse orthogonal transform is as already described for the inverse quantization / inverse transform unit 15 shown in FIG.
 また、逆量子化・逆変換部22は、ブロック毎の予測残差を、TT分割情報(後述)により指定される分割パターンに従って統合し、対象CUについての予測残差Dを生成する。逆量子化・逆変換部22は、生成した対象CUについての予測残差Dを、加算器24に供給する。 Also, the inverse quantization / inverse transform unit 22 integrates the prediction residual for each block according to the division pattern specified by the TT division information (described later), and generates the prediction residual D for the target CU. The inverse quantization / inverse transform unit 22 supplies the prediction residual D for the generated target CU to the adder 24.
 予測画像生成部23は、フレームメモリ25に記録されている局所復号画像P’、および、PT設定情報PTI’を参照して、対象CUについての予測画像Predを生成する。予測画像生成部23は、予測画像生成処理により得られた予測パラメータを、PT設定情報PTI’に設定し、設定後のPT設定情報PTI’を符号化データ生成部29に転送する。なお、予測画像生成部23による予測画像生成処理は、動画像復号装置1の備える予測画像生成部14と同様であるので、ここでは説明を省略する。 The predicted image generation unit 23 refers to the local decoded image P ′ and the PT setting information PTI ′ recorded in the frame memory 25 to generate a predicted image Pred for the target CU. The predicted image generation unit 23 sets the prediction parameter obtained by the predicted image generation process in the PT setting information PTI ′, and transfers the set PT setting information PTI ′ to the encoded data generation unit 29. Note that the predicted image generation process performed by the predicted image generation unit 23 is the same as that performed by the predicted image generation unit 14 included in the video decoding device 1, and thus description thereof is omitted here.
 加算器24は、予測画像生成部23より供給される予測画像Predと、逆量子化・逆変換部22より供給される予測残差Dとを加算することによって、対象CUについての復号画像Pを生成する。 The adder 24 adds the predicted image Pred supplied from the predicted image generation unit 23 and the prediction residual D supplied from the inverse quantization / inverse transform unit 22 to thereby obtain the decoded image P for the target CU. Generate.
 フレームメモリ25には、復号された復号画像Pが順次記録される。フレームメモリ25には、対象ツリーブロックを復号する時点において、当該対象ツリーブロックよりも先に復号された全てのツリーブロック(例えば、ラスタスキャン順で先行する全てのツリーブロック)に対応する復号画像が、当該復号画像Pの復号に用いられたパラメータと共に、記録されている。 Decoded decoded image P is sequentially recorded in the frame memory 25. In the frame memory 25, decoded images corresponding to all tree blocks decoded prior to the target tree block (for example, all tree blocks preceding in the raster scan order) at the time of decoding the target tree block. Are recorded together with the parameters used for decoding the decoded image P.
 減算器26は、CU画像#100から予測画像Predを減算することによって、対象CUについての予測残差Dを生成する。減算器26は、生成した予測残差Dを、変換・量子化部27に供給する。 The subtractor 26 generates a prediction residual D for the target CU by subtracting the prediction image Pred from the CU image # 100. The subtractor 26 supplies the generated prediction residual D to the transform / quantization unit 27.
 変換・量子化部27は、予測残差Dに対して、直交変換および量子化を行うことで量子化予測残差を生成する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことをさす。また、逆直交変換の例としては、DCT変換(Discrete Cosine Transform)、およびDST変換(Discrete Sine Transform)等が挙げられる。 The transform / quantization unit 27 generates a quantized prediction residual by performing orthogonal transform and quantization on the prediction residual D. Here, the orthogonal transform refers to an orthogonal transform from the pixel region to the frequency region. Examples of inverse orthogonal transformation include DCT transformation (DiscretecreCosine Transform), DST transformation (Discrete Sine Transform), and the like.
 具体的には、変換・量子化部27は、CU画像#100、および、CU情報CU’を参照し、対象CUの1または複数のブロックへの分割パターンを決定する。また、決定された分割パターンに従って、予測残差Dを、各ブロックについての予測残差に分割する。 Specifically, the transform / quantization unit 27 refers to the CU image # 100 and the CU information CU 'and determines a division pattern of the target CU into one or a plurality of blocks. Further, according to the determined division pattern, the prediction residual D is divided into prediction residuals for each block.
 また、変換・量子化部27は、各ブロックについての予測残差を直交変換することによって周波数領域における予測残差を生成した後、当該周波数領域における予測残差を量子化することによってブロック毎の量子化予測残差を生成する。 The transform / quantization unit 27 generates a prediction residual in the frequency domain by orthogonally transforming the prediction residual for each block, and then quantizes the prediction residual in the frequency domain to Generate quantized prediction residuals.
 また、変換・量子化部27は、生成したブロック毎の量子化予測残差と、対象CUの分割パターンを指定するTT分割情報と、対象CUの各ブロックへの可能な全分割パターンに関する情報とを含むTT設定情報TTI’を生成する。変換・量子化部27は、生成したTT設定情報TTI’を逆量子化・逆変換部22および符号化データ生成部29に供給する。 In addition, the transform / quantization unit 27 generates the quantization prediction residual for each block, TT division information that specifies the division pattern of the target CU, information about all possible division patterns for each block of the target CU, and TT setting information TTI ′ including is generated. The transform / quantization unit 27 supplies the generated TT setting information TTI ′ to the inverse quantization / inverse transform unit 22 and the encoded data generation unit 29.
 PU情報生成部30は、PT設定情報PTI’に示される予測タイプがインター予測である場合において、PT設定情報PTI’を符号化し、PT設定情報PTIを導出する。また、マージ候補についてのPTI設定情報PTI’を生成し、符号化設定部21に供給する。 The PU information generation unit 30 encodes the PT setting information PTI 'and derives the PT setting information PTI when the prediction type indicated in the PT setting information PTI' is inter prediction. Further, PTI setting information PTI ′ for the merge candidate is generated and supplied to the encoding setting unit 21.
 符号化データ生成部29は、ヘッダ情報H’、TT設定情報TTI’、およびPT設定情報PTI’を符号化し、符号化したヘッダ情報H、TT設定情報TTI、およびPT設定情報PTIを多重化して符号化データ#1を生成し、出力する。 The encoded data generation unit 29 encodes header information H ′, TT setting information TTI ′, and PT setting information PTI ′, and multiplexes the encoded header information H, TT setting information TTI, and PT setting information PTI. Coded data # 1 is generated and output.
  (動画像復号装置との対応関係)
 動画像符号化装置2は、動画像復号装置1の各構成と対応する構成を含む。ここで、対応とは、同様の処理、または、逆の処理を行う関係にあるということである。
(Correspondence relationship with video decoding device)
The video encoding device 2 includes a configuration corresponding to each configuration of the video decoding device 1. Here, “correspondence” means that the same processing or the reverse processing is performed.
 例えば、上述したように、動画像復号装置1が備える予測画像生成部14の予測画像生成処理と、動画像符号化装置2が備える予測画像生成部23の予測画像生成処理とは、同様である。 For example, as described above, the prediction image generation process of the prediction image generation unit 14 included in the video decoding device 1 and the prediction image generation process of the prediction image generation unit 23 included in the video encoding device 2 are the same. .
 例えば、動画像復号装置1において、ビット列から、シンタックス値を復号する処理は、動画像符号化装置2において、シンタックス値から、ビット列を符号化する処理と逆の処理としての対応となっている。 For example, the process of decoding a syntax value from a bit string in the video decoding device 1 corresponds to a process opposite to the process of encoding a bit string from a syntax value in the video encoding device 2. Yes.
 以下では、動画像符号化装置2における各構成が、動画像復号装置1のCU情報復号部11、PU情報復号部12、およびTU情報復号部13とどのような対応となっているかについて説明する。これにより、動画像符号化装置2における各構成の動作・機能はより詳細に明らかになるだろう。 In the following, it will be described how each configuration in the video encoding device 2 corresponds to the CU information decoding unit 11, the PU information decoding unit 12, and the TU information decoding unit 13 of the video decoding device 1. . Thereby, the operation and function of each component in the moving image encoding device 2 will be clarified in more detail.
 符号化データ生成部29は、復号モジュール10に対応している。より詳しくいえば、復号モジュール10が、符号化データおよびシンタックス種別に基づいてシンタックス値を導出するのに対して、符号化データ生成部29は、シンタックス値およびシンタックス種別に基づいて符号化データを生成する。 The encoded data generation unit 29 corresponds to the decoding module 10. More specifically, the decoding module 10 derives a syntax value based on the encoded data and the syntax type, whereas the encoded data generation unit 29 encodes the code based on the syntax value and the syntax type. Generate data.
 符号化設定部21は、動画像復号装置1のCU情報復号部11に対応している。符号化設定部21と、CU情報復号部11とを比較すると次のとおりである。 The encoding setting unit 21 corresponds to the CU information decoding unit 11 of the video decoding device 1. A comparison between the encoding setting unit 21 and the CU information decoding unit 11 is as follows.
 CU情報復号部11が、CU予測タイプ情報に係る符号化データとシンタックス種別とを復号モジュール10に供給し、復号モジュール10により復号されたCU予測タイプ情報に基づいてPU分割タイプを決定する。 The CU information decoding unit 11 supplies the encoded data and syntax type related to the CU prediction type information to the decoding module 10, and determines the PU partition type based on the CU prediction type information decoded by the decoding module 10.
 これに対して、符号化設定部21は、PU分割タイプを決定してCU予測タイプ情報を生成し、CU予測タイプ情報に係るシンタックス値とシンタックス種別とを符号化データ生成部29に供給する。 In response to this, the encoding setting unit 21 determines the PU partition type, generates CU prediction type information, and supplies the syntax value and syntax type related to the CU prediction type information to the encoded data generation unit 29. To do.
 なお、符号化データ生成部29は、復号モジュール10が備える二値化情報記憶部1012、コンテキスト記憶部1013、および確率設定記憶部1014と同様の構成を備えていてもよい。 Note that the encoded data generation unit 29 may have the same configuration as the binarized information storage unit 1012, the context storage unit 1013, and the probability setting storage unit 1014 included in the decoding module 10.
 PU情報生成部30および予測画像生成部23は、動画像復号装置1のPU情報復号部12および予測画像生成部14に対応している。これらを比較すると次のとおりである。 The PU information generation unit 30 and the predicted image generation unit 23 correspond to the PU information decoding unit 12 and the predicted image generation unit 14 of the video decoding device 1. These are compared as follows.
 上述のとおり、PU情報復号部12は、動き情報に係る符号化データとシンタックス種別とを復号モジュール10に供給し、復号モジュール10により復号された動き情報に基づいて動き補償パラメータを導出する。また、予測画像生成部14は、導出された動き補償パラメータに基づいて予測画像を生成する。 As described above, the PU information decoding unit 12 supplies the encoded data related to the motion information and the syntax type to the decoding module 10 and derives a motion compensation parameter based on the motion information decoded by the decoding module 10. Further, the predicted image generation unit 14 generates a predicted image based on the derived motion compensation parameter.
 これに対して、PU情報生成部30および予測画像生成部23は、予測画像生成処理において、動き補償パラメータを決定し、動き補償パラメータに係るシンタックス値とシンタックス種別とを符号化データ生成部29に供給する。 On the other hand, the PU information generation unit 30 and the predicted image generation unit 23 determine a motion compensation parameter in the predicted image generation process, and generate a syntax value and syntax type related to the motion compensation parameter as an encoded data generation unit. 29.
 また、PU情報生成部30および予測画像生成部23は、PU情報復号部12が備えるマージ候補優先順位情報記憶部122、および参照フレーム設定情報記憶部123と同様の構成を備えていてもよい。 Also, the PU information generation unit 30 and the predicted image generation unit 23 may have the same configuration as the merge candidate priority information storage unit 122 and the reference frame setting information storage unit 123 included in the PU information decoding unit 12.
 変換・量子化部27は、動画像復号装置1のTU情報復号部13および逆量子化・逆変換部15に対応している。これらを比較すると次のとおりである。 The transform / quantization unit 27 corresponds to the TU information decoding unit 13 and the inverse quantization / inverse transform unit 15 of the video decoding device 1. These are compared as follows.
 TU情報復号部13が備えるTU分割設定部131は、ノードの分割を行うのか否かを示す情報に係る符号化データおよびシンタックス種別を復号モジュール10に供給し、復号モジュール10により復号されたノードの分割を行うのか否かを示す情報に基づいてTU分割を行う。 The TU division setting unit 131 included in the TU information decoding unit 13 supplies the encoded data and syntax type related to information indicating whether or not to perform node division to the decoding module 10, and the node decoded by the decoding module 10 TU partitioning is performed based on information indicating whether to perform the partitioning.
 さらに、TU情報復号部13が備える変換係数復元部132は、判定情報および変換係数に係る符号化データおよびシンタックス種別を復号モジュール10に供給し、復号モジュール10により復号された判定情報および変換係数に基づいて変換係数を導出する。 Further, the transform coefficient restoration unit 132 included in the TU information decoding unit 13 supplies the determination information and the encoded data related to the transform coefficient and the syntax type to the decoding module 10, and the determination information and the transform coefficient decoded by the decoding module 10. Based on the above, a conversion coefficient is derived.
 これに対して、変換・量子化部27は、TU分割の分割方式を決定し、ノードの分割を行うのか否かを示す情報に係るシンタックス値およびシンタックス種別を符号化データ生成部29に供給する。 On the other hand, the transform / quantization unit 27 determines the division method of the TU division, and sends the syntax value and the syntax type related to the information indicating whether or not to perform node division to the encoded data generation unit 29. Supply.
 また、変換・量子化部27は、予測残差を変換・量子化して得られる量子化変換係数に係るシンタックス値およびシンタックス種別を符号化データ生成部29に供給する。 Also, the transform / quantization unit 27 supplies the encoded data generation unit 29 with syntax values and syntax types related to the quantized transform coefficients obtained by transforming and quantizing the prediction residual.
 なお、変換・量子化部27は、TU分割設定部131が備える変換サイズ決定情報記憶部1314と同様の構成を備えていてもよい。また、符号化データ生成部29は、復号モジュール10が備えるコンテキスト記憶部1034と同様の構成を備えていてもよい。 Note that the transform / quantization unit 27 may have the same configuration as the transform size determination information storage unit 1314 included in the TU partition setting unit 131. The encoded data generation unit 29 may have the same configuration as the context storage unit 1034 included in the decoding module 10.
 (PU情報生成部30の詳細)
 図55は、PU情報生成部30の構成を示すブロック図である。PU情報生成部30は、動き補償パラメータを生成するための動き補償パラメータ生成部301を備える。動き補償パラメータ生成部301は、双予測制限PU判定部1218、双単予測変換部1219、マージ動き補償パラメータ生成部3012、および基本動き補償パラメータ生成部3013を備える。マージ動き補償パラメータ生成部3012は、マージ候補を生成し、PTI設定情報PTI’として、符号化設定部21に供給する。また、マージ動き補償パラメータ生成部3012は、マージ候補を選択するためのインデックスを、PT設定情報PTIとして出力する。基本動き補償パラメータ生成部3013は、入力されたPTI設定情報PTI’、ここでは動き補償パラメータからPT設定情報PTIを符号化する。
(Details of PU information generation unit 30)
FIG. 55 is a block diagram illustrating a configuration of the PU information generation unit 30. The PU information generation unit 30 includes a motion compensation parameter generation unit 301 for generating a motion compensation parameter. The motion compensation parameter generation unit 301 includes a bi-prediction restricted PU determination unit 1218, a bi-prediction conversion unit 1219, a merge motion compensation parameter generation unit 3012, and a basic motion compensation parameter generation unit 3013. The merge motion compensation parameter generation unit 3012 generates merge candidates and supplies the merge candidates to the encoding setting unit 21 as PTI setting information PTI ′. Also, the merge motion compensation parameter generation unit 3012 outputs an index for selecting a merge candidate as PT setting information PTI. The basic motion compensation parameter generation unit 3013 encodes the P setting information PTI from the input PTI setting information PTI ′, here the motion compensation parameter.
 続いて、図56を用いて、マージ動き補償パラメータ生成部3012のより詳細な構成について説明すると次のとおりである。図56は、マージ動き補償パラメータ生成部3012の構成を示すブロック図である。なお、スキップPUの動きパラメータ導出もマージ動き補償パラメータ生成部3012で行われる。 Subsequently, a more detailed configuration of the merge motion compensation parameter generation unit 3012 will be described with reference to FIG. FIG. 56 is a block diagram illustrating a configuration of the merge motion compensation parameter generation unit 3012. Note that the motion parameter derivation of the skip PU is also performed by the merge motion compensation parameter generation unit 3012.
 マージ動き補償パラメータ生成部3012は、隣接マージ候補導出部1212A、時間的マージ候補導出部1212B、ユニーク候補導出部1212C、結合双予測マージ候補導出部1212D、非スケール双予測マージ候補導出部1212E、ゼロベクトルマージ候補導出部1212F、マージ候補導出制御部1212G、マージ候補格納部1212Hから構成される。 The merge motion compensation parameter generation unit 3012 includes an adjacent merge candidate derivation unit 1212A, a temporal merge candidate derivation unit 1212B, a unique candidate derivation unit 1212C, a combined bi-prediction merge candidate derivation unit 1212D, a non-scale bi-prediction merge candidate derivation unit 1212E, and zero. A vector merge candidate derivation unit 1212F, a merge candidate derivation control unit 1212G, and a merge candidate storage unit 1212H are included.
 マージ候補を導出する処理は、マージ動き補償パラメータ導出部1212と同様に、双予測制限PU判定部1218において双予測制限を行うと判定された小サイズのPUについて、双単予測変換部1219を用いて双予測であれば単予測の動き補償パラメータに変換することによって、単予測のマージ候補のみを導出する。各部の詳細は既に説明済みであるので省略する。 Similar to the merge motion compensation parameter derivation unit 1212, the merge candidate derivation process uses the bi-prediction conversion unit 1219 for a small size PU that is determined to be subjected to bi-prediction restriction by the bi-prediction restricted PU determination unit 1218. In the case of bi-prediction, only a single prediction merge candidate is derived by converting the motion compensation parameter into a single prediction. Details of each part have already been described and will be omitted.
 マージ動き補償パラメータ生成部3012は、マージ候補を生成し、PTI設定情報PTI’として、符号化設定部21に供給する。また、マージインデックスを、PT設定情報PTIとして、符号化データ生成部29に供給する。 The merge motion compensation parameter generation unit 3012 generates merge candidates and supplies them to the encoding setting unit 21 as PTI setting information PTI '. Further, the merge index is supplied to the encoded data generation unit 29 as PT setting information PTI.
 続いて、図57を用いて、基本動き補償パラメータ生成部3013のより詳細な構成について説明すると次のとおりである。図57は、基本動き補償パラメータ生成部3013の構成を示すブロック図である。基本動き補償パラメータ生成部3013は、隣接動きベクトル候補導出部1213A、時間的動きベクトル候補導出部1213B、ゼロベクトルマージ候補導出部1213F、動きベクトル候補導出制御部1213G、動きベクトル候補格納部1213H、動きベクトル候補選択部3013A、差分動きベクトル算出部3013B、から構成される。 Subsequently, a more detailed configuration of the basic motion compensation parameter generation unit 3013 will be described with reference to FIG. FIG. 57 is a block diagram showing a configuration of the basic motion compensation parameter generation unit 3013. The basic motion compensation parameter generation unit 3013 includes an adjacent motion vector candidate derivation unit 1213A, a temporal motion vector candidate derivation unit 1213B, a zero vector merge candidate derivation unit 1213F, a motion vector candidate derivation control unit 1213G, a motion vector candidate storage unit 1213H, A vector candidate selection unit 3013A and a difference motion vector calculation unit 3013B are included.
 予測動きベクトル候補を導出する処理は、図54に示した基本動き補償パラメータ導出部1213と同様であるので説明を省略する。動きベクトル候補選択部3013Aは、供給された予測動きベクトルに最も近い予測動きベクトル候補を、動きベクトル候補格納部1213Hに格納された予測動きベクトル候補から選択し、そのインデックスを予測動きベクトルインデックスとして導出する。選択された予測動きベクトルは、差分動きベクトル算出部3013Bに供給される。差分動きベクトル算出部3013Bは供給された動きベクトルと予測動きベクトルとの差分を差分動きベクトルとして算出する。インター予測フラグ、参照インデックス番号、及び、導出された予測動きベクトルインデックス、差分動きベクトルは、PT設定情報PTとして、符号化データ生成部29に供給される。 The process of deriving the predicted motion vector candidate is the same as that of the basic motion compensation parameter deriving unit 1213 shown in FIG. The motion vector candidate selection unit 3013A selects a predicted motion vector candidate closest to the supplied predicted motion vector from the predicted motion vector candidates stored in the motion vector candidate storage unit 1213H, and derives the index as a predicted motion vector index. To do. The selected prediction motion vector is supplied to the difference motion vector calculation unit 3013B. The difference motion vector calculation unit 3013B calculates a difference between the supplied motion vector and the predicted motion vector as a difference motion vector. The inter prediction flag, the reference index number, the derived prediction motion vector index, and the difference motion vector are supplied to the encoded data generation unit 29 as PT setting information PT.
  (具体的構成との対応関係)
   [1]’ 符号化設定部および符号化データ生成部
    [1-1]’コンテキストの参照を制限する構成の例
 符号化データ生成部29は、PU分割タイプが非対称パーティションであるとき、非対称パーティションの分割の種類を示す情報を、CABACのコンテキストを用いないで符号化処理を行ってもかまわない。
(Correspondence with specific composition)
[1] 'Encoding Setting Unit and Encoded Data Generation Unit [1-1]' Example of Configuration for Limiting Context Reference When the PU partition type is an asymmetric partition, the encoded data generation unit 29 Information indicating the type of division may be encoded without using the CABAC context.
 具体的な構成は、例えば、動画像復号装置1の構成例[1-1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1-1]の説明における「CU予測モード復号部1011」、「確率設定記憶部1014」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「確率設定記憶部1014に相当する構成」、および「符号化(する)」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [1-1] of the video decoding device 1, and thus the description thereof is omitted here. However, the “CU prediction mode decoding unit 1011”, the “probability setting storage unit 1014”, and the “decoding (performing)” in the description of the configuration example [1-1] are respectively referred to as “encoded data generation unit 29”, “ The “configuration corresponding to the probability setting storage unit 1014” and “encoding (perform)” shall be read.
    [1-2]’CU予測タイプ情報(pred_type)を符号化する構成
 符号化データ生成部29は、二値化情報を参照してCU予測タイプ情報を符号化するよう構成してもよい。
[1-2] Configuration for Encoding CU Prediction Type Information (pred_type) The encoded data generation unit 29 may be configured to encode CU prediction type information with reference to binarization information.
 具体的な構成は、例えば、動画像復号装置1の構成例[1-2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1-2]の説明における「CU予測モード復号部1011」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「二値化情報記憶部1012に相当する構成」、および「符号化(する)」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [1-2] of the video decoding device 1, and thus the description thereof is omitted here. However, “CU prediction mode decoding unit 1011”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of configuration example [1-2] are respectively referred to as “encoded data generation unit 29”. , “Configuration corresponding to the binarized information storage unit 1012” and “encoding (perform)”.
    [1-3]’小サイズのCUにおいて、イントラCUについて短い符号を符号化する構成
 符号化データ生成部29は、小サイズのCUにおいて、イントラCUについて短い符号を符号化するよう構成してもよい。
[1-3] ′ Configuration for encoding a short code for an intra CU in a small size CU The encoded data generation unit 29 may be configured to encode a short code for an intra CU in a small size CU. Good.
 具体的な構成は、例えば、動画像復号装置1の構成例[1-3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1-3]の説明における「CU予測モード復号部1011」、「コンテキスト記憶部1013」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「コンテキスト記憶部1013に相当する構成」、「二値化情報記憶部1012に相当する構成」、および「符号化(する)」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [1-3] of the video decoding device 1, and thus the description thereof is omitted here. However, “CU prediction mode decoding unit 1011”, “context storage unit 1013”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of the configuration example [1-3] are “ It shall be read as “encoded data generation unit 29”, “configuration corresponding to context storage unit 1013”, “configuration corresponding to binarized information storage unit 1012”, and “encoding (perform)”.
    [1-4]’近傍の予測パラメータに応じてbin列の解釈を変更する構成
 符号化データ生成部29は、隣接領域に割り付けられている予測パラメータを参照して、bin列の解釈を変更するよう構成してもよい。
[1-4] ′ Configuration for Changing the Interpretation of a Bin Sequence According to a Prediction Parameter in the Neighborhood The encoded data generation unit 29 changes the interpretation of the bin sequence with reference to the prediction parameter assigned to the adjacent region You may comprise.
 具体的な構成は、例えば、動画像復号装置1の構成例[1-4]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[1-4]の説明における「CU予測モード復号部1011」、「二値化情報記憶部1012」、および「復号(する)」を、それぞれ、「符号化データ生成部29」、「二値化情報記憶部1012に相当する構成」および「符号化(する)」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [1-4] of the video decoding device 1, and thus the description thereof is omitted here. However, “CU prediction mode decoding unit 1011”, “binarization information storage unit 1012”, and “decoding (performing)” in the description of the configuration example [1-4] are respectively referred to as “encoded data generation unit 29”. , “Configuration corresponding to the binarized information storage unit 1012” and “encoding (to do)”.
   [2]’予測画像生成部および符号化データ生成部
    [2-1]’マージ候補の位置および優先順位の例
 PU情報生成部30は、PU分割タイプが非対称である場合、PU分割タイプが対称である場合と異なる方法でマージ候補の優先順位を決定する構成であってもよい。
[2] 'Predicted image generation unit and encoded data generation unit [2-1]' Example of merge candidate positions and priorities The PU information generation unit 30 has a symmetric PU partition type when the PU partition type is asymmetric. The priorities of the merge candidates may be determined by a method different from that in the case of.
 具体的な構成は、例えば、動画像復号装置1の構成例[2-1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-1]の説明における「動き補償パラメータ導出部121」、および「マージ候補優先順位情報記憶部122」を、それぞれ、「動き補償パラメータ生成部301」、および「マージ候補優先順位情報記憶部122に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [2-1] of the video decoding device 1, and thus the description thereof is omitted here. However, the “motion compensation parameter derivation unit 121” and the “merge candidate priority information storage unit 122” in the description of the configuration example [2-1] are referred to as the “motion compensation parameter generation unit 301” and the “merge candidate priority”, respectively. It shall be read as “a configuration corresponding to the rank information storage unit 122”.
    [2-2]’CUサイズとスキップ/マージとの組み合わせによるマージ候補の変更
 PU情報生成部30は、CUサイズと、当該CUがスキップ/マージを行うCUであるか否かとの組み合わせに応じてマージ候補を変更する構成であってもよい。
[2-2] Change of Merge Candidate by Combination of CU Size and Skip / Merge The PU information generation unit 30 depends on a combination of a CU size and whether or not the CU is a CU that performs skip / merge. It may be configured to change merge candidates.
 具体的な構成は、例えば、動画像復号装置1の構成例[2-2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-2]の説明における「動き補償パラメータ導出部121」、および「マージ候補優先順位情報記憶部122」を、それぞれ、「動き補償パラメータ生成部301」、および「マージ候補優先順位情報記憶部122に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [2-2] of the video decoding device 1, and thus the description thereof is omitted here. However, the “motion compensation parameter derivation unit 121” and the “merge candidate priority information storage unit 122” in the description of the configuration example [2-2] are referred to as the “motion compensation parameter generation unit 301” and the “merge candidate priority”, respectively. It shall be read as “a configuration corresponding to the rank information storage unit 122”.
    [2-3]’参照フレーム数の決定
 動き補償パラメータ生成部301を、以下の[2-3-1]’~[2-3-4]’に示すように構成してもよく、これによりインター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
[2-3] ′ Determination of Reference Frame Number The motion compensation parameter generation unit 301 may be configured as shown in the following [2-3-1] ′ to [2-3-4] ′, thereby You may determine which prediction system of single prediction and bi-prediction is applied in inter prediction.
    [2-3-1]’小サイズPUでの双予測制限
 動き補償パラメータ生成部301は、参照フレーム設定情報を参照して、インター予測において単予測および双予測のいずれの予測方式を適用するかを決定してもよい。
[2-3-1] 'Bi-prediction restriction with small size PU The motion compensation parameter generation unit 301 refers to the reference frame setting information, and applies which prediction method of uni-prediction or bi-prediction in inter prediction May be determined.
 具体的な構成は、例えば、動画像復号装置1の構成例[2-3-1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-3-1]の説明における「動き補償パラメータ導出部121」、および「参照フレーム設定情報記憶部123」を、それぞれ、「動き補償パラメータ生成部301」、および「参照フレーム設定情報記憶部123に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [2-3-1] of the video decoding device 1, and thus the description thereof is omitted here. However, the “motion compensation parameter derivation unit 121” and the “reference frame setting information storage unit 123” in the description of the configuration example [2-3-1] are referred to as the “motion compensation parameter generation unit 301” and the “reference frame”, respectively. It shall be read as “a configuration corresponding to the setting information storage unit 123”.
 参照フレーム設定情報において、小サイズの予測方向を単予測に限定することによって、動き補償パラメータ生成部301における予測画像生成に必要な処理量を大幅に低減することができる。また、小サイズのPUにおいて、マージ候補を単予測に制限することによっても、予測画像生成に必要な処理量を低減することができる。さらに、小サイズのPUにおいて、双予測マージ候補の導出を省略することによっても、マージ候補の導出に必要な処理量を低減することができる。 In the reference frame setting information, by limiting the small-size prediction direction to single prediction, it is possible to significantly reduce the amount of processing required for predictive image generation in the motion compensation parameter generation unit 301. Further, by limiting the merge candidates to single prediction in a small size PU, it is possible to reduce the amount of processing necessary for predictive image generation. Furthermore, by omitting the derivation of bi-predictive merge candidates in a small size PU, it is possible to reduce the amount of processing necessary for derivation of merge candidates.
    [2-3-2]’双予測の制限を行うサイズの決定
 PU情報生成部30は、双予測の制限を行うサイズを決定し符号化してもよい。具体的な構成は、図81に示すとおりである。図81に示す構成は、図55、56に示したPU情報生成部30において、双予測制限PU判定部1218を、双予測制限PU判定部1218Aに変更したものである。
[2-3-2] 'Determining Size to Limit Bi-Prediction The PU information generation unit 30 may determine and code the size to limit bi-prediction. A specific configuration is as shown in FIG. The configuration shown in FIG. 81 is obtained by changing the bi-prediction restricted PU determination unit 1218 to a bi-prediction restricted PU determination unit 1218A in the PU information generation unit 30 shown in FIGS.
 より詳細については、例えば、動画像復号装置1の構成例[2-3-2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-3-2]の説明における「動き補償パラメータ導出部121」、「マージ動き補償パラメータ導出部1212」および「参照フレーム設定情報記憶部123」を、それぞれ、「動き補償パラメータ生成部301」、「マージ動き補償パラメータ生成部3012」および「参照フレーム設定情報記憶部123に相当する構成」と読み替えるものとする。 Since the details are the same as those described in the configuration example [2-3-2] of the video decoding device 1, for example, the description thereof is omitted here. However, the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-2] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
    [2-3-3]’部分的な双予測制限を行うための構成
 PU情報生成部30は、部分的な双予測制限を行ってもよい。具体的な構成は、図81および図82に示すとおりである。図81に示す構成は、図55、56に示したPU情報生成部30において、双単予測変換部1219を、双単予測変換部1219Aに変更したものである。図82に示す構成は、図55、56に示したPU情報生成部30において、双単予測変換部1219を、双単予測変換部1219Bに変更したものである。
[2-3-3] ′ Configuration for Performing Partial Bi-Prediction Restriction The PU information generation unit 30 may perform partial bi-prediction restriction. A specific configuration is as shown in FIG. 81 and FIG. The configuration shown in FIG. 81 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219A in the PU information generation unit 30 shown in FIGS. The configuration shown in FIG. 82 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219B in the PU information generation unit 30 shown in FIGS.
 より詳細については、例えば、動画像復号装置1の構成例[2-3-3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-3-3]の説明における「動き補償パラメータ導出部121」、「マージ動き補償パラメータ導出部1212」および「参照フレーム設定情報記憶部123」を、それぞれ、「動き補償パラメータ生成部301」、「マージ動き補償パラメータ生成部3012」および「参照フレーム設定情報記憶部123に相当する構成」と読み替えるものとする。 Since the details are the same as those described in the configuration example [2-3-3] of the video decoding device 1, for example, the description thereof is omitted here. However, the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-3] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
    [2-3-4]’動きベクトルの整数化
 PU情報生成部30は、動きベクトルの整数化を行ってもよい。具体的な構成は、図83に示すとおりである。図83に示す構成は、図55、56に示したPU情報生成部30において、双単予測変換部1219を、双単予測変換部1219Aに変更したものである。図82に示す構成は、図55、56に示したPU情報生成部30において、双単予測変換部1219を、動きベクトル整数化部1220に変更したものである。
[2-3-4] ′ Motion Vector Integer Conversion The PU information generation unit 30 may perform motion vector integer conversion. A specific configuration is as shown in FIG. The configuration shown in FIG. 83 is obtained by changing the bi-prediction conversion unit 1219 to the bi-prediction conversion unit 1219A in the PU information generation unit 30 shown in FIGS. The configuration shown in FIG. 82 is obtained by changing the bi-prediction conversion unit 1219 to a motion vector integer conversion unit 1220 in the PU information generation unit 30 shown in FIGS.
 より詳細については、例えば、動画像復号装置1の構成例[2-3-4]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[2-3-4]の説明における「動き補償パラメータ導出部121」、「マージ動き補償パラメータ導出部1212」および「参照フレーム設定情報記憶部123」を、それぞれ、「動き補償パラメータ生成部301」、「マージ動き補償パラメータ生成部3012」および「参照フレーム設定情報記憶部123に相当する構成」と読み替えるものとする。 Since the details are the same as those described in the configuration example [2-3-4] of the video decoding device 1, for example, the description thereof is omitted here. However, the “motion compensation parameter deriving unit 121”, “merge motion compensation parameter deriving unit 1212”, and “reference frame setting information storage unit 123” in the description of the configuration example [2-3-4] It shall be read as “generating unit 301”, “merge motion compensation parameter generating unit 3012”, and “configuration corresponding to reference frame setting information storage unit 123”.
 [2-3-2]’~[2-3-4]’に示したように双予測を制限することによって、動き補償パラメータ生成部301における予測画像生成に必要な処理量を低減することができる。 By limiting bi-prediction as shown in [2-3-2] ′ to [2-3-4] ′, it is possible to reduce the processing amount necessary for predictive image generation in the motion compensation parameter generation unit 301. it can.
 (符号化データ上の動き補償パラメータの制限)
 動画像復号装置では、レベル規制による符号化データの制限を説明した。これはレベル毎に符号化データを導出して得られる動き補償パラメータの値を制限するものである。このような制限は、以下に示す動画像符号化装置2により実現できる。なお、ここではインター予測フラグの符号化のスキップ、マージ候補の双単変換、マージ候補導出を行わない例を説明する。
(Restriction of motion compensation parameters on encoded data)
In the moving picture decoding apparatus, the restriction of encoded data due to level restrictions has been described. This limits the value of the motion compensation parameter obtained by deriving the encoded data for each level. Such a restriction can be realized by the moving picture encoding apparatus 2 shown below. Here, an example will be described in which inter prediction flag encoding skip, merge candidate bi-single conversion, and merge candidate derivation are not performed.
 本構成の動画像符号化装置2は、図88に示すPU情報生成部30を用いる。PU情報生成部30は、動き補償パラメータ生成部301を備える。動き補償パラメータ生成部301は、マージ動き補償パラメータ生成部3012、および基本動き補償パラメータ生成部3013を備える。予測制限PU判定部1218の代わりに、動き補償パラメータ制限部3014を備える。本構成では、マージ候補の双単変換を行わないため、双単予測変換部1219を含めないが、小PUサイズの場合にマージ候補の双単変換を行うために双単予測変換部1219を含める構成でも良い。 The moving picture encoding apparatus 2 of this configuration uses a PU information generation unit 30 shown in FIG. The PU information generation unit 30 includes a motion compensation parameter generation unit 301. The motion compensation parameter generation unit 301 includes a merge motion compensation parameter generation unit 3012 and a basic motion compensation parameter generation unit 3013. A motion compensation parameter restriction unit 3014 is provided instead of the prediction restriction PU determination unit 1218. In this configuration, bi-prediction conversion unit 1219 is not included because bi-conversion of merge candidates is not performed. However, bi-prediction conversion unit 1219 is included to perform bi-single conversion of merge candidates in the case of a small PU size. It may be configured.
 動き補償パラメータ制限部3014は、PUサイズ情報と、PTI設定情報PTI’を入力し、PTI設定情報PTI’の動き補償パラメータに応じて追加コストを算出する。追加コストは、符号化設定部21に伝送される。伝送された追加コストは最小コストに追加されるため大きな追加コストを設定することにより、特定の動き補償パラメータの選択を防ぐことができる。 The motion compensation parameter restriction unit 3014 receives PU size information and PTI setting information PTI ', and calculates an additional cost according to the motion compensation parameter of the PTI setting information PTI'. The additional cost is transmitted to the encoding setting unit 21. Since the transmitted additional cost is added to the minimum cost, selection of a specific motion compensation parameter can be prevented by setting a large additional cost.
  [疑似コード]
 続いて、図87に示す疑似コードを用いて、動き補償パラメータ制限部3014の動作について説明する。以下に、図87に示す擬似コードの各ステップSについて説明する。
[Pseudo code]
Next, the operation of the motion compensation parameter restriction unit 3014 will be described using the pseudo code shown in FIG. Hereinafter, each step S of the pseudo code illustrated in FIG. 87 will be described.
 S871:動き補償パラメータ制限部3014は、レベルlevel_idcの値が所定の閾値TH1未満であるか否かを判定する。 S871: The motion compensation parameter restriction unit 3014 determines whether the value of the level level_idc is less than a predetermined threshold value TH1.
 S872:レベルlevel_idcの値がTH1未満である場合、動き補償パラメータ制限部3014は、特に処理は行わない。 S872: When the value of the level level_idc is less than TH1, the motion compensation parameter restriction unit 3014 performs no particular processing.
 S873:一方、レベルlevel_idcの値がTH1未満でない場合、動き補償パラメータ制限部3014は、さらにレベルlevel_idcの値が所定の閾値TH2未満か否かを判定する。 S873: On the other hand, if the value of the level level_idc is not less than TH1, the motion compensation parameter restriction unit 3014 further determines whether the value of the level level_idc is less than a predetermined threshold TH2.
 S874:レベルlevel_idcの値がTH2未満である場合、動き補償パラメータ制限部3014は、DisableBipred変数を次のように設定する。 S874: When the value of the level level_idc is less than TH2, the motion compensation parameter restriction unit 3014 sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=3)と一致しており、かつ、PUのモードが、2N×2N以外のモードのPUについて双予測を制限する。 The logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 3), and the bi-prediction is restricted for PUs whose modes are other than 2N × 2N.
 すなわち、S874では、最小CUサイズである8×8のCUについて、8×8PU以外(2N×2N)のPUにおける双予測を制限する。 That is, in S874, bi-prediction in PUs other than 8 × 8 PU (2N × 2N) is limited for 8 × 8 CU which is the minimum CU size.
 さらに、PTI設定情報PTI’が上記、制限に該当する場合には、追加コストを十分に大きく設定する。該当しない場合には、追加コストを0とする。 Furthermore, when the PTI setting information PTI 'falls under the above restriction, the additional cost is set sufficiently large. If not, the additional cost is set to zero.
 S874´:レベルlevel_idcの値がTH1未満である場合、動き補償パラメータ制限部3014は、使用可能なPUサイズを制限する。すなわち、動き補償パラメータ制限を制限するフラグinter_4x4_enable_flag = 0とし4×4PUの使用を制限する。さらに、PTI設定情報PTI’が上記、制限に該当する場合、すなわちPUサイズが4×4の場合には、追加コストを十分に大きく設定する。該当しない場合には、追加コストを0とする。なお、上記では動き補償パラメータを制限するフラグとしてinter_4x4_enable_flagを用いたが、4×4PUの使用を制限する他のフラグ(例えば、use_restricted_prediction)でも構わない。 S874 ′: When the level level_idc value is less than TH1, the motion compensation parameter limiting unit 3014 limits the usable PU size. That is, the flag inter_4x4_enable_flag = 0 that restricts motion compensation parameter restriction is used to restrict the use of 4 × 4 PUs. Further, when the PTI setting information PTI 'corresponds to the above-described restriction, that is, when the PU size is 4 × 4, the additional cost is set sufficiently large. If not, the additional cost is set to zero. In the above description, inter_4x4_enable_flag is used as a flag for limiting the motion compensation parameter, but other flags (for example, use_restricted_prediction) for limiting the use of 4 × 4 PU may be used.
 S875:レベルlevel_idcの値がTH2未満でない場合、動き補償パラメータ制限部3014は、DisableBipred変数を次のように設定する。 S875: When the value of the level level_idc is not less than TH2, the motion compensation parameter restriction unit 3014 sets the DisableBipred variable as follows.
 CUサイズの対数値(log2CUSize)が、Log2MinCUSize(=4)と一致しており、かつ、PUのモードが、N×NであるPU(最小PU)について双予測を制限する。 The bi-prediction is limited for a PU (minimum PU) in which the logarithmic value (log2CUSize) of the CU size matches Log2MinCUSize (= 4) and the PU mode is N × N.
 すなわち、S875では、最小CUサイズが、8×8以外(例えば、16×16)の場合、最小CUサイズと一致するサイズのCUについて、最小PU(N×N)における双予測を制限している。 That is, in S875, when the minimum CU size is other than 8 × 8 (for example, 16 × 16), bi-prediction at the minimum PU (N × N) is limited for a CU having a size that matches the minimum CU size. .
 さらに、PTI設定情報PTI’が上記、制限に該当する場合には、追加コストを十分に大きく設定する。該当しない場合には、追加コストを0とする。 Furthermore, when the PTI setting information PTI 'falls under the above restriction, the additional cost is set sufficiently large. If not, the additional cost is set to zero.
 S875´:レベルlevel_idcの値がTH2未満でない場合、動き補償パラメータ制限部3014は、使用可能なCUサイズを制限することで、使用可能なPUサイズを制限する。すなわち、CUサイズの対数値Log2MinCuSizeを4以上に制限する。log2_min_cu_size_minus3を1以上に制限する。 S875 ′: When the value of the level level_idc is not less than TH2, the motion compensation parameter restriction unit 3014 restricts the usable PU size by restricting the usable CU size. That is, the logarithmic value Log2MinCuSize of the CU size is limited to 4 or more. Limit log2_min_cu_size_minus3 to 1 or more.
 さらに、PTI設定情報PTI’が上記、制限に該当する場合、すなわちCUサイズが8×8の場合には、追加コストを十分に大きく設定する。該当しない場合には、追加コストを0とする。なお、S874において、動き補償パラメータ制限部3014は、レベルlevel_idcの値に応じて、図84のテーブルのMaxLog2MinCUSizeを参照して、Log2MinCUSizeを決定してもよい。例えば、図84に示すように、レベルlevel_idcの値がTH1以上、TH2未満である場合、MaxLog2MinCuSize=3であるので、S874において、動き補償パラメータ制限部3014は、Log2MinCUSizeの値として、MaxLog2MinCuSize=3を用いることができる。 Furthermore, when the PTI setting information PTI 'corresponds to the above-described restriction, that is, when the CU size is 8x8, the additional cost is set sufficiently large. If not, the additional cost is set to zero. In S874, the motion compensation parameter restriction unit 3014 may determine Log2MinCUSize by referring to MaxLog2MinCUSize in the table of FIG. 84 according to the level level_idc value. For example, as shown in FIG. 84, when the level level_idc value is greater than or equal to TH1 and less than TH2, MaxLog2MinCuSize = 3. Therefore, in S874, the motion compensation parameter limiter 3014 sets MaxLog2MinCuSize = 3 as the value of Log2MinCUSize. Can be used.
   [3]’変換・量子化部および符号化データ生成部
    [3-1]’PU分割タイプが非対称の場合において分割領域サイズを導出する構成の例
 変換・量子化部27は、PU分割タイプが非対称の場合、小さい方のPUでは、長方形(非正方形)の変換を適用する一方で、大きい方のPUでは、正方形の変換を適用する構成であってもよい。
[3] 'Transformation / Quantization Unit and Coded Data Generation Unit [3-1]' Example of Configuration for Deriving Partition Area Size when PU Partition Type is Asymmetric The transform / quantization unit 27 has a PU partition type of In the case of asymmetrical configuration, a rectangular (non-square) transformation may be applied to the smaller PU, while a square transformation may be applied to the larger PU.
 具体的な構成は、例えば、動画像復号装置1の構成例[3-1]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3-1]の説明における「対象領域設定部1311」「分割決定部1312」および「分割領域設定部1313」は、「変換・量子化部27」と読み替えるものとする。また、構成例[3-1]の説明における「変換サイズ決定情報記憶部1314」を、「変換サイズ決定情報記憶部1314に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [3-1] of the video decoding device 1, and thus the description thereof is omitted here. However, “target region setting unit 1311”, “division determining unit 1312”, and “divided region setting unit 1313” in the description of the configuration example [3-1] shall be read as “transformation / quantization unit 27”. In addition, the “conversion size determination information storage unit 1314” in the description of the configuration example [3-1] is replaced with “a configuration corresponding to the conversion size determination information storage unit 1314”.
    [3-2]’一部のPU分割タイプが正方形の分割であるとき非矩形変換を適用する構成の例
 変換・量子化部27は、PU分割タイプが正方形の分割である場合、対象ノードを非正方形に分割する構成であってもよい。また、上記構成に加えて、変換・量子化部27は、は、CUサイズが、16×16サイズであり、かつPU分割タイプが、2N×2Nである場合、各分割深度においてスキャン順が統一できるように分割を行う構成であってもよい。
[3-2] 'Example of configuration in which non-rectangular transformation is applied when some of the PU partition types are square partitions. When the PU partition type is a square partition, the transform / quantization unit 27 The structure divided | segmented into a non-square may be sufficient. In addition to the above configuration, the transform / quantization unit 27 has a uniform scan order at each division depth when the CU size is 16 × 16 size and the PU division type is 2N × 2N. The configuration may be such that the division is performed as possible.
 具体的な構成は、例えば、動画像復号装置1の構成例[3-2]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3-2]の説明における「分割領域設定部1313」、および「変換サイズ決定情報記憶部1314」は、それぞれ、「変換・量子化部27」、および「変換サイズ決定情報記憶部1314に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [3-2] of the video decoding device 1, and thus the description thereof is omitted here. However, the “partition area setting unit 1313” and the “transformed size determination information storage unit 1314” in the description of the configuration example [3-2] are the “transformation / quantization unit 27” and the “transformed size determination information storage”, respectively. It should be read as “a configuration corresponding to the unit 1314”.
   [3-3]’変換係数符号化時にコンテキストを参照する具体的構成
 符号化データ生成部29は、PU分割タイプが非対称分割である場合、小さい方のPUに含まれるTUと、大きい方のPUに含まれるTUとで異なるコンテキストを用いて、非ゼロ変換係数の存否情報および変換係数の少なくとも一方を符号化する構成であってもよい。
[3-3] 'Specific Configuration Referencing Context at Coding Coefficients When the PU partition type is asymmetric partitioning, the encoded data generation unit 29 includes a TU included in a smaller PU and a larger PU. The configuration may be such that at least one of the non-zero transform coefficient presence information and the transform coefficient is encoded using a different context for the TU included in the.
 具体的な構成は、例えば、動画像復号装置1の構成例[3-3]において説明したものと同様であるので、ここでは説明を省略する。ただし、構成例[3-3]の説明における「判定情報復号部1032」および「変換係数復号部1033」は、「符号化データ生成部29」と読み替えるものとする。また、構成例[3-3]の説明における「復号(する)」、および「コンテキスト記憶部1034」を、それぞれ、「符号化(する)」、および「コンテキスト記憶部1034に相当する構成」と読み替えるものとする。 The specific configuration is the same as that described in, for example, the configuration example [3-3] of the video decoding device 1, and thus the description thereof is omitted here. However, “determination information decoding unit 1032” and “transform coefficient decoding unit 1033” in the description of the configuration example [3-3] should be read as “encoded data generation unit 29”. Further, “decoding (perform)” and “context storage unit 1034” in the description of the configuration example [3-3] are referred to as “encoding (perform)” and “configuration corresponding to the context storage unit 1034”, respectively. It shall be replaced.
  (処理の流れ)
 図26を用いて、動画像符号化装置2におけるCU符号化処理について説明すると以下のとおりである。なお、以下では、対象CUは、インターCU、または、スキップCUであるとする。図24は、動画像符号化装置2におけるCU符号化処理(インター/スキップCU)の流れの一例について示すフローチャートである。
(Process flow)
The CU encoding process in the moving image encoding apparatus 2 will be described with reference to FIG. In the following, it is assumed that the target CU is an inter CU or a skip CU. FIG. 24 is a flowchart illustrating an example of a flow of CU encoding processing (inter / skip CU) in the moving image encoding device 2.
 CU符号化処理が開始されると、符号化設定部21が、対象CUについてCU予測情報を決定し、符号化データ生成部29が、符号化設定部21により決定されたCU予測情報を符号化する(S21)。この処理は、CU単位で行われる。 When the CU encoding process is started, the encoding setting unit 21 determines CU prediction information for the target CU, and the encoded data generation unit 29 encodes the CU prediction information determined by the encoding setting unit 21. (S21). This process is performed on a CU basis.
 具体的には、符号化設定部21が、対象CUがスキップCUであるか否かを決定する。対象CUがスキップCUである場合、符号化設定部21は、スキップフラグSKIPを符号化データ生成部20に符号化させる。また、対象CUがスキップCUでない場合、符号化設定部21は、CU予測タイプ情報Pred_typeを符号化データ生成部20に符号化させる。 Specifically, the encoding setting unit 21 determines whether or not the target CU is a skip CU. When the target CU is a skip CU, the encoding setting unit 21 causes the encoded data generation unit 20 to encode the skip flag SKIP. When the target CU is not a skip CU, the encoding setting unit 21 causes the encoded data generation unit 20 to encode the CU prediction type information Pred_type.
 次に、PU単位の処理が行われる。すなわち、予測画像生成部23が動き情報を導出し、符号化データ生成部29が、予測画像生成部23により導出された動き情報を符号化する(S22)。また、予測画像生成部14は、導出した当該動き情報に基づいてインター予測により予測画像を生成する(S23)。 Next, PU unit processing is performed. That is, the predicted image generation unit 23 derives motion information, and the encoded data generation unit 29 encodes the motion information derived by the predicted image generation unit 23 (S22). Further, the predicted image generation unit 14 generates a predicted image by inter prediction based on the derived motion information (S23).
 次に、変換・量子化部27が、TU分割符号化処理を行う(S24)。具体的には、変換・量子化部27は、対象CUのCUサイズおよびPU分割タイプに基づいて、TU分割の方式を設定する。この処理は、CU単位で行われる。 Next, the transform / quantization unit 27 performs TU division coding processing (S24). Specifically, the transform / quantization unit 27 sets a TU partitioning scheme based on the CU size and PU partition type of the target CU. This process is performed on a CU basis.
 次に、TU単位の処理が行われる。すなわち、変換・量子化部27が、予測残差を変換係数に変換・量子化し(S25)、符号化データ生成部29が、変換・量子化された変換係数を符号化する(S26)。 Next, TU unit processing is performed. That is, the transform / quantization unit 27 transforms / quantizes the prediction residual into transform coefficients (S25), and the encoded data generation unit 29 encodes the transformed / quantized transform coefficients (S26).
 次に、逆量子化・逆変換部22が、変換・量子化された変換係数を、逆量子化・逆変換して予測残差を復元するとともに、加算器24が、予測画像および予測残差を加算することにより、復号画像が生成される(S27)。この処理は、CU単位で行われる。 Next, the inverse quantization / inverse transform unit 22 performs inverse quantization / inverse transform on the transformed / quantized transform coefficient to restore the prediction residual, and the adder 24 restores the predicted image and the prediction residual. Is added to generate a decoded image (S27). This process is performed on a CU basis.
 〔応用例〕
 上述した動画像符号化装置2及び動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
[Application example]
The above-described moving image encoding device 2 and moving image decoding device 1 can be used by being mounted on various devices that perform transmission, reception, recording, and reproduction of moving images. The moving image may be a natural moving image captured by a camera or the like, or may be an artificial moving image (including CG and GUI) generated by a computer or the like.
 まず、上述した動画像符号化装置2及び動画像復号装置1を、動画像の送信及び受信に利用できることを、図27を参照して説明する。 First, it will be described with reference to FIG. 27 that the above-described moving image encoding device 2 and moving image decoding device 1 can be used for transmission and reception of moving images.
 図27の(a)は、動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。図27の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_A1として利用される。 (A) of FIG. 27 is a block diagram illustrating a configuration of a transmission device PROD_A in which the moving image encoding device 2 is mounted. As illustrated in FIG. 27A, the transmission apparatus PROD_A modulates a carrier wave with an encoding unit PROD_A1 that obtains encoded data by encoding a moving image, and with the encoded data obtained by the encoding unit PROD_A1. Thus, a modulation unit PROD_A2 that obtains a modulation signal and a transmission unit PROD_A3 that transmits the modulation signal obtained by the modulation unit PROD_A2 are provided. The moving image encoding apparatus 2 described above is used as the encoding unit PROD_A1.
 送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図27の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。 The transmission device PROD_A is a camera PROD_A4 that captures a moving image, a recording medium PROD_A5 that records the moving image, an input terminal PROD_A6 that inputs the moving image from the outside, as a supply source of the moving image input to the encoding unit PROD_A1. An image processing unit A7 that generates or processes an image may be further provided. FIG. 27A illustrates a configuration in which the transmission apparatus PROD_A includes all of these, but a part may be omitted.
 なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。 The recording medium PROD_A5 may be a recording of a non-encoded moving image, or a recording of a moving image encoded by a recording encoding scheme different from the transmission encoding scheme. It may be a thing. In the latter case, a decoding unit (not shown) for decoding the encoded data read from the recording medium PROD_A5 according to the recording encoding method may be interposed between the recording medium PROD_A5 and the encoding unit PROD_A1.
 図27の(b)は、動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図27の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置1は、この復号部PROD_B3として利用される。 (B) of FIG. 27 is a block diagram illustrating a configuration of the receiving device PROD_B in which the moving image decoding device 1 is mounted. As illustrated in FIG. 27B, the receiving device PROD_B includes a receiving unit PROD_B1 that receives a modulated signal, a demodulating unit PROD_B2 that obtains encoded data by demodulating the modulated signal received by the receiving unit PROD_B1, and a demodulator. A decoding unit PROD_B3 that obtains a moving image by decoding the encoded data obtained by the unit PROD_B2. The moving picture decoding apparatus 1 described above is used as the decoding unit PROD_B3.
 受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図27の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。 The receiving device PROD_B has a display PROD_B4 for displaying a moving image, a recording medium PROD_B5 for recording the moving image, and an output terminal for outputting the moving image to the outside as a supply destination of the moving image output by the decoding unit PROD_B3. PROD_B6 may be further provided. FIG. 27B illustrates a configuration in which the reception apparatus PROD_B includes all of these, but a part of the configuration may be omitted.
 なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。 The recording medium PROD_B5 may be used for recording a non-encoded moving image, or may be encoded using a recording encoding method different from the transmission encoding method. May be. In the latter case, an encoding unit (not shown) for encoding the moving image acquired from the decoding unit PROD_B3 according to the recording encoding method may be interposed between the decoding unit PROD_B3 and the recording medium PROD_B5.
 なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。 Note that the transmission medium for transmitting the modulation signal may be wireless or wired. Further, the transmission mode for transmitting the modulated signal may be broadcasting (here, a transmission mode in which the transmission destination is not specified in advance) or communication (here, transmission in which the transmission destination is specified in advance). Refers to the embodiment). That is, the transmission of the modulation signal may be realized by any of wireless broadcasting, wired broadcasting, wireless communication, and wired communication.
 例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。 For example, a terrestrial digital broadcast broadcasting station (broadcasting equipment or the like) / receiving station (such as a television receiver) is an example of a transmitting device PROD_A / receiving device PROD_B that transmits and receives a modulated signal by wireless broadcasting. Further, a broadcasting station (such as broadcasting equipment) / receiving station (such as a television receiver) of cable television broadcasting is an example of a transmitting device PROD_A / receiving device PROD_B that transmits and receives a modulated signal by cable broadcasting.
 また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。 Also, a server (workstation etc.) / Client (television receiver, personal computer, smart phone etc.) such as VOD (Video On Demand) service and video sharing service using the Internet is a transmitting device for transmitting and receiving modulated signals by communication. This is an example of PROD_A / reception device PROD_B (usually, either a wireless or wired transmission medium is used in a LAN, and a wired transmission medium is used in a WAN). Here, the personal computer includes a desktop PC, a laptop PC, and a tablet PC. The smartphone also includes a multi-function mobile phone terminal.
 なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。 In addition to the function of decoding the encoded data downloaded from the server and displaying it on the display, the video sharing service client has a function of encoding a moving image captured by the camera and uploading it to the server. That is, the client of the video sharing service functions as both the transmission device PROD_A and the reception device PROD_B.
 次に、上述した動画像符号化装置2及び動画像復号装置1を、動画像の記録及び再生に利用できることを、図28を参照して説明する。 Next, it will be described with reference to FIG. 28 that the above-described moving image encoding device 2 and moving image decoding device 1 can be used for recording and reproduction of moving images.
 図28の(a)は、上述した動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。図28の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_C1として利用される。 (A) of FIG. 28 is a block diagram showing a configuration of a recording apparatus PROD_C in which the above-described moving picture encoding apparatus 2 is mounted. As shown in (a) of FIG. 28, the recording device PROD_C includes an encoding unit PROD_C1 that obtains encoded data by encoding a moving image, and the encoded data obtained by the encoding unit PROD_C1 on the recording medium PROD_M. A writing unit PROD_C2 for writing. The moving image encoding apparatus 2 described above is used as the encoding unit PROD_C1.
 なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。 The recording medium PROD_M may be of a type built in the recording device PROD_C, such as (1) HDD (Hard Disk Drive) or SSD (Solid State Drive), or (2) SD memory. It may be of the type connected to the recording device PROD_C, such as a card or USB (Universal Serial Bus) flash memory, or (3) DVD (Digital Versatile Disc) or BD (Blu-ray Disc: registration) Or a drive device (not shown) built in the recording device PROD_C.
 また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図28の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。 The recording device PROD_C is a camera PROD_C3 that captures moving images as a supply source of moving images to be input to the encoding unit PROD_C1, an input terminal PROD_C4 for inputting moving images from the outside, and reception for receiving moving images. The unit PROD_C5 and an image processing unit C6 that generates or processes an image may be further provided. In FIG. 28A, a configuration in which the recording apparatus PROD_C includes all of these is illustrated, but a part of the configuration may be omitted.
 なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。 The receiving unit PROD_C5 may receive a non-encoded moving image, or may receive encoded data encoded by a transmission encoding scheme different from the recording encoding scheme. You may do. In the latter case, a transmission decoding unit (not shown) that decodes encoded data encoded by the transmission encoding method may be interposed between the reception unit PROD_C5 and the encoding unit PROD_C1.
 このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。 Examples of such a recording device PROD_C include a DVD recorder, a BD recorder, and an HDD (Hard Disk Drive) recorder (in this case, the input terminal PROD_C4 or the receiving unit PROD_C5 is a main supply source of moving images). . In addition, a camcorder (in this case, the camera PROD_C3 is a main source of moving images), a personal computer (in this case, the receiving unit PROD_C5 or the image processing unit C6 is a main source of moving images), a smartphone (this In this case, the camera PROD_C3 or the receiving unit PROD_C5 is a main supply source of moving images) is also an example of such a recording device PROD_C.
 図28の(b)は、上述した動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図28の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置1は、この復号部PROD_D2として利用される。 (B) of FIG. 28 is a block showing a configuration of a playback device PROD_D equipped with the above-described video decoding device 1. As shown in FIG. 28 (b), the playback device PROD_D reads a moving image by decoding a read unit PROD_D1 that reads encoded data written to the recording medium PROD_M and a coded data read by the read unit PROD_D1. And a decoding unit PROD_D2 to be obtained. The moving picture decoding apparatus 1 described above is used as the decoding unit PROD_D2.
 なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。 Note that the recording medium PROD_M may be of the type built into the playback device PROD_D, such as (1) HDD or SSD, or (2) such as an SD memory card or USB flash memory, It may be of a type connected to the playback device PROD_D, or (3) may be loaded into a drive device (not shown) built in the playback device PROD_D, such as DVD or BD. Good.
 また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図28の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。 In addition, the playback device PROD_D has a display PROD_D3 that displays a moving image, an output terminal PROD_D4 that outputs the moving image to the outside, and a transmission unit that transmits the moving image as a supply destination of the moving image output by the decoding unit PROD_D2. PROD_D5 may be further provided. FIG. 28B illustrates a configuration in which the playback apparatus PROD_D includes all of these, but some of the configurations may be omitted.
  なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。 The transmission unit PROD_D5 may transmit an unencoded moving image, or transmits encoded data encoded by a transmission encoding method different from the recording encoding method. You may do. In the latter case, it is preferable to interpose an encoding unit (not shown) that encodes a moving image using an encoding method for transmission between the decoding unit PROD_D2 and the transmission unit PROD_D5.
 このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
〔まとめ〕
 本発明の一態様に係る画像復号装置は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号装置において、前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備える。
Examples of such a playback device PROD_D include a DVD player, a BD player, and an HDD player (in this case, an output terminal PROD_D4 to which a television receiver or the like is connected is a main supply destination of moving images). . In addition, a television receiver (in this case, the display PROD_D3 is a main supply destination of moving images), a digital signage (also referred to as an electronic signboard or an electronic bulletin board), and the display PROD_D3 or the transmission unit PROD_D5 is the main supply of moving images. Desktop PC (in this case, the output terminal PROD_D4 or the transmission unit PROD_D5 is the main video image supply destination), laptop or tablet PC (in this case, the display PROD_D3 or the transmission unit PROD_D5 is a moving image) A smartphone (which is a main image supply destination), a smartphone (in this case, the display PROD_D3 or the transmission unit PROD_D5 is a main moving image supply destination), and the like are also examples of such a playback device PROD_D.
[Summary]
An image decoding apparatus according to an aspect of the present invention uses a single prediction that refers to one reference image or a bi-prediction that refers to two reference images as a prediction method for inter-screen prediction. In the image decoding apparatus for decoding, when the prediction unit is a prediction unit having a predetermined size or less, a bi-prediction restriction unit is provided for restricting the bi-prediction to the prediction unit.
 本発明の一態様に係る画像復号装置は、予測単位の動き補償パラメータをマージ候補として導出する処理において、隣接する予測単位の動き補償パラメータに基づいて、該マージ候補を導出するマージ候補導出手段を備え、導出される前記マージ候補が、前記双予測である場合、前記双予測制限手段は、前記双予測を前記単予測に変換する。 An image decoding apparatus according to an aspect of the present invention includes a merge candidate derivation unit that derives a merge candidate based on a motion compensation parameter of an adjacent prediction unit in a process of deriving a motion compensation parameter of a prediction unit as a merge candidate. If the merge candidate to be derived is the bi-prediction, the bi-prediction restriction unit converts the bi-prediction into the single prediction.
 本発明の一態様に係る画像復号装置は、参照ピクチャリストの使用の有無を示す予測リスト利用フラグを少なくとも2つ用いる場合であって、該少なくとも2つの予測リスト利用フラグが、該参照ピクチャリストを使用することを示している場合、前記双予測制限手段は、前記少なくとも2つの前記予測リスト利用フラグのうち1つを、前記参照ピクチャリストを使用しないことを示すように変換する。 The image decoding apparatus according to an aspect of the present invention uses at least two prediction list usage flags indicating whether or not a reference picture list is used, and the at least two prediction list usage flags indicate the reference picture list. In the case where the use is indicated, the bi-prediction restriction unit converts one of the at least two prediction list use flags to indicate that the reference picture list is not used.
 本発明の一態様に係る画像復号装置は、前記双予測制限手段が、前記参照ピクチャリストの一つであるL1リストを使用することを示す前記予測リスト利用フラグを、該L1リストを使用しないことを示すように変換する。 In the image decoding device according to an aspect of the present invention, the bi-prediction restriction unit does not use the prediction list use flag indicating that the L1 list that is one of the reference picture lists is used. As shown.
 本発明の一態様に係る画像復号装置は、前記予測単位のサイズが、該予測単位の幅と高さを用いて算出される。 In the image decoding device according to an aspect of the present invention, the size of the prediction unit is calculated using the width and height of the prediction unit.
 本発明の一態様に係る画像復号装置は、前記双予測制限手段が、前記予測単位が所定のサイズより大きい場合は、前記双予測および前記単予測のいずれを行うかを示す情報を復号し、前記予測単位が所定のサイズ以下の場合は、前記双予測および前記単予測のいずれを行うかを示す情報の復号を省略して、前記単予測を行う。 In the image decoding device according to an aspect of the present invention, the bi-prediction restriction unit decodes information indicating whether to perform the bi-prediction or the uni-prediction when the prediction unit is larger than a predetermined size, When the prediction unit is a predetermined size or less, decoding of information indicating whether to perform the bi-prediction or the single prediction is omitted, and the single prediction is performed.
 本発明の一態様に係る画像復号方法は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号方法において、前記予測単位が所定のサイズ以下の予測単位であるか否かを判定するステップと、前記予測単位に対して前記双予測を使用しないように制限するステップとを少なくとも含む。 An image decoding method according to an aspect of the present invention uses, as a prediction method for inter-screen prediction, a single prediction that refers to one reference image or bi-prediction that refers to two reference images to generate an image in a prediction unit. In the image decoding method for decoding, at least a step of determining whether or not the prediction unit is a prediction unit of a predetermined size or less and a step of restricting the bi-prediction from being used for the prediction unit are included. .
 本発明の一態様に係る画像符号化装置は、画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を符号化する画像符号化装置において、記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備える。 An image coding apparatus according to an aspect of the present invention uses, as a prediction method for inter-screen prediction, uni-prediction that refers to one reference image or bi-prediction that refers to two reference images. In the image encoding device that encodes the image, when the prediction unit is a prediction unit of a predetermined size or less, a bi-prediction restriction unit is provided for restricting the bi-prediction to the prediction unit.
 本発明の一態様に係る画像復号装置は、符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号装置において、前記符号化単位を分割する分割タイプを指定する情報を復号するCU情報復号部と、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号する算術復号部とを備え、前記CU情報復号部が、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を復号する場合、前記算術復号部は、前記バイナリ値の位置に応じて、前記コンテキストを用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号する。 An image decoding apparatus according to an aspect of the present invention provides, in an image decoding apparatus that decodes image encoded data and generates a decoded image for each encoding unit, information that specifies a division type for dividing the encoding unit. A CU information decoding unit for decoding, and an arithmetic decoding unit for decoding a binary value from the image encoded data by arithmetic decoding using a context or arithmetic decoding without using a context, and the CU information decoding unit includes the division When decoding information designating asymmetric partition (AMP) as a type, the arithmetic decoding unit performs arithmetic decoding using the context and arithmetic not using the context according to the position of the binary value. Decoding is switched to decoding.
 本発明の上記の態様によれば、非対称パーティションを用いる場合における符号量の削減と、非対称パーティションの性質を活用した効率のよい符号化/復号処理を実現することができる。 According to the above aspect of the present invention, it is possible to realize a reduction in the amount of code when using an asymmetric partition and an efficient encoding / decoding process utilizing the properties of the asymmetric partition.
 また、本発明は以下のように表現することもできる。すなわち、本発明の一態様に係る画像復号装置は、符号化単位毎に、画像を復元するための情報を画像符号化データから復号して画像を復元する画像復号装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を復号する復号手段を備えることを特徴とする。 The present invention can also be expressed as follows. That is, an image decoding apparatus according to an aspect of the present invention provides, for each coding unit, an image decoding apparatus that restores an image by decoding information for restoring an image from image encoded data, For codes assigned to a combination with a prediction method applied to a coding unit, a combination other than the combination is applied to a combination in which a prediction method for intra prediction is applied to a coding unit having a size equal to or smaller than a predetermined size. And a decoding means for decoding a code shorter than the code assigned to.
 上記の構成において、所定サイズ以下のサイズの符号化単位は、当該所定サイズよりも大きいサイズの符号化単位では、インター予測が当たりにくくなるようなサイズの符号化単位である。 In the above configuration, a coding unit having a size equal to or smaller than a predetermined size is a coding unit having a size such that inter prediction is difficult to hit in a coding unit having a size larger than the predetermined size.
 インター予測が当たりにくい領域では、所定サイズ以下のサイズの小さい符号化単位が適用される傾向がある。なお、以下、所定サイズよりも大きいサイズの符号化単位のことを大きい符号化単位と称する。 ∙ In areas where inter prediction is difficult to hit, smaller coding units that are smaller than a predetermined size tend to be applied. Hereinafter, a coding unit having a size larger than the predetermined size is referred to as a large coding unit.
 所定サイズ以下のサイズの符号化単位は、例示的には、最小サイズの符号化単位であり、8×8画素の符号化単位である。 The coding unit having a size equal to or smaller than the predetermined size is, for example, a coding unit having a minimum size and an 8 × 8 pixel coding unit.
 このような小さい符号化単位では、大きい符号化単位よりも空間相関性が高くなるので、予測精度の向上を図るためイントラCUが適用されることが多い。 In such a small coding unit, spatial correlation is higher than that in a large coding unit, and therefore, an intra CU is often applied in order to improve prediction accuracy.
 上記の構成では、符号化サイズが小さく、予測方式が画面内予測である組み合わせについて、それ以外の組み合わせよりも短い符号が割り当てられる。 In the above configuration, a code having a smaller coding size and a prediction method of intra prediction is assigned a shorter code than the other combinations.
 このため、上記の構成によれば、所定サイズ以下のサイズの符号化単位において発生確率が高い組み合わせに短い符号を割り当てることができ、符号化効率が向上するという効果を奏する。 For this reason, according to the above configuration, it is possible to assign a short code to a combination having a high probability of occurrence in a coding unit having a size equal to or smaller than a predetermined size, and the effect of improving coding efficiency is achieved.
 本発明の一態様に係る画像復号装置は、上記復号手段が、上記組み合わせに対して、上記所定サイズより大きいサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して割り当てられている符号に比べて、短い符号を復号することが好ましい。 In the image decoding device according to an aspect of the present invention, the decoding unit is assigned to the combination in which the prediction method for intra prediction is applied to the encoding unit having a size larger than the predetermined size. It is preferable to decode short codes compared to existing codes.
 上記の構成によれば、画面内予測が当たりにくい大きい符号化単位において画面内予測の予測方式が適用される場合よりも、画面内予測が当たりやすい小さい符号化単位において画面内予測の予測方式が適用される場合に、より短い符号が復号される。 According to the above configuration, the prediction method for intra prediction in a small coding unit that is likely to hit in-screen prediction is larger than the case where the prediction method for intra-screen prediction is applied in a large coding unit that is difficult to hit within the screen. When applied, shorter codes are decoded.
 これにより、出現頻度が高い組み合わせに対して、短い符号を復号することができ、その結果、符号化効率を向上させることができる。 Thereby, it is possible to decode a short code for a combination having a high appearance frequency, and as a result, it is possible to improve the encoding efficiency.
 本発明の一態様に係る画像復号装置は、上記復号手段が、上記組み合わせに対して、上記所定サイズと同一サイズの符号化単位に画面内予測以外の予測方式が適用される組み合わせに対して割り当てられている符号に比べて、短い符号を復号することが好ましい。 In the image decoding device according to an aspect of the present invention, the decoding unit allocates, to the combination, a combination in which a prediction method other than intra prediction is applied to an encoding unit having the same size as the predetermined size. It is preferable to decode a short code compared to the code being used.
 上記の構成によれば、小さい符号化単位において予測が当たりにくい画面間予測よりも、予測が当たりやすい画面内予測について、短い符号を復号することができる。 According to the above configuration, it is possible to decode a short code for intra prediction that is more likely to be predicted than inter prediction that is difficult to predict in a small encoding unit.
 これにより、出現頻度が高い組み合わせに対して、短い符号を復号することができ、その結果、符号化効率を向上させることができる。 Thereby, it is possible to decode a short code for a combination having a high appearance frequency, and as a result, it is possible to improve the encoding efficiency.
 本発明の一態様に係る画像復号装置は、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、上記画面間予測が適用される、所定サイズ以下のサイズの予測単位である対象予測単位について、双予測を行うことを制限する双予測制限手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention performs inter-screen prediction of an image in a prediction unit, either uni-prediction referring to one reference image or bi-prediction referring to two reference images. In the image decoding apparatus restored by a prediction method, the image decoding apparatus includes bi-prediction restriction means for restricting bi-prediction for a target prediction unit that is a prediction unit having a size of a predetermined size or less to which the inter-screen prediction is applied. Features.
 双予測は、単予測よりも処理量が多い。なお、双予測とは、画面間予測において参照する画像を2つ用いる予測方式のことである。参照する画像は、対象フレームに対して時間的に前方であっても後方であってもよい。 Bi-prediction requires more processing than single prediction. Note that bi-prediction is a prediction method that uses two images referred to in inter-screen prediction. The image to be referred to may be temporally forward or backward with respect to the target frame.
 また、所定サイズ以下のサイズの小さい予測単位では、所定サイズよりも大きいサイズの大きい予測単位よりも、単位面積当たりの処理量が多い。 Also, a small prediction unit having a size smaller than or equal to a predetermined size has a larger processing amount per unit area than a large prediction unit having a size larger than the predetermined size.
 従って、小さい予測単位において双予測を行うと、どちらも処理量が多いため、復号処理のボトルネックになりやすい。 Therefore, when bi-prediction is performed in a small prediction unit, the amount of processing is large, so that it tends to be a bottleneck in decoding processing.
 上記の構成によれば、小さい予測単位において双予測を行うことを制限する。なお、制限するとは、双予測における一部の処理を省略すること、および、双予測の処理を行わないことを含む。 According to the above configuration, bi-prediction is limited in a small prediction unit. The restriction includes omitting a part of processing in bi-prediction and not performing bi-prediction processing.
 上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができるという効果を奏する。 By performing the above restriction, there is an effect that it is possible to reduce the amount of processing that becomes a bottleneck of decoding processing.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、上記対象予測単位における予測画像の生成に用いる動きベクトルの少なくとも一部の復号を省略しない予測単位であって、かつ、上記対象予測単位の近傍の予測単位に割り付けられている予測パラメータから、該対象予測単位に割り付ける予測パラメータの推定を行わない上記対象予測単位に対して、上記制限を行うことが好ましい。 In the image decoding device according to an aspect of the present invention, the bi-prediction restriction unit is a prediction unit that does not omit decoding at least a part of a motion vector used for generating a predicted image in the target prediction unit, and It is preferable to perform the above restriction on the target prediction unit that does not estimate the prediction parameter assigned to the target prediction unit from the prediction parameters assigned to the prediction unit in the vicinity of the target prediction unit.
 上記の構成によれば、いわゆるスキップ処理およびマージ処理を行わず、実際に対象予測単位に予測パラメータを導出する場合において、双予測を制限する。 According to the above configuration, so-called skip processing and merge processing are not performed, and bi-prediction is limited when a prediction parameter is actually derived for a target prediction unit.
 スキップ処理やマージ処理を行わない場合、動きベクトルを全て復号する必要があり処理量が増加する。したがって、そのような場合に上記制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができる。 When skip processing and merge processing are not performed, it is necessary to decode all motion vectors, which increases the processing amount. Therefore, by performing the above restriction in such a case, it is possible to reduce the amount of processing that becomes a bottleneck of decoding processing.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、双予測および単予測のいずれを行うかを示す情報の復号を省略して、単予測を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, it is preferable that the bi-prediction restriction unit performs single prediction by omitting decoding of information indicating whether bi-prediction or single prediction is performed.
 上記の構成によれば、双予測を制限する対象予測単位における復号処理を簡略化することができる。また、単予測を行うことが予め決まっているのに、双予測および単予測のいずれを行うかを示す情報を復号するというオーバーヘッドを回避することができる。 According to the above configuration, the decoding process in the target prediction unit that restricts bi-prediction can be simplified. Further, it is possible to avoid the overhead of decoding information indicating whether to perform bi-prediction or uni-prediction, although it is determined in advance that uni-prediction is performed.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、双予測における重み付け予測に関する情報の処理を省略することが好ましい。 In the image decoding apparatus according to an aspect of the present invention, it is preferable that the bi-prediction restriction unit omits processing of information related to weighted prediction in bi-prediction.
 上記の構成によれば、双予測における重み付け予測に関する情報の処理を省略することで、双予測における処理量を軽減できる。その結果、重み付け予測に関する情報の処理のような、復号処理のボトルネックになるような処理の処理量を低減することができる。 According to the above configuration, the amount of processing in bi-prediction can be reduced by omitting processing of information related to weighted prediction in bi-prediction. As a result, it is possible to reduce the amount of processing that becomes a bottleneck of decoding processing, such as processing information related to weighted prediction.
 本発明の一態様に係る画像復号装置では、当該画像復号装置が、復号済みの予測単位の復号に用いた動き補償パラメータからマージ候補を導出するマージ候補導出手段を備え、上記双予測制限手段は、上記マージ候補導出手段で導出されるマージ候補が双予測である場合には、該双予測を単予測に変換する双単予測変換手段を備えるものであってもよい。 In the image decoding device according to an aspect of the present invention, the image decoding device includes a merge candidate derivation unit that derives a merge candidate from a motion compensation parameter used for decoding a decoded prediction unit, and the bi-prediction restriction unit includes: When the merge candidate derived by the merge candidate deriving means is bi-prediction, bi-prediction conversion means for converting the bi-prediction into single prediction may be provided.
 上記の構成によれば、対象予測単位における予測画像の復号にマージ処理を用いる場合でも、双予測を制限することができ、対象予測単位における復号処理を簡略化することができる。 According to the above configuration, even when the merge process is used for decoding the prediction image in the target prediction unit, bi-prediction can be restricted, and the decoding process in the target prediction unit can be simplified.
 本発明の一態様に係る画像復号装置は、上記双単予測変換手段が、参照ピクチャリストの使用の有無を示すフラグである予測リスト利用フラグを2つ用いる場合に、該2つの予測リスト利用フラグの両者が、上記参照ピクチャリストを使用することを示しているとき、上記2つの予測リスト利用フラグの一方のフラグを、上記参照ピクチャリストを使用しないことを示すように変換するものであってもよい。 In the image decoding device according to an aspect of the present invention, when the bi-prediction conversion unit uses two prediction list use flags that are flags indicating whether or not a reference picture list is used, the two prediction list use flags When both indicate that the reference picture list is used, one of the two prediction list use flags may be converted to indicate that the reference picture list is not used. Good.
 上記の構成によれば、予測リスト利用フラグを用いて双予測を行うか、単予測を行うかを制御する画像復号装置において、双予測を制限することができ、対象予測単位における復号処理を簡略化することができる。 According to the above configuration, bi-prediction can be limited in the image decoding apparatus that controls whether bi-prediction or uni-prediction is performed using the prediction list use flag, and the decoding process in the target prediction unit is simplified. Can be
 本発明の一態様に係る画像復号装置は、上記双単予測変換手段が、L0リストを使用することを示す参照ピクチャリストのフラグを、当該L0リストを使用しないことを示すように変換するものであってもよい。 In the image decoding device according to an aspect of the present invention, the bi-predictive conversion unit converts the flag of the reference picture list indicating that the L0 list is used so as to indicate that the L0 list is not used. There may be.
 上記の構成によれば、予測リスト利用フラグを用いて双予測を行うか、単予測を行うかを制御する復号装置において、符号化効率を保持したまま、双予測を制限することができ、対象予測単位における復号処理を簡略化することができる。 According to the above configuration, in the decoding device that controls whether to perform bi-prediction or uni-prediction using the prediction list use flag, bi-prediction can be limited while maintaining coding efficiency. The decoding process in the prediction unit can be simplified.
 ここで、L0リストとは、主として前方向予測に使用するピクチャのリストである。一般に、動き補償パラメータの導出では、L0リストの参照ピクチャを優先することが多い。逆に、L0リストの参照ピクチャの代わりにL1リストの参照ピクチャを使用することによれば、これらのL0リストを優先する導出処理と差別化することができる。ある符号化パラメータにより複数の導出処理が選択可能な場合において、あるグループの導出処理をL0リスト優先、他のグループの導出処理をL1リスト優先とすると、各々の導出処理は互いに相補的に用いることができるため、より多くの動きの性質のシーケンスや領域において有効に作用する。そのため、双単予測変換においては、L1リストを用いることによって高い符号化効率を得ることができる。 Here, the L0 list is a list of pictures mainly used for forward prediction. In general, in deriving motion compensation parameters, reference pictures in the L0 list are often given priority. Conversely, by using reference pictures in the L1 list instead of reference pictures in the L0 list, it is possible to differentiate from the derivation process that prioritizes these L0 lists. When a plurality of derivation processes can be selected according to a certain encoding parameter, assuming that a derivation process for a certain group is L0 list priority and a derivation process for other groups is L1 list priority, the respective derivation processes are used in a complementary manner. Therefore, it works effectively in sequences and areas with more motion properties. Therefore, in bi-predictive transformation, high encoding efficiency can be obtained by using the L1 list.
 本発明の一態様に係る画像復号装置は、上記双単予測変換手段が、上記参照ピクチャリストの使用の有無を示すフラグを、上記参照ピクチャリストを使用しないことを示すように変換する場合、参照インデックス番号および動きベクトルのリフレッシュを行わないものであってもよい。 In the image decoding device according to an aspect of the present invention, when the bi-prediction conversion unit converts the flag indicating whether or not the reference picture list is used so as to indicate that the reference picture list is not used, the reference The index number and the motion vector may not be refreshed.
 上記の構成によれば、参照ピクチャリストの使用を制限した場合においても、後続の処理において、制限した方の、参照インデックス番号および動きベクトルの値を使用することができる。そのため、リフレッシュを行う場合と比較して符号化効率を保持したまま、双予測を制限することができ、対象予測単位における復号処理を簡略化することができる。 According to the above configuration, even when the use of the reference picture list is restricted, the reference index number and the motion vector value of the restricted one can be used in the subsequent processing. Therefore, bi-prediction can be restricted while maintaining encoding efficiency as compared with the case where refresh is performed, and decoding processing in the target prediction unit can be simplified.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、結合インター予測参照インデックスに対応するコード番号を復号する場合、コード番号の値の最大値を、双予測を制限するときは単予測の結合参照ピクチャセットの数に設定し、双予測を制限しないときは、単予測の結合参照ピクチャセットの数と双予測の結合参照ピクチャセットの数との和に設定するものであってもよい。 In the image decoding device according to an aspect of the present invention, when the bi-prediction restriction unit decodes the code number corresponding to the combined inter prediction reference index, the maximum value of the code number value is restricted when bi-prediction is restricted. When set to the number of combined reference picture sets for uni-prediction and does not restrict bi-prediction, it is set to the sum of the number of combined reference picture sets for uni-prediction and the number of combined reference picture sets for bi-prediction. Also good.
 上記の構成によれば、結合インター予測参照インデックスを用いる画像復号装置において、単予測を行うことが予め決まっているのに、双予測の場合に対応するコード番号を復号するというオーバーヘッドを回避することができる。 According to the above configuration, in an image decoding apparatus using a joint inter prediction reference index, it is determined in advance that single prediction is performed, but avoids the overhead of decoding a code number corresponding to bi-prediction. Can do.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、結合インター予測参照インデックスを復号する場合に、双予測を制限するときは、コード番号から可変テーブルを用いて上記結合インター予測参照インデックスを導出し、制限しないときは、可変テーブルを用いずにコード番号から上記結合インター予測参照インデックスを導出するものであってもよい。 In the image decoding apparatus according to an aspect of the present invention, when the bi-prediction restriction unit decodes the joint inter prediction reference index, when the bi-prediction is restricted, the joint inter prediction is performed using a variable table from a code number. When the reference index is derived and not limited, the combined inter prediction reference index may be derived from the code number without using the variable table.
 上記の構成によれば、可変テーブルを用いてコード番号から結合インター予測参照インデックスを復号する画像復号装置において、双予測を制限する場合における可変テーブルに関する復号処理を簡略することができる。 According to the above configuration, in the image decoding apparatus that decodes a combined inter prediction reference index from a code number using a variable table, it is possible to simplify the decoding process for the variable table when bi-prediction is restricted.
 本発明の一態様に係る画像復号装置は、上記双予測制限手段が、復号した結合インター予測参照インデックスが結合参照ピクチャセット以外を示す場合、双予測を制限するときは、双予測および単予測のいずれを行うかを示す情報の復号を省略して単予測を行い、双予測を制限しないときは、双予測および単予測のいずれを行うかを示す情報の復号を行うものであってもよい。 In the image decoding apparatus according to an aspect of the present invention, when the bi-prediction restriction unit restricts bi-prediction when the decoded combined inter-prediction reference index indicates other than a combined reference picture set, bi-prediction and single prediction are performed. When decoding is performed by omitting decoding of information indicating which one is to be performed and bi-prediction is not limited, information indicating whether bi-prediction or single prediction is to be performed may be decoded.
 上記の構成によれば、結合インター予測参照インデックスを用いる画像復号装置において、単予測を行うことが予め決まっているのに、双予測および単予測のいずれを行うかを示す情報を復号するというオーバーヘッドを回避することができる。 According to the above configuration, in the image decoding apparatus using the joint inter prediction reference index, the overhead of decoding information indicating whether bi-prediction or uni-prediction is to be performed even though it is predetermined to perform uni-prediction. Can be avoided.
 本発明の一態様に係る画像復号装置では、当該画像復号装置は、対象予測単位における予測画像の復号にマージ処理を用いる場合に動き補償パラメータの候補であるマージ候補を導出するマージ候補導出手段を備え、上記マージ候補導出手段は、上記対象予測単位に隣接している隣接対象予測単位の復号に用いた動き補償パラメータからマージ候補を導出する隣接マージ候補導出手段と、複数の参照ピクチャからマージ候補を導出する双予測マージ候補導出手段を備え、上記マージ候補導出手段は、上記対象予測単位が、所定のサイズのとき、上記双予測マージ候補導出手段によるマージ候補を用いないものであってもよい。 In the image decoding apparatus according to an aspect of the present invention, the image decoding apparatus includes merge candidate derivation means for deriving merge candidates that are motion compensation parameter candidates when merge processing is used for decoding a predicted image in a target prediction unit. The merge candidate derivation means includes an adjacent merge candidate derivation means for deriving a merge candidate from a motion compensation parameter used for decoding an adjacent target prediction unit adjacent to the target prediction unit, and a merge candidate from a plurality of reference pictures. A bi-predictive merge candidate deriving unit for deriving the bi-predictive merge candidate, and the merge candidate deriving unit may not use the merge candidate by the bi-predictive merge candidate deriving unit when the target prediction unit has a predetermined size. .
 上記の構成によれば、双予測に対するマージ候補の導出を省略することにより、マージ候補の導出を簡略化することができる。 According to the above configuration, derivation of merge candidates can be simplified by omitting derivation of merge candidates for bi-prediction.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、復号対象となる上記符号化単位である対象符号化単位を上記予測単位へ分割するタイプである分割タイプと予測方式との複数の組に対して対応付けられる複数の符号を、復号の対象となる上記予測単位である対象予測単位の近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて変更する変更手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention is an image decoding apparatus that generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and restores the image, and is a decoding target. A plurality of codes associated with a plurality of sets of a division type and a prediction method, which is a type for dividing a target coding unit that is a coding unit into the prediction units, are the prediction units to be decoded. It is characterized by comprising changing means for changing according to a decoded parameter assigned to a decoded prediction unit in the vicinity of the target prediction unit.
 予測画像を生成する単位は、符号化処理の単位となる符号化単位を基準に決定される。具体的には、符号化単位と同じ領域または符号化単位を分割して得られる領域を予測単位とする。 The unit for generating the predicted image is determined based on the encoding unit that is the unit of the encoding process. Specifically, the same region as the coding unit or a region obtained by dividing the coding unit is set as the prediction unit.
 上記の構成において、上記予測単位への分割タイプは、正方形への分割および非正方形への分割を含んでいてもよい。正方形への分割は、分割によって得られる予測単位が正方形である場合である。 In the above configuration, the division type into the prediction units may include division into a square and division into a non-square. The division into squares is a case where the prediction unit obtained by the division is a square.
 例えば、正方形の符号化単位を、4つの正方形に四分割する場合がこれに該当する。また、正方形の符号化単位と同じサイズの領域を予測単位とする非分割の場合もこれに該当する。非分割の場合の分割タイプは、一般的には、2N×2Nと表される。 For example, this is the case when a square coding unit is divided into four squares. This also applies to the case of non-division using a region having the same size as the square coding unit as a prediction unit. The division type in the case of non-division is generally expressed as 2N × 2N.
 非正方形への分割は、分割によって得られる予測単位が非正方形である場合である。例えば、符号化単位の領域を大きな長方形と、小さな長方形とに分割する場合がこれに該当する。 <Division into non-square> is when the prediction unit obtained by the division is non-square. For example, this is the case when the coding unit area is divided into a large rectangle and a small rectangle.
 また、符号とは、符号化されたパラメータ値のバイナリ(bin)列のことをいう。バイナリ列は直接符号化されてもよいし、算術符号化により符号化されてもよい。予測方式は、画面間予測および画面内予測のいずれかである。また、予測方式および分割タイプの組とは、例えば、(画面内予測,非分割)であり、pred_typeというパラメータ値によって表されることもある。 Also, the sign means a binary string of encoded parameter values. The binary sequence may be directly encoded or may be encoded by arithmetic encoding. The prediction method is either inter-screen prediction or intra-screen prediction. Further, the set of the prediction method and the division type is, for example, (intra-screen prediction, non-division), and may be represented by a parameter value called pred_type.
 また、上記の構成では、符号と、予測方式および分割タイプの組とは、1対1で対応付けられる。 Also, in the above configuration, a code is associated with a set of prediction scheme and division type on a one-to-one basis.
 上記の構成によれば、復号済みパラメータに応じて、上記対応付けを変更する。言い換えれば、同じ符号であっても、復号済みパラメータに応じて、いずれの予測方式および分割タイプの組を示すかの解釈を変更するということである。 According to the above configuration, the association is changed according to the decoded parameter. In other words, even if the codes are the same, the interpretation of which prediction scheme and division type pair is shown is changed according to the decoded parameters.
 このため、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てることができる。 Therefore, a shorter code can be assigned to a combination of a prediction method and a division type having a higher occurrence probability.
 具体的には、対象符号化単位に隣接する符号化単位が、画面内予測を行う符号化単位である場合、対象符号化単位も画面内予測が採用される可能性が高くなる。 Specifically, when the coding unit adjacent to the target coding unit is a coding unit for performing intra prediction, the target coding unit is likely to be used for intra prediction.
 よって、このような場合、画面内予測を含む組に短い符号を割り当てることが望ましい。 Therefore, in such a case, it is desirable to assign a short code to the set including the intra prediction.
 上記の構成によれば、近傍の復号済み予測単位に割り付けられている復号済みパラメータに応じて、より発生確率が高い予測方式および分割タイプの組に、より短い符号を割り当てるので、符号化効率を向上させることができる。 According to the above configuration, a shorter code is assigned to a set of a prediction method and a division type having a higher probability of occurrence according to a decoded parameter assigned to a neighboring decoded prediction unit. Can be improved.
 本発明の一態様に係る画像復号装置は、上記変更手段が、上記対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているときに、画面内予測の予測方式を含む組に対応付けられる符号を、短い符号に変更することが好ましい。 In the image decoding device according to an aspect of the present invention, when the changing unit allocates an intra-screen prediction prediction method to a decoded coding unit in the vicinity of the target coding unit, the prediction of the intra-screen prediction is performed. It is preferable to change the code associated with the set including the method to a short code.
 上記の構成によれば、対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているときに、画面内予測の予測方式を含む組に対応付けられる符号を、短い符号に変更する。 According to the above configuration, when a prediction scheme for intra prediction is assigned to a decoded encoding unit in the vicinity of the target encoding unit, a code associated with a set including the prediction scheme for intra prediction is Change to a shorter code.
 なお、近傍とは、複数であってもよく、例えば、上隣接符号化単位および左隣接符号化単位を近傍とすることが挙げられる。 Note that there may be a plurality of neighborhoods, for example, the neighborhood of the upper adjacent coding unit and the left adjacent coding unit may be mentioned.
 この場合、上隣接符号化単位および左隣接符号化単位のいずれか、もしくは、両方において、画面内予測の予測方式が割り付けられていればよい。 In this case, the prediction method for intra-screen prediction only needs to be assigned to one or both of the upper adjacent coding unit and the left adjacent coding unit.
 対象符号化単位の近傍の復号済み符号化単位に画面内予測の予測方式が割り付けられているとき、対象符号化単位も画面内予測が割り付けられる可能性が高い。 When the prediction method for intra prediction is assigned to a decoded encoding unit in the vicinity of the target encoding unit, it is highly likely that the target encoding unit is also assigned intra prediction.
 このため、発生頻度が高い組に対応付けられる符号を短くすることができ、符号化効率が向上する。 For this reason, it is possible to shorten a code associated with a group having a high occurrence frequency, and to improve encoding efficiency.
 本発明の一態様に係る画像復号装置は、上記変更手段が、上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいときに、隣接する方向への分割を行う分割タイプを含む組に対応付けられる符号を、短い符号に変更することが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the changing unit performs division in an adjacent direction when a decoded coding unit adjacent to the target coding unit is smaller than the target coding unit. It is preferable to change the code associated with the set including the division type to be performed to a short code.
 上記の構成によれば、上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいときに、隣接する方向への分割を行う分割タイプを含む組に対応付けられる符号を、短い符号に変更する。 According to said structure, when the decoding encoding unit adjacent to the said object encoding unit is smaller than the said object encoding unit, it is matched with the group containing the division type which performs a division | segmentation to an adjacent direction. Change the code to a short code.
 上記対象符号化単位に隣接する復号済み符号化単位が、上記対象符号化単位よりも小さいとき、対象符号化単位と、隣接する復号済み符号化単位との間の境界に対し、垂直な方向にエッジが存在する可能性が高い。すなわち、対象符号化単位が上記復号済み符号化単位に隣接する方向にエッジが現れることが多い。 When the decoded coding unit adjacent to the target coding unit is smaller than the target coding unit, the direction is perpendicular to the boundary between the target coding unit and the adjacent decoded coding unit. An edge is likely to exist. That is, an edge often appears in a direction in which the target coding unit is adjacent to the decoded coding unit.
 このような場合、隣接する方向への分割を行う分割タイプが選択されやすくなる。 In such a case, it becomes easy to select a division type for performing division in an adjacent direction.
 このため、発生頻度が高い組に対応付けられる符号を短くすることができ、符号化効率が向上する。 For this reason, it is possible to shorten a code associated with a group having a high occurrence frequency, and to improve encoding efficiency.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、復号の対象となる上記予測単位である対象予測単位が、該対象予測単位の近傍の領域に割り付けられている予測パラメータから、該対象予測単位の予測パラメータの推定を行う予測単位である場合、該対象予測単位のサイズに応じて、推定に用いる領域の候補を決定する候補決定手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention generates an image by using a prediction method for inter-frame prediction for each prediction unit obtained by dividing an encoding unit into one or more numbers, and restores the image. The target prediction unit, which is the prediction unit to be decoded, is a prediction unit for estimating the prediction parameter of the target prediction unit from the prediction parameters assigned to the area in the vicinity of the target prediction unit. The apparatus further comprises candidate determining means for determining a candidate area to be used for estimation according to the size of the target prediction unit.
 上記の構成によれば、対象予測単位のサイズに応じて、いわゆるスキップや、マージに用いる領域の候補を決定する。または、復号した差分動きベクトルと合わせて動きベクトルを復元するために用いる推定動きベクトルの導出に用いる領域の候補を設定する。 According to the above configuration, a candidate for a region used for so-called skip or merge is determined according to the size of the target prediction unit. Alternatively, an area candidate used for deriving an estimated motion vector used for restoring the motion vector is set together with the decoded difference motion vector.
 対象予測単位のサイズに応じて、画面間予測の動きベクトルの相関は変動する。例えば、所定のサイズ以下の小さい予測単位が選択される領域では、オブジェクトの動きが複雑な場合が多く、動きベクトルの相関は小さい。 The correlation of motion vectors for inter-screen prediction varies depending on the size of the target prediction unit. For example, in a region where a small prediction unit of a predetermined size or less is selected, the motion of the object is often complicated, and the correlation between the motion vectors is small.
 よって、上記構成によれば、例えば、動きの複雑度に応じて、候補数を削減することができる。これにより、サイド情報を削減することができ、その結果、符号化効率を向上させることができる。 Therefore, according to the above configuration, for example, the number of candidates can be reduced according to the complexity of the movement. Thereby, side information can be reduced and, as a result, encoding efficiency can be improved.
 本発明の一態様に係る画像復号装置は、上記候補決定手段が、所定のサイズ以下の小さい予測単位の上記候補の数を、該小さい予測単位よりも大きい予測単位の上記候補の数よりも少なくすることが好ましい。 In the image decoding device according to an aspect of the present invention, the candidate determination unit is configured such that the number of candidates for a small prediction unit equal to or smaller than a predetermined size is smaller than the number of candidates for a prediction unit larger than the small prediction unit. It is preferable to do.
 上記の構成によれば、所定のサイズ以下の小さい予測単位の上記候補の数を、該小さい予測単位よりも大きい予測単位の上記候補の数よりも少なくする。 According to the above configuration, the number of candidates for a small prediction unit of a predetermined size or less is made smaller than the number of candidates for a prediction unit larger than the small prediction unit.
 上述のとおり、所定のサイズ以下の小さい予測単位が選択される領域では、オブジェクトの動きが複雑な場合が多く、動きベクトルの相関は小さい。 As described above, in a region where a small prediction unit of a predetermined size or less is selected, the motion of the object is often complicated, and the correlation between the motion vectors is small.
 そのため、上記のような領域では、候補数を少なくしたほうが、サイド情報を削減することができるため好ましい。 Therefore, in the above area, it is preferable to reduce the number of candidates because side information can be reduced.
 本発明の一態様に係る画像復号装置では、上記候補決定手段は、所定のサイズ以下の小さい予測単位では、時間予測を上記候補に含めないことが好ましい。 In the image decoding device according to an aspect of the present invention, it is preferable that the candidate determination unit does not include temporal prediction in the candidates in a small prediction unit of a predetermined size or less.
 上記の構成によれば、所定のサイズ以下の小さい予測単位では、時間予測を上記候補に含めない。 According to the above configuration, temporal prediction is not included in the candidates in a small prediction unit of a predetermined size or less.
 小さい予測単位が選択されるような動きが複雑な領域では、時間予測に用いられる関連予測単位(collocated PU)と対象予測単位との相関が小さいため、時間予測が選択される可能性が小さい。よって、このような領域では、時間予測をマージ候補に含めないことが好ましい。 In a region where the motion is complex such that a small prediction unit is selected, the correlation between the related prediction unit (collocated PU) used for temporal prediction and the target prediction unit is small, and therefore the possibility that temporal prediction is selected is small. Therefore, in such a region, it is preferable not to include temporal prediction as a merge candidate.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、長方形の予測単位への分割を含み、上記長方形が縦長および横長のいずれであるかを示す符号と、上記長方形の種類を示す符号とを含む、上記長方形の予測単位への分割を特定するための符号のうち、上記長方形の種類を示す符号を、コンテキストを用いずに復号する復号手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention provides an image decoding apparatus that generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and restores the image. The division type includes dividing the rectangle into prediction units, and includes dividing the rectangle into prediction units including a code indicating whether the rectangle is vertically long or horizontally and a code indicating the type of the rectangle. Among the codes for specifying, a decoding means for decoding a code indicating the type of the rectangle without using a context is provided.
 上記の構成によれば、予測単位への分割タイプが、長方形の予測単位への分割の場合、長方形の種類を示す符号を、コンテキストを用いずに復号する。 According to the above configuration, when the division type into prediction units is division into rectangular prediction units, the code indicating the type of rectangle is decoded without using a context.
 長方形の種類とは、例えば、分割タイプが、横長の長方形の分割である場合、2N×N、2N×nU、2N×nDの3種類である。 The types of rectangles are, for example, three types of 2N × N, 2N × nU, and 2N × nD when the division type is horizontal rectangular division.
 予測単位の分割は、符号化単位の領域内に存在するエッジをまたがないように行われることが多い。傾きを有するエッジが領域内に存在する場合、必ずしも同一の長方形の種類が続けて選ばれないことがある。このような領域においては、コンテキストを用いて復号処理を行っても、符号化効率が向上しない場合がある。 The division of the prediction unit is often performed so as not to cross the edge existing in the coding unit area. When an edge having an inclination exists in a region, the same rectangular type may not be selected continuously. In such an area, even if decoding processing is performed using a context, the encoding efficiency may not be improved.
 逆に言えば、このような領域においては、コンテキストを用いないで復号処理を行っても、符号化効率が低下しない場合がある。 Conversely, in such a region, even if decoding processing is performed without using a context, the encoding efficiency may not be reduced.
 上記の構成によれば、上述のような領域において、符号化効率を維持しつつ、コンテキストを参照しないことによる処理の簡略化を図ることができる。 According to the above configuration, it is possible to simplify the processing by not referring to the context while maintaining the encoding efficiency in the above-described region.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに画面間予測の予測方式によって予測画像を生成して画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、上記分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う推定手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention generates an image by using a prediction method for inter-frame prediction for each prediction unit obtained by dividing an encoding unit into one or more numbers, and restores the image. In the above, the division type into prediction units includes an asymmetric division that divides the coding unit into a plurality of prediction units of different sizes or a symmetric division that divides the coding unit into a plurality of prediction units of the same size, When the division type is asymmetric division, an estimation unit is provided that estimates a prediction parameter for inter-screen prediction by an estimation method different from that when the division type is symmetric division.
 上記の構成によれば、分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と異なる推定方法によって、画面間予測の予測パラメータの推定を行う。 According to the above configuration, when the division type is asymmetric division, the prediction parameter for inter-screen prediction is estimated by an estimation method different from that when the division type is symmetric division.
 非対称分割が選択される符号化単位は、予測単位を得るための分割において、小さい方の予測単位と、大きい方の予測単位とに非対称に分割される。 The coding unit for which asymmetric division is selected is divided asymmetrically into a smaller prediction unit and a larger prediction unit in the division for obtaining the prediction unit.
 また、非対称分割が選択される符号化単位では、小さい方の予測単位を長辺方向に横切るエッジが存在する可能性が高い。 Also, in the coding unit in which asymmetric division is selected, there is a high possibility that an edge crossing the smaller prediction unit in the long side direction exists.
 また、エッジが存在する領域は正確な動きベクトルが導出されている可能性が高い。つまり、分割タイプが非対称分割である場合、上記分割タイプが対称分割である場合と、精度の高い動きベクトルが導出されている領域が異なる。 Also, there is a high possibility that an accurate motion vector is derived in the region where the edge exists. That is, when the division type is asymmetric division, the region from which a highly accurate motion vector is derived differs from the case where the division type is symmetric division.
 よって、分割タイプが非対称分割である場合と、上記分割タイプが対称分割である場合とで異なる推定方法を変更することで、分割タイプに応じた好ましい推定方法により画面間予測の予測パラメータの推定を行うことができるという効果を奏する。 Therefore, by changing the estimation method that is different between the case where the division type is asymmetric division and the case where the division type is symmetric division, the estimation parameter of the inter-screen prediction is estimated by a preferable estimation method according to the division type. There is an effect that it can be performed.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、符号化単位を複数の異なる大きさの予測単位に分割する非対称分割または符号化単位を複数の同一の大きさの予測単位に分割する対称分割を含み、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する変換単位分割手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and obtains a coding unit by dividing the coding unit into one or more numbers. In the image decoding apparatus that decodes a prediction residual for each transform unit and restores an image by adding the prediction residual to the prediction image, the division type into the prediction units includes a plurality of encoding units of different sizes. Including an asymmetric division that divides into two prediction units or a symmetrical division that divides a coding unit into a plurality of prediction units of the same size, and the division type of the target coding unit that is the coding unit to be decoded is asymmetric In the case of division, a conversion unit dividing unit that determines a conversion unit division method according to the size of a prediction unit included in the target coding unit is provided.
 上記の構成によれば、復号の対象となる上記符号化単位である対象符号化単位の分割タイプが非対称分割であるとき、上記対象符号化単位に含まれる予測単位の大きさに応じて、変換単位の分割方式を決定する。 According to the above configuration, when the division type of the target coding unit that is the coding unit to be decoded is asymmetrical division, conversion is performed according to the size of the prediction unit included in the target coding unit. Determine the unit division method.
 非対称分割が適用されるとき、小さい方の予測単位にはエッジが含まれる可能性が高いのに対して、大きい方の予測単位にはエッジが含まれる可能性が低い。 When asymmetric partitioning is applied, the smaller prediction unit is more likely to contain an edge, whereas the larger prediction unit is less likely to contain an edge.
 予測残差に方向性がない場合、変換単位の分割方式として、長方形の変換を適用するよりも、正方形の変換を適用したほうが、効率よく相関を除去できる。 ∙ When there is no directionality in the prediction residual, the correlation can be removed more efficiently by applying the square conversion rather than the rectangular conversion as the conversion unit division method.
 上記の構成によれば、分割タイプが非対称分割であるときは、上記対象符号化単位に含まれる予測単位の大きさに応じて、効率よく相関を除去できるような変換単位の分割方式を選択することができる。その結果、符号化効率が向上する。 According to the above configuration, when the partition type is asymmetric partitioning, a transform unit partitioning method that can efficiently remove the correlation is selected according to the size of the prediction unit included in the target coding unit. be able to. As a result, encoding efficiency is improved.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位を1以上の数に分割して得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記変換単位への分割方式は、正方形および長方形の分割を含み、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する分割手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers and obtains a coding unit by dividing the coding unit into one or more numbers. In an image decoding apparatus that decodes a prediction residual for each conversion unit and restores an image by adding the prediction residual to the prediction image, the division method into the conversion units includes square and rectangular division, and decoding When the shape of the target prediction unit, which is the above-mentioned prediction unit to be a target, is a square, there is provided a dividing means for dividing the target conversion unit by a rectangular division method.
 領域内にエッジが存在し、画像に方向性があるにもかかわらず、正方形の予測単位が選択される場合がある。例えば、多数の横エッジが存在するオブジェクトが移動している場合、オブジェクト内では、動きは一様であるため、正方形の予測単位が選択される。しかしながら、このような場合は、変換処理では、横エッジに沿った、水平方向に長い形状の変換単位を適用することが望ましい。 In some cases, a square prediction unit is selected even though an edge exists in the region and the image has directionality. For example, when an object having a large number of horizontal edges is moving, since the motion is uniform within the object, a square prediction unit is selected. However, in such a case, in the conversion process, it is desirable to apply a conversion unit having a shape that is long in the horizontal direction along the horizontal edge.
 上記の構成によれば、復号の対象となる上記予測単位である対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。 According to the above configuration, when the shape of the target prediction unit that is the prediction unit to be decoded is a square, the target conversion unit is divided by a rectangular division method.
 これにより、正方形の符号化単位においても、長方形の変換単位を選択することができ、このため上記のような領域に対する符号化効率を向上させることができる。 Thereby, a rectangular conversion unit can be selected even in a square coding unit, and therefore, the coding efficiency for the above-described region can be improved.
 本発明の一態様に係る画像復号装置は、上記分割手段が、さらに、所定の大きさの符号化単位において分割深度2に対応する変換単位の形状が正方形である場合、上記所定の大きさの符号化単位において、分割深度1に対応する対象変換単位を長方形とすることが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the dividing unit further has a predetermined size when the shape of the transform unit corresponding to the division depth 2 is a square in the encoding unit of the predetermined size. In the encoding unit, it is preferable that the target conversion unit corresponding to the division depth 1 is a rectangle.
 上記の構成によれば、対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。 According to the above configuration, when the shape of the target prediction unit is a square, the target conversion unit is divided by a rectangular division method.
 変換単位を正方形の4分木分割方式により再帰的に2回分割すると、すなわち分割深度を2まで上げると、16個の正方形の変換単位が得られる。この場合、スキャン順は、zスキャンが再帰的に適用されたものになる。従来、対象符号化単位の分割タイプが正方形の分割である場合、この分割方式が適用されていた。 When the conversion unit is recursively divided twice by the square quadtree division method, that is, when the division depth is increased to 2, 16 square conversion units are obtained. In this case, the scan order is a recursively applied z-scan. Conventionally, this division method has been applied when the division type of the target coding unit is a square division.
 一方、変換単位を横長の4分木分割方式により分割する場合は、分割深度2では、各ノードが正方形の変換単位に分割される。すなわち、分割深度を2では、最終的に、16個の正方形の変換単位が得られる。この場合、スキャン順は、16個の正方形の変換単位に対してラスタスキャンが適用される。従来、対象符号化単位の分割タイプが非正方形の分割である場合、この分割方式が適用されていた。 On the other hand, when the conversion unit is divided by the horizontally long quadtree division method, each node is divided into square conversion units at a division depth of 2. That is, with a division depth of 2, 16 square conversion units are finally obtained. In this case, as the scan order, raster scan is applied to 16 square conversion units. Conventionally, this division method has been applied when the division type of the target coding unit is non-square division.
 よって、対象符号化単位の分割タイプが、正方形の分割である場合と非正方形の分割である場合とで、スキャン順が異なっていた。 Therefore, the scan order is different depending on whether the division type of the target coding unit is square division or non-square division.
 これに対して、上記構成によれば、符号化単位の分割タイプが正方形の分割であり、すなわち対象予測単位の形状が正方形である場合、対象変換単位を長方形の分割方式により分割する。 On the other hand, according to the above configuration, when the division type of the encoding unit is square division, that is, when the shape of the target prediction unit is square, the target conversion unit is divided by the rectangular division method.
 このため、正方形の分割である場合と非正方形の分割である場合とで、スキャン順を統一させることができるという効果を奏する。 For this reason, there is an effect that the scanning order can be unified in the case of square division and in the case of non-square division.
 本発明の一態様に係る画像復号装置は、符号化単位を1以上の数に分割して得られる予測単位ごとに予測画像を生成するとともに、符号化単位、または、分割した符号化単位として得られる変換単位ごとに予測残差を復号し、予測画像に予測残差を加算することで画像を復元する画像復号装置において、上記予測単位への分割タイプは、異なる大きさの予測単位への分割である非対称形への分割および同一の大きさの予測単位への分割である対称形への分割を含み、復号の対象となる上記予測単位である対象予測単位の分割タイプが非対称形への分割であるとき、該分割により得られた小さい予測単位および大きい予測単位の間で、異なるコンテキストを参照して変換係数を復号する係数復号手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention generates a prediction image for each prediction unit obtained by dividing a coding unit into one or more numbers, and obtains the prediction unit as a coding unit or a divided coding unit. In an image decoding apparatus that decodes a prediction residual for each conversion unit and restores an image by adding the prediction residual to the prediction image, the division type into the prediction units is a division into prediction units of different sizes And the division type of the target prediction unit, which is the prediction unit to be decoded, into the asymmetric type, including the division into the asymmetric type and the division into the symmetrical type that is the division into the prediction unit of the same size. The coefficient decoding means for decoding the transform coefficient with reference to different contexts between the small prediction unit and the large prediction unit obtained by the division.
 非対称分割により得られた小さい予測単位には、エッジが存在する可能性が高く変換係数が発生しやすい。これに対して、大きい予測単位では変換係数が発生しにくい。対象変換単位が、小さい予測単位に含まれる場合と大きい予測単位に含まれる場合とで、異なるコンテキストを用いることで、それぞれの領域内における変換係数の発生確率に応じた可変長復号を行うことができる。 A small prediction unit obtained by asymmetric division is likely to have an edge, and conversion coefficients are likely to occur. On the other hand, a conversion coefficient is not easily generated in a large prediction unit. By using different contexts for the case where the target transform unit is included in the small prediction unit and in the case where the target transform unit is included in the large prediction unit, variable length decoding can be performed according to the occurrence probability of the transform coefficient in each region. it can.
 本発明の一態様に係る画像符号化装置は、符号化単位毎に、画像を復元するための情報を符号化して画像符号化データを生成する画像符号化装置において、予測単位のサイズと符号化単位に適用される予測方式との組み合わせに割り当てられている符号について、所定サイズ以下のサイズの符号化単位に画面内予測の予測方式が適用される組み合わせに対して、該組み合わせ以外の組み合わせに割り当てられている符号より短い符号を符号化する符号化手段を備えることを特徴とする。 An image encoding apparatus according to an aspect of the present invention is an image encoding apparatus that generates encoded image data by encoding information for restoring an image for each encoding unit. For a code assigned to a combination with a prediction method applied to a unit, a combination other than the combination is assigned to a combination in which a prediction method for intra prediction is applied to a coding unit having a size equal to or smaller than a predetermined size. It is characterized by comprising an encoding means for encoding a code shorter than the currently used code.
 なお、上記画像復号装置に対応する構成を備える画像符号化装置も本発明の範疇に入る。上記のように構成された画像符号化装置によれば、本発明の一態様に係る画像復号装置と同様の効果を奏することができる。 Note that an image coding apparatus having a configuration corresponding to the image decoding apparatus also falls within the scope of the present invention. According to the image encoding device configured as described above, it is possible to achieve the same effects as those of the image decoding device according to one aspect of the present invention.
 本発明の一態様に係る画像復号装置は、符号化データを復号して、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、上記符号化データに含まれる、双予測の制限を行う予測単位のサイズを示す情報である双予測制限情報に基づいて、双予測の制限を行う双予測制限手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention decodes encoded data, and performs single prediction that refers to one reference image and bi-prediction that refers to two reference images for an image in a prediction unit. In an image decoding apparatus that restores using any one of the inter-screen prediction prediction methods, bi-prediction restriction information, which is information indicating the size of a prediction unit for restricting bi-prediction, included in the encoded data is used. Bi-prediction limiting means for limiting prediction is provided.
 上記の構成によれば、画像符号化装置が、画像の符号化において、意図に応じて適応的に双予測制限情報を符号化すれば、画像復号装置において、上記意図に応じた双予測の制限を行うことができる。これにより、画像の解像度や、画像符号化装置/画像復号装置の性能に応じた細かい調整を行うことができるという効果を奏する。 According to the above configuration, if the image coding apparatus adaptively encodes the bi-prediction restriction information according to the intention in the image coding, the image decoding apparatus can restrict the bi-prediction according to the intention. It can be performed. Thereby, there is an effect that fine adjustment according to the resolution of the image and the performance of the image encoding device / image decoding device can be performed.
 本発明の一態様に係る画像復号装置では、上記符号化データに含まれる、双予測の制限を行うか否かを示すフラグである双予測制限フラグが双予測の制限を行うことを示すときに、上記双予測制限情報を復号する制限情報復号手段を備えることが好ましい。 In the image decoding device according to an aspect of the present invention, when the bi-prediction restriction flag, which is a flag indicating whether or not to restrict bi-prediction, included in the encoded data indicates that bi-prediction restriction is performed. It is preferable that a restriction information decoding unit for decoding the bi-prediction restriction information is provided.
 上記の構成によれば、画像符号化装置から明示的にしてされたフラグに応じて適応的に双予測の制限を行うことができる。これにより画像符号化装置が意図するに双予測制限処理を画像復号装置において行うことができる。 According to the above configuration, it is possible to adaptively limit bi-prediction according to a flag explicitly set by the image encoding device. As a result, bi-prediction restriction processing can be performed in the image decoding apparatus as intended by the image encoding apparatus.
 本発明の一態様に係る画像復号装置は、上記双予測制限フラグが、上記符号化データのストリームの複雑度および上記符号化データを復号する画像復号装置の性能の少なくとも何れか一方に応じて設定されているものであることが好ましい。 In the image decoding device according to an aspect of the present invention, the bi-prediction restriction flag is set according to at least one of the complexity of the encoded data stream and the performance of the image decoding device that decodes the encoded data. It is preferred that
 双予測制限フラグは、上記のとおり、双予測の制限を行うか否かを示すフラグである。当該双予測制限フラグは、画像符号化装置において、符号化データのストリームの複雑度および画像復号装置の性能の少なくとも何れか一方に応じて設定される。符号化データのストリームの複雑度および画像復号装置の性能を示す指標としては、例えば、H.264/AVCにおけるレベル規制(level limit)が挙げられる。レベル規制では、デコーダがビット・ストリームを復号するスピード等が規定されている。また、レベル規制は、整数レベルおよびサブレベル(小数点以下のレベル)の2つのレベルにより構成されている。整数レベルは、大まかな範囲を規定しており、level1~5までが規定されている。 The bi-prediction restriction flag is a flag indicating whether or not bi-prediction restriction is performed as described above. The bi-prediction restriction flag is set in the image encoding device in accordance with at least one of the complexity of the encoded data stream and the performance of the image decoding device. As an index indicating the complexity of the stream of encoded data and the performance of the image decoding apparatus, for example, H.264 can be used. The level restriction (level に お け る limit) in H.264 / AVC can be mentioned. In the level regulation, the speed at which the decoder decodes the bit stream is defined. The level restriction is composed of two levels, an integer level and a sub-level (a level after the decimal point). The integer level defines a rough range, and levels 1 to 5 are defined.
 例えば、level 4は、HDTV(High Definition Television;高精細テレビ)の1080pの解像度に対応しており、level 5は、4kの解像度に対応している。 For example, level 4 corresponds to 1080p resolution of HDTV (High Definition Television), and level 5 corresponds to 4k resolution.
 また、さらにサブレベルにおいて、各整数レベルにおける詳細な仕様が規定されている。 In addition, detailed specifications at each integer level are defined in the sub level.
 ここで、レベルに応じて、制約を設けたいPUサイズおよび双予測の制限を行いたい予測単位(PU)は異なる。例えば、level 4(HD)では、4×4PUに制約を設けるとともに、8×4PU、および4×8PUにおいて双予測の制限を行うことが好ましい。また、level 5(4k)では、8×4PUおよび4×8PUに制約を設けるとともに、8×8PUにおいて双予測の制限を行うことが好ましい。 Here, depending on the level, the PU size for which a constraint is to be set and the prediction unit (PU) for which bi-prediction is to be limited are different. For example, in level 4 (HD), it is preferable to set restrictions on 4 × 4 PU and to restrict bi-prediction in 8 × 4 PU and 4 × 8 PU. In level 5 (4k), it is preferable to restrict 8 × 4 PU and 4 × 8 PU, and to restrict bi-prediction in 8 × 8 PU.
 また、このような双予測の制限は、画像符号化装置において明示的に指定されていることが好ましい。 Further, it is preferable that such a restriction of bi-prediction is explicitly specified in the image coding apparatus.
 上記の構成によれば、画像符号化装置が、符号化データにおいて、レベルに応じて双予測制限フラグおよび双予測制限情報を設定している場合、画像復号装置において、双予測制限フラグおよび双予測制限情報に基づいた双予測の制限を行うことができる。 According to the above configuration, when the image encoding apparatus sets the bi-prediction restriction flag and the bi-prediction restriction information according to the level in the encoded data, the image decoding apparatus performs the bi-prediction restriction flag and the bi-prediction. Bi-prediction restriction based on restriction information can be performed.
 すなわち、画像符号化装置において明示的に設定された双予測の制限の指定に従って、画像復号装置において双予測の制限を行うことができる。 That is, bi-prediction restriction can be performed in the image decoding apparatus in accordance with the bi-prediction restriction designation explicitly set in the image encoding apparatus.
 このように、双予測制限フラグの判定結果に応じて双予測制限情報に基づく双予測制限を行うことで、すなわちストリームの複雑度・画像復号装置の性能(レベル)に応じて適応的に双予測の制限を行うことができるという効果を奏する。 Thus, by performing bi-prediction restriction based on the bi-prediction restriction information according to the determination result of the bi-prediction restriction flag, that is, adaptive bi-prediction according to the complexity of the stream and the performance (level) of the image decoding apparatus. There is an effect that the restriction can be performed.
 本発明の一態様に係る画像復号装置は、符号化データを復号して、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、符号化の単位である符号化単位のサイズに応じて、上記予測単位の取り得るサイズが定まっており、上記符号化データに含まれる、符号化単位の最小サイズを示すフラグの値に応じて、双予測の制限を行う双予測制限手段を備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention decodes encoded data, and performs single prediction that refers to one reference image and bi-prediction that refers to two reference images for an image in a prediction unit. In an image decoding apparatus that restores using any one of the inter-screen prediction prediction methods, the size that can be taken by the prediction unit is determined according to the size of the encoding unit that is a unit of encoding. Bi-prediction restriction means for restricting bi-prediction according to the value of a flag indicating the minimum size of the included coding unit is included.
 例えば、引用文献1では、”log2_min_coding_block_size_minus3”というパラメータによって、最小の符号化単位(CU)のサイズを規定する。また、予測単位(PU)の形状(サイズ)は、符号化単位(CU)のサイズも考慮して定められる。最小CUサイズが、8×8である場合、8×8PUに加えて、8×8CUを分割した8×4PU、4×8PU、4×4PUが使用可能である。また、最小CUサイズが16×16である場合、8×8PUが使用可能である一方で、8×4PU、4×8PU、4×4PUは、使用不可である。 For example, in Cited Document 1, the minimum coding unit (CU) size is defined by a parameter “log2_min_coding_block_size_minus3”. In addition, the shape (size) of the prediction unit (PU) is determined in consideration of the size of the coding unit (CU). When the minimum CU size is 8 × 8, in addition to 8 × 8 PU, 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU obtained by dividing 8 × 8 CU can be used. When the minimum CU size is 16 × 16, 8 × 8 PU can be used, while 8 × 4 PU, 4 × 8 PU, and 4 × 4 PU cannot be used.
 上述のとおり、符号化データのストリームの複雑度および画像復号装置の性能の少なくとも何れか一方に応じて設定される、いわゆるレベルに応じて双予測の制限を行うことが好ましい。 As described above, it is preferable to limit the bi-prediction according to a so-called level that is set according to at least one of the complexity of the encoded data stream and the performance of the image decoding apparatus.
 最小CUサイズに基づいて双予測の制限を行えば、双予測制限を行うPUサイズと、単予測自体を制限するPUサイズのバランスを取ることができる。すなわち、双予測に伴う処理量および転送量は制限されるが、単予測の処理量および転送量は制限されないというアンバランスがなくなる。 If the restriction of bi-prediction is performed based on the minimum CU size, it is possible to balance the PU size that restricts bi-prediction and the PU size that restricts single prediction itself. That is, the processing amount and transfer amount associated with bi-prediction are limited, but the unbalance that the processing amount and transfer amount of uni-prediction is not limited is eliminated.
 最小CUサイズは、引用文献1に見られるように、既存のパラメータとして規定されている。よって、このような既存のパラメータを活用することで、双予測制限専用のフラグを追加する場合と比べて、符号量の増大を招来することなく、簡易に双予測の制限を行うことができる。 The minimum CU size is defined as an existing parameter as seen in cited document 1. Therefore, by using such an existing parameter, it is possible to easily limit the bi-prediction without causing an increase in the code amount as compared with a case where a flag dedicated to bi-prediction restriction is added.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、双予測の制限を行うか否かを示すフラグである双予測制限フラグが双予測の制限を行うことを示すときに、上記双予測の制限を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, when the bi-prediction restriction unit indicates that a bi-prediction restriction flag, which is a flag indicating whether or not to restrict bi-prediction, performs restriction on bi-prediction, It is preferable to limit the bi-prediction.
 上記の構成によれば、画像符号化装置が設定した予測制限フラグに基づく双予測の制限を行うことができる。これにより、画像符号化装置が明示的に設定した指定に基づいて、適応的に双予測の制限を行うことができる。 According to the above configuration, bi-prediction restriction based on the prediction restriction flag set by the image encoding device can be performed. Thereby, based on the designation | designated explicitly set by the image coding apparatus, the restriction | limiting of bi-prediction can be performed adaptively.
 本発明の一態様に係る画像復号装置は、上記双予測制限フラグが、上記符号化データのストリームの複雑度および上記符号化データを復号する画像復号装置の性能の少なくとも何れか一方に応じて設定されているものであることが好ましい。 In the image decoding device according to an aspect of the present invention, the bi-prediction restriction flag is set according to at least one of the complexity of the encoded data stream and the performance of the image decoding device that decodes the encoded data. It is preferred that
 上記の構成によれば、レベルに応じて適応的に双予測の制限を行うことができる。 According to the above configuration, bi-prediction can be limited adaptively according to the level.
 本発明の一態様に係る画像復号装置では、上記双予測制限フラグは、少なくとも3値を取り得えるものであり、上記双予測制限手段は、上記双予測制限フラグの値に応じた双予測の制限を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the bi-prediction restriction flag can take at least three values, and the bi-prediction restriction unit restricts bi-prediction according to the value of the bi-prediction restriction flag. It is preferable to carry out.
 上記の構成によれば、双予測の制限に関し、双予測制限フラグの値に応じた細かい調整を行うことができる。例えば、双予測制限フラグの値を3値に設定した場合は、次のような双予測の制限が考えられる。すなわち、あるサイズのCUについて、双予測の制限を行わない場合、2N×2N・PU以外の双予測を制限する場合、および、N×N・PUの双予測を制限する場合、の3つの場合を、3値を取り得る双予測制限フラグによって表現することができる。 According to the above configuration, regarding the restriction of bi-prediction, fine adjustment according to the value of the bi-prediction restriction flag can be performed. For example, when the value of the bi-prediction restriction flag is set to ternary, the following restriction of bi-prediction can be considered. That is, for a certain size CU, there are three cases: bi-prediction restriction is not performed, bi-prediction other than 2N × 2N · PU is restricted, and bi-prediction of N × N · PU is restricted. Can be expressed by a bi-prediction restriction flag that can take three values.
 より具体的には、双予測制限フラグの値に応じて、16×16CUにおいて、双予測の制限を行わない場合、8×8PUだけ双予測を制限する場合、および、8×8PU、16×8PU、8×16PUについて双予測を制限する場合を選択することができる。 More specifically, according to the value of the bi-prediction restriction flag, in 16 × 16 CU, when bi-prediction restriction is not performed, bi-prediction is restricted by 8 × 8 PU, and 8 × 8 PU, 16 × 8 PU , 8 × 16 PU can be selected to limit bi-prediction.
 本発明の一態様に係る画像復号装置では、上記双予測制限フラグは、処理の対象となる符号化単位について予め定められている最小のサイズのインター予測単位を禁止するフラグを兼ねていることが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the bi-prediction restriction flag may also serve as a flag that prohibits an inter-prediction unit having a minimum size predetermined for a coding unit to be processed. preferable.
 上記の構成においては、最小のPU(N×N)でのインター予測単位を禁止する場合、上記双予測制限フラグが双予測の制限を行うことを示すように設定することができる。逆もまた同様である。 In the above configuration, when the inter prediction unit with the minimum PU (N × N) is prohibited, the bi-prediction restriction flag can be set to indicate that bi-prediction restriction is performed. The reverse is also true.
 例えば、最小のPU(N×N)でのインター予測単位を許容するか否かを示すフラグとしては、引用文献1では、inter_4x4_enabled_flagが規定されている。なお、CUのサイズが、8×8以上である場合、または、inter_4x4_enabled_flagが、“1”である場合、N×Nのインター予測が許容される。 For example, as a flag indicating whether or not an inter prediction unit with a minimum PU (N × N) is allowed, in Cited Document 1, inter_4x4_enabled_flag is defined. Note that when the size of the CU is 8 × 8 or more, or when inter_4x4_enabled_flag is “1”, N × N inter prediction is allowed.
 ここで、!inter_4x4_enabled_flag(“!”は、論理否定の論理演算子を表す)とすれば、このように構成されたフラグは、インター4×4を禁止するか否かを示すフラグということができる。 Here, if! Inter_4x4_enabled_flag (“!” Represents a logical negation logical operator), the flag configured in this way can be said to be a flag indicating whether or not inter 4 × 4 is prohibited. .
 あるCUのサイズに関して取り得る最小のサイズのPU(N×N)において、双予測を制限する場合、上記のように構成したフラグによって実現することが可能である。よって、このような場合、フラグの数を削減することができ、比較的簡易に双予測の制限を実現することができる。 When the bi-prediction is limited in the smallest PU (N × N) that can be taken with respect to the size of a certain CU, it can be realized by the flag configured as described above. Therefore, in such a case, the number of flags can be reduced, and the restriction of bi-prediction can be realized relatively easily.
 本発明の一態様に係る画像復号装置は、符号化データを復号して、予測単位内の画像を、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の何れかの画面間予測の予測方式によって復元する画像復号装置において、復号済みの予測単位の復号に用いた動き補償パラメータからマージ候補を導出するマージ候補導出手段と、上記導出されたマージ候補の少なくとも一部に対して、双予測の制限を行う双予測制限手段とを備えることを特徴とする。 An image decoding apparatus according to an aspect of the present invention decodes encoded data, and performs single prediction that refers to one reference image and bi-prediction that refers to two reference images for an image in a prediction unit. In the image decoding apparatus that restores by any one of the inter-screen prediction prediction methods, merge candidate derivation means for deriving merge candidates from the motion compensation parameters used for decoding of the decoded prediction unit, and the merge candidate derived above Bi-prediction restriction means for restricting bi-prediction for at least a part is provided.
 双予測は、単予測よりも処理量が多い。なお、単予測とは、画面間予測において参照する画像を1つ用いる予測方式のことであり、双予測とは、画面間予測において参照する画像を2つ用いる予測方式のことである。参照する画像は、対象フレームに対して時間的に前方であっても後方であってもよい。 Bi-prediction requires more processing than single prediction. Single prediction is a prediction method that uses one image to be referred to in inter-screen prediction, and bi-prediction is a prediction method that uses two images to be referred to in inter-screen prediction. The image to be referred to may be temporally forward or backward with respect to the target frame.
 上記の構成によれば、対象予測単位における予測画像の復号にマージ処理を用いる場合でも、双予測を制限することができ、対象予測単位における復号処理を簡略化することができる。なお、制限するとは、双予測における一部の処理を省略すること、双予測の動きベクトルを、より処理負荷が軽減できるようなものに変換すること、および、双予測の処理を行わない(禁止する)ことを含む。 According to the above configuration, even when the merge process is used for decoding the prediction image in the target prediction unit, bi-prediction can be restricted, and the decoding process in the target prediction unit can be simplified. Note that restricting means omitting a part of processing in bi-prediction, converting a motion vector of bi-prediction to one that can reduce the processing load, and does not perform bi-prediction processing (prohibition) To do).
 導出されたマージ候補の少なくとも一部において上記双予測の制限を行うことで、復号処理のボトルネックになるような処理の処理量を低減することができるという効果を奏する。 By performing the above-described bi-prediction restriction on at least a part of the derived merge candidates, it is possible to reduce the amount of processing that becomes a bottleneck of decoding processing.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、上記双予測の制限において、上記双予測を単予測に変換することが好ましい。 In the image decoding apparatus according to an aspect of the present invention, it is preferable that the bi-prediction restriction unit converts the bi-prediction into single prediction in the restriction of the bi-prediction.
 上記構成において、“双予測を制限する”とは、双予測を単予測に変換して、双予測を行わなくても済むようにするということである。すでに説明したとおり、双予測よりも単予測のほうが、処理が複雑でなく、また処理量も少なくて済む。 In the above configuration, “restrict bi-prediction” means that bi-prediction is converted into single prediction so that bi-prediction is not required. As already described, the simple prediction is less complicated and the processing amount is smaller than the bi-prediction.
 また、「双予測を単予測に変換する」とは、参照される参照画像の枚数を2枚から1枚に制限することを指す。 In addition, “converting bi-prediction to single prediction” refers to limiting the number of referenced reference images from two to one.
 上記の構成によれば、対象予測単位における予測画像の復号にマージ処理を用いる場合において、上述のとおり双予測を制限することで、対象予測単位における復号処理を簡略化することができる。 According to the above configuration, when the merge process is used for decoding the predicted image in the target prediction unit, the decoding process in the target prediction unit can be simplified by restricting the bi-prediction as described above.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、上記導出されたマージ候補のうち、双予測のマージ候補であって、2つの動きベクトルの少なくとも一方が、非整数の成分を含む非整数動きベクトルであるマージ候補に対して、上記双予測の制限を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the bi-prediction restriction unit is a bi-prediction merge candidate among the derived merge candidates, and at least one of the two motion vectors is a non-integer component. The bi-prediction restriction is preferably performed on merge candidates that are non-integer motion vectors including.
 上記の構成によれば、2つの動きベクトルが非整数動きベクトルであるマージ候補を、双予測の制限対象とする。その一方で、マージ候補が整数動きベクトルの場合には双予測を制限しなくても済む。 According to the above configuration, merge candidates whose two motion vectors are non-integer motion vectors are subject to bi-prediction restriction. On the other hand, when the merge candidate is an integer motion vector, bi-prediction need not be restricted.
 ここで、非整数動きベクトルとは、画素位置を整数値として表現したときに、少なくとも一部の該動きベクトルの成分が非整数によって表されるものを指す。 Here, the non-integer motion vector means that at least a part of the motion vector component is represented by a non-integer when the pixel position is expressed as an integer value.
 非整数動きベクトルに対しては、補間画像を生成するための補間フィルタを適用するため、処理負荷が高くなる傾向がある。これに対して、整数動きベクトルの場合には、このようなフィルタ処理は必須ではない。 For non-integer motion vectors, an interpolation filter for generating an interpolated image is applied, which tends to increase the processing load. On the other hand, in the case of an integer motion vector, such filter processing is not essential.
 また、整数動きベクトルの場合には、補間フィルタ処理が必須ではないため、動き補償で参照する範囲は、対象ブロックと同一とすることができる。 Also, in the case of an integer motion vector, since interpolation filter processing is not essential, the range referred to in motion compensation can be the same as the target block.
 このため、整数動きベクトルの場合には、双予測を行っても転送量および処理量が過度には増大しない。 For this reason, in the case of an integer motion vector, even if bi-prediction is performed, the transfer amount and the processing amount do not increase excessively.
 上記の構成によれば、双予測を制限しなくてもそれほど負荷がかからないような整数動きベクトルに対しては、双単変換を省略することができるので、マージ候補を双単変換する双予測制限処理の負荷を軽減することができる。 According to the above configuration, since bi-conversion can be omitted for integer motion vectors that do not require much load even if bi-prediction is not restricted, bi-prediction restriction that bi-converts merge candidates. The processing load can be reduced.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、上記導出されたマージ候補のうち、非整数の成分を含んでいる非整数動きベクトルを含む双予測のマージ候補に対して、該非整数動きベクトルが含んでいる非整数の成分の少なくとも一部を、整数の成分に変換することが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the bi-prediction restriction unit is configured to perform bi-prediction merge candidate including a non-integer motion vector including a non-integer component among the derived merge candidates. It is preferable that at least a part of the non-integer component included in the non-integer motion vector is converted into an integer component.
 上記の構成において、“双予測を制限する”とは、非整数動きベクトルによる双予測を制限するということである。 In the above configuration, “restrict bi-prediction” means to restrict bi-prediction with non-integer motion vectors.
 上述のとおり整数動きベクトルについては、補間フィルタを適用しなくても済む。よって、双予測のマージ候補の非整数動きベクトルの成分を整数化することにより、動き補償で参照する範囲を対象ブロックの範囲に、より一致させることができる。なお、すべての成分が整数化されれば、動き補償で参照する範囲が対象ブロックに一致する。 As described above, the interpolation filter need not be applied to the integer motion vector. Therefore, by converting the component of the non-integer motion vector of the bi-predictive merge candidate into an integer, it is possible to make the range referred to in motion compensation more closely match the target block range. If all the components are converted into integers, the range referred to in motion compensation matches the target block.
 なお、整数化は、(X,Y)の2次元座標表現である場合、X座標に対してのみ行ってもよいし、Y座標に対してのみ行ってもよいし、X座標およびY座標の両方に対して行ってもよい。また、L0およびL1リストの片方のみを整数化してもよい。 In the case of (X, Y) two-dimensional coordinate expression, integerization may be performed only for the X coordinate, only for the Y coordinate, or the X coordinate and the Y coordinate. You may do it for both. Only one of the L0 and L1 lists may be converted to an integer.
 このようにして得られる整数化された動きベクトルにより双予測を行えば、非整数動きベクトルのまま双予測を行う場合と比べて、転送量および処理量の増大を抑えることができる。 If bi-prediction is performed using integerized motion vectors obtained in this way, an increase in the transfer amount and the processing amount can be suppressed as compared with the case where bi-prediction is performed with non-integer motion vectors.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、上記導出されたマージ候補のうち、所定の数のマージ候補に対して、上記双予測の制限を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, it is preferable that the bi-prediction restriction unit restricts the bi-prediction to a predetermined number of merge candidates among the derived merge candidates.
 上記の構成によれば、導出されたマージ候補のうちの一部のマージ候補に対して双予測の制限を行うことができる。例えば、マージ候補の導出の順序が定められている場合、または、導出したマージ候補が格納されているリストに順序が定められている場合、先頭からN個を双予測の制限対象とすることができる。なお、Nは正の整数であり、N=1であってもよい。 According to the above configuration, bi-prediction restriction can be performed on some merge candidates among the derived merge candidates. For example, when the order of derivation of merge candidates is determined, or when the order is determined in a list in which the derived merge candidates are stored, the top N may be subject to bi-prediction restriction. it can. N is a positive integer, and N = 1 may be sufficient.
 これにより、すべてのマージ候補に対して双予測の制限を行う場合と比べて、処理負荷を軽減することができる。 This makes it possible to reduce the processing load compared to the case where bi-prediction restriction is performed on all merge candidates.
 本発明の一態様に係る画像復号装置では、上記双予測制限手段は、上記導出されたマージ候補に、所定数以上の単予測が含まれていない場合、上記双予測の制限を行うことが好ましい。 In the image decoding device according to an aspect of the present invention, it is preferable that the bi-prediction restriction unit restricts the bi-prediction when the derived merge candidate does not include a predetermined number or more of single predictions. .
 マージ候補リストにおいて、所定数以上の単予測が含まれる場合、双予測を許容しても、全体的に見てそれほど処理負荷が増大しない場合がある。上記構成によれば、このような場合において、双予測の制限処理を省略することができ、双予測の制限処理による不可増大の抑制を図ることができる。 If the merge candidate list includes a predetermined number or more of single predictions, even if bi-prediction is allowed, the processing load may not increase so much as a whole. According to the above configuration, in such a case, the bi-prediction restriction process can be omitted, and the non-proliferation can be suppressed by the bi-prediction restriction process.
 本発明の一態様に係る画像復号装置では、上記マージ候補導出手段が、すべてのマージ候補を導出したのち、上記双予測制限手段が、上記導出されたマージ候補に対して上記双予測の制限を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, after the merge candidate derivation unit derives all merge candidates, the bi-prediction restriction unit restricts the bi-prediction restriction on the derived merge candidates. Preferably it is done.
 上記の構成によれば、まず、マージ候補リストを生成する。また、マージ候補の導出においては、このような処理が一般的である。上記構成によれば、このように一般的なマージ候補リスト生成処理に変更を加えなくても済むので、処理ロジックが複雑になることを防ぐことができる。 According to the above configuration, first, a merge candidate list is generated. Also, such processing is common in derivation of merge candidates. According to the above configuration, since it is not necessary to change the general merge candidate list generation process in this way, it is possible to prevent the processing logic from becoming complicated.
 本発明の一態様に係る画像復号装置では、上記マージ候補導出手段が、マージ候補を導出する処理と、並列的に、上記双予測制限手段が、上記導出されたマージ候補に対する上記双予測を制限する処理を行うことが好ましい。 In the image decoding apparatus according to an aspect of the present invention, the bi-prediction restriction unit restricts the bi-prediction with respect to the derived merge candidate in parallel with the merge candidate deriving unit and the process of deriving the merge candidate. It is preferable to perform the processing.
 上記の構成によれば、マージ候補をマージ候補リストに格納する前に、双予測を制限する。また、この処理は、マージ候補を導出する処理と、並列的に行われる。 According to the above configuration, bi-prediction is limited before the merge candidates are stored in the merge candidate list. This process is performed in parallel with the process of deriving merge candidates.
 このような並列化により処理効率の向上を図ることができる。処理のレイテンシの許容範囲が狭い場合に、特に有用である。 Such parallelization can improve processing efficiency. This is particularly useful when the allowable range of processing latency is narrow.
 また、マージ候補の双単変換により、双予測の制限を行う場合であって、マージ候補のユニーク性をチェックする場合、マージ候補リストの生成を行って、ユニーク性のチェックを行ってから、双単変換する場合と比べて、マージ候補の重複なくマージ候補リストを作成することができる。 In addition, when bi-prediction is restricted by bi-transformation of merge candidates and the uniqueness of merge candidates is checked, a merge candidate list is generated and checked for uniqueness, and then bi-directional. Compared to a single conversion, a merge candidate list can be created without duplication of merge candidates.
 本発明の一態様に係る画像符号化装置は、符号化単位毎に、画像を復元するための情報を符号化して画像符号化データを生成する画像符号化装置において、上記符号化データのストリームの複雑度および上記符号化データを復号する画像復号装置の性能の少なくとも何れか一方に応じて、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の画面間予測のうち、双予測の制限を行うか否かを示すフラグである双予測制限フラグを符号化データおいて符号化する符号化手段を備えることを特徴とする。 An image encoding device according to an aspect of the present invention is an image encoding device that generates image encoded data by encoding information for restoring an image for each encoding unit. According to at least one of the complexity and the performance of the image decoding apparatus that decodes the encoded data, between single prediction referring to one reference image and bi-prediction referring to two reference images It comprises encoding means for encoding a bi-prediction restriction flag, which is a flag indicating whether or not to restrict bi-prediction among predictions, in encoded data.
 本発明の一態様に係る画像符号化データのデータ構造は、符号化単位毎に、画像を復元するための情報が画像符号化装置によって符号化されている画像符号化データのデータ構造において、上記符号化データのストリームの複雑度および上記符号化データを復号する画像復号装置の性能の少なくとも何れか一方に応じて、1枚の参照画像を参照する単予測、及び、2枚の参照画像を参照する双予測の画面間予測のうち、双予測の制限を行うか否かを示すフラグである双予測制限フラグを含むことを特徴とする。 The data structure of image encoded data according to one aspect of the present invention is the data structure of image encoded data in which information for restoring an image is encoded by an image encoding device for each encoding unit. Single prediction referring to one reference image and reference to two reference images according to at least one of the complexity of the stream of encoded data and the performance of the image decoding apparatus that decodes the encoded data Among the bi-prediction inter predictions, a bi-prediction restriction flag that is a flag indicating whether or not to restrict bi-prediction is included.
 なお、上記画像復号装置に対応する構成を備える画像符号化装置および当該画像符号化装置によって生成される画像符号化データのデータ構造も本発明の範疇に入る。上記のように構成された画像符号化装置および画像符号化データのデータ構造によれば、本発明の一態様に係る画像復号装置と同様の効果を奏することができる。 Note that an image encoding device having a configuration corresponding to the image decoding device and a data structure of image encoded data generated by the image encoding device also fall within the scope of the present invention. According to the image encoding device and the data structure of the image encoded data configured as described above, the same effects as those of the image decoding device according to an aspect of the present invention can be achieved.
  (ハードウェア的実現およびソフトウェア的実現)
 また、上述した動画像復号装置1および動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
(Hardware implementation and software implementation)
Each block of the moving picture decoding apparatus 1 and the moving picture encoding apparatus 2 described above may be realized in hardware by a logic circuit formed on an integrated circuit (IC chip), or may be a CPU (Central Processing). Unit) may be implemented in software.
 後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。 In the latter case, each device includes a CPU that executes instructions of a program that realizes each function, a ROM (Read (Memory) that stores the program, a RAM (Random Memory) that expands the program, the program, and various types A storage device (recording medium) such as a memory for storing data is provided. An object of the present invention is to provide a recording medium in which a program code (execution format program, intermediate code program, source program) of a control program for each of the above devices, which is software that realizes the above-described functions, is recorded in a computer-readable manner This can also be achieved by supplying each of the above devices and reading and executing the program code recorded on the recording medium by the computer (or CPU or MPU).
 上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD-ROM(Compact Disc Read-Only Memory)/MOディスク(Magneto-Optical disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)/CD-R(CD Recordable)/ブルーレイディスク(Blu-ray Disc:登録商標)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-Only Memory)/EEPROM(登録商標)(Electrically Erasable and Programmable Read-Only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。 Examples of the recording medium include tapes such as magnetic tapes and cassette tapes, magnetic disks such as floppy (registered trademark) disks / hard disks, CD-ROMs (Compact Disc-Read-Only Memory) / MO discs (Magneto-Optical discs). ) / MD (Mini Disc) / DVD (Digital Versatile Disc) / CD-R (CD Recordable) / Blu-ray Disc (Blu-ray Disc: registered trademark) and other optical discs, IC cards (including memory cards) / Cards such as optical cards, mask ROM / EPROM (Erasable Programmable Read-Only Memory) / EEPROM (registered trademark) (Electrically-Erasable Programmable Read-Only Memory) / semiconductor memory such as flash ROM, or PLD (Programmable Logic device) and FPGA (Field Programmable Gate Array) Can.
 また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna television/Cable Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。 Further, each of the above devices may be configured to be connectable to a communication network, and the program code may be supplied via the communication network. The communication network is not particularly limited as long as it can transmit the program code. For example, the Internet, intranet, extranet, LAN (Local Area Network), ISDN (Integrated Services Digital Network), VAN (Value-Added Network), CATV (Community Area Antenna / Cable Television) communication network, Virtual Private Network (Virtual Private Network) Network), telephone line network, mobile communication network, satellite communication network, and the like. The transmission medium constituting the communication network may be any medium that can transmit the program code, and is not limited to a specific configuration or type. For example, even in the case of wired such as IEEE (Institute of Electrical and Electronic Engineers) 1394, USB, power line carrier, cable TV line, telephone line, ADSL (Asymmetric Digital Subscriber Line) line, infrared such as IrDA (Infrared Data Association) or remote control , Bluetooth (registered trademark), IEEE 802.11 wireless, HDR (High Data Rate), NFC (Near Field Communication), DLNA (Digital Living Network Alliance), mobile phone network, satellite line, terrestrial digital network, etc. Is possible. The present invention can also be realized in the form of a computer data signal embedded in a carrier wave in which the program code is embodied by electronic transmission.
 本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The present invention is not limited to the above-described embodiment, and various modifications can be made within the scope indicated in the claims. That is, embodiments obtained by combining technical means appropriately modified within the scope of the claims are also included in the technical scope of the present invention.
 本発明は、画像データが符号化された符号化データを復号する画像復号装置、および、画像データが符号化された符号化データを生成する画像符号化装置に好適に適用することができる。また、画像符号化装置によって生成され、画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。 The present invention can be suitably applied to an image decoding apparatus that decodes encoded data obtained by encoding image data and an image encoding apparatus that generates encoded data obtained by encoding image data. Further, the present invention can be suitably applied to the data structure of encoded data generated by an image encoding device and referenced by the image decoding device.
 1    動画像復号装置
 10   復号モジュール
 11   CU情報復号部
 12   PU情報復号部
 13   TU情報復号部
 16   フレームメモリ
 111  CU予測モード決定部
 112  PUサイズ決定部
 121  動き補償パラメータ導出部(双予測制限手段、候補決定手段、推定手段)
 122  マージ候補優先順位情報記憶部
 123  参照フレーム設定情報記憶部
 131  TU分割設定部
 132  変換係数復元部
 1011 CU予測モード復号部(復号手段、変更手段)
 1012 二値化情報記憶部
 1013 コンテキスト記憶部
 1014 確率設定記憶部
 1021 動き情報復号部(制限情報復号手段)
 1031 領域分割フラグ復号部
 1032 判定情報復号部(係数復号手段)
 1033 変換係数復号部(係数復号手段)
 1311 対象領域設定部
 1312 分割決定部
 1313 分割領域設定部(変換単位分割手段、分割手段)
 1314 変換サイズ決定情報記憶部
 2    動画像符号化装置
 21   符号化設定部
 23   予測画像生成部
 25   フレームメモリ
 27   変換・量子化部
 29   符号化データ生成部(符号化手段)
 1211   スキップ動き補償パラメータ導出部
 1212   マージ動き補償パラメータ導出部(マージ候補導出部)
 1213   基本動き補償パラメータ導出部
 1218   双予測制限PU判定部
 1219   双単予測変換部
 1220   動きベクトル整数化部
 1212A   隣接マージ候補導出部
 1212B   時間的マージ候補導出部
 1212C   ユニーク候補導出部
 1212D   結合双予測マージ候補導出部
 1212E   非スケール双予測マージ候補導出部
 1212F   ゼロベクトルマージ候補導出部
 1212G   マージ候補導出制御部
 1212H   マージ候補格納部
 1212J   マージ候補選択部
 1213A   隣接動きベクトル候補導出部
 1213B   時間的動きベクトル候補導出部
 1213F   ゼロベクトルマージ候補導出部
 1213G   動きベクトル候補導出制御部
 1213H   動きベクトル候補格納部
 1213I   動きベクトル候補選択部
 1213J   動きベクトル復元部
 1218A   双予測制限PU判定部
 1219A   双単予測変換部(双予測制限手段)
 1219B   双単予測変換部(双予測制限手段)
 3012   マージ動き補償パラメータ生成部
 3013   基本動き補償パラメータ生成部
 3013A   動きベクトル候補選択部
 3013B   差分動きベクトル算出部
 3014   動き補償パラメータ制限部
DESCRIPTION OF SYMBOLS 1 Video decoding device 10 Decoding module 11 CU information decoding part 12 PU information decoding part 13 TU information decoding part 16 Frame memory 111 CU prediction mode determination part 112 PU size determination part 121 Motion compensation parameter derivation part (Bi prediction prediction means, candidate Determination means, estimation means)
122 merge candidate priority information storage unit 123 reference frame setting information storage unit 131 TU partition setting unit 132 transform coefficient restoration unit 1011 CU prediction mode decoding unit (decoding unit, changing unit)
1012 Binary information storage unit 1013 Context storage unit 1014 Probability setting storage unit 1021 Motion information decoding unit (restriction information decoding unit)
1031 Region division flag decoding unit 1032 Determination information decoding unit (coefficient decoding means)
1033 Transform coefficient decoding unit (coefficient decoding means)
1311 Target region setting unit 1312 Division determination unit 1313 Division region setting unit (conversion unit division unit, division unit)
1314 Transform Size Determination Information Storage Unit 2 Video Encoding Device 21 Coding Setting Unit 23 Predictive Image Generation Unit 25 Frame Memory 27 Transform / Quantization Unit 29 Encoded Data Generation Unit (Encoding Unit)
1211 Skip motion compensation parameter derivation unit 1212 Merge motion compensation parameter derivation unit (merge candidate derivation unit)
1213 Basic motion compensation parameter derivation unit 1218 Bi-prediction restricted PU determination unit 1219 Bi-uni prediction conversion unit 1220 Motion vector integerization unit 1212A Neighbor merge candidate derivation unit 1212B Temporal merge candidate derivation unit 1212C Unique candidate derivation unit 1212D Combined bi-prediction merge candidate Deriving unit 1212E Non-scale bi-predictive merge candidate deriving unit 1212F Zero vector merge candidate deriving unit 1212G Merge candidate deriving control unit 1212H Merge candidate storage unit 1212J Merge candidate selecting unit 1213A Adjacent motion vector candidate deriving unit 1213B Temporal motion vector candidate deriving unit 1213F Zero vector merge candidate derivation unit 1213G Motion vector candidate derivation control unit 1213H Motion vector candidate storage unit 1213I Motion vector candidate selection unit 1 213J Motion vector restoration unit 1218A Bi-prediction restricted PU determination unit 1219A Bi-unidirectional prediction conversion unit (bi-prediction restriction unit)
1219B Bi-single prediction conversion unit (bi-prediction limiting means)
3012 Merge motion compensation parameter generation unit 3013 Basic motion compensation parameter generation unit 3013A Motion vector candidate selection unit 3013B Differential motion vector calculation unit 3014 Motion compensation parameter restriction unit

Claims (9)

  1.  画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号装置において、
     前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備えることを特徴とする画像復号装置。
    In an image decoding apparatus that decodes an image in a prediction unit using single prediction referring to one reference image or bi-prediction referring to two reference images as a prediction method of inter-screen prediction,
    An image decoding apparatus comprising: a bi-prediction restriction unit that restricts performing the bi-prediction on a prediction unit when the prediction unit is a prediction unit of a predetermined size or less.
  2.  予測単位の動き補償パラメータをマージ候補として導出する処理において、隣接する予測単位の動き補償パラメータに基づいて、該マージ候補を導出するマージ候補導出手段を備え、
     導出される前記マージ候補が、前記双予測である場合、
     前記双予測制限手段は、前記双予測を前記単予測に変換することを特徴とする請求項1に記載の画像復号装置。
    In the process of deriving a motion compensation parameter of a prediction unit as a merge candidate, it comprises merge candidate derivation means for deriving the merge candidate based on a motion compensation parameter of an adjacent prediction unit,
    When the derived merge candidate is the bi-prediction,
    The image decoding apparatus according to claim 1, wherein the bi-prediction restriction unit converts the bi-prediction into the single prediction.
  3.  参照ピクチャリストの使用の有無を示す予測リスト利用フラグを少なくとも2つ用いる場合であって、該少なくとも2つの予測リスト利用フラグが、該参照ピクチャリストを使用することを示している場合、
     前記双予測制限手段は、前記少なくとも2つの前記予測リスト利用フラグのうち1つを、前記参照ピクチャリストを使用しないことを示すように変換することを特徴とする請求項1または2に記載の画像復号装置。
    When using at least two prediction list use flags indicating whether or not the reference picture list is used, and when the at least two prediction list use flags indicate that the reference picture list is used,
    3. The image according to claim 1, wherein the bi-prediction restriction unit converts one of the at least two prediction list use flags to indicate that the reference picture list is not used. Decoding device.
  4.  前記双予測制限手段は、前記参照ピクチャリストの一つであるL1リストを使用することを示す前記予測リスト利用フラグを、該L1リストを使用しないことを示すように変換することを特徴とする請求項3に記載の画像復号装置。 The bi-prediction restriction unit converts the prediction list use flag indicating that an L1 list, which is one of the reference picture lists, is used so as to indicate that the L1 list is not used. Item 4. The image decoding device according to Item 3.
  5.  前記予測単位のサイズは、該予測単位の幅と高さを用いて算出されることを特徴とする請求項1から4のいずれか1項に記載の画像復号装置。 5. The image decoding device according to claim 1, wherein the size of the prediction unit is calculated using a width and a height of the prediction unit.
  6.  前記双予測制限手段は、前記予測単位が所定のサイズより大きい場合は、前記双予測および前記単予測のいずれを行うかを示す情報を復号し、前記予測単位が所定のサイズ以下の場合は、前記双予測および前記単予測のいずれを行うかを示す情報の復号を省略して、前記単予測を行うことを特徴とする請求項1から5のいずれか1項に記載の画像復号装置。 The bi-prediction restriction unit decodes information indicating whether to perform the bi-prediction or the uni-prediction when the prediction unit is larger than a predetermined size, and when the prediction unit is a predetermined size or less, The image decoding apparatus according to claim 1, wherein the single prediction is performed by omitting decoding of information indicating whether to perform the bi-prediction or the single prediction.
  7.  画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を復号する画像復号方法において、
     前記予測単位が所定のサイズ以下の予測単位であるか否かを判定するステップと、
     前記予測単位に対して前記双予測を使用しないように制限するステップとを少なくとも含むことを特徴とする画像復号方法。
    In an image decoding method for decoding an image in a prediction unit using single prediction referring to one reference image or bi-prediction referring to two reference images as a prediction method of inter-screen prediction,
    Determining whether the prediction unit is a prediction unit of a predetermined size or less;
    And a step of restricting the bi-prediction from being used for the prediction unit.
  8.  画面間予測の予測方式として、1枚の参照画像を参照する単予測または2枚の参照画像を参照する双予測を用いて予測単位内の画像を符号化する画像符号化装置において、
     前記予測単位が所定のサイズ以下の予測単位である場合、該予測単位に対して前記双予測を行うことを制限する双予測制限手段を備えることを特徴とする画像符号化装置。
    In an image encoding apparatus that encodes an image in a prediction unit using uni-prediction referring to one reference image or bi-prediction referring to two reference images as a prediction method of inter-screen prediction,
    An image coding apparatus comprising: a bi-prediction restriction unit that restricts performing the bi-prediction on a prediction unit when the prediction unit is a prediction unit of a predetermined size or less.
  9.  符号化単位毎に、画像符号化データを復号して復号画像を生成する画像復号装置において、
     前記符号化単位を分割する分割タイプを指定する情報を復号するCU情報復号部と、
     コンテキストを用いた算術復号又はコンテキストを用いない算術復号により、前記画像符号化データからバイナリ値を復号する算術復号部とを備え、
     前記CU情報復号部が、前記分割タイプとして非対称的分割(AMP; Asymmetric Motion Partition)を指定する情報を復号する場合、
     前記算術復号部は、前記バイナリ値の位置に応じて、前記コンテキストを用いた算術復号と前記コンテキストを用いない算術復号とを切り替えて復号することを特徴とする画像復号装置。
    In an image decoding apparatus that decodes image encoded data and generates a decoded image for each encoding unit,
    A CU information decoding unit for decoding information designating a division type for dividing the coding unit;
    An arithmetic decoding unit that decodes a binary value from the image encoded data by arithmetic decoding using context or arithmetic decoding without using context,
    When the CU information decoding unit decodes information designating asymmetric motion partition (AMP) as the division type,
    The image decoding device, wherein the arithmetic decoding unit switches between arithmetic decoding using the context and arithmetic decoding not using the context according to a position of the binary value.
PCT/JP2012/075195 2011-11-04 2012-09-28 Image decoding device, image decoding method, and image encoding device WO2013065431A1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011-242843 2011-11-04
JP2011242843 2011-11-04
JP2011-289936 2011-12-28
JP2011289936 2011-12-28

Publications (1)

Publication Number Publication Date
WO2013065431A1 true WO2013065431A1 (en) 2013-05-10

Family

ID=48191789

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/075195 WO2013065431A1 (en) 2011-11-04 2012-09-28 Image decoding device, image decoding method, and image encoding device

Country Status (1)

Country Link
WO (1) WO2013065431A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015105003A1 (en) * 2014-01-08 2015-07-16 ソニー株式会社 Decoding device and decoding method, and encoding device and encoding method
JP2018023121A (en) * 2017-08-25 2018-02-08 株式会社東芝 Decoding method and decoding device
CN110249629A (en) * 2017-01-31 2019-09-17 夏普株式会社 For the system and method by picture segmentation at video block to carry out video codes processing
CN110463203A (en) * 2017-03-31 2019-11-15 松下电器(美国)知识产权公司 Picture coding device, picture decoding apparatus, image encoding method and picture decoding method
US10554991B2 (en) 2011-11-08 2020-02-04 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006082690A1 (en) * 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. Image encoding method and image encoding device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006082690A1 (en) * 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. Image encoding method and image encoding device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALEXANDER (SANDY) MACINNIS: "Complexity Limitations for High Definition", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/ IEC JTC1/SC29/WG11 AND ITU-T SG16 Q.6) 4TH MEETING, 22 July 2002 (2002-07-22), KLAGENFURT, AUSTRIA *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11375218B2 (en) 2011-11-08 2022-06-28 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
US10554991B2 (en) 2011-11-08 2020-02-04 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
US10687072B2 (en) 2011-11-08 2020-06-16 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
US11451808B2 (en) 2011-11-08 2022-09-20 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
US11831891B2 (en) 2011-11-08 2023-11-28 Kabushiki Kaisha Toshiba Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
JPWO2015105003A1 (en) * 2014-01-08 2017-03-23 ソニー株式会社 Decoding device, decoding method, and encoding device and encoding method
US10523952B2 (en) 2014-01-08 2019-12-31 Sony Corporation Decoding apparatus and decoding method, and coding apparatus and coding method
US10893279B2 (en) 2014-01-08 2021-01-12 Sony Corporation Decoding apparatus and decoding method, and coding apparatus and coding method
WO2015105003A1 (en) * 2014-01-08 2015-07-16 ソニー株式会社 Decoding device and decoding method, and encoding device and encoding method
CN110249629A (en) * 2017-01-31 2019-09-17 夏普株式会社 For the system and method by picture segmentation at video block to carry out video codes processing
CN110463203A (en) * 2017-03-31 2019-11-15 松下电器(美国)知识产权公司 Picture coding device, picture decoding apparatus, image encoding method and picture decoding method
CN110463203B (en) * 2017-03-31 2023-07-14 松下电器(美国)知识产权公司 Image decoding method and device
JP2018023121A (en) * 2017-08-25 2018-02-08 株式会社東芝 Decoding method and decoding device

Similar Documents

Publication Publication Date Title
JP6190499B2 (en) Image decoding apparatus, image decoding method and image encoding apparatus
JP6190494B2 (en) Image decoding apparatus, image decoding method and image encoding apparatus
US20230199218A1 (en) Image decoding device, image encoding device, and image decoding method
JP2019126077A (en) Image filter device, filter method, and video and image decoding device
WO2013065431A1 (en) Image decoding device, image decoding method, and image encoding device
JP2013118424A (en) Image decoding device, image encoding device, and data structure of encoded data
JP2013223049A (en) Image decoding apparatus and image encoding apparatus
AU2015264943B2 (en) Image decoding device, image encoding device, and data structure of encoded data
JP2013251827A (en) Image filter device, image decoding device, image encoding device, and data structure

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12846459

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12846459

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP