JP7281890B2 - Video encoding device and video decoding device - Google Patents

Video encoding device and video decoding device Download PDF

Info

Publication number
JP7281890B2
JP7281890B2 JP2018200186A JP2018200186A JP7281890B2 JP 7281890 B2 JP7281890 B2 JP 7281890B2 JP 2018200186 A JP2018200186 A JP 2018200186A JP 2018200186 A JP2018200186 A JP 2018200186A JP 7281890 B2 JP7281890 B2 JP 7281890B2
Authority
JP
Japan
Prior art keywords
tile
unit
ctu
coordinates
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018200186A
Other languages
Japanese (ja)
Other versions
JP2020068461A5 (en
JP2020068461A (en
Inventor
将伸 八杉
知宏 猪飼
友子 青野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018200186A priority Critical patent/JP7281890B2/en
Publication of JP2020068461A publication Critical patent/JP2020068461A/en
Publication of JP2020068461A5 publication Critical patent/JP2020068461A5/ja
Priority to JP2023079788A priority patent/JP2023100982A/en
Application granted granted Critical
Publication of JP7281890B2 publication Critical patent/JP7281890B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明の実施形態は、動画像復号装置、および動画像符号化装置に関する。 TECHNICAL FIELD Embodiments of the present invention relate to a moving image decoding device and a moving image encoding device.

動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置が用いられている。 A moving image encoding device that generates encoded data by encoding a moving image and a moving image that generates a decoded image by decoding the encoded data in order to efficiently transmit or record the moving image An image decoding device is used.

具体的な動画像符号化方式としては、例えば、H.264/AVCやHEVC(High-Efficiency Video Coding)にて提案されている方式などが挙げられる。 Examples of specific moving image coding methods include methods proposed in H.264/AVC and HEVC (High-Efficiency Video Coding).

このような動画像符号化方式においては、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化ツリーユニット(CTU:Coding Tree Unit)、符号化ツリーユニットを分割することで得られる符号化単位(符号化ユニット(Coding Unit:CU)と呼ばれることもある)、及び、符号化単位を分割することより得られる変換ユニット(TU:Transform Unit)からなる階層構造により管理され、CU毎に符号化/復号される。 In such a video coding method, the images (pictures) that make up the video are divided into slices obtained by dividing the image, and coding tree units (CTU: Coding Tree Units) obtained by dividing the slices. ), a coding unit obtained by dividing the coding tree unit (also called a coding unit (CU)), and a transform unit obtained by dividing the coding unit (TU: Transform Unit), and encoded/decoded for each CU.

また、このような動画像符号化方式においては、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測誤差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。 Further, in such a video encoding method, a predicted image is normally generated based on a locally decoded image obtained by encoding/decoding an input image, and the predicted image is generated from the input image (original image). The prediction error obtained by subtraction (sometimes called the "difference image" or "residual image") is encoded. Inter-prediction and intra-prediction are methods for generating predicted images.

また、画面を複数の単位に分割し並列処理を行う方法としては、スライス、CTUライン(ウェーブフロントセグメント)、タイルに分割する方法が知られている。タイルに分割する方法では従来CTU単位での分割に限定されていた。 As a method of dividing a screen into a plurality of units and performing parallel processing, a method of dividing into slices, CTU lines (wavefront segments), and tiles is known. Conventionally, the method of dividing into tiles was limited to dividing into CTU units.

また、近年の動画像符号化及び復号の技術として非特許文献1が挙げられる。 In addition, Non-Patent Document 1 can be cited as a technique of video encoding and decoding in recent years.

"Algorithm Description of Joint Exploration Test Model 7", JVET-G1001, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 2017-08-19"Algorithm Description of Joint Exploration Test Model 7", JVET-G1001, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 2017-08-19

上記で説明したように、タイルサイズがCTUの整数倍という制限があり、ロードバランスのために同じサイズに分割することや、360度動画のフェース(face)サイズに合わせたタイルを構成することが難しいという課題がある。 As explained above, there is a limit that the tile size is an integer multiple of the CTU, and it is possible to divide it into equal sizes for load balancing and configure tiles that match the face size of the 360-degree video. There is a difficult issue.

また、タイルサイズが、CTUサイズの整数倍に限定されない場合、時間動きベクトル参照を行うために、参照ピクチャの動きベクトルを参照すると、CTU境界を越えて多くの位置から動きベクトルを参照する可能性があるという、課題がある。 Also, if the tile size is not limited to an integer multiple of the CTU size, referencing the motion vector of the reference picture for temporal motion vector referencing may result in referencing motion vectors from many positions across the CTU boundary. There is a problem that there is

また、タイルサイズが、CTUサイズの整数倍に限定されない場合、マルチラインイントラ予測において、CTU境界を越えて複数ラインを参照する可能性があるという課題がある。 Also, if the tile size is not limited to an integral multiple of the CTU size, there is a problem that multiple lines may be referenced across the CTU boundary in multiline intra prediction.

そこで、本発明は、上記の課題に鑑みてなされたものであり、その目的は、CTUの整数倍の制限がないタイル分割と効率的な時間動きベクトル参照、マルチラインイントラ予測を提供することである。 Therefore, the present invention has been made in view of the above problems, and its object is to provide tile division, efficient temporal motion vector reference, and multi-line intra prediction without restrictions on integral multiples of CTU. be.

本発明の一態様に係る動画像復号装置は、タイル単位サイズの整数倍のタイルサイズを復号するヘッダ情報復号部と、ピクチャ内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行うCT分割部と、参照ブロックのピクチャ内座標yColBrInPicと、対象ピクチャのピクチャ内座標から導出した仮想CTU座標yVirCtbBを比較して、参照ブロックの参照可能性を判定し、時間動きベクトルを導出する時間動き予測部を備えることを特徴とする。また、タイル単位サイズの整数倍のタイルサイズを復号するヘッダ情報復号部と、ピクチャ内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行うCT分割部と、ピクチャ内座標からタイル内座標に変換してCTU境界の判定を行うイントラ予測部を備えることを特徴とする。 A video decoding device according to an aspect of the present invention includes a header information decoding unit that decodes a tile size that is an integer multiple of a tile unit size, and a quadtree, binary tree, and ternary tree using the in-picture coordinates and the tile size. The CT partitioning unit that performs multi-tree partitioning of the tree compares the in-picture coordinates yColBrInPic of the reference block with the virtual CTU coordinates yVirCtbB derived from the in-picture coordinates of the target picture to determine the referability of the reference block. It is characterized by comprising a temporal motion prediction unit that derives a motion vector. Also, a header information decoding unit that decodes a tile size that is an integer multiple of the tile unit size, and a CT division unit that performs multi-tree division of a quadtree, a binary tree, and a ternary tree using the in-picture coordinates and the tile size. and an intra-prediction unit that converts intra-picture coordinates to intra-tile coordinates and determines CTU boundaries.

符号化ストリームのデータの階層構造を示す図である。FIG. 3 is a diagram showing the hierarchical structure of data in an encoded stream; CTUの分割例を示す図である。FIG. 4 is a diagram showing an example of CTU division; タイルを説明する図である。It is a figure explaining a tile. タイル情報等に関するシンタックス表である。It is a syntax table regarding tile information and the like. 動画像復号装置の構成を示す概略図である。1 is a schematic diagram showing the configuration of a video decoding device; FIG. 動画像復号装置の概略的動作を説明するフローチャートである。4 is a flowchart for explaining schematic operations of a video decoding device; CT情報復号部の動作を説明するフローチャートである。4 is a flowchart for explaining the operation of a CT information decoding unit; CTUおよびQT情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of CTU and QT information; MT(Multi Tree)情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of MT (Multi Tree) information; MT(Multi Tree)情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of MT (Multi Tree) information; 非CTUサイズでのタイル分割を説明する図である。FIG. 10 is a diagram for explaining tile division in a non-CTU size; 非CTUサイズでのタイル分割を説明する図である。FIG. 10 is a diagram for explaining tile division in a non-CTU size; 符号化スライスデータのシンタックス構成である。It is a syntax configuration of encoded slice data. 仮想CTUライン制限を行いながら参照ピクチャの動きベクトルを参照する場合の参照範囲を示す図である。FIG. 10 is a diagram showing a reference range when referring to motion vectors of reference pictures while performing virtual CTU line restriction; 仮想CTUライン制限を行いながら参照ピクチャの動きベクトルを参照する場合のフローチャートである。FIG. 10 is a flowchart when referring to a motion vector of a reference picture while performing virtual CTU line restriction; FIG. 仮想CTUライン制限を行いながら参照ピクチャの動きベクトルを参照する場合の参照範囲を示す図である。FIG. 10 is a diagram showing a reference range when referring to motion vectors of reference pictures while performing virtual CTU line restriction; 仮想CTUライン制限を行いながら参照ピクチャの動きベクトルを参照する場合のフローチャートである。FIG. 10 is a flowchart when referring to a motion vector of a reference picture while performing virtual CTU line restriction; FIG. 時間動き導出(時間動きベクトル導出)において、参照ピクチャの参照位置を示す図である。FIG. 4 is a diagram showing reference positions of reference pictures in temporal motion derivation (temporal motion vector derivation); 動画像符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of a video encoding apparatus. 本実施形態に係る動画像符号化装置を搭載した送信装置、および、動画像復号装置を搭載した受信装置の構成について示した図である。(a)は動画像符号化装置を搭載した送信装置を示しており、(b)は動画像復号装置を搭載した受信装置を示している。1 is a diagram showing the configuration of a transmitting device equipped with a moving image encoding device and a receiving device equipped with a moving image decoding device according to an embodiment; FIG. (a) shows a transmitting device equipped with a moving image encoding device, and (b) shows a receiving device equipped with a moving image decoding device. 本実施形態に係る動画像符号化装置を搭載した記録装置、および、動画像復号装置を搭載した再生装置の構成について示した図である。(a)は動画像符号化装置を搭載した記録装置を示しており、(b)は動画像復号装置を搭載した再生装置を示している。1 is a diagram showing configurations of a recording device equipped with a moving image encoding device and a reproducing device equipped with a moving image decoding device according to an embodiment; FIG. (a) shows a recording device equipped with a moving image encoding device, and (b) shows a reproducing device equipped with a moving image decoding device. 本実施形態に係る画像伝送システムの構成を示す概略図である。1 is a schematic diagram showing the configuration of an image transmission system according to this embodiment; FIG. タイル情報等に関するシンタックス表の別の例である。FIG. 11 is another example of a syntax table for tile information, etc. FIG. タイル情報等に関するシンタックス表の別の例である。FIG. 11 is another example of a syntax table for tile information, etc. FIG. タイル情報等に関するシンタックス表の別の例である。FIG. 11 is another example of a syntax table for tile information, etc. FIG. タイル情報等に関するシンタックス表の別の例である。FIG. 11 is another example of a syntax table for tile information, etc. FIG. 符号化スライスデータ、CTU情報のシンタックス構成例を示す図である。FIG. 4 is a diagram showing a syntax configuration example of encoded slice data and CTU information; QT情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of QT information; MT情報のシンタックス表の構成例を示す図である。FIG. 10 is a diagram showing a configuration example of a syntax table of MT information; CTU情報のシンタックス構成例を示す図である。FIG. 10 is a diagram showing a syntax configuration example of CTU information; 符号化タイルデータのシンタックス構成である。It is a syntax configuration of encoded tile data. CTUおよびQT情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of CTU and QT information; MT(Multi Tree)情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of MT (Multi Tree) information; CTUおよびQT情報のシンタックス表の構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a syntax table of CTU and QT information; マルチラインイントラ予測において、タイル内のCTU境界に応じて、イントラ参照ラインを定める動作を説明する図である。FIG. 4 is a diagram for explaining the operation of determining intra reference lines according to CTU boundaries within a tile in multiline intra prediction; マルチラインイントラ予測において、タイル内のCTU境界に応じて、イントラ参照ラインを定める動作を説明するフローチャートである。FIG. 10 is a flowchart for explaining the operation of determining intra reference lines according to CTU boundaries within a tile in multiline intra prediction; FIG. マルチラインイントラ予測において、タイル内のCTU境界に応じて、イントラ参照ラインを定める動作を説明するフローチャートである。FIG. 10 is a flowchart for explaining the operation of determining intra reference lines according to CTU boundaries within a tile in multiline intra prediction; FIG. マージ予測パラメータ導出部の構成を示す概略図である。FIG. 4 is a schematic diagram showing the configuration of a merge prediction parameter deriving unit; 参照ピクチャ内の動きベクトルを時間動きベクトルとして参照する処理の例を示す図である。FIG. 10 is a diagram illustrating an example of processing for referring to a motion vector in a reference picture as a temporal motion vector; 参照ピクチャと対象ピクチャが同じタイル分割である場合の対象CTUと動きベクトルを参照範囲の関係を示す図である。FIG. 10 is a diagram showing the relationship between a target CTU and a motion vector reference range when a reference picture and a target picture are divided into the same tiles; マルチラインイントラ予測における、シンタックス構成を示す図である。It is a figure which shows the syntax structure in multi-line intra prediction. ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、MPM導出処理を示すフローチャートである10 is a flowchart showing MPM derivation processing when dividing a picture into tiles of sizes not limited to integral multiples of CTU; ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、MPM導出処理を示すフローチャートである10 is a flowchart showing MPM derivation processing when dividing a picture into tiles of sizes not limited to integral multiples of CTU;

(第1の実施形態)
以下、図面を参照しながら本発明の実施形態について説明する。
(First embodiment)
Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図22は、本実施形態に係る画像伝送システム1の構成を示す概略図である。 FIG. 22 is a schematic diagram showing the configuration of the image transmission system 1 according to this embodiment.

画像伝送システム1は、符号化対象画像を符号化した符号化ストリームを伝送し、伝送された符号化ストリームを復号し画像を表示するシステムである。画像伝送システム1は、動画像符号化装置(画像符号化装置)11、ネットワーク21、動画像復号装置(画像復号装置)31、及び動画像表示装置(画像表示装置)41を含んで構成される。 The image transmission system 1 is a system that transmits an encoded stream obtained by encoding an encoding target image, decodes the transmitted encoded stream, and displays the image. The image transmission system 1 includes a moving image coding device (image coding device) 11, a network 21, a moving image decoding device (image decoding device) 31, and a moving image display device (image display device) 41. .

動画像符号化装置11には画像Tが入力される。 An image T is input to the moving image encoding device 11 .

ネットワーク21は、動画像符号化装置11が生成した符号化ストリームTeを動画像復号装置31に伝送する。ネットワーク21は、インターネット(Internet)、広域ネットワーク(WAN:Wide Area Network)、小規模ネットワーク(LAN:Local Area Network)またはこれらの組み合わせである。ネットワーク21は、必ずしも双方向の通信網に限らず、地上デジタル放送、衛星放送等の放送波を伝送する一方向の通信網であっても良い。また、ネットワーク21は、DVD(Digital Versatile Disc:登録商標)、BD(Blue-ray Disc:登録商標)等の符号化ストリームTeを記録した記憶媒体で代替されても良い。 The network 21 transmits the encoded stream Te generated by the video encoding device 11 to the video decoding device 31 . The network 21 is the Internet, a Wide Area Network (WAN), a Local Area Network (LAN), or a combination thereof. The network 21 is not necessarily a two-way communication network, and may be a one-way communication network that transmits broadcast waves such as terrestrial digital broadcasting and satellite broadcasting. Also, the network 21 may be replaced by a storage medium such as a DVD (Digital Versatile Disc: registered trademark) or a BD (Blue-ray Disc: registered trademark) that records the encoded stream Te.

動画像復号装置31は、ネットワーク21が伝送した符号化ストリームTeのそれぞれを復号し、復号した1または複数の復号画像Tdを生成する。 The moving image decoding device 31 decodes each of the encoded streams Te transmitted by the network 21 and generates one or more decoded images Td.

動画像表示装置41は、動画像復号装置31が生成した1または複数の復号画像Tdの全部または一部を表示する。動画像表示装置41は、例えば、液晶ディスプレイ、有機EL(Electro-luminescence)ディスプレイ等の表示デバイスを備える。ディスプレイの形態としては、据え置き、モバイル、HMD等が挙げられる。また、動画像復号装置31が高い処理能力を有する場合には、画質の高い画像を表示し、より低い処理能力しか有しない場合には、高い処理能力、表示能力を必要としない画像を表示する。 The moving image display device 41 displays all or part of one or more decoded images Td generated by the moving image decoding device 31 . The moving image display device 41 includes, for example, a display device such as a liquid crystal display or an organic EL (Electro-luminescence) display. The form of the display includes stationary, mobile, HMD, and the like. In addition, when the moving image decoding device 31 has high processing power, it displays an image with high image quality, and when it has only lower processing power, it displays an image that does not require high processing power and display power. .

<演算子>
本明細書で用いる演算子を以下に記載する。
<operator>
The operators used in this specification are described below.

>>は右ビットシフト、<<は左ビットシフト、&はビットワイズAND、|はビットワイズOR、|=はOR代入演算子であり、||は論理和を示す。 >> is a right bit shift, << is a left bit shift, & is a bitwise AND, | is a bitwise OR, |= is an OR assignment operator, and || indicates a logical sum.

x?y:zは、xが真(0以外)の場合にy、xが偽(0)の場合にzをとる3項演算子である。 x?y:z is a ternary operator that takes y if x is true (not 0) and z if x is false (0).

!は0を1、0以外を0に変換する演算を示す。 ! indicates an operation that converts 0 to 1 and anything other than 0 to 0.

Clip3(a,b,c)は、cをa以上b以下の値にクリップする関数であり、c<aの場合にはaを返し、c>bの場合にはbを返し、その他の場合にはcを返す関数である(ただし、a<=b)。 Clip3(a,b,c) is a function that clips c to values greater than or equal to a and less than or equal to b, if c<a returns a, if c>b returns b, otherwise is a function that returns c (where a<=b).

abs(a)はaの絶対値を返す関数である。 abs(a) is a function that returns the absolute value of a.

Int(a)はaの整数値を返す関数である。 Int(a) is a function that returns the integer value of a.

floor(a)はa以下の最大の整数を返す関数である。 floor(a) is a function that returns the largest integer less than or equal to a.

ceil(a)はa以上の最大の整数を返す関数である。 ceil(a) is a function that returns the largest integer greater than or equal to a.

a/dはdによるaの除算(小数点以下切り捨て)を表す。 a/d represents division of a by d (truncated after the decimal point).

<符号化ストリームTeの構造>
本実施形態に係る動画像符号化装置11および動画像復号装置31の詳細な説明に先立って、動画像符号化装置11によって生成され、動画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。
<Structure of encoded stream Te>
Prior to a detailed description of the video encoding device 11 and the video decoding device 31 according to the present embodiment, data of the encoded stream Te generated by the video encoding device 11 and decoded by the video decoding device 31 I will explain the structure.

図1は、符号化ストリームTeにおけるデータの階層構造を示す図である。符号化ストリームTeは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。図1の(a)~(f)は、それぞれ、シーケンスSEQを既定する符号化ビデオシーケンス、ピクチャPICTを規定する符号化ピクチャ、スライスSを規定する符号化スライス、スライスデータを規定する符号化スライスデータ、符号化スライスデータに含まれる符号化ツリーユニット、符号化ツリーユニットに含まれる符号化ユニットを示す図である。 FIG. 1 is a diagram showing the hierarchical structure of data in an encoded stream Te. The encoded stream Te illustratively includes a sequence and a plurality of pictures that constitute the sequence. (a) to (f) of FIG. 1 respectively show a coded video sequence that defines a sequence SEQ, a coded picture that defines a picture PICT, a coded slice that defines a slice S, and a coded slice that defines slice data. FIG. 3 is a diagram showing data, a coding tree unit included in the coded slice data, and a coding unit included in the coding tree unit;

(符号化ビデオシーケンス)
符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために動画像復号装置31が参照するデータの集合が規定されている。シーケンスSEQは、図1(a)に示すように、ビデオパラメータセット(Video Parameter Set)、シーケンスパラメータセットSPS
(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
(encoded video sequence)
The encoded video sequence defines a set of data that the video decoding device 31 refers to in order to decode the sequence SEQ to be processed. A sequence SEQ consists of a video parameter set and a sequence parameter set SPS, as shown in Fig. 1(a).
(Sequence Parameter Set), picture parameter set PPS (Picture Parameter Set), picture PICT, and supplemental enhancement information SEI (Supplemental Enhancement Information).

ビデオパラメータセットVPSは、複数のレイヤから構成されている動画像において、複数の動画像に共通する符号化パラメータの集合および動画像に含まれる複数のレイヤおよび個々のレイヤに関連する符号化パラメータの集合が規定されている。 A video parameter set VPS is a set of coding parameters common to multiple video images, multiple layers included in the video image, and coding parameters related to individual layers. Sets are defined.

シーケンスパラメータセットSPSでは、対象シーケンスを復号するために動画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。なお、SPSは複数存在してもよい。その場合、PPSから複数のSPSの何れかを選択する。 The sequence parameter set SPS defines a set of coding parameters that the video decoding device 31 refers to in order to decode the target sequence. For example, the width and height of the picture are defined. A plurality of SPSs may exist. In that case, one of a plurality of SPSs is selected from the PPS.

ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために動画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値(pic_init_qp_minus26)や重み付き予測の適用を示すフラグ(weighted_pred_flag)が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。 The picture parameter set PPS defines a set of coding parameters that the video decoding device 31 refers to in order to decode each picture in the target sequence. For example, it includes a quantization width reference value (pic_init_qp_minus26) used for picture decoding and a flag (weighted_pred_flag) indicating application of weighted prediction. A plurality of PPSs may exist. In that case, one of a plurality of PPSs is selected from each picture in the target sequence.

(符号化ピクチャ)
符号化ピクチャでは、処理対象のピクチャPICTを復号するために動画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図1(b)に示すように、スライス0~スライスNS-1を含む(NSはピクチャPICTに含まれるスライスの総数)。
(coded picture)
The encoded picture defines a set of data that the video decoding device 31 refers to in order to decode the picture PICT to be processed. A picture PICT includes slices 0 to NS-1 (NS is the total number of slices included in the picture PICT), as shown in FIG. 1(b).

なお、以下、スライス0~スライスNS-1のそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。 In the following description, if there is no need to distinguish between slices 0 to NS-1, the suffixes may be omitted. The same applies to other data with subscripts that are included in the encoded stream Te described below.

(符号化スライス)
符号化スライスでは、処理対象のスライスSを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスは、図1(c)に示すように、スライスヘッダ、および、スライスデータを含んでいる。
(coded slice)
The encoded slice defines a set of data that the video decoding device 31 refers to in order to decode the slice S to be processed. A slice includes a slice header and slice data, as shown in FIG. 1(c).

スライスヘッダには、対象スライスの復号方法を決定するために動画像復号装置31が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダに含まれる符号化パラメータの一例である。 The slice header includes a coding parameter group that the video decoding device 31 refers to in order to determine the decoding method for the target slice. Slice type designation information (slice_type) that designates a slice type is an example of a coding parameter included in a slice header.

スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、または、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。なお、インター予測は、単予測、双予測に限定されず、より多くの参照ピクチャを用いて予測画像を生成してもよい。以下、P、Bスライスと呼ぶ場合には、インター予測を用いることができるブロックを含むスライスを指す。 Slice types that can be specified by the slice type specifying information include (1) I slices that use only intra prediction during encoding, (2) P slices that use unidirectional prediction or intra prediction during encoding, (3) B slices using uni-prediction, bi-prediction, or intra-prediction during encoding. Note that inter prediction is not limited to uni-prediction and bi-prediction, and a predicted image may be generated using more reference pictures. Hereinafter, when referred to as P and B slices, they refer to slices containing blocks for which inter prediction can be used.

なお、スライスヘッダは、ピクチャパラメータセットPPSへの参照(pic_parameter_set_id)を含んでいても良い。 Note that the slice header may include a reference (pic_parameter_set_id) to the picture parameter set PPS.

(符号化スライスデータ)
符号化スライスデータでは、処理対象のスライスデータを復号するために動画像復号装置
31が参照するデータの集合が規定されている。スライスデータは、図1(d)に示すように、CTUを含んでいる。CTUは、スライスを構成する固定サイズ(例えば128x128)のブロックであり、最大符号化単位(LCU:Largest Coding Unit)と呼ぶこともある。
(encoded slice data)
For encoded slice data, a video decoding device is used to decode slice data to be processed.
A set of data referenced by 31 is defined. The slice data includes CTU, as shown in FIG. 1(d). A CTU is a block of a fixed size (for example, 128x128) that forms a slice, and is also called a Largest Coding Unit (LCU).

(タイル)
図3(a)はピクチャをN個のタイル(実線の矩形、図はN=9の例)に分割した例を示す図である。タイルはさらに複数のCTU(破線の矩形)に分割される。図3(a)の中央に示すように、タイルの左上座標を(xTile,yTile)、幅をwTile、高さをhTileと記す。またピクチャの幅をwPict、高さをhPictと記す。なお、タイルの分割数やサイズに関する情報をタイル情報と呼び、詳細は後述する。xTile、yTile、wTile、hTile、wPict、hPictの単位は画素である。ピクチャの幅、高さは図4(a)に示すsequence_parameter_set_rbsp()(SPSと称す)で通知される、pic_width_in_luma_samples、pic_height_in_luma_samplesをセットする。
(tile)
FIG. 3A is a diagram showing an example in which a picture is divided into N tiles (rectangles with solid lines; the figure shows an example of N=9). The tile is further divided into multiple CTUs (dashed rectangles). As shown in the center of FIG. 3(a), the upper left coordinate of the tile is (xTile, yTile), the width is wTile, and the height is hTile. Also, the width of the picture is described as wPict, and the height as hPict. Information about the number of tile divisions and size is called tile information, and the details will be described later. The units of xTile, yTile, wTile, hTile, wPict, and hPict are pixels. For the width and height of the picture, pic_width_in_luma_samples and pic_height_in_luma_samples notified by sequence_parameter_set_rbsp() (referred to as SPS) shown in FIG. 4(a) are set.

wPict = pic_width_in_luma_samples
hPict = pic_height_in_luma_samples
図3(b)はピクチャをタイルに分割した時の、CTUの符号化、復号順序を示す図である。各タイルに記載されている番号はTileId(ピクチャ内のタイルの識別子)であり、ピクチャ内のタイルに対し左上から右下にラスタスキャン順で番号TileIdを割り当ててもよい。また、CTUは各タイル内を左上から右下へラスタスキャン順に処理され、1つのタイル内での処理が終わると、次のタイル内のCTUが処理される。
wPict = pic_width_in_luma_samples
hPict = pic_height_in_luma_samples
FIG. 3(b) is a diagram showing the encoding and decoding order of CTUs when a picture is divided into tiles. The number described in each tile is TileId (identifier of the tile within the picture), and the number TileId may be assigned to the tiles within the picture in raster scan order from top left to bottom right. Also, CTUs are processed within each tile in raster scan order from upper left to lower right, and when processing within one tile is completed, CTUs within the next tile are processed.

図3(c)は時間方向に連続するタイルを示す図である。図3(c)に示されるように、ビデオシーケンスは、時間方向に連続する複数のピクチャから構成されている。タイルシーケンスは、時間方向に連続する1つ以上の時刻のタイルから構成されている。図中wのTile(n,tk)は、時刻tkにおけるTileId=nのタイルを表す。なお、図中のCVS(Coded Video Sequence)は、あるイントラピクチャから復号順で別のイントラピクチャの直前のピクチャまでのピクチャ群である。 FIG. 3(c) is a diagram showing tiles that are continuous in the time direction. As shown in FIG. 3(c), a video sequence is composed of a plurality of pictures that are continuous in the time direction. A tile sequence is composed of one or more time tiles that are consecutive in the time direction. Tile(n, tk) of w in the figure represents a tile of TileId=n at time tk. Note that a CVS (Coded Video Sequence) in the figure is a group of pictures from an intra picture to the picture immediately preceding another intra picture in decoding order.

図4は、タイル情報等に関するシンタックスの例である。 FIG. 4 is an example of syntax related to tile information and the like.

図4(b)に示すPPS(pic_parameter_set_rbsp())で、タイルに関するパラメータtile_parameters()を通知する。以下、パラメータを通知するとは、パラメータを符号化データ(ビットストリーム)に含めることを意味し、動画像符号化装置では当該パラメータを符号化し、動画像復号装置では当該パラメータを復号する。tile_parameters()には、図4(c)に示すように、tileが存在するか否かを示すtile_enabled_flagが1の場合、タイル情報tile_info()を通知する。また、tile_enabled_flagが1の場合、タイルが時間的に連続する複数のピクチャにわたって独立に復号できるか否かを示すindependent_tiles_flag(independent_decoding_tile_flag)を通知する。independent_tiles_flagが0の場合、タイルは、参照ピクチャ中の隣接タイルを参照して復号する(独立に復号できない)。independent_tiles_flagが1の場合、参照ピクチャ中の隣接タイルを参照せずに復号する。タイルを用いる場合、independent_tiles_flagの値によらず、対象ピクチャ中の隣接タイルを参照せずに復号するため、複数のタイルを並列に復号することができる。このindependent_tiles_flagフラグは、タイルグループ単位やタイル単位など領域単位のフラグindependent_decoding_picture_region_flagであってもよい。なおindependent_tiles_flagは1の場合に独立(ピクチャ間参照なし)、0の場合に従属(ピクチャ間参照あり)であったが、0と1が逆のフラグでもよい。例えば、タイル時ピクチャ間参照可能フラグtile_inpicture_ref_enabled_flagという名前で0の時に独立、1の時に従属となるフラグでもよい。
図4(c)に示すように、independent_tiles_flagが0の場合に参照ピクチャにかけるタイル境界でのループフィルタのオンオフを示す、loop_filter_across_tiles_enable_flagを伝
送(present)する。independent_tiles_flagが1の場合において、loop_filter_across_tiles_enable_flagを伝送(present)せずに常に0としてもよい。
The PPS (pic_parameter_set_rbsp()) shown in FIG. 4(b) notifies the parameter tile_parameters() regarding the tile. Hereinafter, to notify a parameter means to include the parameter in the encoded data (bitstream). The video encoding device encodes the parameter, and the video decoding device decodes the parameter. As shown in FIG. 4(c), tile information tile_info() is notified to tile_parameters() when tile_enabled_flag indicating whether or not a tile exists is 1. Also, when tile_enabled_flag is 1, an independent_tiles_flag (independent_decoding_tile_flag) indicating whether tiles can be decoded independently over a plurality of temporally consecutive pictures is notified. If independent_tiles_flag is 0, tiles are decoded with reference to adjacent tiles in the reference picture (cannot be decoded independently). If independent_tiles_flag is 1, decode without referring to adjacent tiles in the reference picture. When using tiles, decoding is performed without referring to adjacent tiles in the current picture regardless of the value of independent_tiles_flag, so multiple tiles can be decoded in parallel. This independent_tiles_flag flag may be a flag independent_decoding_picture_region_flag for each region such as each tile group or each tile. Although independent_tiles_flag is 1 for independent (no inter-picture reference) and 0 for dependent (with inter-picture reference), 0 and 1 may be reversed. For example, the tile-in-picture referable flag tile_inpicture_ref_enabled_flag may be a flag that is independent when 0 and dependent when 1.
As shown in FIG. 4(c), when independent_tiles_flag is 0, loop_filter_across_tiles_enable_flag, which indicates ON/OFF of the loop filter at the tile boundary applied to the reference picture, is transmitted (presented). When independent_tiles_flag is 1, loop_filter_across_tiles_enable_flag may always be 0 without presenting it.

なお、シーケンスを通してタイルを独立に処理する場合、独立タイルフラグindependent_tiles_flagは図4(a)に示すようにSPSで通知してもよい。 When tiles are processed independently through the sequence, the independent tile flag independent_tiles_flag may be notified by SPS as shown in FIG. 4(a).

タイル情報tile_info()は、例えば図4(d)に示すように、num_tile_columns_minus1、num_tile_rows_minus1、tile_unit_width_idc、tile_unit_height_idc、uniform_spacing_flag、column_width_in_unit_minus1[i]、row_height_in_unit_minus1[i]である。ここで、num_tile_columns_minus1、num_tile_rows_minus1は各々ピクチャ内の水平、垂直方向のタイル数M、Nから各々1を引いた値である。uniform_spacing_flagはピクチャが可能な限り均等にタイル分割されるか否かを示すフラグである。uniform_spacing_flagの値が1の場合、ピクチャの各タイルの幅、高さは所定のサイズを単位として可能な限り等しくなるよう、ピクチャ内の水平、垂直方向のタイル数と、タイルの最小単位を示す識別子(タイルユニット識別子)(tile_unit_width_idc、tile_unit_height_idc)から動画像符号化装置、動画像復号装置(ヘッダ復号部3020)において、タイルの幅、高さを導出する。 The tile information tile_info() is, for example, num_tile_columns_minus1, num_tile_rows_minus1, tile_unit_width_idc, tile_unit_height_idc, uniform_spacing_flag, column_width_in_unit_minus1[i], row_height_in_unit_minus1[i], as shown in FIG. 4(d). Here, num_tile_columns_minus1 and num_tile_rows_minus1 are values obtained by subtracting 1 from the number of tiles M and N in the horizontal and vertical directions in the picture, respectively. uniform_spacing_flag is a flag that indicates whether the picture is tiled as evenly as possible. When the value of uniform_spacing_flag is 1, an identifier that indicates the number of horizontal and vertical tiles in the picture and the minimum unit of tiles so that the width and height of each tile in the picture are equal as much as possible in units of a given size. From (tile unit identifier) (tile_unit_width_idc, tile_unit_height_idc), the width and height of the tile are derived in the video encoding device and the video decoding device (header decoding unit 3020).

ヘッダ復号部3020は、タイルユニット識別子tile_unit_width_idc、tile_unit_height_idcからタイルの最小単位(タイルの単位サイズ)wUnitTile、hUnitTileを導出する(詳細は後述)。タイルの単位サイズをCTUのサイズの整数倍に限定されないタイルを、以下、フレキシブルタイルと呼ぶ。 The header decoding unit 3020 derives minimum tile units (tile unit sizes) wUnitTile and hUnitTile from the tile unit identifiers tile_unit_width_idc and tile_unit_height_idc (details will be described later). A tile whose unit size is not limited to an integral multiple of the CTU size is hereinafter referred to as a flexible tile.

wUnitTile = 1<<(log2CbSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CbSize+tile_unit_height_idc)
ヘッダ復号部3020は、ピクチャ内の水平、垂直方向のタイル数M、Nを以下で導出する。MはnumTileColumns、NはnumTileRowsである。
wUnitTile = 1<<(log2CbSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CbSize+tile_unit_height_idc)
The header decoding unit 3020 derives the numbers M and N of tiles in the horizontal and vertical directions in the picture as follows. M is numTileColumns and N is numTileRows.

M = num_tile_columns_minus1+1
N = num_tile_rows_minus1+1
numTileColumns = M = num_tile_columns_minus1+1
numTileRows = N = num_tile_columns_minus1+1
ヘッダ復号部3020は、タイルの最小サイズ(最小単位)wUnitTile、hUnitTileの倍数となるように、タイルサイズを以下で導出する。ここで、wPictInUnitTileとhPictInUnitTileは、それぞれ、wPictおよびhPictをwUnitTileおよびhUnitTileを単位として表した値である。
M = num_tile_columns_minus1+1
N = num_tile_rows_minus1+1
numTileColumns = M = num_tile_columns_minus1+1
numTileRows = N = num_tile_columns_minus1+1
The header decoding unit 3020 derives the tile size as follows so as to be a multiple of the minimum tile size (minimum unit) wUnitTile and hUnitTile. Here, wPictInUnitTile and hPictInUnitTile are values representing wPict and hPict in units of wUnitTile and hUnitTile, respectively.

wPictInUnitTile = ceil(wPict/wUnitTile)
hPictInUnitTile = ceil(hPict/hUnitTile)
wTile[m] = ceil(wPictInUnitTile/M)*wUnitTile (0<=m<M)
hTile[n] = ceil(hPictInUnitTile/N)*hUnitTile (0<=n<N)
あるいはヘッダ復号部3020は、下式で導出してもよい。
wPictInUnitTile = ceil(wPict/wUnitTile)
hPictInUnitTile = ceil(hPict/hUnitTile)
wTile[m] = ceil(wPictInUnitTile/M)*wUnitTile (0<=m<M)
hTile[n] = ceil(hPictInUnitTile/N)*hUnitTile (0<=n<N)
Alternatively, the header decoding unit 3020 may be derived by the following formula.

wTile[m] = floor(wPict/M/wUnitTile)*wUnitTile (0<=m<M)
hTile[n] = floor(hPict/N/hUnitTile)*hUnitTile (0<=n<N)
あるいはヘッダ復号部3020は、下式で導出してもよい。
wTile[m] = floor(wPict/M/wUnitTile)*wUnitTile (0<=m<M)
hTile[n] = floor(hPict/N/hUnitTile)*hUnitTile (0<=n<N)
Alternatively, the header decoding unit 3020 may be derived by the following formula.

for(m=0;m<M;m++)
wTile[m] = ((m+1)*wPictInUnitTile/M-m*wPictInUnitTile/M)*wUnitTile
for(n=0;n<N;n++)
hTile[n] = ((n+1)*hPictInUnitTile/N-n*hPictInUnitTile/N)*hUnitTile
uniform_spacing_flagの値が0の場合、ピクチャの各タイルの幅、高さは個別に設定される。動画像符号化装置では、各タイルの幅column_width_in_unit_minus1[i](図3のwTileを、wUnitTileを単位として表現した値)、高さrow_height_in_unit_minus1[i](図3のhTileを、hUnitTileを単位として表現した値)をタイル毎に符号化する。動画像復号装置のヘッダ復号部3020では、符号化された(column_width_in_unit_minus1[],row_width_in_unit_minus1[])に基づいてタイル毎に、タイルサイズwTile[m]、hTile[n]を下記のように復号する。
for(m=0;m<M;m++)
wTile[m] = ((m+1)*wPictInUnitTile/Mm*wPictInUnitTile/M)*wUnitTile
for(n=0;n<N;n++)
hTile[n] = ((n+1)*hPictInUnitTile/Nn*hPictInUnitTile/N)*hUnitTile
If the value of uniform_spacing_flag is 0, the width and height of each tile in the picture are set individually. In the video encoding device, each tile has a width column_width_in_unit_minus1[i] (wTile in FIG. 3 expressed in units of wUnitTile) and a height row_height_in_unit_minus1[i] (hTile in FIG. 3 expressed in units of hUnitTile). value) for each tile. The header decoding unit 3020 of the video decoding device decodes the tile sizes wTile[m] and hTile[n] for each tile based on the encoded (column_width_in_unit_minus1[], row_width_in_unit_minus1[]) as follows.

wTile[m] = (column_width_in_unit_minus1[m]+1)*wUnitTile (0<=m<M-1)
hTile[n] = (row_height_in_unit_minus1[m]+1)*hUnitTile (0<=n<N-1)
wTile[M-1] = ceil((wPict-sum_m(wTile[m]))/wUnitTile)*wUnitTile
hTile[N-1] = ceil((hPict-sum_n(hTile[n]))/hUnitTile)*hUnitTile
ここで、sum_m(wTile[m])は、wTile(0<=m<M-1)の総和、sum_n(hTile[n])はhTile(0<=n<N-1)の総和を表す。
wTile[m] = (column_width_in_unit_minus1[m]+1)*wUnitTile (0<=m<M-1)
hTile[n] = (row_height_in_unit_minus1[m]+1)*hUnitTile (0<=n<N-1)
wTile[M-1] = ceil((wPict-sum_m(wTile[m]))/wUnitTile)*wUnitTile
hTile[N-1] = ceil((hPict-sum_n(hTile[n]))/hUnitTile)*hUnitTile
Here, sum_m(wTile[m]) represents the sum of wTile(0<=m<M-1), and sum_n(hTile[n]) represents the sum of hTile(0<=n<N-1).

あるいは、画面端にあたるwTile[M-1]およびhTile[N-1]は、ピクチャサイズがタイルの最小単位の整数倍でない場合には、単に下記のようにしてもよい。 Alternatively, wTile[M-1] and hTile[N-1] at the screen edges may simply be as follows if the picture size is not an integral multiple of the minimum unit of tiles.

wTile[M-1] = wPict-sum_m(wTile[m])
hTile[N-1] = hPict-sum_n(hTile[n])
ただしこの場合は、処理単位がタイルの最小単位あるいは最小CUサイズに合致するように、パディングやクロッピングなどにより画面端が適切に処理されることが望ましい。
wTile[M-1] = wPict-sum_m(wTile[m])
hTile[N-1] = hPict-sum_n(hTile[n])
However, in this case, it is desirable that the edges of the screen are appropriately processed by padding or cropping so that the processing unit matches the minimum unit of tiles or the minimum CU size.

なお、位置(m,n)のタイルは識別子TileIdでも表され、TileIdは下記で算出してもよい。 Note that the tile at position (m,n) is also represented by an identifier TileId, which may be calculated as follows.

TileId = n*M+m
あるいは、TileIdが既知の場合、TileIdからタイルの位置を示す(m,n)を算出してもよい。
TileId = n*M+m
Alternatively, if the TileId is known, (m,n) indicating the position of the tile may be calculated from the TileId.

m = TileId%M
n = TileId/M
ヘッダ復号部3020は、タイルの大きさの単位を示すタイルユニット情報を復号する。タイルの幅と高さの最小単位をwUnitTile、hUnitTileとする場合、タイルの幅と高さは、各々wUnitTile、hUnitTileの整数倍に設定される。
m = TileId%M
n = TileId/M
The header decoding unit 3020 decodes tile unit information indicating the unit of tile size. When the minimum units of tile width and height are wUnitTile and hUnitTile, the tile width and height are set to integral multiples of wUnitTile and hUnitTile, respectively.

例えば、ヘッダ復号部3020は、符号化データからタイルユニット識別子としてtile_unit_width_idcとtile_unit_height_idcを復号する。タイルの大きさの単位は符号化ユニットCUの最小サイズの定数倍(1を含む)としてもよい。CTUの幅と高さが等しい正方形であれば、tile_unit_size_idcのみ復号して、tile_unit_height_idc=tile_unit_width_idc=tile_unit_size_idcとし、タイルの大きさの単位を導出してもよい。このとき以下の明細書ではtile_unit_width_idc、tile_unit_height_idcをtile_unit_size_idcと読みかえてもよい(この場合常に、wUnitTile=hUnitTile=UnitTileSizeY)。 For example, the header decoding unit 3020 decodes tile_unit_width_idc and tile_unit_height_idc as tile unit identifiers from the encoded data. The tile size unit may be a constant multiple (including 1) of the minimum size of the coding unit CU. If the CTU is a square with the same width and height, only the tile_unit_size_idc may be decoded to set tile_unit_height_idc=tile_unit_width_idc=tile_unit_size_idc to derive the tile size unit. At this time, tile_unit_width_idc and tile_unit_height_idc may be read as tile_unit_size_idc in the following specification (in this case, wUnitTile=hUnitTile=UnitTileSizeY).

(設定方法1)
ヘッダ復号部3020は、タイルユニット識別子が0である場合には、タイルの大きさの単位をCTU単位として設定する。具体的には、tile_unit_width_idc=0の場合にwUnitTile=ctuWidth、tile_unit_width_idc=0の場合にhUnitTile=ctuHeightに設定する。ここで、ctuWidthはCTUの幅、ctuHeightはCTUの高さである。
(Setting method 1)
When the tile unit identifier is 0, the header decoding unit 3020 sets the tile size unit as the CTU unit. Specifically, when tile_unit_width_idc=0, set wUnitTile=ctuWidth, and when tile_unit_width_idc=0, set hUnitTile=ctuHeight. where ctuWidth is the width of the CTU and ctuHeight is the height of the CTU.

さらにヘッダ復号部3020は、以下のように、タイルユニット識別子が0以外である場合には、タイルの大きさの単位を符号化ユニットCUの最小サイズの定数倍になるように設定しても良い。 Furthermore, the header decoding unit 3020 may set the tile size unit to be a constant multiple of the minimum size of the coding unit CU, as described below, when the tile unit identifier is other than 0. .

wUnitTile = (tile_unit_width_idc==0) ? ctuWidth : 1<<(log2CbSize+tile_unit_width_idc-1)
hUnitTile = (tile_unit_height_idc==0) ? ctuHeight : 1<<(log2CbSize+tile_unit_height_idc-1)
ここで、log2CbSize=log2(minCU)、minCUは符号化ユニットCUの最小サイズである。
wUnitTile = (tile_unit_width_idc==0) ? ctuWidth : 1<<(log2CbSize+tile_unit_width_idc-1)
hUnitTile = (tile_unit_height_idc==0) ? ctuHeight : 1<<(log2CbSize+tile_unit_height_idc-1)
where log2CbSize=log2(minCU), minCU is the minimum size of the coding unit CU.

なおCTUサイズctuSize=ctuWidth=ctuHeightは、以下のように、最小CUサイズを定めるシンタックス要素log2_min_luma_coding_block_size_minus3と、CUサイズを最小CUサイズとの差分との対数で示すシンタックス要素log2_diff_max_min_luma_coding_block_sizeを復号して導出しても良い。 The CTU size ctuSize=ctuWidth=ctuHeight is derived by decoding the syntax element log2_min_luma_coding_block_size_minus3 that determines the minimum CU size and the syntax element log2_diff_max_min_luma_coding_block_size that indicates the CU size as a logarithm of the difference from the minimum CU size. can be

log2CbSize = log2_min_luma_coding_block_size_minus3+3
log2CtuSize = log2CbSize+log2_diff_max_min_luma_coding_block_size
minCU = 1 << log2CbSize
ctuSize = 1 << log2CtuSize
なお、タイルユニット識別子!=0の場合には、タイル単位を符号化ユニットCUの最小サイズの定数倍(2の指数乗)に設定しても良い。
log2CbSize = log2_min_luma_coding_block_size_minus3+3
log2CtuSize = log2CbSize + log2_diff_max_min_luma_coding_block_size
minCU = 1 << log2CbSize
ctuSize = 1 << log2CtuSize
Note that when the tile unit identifier !=0, the tile unit may be set to a constant multiple (exponential power of 2) of the minimum size of the encoding unit CU.

wUnitTile = (tile_unit_width_idc==0) ? ctuWidth : 1<<(log2CbSize+ Log2DiffTileUnitSize)
hUnitTile = (tile_unit_height_idc==0) ? ctuHeight : 1<<(log2CbSize+ Log2DiffTileUnitSize)
ここでLog2DiffTileUnitSizeは、タイル単位を定める定数である。例えば1、2、3に設定することで、タイル単位が最小CUサイズの4、8、16倍に設定される。例えば、CUサイズが4の場合には、8、16、32に設定される。さらに最大値をCTUサイズとなるようにクリップしても良い。
wUnitTile = (tile_unit_width_idc==0) ? ctuWidth : 1<<(log2CbSize+ Log2DiffTileUnitSize)
hUnitTile = (tile_unit_height_idc==0) ? ctuHeight : 1<<(log2CbSize+ Log2DiffTileUnitSize)
Here, Log2DiffTileUnitSize is a constant that defines the tile unit. For example, setting to 1, 2, 3 will set the tile unit to 4, 8, 16 times the minimum CU size. For example, if the CU size is 4, it is set to 8, 16, and 32. Furthermore, the maximum value may be clipped to the CTU size.

(設定方法2)
タイル情報は0から所定の範囲の数のタイルユニット識別子tile_unit_width_idcであり、タイルの大きさの単位を1<<(log2(minCU)+タイルユニット識別子)で設定してもよい。すなわち、ヘッダ復号部3020は、tile_unit_width_idc、tile_unit_height_idc(もしくはtile_unit_size_idc)を復号し、タイル単位を以下のように設定してもよい。
(Setting method 2)
The tile information is a tile unit identifier tile_unit_width_idc with a number ranging from 0 to a predetermined range, and the tile size unit may be set as 1<<(log2(minCU)+tile unit identifier). That is, the header decoding unit 3020 may decode tile_unit_width_idc and tile_unit_height_idc (or tile_unit_size_idc) and set the tile unit as follows.

wUnitTile = 1<<(log2CbSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CbSize+tile_unit_height_idc)
CTUの幅と高さが等しい正方形であれば、以上はtile_unit_size_idcを復号し以下のように設定することと同値である。以下、自明であるので、正方形のみの場合の説明は省略する。
wUnitTile = 1<<(log2CbSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CbSize+tile_unit_height_idc)
If the CTU is a square with the same width and height, the above is equivalent to decoding tile_unit_size_idc and setting it as follows. Since it is self-explanatory, a description of the case of only squares is omitted below.

wUnitTile = hUnitTile = ctuSize>>tile_unit_size_idc
なお、タイルユニット識別子を明示的に符号化せず、タイル単位を符号化ユニットCUの最小サイズの定数倍(2の指数乗)に設定しても良い。
wUnitTile = hUnitTile = ctuSize>>tile_unit_size_idc
Note that the tile unit may be set to a constant multiple (exponential power of 2) of the minimum size of the encoding unit CU without explicitly encoding the tile unit identifier.

wUnitTile = 1<<(log2CbSize+Log2DiffTileUnitSize)
hUnitTile = 1<<(log2CbSize+Log2DiffTileUnitSize)
ここでLog2DiffTileUnitSizeは、タイル単位を定める定数である。さらに最大値がCTU
サイズにクリップしても良い。
wUnitTile = 1<<(log2CbSize+Log2DiffTileUnitSize)
hUnitTile = 1<<(log2CbSize+Log2DiffTileUnitSize)
Here, Log2DiffTileUnitSize is a constant that defines the tile unit. Furthermore, the maximum value is CTU
Can be clipped to size.

wUnitTile = min(ctuWidth,1<<(log2CbSize+Log2DiffTileUnitSize))
hUnitTile = min(ctuHeight1<<(log2CbSize+Log2DiffTileUnitSize))
(設定方法3)
タイル情報は、0から所定の範囲の数のタイルユニット識別子であり、タイルの大きさの単位をCTUサイズの2の指数乗分の1となるように、1<<(log2(CTUサイズ)-タイルユニット識別子)で設定することを特徴とする。すなわち、ヘッダ復号部3020は、tile_unit_width_idc、tile_unit_height_idc(もしくはtile_unit_size_idc)を復号し、タイル単位を以下のように設定してもよい。
wUnitTile = min(ctuWidth,1<<(log2CbSize+Log2DiffTileUnitSize))
hUnitTile = min(ctuHeight1<<(log2CbSize+Log2DiffTileUnitSize))
(Setting method 3)
The tile information is a tile unit identifier with a number ranging from 0 to a predetermined range. tile unit identifier). That is, the header decoding unit 3020 may decode tile_unit_width_idc and tile_unit_height_idc (or tile_unit_size_idc) and set the tile unit as follows.

wUnitTile = 1<<(log2CtuWidthY-tile_unit_width_idc)
hUnitTile = 1<<(log2CtuHeightY-tile_unit_height_idc)
ここで、log2CtuWidthY=log2(ctuWidth)、log2CtuHeightY=log2(ctuHeight)である。
wUnitTile = 1<<(log2CtuWidthY-tile_unit_width_idc)
hUnitTile = 1<<(log2CtuHeightY-tile_unit_height_idc)
where log2CtuWidthY=log2(ctuWidth) and log2CtuHeightY=log2(ctuHeight).

なお、CTUサイズの幅と高さを同じ値に設定しても良い。 Note that the width and height of the CTU size may be set to the same value.

wUnitTile = 1<<(log2CtuSize-tile_unit_width_idc)
hUnitTile = 1<<(log2CtuSize-tile_unit_height_idc)
ここで、log2CtuSize=log2(ctuWidth)=log2(ctuHeight)である。
この場合、差分の対数での表現になるのでtile_unit_width_idcをlog2_diff_luma_tile_unit_sizeと呼ぶのも適当である。
wUnitTile = 1<<(log2CtuSize-tile_unit_width_idc)
hUnitTile = 1<<(log2CtuSize-tile_unit_height_idc)
where log2CtuSize=log2(ctuWidth)=log2(ctuHeight).
In this case, it is appropriate to call tile_unit_width_idc log2_diff_luma_tile_unit_size because the difference is expressed in logarithm.

なお、以下のようにタイル単位が8の倍数の最小サイズとなるようにクリップしても良い。 It should be noted that it is also possible to clip so that the tile unit has a minimum size that is a multiple of 8 as follows.

wUnitTile = max(8, ctuWidth>>tile_unit_width_idc)
hUnitTile = max(8, ctuHeight>>tile_unit_height_idc)
これによって、常にタイル幅が8の倍数となるため(設定方法5)に示す効果も奏する。
wUnitTile = max(8, ctuWidth>>tile_unit_width_idc)
hUnitTile = max(8, ctuHeight >> tile_unit_height_idc)
As a result, since the tile width is always a multiple of 8, the effect shown in (setting method 5) is also exhibited.

また、以下のように単位サイズをminCTUサイズとなるようにクリップしても良い。 Also, you can clip so that the unit size becomes the minCTU size as follows.

wUnitTile = max(minCTU, ctuWidth>>tile_unit_width_idc)
hUnitTile = max(minCTU, ctuHeight>>tile_unit_height_idc)
これによって、常にタイル幅がCTUの最小サイズの倍数となるため(設定方法5)に示す効果も奏する。
wUnitTile = max(minCTU, ctuWidth >> tile_unit_width_idc)
hUnitTile = max(minCTU, ctuHeight >> tile_unit_height_idc)
As a result, the tile width is always a multiple of the minimum size of the CTU, so the effect shown in (setting method 5) is also achieved.

さらに、tile_unit_width_idcの取り得る範囲を制限しても良い。例えば、ctuWidth>>tile_unit_width_idcの最小値をminCTUとする場合、
ctuWidth>>tile_unit_width_idc >= minCTU
ctuWidth >= minCTU<< tile_unit_width_idc
ctuWidth >= minCTU * (1<<tile_unit_width_idc)
(1<<tile_unit_width_idc) <= ctuWidth/minCTU
tile_unit_width_idc <= log2(ctuWidth)-log2(minCTU)
であるから、tile_unit_width_idcを0以上log2(ctuWidth)-log2(minCTU)以下に制限する。すなわち、動画像復号装置は、0以上log2(ctuWidth)-log2(minCTU)以下に制限された符号化データを復号することにより、minCTUの倍数であるタイル単位を用いることができる。
Furthermore, the possible range of tile_unit_width_idc may be restricted. For example, if the minimum value of ctuWidth>>tile_unit_width_idc is minCTU,
ctuWidth >> tile_unit_width_idc >= minCTU
ctuWidth >= minCTU<< tile_unit_width_idc
ctuWidth >= minCTU * (1<<tile_unit_width_idc)
(1<<tile_unit_width_idc) <= ctuWidth/minCTU
tile_unit_width_idc <= log2(ctuWidth)-log2(minCTU)
Therefore, limit tile_unit_width_idc to 0 or more and log2(ctuWidth)-log2(minCTU) or less. That is, the video decoding device can use tile units that are multiples of minCTU by decoding encoded data limited to 0 or more and log2(ctuWidth)-log2(minCTU) or less.

同様に、0以上log2(ctuWidth)-log2(8)=log2(ctuWidth)-3以下に制限された符号化デー
タを復号することにより8の倍数であるタイル単位を用いることができる。8の倍数でなく16、32の倍数の場合には、上記の3(log2(8))を4、5とすればよい。
Similarly, tile units that are multiples of 8 can be used by decoding encoded data limited to 0 or more and log2(ctuWidth)-log2(8)=log2(ctuWidth)-3 or less. In the case of multiples of 16 and 32 instead of multiples of 8, the above 3(log2(8)) should be changed to 4 and 5.

(設定方法4)
タイル情報は、0から所定の範囲の数のタイルユニット識別子であり、タイルの大きさの単位をCTUサイズの2の指数乗分の1となるように、CTUサイズ>>タイルユニット識別子で設定することを特徴とする。すなわち、ヘッダ復号部3020は、tile_unit_width_idc、tile_unit_height_idc(もしくはtile_unit_size_idc)を復号し、タイル単位を以下のように設定してもよい。
(Setting method 4)
The tile information is a tile unit identifier with a number ranging from 0 to a predetermined range, and the tile size unit is set by CTU size >> tile unit identifier so that the tile size unit is 1 divided by the CTU size multiplied by 2. It is characterized by That is, the header decoding unit 3020 may decode tile_unit_width_idc and tile_unit_height_idc (or tile_unit_size_idc) and set the tile unit as follows.

wUnitTile = ctuWidth>>tile_unit_width_idc
hUnitTile = ctuHeight>>tile_unit_height_idc
設定方法3と設定方法4は同値であるから、tile_unit_width_idc、tile_unit_height_idc(もしくはtile_unit_size_idc)の制限は(設定方法3)で説明した方法が利用できる。
wUnitTile = ctuWidth >> tile_unit_width_idc
hUnitTile = ctuHeight>>tile_unit_height_idc
Since setting method 3 and setting method 4 have the same value, the method described in (setting method 3) can be used to limit tile_unit_width_idc and tile_unit_height_idc (or tile_unit_size_idc).

(設定方法5)
ヘッダ復号部3020は、タイルユニット識別子(tile_unit_width_idc、tile_unit_height_idc)を復号せず、所定の値TileUnitをwUnitTile、hUnitTileに設定する。所定の値TileUnitは8の倍数、特に8、16、32の何れかであることが好ましい。タイル情報tile_info()は図4(d)に替えて図23(d)のように通知され、ヘッダ復号部3020はこのタイル情報を復号する。
(Setting method 5)
The header decoding unit 3020 does not decode the tile unit identifiers (tile_unit_width_idc, tile_unit_height_idc), and sets the predetermined value TileUnit to wUnitTile, hUnitTile. Preferably, the predetermined value TileUnit is a multiple of 8, especially 8, 16 or 32. Tile information tile_info( ) is notified as shown in FIG. 23(d) instead of FIG. 4(d), and header decoding section 3020 decodes this tile information.

wUnitTile = TileUnit
hUnitTile = TileUnit
ここで、TileUnitは8あるいは16、32のように8の倍数とする。タイル単位を8の倍数とすれば、画素のbitDepthが10bitなど8の倍数でない場合にも、タイル幅の画素データは8の倍数とすることができる。これによりメモリ配置する場合にもタイル境界が常にバイト(8bit)境界となり、タイルをメモリに配置する場合において、タイル間にメモリのギャップが不要である。ギャップがなければ、ギャップ分のメモリは不要で、連続的に転送可能であることから、メモリサイズを低減できるとともに高速転送が可能という効果を奏する。さらに16の倍数であれば、タイル幅のデータを常に128bitの倍数とすることができ(bitDepth=8bitの場合)、多くのメモリ(例えばDDR)のバーストアクセスで高速アクセスが可能となる。
wUnitTile = TileUnit
hUnitTile = TileUnit
Here, TileUnit is 8 or a multiple of 8 such as 16 or 32. If the tile unit is a multiple of 8, the pixel data of the tile width can be a multiple of 8 even if the pixel bitDepth is not a multiple of 8, such as 10 bits. As a result, the tile boundary is always a byte (8-bit) boundary even when arranging the tiles in the memory, and no memory gap is required between the tiles when arranging the tiles in the memory. If there is no gap, the memory for the gap is not required, and continuous transfer is possible, so that the memory size can be reduced and high-speed transfer is possible. Furthermore, if it is a multiple of 16, the tile width data can always be a multiple of 128 bits (when bitDepth = 8 bits), and high-speed access is possible with burst access of many memories (eg DDR).

さらに、16、32の場合には後述の最小CTUサイズと一致するという効果を奏する。 Furthermore, in the case of 16 and 32, there is an effect that it matches the minimum CTU size described later.

(設定方法6)
ヘッダ復号部3020は、タイルユニット識別子(tile_unit_width_idc、tile_unit_height_idc)を復号せず、所定の値TileUnitをwUnitTile、hUnitTileに設定する。所定の値TileUnitはCTUの最小サイズ(最小CTUサイズ)であることが好ましい。この場合、タイル情報tile_info()は図4(d)に替えて図23(d)のように通知され、ヘッダ復号部3020はこのタイル情報を復号する。
(Setting method 6)
The header decoding unit 3020 does not decode the tile unit identifiers (tile_unit_width_idc, tile_unit_height_idc), and sets the predetermined value TileUnit to wUnitTile, hUnitTile. The predetermined value TileUnit is preferably the minimum size of the CTU (minimum CTU size). In this case, the tile information tile_info( ) is notified as shown in FIG. 23(d) instead of FIG. 4(d), and the header decoding unit 3020 decodes this tile information.

wUnitTile = TileUnit
hUnitTile = TileUnit
TileUnit = 1<<(log2_min_luma_coding_tree_block_size_minus4+4)
ここで、log2_min_luma_coding_block_size_minus4は、CTUの最小サイズの2のべき乗表現から4を引いた値である。例えば、0、1、2、3であれば各々最小CTUサイズは、16、32、64、128である。なお最小CTUサイズを定めるlog2_min_luma_coding_block_size_minus4は
シンタックス要素として符号化データで符号化しても良いし定数でもよい。例えば定数の場合には、通例最小CTUサイズは、16、32であるため(設定方法5)と一致する。
wUnitTile = TileUnit
hUnitTile = TileUnit
TileUnit = 1<<(log2_min_luma_coding_tree_block_size_minus4+4)
Here, log2_min_luma_coding_block_size_minus4 is a value obtained by subtracting 4 from the power-of-2 representation of the minimum size of the CTU. For example, the minimum CTU sizes are 16, 32, 64, and 128 for 0, 1, 2, and 3, respectively. Note that log2_min_luma_coding_block_size_minus4, which determines the minimum CTU size, may be encoded with encoded data as a syntax element, or may be a constant. For example, in the case of a constant, the minimum CTU size is usually 16 and 32, so it matches (setting method 5).

最小CTUサイズは、動画像復号装置の機能や能力を規定するプロファイルやレベルで設定しても良い。プロファイルやレベルは、機器間のネゴーシエ―ションに用いられるため比較的上位のパラメータセットやヘッダ、例えば、SPSのシンタックス要素profile_idc、level_idcで伝送される。 The minimum CTU size may be set with a profile or level that defines the functions and capabilities of the video decoding device. Profiles and levels are used for negotiation between devices, so they are transmitted by relatively high-order parameter sets and headers, for example, SPS syntax elements profile_idc and level_idc.

タイル単位を最小CTUサイズの倍数とする場合、タイル幅は常に最小CTUサイズの倍数となる。通例、ピクチャをメモリに格納する場合にはCTUサイズの取り得る範囲が限定的である(例えば、16、32、64)であることに基づいてメモリ配置を最適化する。タイル幅がCTUサイズの整数倍(2の指数乗)であれば、ピクチャと同様の方法でタイルの場合もメモリ配置ができるので、画像を省メモリかつ高速アクセス可能となる効果を奏する。 If the tile unit is a multiple of the minimum CTU size, the tile width will always be a multiple of the minimum CTU size. Typically, memory allocation is optimized based on the limited range of possible CTU sizes (eg, 16, 32, 64) when pictures are stored in memory. If the tile width is an integer multiple (exponential power of 2) of the CTU size, memory can be allocated in the case of tiles in the same manner as for pictures, so there is an effect that memory can be saved and images can be accessed at high speed.

(設定方法7)
タイル情報は、0から所定の範囲の数のタイルユニット識別子であり、タイルの大きさの単位を最小CTUサイズの整数倍(2の指数乗)となるように、1<<(log2(最小CTUサイズ)+タイルユニット識別子)で設定する。(設定方法7)では、タイルユニット識別子は最小CTUサイズの倍数を対数表現したものである。すなわち、ヘッダ復号部3020は、tile_unit_width_idcを復号し、タイル単位を以下のように設定してもよい。
(Setting method 7)
The tile information is a tile unit identifier with a number ranging from 0 to a predetermined range, and 1<<(log2(minimum CTU size) + tile unit identifier). In (setting method 7), the tile unit identifier is a logarithmic representation of a multiple of the minimum CTU size. That is, the header decoding unit 3020 may decode tile_unit_width_idc and set the tile unit as follows.

wUnitTile = 1<<(log2CtuUnitSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CtuUnitSize+tile_unit_height_idc)
ここで、CTUの最小サイズminCTU=ctuUnitSize=1<<(log2_min_luma_coding_tree_block_size_minus4+4)、log2CtuUnitSize=log2_min_luma_coding_tree_block_size_minus4+4であってもよい。
wUnitTile = 1<<(log2CtuUnitSize+tile_unit_width_idc)
hUnitTile = 1<<(log2CtuUnitSize+tile_unit_height_idc)
Here, the minimum size of the CTU may be minCTU=ctuUnitSize=1<<(log2_min_luma_coding_tree_block_size_minus4+4), log2CtuUnitSize=log2_min_luma_coding_tree_block_size_minus4+4.

(設定方法8)
タイル情報は、0から所定の範囲の数のタイルユニット識別子であり、タイルの大きさの単位を最大CTUサイズ>>タイルユニット識別子で設定する。(設定方法8)では、タイルユニット識別子は最大CTUサイズの倍数(2のべき乗分の1倍)を対数表現したものである。すなわち、ヘッダ復号部3020は、tile_unit_width_idcを復号し、タイル単位を以下のように設定してもよい。
(Setting method 8)
The tile information is a number of tile unit identifiers ranging from 0 to a predetermined range, and the tile size unit is set by maximum CTU size >> tile unit identifier. In (setting method 8), the tile unit identifier is a logarithmic representation of a multiple of the maximum CTU size (1 times the power of 2). That is, the header decoding unit 3020 may decode tile_unit_width_idc and set the tile unit as follows.

wUnitTile = ctuUnitSize>>tile_unit_width_idc
hUnitTile = ctuUnitSize>>tile_unit_height_idc
(設定方法9)
(設定方法9)では、図24(a)に示すように、tile_parameters()およびタイル情報tile_info()をPPSではなく、SPSで通知する。図24(c)に示すように、タイルの最小単位はlog2_min_unit_tile_size_minus3で通知される。ヘッダ復号部3020はこのタイル情報を復号し、タイルの最小単位(wUnitTile、hUnitTile)を導出する。
wUnitTile = ctuUnitSize>>tile_unit_width_idc
hUnitTile = ctuUnitSize>>tile_unit_height_idc
(Setting method 9)
In (setting method 9), as shown in FIG. 24(a), tile_parameters( ) and tile information tile_info( ) are notified not by PPS but by SPS. As shown in FIG. 24(c), the minimum unit of tile is notified by log2_min_unit_tile_size_minus3. The header decoding unit 3020 decodes this tile information and derives the minimum unit of tile (wUnitTile, hUnitTile).

wUnitTile = 1<<(log2_min_unit_tile_size_minus3+3)
hUnitTile = 1<<(log2_min_unit_tile_size_minus3+3)
ここでlog2_min_unit_tile_size_minus3は、タイルの最小単位の最小値の2のべき乗表現から3を引いた値であり、0以上の整数である。従ってタイルの最小単位は8以上である。
wUnitTile = 1<<(log2_min_unit_tile_size_minus3+3)
hUnitTile = 1<<(log2_min_unit_tile_size_minus3+3)
Here, log2_min_unit_tile_size_minus3 is a value obtained by subtracting 3 from the power-of-2 expression of the minimum value of the minimum unit of the tile, and is an integer of 0 or greater. Therefore, the minimum unit of tiles is 8 or more.

また別の例として、図25(a)に示すように、タイル情報としてlog2_diff_curr_min_unit_tile_sizeのみを通知してもよい。log2_diff_curr_min_unit_tile_sizeは、当該SPSでのタイルサイズの最小単位と、CTUの最小サイズとの差分である。ヘッダ復号部3020はこの
タイル情報を復号し、タイルの最小単位(wUnitTile、hUnitTile)を導出する。
As another example, as shown in FIG. 25(a), only log2_diff_curr_min_unit_tile_size may be notified as tile information. log2_diff_curr_min_unit_tile_size is the difference between the minimum unit of tile size in the SPS and the minimum size of CTU. The header decoding unit 3020 decodes this tile information and derives the minimum unit of tile (wUnitTile, hUnitTile).

wUnitTile = 1<<( log2CtuSize + log2_diff_curr_min_unit_tile_size )
hUnitTile = 1<<( log2CtuSize + log2_diff_curr_min_unit_tile_size )
(設定方法10)
(設定方法10)では、(設定方法9)に対し、当該SPSでのタイルサイズの最小単位は当該SPSでのCTUサイズを超えない制約を設ける。従って、log2_diff_curr_min_unit_tile_sizeは下式を満たす値でなければならない。
wUnitTile = 1<<( log2CtuSize + log2_diff_curr_min_unit_tile_size )
hUnitTile = 1<<( log2CtuSize + log2_diff_curr_min_unit_tile_size )
(Setting method 10)
In (setting method 10), in contrast to (setting method 9), there is a restriction that the minimum unit of the tile size in the SPS does not exceed the CTU size in the SPS. Therefore, log2_diff_curr_min_unit_tile_size must satisfy the following formula.

0<=log2_diff_curr_min_unit_tile_size<=log2_diff_max_min_luma_coding_block_sizeここで、log2_diff_max_min_luma_coding_block_sizeは、CTUの最大および最小サイズの2のべき乗表現の差分である。 0<=log2_diff_curr_min_unit_tile_size<=log2_diff_max_min_luma_coding_block_size where log2_diff_max_min_luma_coding_block_size is the power-of-two difference between the maximum and minimum size of the CTU.

(設定方法11)
(設定方法11)では、図26に示すように、tile_parameters()およびタイル情報tile_info()をPPSで通知する。図26(a)および(d)に示すように、タイルの最小単位はSPSで通知されるCTUの最小サイズおよびPPSで通知されるタイル情報(log2_diff_curr_min_unit_tile_size)を用いて導出される。log2_diff_curr_min_unit_tile_sizeは、タイルサイズの最小単位とCTUの最小サイズとの差分である。ヘッダ復号部3020はこのタイル情報を復号し、wUnitTile、hUnitTileを導出する。
(Setting method 11)
In (setting method 11), as shown in FIG. 26, tile_parameters( ) and tile information tile_info( ) are notified by PPS. As shown in FIGS. 26(a) and (d), the minimum unit of tile is derived using the minimum size of CTU notified by SPS and the tile information (log2_diff_curr_min_unit_tile_size) notified by PPS. log2_diff_curr_min_unit_tile_size is the difference between the minimum unit of tile size and the minimum size of CTU. The header decoding unit 3020 decodes this tile information and derives wUnitTile and hUnitTile.

wUnitTile = 1<<(log2CtuSize+log2_diff_curr_min_unit_tile_size)
hUnitTile = 1<<(log2CtuSize+log2_diff_curr_min_unit_tile_size)
(設定方法12)
(設定方法12)では、independent_tiles_flagを参照してTileUnitをwUnitTile、hUnitTileを導出する。independent_tiles_flag=1、すなわち各タイルを独立(他のタイルを参照せず)に処理できる場合は、そうでない場合よりもタイルのタイル単位(最小単位)を小さく設定する。例えば、(設定方法5)において、independent_tiles_flag=1の場合は所定の値TileUnitを8に設定し、independent_tiles_flag=0の場合は所定の値TileUnitを16に設定する。
wUnitTile = 1<<(log2CtuSize+log2_diff_curr_min_unit_tile_size)
hUnitTile = 1<<(log2CtuSize+log2_diff_curr_min_unit_tile_size)
(Setting method 12)
In (setting method 12), the independent_tiles_flag is referenced to derive wUnitTile and hUnitTile for TileUnit. independent_tiles_flag = 1, ie if each tile can be processed independently (without referring to other tiles), set the tile unit (minimum unit) smaller than otherwise. For example, in (setting method 5), the predetermined value TileUnit is set to 8 when independent_tiles_flag=1, and set to 16 when independent_tiles_flag=0.

また別の例として、(設定方法6)において、independent_tiles_flag=1の場合は所定の値TileUnitをCTUの最小サイズ(最小CTUサイズ)以下の値に設定し、independent_tiles_flag=0の場合は所定の値TileUnitをCTUの最小サイズ(最小CTUサイズ)に設定する。 As another example, in (setting method 6), when independent_tiles_flag=1, a predetermined value TileUnit is set to a value equal to or less than the minimum size of the CTU (minimum CTU size), and when independent_tiles_flag=0, a predetermined value TileUnit to the minimum size of the CTU (minimum CTU size).

また別の例として、(設定方法6)において、independent_tiles_flag=1の場合は所定の値TileUnitをCTUサイズ以下の値に設定し、independent_tiles_flag=0の場合は所定の値TileUnitをCTUサイズに設定する。例えば、independent_tiles_flag=1の場合は所定の値TileUnitを8、16、32の何れか、0の場合にはCTUサイズを用いる。 As another example, in (setting method 6), when independent_tiles_flag=1, the predetermined value TileUnit is set to a value equal to or smaller than the CTU size, and when independent_tiles_flag=0, the predetermined value TileUnit is set to the CTU size. For example, if independent_tiles_flag=1, a predetermined value TileUnit of 8, 16, or 32 is used, and if 0, the CTU size is used.

あるいは、別の例として、(設定方法6)において、independent_tiles_flag=1の場合は所定の値TileUnitをCTUの最小サイズ(最小CTUサイズ)に設定し、independent_tiles_flag=0の場合は所定の値TileUnitをCTUサイズに設定する。 Alternatively, as another example, in (setting method 6), if independent_tiles_flag = 1, a predetermined value TileUnit is set to the minimum size of the CTU (minimum CTU size), and if independent_tiles_flag = 0, the predetermined value TileUnit is set to the CTU set to size.

independent_tiles_flagが1、すなわち、互いに参照することなく、独立に復号されるタイルでは、タイル同士を独立にメモリ配置できる(すなわち、タイル間にメモリ上のギャップが発生しても問題ない)ため、小さな値であってもメモリ配置に問題が生じない。これにより独立復号可能な領域の場合には、フレキシブルにタイルサイズを決定できるという効果を奏する。 If independent_tiles_flag is 1, that is, tiles that are decoded independently without referring to each other, the tiles can be arranged in memory independently (that is, there is no problem if memory gaps occur between tiles), so a small value However, there is no problem with memory allocation. As a result, in the case of independently decodable areas, the tile size can be determined flexibly.

(設定方法13)
(設定方法13)では、所定の値TileUnitを他の処理の単位に合わせて設定する。例えば予測の単位(サブCU)を所定の値TileUnitとして設定する。あるいはTMVP用に動きベクトルを格納する単位を所定の値TileUnitとして設定する。例えば、TMVP用の動きベクトル格納単位が8x8の場合、TileUnit=8に設定する。あるいは量子化パラメータを更新する単位を所定の値TileUnitとして設定する。例えば、差分量子化パラメータを通知する単位が16x16の場合、TileUnit=16に設定する。
(Setting method 13)
In (setting method 13), the predetermined value TileUnit is set according to the unit of other processing. For example, a prediction unit (sub CU) is set as a predetermined value TileUnit. Alternatively, the unit for storing motion vectors for TMVP is set as a predetermined value TileUnit. For example, if the motion vector storage unit for TMVP is 8x8, set TileUnit=8. Alternatively, the unit for updating the quantization parameter is set as a predetermined value TileUnit. For example, if the unit for reporting the differential quantization parameter is 16x16, set TileUnit=16.

(設定方法14)
(設定方法14)では、所定の値TileUnitを、タイルの水平方向については最小CTUサイズの整数倍ctuSize、垂直方向については8もしくは16に設定する。ヘッダ復号部3020はこのタイル情報を復号する。例えば下式でタイルの最小単位を設定する。
(Setting method 14)
In (setting method 14), the predetermined value TileUnit is set to an integral multiple ctuSize of the minimum CTU size in the horizontal direction of the tile, and 8 or 16 in the vertical direction. The header decoding unit 3020 decodes this tile information. For example, use the following formula to set the minimum unit of tiles.

wUnitTile = ctuSize
hUnitTile = 8
(タイル情報設定部)
タイル情報設定部は、タイルの最小単位wUnitTile、hUnitTileに基づいて、タイルの左上座標(xTile, yTile)を設定する。さらに、タイル情報設定部は、タイルのCTU単位の幅tileWidthInCtus(=TileWidthInCtbsY)と高さtileHeightInCtus(=TileHeightInCtbsY)を設定する。
wUnitTile = ctuSize
hUnitTile = 8
(Tile information setting part)
The tile information setting unit sets the upper left coordinates (xTile, yTile) of the tile based on the minimum units wUnitTile and hUnitTile of the tile. Further, the tile information setting unit sets the width tileWidthInCtus (=TileWidthInCtbsY) and the height tileHeightInCtus (=TileHeightInCtbsY) in CTU units of the tile.

(ステップ1)
タイルの最小単位wUnitTile、hUnitTileと画面幅wPict、hPictから、タイル単位(wUnitTile, hUnitTile)での画面幅wPictInUnitTile, hPictInUnitTileを導出する。
(Step 1)
The screen widths wPictInUnitTile and hPictInUnitTile in tile units (wUnitTile, hUnitTile) are derived from the minimum tile units wUnitTile and hUnitTile and the screen widths wPict and hPict.

wPictInUnitTile = divRoundUp(wPict,wUnitTile)
hPictInUnitTile = divRoundUp(hPict,hUnitTile)
ここでdivRoundUp(x,y) = (x+y-1)/y
つまり、xをyで除算した値以上の最小の整数を返す。すなわち、ceil(x/y)としてもよい。
wPictInUnitTile = divRoundUp(wPict,wUnitTile)
hPictInUnitTile = divRoundUp(hPict,hUnitTile)
where divRoundUp(x,y) = (x+y-1)/y
That is, it returns the smallest integer greater than or equal to x divided by y. That is, it may be ceil(x/y).

(ステップ2)
タイル情報設定部は、タイル単位の位置(col, row)で示されるタイルのピクチャ内の左上座標(xTile, yTile)を導出する。以下、ピクチャ内の座標とは、ピクチャ左上を(0, 0)とするピクチャ座標系の座標であり、タイル内の座標とは、各タイルの左上を(0, 0)とするタイル座標系の座標を意味する。タイルのコラム位置colを0からタイルのコラム数numTileColumns-1までループし、最小単位wUnitTileを用いて、各colの各タイルのX座標tx[col]と幅tw[col]を導出する。同様に、タイルのrow位置rowを0からタイルのrow数numTileRows-1までループし、最小単位hUnitTileを用いて、各rowの各タイルのY座標ty[row]と高さth[row]を導出する。
(Step 2)
The tile information setting unit derives the upper left coordinate (xTile, yTile) in the picture of the tile indicated by the tile position (col, row). Below, the coordinates within a picture are those in the picture coordinate system where the top left of the picture is (0, 0), and the coordinates within a tile are those in the tile coordinate system where the top left of each tile is (0, 0). means coordinates. Loop the tile column position col from 0 to the tile column number numTileColumns-1, and use the minimum unit wUnitTile to derive the X coordinate tx[col] and width tw[col] of each tile of each col. Similarly, loop the tile row position row from 0 to the number of tile rows numTileRows-1, and use the minimum unit hUnitTile to derive the Y coordinate ty[row] and height th[row] of each tile in each row. do.

タイル情報設定部は、uniform_spacing_flagが1の場合には、画面をnumTileColumns x
numTileRows (= M x N)にタイル分割し、タイルサイズtw[col]、th[row]とタイルのX座標tx[col]、Y座標ty[row]を導出する。具体的には、以下の擬似コードのように、ピクチャの幅wPict、タイルのコラム数numTileColumnsを用いて、tx[col]、tw[col]を導出し、ピクチャの幅hPict、タイルのコラム数numTileRowsを用いて、ty[row]、th[row]を導出する。tyおよびtwは、前出のhTileおよびwTileとして先に求めておいた値を用いてもよい。なお、wPict-tx[col]とtw[col]についてmin()を適用しているのは、タイルが画面端を超える大きさにならないようにするためである。
When uniform_spacing_flag is 1, the tile information setting part divides the screen into numTileColumns x
Tiles are divided into numTileRows (= M x N), and tile sizes tw[col], th[row], tile X coordinates tx[col], Y coordinates ty[row] are derived. Specifically, as shown in the pseudo code below, the picture width wPict and the number of tile columns numTileColumns are used to derive tx[col] and tw[col], the picture width hPict and the number of tile columns numTileRows to derive ty[row] and th[row]. For ty and tw, the values previously obtained as the aforementioned hTile and wTile may be used. Note that min() is applied to wPict-tx[col] and tw[col] so that the tiles do not exceed the edge of the screen.

for(col=0; col < numTileColumns; col++)
{
tx[col] = wUnitTile*(col*wPictInUnitTile/numTileColumns)
tw[col] = wUnitTile*((col+1)*wPictInUnitTile/numTileColumns)-tx[col]
tw[col] = min(wPict-tx[col],tw[col])
}
for(row=0; row < numTileRows; row++)
{
ty[row] = hUnitTile*(row*hPictInUnitTile/numTileRows)
th[row] = hUnitTile*((row+1)*hPictInUnitTile/numTileRows)-ty[row]
th[row] = min(hPict-ty[row],th[row])
}
タイル情報設定部は、uniform_spacing_flagが0の場合には、タイルサイズwTile(col), hTile(row)を用いて画面を分割しタイルのX座標tx[col]、Y座標ty[row]を導出する。
具体的には、以下の擬似コードのように、ピクチャの幅wPictとタイルのコラム幅wTile[col]を用いて、tx[col]を導出し、ピクチャの高さhPict、タイルのロウ高さhTile[row]を用いて、ty[row]を導出する。
for(col=0; col <numTileColumns; col++)
{
tx[col] = wUnitTile*(col*wPictInUnitTile/numTileColumns)
tw[col] = wUnitTile*((col+1)*wPictInUnitTile/numTileColumns)-tx[col]
tw[col] = min(wPict-tx[col],tw[col])
}
for(row=0; row <numTileRows; row++)
{
ty[row] = hUnitTile*(row*hPictInUnitTile/numTileRows)
th[row] = hUnitTile*((row+1)*hPictInUnitTile/numTileRows)-ty[row]
th[row] = min(hPict-ty[row],th[row])
}
When the uniform_spacing_flag is 0, the tile information setting unit divides the screen using the tile sizes wTile(col) and hTile(row) and derives the X coordinate tx[col] and Y coordinate ty[row] of the tile. .
Specifically, as shown in the pseudocode below, the picture width wPict and the tile column width wTile[col] are used to derive tx[col], the picture height hPict, and the tile row height hTile Use [row] to derive ty[row].

for(col=0;col<numTileColumns-1;col++)
{
tw[col] = wTile[col] = (column_width_in_unit_minus1[col]+1)*wUnitTile
tx[col+1] = tx[col]+tw[col]
}
tw[numTileColumns-1] = wPict-tx[numTileColumns-1]
for(row=0;row<numTileRows-1;row++)
{
th[row] = hTile[row] = (column_height_in_unit_minus1[row]+1)*hUnitTile
ty[row+1] = ty[row]+th[row]
}
th[numTileRows-1] = hPict-ty[numTileRows-1]
タイル情報設定部は、導出されたタイルのX座標tx[col]、Y座標ty[row]とタイルサイズtw[col]、th[row]を、タイルIDで示されるタイルのピクチャ内左上座標xTile[TileId]、yTile[TileId]、タイルサイズwTile[TileId]、hTile[TileId]に格納する。
for(col=0;col<numTileColumns-1;col++)
{
tw[col] = wTile[col] = (column_width_in_unit_minus1[col]+1)*wUnitTile
tx[col+1] = tx[col]+tw[col]
}
tw[numTileColumns-1] = wPict-tx[numTileColumns-1]
for(row=0;row<numTileRows-1;row++)
{
th[row] = hTile[row] = (column_height_in_unit_minus1[row]+1)*hUnitTile
ty[row+1] = ty[row]+th[row]
}
th[numTileRows-1] = hPict-ty[numTileRows-1]
The tile information setting unit converts the derived tile X coordinate tx[col], Y coordinate ty[row] and tile size tw[col], th[row] to the upper left coordinate xTile in the picture of the tile indicated by the tile ID. Store in [TileId], yTile[TileId], tile size wTile[TileId], hTile[TileId].

for(row=0;row<numTileRows;row++)
{
for(col=0;col<numTileColumns;col++)
{
TileId = row*numTileColumns+col
xTile[TileId] = tx[col]
yTile[TileId] = ty[row]
wTile[TileId] = tw[col]
hTile[TileId] = th[row]
tileWidthInCtus[TileId] = divRoundUp(tw[col],ctuWidth)
tileHeightInCtus[TileId] = divRoundUp(th[row],ctuHeight)
}
}
for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1;i++)
PicWidthInCtbsY += tileWidthInCtus[i]
for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1;j++)
PicHeightInCtbsY += tileHeightInCtus[j)]
なお、以下の表現でも一時変数は異なるが同じ動作であるのでタイル情報設定部は、以下の動作を行ってもよい。
for(row=0;row<numTileRows;row++)
{
for(col=0;col<numTileColumns;col++)
{
TileId = row*numTileColumns+col
xTile[TileId] = tx[col]
yTile[TileId] = ty[row]
wTile[TileId] = tw[col]
hTile[TileId] = th[row]
tileWidthInCtus[TileId] = divRoundUp(tw[col],ctuWidth)
tileHeightInCtus[TileId] = divRoundUp(th[row],ctuHeight)
}
}
for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1;i++)
PicWidthInCtbsY += tileWidthInCtus[i]
for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1;j++)
PicHeightInCtbsY += tileHeightInCtus[j)]
It should be noted that the tile information setting unit may perform the following operations because the operation is the same even though the temporary variables are different in the expressions below.

if (uniform_spacing_flag) {
for (i=0; i<= num_tile_columns_minus1;i++)
colWidth[i] = ((i+1)*wPictInUnitTile)/(num_tile_columns_minus1+1)-(i*hPictInUnitTile)/(num_tile_columns_minus1+1))
for (j=0; j<= num_tile_rows_minus1;j++)
rowHeight[j] = ((j+1)*hPictInUnitTile)/(num_tile_rows_minus1+1)-(j*hPictInUnitTile)/(num_tile_rows_minus1+1))
else {
colWidth[num_tile_columns_minus1] = wPictInUnitTile
for (i=0; i<= num_tile_columns_minus1;i++) {
colWidth[i] = column_width_minus1[i]+1
colWidth[num_tile_columns_minus1]-=colWidth[i]
}
rowHeight [num_tile_rows_minus1] = hPictInUnitTile
for (j=0; j<= num_tile_rows_minus1;j++) {
rowHeight[j] = row_height_minus1[j]+1
rowHeight[num_tile_rows_minus1]-=rowHeight[j]
}
}
}
for (colX[0]=0,i=0; i <= num_tile_columns_minus1; i++)
colX[i+1] = colX[i]+colWidth[i]*wUnitTile
for (colY[0]=0,j=0; j <= num_tile_rows_minus1; j++)
colY[j+1] = colY[j]+colRow[j]*hUnitTile
for (colBd[0]=0,i=0; i <= num_tile_columns_minus1; i++)
colBd[i+1] = colBd[i]+Ceil(colWidth[i]*wUnitTile÷ctuWidth)
for (rowBd[0]=0,j=0; j <= num_tile_rows_minus1;j++)
rowBd[j+1] = rowBd[j]+Ceil(rowHeight[j]*hUnitTile÷ctuHeight)
for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1; i++)
PicWidthInCtbsY += Ceil(colWidth[i]*TileUnitSizeY÷ctuSize)
for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1; j++)
PicHeightInCtbsY += Ceil(rowHeight[j]*TileUnitSizeY÷ctuSize)
なお、画面全体において以下のように導出しても良い。
if (uniform_spacing_flag) {
for (i=0; i<= num_tile_columns_minus1;i++)
colWidth[i] = ((i+1)*wPictInUnitTile)/(num_tile_columns_minus1+1)-(i*hPictInUnitTile)/(num_tile_columns_minus1+1))
for (j=0; j<= num_tile_rows_minus1;j++)
rowHeight[j] = ((j+1)*hPictInUnitTile)/(num_tile_rows_minus1+1)-(j*hPictInUnitTile)/(num_tile_rows_minus1+1))
else {
colWidth[num_tile_columns_minus1] = wPictInUnitTile
for (i=0; i<= num_tile_columns_minus1;i++) {
colWidth[i] = column_width_minus1[i]+1
colWidth[num_tile_columns_minus1]-=colWidth[i]
}
rowHeight[num_tile_rows_minus1] = hPictInUnitTile
for (j=0; j<= num_tile_rows_minus1;j++) {
rowHeight[j] = row_height_minus1[j]+1
rowHeight[num_tile_rows_minus1]-=rowHeight[j]
}
}
}
for (colX[0]=0,i=0; i <= num_tile_columns_minus1; i++)
colX[i+1] = colX[i]+colWidth[i]*wUnitTile
for (colY[0]=0,j=0; j <= num_tile_rows_minus1; j++)
colY[j+1] = colY[j]+colRow[j]*hUnitTile
for (colBd[0]=0,i=0; i <= num_tile_columns_minus1; i++)
colBd[i+1] = colBd[i]+Ceil(colWidth[i]*wUnitTile÷ctuWidth)
for (rowBd[0]=0,j=0; j <= num_tile_rows_minus1;j++)
rowBd[j+1] = rowBd[j]+Ceil(rowHeight[j]*hUnitTile÷ctuHeight)
for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1; i++)
PicWidthInCtbsY += Ceil(colWidth[i]*TileUnitSizeY÷ctuSize)
for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1;j++)
PicHeightInCtbsY += Ceil(rowHeight[j]*TileUnitSizeY÷ctuSize)
In addition, you may derive as follows in the whole screen.

for(i = 0; i < NumTilesInPic; i++ ) {
col = i % ( num_tile_columns_minus1 + 1 )
row = i / ( num_tile_columns_minus1 + 1 )
TileWidth [ i ] = colWidth[ col ] * TileUnitSizeY
TileHeight [ i ] = rowHeight[ row ] * TileUnitSizeY
TileWidthInCtbsY[ i ] = Ceil( wTile [ i ] ÷ ctuSize )
TileHeightInCtbsY[ i ] = Ceil( hTile [ i ] ÷ ctuSize )
TileX[ i ] = TileColX[ col ]
TileY[ i ] = TileRowY[ row ]
TileXInCtbsY[ i ] = colBd[ col ]
TileYInCtbsY[ i ] = rowBd[ row ]
}
ここでTileUnitSizeY=wUnitTile=hUnitTile
上記により、スライスデータ(slice_segment_data())では、図4(b)で示すPPSで通知したタイル情報を用いて、ピクチャ上の(xTile,yTile)の位置から始まるタイルの情報をCTU単位で通知する。具体的には、ピクチャ上の(xTile,yTile)から始まる各タイルの左上座標(0,0)として、タイルを、CTU(幅ctuWidth、高さctuHeight)に分割し、各CTUの符号化データcoding_quadtree()を通知してもよい。
for(i = 0; i <NumTilesInPic; i++ ) {
col = i % ( num_tile_columns_minus1 + 1 )
row = i / ( num_tile_columns_minus1 + 1 )
TileWidth[i] = colWidth[col] * TileUnitSizeY
TileHeight[ i ] = rowHeight[ row ] * TileUnitSizeY
TileWidthInCtbsY[i] = Ceil(wTile[i] ÷ ctuSize)
TileHeightInCtbsY[ i ] = Ceil( hTile [ i ] ÷ ctuSize )
TileX[i] = TileColX[col]
TileY[i] = TileRowY[row]
TileXInCtbsY[ i ] = colBd[ col ]
TileYInCtbsY[ i ] = rowBd[ row ]
}
where TileUnitSizeY=wUnitTile=hUnitTile
As described above, slice data (slice_segment_data()) uses the tile information notified by the PPS shown in FIG. . Specifically, each tile is divided into CTUs (width ctuWidth, height ctuHeight) as the upper left coordinates (0, 0) of each tile starting from (xTile, yTile) on the picture, and the coded data of each CTU coding_quadtree () may be notified.

ヘッダ復号部3020は、外部から入力され、NAL(network abstraction layer)ユニット単位で符号化された符号化ストリームTeからヘッダ情報を復号する。また、ヘッダ復号部3020は、外部から入力された、ディスプレイ等に表示すべき画像領域を示す制御情報から、表示に必要なタイル(TileId)を導出する。また、ヘッダ復号部3020は、符号化ストリームTeから表示に必要な符号化タイルを抽出する。符号化タイルは、符号化データ中のシンタックスに従って、CT情報復号部3021によってCTUに分割され処理される。タイル情報は、具体的には、num_tile_columns_minus1、num_tile_rows_minus1、uniform_spacing_flag、column_width_in_unit_minus1[i]、row_height_in_unit_minus1[i]等のシンタックスから算出した、タイルの水平方向の個数M、垂直方向の個数N、タイルの幅wTile[m]と高さhTile[n]等である。 The header decoding unit 3020 decodes header information from an encoded stream Te that is input from the outside and encoded in units of NAL (network abstraction layer) units. Also, the header decoding unit 3020 derives a tile (TileId) necessary for display from externally input control information indicating an image area to be displayed on a display or the like. Also, the header decoding unit 3020 extracts encoded tiles necessary for display from the encoded stream Te. The encoded tiles are divided into CTUs and processed by the CT information decoding unit 3021 according to the syntax in the encoded data. Specifically, the tile information is calculated from syntax such as num_tile_columns_minus1, num_tile_rows_minus1, uniform_spacing_flag, column_width_in_unit_minus1[i], row_height_in_unit_minus1[i], etc. [m] and height hTile[n] and so on.

図11はCTUサイズの整数倍以外でタイルを分割する例である。図11(a)は、本実施形態の技術であって、1920x1080のHD画像を4x3のタイルに分割する図である。本実施形態では4x3のタイルに分割する時に、全タイルを等サイズに分割できる(480x360に分割される)ため、複数のプロセッサやハードウェアに等しくロードバランスできる効果を有する。タイルサイズはピクチャ境界にかかわらずCTUの整数倍以外のサイズをとることが可能である。図11(b)は各タイルのCTU分割を表す図である。CTUに分割する際、タイルサイズがCTUサイズの整数倍でない場合は、タイルの外側にクロップオフセット領域を設ける。特にTILE Bに示すように、CTUは各タイルの左上を基準として分割される。したがって、CTUの左上座標は、CTUサイズの整数倍に限定されない。 FIG. 11 is an example of dividing tiles by non-integer multiples of the CTU size. FIG. 11(a) is a diagram of the technology of the present embodiment, in which a 1920×1080 HD image is divided into 4×3 tiles. In this embodiment, when dividing into 4x3 tiles, all tiles can be divided into equal sizes (divided into 480x360), so there is an effect of equally load-balancing a plurality of processors and hardware. Tile sizes can be other than integer multiples of CTU regardless of picture boundaries. FIG. 11(b) is a diagram showing CTU division of each tile. When dividing into CTUs, if the tile size is not an integral multiple of the CTU size, a crop offset area is provided outside the tiles. Specifically, as shown in TILE B, the CTU is split relative to the top left of each tile. Therefore, the upper left coordinate of the CTU is not limited to integer multiples of the CTU size.

図12は、さらに各タイルをCTU分割する場合を示す図である。図ではピクチャを2x2のタイルに分割するが、各タイルはさらにCTUに分割される。本実施形態では図に示す通り、各タイルをCTUに分割するにあたって、タイルの左上からCTUを開始するように分割を行う。したがってタイルは右側及び下側において、CTUサイズの整数倍以外の位置で終端することがあるが、タイルの左側および上側においてはCTU境界とタイル境界は一致する。 FIG. 12 is a diagram showing a case where each tile is further divided into CTUs. The picture divides the picture into 2x2 tiles, but each tile is further divided into CTUs. In this embodiment, as shown in the figure, when dividing each tile into CTUs, the division is performed so that the CTUs start from the upper left corner of the tile. Therefore, on the right and bottom sides of the tiles, the tiles may end at positions other than integer multiples of the CTU size, but on the left and top sides of the tiles, the CTU and tile boundaries coincide.

(符号化ツリーユニット)
図1(e)には、処理対象のCTUを復号するために動画像復号装置31が参照するデータの集合が規定されている。CTUは、再帰的な4分木分割(QT(Quad Tree)分割)、2分木分割(BT(Binary Tree)分割)あるいは3分木分割(TT(Ternary Tree)分割)により符号化処理の基本的な単位である符号化ユニットCUに分割される。BT分割とTT分割を合わせてマルチツリー分割(MT(Multi Tree)分割)と呼ぶ。再帰的な4分木分割により得られる木構造のノードのことを符号化ノード(Coding Node)と称する。4分木、2分木、及び3分木の中間ノードは、符号化ノードであり、CTU自身も最上位の符号化ノードとして規定される。QT分割、BT分割、TT分割を合わせてCT分割と呼ぶ。
(encoding tree unit)
FIG. 1(e) defines a set of data that the video decoding device 31 refers to in order to decode the CTU to be processed. CTU uses recursive quad tree partitioning (QT (Quad Tree) partitioning), binary tree partitioning (BT (Binary Tree) partitioning), or ternary tree partitioning (TT (Ternary Tree) partitioning) as the basis of coding processing. It is divided into coding units CU, which are similar units. BT partitioning and TT partitioning are collectively called multi-tree partitioning (MT (Multi Tree) partitioning). A node of a tree structure obtained by recursive quadtree partitioning is called a coding node. Intermediate nodes of quadtrees, binary trees, and ternary trees are coding nodes, and the CTU itself is defined as a top-level coding node. QT division, BT division, and TT division are collectively called CT division.

CTは、CT情報として、QT分割を行うか否かを示すQT分割フラグ(cu_split_flag)、MT分割の分割方法を示すMT分割モード(split_mt_mode)、MT分割の分割方向を示すMT分割方向(split_mt_dir)、MT分割の分割タイプを示すMT分割タイプ(split_mt_type)を含む。cu_split_flag、split_mt_flag、split_mt_dir、split_mt_type は符号化ノード毎に伝送される。 CT includes, as CT information, a QT splitting flag (cu_split_flag) indicating whether to perform QT splitting, an MT splitting mode (split_mt_mode) indicating a splitting method of MT splitting, and an MT splitting direction (split_mt_dir) indicating the splitting direction of MT splitting. , including an MT split type (split_mt_type) that indicates the split type of the MT split. cu_split_flag, split_mt_flag, split_mt_dir and split_mt_type are transmitted for each encoding node.

cu_split_flagが1の場合、符号化ノードは4つの符号化ノードに分割される(図2(b))。cu_split_flagが0の時、split_mt_flagが0の場合に符号化ノードは分割されず1つのCUをノードとして持つ(図2(a))。CUは符号化ノードの末端ノードであり、これ以上分割されない。CUは、符号化処理の基本的な単位となる。 If cu_split_flag is 1, the encoding node is split into four encoding nodes (FIG. 2(b)). When cu_split_flag is 0 and split_mt_flag is 0, the encoding node is not split and has one CU as a node (Fig. 2(a)). A CU is a terminal node of an encoding node and is not split any further. A CU is a basic unit of encoding processing.

split_mt_flagが1の場合に符号化ノードは以下のようにMT分割される。split_mt_typeが0の時、split_mt_dirが1の場合に符号化ノードは2つの符号化ノードに水平分割され(図2(d))、split_mt_dirが0の場合に符号化ノードは2つの符号化ノードに垂直分割される(図2(c))。また、split_mt_typeが1の時、split_mt_dirが1の場合に符号化ノードは3つの符号化ノードに水平分割され(図2(f))、split_mt_dirが0の場合に符号化ノードは3つの符号化ノードに垂直分割される(図2(e))。 When split_mt_flag is 1, the coding node is MT-split as follows. When split_mt_type is 0, the encoding node is split horizontally into two encoding nodes when split_mt_dir is 1 (Fig. 2(d)), and when split_mt_dir is 0, the encoding node is vertically split into two encoding nodes. It is divided (Fig. 2(c)). When split_mt_type is 1 and split_mt_dir is 1, the encoding node is horizontally split into 3 encoding nodes (Fig. 2(f)). (Fig. 2(e)).

また、CTUのサイズが64x64画素の場合には、CUのサイズは、64x64画素、64x32画素、32x64画素、32x32画素、64x16画素、16x64画素、32x16画素、16x32画素、16x16画素、64x8画素、8x64画素、32x8画素、8x32画素、16x8画素、8x16画素、8x8画素、64x4画素、4x64画素、32x4画素、4x32画素、16x4画素、4x16画素、8x4画素、4x8画素、及び、4x4画素の何れかをとり得る。 If the CTU size is 64x64 pixels, the CU size is 64x64 pixels, 64x32 pixels, 32x64 pixels, 32x32 pixels, 64x16 pixels, 16x64 pixels, 32x16 pixels, 16x32 pixels, 16x16 pixels, 64x8 pixels, 8x64 pixels. , 32x8 pixels, 8x32 pixels, 16x8 pixels, 8x16 pixels, 8x8 pixels, 64x4 pixels, 4x64 pixels, 32x4 pixels, 4x32 pixels, 16x4 pixels, 4x16 pixels, 8x4 pixels, 4x8 pixels, and 4x4 pixels. .

(符号化ユニット)
図1(f)に示すように、処理対象の符号化ユニットを復号するために動画像復号装置31が参照するデータの集合が規定されている。具体的には、CUは、CUヘッダCUH、予測パラメータ、変換パラメータ、量子化変換係数等から構成される。CUヘッダでは予測モード等が規定される。
(encoding unit)
As shown in FIG. 1(f), a set of data referred to by the moving picture decoding device 31 for decoding the encoding unit to be processed is defined. Specifically, a CU is composed of a CU header CUH, prediction parameters, transform parameters, quantized transform coefficients, and the like. A prediction mode and the like are defined in the CU header.

予測処理は、CU単位で行われる場合と、CUをさらに分割したサブCU単位で行われる場合がある。CUとサブCUのサイズが等しい場合には、CU中のサブCUは1つである。CUがサブCUのサイズよりも大きい場合、CUは、サブCUに分割される。たとえばCUが8x8、サブCUが4x4の場合、CUは水平2分割、垂直2分割からなる、4つのサブCUに分割される。 Prediction processing may be performed in units of CUs or may be performed in units of sub-CUs obtained by further dividing a CU. If the CU and sub-CU sizes are equal, there is one sub-CU in the CU. If the CU is larger than the sub-CU size, the CU is split into sub-CUs. For example, if the CU is 8x8 and the sub-CU is 4x4, the CU is divided into 4 sub-CUs consisting of 2 horizontal divisions and 2 vertical divisions.

予測の種類(予測モード)は、イントラ予測と、インター予測の2つがある。イントラ予測は、同一ピクチャ内の予測であり、インター予測は、互いに異なるピクチャ間(例えば、表示時刻間、レイヤ画像間)で行われる予測処理を指す。 There are two types of prediction (prediction mode): intra prediction and inter prediction. Intra prediction is prediction within the same picture, and inter prediction is prediction processing performed between different pictures (for example, between display times, between layer images).

変換・量子化処理はCU単位で行われるが、量子化変換係数は4x4等のサブブロック単位でエントロピー符号化してもよい。 Transformation/quantization processing is performed in units of CUs, but the quantized transform coefficients may be entropy-encoded in units of subblocks such as 4x4.

(予測パラメータ)
予測画像は、ブロックに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測とインター予測の予測パラメータがある。
(prediction parameter)
A predicted image is derived from the prediction parameters associated with the block. The prediction parameters include prediction parameters for intra prediction and inter prediction.

(動画像復号装置の構成)
本実施形態に係る動画像復号装置31(図5)の構成について説明する。
(Configuration of video decoding device)
The configuration of the video decoding device 31 (FIG. 5) according to this embodiment will be described.

動画像復号装置31は、パラメータ復号部(予測画像復号装置)302、ループフィルタ305、参照ピクチャメモリ306、予測パラメータメモリ307、予測画像生成部(予測画像生成装置)308、逆量子化・逆変換部311、及び加算部312を含んで構成される。なお、後述の動画像符号化装置11に合わせ、動画像復号装置31にループフィルタ305が含まれない構成もある。パラメータ復号部302は、さらに、エントロピー復号部301、ヘッダ復号部3020、CT情報復号部3021、及びCU復号部3022(予測モード復号部)を備えており、CU復号部3022はさらにTU復号部3024を備えている。 The video decoding device 31 includes a parameter decoding unit (predictive image decoding device) 302, a loop filter 305, a reference picture memory 306, a prediction parameter memory 307, a predicted image generating unit (predictive image generating device) 308, inverse quantization/inverse transform. It includes a unit 311 and an addition unit 312 . Note that the moving image decoding device 31 may have a configuration in which the loop filter 305 is not included in accordance with the moving image encoding device 11 described later. The parameter decoding unit 302 further includes an entropy decoding unit 301, a header decoding unit 3020, a CT information decoding unit 3021, and a CU decoding unit 3022 (prediction mode decoding unit). It has

(復号モジュール)
以下、各モジュールの概略動作を説明する。パラメータ復号部302はヘッダ情報、分割情報、予測情報、量子化変換係数等のパラメータの復号処理を行う。
(decryption module)
The general operation of each module will be described below. A parameter decoding unit 302 decodes parameters such as header information, division information, prediction information, and quantized transform coefficients.

エントロピー復号部301は、バイナリデータからシンタックス要素を復号する。エントロピー復号部301は、より具体的には、供給元から供給されるシンタックス要素に基づいて、CABAC等のエントロピー符号化方式による符号化データから、シンタックス要素を復号して供給元に返す。以下に示す例では、シンタックス要素の供給元は、CT情報復号部3021、CU復号部3022である。 The entropy decoding unit 301 decodes syntax elements from binary data. More specifically, the entropy decoding unit 301 decodes syntax elements from data encoded by an entropy encoding method such as CABAC based on the syntax elements supplied from the supply source and returns them to the supply source. In the example shown below, the supply sources of the syntax elements are the CT information decoding unit 3021 and the CU decoding unit 3022.

(基本フロー)
図6は、動画像復号装置31の概略的動作を説明するフローチャートである。
(Basic flow)
FIG. 6 is a flow chart for explaining a schematic operation of the video decoding device 31. As shown in FIG.

(S1100:パラメータセット情報復号)ヘッダ復号部3020は、符号化データからVPS、SPS、PPSなどのパラメータセット情報を復号する。 (S1100: Parameter Set Information Decoding) Header decoding section 3020 decodes parameter set information such as VPS, SPS, and PPS from encoded data.

(S1200:スライス情報復号)ヘッダ復号部3020は、符号化データからスライスヘッダ(スライス情報)を復号する。 (S1200: Slice Information Decoding) Header decoding section 3020 decodes the slice header (slice information) from the encoded data.

以下、動画像復号装置31は、対象ピクチャに含まれる各CTUについて、S1300からS5000の処理を繰り返すことにより各CTUの復号画像を導出する。 Thereafter, video decoding device 31 derives a decoded image of each CTU by repeating the processing from S1300 to S5000 for each CTU included in the target picture.

(S1300:CTU情報復号)CT情報復号部3021は、符号化データからCTUを復号する。 (S1300: CTU Information Decoding) CT information decoding section 3021 decodes CTU from encoded data.

(S1400:CT情報復号)CT情報復号部3021は、符号化データからCTを復号する。 (S1400: CT Information Decoding) CT information decoding section 3021 decodes CT from encoded data.

(S1500:CU復号)CU復号部3022はS1510、S1520を実施して、符号化データからCUを復号する。 (S1500: CU Decoding) CU decoding section 3022 executes S1510 and S1520 to decode CU from encoded data.

(S1510:CU情報復号)CU復号部3022は、符号化データからCU情報、予測情報、TU分割フラグsplit_transform_flag、CU残差フラグcbf_cb、cbf_cr、cbf_luma等を復号する。 (S1510: CU information decoding) CU decoding section 3022 decodes CU information, prediction information, TU split flag split_transform_flag, CU residual flag cbf_cb, cbf_cr, cbf_luma, etc. from encoded data.

(S1520:TU情報復号)TU復号部3024は、TUに予測誤差が含まれている場合に、符号化データからQP更新情報(量子化補正値)と量子化予測誤差(residual_coding)を復号する。なお、QP更新情報は、量子化パラメータQPの予測値である量子化パラメータ予測値qPpredからの差分値である。 (S1520: TU information decoding) TU decoding section 3024 decodes QP update information (quantization correction value) and quantization prediction error (residual_coding) from encoded data when prediction error is included in TU. Note that the QP update information is a difference value from the quantization parameter prediction value qPpred, which is the prediction value of the quantization parameter QP.

(S2000:予測画像生成)予測画像生成部308は、対象CUに含まれる各ブロックについて、予測情報に基づいて予測画像を生成する。 (S2000: Generate Predicted Image) The predicted image generation unit 308 generates a predicted image for each block included in the target CU based on the prediction information.

(S3000:逆量子化・逆変換)逆量子化・逆変換部311は、対象CUに含まれる各TUについて、逆量子化・逆変換処理を実行する。 (S3000: Inverse Quantization/Inverse Transform) The inverse quantization/inverse transform unit 311 executes inverse quantization/inverse transform processing for each TU included in the target CU.

(S4000:復号画像生成)加算器312は、予測画像生成部308より供給される予測画像と、逆量子化・逆変換部311より供給される予測誤差とを加算することによって、対象CUの復号画像を生成する。 (S4000: Generate decoded image) The adder 312 adds the predicted image supplied from the predicted image generation unit 308 and the prediction error supplied from the inverse quantization/inverse transform unit 311, thereby decoding the target CU. Generate an image.

(S5000:ループフィルタ)ループフィルタ305は、復号画像にデブロッキングフィルタ、SAO、ALFなどのループフィルタをかけ、復号画像を生成する。 (S5000: Loop Filter) Loop filter 305 generates a decoded image by applying loop filters such as deblocking filter, SAO, and ALF to the decoded image.

(タイルの場合のCTUの復号)
図13は、符号化スライスデータを示す図である。パラメータ復号部302のCT情報復号部3021は、スライス(タイル)を構成するCTUを順に処理する。さらに、CT情報復号部3021は、図示しない対象CTU座標導出部を用いて、対象CTUのCTUラスタスキャンアドレスCtbAddrInRsから、CTUアドレステーブルCtbAddrToCtbX[]、CtbAddrToCtbY[]を参照して対象CTUの左上座標(xCtb, yCtb)を導出する。
(decoding of CTU in case of tiles)
FIG. 13 is a diagram showing encoded slice data. A CT information decoding unit 3021 of the parameter decoding unit 302 sequentially processes CTUs forming a slice (tile). Furthermore, the CT information decoding unit 3021 uses a target CTU coordinate derivation unit (not shown) to refer to the CTU address tables CtbAddrToCtbX[] and CtbAddrToCtbY[] from the CTU raster scan address CtbAddrInRs of the target CTU, and the upper left coordinate ( xCtb, yCtb).

xCtb = CtbAddrToCtbX[CtbAddrInRs]
yCtb = CtbAddrToCtbY[CtbAddrInRs]
CT情報復号部3021は対象CTUをルートとする符号化ツリーcoding_quadtree(xCtb,yCtb,log2CbSize,cqtDepth)を符号化データから再帰処理により復号する。
xCtb = CtbAddrToCtbX[CtbAddrInRs]
yCtb = CtbAddrToCtbY[CtbAddrInRs]
The CT information decoding unit 3021 decodes the coding tree coding_quadtree(xCtb, yCtb, log2CbSize, cqtDepth) whose root is the target CTU from the coded data by recursive processing.

ここでCtbAddrToCtbX、CtbAddrToCtbYは、CTUアドレステーブル導出部で導出されるテーブルである。
パラメータ復号部302は、スライスセグメントの終端か否かを示すフラグend_of_slice_segment_flagを復号し、次のCTUの処理の準備のためにCTUアドレスCtbAddrInTsを1だけインクリメントし(CtbAddrInTs++)、後続CTUのアドレスを導出する。さらに後続CTUに対応するCTUラスタスキャンアドレスを導出する(CtbAddrInRs = CtbAddrTsToRs[CtbAddrInTs])。ここでCtbAddrInTsは対象CTUのタイルスキャンアドレスである。
Here, CtbAddrToCtbX and CtbAddrToCtbY are tables derived by the CTU address table derivation unit.
The parameter decoding unit 302 decodes the flag end_of_slice_segment_flag indicating whether or not it is the end of the slice segment, increments the CTU address CtbAddrInTs by 1 (CtbAddrInTs++) in preparation for processing the next CTU, and derives the address of the subsequent CTU. . Further derive the CTU raster scan address corresponding to the subsequent CTU (CtbAddrInRs = CtbAddrTsToRs[CtbAddrInTs]). where CtbAddrInTs is the tile scan address of the target CTU.

パラメータ復号部302は、スライスセグメントの終端ではなく(!end_of_slice_segment_flag)、タイルが有効であり(tiles_enabled_flag)、後続CTUのタイルID(TileId[CtbAddrInTs]もしくはTildIdTbl[CtbAddrInTs])と対象CTUのCTUのタイルID([CtbAddrInTs-1])が異なる場合、end_of_subset_one_bitを復号し、さらにバイトアライメント用のビット(byte_alignment())を復号する。 Parameter decoding unit 302 is not the end of the slice segment (!end_of_slice_segment_flag), the tile is enabled (tiles_enabled_flag), the tile ID of the subsequent CTU (TileId[CtbAddrInTs] or TildIdTbl[CtbAddrInTs]) and the CTU tile ID of the target CTU If ([CtbAddrInTs-1]) is different, decode end_of_subset_one_bit and then decode the bit for byte alignment (byte_alignment()).

さらに、パラメータ復号部302は、タイルに加え、CTUライン単位に並列処理を行うウェーブフロントに対応し、ウェーブフロントフラグentropy_coding_sync_enabled_flagが1であり、後続CTUがCTUライン先頭の場合(CtbAddrInRs%PicWidthInCtbsY==0)、end_of_subset_one_bitを復号し、さらにバイトアライメント用のビット(byte_alignment())を復号してもよい。 Furthermore, the parameter decoding unit 302 supports wavefronts that perform parallel processing in units of CTU lines in addition to tiles, and if the wavefront flag entropy_coding_sync_enabled_flag is 1 and the subsequent CTU is the head of the CTU line (CtbAddrInRs%PicWidthInCtbsY==0 ), end_of_subset_one_bit, and the bit for byte alignment (byte_alignment()) may be decoded.

なお、end_of_subset_one_bitとbyte_alignment()を復号する条件は、図27(a)に示す条件であってもよい。つまり、パラメータ復号部302は、スライスセグメントの終端ではなく(!end_of_slice_segment_flag)、タイルが有効である(tiles_enabled_flag)場合、end_of_subset_one_bitとbyte_alignment()を復号する。 The conditions for decoding end_of_subset_one_bit and byte_alignment( ) may be the conditions shown in FIG. 27(a). That is, the parameter decoding unit 302 decodes end_of_subset_one_bit and byte_alignment( ) if tiles are enabled (tiles_enabled_flag) instead of the end of the slice segment (!end_of_slice_segment_flag).

ここで、本実施形態では、CTUサイズの整数倍に限定されないサイズのタイルの場合のPicWidthInCtbsYの導出方法に特徴がある。PicWidthInCtbsYはピクチャの幅にCTUが何個含まれるかを意味するが、本実施形態のようにタイルの有効領域の大きさがCTUサイズの整数倍に限られない場合は、有効領域がCTUサイズに満たないサイズのCTUが複数個存在しうるため、PicWidthInCtbsYの値はceil(wPict/ctuWidth)に等しいとは限らない。上述のように、本実施形態のパラメータ復号部302は、PicWidthInCtbsYを、以下の方法で導出する。 Here, this embodiment is characterized by a method of deriving PicWidthInCtbsY for tiles of sizes not limited to integral multiples of the CTU size. PicWidthInCtbsY means how many CTUs are included in the picture width. The value of PicWidthInCtbsY is not always equal to ceil(wPict/ctuWidth), as there may be multiple CTUs with less than the size. As described above, the parameter decoding unit 302 of this embodiment derives PicWidthInCtbsY by the following method.

for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1;i++)
PicWidthInCtbsY += tileWidthInCtus[i]
PicHeightInCtbsYについても同様であり、以下の方法で導出する。
for(PicWidthInCtbsY=0,i=0;i<=num_tile_columns_minus1;i++)
PicWidthInCtbsY += tileWidthInCtus[i]
PicHeightInCtbsY is the same and is derived by the following method.

for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1;j++)
PicHeightInCtbsY += tileHeightInCtus[j]
タイルがCTUサイズの整数倍に限定される場合には、以下の方法で導出しても良い。
for(PicHeightInCtbsY=0,j=0;j<=num_tile_rows_minus1;j++)
PicHeightInCtbsY += tileHeightInCtus[j]
If the tiles are limited to integer multiples of the CTU size, the following method may be used for derivation.

PicWidthInCtbsY = Ceil(wPict/ctuWidth)
PicHeightInCtbsY = Ceil(hPict/ctuHeight)
ここでの除算(/)は小数精度とする。
PicWidthInCtbsY = Ceil(wPict/ctuWidth)
PicHeightInCtbsY = Ceil(hPict/ctuHeight)
The division (/) here is decimal precision.

(CTUアドレステーブル導出部)
CTUアドレステーブル導出部は、以下のステップにより、CTUラスタスキャンアドレス(CtbAddrInRs)からCTUの座標(xCtb, yCtb)を導出するCTUアドレステーブルCtbAddrToCtbX[]、CtbAddrToCtbY[]を導出する。
(CTU address table derivation part)
The CTU address table deriving unit derives CTU address tables CtbAddrToCtbX[], CtbAddrToCtbY[] for deriving CTU coordinates (xCtb, yCtb) from CTU raster scan addresses (CtbAddrInRs) by the following steps.

(ステップ1)
対象CTUのCTUラスタスキャンアドレスCtbAddrInRsからタイルID(TileId)を導出する。
(Step 1)
A tile ID (TileId) is derived from the CTU raster scan address CtbAddrInRs of the target CTU.

TileId = CtbAddrRsToTileID[CtbAddrInRs]
ここでCtbAddrRsToTileIDは、タイルIDテーブル導出部で導出されるテーブルである。
TileId = CtbAddrRsToTileID[CtbAddrInRs]
Here, CtbAddrRsToTileID is a table derived by the tile ID table derivation unit.

(ステップ2)
CTUアドレステーブル導出部は、対象CTUを含むタイルの先頭CTUラスタスキャンアドレスfirstCtbAddrInRs[TileId]を導出し、ピクチャの幅に含まれるCTUの個数PicWidthInCtbsYを用いて、CTUを単位としたタイル内座標(xCtbInCtus, yCtbInCtus)を以下の式で導出する
xCtbInCtus = (CtbAddrInRs-firstCtbAddrInRs[TileId])%PicWidthInCtbsY
yCtbInCtus = (CtbAddrInRs-firstCtbAddrInRs[TileId])/PicWidthInCtbsY
ここでfirstCtbAddrInRsは、タイルIDで示されるタイルの先頭CTUラスタスキャンアドレスを導出するテーブルであり、先頭タイルアドレス導出部で導出される。
(Step 2)
The CTU address table derivation unit derives the first CTU raster scan address firstCtbAddrInRs[TileId] of the tile containing the target CTU, and uses the number of CTUs PicWidthInCtbsY included in the picture width to calculate the intra-tile coordinates (xCtbInCtus , yCtbInCtus) is derived by
xCtbInCtus = (CtbAddrInRs-firstCtbAddrInRs[TileId])%PicWidthInCtbsY
yCtbInCtus = (CtbAddrInRs-firstCtbAddrInRs[TileId])/PicWidthInCtbsY
Here, firstCtbAddrInRs is a table for deriving the leading CTU raster scan address of the tile indicated by the tile ID, and is derived by the leading tile address deriving unit.

CTUアドレステーブル導出部は、CTUサイズ(ctuWidth, ctuHeight)をかけて、画素単位のタイル内座標(xCtbInTile, yCtbInTile)を以下の式で導出する。 The CTU address table deriving unit multiplies the CTU size (ctuWidth, ctuHeight) to derive the pixel unit intra-tile coordinates (xCtbInTile, yCtbInTile) using the following formula.

xCtbInTile = xCtbInCtus*ctuWidth
yCtbInTile = yCtbInCtus*ctuHeight
なお、CTUサイズの対数表示を用いて以下のように導出しても良い。
xCtbInTile = xCtbInCtus*ctuWidth
yCtbInTile = yCtbInCtus*ctuHeight
Note that the CTU size may be derived using logarithmic representation as follows.

xCtbInTile = xCtbInCtus<<CtbLog2SizeY
yCtbInTile = yCtbInCtus<<CtbLog2SizeY
(ステップ3)
CTUアドレステーブル導出部は、タイル内座標(xCtbInTile, yCtbInTile)とタイル左上のピクチャ内座標(xTile[TileId],yTile[TileId])の和から、ピクチャ内におけるCTUの左上座標(xCtb, yCtb)を導出する。
xCtbInTile = xCtbInCtus<<CtbLog2SizeY
yCtbInTile = yCtbInCtus<<CtbLog2SizeY
(Step 3)
The CTU address table derivation unit calculates the upper left coordinates (xCtb, yCtb) of the CTU in the picture from the sum of the coordinates in the tile (xCtbInTile, yCtbInTile) and the coordinates in the picture of the upper left of the tile (xTile[TileId], yTile[TileId]). derive

xCtb = xTile[TileId]+xCtbInTile
yCtb = yTile[TileId]+yCtbInTile
(ステップ4)
CTUアドレステーブル導出部は、最後に導出されたCtbAddrInRsに関するCTUの左上座標(xCtb, yCtb)をテーブルに格納する
CtbAddrToCtbX[CtbAddrInRs] = xCtb
CtbAddrToCtbY[CtbAddrInRs] = yCtb
上記の処理は、タイル左上CTUの位置(xTileInCtus, yTileInCtu)を用いて、以下のようにも表現できる。
xCtb = xTile[TileId]+xCtbInTile
yCtb = yTile[TileId]+yCtbInTile
(Step 4)
The CTU address table derivation unit stores the CTU upper left coordinates (xCtb, yCtb) for the last derived CtbAddrInRs in the table.
CtbAddrToCtbX[CtbAddrInRs] = xCtb
CtbAddrToCtbY[CtbAddrInRs] = yCtb
The above processing can also be expressed as follows using the position of the upper left CTU of the tile (xTileInCtus, yTileInCtu).

xTileInCtus = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
yTileInCtus = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
xCtb = (((CtbAddrInRs-xTileInCtus)%tileWidthInCtus[TileId])<<log2CtuWidthY)+xTile[TileId]
yCtb = (((CtbAddrInRs-yTileInCtus)/tileWidthInCtus[TileId])<<log2CtuHeightY)+yTile[TileId]
ここでlog2CtuWidthY=log2(ctuWidth)、log2CtuHeightY=log2(ctuHeight)である。タイル左上CTUの位置(xTileInCtus, yTileInCtu)やCTUの左上座標(xCtb,yCtb)はしばしば参照されるため、導出済みの値をテーブルに格納して用いてもよい。また、上記の導出を参照の都度行ってもよい。
xTileInCtus = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
yTileInCtus = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
xCtb = (((CtbAddrInRs-xTileInCtus)%tileWidthInCtus[TileId])<<log2CtuWidthY)+xTile[TileId]
yCtb = (((CtbAddrInRs-yTileInCtus)/tileWidthInCtus[TileId])<<log2CtuHeightY)+yTile[TileId]
where log2CtuWidthY=log2(ctuWidth) and log2CtuHeightY=log2(ctuHeight). Since the position of the upper left CTU of the tile (xTileInCtus, yTileInCtu) and the upper left coordinates of the CTU (xCtb, yCtb) are often referred to, the derived values may be stored in a table and used. Also, the above derivation may be performed each time reference is made.

上記処理の全体を擬似コードで示すと以下になる。 The whole of the above processing is shown below in pseudo code.

for (CtbAddrInRs=0;CtbAddrInRs<numCtusInFrame;CtbAddrInRs++)
{
TileId = CtbAddrRsToTileID[CtbAddrInRs]
xCtb = xTile[TileId]+((CtbAddrInRs-firstCtbAddrInRs[TileId])%PicWidthInCtbsY)* ctuUWidth
yCtb = yTile[TileId]+((CtbAddrInRs-firstCtbAddrInRs[TileId])/PicWidthInCtbsY) * ctuHeight
CtbAddrToCtbX[CtbAddrInRs] = xCtb
CtbAddrToCtbY[CtbAddrInRs] = yCtb
}
ここで、numCtusInFrameは1ピクチャ内のCTUの個数であり、numCtusInFrame=numTileColumns*numTileRowsである。
for (CtbAddrInRs=0;CtbAddrInRs<numCtusInFrame;CtbAddrInRs++)
{
TileId = CtbAddrRsToTileID[CtbAddrInRs]
xCtb = xTile[TileId]+((CtbAddrInRs-firstCtbAddrInRs[TileId])%PicWidthInCtbsY)* ctuUWidth
yCtb = yTile[TileId]+((CtbAddrInRs-firstCtbAddrInRs[TileId])/PicWidthInCtbsY) * ctuHeight
CtbAddrToCtbX[CtbAddrInRs] = xCtb
CtbAddrToCtbY[CtbAddrInRs] = yCtb
}
Here, numCtusInFrame is the number of CTUs in one picture, and numCtusInFrame=numTileColumns*numTileRows.

(タイルの場合のCTUの復号・変形例)
上記で説明したタイルのCTUの復号の方法について、xCtbとyCtbの導出にCTUアドレステーブルCtbAddrToCtbX[]およびCtbAddrToCtbY[]を用いず、別の方法を用いてもよい。次にその例を示す。
(Decoding/modification example of CTU for tiles)
Regarding the method of decoding the CTU of the tile described above, another method may be used for deriving xCtb and yCtb without using the CTU address tables CtbAddrToCtbX[] and CtbAddrToCtbY[]. For example:

CT情報復号部3021は、図示しない対象CTU座標導出部を用いて、対象CTUのCTUラスタスキャンアドレスCtbAddrInRsから、対象CTUのCTU単位のX座標(CTUのcol位置)およびCTU単位のY座標(CTUのrow位置)であるrxおよびryを導出し、CTU座標変換テーブルCtbColToCtbX[]、CtbRowToCtbY[]を参照して対象CTUの左上座標(xCtb, yCtb)を導出する。 The CT information decoding unit 3021 uses a target CTU coordinate deriving unit (not shown) to obtain the target CTU's CTU raster scan address CtbAddrInRs from the target CTU's CTU unit X coordinate (col position of CTU) and CTU unit Y coordinate (CTU rx and ry, which are the row position of the CTU), and refer to the CTU coordinate conversion table CtbColToCtbX[], CtbRowToCtbY[] to derive the upper left coordinates (xCtb, yCtb) of the target CTU.

rx = CtbAddrInRs % PicWidthInCtbsY
ry = CtbAddrInRs / PicWidthInCtbsY
xCtb = CtbColToCtbX[rx]
yCtb = CtbRowToCtbY[ry]
図30(a)のcoding_tree_unit()は、この変形例の導出方法を用いたシンタックスの例である。対象CTの左上座標(xCtb,yCtb)を、CTU座標変換テーブルを用いて導出し、coding_quadtree()に左上座標(xCtb,yCtb)を渡す。図30(b)に示すように、タイルが利用可能な場合(tile_enabled_flagが真)と、そうでない場合とで、導出方法を変更してもよい。
rx = CtbAddrInRs % PicWidthInCtbsY
ry = CtbAddrInRs / PicWidthInCtbsY
xCtb = CtbColToCtbX[rx]
yCtb = CtbRowToCtbY[ry]
The coding_tree_unit() in FIG. 30(a) is an example of syntax using the derivation method of this modified example. The upper left coordinate (xCtb, yCtb) of the target CT is derived using the CTU coordinate conversion table, and the upper left coordinate (xCtb, yCtb) is passed to coding_quadtree(). As shown in FIG. 30(b), the derivation method may be changed depending on whether the tile is available (tile_enabled_flag is true) or not.

(CTU座標変換テーブル導出部)
CTU座標変換テーブル導出部は、以下のステップにより、CTU単位のX座標およびCTU単位
のY座標(rx, ry)からCTUの画素単位の座標(xCtb, yCtb)を導出するCTU座標変換テーブルCtbColToCtbX[]、CtbRowToCtbY[]を導出する。
(CTU coordinate conversion table derivation part)
The CTU coordinate conversion table deriving unit creates a CTU coordinate conversion table CtbColToCtbX[ ], derive CtbRowToCtbY[].

CTU座標変換テーブル導出部は、CTU単位のX座標rxを0からnum_tile_columns_minus1までループし、以下のステップを実行する。 The CTU coordinate conversion table derivation unit loops the X coordinate rx in CTU units from 0 to num_tile_columns_minus1 and executes the following steps.

(ステップ1x)
CTU座標変換テーブル導出部は、CTU単位のX座標rxから、タイルIDを導出する。このとき、すべてのY座標についてこのテーブルは同じであるため、CTU単位のY座標(CTUのrow位置)は0とする。したがって、
TileId = CtbAddrRsToTileID[rx]
ここでCtbAddrRsToTileIDは、タイルIDテーブル導出部で導出されるテーブルである。
(Step 1x)
The CTU coordinate conversion table derivation unit derives a tile ID from the X coordinate rx in CTU units. At this time, since this table is the same for all Y coordinates, the Y coordinate in CTU units (the row position of CTU) is set to 0. therefore,
TileId = CtbAddrRsToTileID[rx]
Here, CtbAddrRsToTileID is a table derived by the tile ID table derivation unit.

(ステップ2x)
CTU座標変換テーブル導出部は、対象CTUを含むタイルの先頭CTUラスタスキャンアドレスfirstCtbAddrInRs[TileId]を導出し、CTUを単位としたタイル内座標xCtbInCtusを以下の式で導出する。
(Step 2x)
The CTU coordinate conversion table deriving unit derives the first CTU raster scan address firstCtbAddrInRs[TileId] of the tile containing the target CTU, and derives the intra-tile coordinate xCtbInCtus in units of CTU by the following formula.

xCtbInCtus = rx - firstCtbAddrInRs[TileId] % PicWidthInCtbsY
ここでfirstCtbAddrInRsは、タイルIDで示されるタイルの先頭CTUラスタスキャンアドレスを導出するテーブルであり、先頭タイルアドレス導出部で導出される。
xCtbInCtus = rx - firstCtbAddrInRs[TileId] % PicWidthInCtbsY
Here, firstCtbAddrInRs is a table for deriving the leading CTU raster scan address of the tile indicated by the tile ID, and is derived by the leading tile address deriving unit.

あるいは、タイルIDで示されるタイルの先頭CTBのCTU単位X座標(col位置)を導出するテーブルfirstCtbCol[]を用いて、次のように導出してもよい。 Alternatively, it may be derived as follows using a table firstCtbCol[ ] for deriving the CTU unit X coordinate (col position) of the head CTB of the tile indicated by the tile ID.

xCtbInCtus = rx - firstCtbCol[TileId]
テーブルfirstCtbCol[]は、先頭タイルアドレス導出部で、次のように導出する。
xCtbInCtus = rx - firstCtbCol[TileId]
The table firstCtbCol[] is derived as follows by the leading tile address deriving unit.

firstCtbCol[TileId] = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
次に、CTU座標変換テーブル導出部は、xCtbInCtusにCTUサイズctuWidthをかけて、画素単位のタイル内座標xCtbInTileを以下の式で導出する。
firstCtbCol[TileId] = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
Next, the CTU coordinate conversion table deriving unit multiplies xCtbInCtus by the CTU size ctuWidth to derive the in-tile coordinate xCtbInTile in units of pixels using the following formula.

xCtbInTile = xCtbInCtus*ctuWidth
(ステップ3x)
CTU座標変換テーブル導出部は、タイル内X座標xCtbInTileとタイル左上X座標のピクチャ内座標xTile[TileId]の和から、ピクチャ内におけるCTUの左上X座標xCtbを導出する。
xCtbInTile = xCtbInCtus*ctuWidth
(Step 3x)
The CTU coordinate conversion table deriving unit derives the upper left X coordinate xCtb of the CTU in the picture from the sum of the in-tile X coordinate xCtbInTile and the in-picture coordinate xTile[TileId] of the tile upper left X coordinate.

xCtb = xTile[TileId]+xCtbInTile
(ステップ4x)
最後に、CTU座標変換テーブル導出部は、導出されたrxに関するCTUの左上X座標xCtbをテーブルに格納する。
xCtb = xTile[TileId]+xCtbInTile
(Step 4x)
Finally, the CTU coordinate conversion table derivation unit stores the upper left X coordinate xCtb of the CTU with respect to the derived rx in the table.

CtbColToCtbX[rx] = xCtb
上記の処理は、タイル左上CTUのX座標xTileInCtusを用いて、以下のようにも表現できる。
CtbColToCtbX[rx] = xCtb
The above processing can also be expressed as follows using the X coordinate xTileInCtus of the upper left CTU of the tile.

xTileInCtus = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
xCtb = ((rx-xTileInCtus)<<log2CtuWidthY)+xTile[TileId]
ここでlog2CtuWidthY=log2(ctuWidth)である。タイル左上CTUのX座標xTileInCtusやCTUの左上X座標xCtbはしばしば参照されるため、このように導出済みの値をテーブルに格納
して用いてもよいし、上記の導出を参照の都度行ってもよい。
xTileInCtus = firstCtbAddrInRs[TileId] % PicWidthInCtbsY
xCtb = ((rx-xTileInCtus)<<log2CtuWidthY)+xTile[TileId]
where log2CtuWidthY=log2(ctuWidth). Since the X coordinate xTileInCtus of the upper left CTU of the tile and the upper left X coordinate xCtb of the CTU are often referred to, the derived values may be stored in a table and used in this way, or the above derivation may be performed each time the reference is made. good.

上記処理の全体を擬似コードで示すと以下になる。 The whole of the above processing is shown below in pseudo code.

for ( col=0; col<=num_tile_columns_minus1; col++ )
{
TileId = CtbAddrRsToTileID[col]
xCtb = xTile[TileId]+((rx-firstCtbAddrInRs[TileId])%PicWidthInCtbsY)* ctuWidth
CtbColToCtbX[col] = xCtb
}
X座標に関するテーブルと同様に、CTU座標変換テーブル導出部は、CTU単位のY座標ryを0からnum_tile_rows_minus1までループし、以下のステップを実行する。
for ( col=0; col<=num_tile_columns_minus1; col++ )
{
TileId = CtbAddrRsToTileID[col]
xCtb = xTile[TileId]+((rx-firstCtbAddrInRs[TileId])%PicWidthInCtbsY)* ctuWidth
CtbColToCtbX[col] = xCtb
}
Similar to the table for X coordinates, the CTU coordinate conversion table derivation loops the Y coordinate ry in CTU units from 0 to num_tile_rows_minus1 and performs the following steps.

(ステップ1y)
CTU座標変換テーブル導出部は、CTU単位のY座標ryから、タイルIDを導出する。このとき、すべてのX座標についてこのテーブルは同じであるため、CTU単位のX座標(CTUのcol位置)は0とする。したがって、
TileId = CtbAddrRsToTileID[ry*PicWidthInCtbsY]
ここでCtbAddrRsToTileIDは、タイルIDテーブル導出部で導出されるテーブルである。
(Step 1y)
The CTU coordinate conversion table derivation unit derives a tile ID from the Y coordinate ry in CTU units. At this time, since this table is the same for all X coordinates, the X coordinate in CTU units (col position of CTU) is set to 0. therefore,
TileId = CtbAddrRsToTileID[ry*PicWidthInCtbsY]
Here, CtbAddrRsToTileID is a table derived by the tile ID table derivation unit.

(ステップ2y)
CTU座標変換テーブル導出部は、対象CTUを含むタイルの先頭CTUラスタスキャンアドレスfirstCtbAddrInRs[TileId]を導出し、CTUを単位としたタイル内座標yCtbInCtusを以下の式で導出する。
(Step 2y)
The CTU coordinate conversion table deriving unit derives the first CTU raster scan address firstCtbAddrInRs[TileId] of the tile containing the target CTU, and derives the intra-tile coordinate yCtbInCtus in units of CTUs using the following formula.

yCtbInCtus = ry - firstCtbAddrInRs[TileId] / PicWidthInCtbsY
ここでfirstCtbAddrInRsは、タイルIDで示されるタイルの先頭CTUラスタスキャンアドレスを導出するテーブルであり、先頭タイルアドレス導出部で導出される。
yCtbInCtus = ry - firstCtbAddrInRs[TileId] / PicWidthInCtbsY
Here, firstCtbAddrInRs is a table for deriving the leading CTU raster scan address of the tile indicated by the tile ID, and is derived by the leading tile address deriving unit.

あるいは、タイルIDで示されるタイルの先頭CTBのCTU単位Y座標(row位置)を導出するテーブルfirstCtbRow[]を用いて、次のように導出してもよい。 Alternatively, it may be derived as follows using a table firstCtbRow[] for deriving the CTU unit Y coordinate (row position) of the head CTB of the tile indicated by the tile ID.

yCtbInCtus = ry - firstCtbRow[TileId]
テーブルfirstCtbRow[]は、先頭タイルアドレス導出部で、次のように導出する。
yCtbInCtus = ry - firstCtbRow[TileId]
The table firstCtbRow[] is derived as follows by the leading tile address deriving unit.

firstCtbRow[TileId] = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
次に、CTU座標変換テーブル導出部は、yCtbInCtusにCTUサイズctuHeightをかけて、画素単位のタイル内座標yCtbInTileを以下の式で導出する。
firstCtbRow[TileId] = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
Next, the CTU coordinate conversion table deriving unit multiplies yCtbInCtus by the CTU size ctuHeight to derive the in-tile coordinate yCtbInTile in units of pixels using the following formula.

yCtbInTile = yCtbInCtus*ctuHeight
(ステップ3y)
CTU座標変換テーブル導出部は、タイル内Y座標yCtbInTileとタイル左上Y座標のピクチャ内座標yTile[TileId]の和から、ピクチャ内におけるCTUの左上Y座標yCtbを導出する。
yCtbInTile = yCtbInCtus*ctuHeight
(Step 3y)
The CTU coordinate conversion table derivation unit derives the upper left Y coordinate yCtb of the CTU in the picture from the sum of the intra-tile Y coordinate yCtbInTile and the intra-picture coordinate yTile[TileId] of the tile upper left Y coordinate.

yCtb = yTile[TileId]+yCtbInTile
(ステップ4y)
最後に、CTU座標変換テーブル導出部は、導出されたryに関するCTUの左上Y座標yCtbをテーブルに格納する。
yCtb = yTile[TileId]+yCtbInTile
(Step 4y)
Finally, the CTU coordinate conversion table derivation unit stores the derived upper left Y coordinate yCtb of the CTU related to ry in the table.

CtbRowToCtbY[ry] = yCtb
上記の処理は、タイル左上CTUのy位置yTileInCtusを用いて、以下のようにも表現できる。
CtbRowToCtbY[ry] = yCtb
The above processing can also be expressed as follows using the y-position yTileInCtus of the upper left CTU of the tile.

yTileInCtus = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
yCtb = ((ry-yTileInCtus)<<log2CtuHeightY)+yTile[TileId]
ここでlog2CtuHeightY=log2(ctuHeight)である。タイル左上CTUのY座標yTileInCtusやCTUの左上Y座標yCtbはしばしば参照されるため、このように導出済みの値をテーブルに格納して用いてもよいし、上記の導出を参照の都度行ってもよい。
yTileInCtus = firstCtbAddrInRs[TileId] / PicWidthInCtbsY
yCtb = ((ry-yTileInCtus)<<log2CtuHeightY)+yTile[TileId]
where log2CtuHeightY=log2(ctuHeight). Since the Y coordinate yTileInCtus of the upper left CTU of the tile and the Y coordinate yCtb of the upper left CTU of the CTU are often referred to, the derived values may be stored in a table and used in this way, or the above derivation may be performed each time the reference is made. good.

上記処理の全体を擬似コードで示すと以下になる。 The whole of the above processing is shown below in pseudo code.

for ( row=0; row<=num_tile_rows_minus1; row++ )
{
TileId = CtbAddrRsToTileID[row*PicWidthInCtbsY]
yCtb = yTile[TileId]+((ry-firstCtbAddrInRs[TileId])/PicWidthInCtbsY)* ctuHeight
CtbRowToCtbY[row] = yCtb
}
なお、CtbAddrInTsとCtbAddrInRsは互いに変換可能であるため、上記実施例のうちラスタスキャン順CTU位置CtbAddrInRsを添字とするテーブルは、タイルスキャン順CTU位置CtbAddrInTsを添字として導出し、参照時の添字もタイルスキャン順CTU位置に変換したものを用いて構成することも可能である。同様に、タイルスキャン順CTU位置CtbAddrInTsを添字とするテーブルは、ラスタスキャン順CTU位置CtbAddrInRsを添字として導出し、参照時の添字もラスタスキャン順CTU位置に変換したものを用いて構成することも可能である。
for ( row=0; row<=num_tile_rows_minus1; row++ )
{
TileId = CtbAddrRsToTileID[row*PicWidthInCtbsY]
yCtb = yTile[TileId]+((ry-firstCtbAddrInRs[TileId])/PicWidthInCtbsY)* ctuHeight
CtbRowToCtbY[row] = yCtb
}
Since CtbAddrInTs and CtbAddrInRs can be converted to each other, the table with the raster scan order CTU position CtbAddrInRs as the subscript is derived from the tile scan order CTU position CtbAddrInTs as the subscript, and the subscript at the time of reference is also the tile scan It is also possible to configure using the forward CTU positions converted. Similarly, a table with tile scan order CTU positions CtbAddrInTs as subscripts can be derived using raster scan order CTU positions CtbAddrInRs as subscripts, and the subscripts at the time of reference can also be converted to raster scan order CTU positions and configured. is.

ラスタスキャン順CTUアドレスからタイルスキャン順CTUアドレスを導出するテーブルCtbAddrRsToTs[]の導出例を以下に擬似コードで示す。CtbAddrRsToTileId[]は、タイルIDテーブル導出部によって導出された、ラスタスキャン順CTUアドレスからタイルIDを導出する、タイルIDテーブルである。 An example of deriving a table CtbAddrRsToTs[] for deriving a tile-scan order CTU address from a raster-scan order CTU address is shown below in pseudocode. CtbAddrRsToTileId[ ] is a tile ID table that derives the tile ID from the raster scan order CTU address derived by the tile ID table derivation unit.

for( ctbAddrRs = 0; ctbAddrRs < numCtusInFrame; ctbAddrRs++ ) {
tileId = CtbAddrRsToTileId[ ctbAddrRs ]
tbX = ctbAddrRs % PicWidthInCtbsY
tbY = ctbAddrRs / PicWidthInCtbsY
CtbAddrRsToTs[ ctbAddrRs ] = 0
for( t = 0; t < tileId; t++ ) {
CtbAddrRsToTs[ctbAddrRs] += TileWidthInCtbsY[tileId]*TileHeightInCtbsY[tileId]
}
CtbAddrRsToTs[ctbAddrRs] += (tbY-TileYInCtbsY[tileId])*TileWidthInCtbsY[tileId]+
tbX-TileXInCtbsY[tileId]
}
以上の構成により、画像をCTUに分割し、CTU単位に動画像を復号する動画像復号装置において、タイルをCTUに分割して再帰的に分割するCT情報復号部を備え、対象CTUのラスタスキャンアドレスから、1つ以上のタイルのサイズを参照して、対象CTUのピクチャ上の左上座標を導出するヘッダ復号部(対象CTU座標導出部)を備え、上記CT情報復号部は、導出された対象CTUのピクチャ上の左上座標に基づいて、対象CTUを符号化ツリーに分割し、分割されたCTの右下位置のタイル内座標がタイルサイズ
以内である場合に、符号化ツリーを処理する手段を備える。
for( ctbAddrRs = 0; ctbAddrRs <numCtusInFrame; ctbAddrRs++ ) {
tileId = CtbAddrRsToTileId[ ctbAddrRs ]
tbX = ctbAddrRs % PicWidthInCtbsY
tbY = ctbAddrRs / PicWidthInCtbsY
CtbAddrRsToTs[ ctbAddrRs ] = 0
for( t = 0; t <tileId; t++ ) {
CtbAddrRsToTs[ctbAddrRs] += TileWidthInCtbsY[tileId]*TileHeightInCtbsY[tileId]
}
CtbAddrRsToTs[ctbAddrRs] += (tbY-TileYInCtbsY[tileId])*TileWidthInCtbsY[tileId]+
tbX-TileXInCtbsY[tileId]
}
With the above configuration, the moving image decoding device that divides an image into CTUs and decodes a moving image in units of CTUs includes a CT information decoding unit that divides a tile into CTUs and divides it recursively, and raster scans the target CTU. A header decoding unit (target CTU coordinate derivation unit) for deriving the upper left coordinate on the picture of the target CTU by referring to the size of one or more tiles from the address, and the CT information decoding unit includes the derived target a means for dividing a target CTU into a coding tree based on the upper left coordinate on the picture of the CTU, and processing the coding tree when the intra-tile coordinate of the lower right position of the divided CT is within the tile size; Prepare.

画像をタイルに分割し、タイル単位に動画像を復号する動画像復号装置において、
対象CTUのラスタスキャンアドレスから、対象CTUの左上座標を導出するCTUアドレステーブルを参照するヘッダ復号部(対象CTU座標導出部)を備え、上記CTUアドレステーブルを、1つ以上のタイルのサイズから導出するヘッダ復号部(CTUアドレステーブル導出部)を備える。
In a video decoding device that divides an image into tiles and decodes the video in units of tiles,
A header decoding unit (target CTU coordinate deriving unit) that refers to a CTU address table that derives the upper left coordinate of the target CTU from the raster scan address of the target CTU, and derives the CTU address table from the size of one or more tiles. header decoder (CTU address table derivation unit).

(タイルIDテーブル導出部)
タイルIDテーブル導出部は以下のステップでタイルIDテーブルCtbAddrRsToTileID[]を導出する。
(Tile ID table derivation unit)
The tile ID table derivation unit derives the tile ID table CtbAddrRsToTileID[] in the following steps.

(ステップ1)
画面内CTUアドレスCtbAddrInRsに対応するCTUのタイル座標(columnIdx,rowIdx)を導出する。
(Step 1)
Derive the tile coordinates (columnIdx, rowIdx) of the CTU corresponding to the intra-screen CTU address CtbAddrInRs.

(ステップ2)
タイル座標(columnIdx, rowIdx)から画面内タイルIDを導出する。
(Step 2)
Derive the screen tile ID from the tile coordinates (columnIdx, rowIdx).

TileId = rowIdx*numTileColumns+columnIdx
ここでnumTileColumnsはピクチャ内の水平方向のタイルの個数である。
TileId = rowIdx*numTileColumns+columnIdx
where numTileColumns is the number of horizontal tiles in the picture.

(ステップ3)
導出したタイルIDをタイルIDテーブルCtbAddrRsToTileID[]に格納する。
(Step 3)
The derived tile ID is stored in the tile ID table CtbAddrRsToTileID[].

CtbAddrRsToTileID[CtbAddrInRs] = TileId
上記の処理の擬似コードを以下に示す。
CtbAddrRsToTileID[CtbAddrInRs] = TileId
Pseudocode for the above process is shown below.

for(CtbAddrInRs=0;CtbAddrInRs<numCtusInFrame;CtbAddrInRs++)
{
for(col=0;col<numTileColumns;col++)
{
if(CtbAddrInRs%PicWidthInCtbsY<=rightEdgePosInCtus[col])
{
columnIdx = col
break
}
}
for(row=0;row<numTileRows;row++)
{
if(CtbAddrInRs/PicWidthInCtbsY<=bottomEdgePosInCtus[row*numTileColumns])
{
rowIdx = row
break
}
}
CtbAddrRsToTileID[CtbAddrInRs] = rowIdx*numTileColumns+columnIdx
}
(先頭タイルアドレス導出部)
先頭タイルアドレス導出部は以下のステップで先頭タイルアドレステーブルfirstCtbAd
drInRs[]を導出する。
for(CtbAddrInRs=0;CtbAddrInRs<numCtusInFrame;CtbAddrInRs++)
{
for(col=0;col<numTileColumns;col++)
{
if(CtbAddrInRs%PicWidthInCtbsY<=rightEdgePosInCtus[col])
{
columnIdx = col
break
}
}
for(row=0;row<numTileRows;row++)
{
if(CtbAddrInRs/PicWidthInCtbsY<=bottomEdgePosInCtus[row*numTileColumns])
{
rowIdx = row
break
}
}
CtbAddrRsToTileID[CtbAddrInRs] = rowIdx*numTileColumns+columnIdx
}
(leading tile address derivation unit)
The first tile address derivation unit uses the following steps to obtain the first tile address table firstCtbAd
Derive drInRs[].

(ステップ1)
タイル単位の座標で(col, row)に対応するTileIdについて、col列までの各タイルi(0<=i<col)のCTU単位の幅tileWidthInCtus[i]を参照して、TileIdの示すタイルのCTU単位の右端位置rightEdgePosInCtus[TileId]を導出する。同様に、row列までの各タイルj(0<=j<row)のCTU単位の高さtileHeightInCtus[j]を参照して、TileIdの示すタイルのCTU単位の下端位置bottomEdgePosInCtus[TileId]を導出する。
(Step 1)
For the TileId corresponding to (col, row) in tile unit coordinates, refer to the width tileWidthInCtus[i] in CTU units of each tile i (0<=i<col) up to the col column, and refer to the tile indicated by TileId. Derive the right edge position rightEdgePosInCtus[TileId] in CTU units. Similarly, refer to the height tileHeightInCtus[j] in CTU units of each tile j (0<=j<row) up to the row column, and derive the bottom position bottomEdgePosInCtus[TileId] in CTU units of the tile indicated by TileId. .

(ステップ2)
TileIdで示すタイルのCTU単位の右端位置rightEdgePosInCtus[TileId]、および、TileIdで示すタイルのCTU単位の幅tileWidthInCtus[TileId]から、TileIdで示すタイルのCTU単位の左端位置xCtbInCtusを導出する。
(Step 2)
The left edge position xCtbInCtus of the tile indicated by TileId in CTU units is derived from the right edge position in CTU units of the tile indicated by TileId rightEdgePosInCtus[TileId] and the width of the tile indicated by TileId in CTU units tileWidthInCtus[TileId].

TileIdで示すタイルのCTU単位の下端位置bottomEdgePosInCtus[TileId]、および、TileIdで示すタイルのCTU単位の高さtileHeightInCtus[TileId]から、TileIdで示すタイルのCTU単位の上端位置yCtbInCtusを導出する。 The top position yCtbInCtus of the tile indicated by TileId in CTU units is derived from the bottom edge position bottomEdgePosInCtus[TileId] in CTU units of the tile indicated by TileId and the height tileHeightInCtus[TileId] in CTU units of the tile indicated by TileId.

xCtbInCtus = rightEdgePosInCtus[TileId]-tileWidthInCtus[TileId]+1
yCtbInCtus = bottomEdgePosInCtus[TileId]-tileHeightInCtus[TileId]+1
TileIdで示すCTU単位のタイル左上画素の画面内位置(xCtbInCtus, yCtbInCtus)から、CTUラスタスキャンアドレスCtbAddrInRsを導出する。
xCtbInCtus = rightEdgePosInCtus[TileId]-tileWidthInCtus[TileId]+1
yCtbInCtus = bottomEdgePosInCtus[TileId]-tileHeightInCtus[TileId]+1
A CTU raster scan address CtbAddrInRs is derived from the screen position (xCtbInCtus, yCtbInCtus) of the tile upper left pixel indicated by TileId.

CtbAddrInRs = yCtbInCtus*PicWidthInCtbsY+xCtbInCtus
ここで、tileWidthInCtus[]、tileHeightInCtus[]はタイル情報設定部が導出する。
CtbAddrInRs = yCtbInCtus*PicWidthInCtbsY+xCtbInCtus
Here, tileWidthInCtus[] and tileHeightInCtus[] are derived by the tile information setting unit.

(ステップ3)
導出したCTUアドレスを先頭タイルアドレステーブルfirstCtbAddrInRs[]に格納する
firstCtbAddrInRs[TileId] = CtbAddrInRs
上記の処理の擬似コードを以下に示す。
(Step 3)
Store the derived CTU address in the first tile address table firstCtbAddrInRs[]
firstCtbAddrInRs[TileId] = CtbAddrInRs
Pseudocode for the above process is shown below.

for(row=0; row < numTileRows; row++)
{
for(col=0; col < numTileColumns; col++)
{
TileIdx = row*numTileColumns+col;
rightEdgePosInCTU = 0;
for(i=0; i <= col; i++)
{
rightEdgePosInCTU += tileWidthInCtus[row*numTileColumns+i]
}
rightEdgePosInCtus[TileId] = rightEdgePosInCTU-1
bottomEdgePosInCTU = 0;
for(i=0 ;i <= row; i++)
{
bottomEdgePosInCTU += tileHeightInCtus[i*numTileColumns+col]
}
bottomEdgePosInCtus[tileId] = bottomEdgePosInCTU-1
xCtbInCtus = rightEdgePosInCtus[TileId]-tileWidthInCtus[TileId]+1
yCtbInCtus = bottomEdgePosInCtus[TileId]-tileHeightInCtus[TileId]+1
CtbAddrInRs = yCtbInCtus*PicWidthInCtbsY+xCtbInCtus
firstCtbAddrInRs[TileId] = CtbAddrInRs
}
}
(CT情報復号の処理)
以下、CT情報復号の処理を、図7、図8、図9を参照して説明する。図7は、本発明の一実施形態に係るCT情報復号部3021の動作を説明するフローチャートである。また、図8は、本発明の一実施形態に係るCTUおよびQT情報のシンタックス表の構成例を示す図であり、図9は、本発明の一実施形態に係るMT分割情報のシンタックス表の構成例を示す図である。また図7~図9の別の例を、図27~図29に示す。
for(row=0; row <numTileRows; row++)
{
for(col=0; col <numTileColumns; col++)
{
TileIdx = row*numTileColumns+col;
rightEdgePosInCTU = 0;
for(i=0; i <= col; i++)
{
rightEdgePosInCTU += tileWidthInCtus[row*numTileColumns+i]
}
rightEdgePosInCtus[TileId] = rightEdgePosInCTU-1
bottomEdgePosInCTU = 0;
for(i=0 ;i <= row; i++)
{
bottomEdgePosInCTU += tileHeightInCtus[i*numTileColumns+col]
}
bottomEdgePosInCtus[tileId] = bottomEdgePosInCTU-1
xCtbInCtus = rightEdgePosInCtus[TileId]-tileWidthInCtus[TileId]+1
yCtbInCtus = bottomEdgePosInCtus[TileId]-tileHeightInCtus[TileId]+1
CtbAddrInRs = yCtbInCtus*PicWidthInCtbsY+xCtbInCtus
firstCtbAddrInRs[TileId] = CtbAddrInRs
}
}
(Processing of CT information decoding)
The CT information decoding process will be described below with reference to FIGS. 7, 8, and 9. FIG. FIG. 7 is a flow chart explaining the operation of the CT information decoding unit 3021 according to one embodiment of the present invention. FIG. 8 is a diagram showing a configuration example of a syntax table of CTU and QT information according to one embodiment of the present invention, and FIG. 9 is a syntax table of MT division information according to one embodiment of the present invention. It is a figure which shows the structural example of. Another example of FIGS. 7-9 is shown in FIGS. 27-29.

図8(a)のcoding_tree_unit()のシンタックスの復号においてCT情報復号は、対象CTUの左上座標(xCtb,yCtb)を導出し、coding_quadtree()のシンタックスを再帰的に復号する。coding_quadtree()のCTの左上座標(xCb, yCb)の初期値には、CTUの左上座標(xCtb,yCtb)を用いる。(xCtb,yCtb)の別の導出方法として、図27(b)に示すように、タイルを利用する場合(tile_enabled_flagが真)と、そうでない場合とで、導出方法を変更してもよい。すなわち、タイルを利用する場合には、CTU左上座標(xCtb, yCtb)を、画面内のタイル左上座標(xTile[TileId], yTile[TileId])とタイル内のCTU左上座標の和から導出する。つまり、タイル内のCTU左上座標は、CTU単位のCTUの画面内座標(rx, ry)とCTU単位のタイルの画面内座標(TileXInCtbY, TileYInCtbY)の差分から、CTU単位のタイル内座標を導出し、CTUサイズをかける(CtbLog2SizeYで左シフトする)。 CT information decoding in decoding the syntax of coding_tree_unit() in FIG. 8(a) derives the upper left coordinates (xCtb, yCtb) of the target CTU, and recursively decodes the syntax of coding_quadtree(). Use the upper left coordinates (xCtb, yCtb) of the CTU for the initial value of the upper left coordinates (xCb, yCb) of CT in coding_quadtree(). As another derivation method of (xCtb, yCtb), as shown in FIG. 27(b), the derivation method may be changed depending on whether tiles are used (tile_enabled_flag is true) or not. That is, when using tiles, the CTU upper left coordinate (xCtb, yCtb) is derived from the sum of the tile upper left coordinate (xTile[TileId], yTile[TileId]) in the screen and the CTU upper left coordinate in the tile. In other words, the CTU upper left coordinate in the tile is derived from the difference between the CTU in-screen coordinates (rx, ry) in CTU units and the tile in-screen coordinates (TileXInCtbY, TileYInCtbY) in CTU units. , multiplied by the CTU size (left shift by CtbLog2SizeY).

CurrTileId = TileIdTbl[ CtbAddrInRs ]
xCtb = xTile[TileId]+(rx-TileXInCtbsY[CurrTileId]) <<CtbLog2SizeY
yCtb = yTile[TileId]+(ry-TileYInCtbsY[CurrTileId]) <<CtbLog2SizeY
逆に、タイルを利用しない場合には、CTU左上座標(xCtb, yCtb)を、CTU単位のCTUの画面内座標から導出する。つまり、タイル内のCTU左上座標は、CTU単位のCTUの画面内座標(rx, ry)にCTUサイズをかける(CtbLog2SizeYで左シフトする)。
CurrTileId = TileIdTbl[ CtbAddrInRs ]
xCtb = xTile[TileId]+(rx-TileXInCtbsY[CurrTileId]) <<CtbLog2SizeY
yCtb = yTile[TileId]+(ry-TileYInCtbsY[CurrTileId]) <<CtbLog2SizeY
Conversely, when tiles are not used, the CTU upper left coordinates (xCtb, yCtb) are derived from the on-screen coordinates of the CTU in CTU units. That is, the CTU upper left coordinate within the tile is obtained by multiplying the CTU screen coordinate (rx, ry) in CTU units by the CTU size (left shift by CtbLog2SizeY).

rx = CtbAddrInRs % PicWidthInCtbsY
ry = CtbAddrInRs / PicWidthInCtbsY
xCtb = rx << CtbLog2SizeY
yCtb = ry << CtbLog2SizeY
また、タイルを利用しない場合も、画面全体が一つのタイルであるとして、タイルの利用する利用しないに限らずに処理をしてもよい。
rx = CtbAddrInRs % PicWidthInCtbsY
ry = CtbAddrInRs / PicWidthInCtbsY
xCtb = rx << CtbLog2SizeY
yCtb = ry << CtbLog2SizeY
Also, even when tiles are not used, processing may be performed regardless of whether or not tiles are used, assuming that the entire screen is one tile.

(CTU以下の復号)
(ピクチャ内座標系を用いたフレキシブルタイルのCT分割)
CT情報復号部3021は符号化データからCT情報を復号し、再帰的に符号化ツリーCT(coding_quadtree)を復号する。具体的には、CT情報復号部3021はQT情報を復号し、対象CT coding_quadtree(x0,y0,log2CbSize,cqtDepth)を復号する。なお、(x0,y0)は対象CTの左上座標、log2CbSizeはCTのサイズであるCTサイズの2を底とした対数である対数CTサイズ、cqtDepthはCTの階層を示すCTデプス(QT深度)である。
(Decryption below CTU)
(CT division of flexible tiles using intra-picture coordinate system)
A CT information decoding unit 3021 decodes CT information from encoded data and recursively decodes a coding tree CT (coding_quadtree). Specifically, the CT information decoding unit 3021 decodes the QT information and decodes the target CT coding_quadtree (x0, y0, log2CbSize, cqtDepth). Note that (x0, y0) is the upper left coordinate of the target CT, log2CbSize is the logarithmic CT size that is the base 2 logarithm of the CT size, and cqtDepth is the CT depth (QT depth) that indicates the CT hierarchy. be.

(S1411)CT情報復号部3021は復号したCT情報にQT分割フラグがあるか否かを判定する。QT分割フラグがある場合にはS1421に遷移し、それ以外の場合にはS1422に遷移する。 (S1411) The CT information decoding unit 3021 determines whether or not the decoded CT information has a QT division flag. If there is a QT split flag, the process transitions to S1421; otherwise, the process transitions to S1422.

(S1421)CT情報復号部3021は、対数CTサイズlog2CbSizeがMinCbLog2SizeYより大きいと判定された場合には、QT分割フラグ(split_cu_flag)を復号する。
ここで、下式のように、タイルを用いる場合にはCTUの左上座標(xCtb,yCtb)とタイルサイ
ズを考慮して、さらなる四分木分割を実施するか否かを示すsplit_cu_flagを通知する。
(S1421) The CT information decoding unit 3021 decodes the QT split flag (split_cu_flag) when it is determined that the logarithmic CT size log2CbSize is larger than MinCbLog2SizeY.
Here, as in the following formula, when using tiles, split_cu_flag indicating whether or not to perform further quadtree splitting is notified in consideration of the upper left coordinates (xCtb, yCtb) of the CTU and the tile size.

if (x0+(1<<log2CbSize)-xTile<=wT && y0+(1<<log2CbSize)-yTile<=hT && log2CbSize>MinCbLog2SizeY)
split_cu_flag[x0][y0]
ここで、(x0,y0)はブロックの左上座標、(xTile,yTile)はタイルの左上座標、log2CbSizeはブロックサイズの対数値、wTとhTはタイル有効領域(もしくはタイル符号化領域)の幅と高さ、MinCbLog2SizeYはブロックの最小サイズの対数値である。
if (x0+(1<<log2CbSize)-xTile<=wT &&y0+(1<<log2CbSize)-yTile<=hT&&log2CbSize>MinCbLog2SizeY)
split_cu_flag[x0][y0]
where (x0,y0) is the upper left coordinate of the block, (xTile,yTile) is the upper left coordinate of the tile, log2CbSize is the logarithm of the block size, wT and hT are the width of the tile valid area (or tile encoding area) and The height, MinCbLog2SizeY, is the logarithm of the block's minimum size.

ブロックの右端の座標x0+(1<<log2CbSize)、下端の座標y0+(1<<log2CbSize)が、タイル有効領域の右端の座標xTile+wTileと下端の座標yTile+hTileよりも小さい場合、対象ブロックはタイル有効領域内に存在する。ブロックがタイル内に存在し、ブロックサイズが最小値よりも大きい場合(log2CbSize>MinCbLog2SizeY)、ブロックをさらに分割するか否かを示すフラグsplit_cu_flagを通知する。ブロックをさらに四分木分割する場合、split_cu_flagを1にセットし、ブロックを四分木分割しない場合、split_cu_flagを0にセットする。 If the right edge coordinate x0+(1<<log2CbSize) and the bottom edge coordinate y0+(1<<log2CbSize) of the block are smaller than the right edge coordinate xTile+wTile and the bottom edge coordinate yTile+hTile of the tile valid area, the target block is Exists in the tile valid area. If the block exists within the tile and the block size is larger than the minimum value (log2CbSize>MinCbLog2SizeY), a flag split_cu_flag indicating whether to further split the block is notified. Set split_cu_flag to 1 if the block is to be further quadtree split, and set split_cu_flag to 0 if the block is not to be quadtree split.

(S1422)CT情報復号部3021は、それ以外の場合には、符号化データからのQT分割フラグsplit_cu_flagの復号を省略し、QT分割フラグsplit_cu_flagに0をセットする。 (S1422) Otherwise, the CT information decoding unit 3021 omits decoding the QT split flag split_cu_flag from the encoded data and sets 0 to the QT split flag split_cu_flag.

(S1450)QT分割フラグsplit_cu_flagが0以外である場合にはS1451に遷移し、それ以外の場合にはS1471に遷移する。 (S1450) If the QT split flag split_cu_flag is other than 0, the process proceeds to S1451; otherwise, the process proceeds to S1471.

(S1451)CT情報復号部3021はQT分割を行う。具体的には、CT情報復号部3021は、CTデプスcqtDepth+1の位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1)において、対数CTサイズlog2CbSize-1の4つのCTを復号する。タイル内での各CTの右下座標(xi-xTile[TileId], yi-yTile[TileId])がタイルサイズ(wTile[TileId], hTile[TileId])未満のCTを復号する。逆に、各CTの右下座標(xi-xTile[TileId], yi+yTile[TileId])の何れかがタイルサイズ(wTile[TileId], hTile[TileId])以上のCTは復号しない。すなわち、CT情報復号部3021は、対象CTUを再帰的に符号化ツリーに分割し、分割されたCTの左上座標(x1, y0), (x0, y1), (x1, y1)が対象タイル内である場合に、符号化ツリーを処理する。 (S1451) The CT information decoding unit 3021 performs QT division. Specifically, the CT information decoding unit 3021 performs logarithmic CT size log2CbSize-1 Decode the four CTs of Decode CTs whose lower right coordinate (xi-xTile[TileId], yi-yTile[TileId]) of each CT within the tile is less than the tile size (wTile[TileId], hTile[TileId]). Conversely, any CT whose lower right coordinate (xi-xTile[TileId], yi+yTile[TileId]) is greater than or equal to the tile size (wTile[TileId], hTile[TileId]) is not decoded. That is, the CT information decoding unit 3021 recursively divides the target CTU into coding trees, and the upper left coordinates (x1, y0), (x0, y1), (x1, y1) of the divided CT are located in the target tile. , then process the coding tree.

coding_quadtree(x0,y0,log2CbSize-1,cqtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_quadtree(x0,y1,log2CbSize-1,cqtDepth+1)
if (x1-xTile[TileId] < wTile[TileId] && y1-yTile[TileId] < hTile[TileId])
coding_quadtree(x1,y1,log2CbSize-1,cqtDepth+1)
上記に置いて、例えば、4分木分割で得られた、(x1,y0)に位置するブロックであるcoding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1,wTile,hTile,xTile,yTile)は、以下のようにx1がタイル内に位置する場合に符号化あるいは復号される。
coding_quadtree(x0,y0,log2CbSize-1,cqtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_quadtree(x0,y1,log2CbSize-1,cqtDepth+1)
if (x1-xTile[TileId] < wTile[TileId] && y1-yTile[TileId] < hTile[TileId])
coding_quadtree(x1,y1,log2CbSize-1,cqtDepth+1)
Given the above, for example, coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1,wTile,hTile,xTile,yTile), a block located at (x1,y0) obtained by quadtree partitioning, is , is encoded or decoded if x1 lies within a tile as follows:

if (x1-xTile[TileId]<wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
ここで、(x0,y0)は対象CTの左上座標、(x1,y1)は以下の式のように(x0,y0)にCTサイズ(1<<log2CbSize)の1/2を加えて導出される。
if (x1-xTile[TileId]<wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
Here, (x0, y0) is the upper left coordinate of the target CT, and (x1, y1) is derived by adding 1/2 of the CT size (1<<log2CbSize) to (x0, y0) as shown in the following formula. be.

x1 = x0+(1<<(log2CbSize-1))
y1 = y0+(1<<(log2CbSize-1))
1<<Nは2のN乗と同値である(以下同様)。
x1 = x0+(1<<(log2CbSize-1))
y1 = y0+(1<<(log2CbSize-1))
1<<N is equivalent to 2 to the Nth power (and so on).

そして、CT情報復号部3021は、下式のように、CTの階層を示すCTデプスcqtDepthと対数CTサイズlog2CbSizeを更新する。 Then, the CT information decoding unit 3021 updates the CT depth cqtDepth indicating the layer of CT and the logarithmic CT size log2CbSize as shown in the following formula.

cqtDepth = cqtDepth+1
log2CbSize = log2CbSize-1
CT情報復号部3021は、下位のCTにおいても、更新された左上座標、対数CTサイズ、CTデプスを用いて、S1411から開始されるQT情報復号を継続する。
cqtDepth = cqtDepth + 1
log2CbSize = log2CbSize-1
The CT information decoding unit 3021 continues QT information decoding starting from S1411 using the updated upper left coordinate, logarithmic CT size, and CT depth for lower CTs as well.

QT分割終了後、CT情報復号部3021は符号化データからCT情報を復号し、再帰的に符号化ツリーCT(MT、coding_multitree(図9)あるいはmulti_type_tree(図29))を復号する。具体的には、CT情報復号部3021は、MT分割情報を復号し、対象CT coding_multitree(x0,y0,log2CbWidth,log2CbHeight,cbtDepth)、あるいは、multi_type_tree(x0,y0,cbWidth,cbHeight,mttDepth,depthOffset,partIdx,treeType)を復号する。なお、log2CbWidthはCTの幅の対数値、log2CbHeightはCTの高さの対数値、cbtDepthはマルチツリーの階層を示すCTデプス(MT深度)である。以下では、coding_multitreeについて説明する。 After the QT division, the CT information decoding unit 3021 decodes the CT information from the encoded data, and recursively decodes the coding tree CT (MT, coding_multitree (Fig. 9) or multi_type_tree (Fig. 29)). Specifically, the CT information decoding unit 3021 decodes the MT division information, the target CT coding_multitree (x0, y0, log2CbWidth, log2CbHeight, cbtDepth) or multi_type_tree (x0, y0, cbWidth, cbHeight, mttDepth, depthOffset, decrypt partIdx, treeType). Note that log2CbWidth is the logarithmic value of the CT width, log2CbHeight is the logarithmic value of the CT height, and cbtDepth is the CT depth (MT depth) indicating the hierarchy of the multitree. The coding_multitree is explained below.

(S1471)CT情報復号部3021は、復号したCT情報にMT分割フラグ(分割情報)があるか否かを判定する。MT分割フラグがある場合にはS1481に遷移する。それ以外の場合にはS1482に遷移する。 (S1471) The CT information decoding unit 3021 determines whether or not the decoded CT information has an MT division flag (division information). If there is an MT division flag, the process transitions to S1481. Otherwise, the process proceeds to S1482.

(S1481)CT情報復号部3021はMT分割フラグsplit_mt_flagを復号する。 (S1481) CT information decoding section 3021 decodes MT split flag split_mt_flag.

(S1482)CT情報復号部3021は符号化データからMT分割フラグsplit_mt_flagを復号せず、0に設定する。 (S1482) The CT information decoding unit 3021 does not decode the MT split flag split_mt_flag from the encoded data, and sets it to 0.

(S1490)CT情報復号部3021は、MT分割フラグsplit_mt_flagが0以外の場合には、S1491に遷移する。それ以外の場合には、CT情報復号部3021は対象CTを分割せず、処理を終了する(CUの復号に移行する)。 (S1490) If the MT split flag split_mt_flag is other than 0, the CT information decoding unit 3021 transitions to S1491. Otherwise, the CT information decoding unit 3021 does not divide the target CT and ends the process (moves to CU decoding).

(S1491)CT情報復号部3021はMT分割を行う。MT分割の方向を示すフラグsplit_mt_dirと、MT分割が2分木であるか3分木であるかを示すシンタックス要素split_mt_typeを復号する。CT情報復号部3021は、分割されたCTの左上座標が対象タイル内である場合に、符号化ツリーを処理する。CTの左上座標は2分木では、(x0, y1)もしくは(x1, y0)、3分木では(x0, y1), (x0, y2)もしくは(x1, y0), (x2, y0)。である。ここで先頭CTの左上座標(x0, y0)がタイル外になる場合には分割自体されないため、(x0, y0)は常にタイル内であると仮定する。 (S1491) The CT information decoding unit 3021 performs MT division. Decode the flag split_mt_dir indicating the direction of the MT split and the syntax element split_mt_type indicating whether the MT split is a binary tree or a ternary tree. The CT information decoding unit 3021 processes the coding tree when the upper left coordinate of the divided CT is within the target tile. The upper left coordinates of CT are (x0, y1) or (x1, y0) for binary trees, and (x0, y1), (x0, y2) or (x1, y0), (x2, y0) for ternary trees. is. If the upper left coordinates (x0, y0) of the top CT are outside the tile, the division itself is not performed, so (x0, y0) is always assumed to be inside the tile.

CT情報復号部3021は、MT分割タイプsplit_mt_typeが0(2分割)、かつ、MT分割方向split_dir_flagが1(水平分割)の場合は、以下の2つのCTを復号(BT分割情報復号)する。タイル内でのCT(x0, y1)の下座標y1-yTile[TileId]がタイルサイズhTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの下座標y1-yTile[TileId]がタイルサイズhTile[TileId]以上のCTは復号しない。 When the MT split type split_mt_type is 0 (two split) and the MT split direction split_dir_flag is 1 (horizontal split), the CT information decoding unit 3021 decodes the following two CTs (BT split information decoding). Decode CTs whose lower coordinates y1-yTile[TileId] of CT(x0, y1) in the tile are less than the tile size hTile[TileId]. Conversely, CTs whose lower coordinates y1-yTile[TileId] of each CT within the tile are equal to or greater than the tile size hTile[TileId] are not decoded.

coding_multitree(x0,y0,log2CbWidth,log2CbHeight-1,cbtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y1,log2CbWidth,log2CbHeight-1,cbtDepth+1)
一方、MT分割方向split_dir_flagが0(垂直分割)の場合は、以下の2つのCTを復号(BT分割情報復号)する。タイル内でのCT(x1, y0)の右座標x1-xTile[TileId]がタイルサイ
ズwTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの右座標x1-xTile[TileId]がタイルサイズwTile[TileId]以上のCTは復号しない。
coding_multitree(x0,y0,log2CbWidth,log2CbHeight-1,cbtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y1,log2CbWidth,log2CbHeight-1,cbtDepth+1)
On the other hand, when the MT split direction split_dir_flag is 0 (vertical split), the following two CTs are decoded (BT split information decoded). Decode CTs whose right coordinate x1-xTile[TileId] of CT(x1, y0) in the tile is less than the tile size wTile[TileId]. Conversely, CTs whose right coordinate x1-xTile[TileId] of each CT within the tile is equal to or greater than the tile size wTile[TileId] are not decoded.

coding_multitree(x0,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_multitree(x1,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
ここで、(x1,y1)は以下の式で導出される。
coding_multitree(x0,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_multitree(x1,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
Here, (x1, y1) is derived by the following formula.

x1 = x0+(1<<(log2CbWidth-1))
y1 = y0+(1<<(log2CbHeight-1))
さらに、log2CbWidth、または、log2CbHeightを下式のように更新する。
x1 = x0+(1<<(log2CbWidth-1))
y1 = y0+(1<<(log2CbHeight-1))
Furthermore, update log2CbWidth or log2CbHeight as shown in the following formula.

log2CbWidth = log2CbWidth-1
log2CbHeight = log2CbHeight-1
CT情報復号部3021は、MT分割タイプsplit_mt_typeが1(3分割)を示す場合には、3つのCTを復号(TT分割情報復号)する。
log2CbWidth = log2CbWidth - 1
log2CbHeight = log2CbHeight-1
The CT information decoding unit 3021 decodes three CTs (TT split information decoding) when the MT split type split_mt_type indicates 1 (3 splits).

MT分割方向split_dir_flagが1(水平分割)の場合は、以下の3つのCTを復号する。タイル内でのi=0, 1の各CT(x0, yi)の下座標yi-yTile[TileId]がタイルサイズhTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの下座標yi-yTile[TileId]がタイルサイズhTile[TileId]以上のCTは復号しない。 When the MT split direction split_dir_flag is 1 (horizontal split), the following three CTs are decoded. Decode CTs whose lower coordinates yi-yTile[TileId] of each CT (x0, yi) of i=0, 1 in the tile are less than the tile size hTile[TileId]. Conversely, CTs whose lower coordinates yi-yTile[TileId] of each CT within the tile are equal to or larger than the tile size hTile[TileId] are not decoded.

coding_multitree(x0,y0,log2CbWidth,log2CbHeight-2,cbtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y1,log2CbWidth,log2CbHeight-1,cbtDepth+1)
if (y2-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y2,log2CbWidth,log2CbHeight-2,cbtDepth+1)
一方、MT分割方向split_dir_flagが1(垂直分割)の場合は、以下の3つのCTを復号(TT分割情報復号)する。タイル内でのi=0, 1の各CT(xi, y0)の右座標xi-xTile[TileId]がタイルサイズwTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの右座標xi-xTile[TileId]がタイルサイズwTile[TileId]以上のCTは復号しない。
coding_multitree(x0,y0,log2CbWidth,log2CbHeight-2,cbtDepth+1)
if (y1-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y1,log2CbWidth,log2CbHeight-1,cbtDepth+1)
if (y2-yTile[TileId] < hTile[TileId])
coding_multitree(x0,y2,log2CbWidth,log2CbHeight-2,cbtDepth+1)
On the other hand, when the MT split direction split_dir_flag is 1 (vertical split), the following three CTs are decoded (TT split information decoded). Decode CTs whose right coordinate xi-xTile[TileId] of each CT(xi, y0) of i=0, 1 in the tile is less than the tile size wTile[TileId]. Conversely, CTs whose right coordinate xi-xTile[TileId] of each CT within the tile is greater than or equal to the tile size wTile[TileId] are not decoded.

coding_multitree(x0,y0,log2CbWidth-2,log2CbHeight,cbtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_multitree(x1,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
if (x2-xTile[TileId] < wTile[TileId])
coding_multitree(x2,y0,log2CbWidth-2,log2CbHeight,cbtDepth+1)
ここで、(x1,y1)、(x2,y2)は、以下の式のように、導出される。
coding_multitree(x0,y0,log2CbWidth-2,log2CbHeight,cbtDepth+1)
if (x1-xTile[TileId] < wTile[TileId])
coding_multitree(x1,y0,log2CbWidth-1,log2CbHeight,cbtDepth+1)
if (x2-xTile[TileId] < wTile[TileId])
coding_multitree(x2,y0,log2CbWidth-2,log2CbHeight,cbtDepth+1)
Here, (x1, y1) and (x2, y2) are derived as in the following formulas.

x1 = x0+(1<<(log2CbWidth-2))
y1 = y0+(1<<(log2CbHeight-2))
x2 = x0+(3<<(log2CbWidth-2))
y2 = y0+(3<<(log2CbHeight-2))
CT情報復号部3021は、下位のCTにおいても、更新された左上座標、CTの幅及び高さ、MT深度を用いて、S1471から開始されるBT分割情報復号、あるいは、TT分割情報復号を継続する。
x1 = x0+(1<<(log2CbWidth-2))
y1 = y0+(1<<(log2CbHeight-2))
x2 = x0+(3<<(log2CbWidth-2))
y2 = y0+(3<<(log2CbHeight-2))
The CT information decoding unit 3021 continues BT division information decoding or TT division information decoding starting from S1471 using the updated upper left coordinate, width and height of CT, and MT depth in the lower CT. do.

また、CT情報復号部3021は、MT分割フラグsplit_mt_flagが0の場合、すなわちQT分割もMT分割も行われない場合には、CU復号部3022でCU(coding_unit(x0,y0,log2CbSize, cqtDepth))を復号する。 Further, when the MT split flag split_mt_flag is 0, that is, when neither QT splitting nor MT splitting is performed, the CT information decoding unit 3021 performs CU (coding_unit (x0, y0, log2CbSize, cqtDepth)) in the CU decoding unit 3022 to decrypt.

以下、画面内座標系とは、対象画面の左上座標を基準とする対象ブロックの輝度左上座標を用いることであり、タイル内座標系とは、対象タイルの左上座標を基準とする対象ブロックの輝度左上座標をもちいることであってもよい。 Hereinafter, the intra-screen coordinate system refers to using the luminance upper left coordinates of the target block based on the upper left coordinates of the target screen, and the intra-tile coordinate system refers to the luminance of the target block based on the upper left coordinates of the target tile. It is also possible to use upper left coordinates.

以上のように、画面内座標系で表現される各CUの左上座標(xi, yi)から、タイル左上座標(xTile, yTile)を引いて、タイル内座標系の左上座標を導出し、それをタイルサイズ(wTile, hTile)と比較することで、分割フラグを復号し、各CTを復号する。これによって、タイルサイズがCTUサイズの整数倍ではない場合においても、無駄な分割フラグ、無駄なCTを復号することなく、効率的にCU分割を行うことが可能であるという効果を奏する。 As described above, the tile upper left coordinates (xTile, yTile) are subtracted from the upper left coordinates (xi, yi) of each CU expressed in the in-screen coordinate system to derive the upper left coordinates in the tile coordinate system, which are then converted to Decode the split flag and decode each CT by comparing with the tile size (wTile, hTile). As a result, even when the tile size is not an integral multiple of the CTU size, it is possible to efficiently perform CU partitioning without decoding unnecessary partition flags and unnecessary CTs.

(タイル分割の別の例)
図31のシンタックステーブルを用いてタイル分割の別の例を説明する。この例では、画面を矩形のタイルに分割し、タイルをグループとした単位を用いて符号化データを構成する。タイルの左上座標はxTile, yTile、タイルの幅、高さはwTile, hTileである。タイルの先頭位置を格納するテーブルFirstCtbAddrTsとタイルグループの位置tile_group_addressから、先頭タイルのCTUアドレスctbAddrInTsを導出する。0からnum_tiles_in_tile_group_minus1までのタイルを復号する。num_tiles_in_tile_group_minus1は、ピクチャ内のタイルの個数から1を引いた値である。TileIdで示される各タイルについて0からNumCtusInTile[tileIdx]までのCTUを復号する。タイルの終端でend_of_tile_one_bitとバイトアライン用ビットbyte_alignment()を復号する。またタイル内におけるCTU位置jをcoding_tree_unitの引数としてCTUを復号する。jは、CtbAddrInTileの値として設定される。
(another example of tiling)
Another example of tile division will be described using the syntax table of FIG. In this example, the screen is divided into rectangular tiles, and the coded data is formed using the tiles as a group. The top left coordinates of the tile are xTile, yTile, and the width and height of the tile are wTile, hTile. The CTU address ctbAddrInTs of the leading tile is derived from the table FirstCtbAddrTs storing the leading position of the tile and the position tile_group_address of the tile group. Decode tiles from 0 to num_tiles_in_tile_group_minus1. num_tiles_in_tile_group_minus1 is the number of tiles in the picture minus one. Decode CTUs from 0 to NumCtusInTile[tileIdx] for each tile indicated by TileId. At the end of the tile, decode the end_of_tile_one_bit and the byte alignment bit byte_alignment(). Also, the CTU is decoded using the CTU position j in the tile as an argument of coding_tree_unit. j is set as the value of CtbAddrInTile.

図31(b)は、タイル座標系におけるCTU位置CtbAddrInTileを用いて、各CTUを復号する例を示す。タイル内のCTU単位のラスタスキャン位置CtbAddrInTileと、タイルのCTU単位のサイズTileWidthInCtusから、タイル内のCTU単位の位置(rx,ry)とタイル内の画素単位の位置(xCtb,yCtb)を導出する。導出したタイル内座標系のCTU位置を用いて、以下のようにCTUを復号する。なお、タイル内のCTU単位のラスタ位置CtbAddrInTileは、画面単位のCTU位置CtbAddrInTsからタイルの先頭位置FirstCtbAddrTsを引いて導出してもよい。 FIG. 31(b) shows an example of decoding each CTU using the CTU position CtbAddrInTile in the tile coordinate system. From the raster scan position CtbAddrInTile in CTU units in the tile and the size TileWidthInCtus in CTU units of the tile, the position in CTU units in the tile (rx, ry) and the position in pixel units in the tile (xCtb, yCtb) are derived. Using the derived CTU position in the intra-tile coordinate system, decode the CTU as follows. Note that the raster position CtbAddrInTile in units of CTU within a tile may be derived by subtracting the start position FirstCtbAddrTs of the tile from the CTU position CtbAddrInTs in units of screen.

CtbAddrInTile = CtbAddrInTs - FirstCtbAddrTs[tile_group_id]
(CTU以下の復号)
(タイル内座標系を用いたフレキシブルタイルのCT分割)
図7、図32、図33のシンタックステーブルを復号する場合のCT情報復号部3021の動作を説明する。本構成のタイル左上の座標を原点とするタイル内座標系を用いて、CTU座標(xCtb, yCtb)を導出し、そのCTU座標とタイルサイズ(wTile, hTile)に基づいて再帰的にCT情報及びMT分割情報を復号して、CT情報を復号する。
CtbAddrInTile = CtbAddrInTs - FirstCtbAddrTs[tile_group_id]
(Decryption below CTU)
(CT division of flexible tiles using intra-tile coordinate system)
The operation of CT information decoding section 3021 when decoding the syntax tables of FIGS. 7, 32, and 33 will be described. CTU coordinates (xCtb, yCtb) are derived using the intra-tile coordinate system with the coordinates of the upper left corner of the tile of this configuration as the origin, and CT information and Decode the MT division information and decode the CT information.

まず、CT情報復号部3021は符号化データからCT情報を復号し、再帰的に符号化ツリーCT(coding_quadtree)を復号する。具体的には、CT情報復号部3021はQT情報を復号し、対象CT coding_quadtree(x0,y0,log2CbSize,cqtDepth,treeType)を復号する。 First, the CT information decoding unit 3021 decodes the CT information from the encoded data, and recursively decodes the coding tree CT (coding_quadtree). Specifically, the CT information decoding unit 3021 decodes the QT information and decodes the target CT coding_quadtree (x0, y0, log2CbSize, cqtDepth, treeType).

(S1411)CT情報復号部3021は復号したCT情報にQT分割フラグがあるか否かを判定する。QT分割フラグがある場合にはS1421に遷移し、それ以外の場合にはS1422に遷移する。 (S1411) The CT information decoding unit 3021 determines whether or not the decoded CT information has a QT division flag. If there is a QT split flag, the process transitions to S1421; otherwise, the process transitions to S1422.

(S1421)CT情報復号部3021は、対数CTサイズlog2CbSizeがMinCbLog2SizeYより大きいと判定された場合には、QT分割フラグ(qt_split_cu_flag)を復号する。
ここで、下式のように、タイルを用いる場合にはタイル内座標系におけるCTの左上座標 (x0,y0)とタイルサイズを考慮して、さらなる四分木分割を実施するか否かを示すqt_split_cu_flagが通知される。
(S1421) The CT information decoding unit 3021 decodes the QT split flag (qt_split_cu_flag) when it is determined that the logarithmic CT size log2CbSize is larger than MinCbLog2SizeY.
Here, as shown in the following formula, when tiles are used, the upper left coordinates (x0, y0) of CT in the tile coordinate system and the tile size are taken into account to indicate whether or not to perform further quadtree division. qt_split_cu_flag is notified.

if ((((x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
((y0+(1<<log2CbSize) <= hTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2 &&
log2CbSize > MinQtLog2SizeY)
qt_split_cu_flag[x0][y0]
つまり、ブロックの右端の座標x0+(1<<log2CbSize)、下端の座標y0+(1<<log2CbSize)の両方が、タイル幅wTileとタイル高さhTile以下の場合、
(x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
((y0+(1<<log2CbSize) <= hTile[TileId])?1:0)>=2
もしくは、ブロックの右端の座標x0+(1<<log2CbSize)がタイル幅wTile以下で、CTサイズが最大BTサイズMaxBtSizeY以上の場合、
(x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2
もしくは、ブロックの下端の座標y0+(1<<log2CbSize)がタイル高さhTile以下で、CTサイズが最大BTサイズMaxBtSizeY以上の場合、
(y0+(1<<log2CbSize) <= hTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2
の場合に、QT分割フラグqt_split_cu_flagを符号化データから復号する。
if ((((x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
((y0+(1<<log2CbSize) <= hTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2 &&
log2CbSize > MinQtLog2SizeY)
qt_split_cu_flag[x0][y0]
In other words, if both the coordinates x0+(1<<log2CbSize) of the right edge of the block and the coordinates y0+(1<<log2CbSize) of the bottom edge of the block are less than the tile width wTile and the tile height hTile,
(x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
((y0+(1<<log2CbSize) <= hTile[TileId])?1:0)>=2
Alternatively, if the coordinate x0+(1<<log2CbSize) of the right end of the block is less than the tile width wTile and the CT size is greater than the maximum BT size MaxBtSizeY,
(x0+(1<<log2CbSize) <= wTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2
Alternatively, if the coordinate y0+(1<<log2CbSize) of the bottom edge of the block is less than the tile height hTile and the CT size is greater than the maximum BT size MaxBtSizeY,
(y0+(1<<log2CbSize) <= hTile[TileId])?1:0)+
(((1<<log2CbSize) <= MaxBtSizeY)?1:0)) >= 2
, decode the QT split flag qt_split_cu_flag from the encoded data.

(S1422)CT情報復号部3021は、それ以外の場合には、符号化データからのQT分割フラグqt_split_cu_flagの復号を省略し、QT分割フラグqt_split_cu_flagを、タイルサイズ(wTile, hTile)を用いて以下のように導出する。 (S1422) In other cases, the CT information decoding unit 3021 omits decoding the QT split flag qt_split_cu_flag from the encoded data, and sets the QT split flag qt_split_cu_flag to the following using the tile size (wTile, hTile). We derive

以下の何れかが真の場合、qt_split_cu_flagに1を導出する。 Derive 1 in qt_split_cu_flag if any of the following are true:

x0+(1<<log2CbSize) > wTile[TileId] && (1<<log2CbSize) > MaxBtSizeY
y0+(1<<log2CbSize) > hTile[TileId] && (1<<log2CbSize) > MaxBtSizeY
以下の全てが真の場合、qt_split_cu_flagに1を導出する。
x0+(1<<log2CbSize) > wTile[TileId] &&(1<<log2CbSize)> MaxBtSizeY
y0+(1<<log2CbSize) > hTile[TileId] &&(1<<log2CbSize)> MaxBtSizeY
Derive 1 in qt_split_cu_flag if all of the following are true:

x0+(1<<log2CbSize) > wTile[TileId]
y0+(1<<log2CbSize) > hTile[TileId]
(1<<log2CbSize) > MinQtSizeY
上記以外の場合、qt_split_cu_flagに1を導出する。
x0+(1<<log2CbSize) > wTile[TileId]
y0+(1<<log2CbSize) > hTile[TileId]
(1<<log2CbSize) > MinQtSizeY
Otherwise, derive 1 in qt_split_cu_flag.

すなわち、CT右座標がタイルサイズ幅を超えており、かつ、CTサイズが最大BT分割サイズMaxBtSizeYを超えている場合には必ず分割する(qt_split_cu_flagに1を導出)。 That is, when the CT right coordinate exceeds the tile size width and the CT size exceeds the maximum BT split size MaxBtSizeY, the tile is always split (qt_split_cu_flag is derived to 1).

CT下座標がタイルサイズ高さを超えており、かつ、CTサイズが最大BT分割サイズMaxBtSizeYを超えている場合には必ず分割する(qt_split_cu_flagに1を導出)。 When the CT bottom coordinate exceeds the tile size height and the CT size exceeds the maximum BT split size MaxBtSizeY, it must be split (qt_split_cu_flag is derived to 1).

CT右下座標がタイルサイズを超えている場合にも必ず分割する(qt_split_cu_flagに1を導出)。 Even when the CT lower right coordinate exceeds the tile size, it is always split (1 is derived to qt_split_cu_flag).

(S1450)QT分割フラグsplit_cu_flagが0以外である場合にはS1451に遷移し、それ以外の場合にはS1471に遷移する。 (S1450) If the QT split flag split_cu_flag is other than 0, the process proceeds to S1451; otherwise, the process proceeds to S1471.

(S1451)CT情報復号部3021はQT分割を行う。具体的には、CT情報復号部3021は、CTデプスcqtDepth+1の位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1)において、対数CTサイズlog2CbSize-1の4つのCTを復号する。タイル内での各CTの右下座標(xi-xTile[TileId], yi+yT
ile[TileId])がタイルサイズ(wTile[TileId], hTile[TileId])以下のCTを復号する。逆に、各CTの右下座標(xi, yi)の何れかがタイルサイズ(wTile[TileId], hTile[TileId])より大きいCTは復号しない。すなわち、CT情報復号部3021は、対象CTUを再帰的に符号化ツリーに分割し、分割されたCTの左上座標(x1, y0)、(x0, y1)、(x1, y1)が対象タイル内である場合に、符号化ツリーを処理する。
(S1451) The CT information decoding unit 3021 performs QT division. Specifically, the CT information decoding unit 3021 performs logarithmic CT size log2CbSize-1 Decode the four CTs of The lower right coordinate of each CT within the tile (xi-xTile[TileId], yi+yT
ile[TileId]) is less than or equal to the tile size (wTile[TileId], hTile[TileId]). Conversely, CTs whose lower right coordinates (xi, yi) are larger than the tile size (wTile[TileId], hTile[TileId]) are not decoded. That is, the CT information decoding unit 3021 recursively divides the target CTU into coding trees, and the upper left coordinates (x1, y0), (x0, y1), and (x1, y1) of the divided CT are in the target tile. , then process the coding tree.

coding_quadtree(x0,y0,log2CbSize-1,cqtDepth+1)
if (x1 < wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
if (y1 < hTile[TileId])
coding_quadtree(x0,y1,log2CbSize-1,cqtDepth+1)
if (x1 < wTile[TileId] && y1 < hTile[TileId])
coding_quadtree(x1,y1,log2CbSize-1,cqtDepth+1)
上記において、例えば、4分木分割で得られた、(x1,y0)に位置するブロックであるcoding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)は、以下のようにx1がタイル内に位置する場合に符号化あるいは復号される。
coding_quadtree(x0,y0,log2CbSize-1,cqtDepth+1)
if (x1 < wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
if (y1 < hTile[TileId])
coding_quadtree(x0,y1,log2CbSize-1,cqtDepth+1)
if (x1 < wTile[TileId] && y1 < hTile[TileId])
coding_quadtree(x1,y1,log2CbSize-1,cqtDepth+1)
In the above, for example, coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1), which is a block located at (x1,y0) obtained by quadtree partitioning, x1 is in the tile as follows Encoded or decoded if located.

if (x1<wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
ここで、(x0,y0)は対象CTの左上座標、(x1,y1)は以下の式のように(x0,y0)にCTサイズ(1<<log2CbSize)の1/2を加えて導出される。
if (x1<wTile[TileId])
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)
Here, (x0, y0) is the upper left coordinate of the target CT, and (x1, y1) is derived by adding 1/2 of the CT size (1<<log2CbSize) to (x0, y0) as shown in the following formula. be.

x1 = x0+(1<<(log2CbSize-1))
y1 = y0+(1<<(log2CbSize-1))
1<<Nは2のN乗と同値である(以下同様)。
x1 = x0+(1<<(log2CbSize-1))
y1 = y0+(1<<(log2CbSize-1))
1<<N is equivalent to 2 to the Nth power (and so on).

そして、CT情報復号部3021は、下式のように、CTの階層を示すCTデプスcqtDepthと対数CTサイズlog2CbSizeを更新する。 Then, the CT information decoding unit 3021 updates the CT depth cqtDepth indicating the layer of CT and the logarithmic CT size log2CbSize as shown in the following formula.

cqtDepth = cqtDepth+1
log2CbSize = log2CbSize-1
CT情報復号部3021は、下位のCTにおいても、更新された左上座標、対数CTサイズ、CTデプスを用いて、S1411から開始されるQT情報復号を継続する。
cqtDepth = cqtDepth + 1
log2CbSize = log2CbSize-1
The CT information decoding unit 3021 continues QT information decoding starting from S1411 using the updated upper left coordinate, logarithmic CT size, and CT depth for lower CTs as well.

QT分割終了後、CT情報復号部3021は符号化データからCT情報を復号し、再帰的に符号化ツリーCT(MT、multi_type_tree)を復号する。具体的には、CT情報復号部3021は、タイル内座標とタイルサイズを用いて、MT分割情報を復号し、対象CT multi_type_tree (x0,y0,CbWidth,CbHeight,mttDepth,depthOffset,partIdx,treeType)を復号する。なお、CbWidthはCTの幅、CbHeightはCTの高さ、mttDepthはマルチツリーの階層を示すCTデプス(MT深度)である。 After the QT division, the CT information decoding unit 3021 decodes the CT information from the encoded data, and recursively decodes the encoded tree CT (MT, multi_type_tree). Specifically, the CT information decoding unit 3021 decodes the MT division information using the intra-tile coordinates and the tile size, and converts the target CT multi_type_tree (x0, y0, CbWidth, CbHeight, mttDepth, depthOffset, partIdx, treeType) into Decrypt. Note that CbWidth is the CT width, CbHeight is the CT height, and mttDepth is the CT depth (MT depth) indicating the hierarchy of the multi-tree.

(S1471)CT情報復号部3021は、復号したCT情報にMT分割フラグ(分割情報、すなわちmtt_split_cu_flag、mtt_split_cu_vertical_flag、mtt_split_cu_binary_flag)があるか否かを判定する。以下の判定により、MT分割フラグがある場合にはS1481に遷移する。それ以外の場合にはS1482に遷移する。 (S1471) The CT information decoding unit 3021 determines whether or not the decoded CT information has an MT split flag (split information: mtt_split_cu_flag, mtt_split_cu_vertical_flag, mtt_split_cu_binary_flag). Based on the determination below, if there is an MT division flag, the process proceeds to S1481. Otherwise, the process proceeds to S1482.

(allowSplitBtVer || allowSplitBtHor || allowSplitTtVer || allowSplitTtHor)
&& (x0+cbWidth<=wTile[TileId]) && (y0+cbHeight<=hTile[TileId])
ここで、allowSplitBtVer、allowSplitBtHorは以下の処理により導出する。
(allowSplitBtVer || allowSplitBtHor || allowSplitTtVer || allowSplitTtHor)
&&(x0+cbWidth<=wTile[TileId])&&(y0+cbHeight<=hTile[TileId])
Here, allowSplitBtVer and allowSplitBtHor are derived by the following processing.

以下の何れかが真の場合、allowBtSplitを偽(FALTH)とする。
・cbSize <= MinBtSizeY
・cbWidth > MaxBtSizeY
・cbHeight > MaxBtSizeY
・mttDepth >= MaxMttDepth + depthOffset
上記以外で以下の全てが真の場合、allowBtSplitを偽とする。
・btSplit = SPLIT_BT_VER
・y0 + cbHeight > hTile[TileId]
上記以外で以下の全てが真の場合、allowBtSplitを偽とする。
・btSplit = SPLIT_BT_HOR
・x0 + cbWidth > wTile[TileId]
上記以外で以下の全てが真の場合、allowBtSplitを偽とする。
・mttDepth > 0
・partIdx = 1
・MttSplitMode[ x0 ][ y0 ][ mttDepth - 1 ] = parallelTtSplit
上記以外の場合、allowBtSplitを真とする。
・allowBtSplit = TRUE
ここでcbSize、parallelTtSplitは、以下のように設定する。
If any of the following is true, let allowBtSplit be false (FALTH).
・cbSize <= MinBtSizeY
・cbWidth > MaxBtSizeY
・cbHeight > MaxBtSizeY
・mttDepth >= MaxMttDepth + depthOffset
Except for the above, if all of the following are true, then allowBtSplit is false.
・btSplit = SPLIT_BT_VER
・y0 + cbHeight > hTile[TileId]
Except for the above, if all of the following are true, then allowBtSplit is false.
・btSplit = SPLIT_BT_HOR
・x0 + cbWidth > wTile[TileId]
Except for the above, if all of the following are true, then allowBtSplit is false.
・mttDepth > 0
・partIdx = 1
・MttSplitMode[ x0 ][ y0 ][ mttDepth - 1 ] = parallelTtSplit
Otherwise, let allowBtSplit be true.
・allowBtSplit = TRUE
Here cbSize and parallelTtSplit are set as follows.

SPLIT_BT_VER(allowSplitBtVer)の場合、cbSize=cbWidth、parallelTtSplit= SPLIT_TT_VER
SPLIT_BT_HOR(allowSplitBtHor)の場合、cbSize=cbHeight、parallelTtSplit=SPLIT_TT_HOR
なお、allowSplitTtVer、allowSplitTtHorは以下の処理により導出する。
For SPLIT_BT_VER(allowSplitBtVer), cbSize=cbWidth, parallelTtSplit= SPLIT_TT_VER
If SPLIT_BT_HOR(allowSplitBtHor) then cbSize=cbHeight, parallelTtSplit=SPLIT_TT_HOR
Note that allowSplitTtVer and allowSplitTtHor are derived by the following processing.

以下の何れかが真の場合、allowTtSplit(allowTtSplirHor, allowTtSplirVer)を偽(FALTH)とする。
・cbSize <= 2 * MinTtSizeY
・cbWidth > MaxTtSizeY
・cbHeight > MaxTtSizeY
・mttDepth >= MaxMttDepth + depthOffset
・x0 + cbWidth > wTile[TileId]
・y0 + cbHeight > hTile[TileId]
上記以外の場合、allowTtSplit(allowTtSplirHor, allowTtSplirVer)を真とする。
・allowTtSplit = TRUE
ここでcbSizeは、以下のように設定する。
If any of the following is true, let allowTtSplit(allowTtSplirHor, allowTtSplirVer) be false (FALTH).
・cbSize <= 2 * MinTtSizeY
・cbWidth > MaxTtSizeY
・cbHeight > MaxTtSizeY
・mttDepth >= MaxMttDepth + depthOffset
・x0 + cbWidth > wTile[TileId]
・y0 + cbHeight > hTile[TileId]
Otherwise, let allowTtSplit(allowTtSplirHor, allowTtSplirVer) be true.
・allowTtSplit = TRUE
Here cbSize is set as follows.

SPLIT_TT_VER(allowSplitTtVer)の場合、cbSize=cbWidth
SPLIT_TT_HOR(allowSplitTtHor)の場合、cbSize=cbHeight
すなわち、CT右座標がタイルサイズ幅を超えるか、CT下座標がタイルサイズ高さを超えいるかに応じて、MT分割フラグを符号化するか否かを決定する。
If SPLIT_TT_VER(allowSplitTtVer) then cbSize=cbWidth
If SPLIT_TT_HOR(allowSplitTtHor) then cbSize=cbHeight
That is, whether or not to encode the MT division flag is determined depending on whether the CT right coordinate exceeds the tile size width or the CT bottom coordinate exceeds the tile size height.

(S1481)CT情報復号部3021はMT分割フラグmtt_split_cu_flagを復号する。 (S1481) The CT information decoding unit 3021 decodes the MT split flag mtt_split_cu_flag.

(S1482)CT情報復号部3021は符号化データからMT分割フラグmtt_split_cu_flagを復号せず、以下のように導出する。 (S1482) The CT information decoding unit 3021 does not decode the MT split flag mtt_split_cu_flag from the encoded data, but derives it as follows.

以下のいずれかが真の場合、mtt_split_cu_flagに1を導出する。
・x0 + cbWidth > wTile[TileId]
・x0 + cbHeight > hTile[TileId]
上記以外の場合、mtt_split_cu_flagに0を導出する。すなわち、タイル内座標におけるCTの右端および下端座標がタイルサイズを超える場合には、MT分割フラグを復号しない。
Derive 1 in mtt_split_cu_flag if any of the following is true:
・x0 + cbWidth > wTile[TileId]
・x0 + cbHeight > hTile[TileId]
Otherwise, derive 0 in mtt_split_cu_flag. That is, if the right and bottom coordinates of CT in the tile coordinates exceed the tile size, the MT division flag is not decoded.

すなわち、CT右座標がタイルサイズ幅を超えるか、CT下座標がタイルサイズ高さを超えいるかに応じて、TT分割フラグを符号化するか否かを決定する。 That is, whether or not to encode the TT division flag is determined depending on whether the CT right coordinate exceeds the tile size width or the CT bottom coordinate exceeds the tile size height.

(S1490)CT情報復号部3021は、MT分割フラグsplit_mt_flagが0以外の場合には、S1491に遷移する。それ以外の場合には、CT情報復号部3021は対象CTを分割せず、処理を終了する(CUの復号に移行する)。 (S1490) If the MT split flag split_mt_flag is other than 0, the CT information decoding unit 3021 transitions to S1491. Otherwise, the CT information decoding unit 3021 does not divide the target CT and ends the process (moves to CU decoding).

(S1491)CT情報復号部3021はMT分割を行う。BT分割もしくはTT分割が可能な場合(allowSplitBtHor || allowSplitTtHor ) || ( allowSplitBtVer || allowSplitTtVer ))、MT分割の方向を示すフラグmtt_split_cu_vertical_flagを復号する。復号した分割方法mtt_split_cu_vertical_flagにおいて、BT分割とTT分割の両者が可能な場合(( allowSplitBtVer && allowSplitTtVer && mtt_split_cu_vertical_flag ) || ( allowSplitBtHor
&& allowSplitTtHor && !mtt_split_cu_vertical_flag)には、MT分割が2分木であるか3分木であるかを示すシンタックス要素mtt_split_cu_binary_flagを復号する。CT情報復号部3021は、分割されたCTの左上座標が対象タイル内である場合に、符号化ツリーを処理する。CTの左上座標は2分木では、(x0, y1)もしくは(x1, y0)、3分木では(x0, y1), (x0, y2)もしくは(x1, y0), (x2, y0)である。ここで先頭CTの左上座標(x0, y0)がタイル外にある場合には分割自体が行われないため、(x0, y0)は常にタイル内であると仮定する。
(S1491) The CT information decoding unit 3021 performs MT division. If BT splitting or TT splitting is possible (allowSplitBtHor || allowSplitTtHor ) || ( allowSplitBtVer || allowSplitTtVer )), decode the flag mtt_split_cu_vertical_flag indicating the direction of MT splitting. If both BT splitting and TT splitting are possible in the decrypted splitting method mtt_split_cu_vertical_flag (( allowSplitBtVer && allowSplitTtVer && mtt_split_cu_vertical_flag ) || ( allowSplitBtHor
&& allowSplitTtHor && !mtt_split_cu_vertical_flag) decodes the syntax element mtt_split_cu_binary_flag which indicates whether the MT split is a binary tree or a ternary tree. The CT information decoding unit 3021 processes the coding tree when the upper left coordinate of the divided CT is within the target tile. The upper left coordinate of CT is (x0, y1) or (x1, y0) in a binary tree, or (x0, y1), (x0, y2) or (x1, y0), (x2, y0) in a ternary tree. be. If the upper left coordinates (x0, y0) of the top CT are outside the tile, the division itself is not performed, so it is assumed that (x0, y0) is always inside the tile.

CT情報復号部3021は、MT分割タイプsplit_mt_typeが0(2分割)、かつ、MT分割方向split_dir_flagが1(水平分割)の場合は、以下の2つのCTを復号(BT分割情報復号)する。タイル内でのCT(x0,y1)の下座標y1がタイルサイズhTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの下座標y1がタイルサイズhTile[TileId]以上のCTは復号しない。 When the MT split type split_mt_type is 0 (two split) and the MT split direction split_dir_flag is 1 (horizontal split), the CT information decoding unit 3021 decodes the following two CTs (BT split information decoding). Decode CTs whose lower coordinate y1 of CT(x0,y1) in the tile is less than the tile size hTile[TileId]. Conversely, CTs whose bottom coordinate y1 of each CT within the tile is equal to or greater than the tile size hTile[TileId] are not decoded.

multi_type_tree(x0,y0,cbWidth,cbHeight/2,mttDepth,depthOffset,0,treeType)
if (y1 < hTile[TileId])
multi_type_tree(x0,y1,cbWidth,cbHeight/2,mttDepth+1,depthOffset,1,treeType)
一方、MT分割方向split_dir_flagが0(垂直分割)の場合は、以下の2つのCTを復号(BT分割情報復号)する。タイル内でのCT(x1,y0)の右座標x1がタイルサイズwTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの右座標x1がタイルサイズwTile[TileId]以上のCTは復号しない。
multi_type_tree(x0,y0,cbWidth,cbHeight/2,mttDepth,depthOffset,0,treeType)
if (y1 < hTile[TileId])
multi_type_tree(x0,y1,cbWidth,cbHeight/2,mttDepth+1,depthOffset,1,treeType)
On the other hand, when the MT split direction split_dir_flag is 0 (vertical split), the following two CTs are decoded (BT split information decoded). Decode CTs whose right coordinate x1 of CT(x1,y0) within the tile is less than the tile size wTile[TileId]. Conversely, CTs whose right coordinate x1 of each CT within the tile is greater than or equal to the tile size wTile[TileId] are not decoded.

multi_type_tree(x0,y0,cbWidth/2,cbHeight,mttDepth+1,depthOffset,0,treeType)
if (x1 < wTile[TileId])
multi_type_tree(x1,y0,cbWidth/2,cbHeightY,mttDepth+1,depthOffset,1,treeType)ここで、(x1,y1)は以下の式で導出される。
multi_type_tree(x0,y0,cbWidth/2,cbHeight,mttDepth+1,depthOffset,0,treeType)
if (x1 < wTile[TileId])
multi_type_tree(x1, y0, cbWidth/2, cbHeightY, mttDepth+1, depthOffset, 1, treeType) where (x1, y1) is derived by the following formula.

x1 = x0+(cbWidth/2)
y1 = y0+(cbHeight/2)
さらに、log2CbWidth、または、log2CbHeightを下式のように更新する。
x1 = x0 + (cbWidth/2)
y1 = y0 + (cbHeight/2)
Furthermore, update log2CbWidth or log2CbHeight as shown in the following formula.

CbWidth = CbWidth/2
CbHeight = CbHeight/2
CT情報復号部3021は、MT分割タイプsplit_mt_typeが1(3分割)を示す場合には、3
つのCTを復号(TT分割情報復号)する。
CbWidth = CbWidth/2
CbHeight = CbHeight/2
When the MT split type split_mt_type indicates 1 (3 splits), the CT information decoding unit 3021
Decode one CT (TT division information decoding).

MT分割方向split_dir_flagが1(水平分割)の場合は、以下の3つのCTを復号する。タイル内でのi=0, 1の各CT(x0, yi)の下座標yiがタイルサイズhTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの下座標yiがタイルサイズhTile[TileId]以上のCTは復号しない。 When the MT split direction split_dir_flag is 1 (horizontal split), the following three CTs are decoded. Decode CTs whose bottom coordinate yi of each CT (x0, yi) of i=0, 1 in the tile is less than the tile size hTile[TileId]. Conversely, CTs whose bottom coordinate yi of each CT within the tile is equal to or larger than the tile size hTile[TileId] are not decoded.

multi_type_tree(x0,y0,cbWidth,cbHeight/4,mttDepth+1,depthOffset,0,treeType)
if (y1 < hTile[TileId])
multi_type_tree(x0,y1,cbWidth,cbHeight/2,mttDepth+1,depthOffset,1,treeType)
if (y2 < hTile[TileId])
multi_type_tree(x0,y2,cbWidth,cbHeight/4,mttDepth+1,depthOffset,2,treeType)
一方、MT分割方向split_dir_flagが1(垂直分割)の場合は、以下の3つのCTを復号(TT分割情報復号)する。タイル内でのi=0, 1の各CT(xi, y0)の右座標xiがタイルサイズwTile[TileId]未満のCTを復号する。逆に、タイル内での各CTの右座標xiがタイルサイズwTile[TileId]以上のCTは復号しない。
multi_type_tree(x0,y0,cbWidth,cbHeight/4,mttDepth+1,depthOffset,0,treeType)
if (y1 < hTile[TileId])
multi_type_tree(x0,y1,cbWidth,cbHeight/2,mttDepth+1,depthOffset,1,treeType)
if (y2 < hTile[TileId])
multi_type_tree(x0,y2,cbWidth,cbHeight/4,mttDepth+1,depthOffset,2,treeType)
On the other hand, when the MT split direction split_dir_flag is 1 (vertical split), the following three CTs are decoded (TT split information decoded). Decode CTs whose right coordinate xi of each CT (xi, y0) of i=0, 1 in the tile is less than the tile size wTile[TileId]. Conversely, CTs whose right coordinate xi of each CT within the tile is equal to or greater than the tile size wTile[TileId] are not decoded.

multi_type_tree(x0,y0,cbWidth/4,cbHeight,mttDepth+1,depthOffset,0,treeType)
if (x1 < wTile[TileId])
multi_type_tree(x1,y0,cbWidth/2,cbHeight,mttDepth+1,depthOffset,1,treeType)
if (x2 < wTile[TileId])
multi_type_tree(x2,y0,cbWidth/4,cbHeight,mttDepth+1,depthOffset,2,treeType)
ここで、(x1,y1)、(x2,y2)は、以下の式のように、導出される。
multi_type_tree(x0,y0,cbWidth/4,cbHeight,mttDepth+1,depthOffset,0,treeType)
if (x1 < wTile[TileId])
multi_type_tree(x1,y0,cbWidth/2,cbHeight,mttDepth+1,depthOffset,1,treeType)
if (x2 < wTile[TileId])
multi_type_tree(x2,y0,cbWidth/4,cbHeight,mttDepth+1,depthOffset,2,treeType)
Here, (x1, y1) and (x2, y2) are derived as in the following formulas.

x1 = x0+(cbHeight/4)
y1 = y0+(3*cbHeight/4)
x2 = x0+(cbWidth/4)
y2 = y0+(3*cbWidth/4)
CT情報復号部3021は、下位のCTにおいても、更新された左上座標、CTの幅及び高さ、MT深度を用いて、S1471から開始されるBT分割情報復号、あるいは、TT分割情報復号を継続する。
x1 = x0 + (cbHeight/4)
y1 = y0 + (3*cbHeight/4)
x2 = x0 + (cbWidth/4)
y2 = y0 + (3*cbWidth/4)
The CT information decoding unit 3021 continues BT division information decoding or TT division information decoding starting from S1471 using the updated upper left coordinate, width and height of CT, and MT depth in the lower CT. do.

また、CT情報復号部3021は、MT分割フラグsplit_mt_flagが0の場合、すなわちQT分割もMT分割も行われない場合には、CU復号部3022でCU(coding_unit(x0,y0,cbWidth,cbHeight,treeType))を復号する。 In addition, when the MT split flag split_mt_flag is 0, that is, when neither QT splitting nor MT splitting is performed, the CT information decoding unit 3021 causes the CU decoding unit 3022 to perform CU (coding_unit(x0, y0, cbWidth, cbHeight, treeType )).

以上のように、タイル内で表現される各CUの左上座標(xi, yi)をタイルサイズ(wTile, hTile)と比較することで、分割フラグを復号し、各CTを復号する。これによって、タイルサイズがCTUサイズの整数倍ではない場合においても、無駄な分割フラグ、無駄なCTを復号することなく、効率的にCU分割を行うことが可能であるという効果を奏する。また、タイル内座標系を用いて、CU分割を行うことにより、画面内座標系からタイル内座標系への変換を行うことなく、簡単な処理でCU分割を行うことが可能であるというさらなる効果を奏する。 As described above, by comparing the upper left coordinates (xi, yi) of each CU expressed in a tile with the tile size (wTile, hTile), the division flag is decoded and each CT is decoded. As a result, even when the tile size is not an integral multiple of the CTU size, it is possible to efficiently perform CU partitioning without decoding unnecessary partition flags and unnecessary CTs. In addition, by performing CU division using the in-tile coordinate system, there is a further effect that CU division can be performed with simple processing without conversion from the in-screen coordinate system to the in-tile coordinate system. play.

また、パラメータ復号部302は、図示しないインター予測パラメータ復号部303及びイントラ予測パラメータ復号部304を含んで構成される。予測画像生成部308は、図示しないインター予測画像生成部309及びイントラ予測画像生成部310を含んで構成される。 Also, parameter decoding section 302 includes inter prediction parameter decoding section 303 and intra prediction parameter decoding section 304 (not shown). The predicted image generator 308 includes an inter predicted image generator 309 and an intra predicted image generator 310 (not shown).

(フレキシブルタイルにおけるマルチラインイントラ予測)
図35はマルチラインイントラ予測を示す図である。イントラ予測パラメータ復号部304
及びイントラ予測パラメータ符号化部113は、マルチラインイントラ予測パラメータを復号もしくは符号化する。イントラ予測画像生成部310においては、シンタックス要素intra_luma_ref_idxに応じて、対象ブロック境界から隣接する参照画素のうち、どのラインを参照するかを選択する。例えば図35(a)のように、intra_luma_ref_idxが0, 1, 2の場合、参照ピクチャのラインを示すインデックスIntraLumaRefLineIdx(refIdx)を0, 1, 3に設定する。つまり、対象ブロックからみて近い順に0, 1, 3のラインを参照する。
(Multi-line intra prediction in flexible tiles)
FIG. 35 is a diagram showing multiline intra prediction. Intra prediction parameter decoding unit 304
And the intra prediction parameter encoding unit 113 decodes or encodes the multiline intra prediction parameters. The intra prediction image generation unit 310 selects which line to refer to among the reference pixels adjacent to the target block boundary according to the syntax element intra_luma_ref_idx. For example, as shown in FIG. 35(a), if intra_luma_ref_idx is 0, 1, 2, the index IntraLumaRefLineIdx (refIdx) indicating the line of the reference picture is set to 0, 1, 3. In other words, the 0, 1, and 3 lines are referenced in order of proximity to the target block.

図35(b)は対象ブロックのY座標がCTU境界に接する場合を示す。この場合には、シンタックス要素intra_luma_ref_idxを復号せずに0を導出(infer)する。 FIG. 35(b) shows the case where the Y coordinate of the target block touches the CTU boundary. In this case, infer 0 without decoding the syntax element intra_luma_ref_idx.

図36は、ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、マルチラインイントラ予測の処理を示すフローチャートである。図41(a)は、シンタックステーブル例である。 FIG. 36 is a flowchart showing multiline intra prediction processing when a picture is divided into tiles of sizes not limited to integral multiples of the CTU. FIG. 41(a) is an example of a syntax table.

S4001:ヘッダ復号部3020、ヘッダ符号化部1110は、CTUサイズ以下を単位とするタイルサイズ(CTUサイズの整数倍に限定しないタイルサイズ)を復号もしくは符号化する。例えば既に説明したように、tile_unit_size_idcを復号してタイル単位サイズwUnitTileあるいはhUnitTileを導出し、wUnitTileあるいはhUnitTileの倍数からなるタイルサイズを復号してもよい。 S4001: The header decoding unit 3020 and the header encoding unit 1110 decode or encode the tile size in units of the CTU size or smaller (the tile size is not limited to an integral multiple of the CTU size). For example, as described above, tile_unit_size_idc may be decoded to derive tile unit sizes wUnitTile or hUnitTile, and tile sizes that are multiples of wUnitTile or hUnitTile may be decoded.

S4002:CT情報復号部3021、CT情報符号化部1111(CT分割部)は、タイル内座標系を用いて、CT分割を行う。例えば、既に説明したように図31~図33に示すシンタックス構成を用いて、CT分割を行う。このとき、CTの左上座標(x0, y0)、つまりQT分割coding_quadtree(x0, y0, …)、MTT分割multi_type_tree(x0, y0, …)の引数である(x0, y0)はタイル左上座標を原点とする座標を用いる。また、分割シンタックスqt_split_cu_flag、mtt_split_cu_flagはタイル内座標(x0, y0)とタイルサイズwTile、hTileを参照して、復号あるいは符号化の有無を判定する。 S4002: The CT information decoding unit 3021 and CT information encoding unit 1111 (CT division unit) perform CT division using the intra-tile coordinate system. For example, CT division is performed using the syntax configurations shown in FIGS. 31 to 33 as already described. At this time, the upper left coordinate of CT (x0, y0), that is, the argument of QT division coding_quadtree (x0, y0, …), MTT division multi_type_tree (x0, y0, …) is the tile upper left coordinate as the origin Use the coordinates to be Also, the split syntaxes qt_split_cu_flag and mtt_split_cu_flag refer to the tile coordinates (x0, y0) and the tile sizes wTile and hTile to determine whether decoding or encoding is to be performed.

S4004:イントラ予測パラメータ復号部304とイントラ予測パラメータ符号化部113は、タイル内座標系の対象ブロックの座標値(x0, y0)を用いて、対象ブロックがCTU境界より下であるか否かを判定する。(y0 % ctuSize) > 0の場合に、CTU境界より下と判定する。対象ブロックがCTU境界より下の場合には、S4005に遷移して、イントラ参照ラインインデックスintra_luma_ref_idxを復号または符号化する。それ以外、対象ブロックがCTU境界と接している場合にはintra_luma_ref_idxを復号せずに0と導出(infer)する。 S4004: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 use the coordinate values (x0, y0) of the target block in the intra-tile coordinate system to determine whether the target block is below the CTU boundary. judge. If (y0 % ctuSize) > 0, determine below the CTU boundary. If the target block is below the CTU boundary, the process transitions to S4005 to decode or encode the intra reference line index intra_luma_ref_idx. Otherwise, if the target block is in contact with the CTU boundary, 0 is derived (infer) without decoding intra_luma_ref_idx.

S4005:イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、イントラ参照ラインインデックスintra_luma_ref_idxを復号もしくは符号化する。 S4005: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 decode or encode the intra reference line index intra_luma_ref_idx.

なお、イントラ予測においては、イントラ参照ラインインデックスintra_luma_ref_idxの他に、推定イントラ予測モードMostProbableMode(MPM)の一つであるか否かを示すフラグintra_luma_mpm_flag、MPMを選択するインデックスintra_luma_mpm_idx、MPMでない場合のイントラ予測モードを示すインデックスintra_luma_mpm_remainderをさらに復号あるいは符号化してもよい。 In addition, in intra prediction, in addition to intra reference line index intra_luma_ref_idx, flag intra_luma_mpm_flag indicating whether it is one of estimated intra prediction modes MostProbableMode (MPM), index intra_luma_mpm_idx for selecting MPM, intra prediction when not MPM The index intra_luma_mpm_remainder indicating the mode may be further decoded or encoded.

イントラ予測画像生成部310は、導出されたIntraLumaRefLineIdx(refIdx)を用いて、以下の範囲の参照ピクチャサンプルp[x][y]を導出する。 Using the derived IntraLumaRefLineIdx (refIdx), the intra prediction image generation unit 310 derives reference picture samples p[x][y] in the following range.

p[x][y] with x = -1-refIdx, y = -1-refIdx..refH-1 and x = -refIdx..refW-1, y =
-1-refIdx
ここでrefW, refHは、以下の式で導出する。
p[x][y] with x = -1-refIdx, y = -1-refIdx..refH-1 and x = -refIdx..refW-1, y =
-1-refIdx
Here, refW and refH are derived by the following formulas.

refW = (nTbH>nTbW) ? (nTbW+(nTbH>>whRatio)+Ceil(nTbH/32)) : (nTbW*2)
refH = (nTbW>nTbH) ? (nTbH+(nTbW>>whRatio)+Ceil(nTbW/32)) : (nTbH*2)
ここで、nTbW, nTbHは対象ブロックのサイズ、whRatioは、Min(Abs(Log2(nTbW/nTbH), 2)で導出される値で、対象ブロックのサイズの縦横比が大きくなるほど大きくなる値で、正方形の場合に0、nTbH:nTbWが1:2の場合に1, 1:4の場合に2となる値である。
refW = (nTbH>nTbW) ? (nTbW+(nTbH>>whRatio)+Ceil(nTbH/32)) : (nTbW*2)
refH = (nTbW>nTbH) ? (nTbH+(nTbW>>whRatio)+Ceil(nTbW/32)) : (nTbH*2)
where nTbW and nTbH are the sizes of the target block, whRatio is a value derived by Min(Abs(Log2(nTbW/nTbH), 2) and increases as the aspect ratio of the target block size increases. The value is 0 for a square, 1 for a ratio of nTbH:nTbW of 1:2, and 2 for a ratio of 1:4.

イントラ予測画像生成部310は、参照ピクチャサンプルp[x][y]を用いて予測画像predSamplesを生成する。例えばプレーナモードは以下の式で導出してもよい。
predV[x][y] = ((nTbH-1-y)*p[x][-1]+(y+1)*p[-1][nTbH])<<Log2(nTbW)
predH[x][y] = ((nTbW-1-x)*p[-1][y]+(x+1)*p[nTbW][-1])<<Log2(nTbH)
predSamples[x][y] = (predV[x][y]+predH[x][y]+nTbW*nTbH)>>(Log2(nTbW)+Log2(nTbH)+1)
以上の構成のイントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113によれば、タイル単位サイズの整数倍のタイルサイズを復号あるいは符号化し、タイル内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行い、タイル内座標(対象タイルの左上座標を基準とする対象ブロックの左上座標)を用いてCTU境界の判定を行うことで、タイルサイズがCTUの整数倍ではない場合においても、容易にCTU境界において追加のラインメモリを利用することなく、マルチラインイントラ予測が可能となる効果を奏する。
The intra predicted image generation unit 310 generates predicted images predSamples using the reference picture samples p[x][y]. For example, the planar mode may be derived by the following formula.
predV[x][y] = ((nTbH-1-y)*p[x][-1]+(y+1)*p[-1][nTbH])<<Log2(nTbW)
predH[x][y] = ((nTbW-1-x)*p[-1][y]+(x+1)*p[nTbW][-1])<<Log2(nTbH)
predSamples[x][y] = (predV[x][y]+predH[x][y]+nTbW*nTbH)>>(Log2(nTbW)+Log2(nTbH)+1)
According to the intra-prediction parameter decoding unit 304 and the intra-prediction parameter encoding unit 113 configured as described above, the tile size that is an integer multiple of the tile unit size is decoded or encoded, and the quadtree, By performing multi-tree partitioning of a binary tree and a ternary tree, and determining the CTU boundary using the coordinates within the tile (the upper left coordinate of the target block based on the upper left coordinate of the target tile), the tile size is reduced to the CTU. Even if the number is not an integer multiple, multi-line intra prediction can be easily performed at the CTU boundary without using an additional line memory.

図37は、ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、マルチラインイントラ予測の処理を示すフローチャートである。図41(b)は、シンタックステーブル例である。 FIG. 37 is a flowchart showing multiline intra prediction processing when a picture is divided into tiles of sizes not limited to integral multiples of the CTU. FIG. 41(b) is an example of a syntax table.

S4101:ヘッダ復号部3020、ヘッダ符号化部1110は、CTUサイズ以下を単位とするタイルサイズ(CTUサイズの整数倍に限定しないタイルサイズ)を復号もしくは符号化する。例えば既に説明したように、tile_unit_size_idcを復号してタイル単位サイズwUnitTileあるいはhUnitTileを導出し、wUnitTileあるいはhUnitTileの倍数からなるタイルサイズを復号してもよい。 S4101: The header decoding unit 3020 and the header encoding unit 1110 decode or encode the tile size in units of the CTU size or less (the tile size is not limited to an integral multiple of the CTU size). For example, as described above, tile_unit_size_idc may be decoded to derive tile unit sizes wUnitTile or hUnitTile, and tile sizes that are multiples of wUnitTile or hUnitTile may be decoded.

S4102:CT情報復号部3021、CT情報符号化部1111(CT分割部)は、ピクチャ内座標系を用いて、CT分割を行う。例えば、既に説明したように図27~図29に示すシンタックス構成を用いて、CT分割を行う。このとき、CTの左上座標(x0, y0)、つまりQT分割coding_quadtree(x0, y0, …)、MTT分割multi_type_tree(x0, y0, …)の引数である(x0, y0)はピクチャ左上座標を原点とする座標を用いる。また、分割シンタックスqt_split_cu_flag、mtt_split_cu_flagは、ピクチャ内座標(x0, y0)とタイル左上座標xTile, yTile、タイルサイズwTile、hTileを参照して判定する。例えば
if (x1-xTile[TileId] < wTile[TileId])
coding_quadtree( x1, y0, log2CbSize-1, cqtDepth+1, treeType)
if (y1-yTile[TileId] < hTile[TileId])
coding_quadtree( x0, y1, log2CbSize-1, cqtDepth+1, treeType)
このように、ピクチャ内座標からタイル左上座標を引くことで導出されたタイル内座標をもとに、CT分割を行ってもよい。
S4102: The CT information decoding unit 3021 and CT information encoding unit 1111 (CT division unit) perform CT division using the intra-picture coordinate system. For example, CT division is performed using the syntax configurations shown in FIGS. 27 to 29 as already described. At this time, the upper left coordinate of CT (x0, y0), that is, the argument of QT division coding_quadtree (x0, y0, …), MTT division multi_type_tree (x0, y0, …) is the picture upper left coordinate as the origin Use the coordinates to be Also, the split syntaxes qt_split_cu_flag and mtt_split_cu_flag are determined by referring to the in-picture coordinates (x0, y0), tile upper left coordinates xTile, yTile, and tile sizes wTile, hTile. for example
if (x1-xTile[TileId] < wTile[TileId])
coding_quadtree( x1, y0, log2CbSize-1, cqtDepth+1, treeType)
if (y1-yTile[TileId] < hTile[TileId])
coding_quadtree( x0, y1, log2CbSize-1, cqtDepth+1, treeType)
Thus, CT division may be performed based on the intra-tile coordinates derived by subtracting the tile upper left coordinates from the intra-picture coordinates.

S4103:イントラ予測パラメータ復号部304とイントラ予測パラメータ符号化部113は、ピクチャ内座標からタイル内座標に変換する。ピクチャ内座標(x0, y0)からピクチャ内座標におけるタイル左上座標(xTile, yTile)をひくことで、タイル内座標(x0-xTile, y0-yTile)を導出する。このとき、Y座標のみ導出してもよい。 S4103: The intra-prediction parameter decoding unit 304 and the intra-prediction parameter encoding unit 113 convert from intra-picture coordinates to intra-tile coordinates. The intra-tile coordinates (x0-xTile, y0-yTile) are derived by subtracting the upper left tile coordinates (xTile, yTile) in the intra-picture coordinates from the intra-picture coordinates (x0, y0). At this time, only the Y coordinate may be derived.

S4104:イントラ予測パラメータ復号部304とイントラ予測パラメータ符号化部113は、タイル内座標系の対象ブロックの座標値(x0-xTile, y0-yTile)を用いて、対象ブロックがCTU境界より下であるか否かを判定する。((y0-yTile)%ctuSize)>0の場合に、CTU境界より下と判定される。CTU境界より下の場合には、S4105に遷移して、イントラ参照ラインインデックスintra_luma_ref_idxを復号あるいは符号化する。それ以外、対象ブロックがCTU境界と接している場合にはintra_luma_ref_idxを復号せず0として導出(infer)する。言い換えると、タイル内座標系の対象ブロックの座標値である対象タイルの左上座標に対する左上輝度ブロックの左上座標(xCb, yCb)を用いて、CTU境界判定を(yCb%ctuSize)>0で行ってもよい。 S4104: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 use the coordinate values (x0-xTile, y0-yTile) of the target block in the intra-tile coordinate system to determine that the target block is below the CTU boundary. Determine whether or not It is determined to be below the CTU boundary if ((y0-yTile)%ctuSize)>0. If it is below the CTU boundary, the process transitions to S4105 to decode or encode the intra reference line index intra_luma_ref_idx. Otherwise, if the target block is in contact with the CTU boundary, intra_luma_ref_idx is derived (infer) as 0 without being decoded. In other words, using the upper left coordinate (xCb, yCb) of the upper left luminance block with respect to the upper left coordinate of the target tile, which is the coordinate value of the target block in the intra-tile coordinate system, the CTU boundary determination is performed with (yCb%ctuSize)>0. good too.

S4105:イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、イントラ参照ラインインデックスintra_luma_ref_idxを復号もしくは符号化する。 S4105: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 decode or encode the intra reference line index intra_luma_ref_idx.

なお、イントラ予測においては、イントラ参照ラインインデックスintra_luma_ref_idxの他に、MPMであるか否かを示すフラグintra_luma_mpm_flag、MPMを選択するインデックスintra_luma_mpm_idx、MPMでない場合のイントラ予測モードを示すインデックスintra_luma_mpm_remainderをさらに復号あるいは符号化してもよい。つまり、タイル内座標系の対象ブロックの座標値である、対象タイルの左上座標に対する輝度ブロックの左上座標(xCb, yCb)を用いて、CTU境界判定を(yCb%ctuSize)>0で行ってもよい。 In intra prediction, in addition to the intra reference line index intra_luma_ref_idx, the flag intra_luma_mpm_flag indicating whether or not it is MPM, the index intra_luma_mpm_idx for selecting MPM, and the index intra_luma_mpm_remainder indicating the intra prediction mode when not MPM are further decoded or encoded. may be changed. In other words, using the upper left coordinate (xCb, yCb) of the luminance block with respect to the upper left coordinate of the target tile, which is the coordinate value of the target block in the intra-tile coordinate system, the CTU boundary determination can be performed with (yCb%ctuSize) > 0. good.

イントラ予測画像生成部310は、IntraLumaRefLineIdx(refIdx)を用いて、参照ピクチャサンプルp[x][y]を導出し、導出した参照ピクチャサンプルp[x][y]から予測画像を導出する。 The intra predicted image generation unit 310 derives reference picture samples p[x][y] using IntraLumaRefLineIdx (refIdx), and derives a predicted image from the derived reference picture samples p[x][y].

以上の構成のイントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113によれば、タイル単位サイズの整数倍のタイルサイズを復号あるいは符号化し、ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行い、ピクチャ内座標(対象ピクチャの左上座標を基準とする対象ブロックの左上座標)からタイル内座標(対象タイルの左上座標を基準とする対象ブロックの左上座標)に変換してCTU境界の判定を行うことで、タイルサイズがCTUの整数倍ではない場合においても、正確にCTU境界判定が可能となり追加のラインメモリを利用することなく、マルチラインイントラ予測が可能となる効果を奏する。 According to the intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 configured as described above, the tile size that is an integer multiple of the tile unit size is decoded or encoded, and the intra-picture coordinates, tile upper left coordinates, and tile size are used to decode or encode the tile size. Perform multi-tree partitioning of quadtrees, binary trees, and ternary trees, and convert intra-picture coordinates (upper left coordinates of the target block based on the upper left coordinates of the target picture) to intra-tile coordinates (upper left coordinates of the target tile). (upper left coordinates of the target block) to determine the CTU boundary, even if the tile size is not an integral multiple of the CTU, it is possible to accurately determine the CTU boundary without using additional line memory. , multi-line intra prediction is possible.

(MPM導出)
イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、左上座標(xCb, yCb)、サイズ(cbWidth, cbHeight)の対象ブロックの左と上に各々隣接する隣接ブロックA, Bの位置(xNbA, yNbA)、(xNbB, yNbB)を以下で導出する。
(MPM derivation)
The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 determine the positions (xNbA , yNbA) and (xNbB, yNbB) are derived below.

(xNbA, yNbA) = (xCb-1, yCb+cbHeight-1)
(xNbA, yNbA) = (xCb+cbWidth-1, yCb-1)
イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、ブロックA, Bのイントラ予測モードである隣接イントラ予測モードcandIntraPredModeA、candIntraPredModeBを導出する。具体的には、X=AもしくはBにおいて、以下の条件が1つでも真の場合に、隣接イントラ予測モード(candIntraPredModeA, candIntraPredModeB)にプレーナモードを設定する。
・Xの位置(xNbX, yNbX)が画面外やタイル外であり利用可能(available)ではない。
・Xの位置(xNbX, yNbX)の予測モードCuPredModeがイントラ(MODE_INTRA)ではない。
・Xが上の隣接ブロックBであり、XのY座標(yCb)がCTU境界よりも上にある。
(xNbA, yNbA) = (xCb-1, yCb+cbHeight-1)
(xNbA, yNbA) = (xCb+cbWidth-1, yCb-1)
The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 derive adjacent intra prediction modes candIntraPredModeA and candIntraPredModeB, which are intra prediction modes of blocks A and B, respectively. Specifically, when X=A or B, the planar mode is set to the adjacent intra prediction modes (candIntraPredModeA, candIntraPredModeB) when at least one of the following conditions is true.
・The X position (xNbX, yNbX) is outside the screen or outside the tile and is not available.
・Prediction mode CuPredMode of X position (xNbX, yNbX) is not intra (MODE_INTRA).
• X is the upper neighbor block B, and the Y coordinate of X (yCb) is above the CTU boundary.

上記以外の場合、Xの位置(xNbX, yNbX)のイントラ予測モードを隣接予測モードとして
設定する。なお、フレキシブルタイルの場合のCTU境界判定については後述する。
In cases other than the above, the intra prediction mode at the X position (xNbX, yNbX) is set as the adjacent prediction mode. Note that CTU boundary determination for flexible tiles will be described later.

candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、以下の式でMPMリストcandModeListを導出しても良い。
最初に以下の式で初期リストを導出する。
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = !candIntraPredModeA
candModeList[ 2 ] = INTRA_ANGULAR50
candModeList[ 3 ] = INTRA_ANGULAR18
candModeList[ 4 ] = INTRA_ANGULAR46
candModeList[ 5 ] = INTRA_ANGULAR54
もしcandIntraPredModeBとcandIntraPredModeAが等しい場合には、以下を行う。
candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 may derive the MPM list candModeList using the following formula.
First, derive the initial list by the following formula.
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = !candIntraPredModeA
candModeList[ 2 ] = INTRA_ANGULAR50
candModeList[ 3 ] = INTRA_ANGULAR18
candModeList[ 4 ] = INTRA_ANGULAR46
candModeList[ 5 ] = INTRA_ANGULAR54
If candIntraPredModeB and candIntraPredModeA are equal, do the following.

candIntraPredModeAが1より大きい場合、以下のようにリストを更新する。3, 4, 5のエントリには、candIntraPredModeAに対して-1, +1, -2のイントラ予測モードが格納される。
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = INTRA_PLANAR
candModeList[ 2 ] = INTRA_DC
candModeList[ 3 ] = 2+((candIntraPredModeA+62)%65)
candModeList[ 4 ] = 2+((candIntraPredModeA-1)%65)
candModeList[ 5 ] = 2+((candIntraPredModeA+61)%65)
上記以外(もしcandIntraPredModeBとcandIntraPredModeAが等しくない場合)、当該2つの隣接予測モードをエントリ0, 1に格納する。
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = candIntraPredModeB
biggerIdx = candModeList[0]>candModeList[1] ? 0 : 1
さらに、candIntraPredModeAとcandIntraPredModeBが両方とも1より大きい場合(2つの隣接予測モードが両方ともAngular予測(方向予測)の場合)、以下のようにリストを更新する。
candModeList[ 2 ] = INTRA_PLANAR
candModeList[ 3 ] = INTRA_DC
さらに、candModeList[biggerIdx]-candModeList[!biggerIdx]が64もしくは1の場合(つまり2つの隣接予測モードの違いが-1もしくは1の場合)、以下を行い、4と5のエントリに、隣接予測モードの-2, +2のイントラ予測モードを格納する。
candModeList[ 4 ] = 2+((candModeList[biggerIdx]+62)%65)
candModeList[ 5 ] = 2+((candModeList[biggerIdx]-1)%65)
candModeList[biggerIdx]-candModeList[!biggerIdx]が64もしくは1以外の場合、以下を行い、4と5のエントリに、隣接予測モードの-1, +1のイントラ予測モードを格納する。
candModeList[ 4 ] = 2+((candModeList[biggerIdx]+61)%65)
candModeList[ 5 ] = 2+(candModeList[biggerIdx]%65)
上記以外で、candIntraPredModeAとcandIntraPredModeの和が2以上の場合(2つの隣接予測モードがDCモードとプレーナモードではない場合)、以下を行う。3, 4と5のエントリに、隣接予測モードの-1, +1, -2のイントラ予測モードを格納する。
candModeList[ 2 ] = !candModeList[!biggerIdx]
candModeList[ 3 ] = 2+((candModeList[biggerIdx]+62)%65)
candModeList[ 4 ] = 2+((candModeList[biggerIdx]-1)%65)
candModeList[ 5 ] = 2+((candModeList[biggerIdx]+61)%65)
(フレキシブルタイルにおけるMPM導出における隣接イントラ予測モードの導出)
図42は、ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、MPM導出処理を示すフローチャートである。S5001、S5002は、S4001、S4002と同じ処理であるため説明を省略する。
If candIntraPredModeA is greater than 1, update the list as follows. Entries 3, 4, and 5 store intra prediction modes of -1, +1, and -2 for candIntraPredModeA.
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = INTRA_PLANAR
candModeList[ 2 ] = INTRA_DC
candModeList[ 3 ] = 2+((candIntraPredModeA+62)%65)
candModeList[ 4 ] = 2+((candIntraPredModeA-1)%65)
candModeList[ 5 ] = 2+((candIntraPredModeA+61)%65)
Otherwise (if candIntraPredModeB and candIntraPredModeA are not equal), store the two adjacent prediction modes in entries 0 and 1.
candModeList[ 0 ] = candIntraPredModeA
candModeList[ 1 ] = candIntraPredModeB
biggerIdx = candModeList[0]>candModeList[1] ? 0 : 1
Furthermore, if both candIntraPredModeA and candIntraPredModeB are greater than 1 (when both two neighboring prediction modes are Angular prediction (directional prediction)), update the list as follows.
candModeList[ 2 ] = INTRA_PLANAR
candModeList[ 3 ] = INTRA_DC
In addition, if candModeList[biggerIdx]-candModeList[!biggerIdx] is 64 or 1 (i.e. the difference between the two adjacent prediction modes is -1 or 1), do the following and add to entries 4 and 5 the adjacent prediction modes Stores the -2, +2 intra prediction modes of .
candModeList[ 4 ] = 2+((candModeList[biggerIdx]+62)%65)
candModeList[ 5 ] = 2+((candModeList[biggerIdx]-1)%65)
candModeList[biggerIdx]-If candModeList[!biggerIdx] is 64 or other than 1, do the following and store -1 and +1 intra prediction modes of adjacent prediction modes in entries 4 and 5.
candModeList[ 4 ] = 2+((candModeList[biggerIdx]+61)%65)
candModeList[ 5 ] = 2+(candModeList[biggerIdx]%65)
Otherwise, if the sum of candIntraPredModeA and candIntraPredMode is 2 or more (if the two adjacent prediction modes are not DC mode and planar mode), do the following. The 3, 4 and 5 entries store the -1, +1 and -2 intra prediction modes of the adjacent prediction modes.
candModeList[ 2 ] = !candModeList[!biggerIdx]
candModeList[ 3 ] = 2+((candModeList[biggerIdx]+62)%65)
candModeList[ 4 ] = 2+((candModeList[biggerIdx]-1)%65)
candModeList[ 5 ] = 2+((candModeList[biggerIdx]+61)%65)
(Derivation of adjacent intra prediction mode in MPM derivation in flexible tiles)
FIG. 42 is a flowchart showing MPM derivation processing when a picture is divided into tiles of sizes not limited to integral multiples of the CTU. S5001 and S5002 are the same processing as S4001 and S4002, so description thereof is omitted.

S5004:イントラ予測パラメータ復号部304とイントラ予測パラメータ符号化部113は、タイル内座標系の対象ブロックの座標値(xCb, yCb)を用いて、隣接ブロックXのY座標yCbがCTU境界よりも上にあるかを判定する。 S5004: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 use the coordinate values (xCb, yCb) of the target block in the intra-tile coordinate system to determine that the Y coordinate yCb of the adjacent block X is above the CTU boundary. Determine if there is

(yCb-1)<((yCb>>CtbLog2SizeY)<<CtbLog2SizeY)
なお、上記の判定式にさらに、以下の判定式の何れかが真の場合を加えてもよい。
・Xの位置が画面外やタイル外であり利用可能(available)ではない。
・Xの位置(xNbX, yNbX)の予測モードCuPredModeがイントラ(MODE_INTRA)ではない。
(yCb-1)<((yCb>>CtbLog2SizeY)<<CtbLog2SizeY)
In addition to the above determination formulas, a case where any of the following determination formulas is true may be added.
・The position of X is outside the screen or outside the tile and is not available.
・Prediction mode CuPredMode of X position (xNbX, yNbX) is not intra (MODE_INTRA).

S5005: Xの位置(xNbX, yNbX)のイントラ予測モードを隣接予測モードに設定する。 S5005: Set the intra prediction mode of the X position (xNbX, yNbX) to the adjacent prediction mode.

candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、以下の条件が真の場合に、隣接イントラ予測モード(candIntraPredModeA, candIntraPredModeB)にプレーナモードを設定する。
・Xが上の隣接ブロックBであり、XのY座標 (yCb)がCTU境界よりも上にある。
candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 set the adjacent intra prediction modes (candIntraPredModeA, candIntraPredModeB) to the planar mode when the following conditions are true.
• X is the upper neighbor block B and the Y coordinate of X (yCb) is above the CTU boundary.

以上の構成のイントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113によれば、タイル単位サイズの整数倍のタイルサイズを復号あるいは符号化し、タイル内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行い、タイル内座標(対象タイルの左上座標を基準とする対象ブロックの左上座標)を用いてCTU境界の判定を行うことで、タイルサイズがCTUサイズの整数倍ではない場合においても、ラインメモリを利用することなく、MPMを導出することが可能となる効果を奏する。 According to the intra-prediction parameter decoding unit 304 and the intra-prediction parameter encoding unit 113 configured as described above, the tile size that is an integer multiple of the tile unit size is decoded or encoded, and the quadtree, By performing multi-tree partitioning of a binary tree and a ternary tree, and determining the CTU boundary using the coordinates in the tile (the upper left coordinate of the target block based on the upper left coordinate of the target tile), the tile size is the CTU size Even if it is not an integer multiple of , it is possible to derive the MPM without using a line memory.

図43は、ピクチャをCTUの整数倍に制限されないサイズのタイルに分割する場合における、MPM導出処理を示すフローチャートである。S5101、S5102、S5103は、S4101、S4102、S4103と同じ処理であるため説明を省略する。 FIG. 43 is a flowchart showing MPM derivation processing when a picture is divided into tiles of sizes not limited to integral multiples of the CTU. S5101, S5102, and S5103 are the same processing as S4101, S4102, and S4103, so description thereof is omitted.

S5104:イントラ予測パラメータ復号部304とイントラ予測パラメータ符号化部113は、タイル内座標系の対象ブロックの座標値(x0-xTile, y0-yTile)を用いて、隣接ブロックXのY座標(yCb-yTile)がCTU境界よりも上にあるかを判定する。 S5104: The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 calculate the Y coordinate (yCb- yTile) is above the CTU boundary.

(yCb-yTile-1) < ((yCb-yTile)>>CtbLog2SizeY)<<CtbLog2SizeY
なお、上記の判定式にさらに、以下の判定式の何れかが真の場合を加えてもよい。
・Xの位置が画面外やタイル外であり利用可能(available)ではない。
・Xの位置(xNbX, yNbX)の予測モードCuPredModeがイントラ(MODE_INTRA)ではない。
(yCb-yTile-1) <((yCb-yTile)>>CtbLog2SizeY)<<CtbLog2SizeY
In addition to the above determination formulas, a case where any of the following determination formulas is true may be added.
・The position of X is outside the screen or outside the tile and is not available.
・Prediction mode CuPredMode of X position (xNbX, yNbX) is not intra (MODE_INTRA).

S5105:Xの位置(xNbX, yNbX)のイントラ予測モードを隣接予測モードに設定する。 S5105: Set the intra prediction mode of the X position (xNbX, yNbX) to the adjacent prediction mode.

candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
・イントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113は、以下の条件が真の場合に、隣接イントラ予測モード(candIntraPredModeA, candIntraPredModeB)にプレーナモードを設定する。
Xが上の隣接ブロックBであり、XのY座標(yCb)がCTU境界よりも上にある。
candIntraPredModeX = IntraPredModeY[xNbX][yNbX]
The intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 set the adjacent intra prediction modes (candIntraPredModeA, candIntraPredModeB) to the planar mode when the following conditions are true.
X is the upper neighbor block B, and the Y coordinate of X (yCb) is above the CTU boundary.

以上の構成のイントラ予測パラメータ復号部304、イントラ予測パラメータ符号化部113によれば、タイル単位サイズの整数倍のタイルサイズを復号あるいは符号化し、ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行い、ピクチャ内座標からタイル内座標に変換してCTU境界の判定を行うことで、タイルサイズがCTUの整数倍ではない場合においても、ラインメモリを利用することなく、MPM導出が可能となる効果を奏する。 According to the intra prediction parameter decoding unit 304 and the intra prediction parameter encoding unit 113 configured as described above, the tile size that is an integer multiple of the tile unit size is decoded or encoded, and the intra-picture coordinates, tile upper left coordinates, and tile size are used to decode or encode the tile size. Multi-tree partitioning of quadtree, binary tree, and ternary tree is performed, and the coordinates in the picture are converted to the coordinates in the tile, and the CTU boundary is determined, even if the tile size is not an integral multiple of the CTU. , MPM derivation is possible without using line memory.

エントロピー復号部301は、インター予測パラメータ(予測モードpredMode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測識別子inter_pred_idc、参照ピクチャインデックスrefIdxLX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLX)をインター予測パラメータ復号部303に出力する。また、イントラ予測パラメータ(輝度予測モードIntraPredModeY、色差予測モードIntraPredModeC)をイントラ予測パラメータ復号部304に出力する。エントロピー復号部301は、量子化変換係数を逆量子化・逆変換部311に出力する。 Entropy decoding section 301 outputs inter prediction parameters (prediction mode predMode, merge flag merge_flag, merge index merge_idx, inter prediction identifier inter_pred_idc, reference picture index refIdxLX, prediction vector index mvp_LX_idx, difference vector mvdLX) to inter prediction parameter decoding section 303. do. Also, intra prediction parameters (luminance prediction mode IntraPredModeY, color difference prediction mode IntraPredModeC) are output to intra prediction parameter decoding section 304 . The entropy decoding unit 301 outputs the quantized transform coefficients to the inverse quantization/inverse transform unit 311 .

(CCLM予測)
イントラ予測画像生成部310(CCLM予測部)は、輝度から色差を線形予測するCCLM予測(Chroma Component Liner Model)を行ってもよい。CCLM予測では、対象ブロックの隣接画素(上と左に隣接する)において輝度と色差の線形予測関係(線形予測パラメータa, b)を導出し、対象ブロックの輝度画像から、色差画像をy=a*x+bの関係式で導出する。より具体的には、輝度をダウンサンプルして得られる画素値pDsY[x][y]と予測パラメータa,
b及び所定のシフト値kから以下の式で、色差の予測画像predSamples[][]を導出する。
(CCLM prediction)
The intra prediction image generation unit 310 (CCLM prediction unit) may perform CCLM prediction (Chroma Component Liner Model) that linearly predicts color difference from luminance. In CCLM prediction, the linear prediction relationship between luminance and chrominance (linear prediction parameters a, b) is derived for adjacent pixels (upper and left adjacent pixels) of the target block. *Derived by the relational expression of x+b. More specifically, the pixel value pDsY[x][y] obtained by downsampling the luminance and the prediction parameter a,
A color difference prediction image predSamples[][] is derived from b and a predetermined shift value k by the following equation.

predSamples[x][y] = Clip1C(((pDsY[x][y]*a)>>k)+b)
(フレキシブルタイルにおけるCCLM予測)
タイルのサイズは、既に説明したように、タイル単位サイズTileUnitSizeYの整数倍のサイズとして復号もしくは符号化する。またCT分割部は、ピクチャ内座標系を用いて、ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行う。もしくは、タイル内座標系を用いて、タイル内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行う。
predSamples[x][y] = Clip1C(((pDsY[x][y]*a)>>k)+b)
(CCLM prediction in flexible tiles)
As already explained, the tile size is decoded or encoded as an integer multiple of the tile unit size TileUnitSizeY. The CT division unit uses the intra-picture coordinate system to perform multi-tree division of quadtrees, binary trees, and tri-trees using intra-picture coordinates, tile upper left coordinates, and tile sizes. Alternatively, the intra-tile coordinate system is used to perform multi-tree partitioning of quadtrees, binary trees, and ternary trees using intra-tile coordinates and tile sizes.

CCLM予測部は、タイル内座標系の対象ブロックの座標値である対象タイルの左上座標に対する色差ブロックの左上座標(xCbC, yCbC)を用いて、CTU境界判定を行う。 The CCLM prediction unit performs CTU boundary determination using the upper left coordinates (xCbC, yCbC) of the chrominance block with respect to the upper left coordinates of the target tile, which are the coordinate values of the target block in the intra-tile coordinate system.

bCTUboudary = yCbC & ((1<<(CtbLog2SizeY-1)-1))
また輝度と色差のサンプリングが2:1である4:2:0以外のサンプルを考慮して以下で導出しても良い。SubHeightCが輝度と色差のサンプル比である場合、
bCTUboudary = (SubHeightC==2) ? (yCbC & ((1<<(CtbLog2SizeY-1)-1)) : ((1<<(CtbLog2SizeY)-1))
bCTUboudary = yCbC & ((1<<(CtbLog2SizeY-1)-(SubHeightC-1)))
またchroma_format_idcを用いて切り替えても良い。
bCTUboudary = yCbC &((1<<(CtbLog2SizeY-1)-1))
In addition, the following may be derived in consideration of samples other than 4:2:0 where luminance and color difference are sampled at 2:1. If SubHeightC is the luminance and chrominance sample ratio,
bCTUboudary = (SubHeightC==2) ? (yCbC &((1<<(CtbLog2SizeY-1)-1)) : ((1<<(CtbLog2SizeY)-1))
bCTUboudary = yCbC &((1<<(CtbLog2SizeY-1)-(SubHeightC-1)))
Alternatively, switching may be performed using chroma_format_idc.

なお、タイル内の輝度左上座標(xCb, yCb)を用いて以下の式で導出してもよい。 Alternatively, the luminance upper left coordinate (xCb, yCb) in the tile may be used to derive the following formula.

bCTUboudary = yCb & ((1<<(CtbLog2SizeY))-1)
ここで、左上色差ブロックの左上座標(xCbC, yCbC)は、タイル左上座標を基準と、左上輝度ブロック座標(xCb, yCb)から導出してもよい。
bCTUboudary = yCb &((1<<(CtbLog2SizeY))-1)
Here, the upper left coordinate (xCbC, yCbC) of the upper left chrominance block may be derived from the upper left luminance block coordinate (xCb, yCb) with reference to the tile upper left coordinate.

ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木、2分木、3分木のマ
ルチツリー分割を行い、対象画面の左上座標を基準とする対象ブロックの輝度左上座標(xCbInPic, yCbInPic)と、対象画面の左上座標を基準とする対象タイルの輝度左上座標(xTile, yTile)からタイル内の左上輝度ブロック座標(xCb, yCb)を導出してもよい。
Multi-tree partitioning of quadtree, binary tree, and ternary tree is performed using the coordinates in the picture, the upper left coordinate of the tile, and the tile size, and the luminance upper left coordinate (xCbInPic, yCbInPic ) and the luminance upper left coordinates (xTile, yTile) of the target tile with reference to the upper left coordinates of the target screen, the upper left luminance block coordinates (xCb, yCb) in the tile may be derived.

xCb = xCbInPic-xTile[TileId]
yCb = yCbInPic-yTile[TileId]
また、タイル内座標系を用いて、タイル内座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行う場合には、対象ブロックの左上座標をそのまま(xCb, yCb)に用いる。
xCb = xCbInPic-xTile[TileId]
yCb = yCbInPic-yTile[TileId]
In addition, when using the intra-tile coordinate system and using the intra-tile coordinates and the tile size to perform multi-tree partitioning of quadtrees, binary trees, and tri-trees, the upper left coordinate of the target block is used as it is (xCb, yCb).

CCLM予測部は、隣接輝度画像pTopDsYを以下の手順で導出する。CCLM予測部は、上画素が参照可能(availT = TRUE)であり、CTU境界ではない(bCTUboundary = FALSE)場合にはx=1..nTbW-1に対して以下の式で導出する。つまりbCTUboundary = FALSEの場合にはpY[x][y]のうちpY[x][-1]とpY[x][-2]の2ラインを利用する。
pTopDsY[x] = (pY[2*x-1][-2]+pY[2*x-1][-1]+2*pY[2*x][-2]+2*pY[2*x][-1]+pY[2*x+1][-2]+pY[2*x+1][-1]+4)>>3
ここで、pY[][]は、対象ブロックに隣接する輝度画像である。
The CCLM prediction unit derives the adjacent luminance image pTopDsY by the following procedure. The CCLM predictor is derived by the following formula for x=1..nTbW-1 when the upper pixel is available (availT = TRUE) and not at the CTU boundary (bCTUboundary = FALSE). That is, when bCTUboundary=FALSE, two lines pY[x][-1] and pY[x][-2] of pY[x][y] are used.
pTopDsY[x] = (pY[2*x-1][-2]+pY[2*x-1][-1]+2*pY[2*x][-2]+2*pY[2 *x][-1]+pY[2*x+1][-2]+pY[2*x+1][-1]+4)>>3
Here, pY[][] is the luminance image adjacent to the target block.

左上座標が利用可能であれば、さらに以下の式で導出しても良い。
pTopDsY[0]=(pY[-1][-2]+pY[-1][-1]+2*pY[0][-2]+2*pY[0][-1]+pY[1][-2]+pY[1][-1]+4)>>3
左上隣接座標(添字x、yがともに負で示される座標)が利用可能でなければ、以下の式で導出しても良い。
pTopDsY[0] = (pY[0][-2]+pY[0][-1]+1)>>1
CCLM予測部は、隣接輝度画像pTopDsYを以下の手順で導出する。CCLM予測部は、上画素が参照可能(availT = TRUE)であり、CTU境界である(bCTUboundary = TRUW)場合には、x=1..nTbW-1に対して以下の式で導出する。
pTopDsY[x] = (pY[2*x-1][-1]+2*pY[2*x][-1]+pY[2*x+1][-1]+2)>>2
つまりbCTUboundary = TRUEの場合には、pY[x][y]のうちpY[x][-1]の1ラインのみを利用する。
If the upper left coordinate is available, it may be further derived by the following formula.
pTopDsY[0]=(pY[-1][-2]+pY[-1][-1]+2*pY[0][-2]+2*pY[0][-1]+pY[ 1][-2]+pY[1][-1]+4)>>3
If upper left adjacent coordinates (coordinates with negative x and y subscripts) are not available, they may be derived by the following equations.
pTopDsY[0] = (pY[0][-2]+pY[0][-1]+1)>>1
The CCLM prediction unit derives the adjacent luminance image pTopDsY by the following procedure. The CCLM predictor is derived by the following formula for x=1..nTbW-1 if the upper pixel is available (availT = TRUE) and is the CTU boundary (bCTUboundary = TRUW).
pTopDsY[x] = (pY[2*x-1][-1]+2*pY[2*x][-1]+pY[2*x+1][-1]+2)>>2
That is, if bCTUboundary=TRUE, only one line of pY[x][-1] out of pY[x][y] is used.

左上隣接座標が利用可能であれば、さらに以下の式で導出しても良い。
pTopDsY[0] = (pY[-1][-1]+2*pY[0][-1]+pY[1][-1]+2)>>2
左上隣接座標が利用可能でなければ、さらに以下の式で導出しても良い。
pTopDsY[0] = pY[0][-1]
CCLM予測部は、さらに隣接輝度画像pLeftDsY[]を導出する。
If the upper left adjacent coordinates are available, they may be further derived by the following equations.
pTopDsY[0] = (pY[-1][-1]+2*pY[0][-1]+pY[1][-1]+2)>>2
If the upper left adjacent coordinates are not available, it may be further derived by the following formula.
pTopDsY[0] = pY[0][-1]
The CCLM predictor further derives an adjacent luminance image pLeftDsY[].

CCLM予測部は、隣接輝度画像pTopDsYの最小値MinLumaと最大値MaxLumaとその位置における色差画素値ChromaForMinLuma、ChromaForMaxLumaを導出する。 The CCLM prediction unit derives the minimum value MinLuma and the maximum value MaxLuma of the adjacent luminance image pTopDsY and the chrominance pixel values ChromaForMinLuma and ChromaForMaxLuma at that position.

CCLM予測部は、ChromaForMinLuma、ChromaForMaxLumaの差を、MinLumaとMaxLumaの差で割ることで傾きaを導出する。より具体的には整数演算のために、以下の式でCCLMパラメータaを導出する。 The CCLM prediction unit derives the slope a by dividing the difference between ChromaForMinLuma and ChromaForMaxLuma by the difference between MinLuma and MaxLuma. More specifically, for integer arithmetic, the CCLM parameter a is derived by the following equation.

shift = (BitDepthC>8) ? BitDepthC-9 : 0
add = shift ? 1<<(shift-1) : 0
diff = (MaxLuma-MinLuma+add)>>shift
k = 16
diffが正の場合、CCLM予測部は以下の式を用いてaを導出し、それ以外ではa=0とする。
shift = (BitDepthC>8) ? BitDepthC-9 : 0
add = shift ? 1<<(shift-1) : 0
diff = (MaxLuma-MinLuma+add)>>shift
k = 16
If diff is positive, the CCLM predictor derives a using the following formula, otherwise a=0.

div = ((ChromaForMaxLuma-ChromaForMinLuma)*(Floor((65536*65536)/diff)-Floor(65536/diff)*65536)+32768)>>16
a = (((ChromaForMaxLuma-ChromaForMinLuma)*Floor(65536/diff)+div+add)>>shift)
さらに、CCLM予測部はbを導出する。
b = ChromaForMinLuma-((a*MinLuma)>>k)
以上の構成のCCLM予測部によれば、タイル単位サイズの整数倍のタイルサイズを復号あるいは符号化し、ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木、2分木、3分木のマルチツリー分割を行いピクチャ内座標からタイル内座標(対象タイルの左上座標を基準とする対象ブロックの左上座標)に変換してCTU境界の判定を行う、もしくは、タイル内座標を用いて、4分木、2分木、3分木のマルチツリー分割を行い、タイル内座標を用いてCTU境界判定を行う。これによりタイルサイズがCTUの整数倍ではない場合においても、ラインメモリを利用することなく、CCLM予測が可能となる効果を奏する。
div = ((ChromaForMaxLuma-ChromaForMinLuma)*(Floor((65536*65536)/diff)-Floor(65536/diff)*65536)+32768)>>16
a = (((ChromaForMaxLuma-ChromaForMinLuma)*Floor(65536/diff)+div+add)>>shift)
Furthermore, the CCLM predictor derives b.
b = ChromaForMinLuma-((a*MinLuma)>>k)
According to the CCLM prediction unit configured as described above, a tile size that is an integral multiple of the tile unit size is decoded or encoded, and a quadtree, binary tree, or ternary tree is generated using the in-picture coordinates, the tile upper left coordinate, and the tile size. multi-tree division is performed to convert the in-picture coordinates to in-tile coordinates (upper-left coordinates of the target block based on the upper-left coordinates of the target tile) to determine the CTU boundary, or use the in-tile coordinates to determine the 4 Multi-tree partitioning of branch tree, binary tree, and ternary tree is performed, and CTU boundary determination is performed using coordinates within the tile. As a result, even when the tile size is not an integral multiple of the CTU, CCLM prediction is possible without using line memory.

(マージ予測)
図38(a)は、本実施形態に係るマージ予測パラメータ導出部3036の構成を示す概略図である。マージ予測パラメータ導出部3036は、マージ候補導出部30361、マージ候補選択部30362を備える。なお、マージ候補は、予測リスト利用フラグpredFlagLX、動きベクトルmvLX、参照ピクチャインデックスrefIdxLXを含んで構成され、マージ候補リストに格納される。マージ候補リストに格納されたマージ候補には、所定の規則に従ってインデックスが割り当てられる。
(merge prediction)
FIG. 38(a) is a schematic diagram showing the configuration of the merge prediction parameter derivation unit 3036 according to this embodiment. The merge prediction parameter derivation unit 3036 includes a merge candidate derivation unit 30361 and a merge candidate selection unit 30362 . Note that the merge candidate includes a prediction list usage flag predFlagLX, a motion vector mvLX, and a reference picture index refIdxLX, and is stored in the merge candidate list. The merge candidates stored in the merge candidate list are assigned indices according to a predetermined rule.

マージ候補導出部30361は、復号済の隣接ブロックの動きベクトルと参照ピクチャインデックスrefIdxLXをそのまま用いてマージ候補を導出する。それ以外に、マージ候補導出部30361は、後述する空間マージ候補導出処理、時間マージ候補導出処理、結合マージ候補導出処理、およびゼロマージ候補導出処理、時空間マージ候補導出処理を適用してもよい。 The merge candidate derivation unit 30361 derives merge candidates using the motion vectors of the decoded neighboring blocks and the reference picture index refIdxLX as they are. In addition, the merge candidate derivation unit 30361 may apply spatial merge candidate derivation processing, temporal merge candidate derivation processing, joint merge candidate derivation processing, zero merge candidate derivation processing, and spatio-temporal merge candidate derivation processing, which will be described later.

(空間マージ候補導出処理)
空間マージ候補導出処理として、マージ候補導出部30361は、所定の規則に従って、予測パラメータメモリ307が記憶している予測パラメータ(予測リスト利用フラグpredFlagLX、動きベクトルmvLX、参照ピクチャインデックスrefIdxLX)を読み出し、マージ候補に設定する。参照ピクチャの指定方法は、例えば、対象ブロックから予め定めた範囲内にある隣接ブロック(例えば、対象ブロックの左端L、左下端BL、左上端AL、上端A、右上端ARにそれぞれ接するブロックの全部または一部)のそれぞれに係る予測パラメータである。各々のマージ候補をL, BL, AL, A, ARと呼ぶ。
(Spatial merge candidate derivation process)
As the spatial merge candidate derivation process, the merge candidate derivation unit 30361 reads the prediction parameters (prediction list usage flag predFlagLX, motion vector mvLX, reference picture index refIdxLX) stored in the prediction parameter memory 307 according to a predetermined rule, and merges the prediction parameters. set as a candidate. The method of specifying a reference picture is, for example, all blocks adjacent to the target block within a predetermined range (for example, the left edge L, the lower left edge BL, the upper left edge AL, the upper edge A, and the upper right edge AR of the target block). or part). Call each merge candidate L, BL, AL, A, AR.

(時間マージ候補導出処理、時間動きベクトル導出処理)
時間マージ導出処理として、マージ候補導出部30361は、対象ブロックの右下CBR、あるいは、中央の座標を含む参照画像中のブロックCの予測パラメータを、予測パラメータメモリ307から読み出してマージ候補とし、マージ候補リストmergeCandList[]に格納する。
(Temporal merge candidate derivation process, temporal motion vector derivation process)
As a temporal merge derivation process, the merge candidate derivation unit 30361 reads out the prediction parameters of the block C in the reference image including the lower right CBR of the target block or the center coordinates from the prediction parameter memory 307 and uses them as merge candidates. Store in candidate list mergeCandList[].

図18は、参照画像中のブロックC、CBRを示す図である。ブロックCBR(ブロックBR)を優先してマージ候補リストmergeCandList[]に加え、ブロックCBRが動きベクトルを持たない(例えばイントラ予測ブロック)場合や、ブロックCBRがピクチャ外に位置する場合は、ブロックCの動きベクトルを予測ベクトル候補に加える。動きの異なる可能性が高いコロケートブロックの動きベクトルを予測候補として加えることで、予測ベクトルの選択肢が増え、符号化効率が高まる。参照画像の指定方法は、例えば、スライスヘッダにおいて指定された参照ピクチャインデックスrefIdxLXでも良いし、隣接ブロックの参照ピクチャインデックスrefIdxLXのうち最小のものを用いて指定しても良い。 FIG. 18 is a diagram showing blocks C and CBR in the reference image. Add the block CBR (block BR) to the merge candidate list mergeCandList[] with priority, and if the block CBR does not have a motion vector (for example, an intra-prediction block) or if the block CBR is located outside the picture, block C Add the motion vector to the vector predictor candidates. By adding the motion vectors of collocated blocks that are highly likely to have different motions as prediction candidates, the number of choices for prediction vectors increases, and coding efficiency increases. The method of specifying the reference picture may be, for example, the reference picture index refIdxLX specified in the slice header, or the minimum one of the reference picture indices refIdxLX of adjacent blocks.

例えばマージ候補導出部30361は、ブロックCの位置(xColCtr,yColCtr)とブロックCBRの位置(xColBr、yColBr)を、以下の式で導出してもよい。 For example, the merge candidate derivation unit 30361 may derive the position of block C (xColCtr, yColCtr) and the position of block CBR (xColBr, yColBr) using the following formulas.

xColCtr = xCb+(bW>>1)
yColCtr = yCb+(bH>>1)
xColBr = xCb+bW
yColBr = yCb+bH
ここで、(xCb,yCb)は対象ブロックの左上座標、(bW,bH)は対象ブロックの幅と高さである。なお、bW, bHは、cbWidth、cbHeightとも記載する。
ブロックCBRが利用可能であればブロックCBRの動きベクトルを利用してマージ候補COLを導出する。ブロックCBRが利用可能でなければブロックCを使用してCOLを導出する。
xColCtr = xCb+(bW>>1)
yColCtr = yCb+(bH>>1)
xColBr = xCb+bW
yColBr = yCb + bH
Here, (xCb, yCb) are the upper left coordinates of the target block, and (bW, bH) are the width and height of the target block. Note that bW and bH are also described as cbWidth and cbHeight.
If the block CBR is available, the motion vector of the block CBR is used to derive the merging candidate COL. If block CBR is not available, block C is used to derive COL.

(タイル境界を時間マージ候補導出処理の構成)
マージ候補導出部30361(時間動き予測部、時間動きベクトル導出部)は、参照メモリ中の動きベクトルをCTUライン単位で管理し、対象CTUに必要な範囲のみを内部メモリにフェッチすることが好適である。このときマージ候補導出部30361は、フェッチした領域以外をアクセスしないように、ブロックCBRの位置(xColBr、yColBr)が対象CTUラインを超える場合にはブロックBRを利用せず、以下の処理によりブロックCを利用する。
(Configuration of time merge candidate derivation processing for tile boundaries)
The merge candidate derivation unit 30361 (temporal motion prediction unit, temporal motion vector derivation unit) preferably manages the motion vectors in the reference memory in units of CTU lines and fetches only the range required for the target CTU into the internal memory. be. At this time, the merging candidate deriving unit 30361 does not use the block BR when the position (xColBr, yColBr) of the block CBR exceeds the target CTU line so as not to access any area other than the fetched area, and performs the following processing. take advantage of

以下、タイル内座標を用いて対象ブロックの左上座標を処理する場合の処理例を示す。以下の処理では、(yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY)により、同じCTUラインと判定される場合には参照位置(xRef, yRef)に(xColBr, yColBr)を用い、それ以外では(xColCtr, yColCtr)を用いる。さらに、下記の例のように3bit右シフトの後で3bit左シフトすることで8*8単位にアクセスを制限してもよい。なお、参照ピクチャメモリ上の動きベクトルを参照する場合に、タイル左上座標を参照位置に加算し画面内座標の参照位置を導出するが、この動作は、参照位置の量子化(シフト)の前でも後でもよい。 A processing example of processing the upper left coordinates of the target block using the intra-tile coordinates will be described below. In the following process, (yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY), if it is determined to be the same CTU line, use (xColBr, yColBr) as the reference position (xRef, yRef), otherwise Use (xColCtr, yColCtr). Furthermore, as shown in the example below, the access may be restricted to 8*8 units by performing a 3-bit left shift after a 3-bit right shift. When referring to a motion vector in the reference picture memory, the upper left coordinate of the tile is added to the reference position to derive the reference position of the in-screen coordinates. You can do it later.

xColBr = xCbInTile + cbWidth
yColBr = yCbInTile + cbHeight
xColCtr = xCbInTile + (cbWidth>>1)
yColCtr = yCbInTile + (cbHeight>>1)
if (((yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY)) && (yColBr<hPict) && (xColBr<wPict)) {
// (xColBr, yColBr)を用いて参照ピクチャの動きベクトルを参照する。例えば、下記(xRef, yRef)を参照。
xColBr = xCbInTile + cbWidth
yColBr = yCbInTile + cbHeight
xColCtr = xCbInTile + (cbWidth>>1)
yColCtr = yCbInTile + (cbHeight>>1)
if (((yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY)) &&(yColBr<hPict)&&(xColBr<wPict)) {
// Reference the motion vector of the reference picture using (xColBr, yColBr). For example, see (xRef, yRef) below.

xRef = ((xColBr>>3)<<3)+xTile[TileId]
yRef = ((yColBr>>3)<<3)+yTile[TileId]
}
else {
// (xColCtr, yColCtr)を用いて参照ピクチャの動きベクトルを参照する。例えば、
xRef = ((xColCtr>>3)<<3)+xTile[TileId]
yRef = ((yColCtr>>3)<<3)+yTile[TileId]
}
図40は、参照ピクチャのタイル分割と対象ピクチャのタイル分割が等しい場合である。この場合には、対象ピクチャ内のCTU座標と、参照ピクチャ内のCTU座標によって、画面内のCTU座標を導出することができる。また、タイル内のCTUラインごとにMVメモリを管理する場合において、画面内にあってもタイル内にないCTUラインのMVメモリは参
照することが難しい。したがって、本実施形態では参照範囲をタイル内に限定する。図39(a)に示す。
xRef = ((xColBr>>3)<<3)+xTile[TileId]
yRef = ((yColBr>>3)<<3)+yTile[TileId]
}
else {
// Reference the motion vector of the reference picture using (xColCtr, yColCtr). for example,
xRef = ((xColCtr>>3)<<3)+xTile[TileId]
yRef = ((yColCtr>>3)<<3)+yTile[TileId]
}
FIG. 40 shows the case where the tile division of the reference picture and the tile division of the target picture are the same. In this case, the CTU coordinates within the screen can be derived from the CTU coordinates within the target picture and the CTU coordinates within the reference picture. Also, when managing the MV memory for each CTU line within a tile, it is difficult to refer to the MV memory of a CTU line that is within the screen but not within the tile. Therefore, in this embodiment, the reference range is limited within the tile. It is shown in FIG. 39(a).

xColBr = xCbInTile+cbWidth
yColBr = yCbInTile+cbHeight
xColCtr = xCbInTile+(cbWidth>>1)
yColCtr = yCbInTile+(cbHeight>>1)
if (((yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY)) && (yColBr<hTile[TileId]) &&
(xColBr<wTile[TileId])) {
// (xColBr, yColBr)を用いて参照ピクチャの動きベクトルを参照する。例えば、下記(xRef, yRef)を参照。
xColBr = xCbInTile + cbWidth
yColBr = yCbInTile + cbHeight
xColCtr = xCbInTile+(cbWidth>>1)
yColCtr = yCbInTile+(cbHeight>>1)
if (((yCb>>CtbLog2SizeY)==(yColBr>>CtbLog2SizeY)) &&(yColBr<hTile[TileId])&&
(xColBr<wTile[TileId])) {
// Reference the motion vector of the reference picture using (xColBr, yColBr). For example, see (xRef, yRef) below.

xRef = ((xColBr>>3)<<3)+xTile[TileId]
yRef = ((yColBr>>3)<<3)+yTile[TileId]
}
else {
// (xColCtr, yColCtr)を用いて参照ピクチャの動きベクトルを参照する。例えば、
xRef = ((xColCtr>>3)<<3)+xTile[TileId]
yRef = ((yColCtr>>3)<<3)+yTile[TileId]
}
また、上記の処理は独立タイル(independent_tiles_flag=1)の場合に行っても良い。
xRef = ((xColBr>>3)<<3)+xTile[TileId]
yRef = ((yColBr>>3)<<3)+yTile[TileId]
}
else {
// Reference the motion vector of the reference picture using (xColCtr, yColCtr). for example,
xRef = ((xColCtr>>3)<<3)+xTile[TileId]
yRef = ((yColCtr>>3)<<3)+yTile[TileId]
}
Also, the above process may be performed for independent tiles (independent_tiles_flag=1).

タイル境界を超える範囲を参照しないように、座標系として、予測ブロックの座標にタイル左上を原点とするタイル内座標(xCbInTile、yCbInTile)を用い、各参照位置がタイルサイズ(wTile, hTile)を超える場合には参照しないことが適当である。さらに、参照ピクチャメモリ上の動きベクトルを参照する場合に、タイル左上座標を参照位置に加算し画面内座標の参照位置を導出する。図31~図34に示すように、タイル内座標でCT分割を行うことにより、予測ブロックの左上座標をタイル内座標で導出し、時間予測で参照する位置を判定することにより、CTU境界にかかるかどうかを簡単に判定することができる効果を奏する。 In order not to refer to the range beyond the tile boundary, use the coordinates within the tile (xCbInTile, yCbInTile) with the origin at the upper left of the tile as the coordinate system for the prediction block, and each reference position exceeds the tile size (wTile, hTile). In some cases, it is appropriate not to refer to it. Furthermore, when referring to the motion vector on the reference picture memory, the tile upper left coordinates are added to the reference position to derive the reference position of the in-screen coordinates. As shown in FIGS. 31 to 34, by performing CT division with intra-tile coordinates, the upper left coordinate of the prediction block is derived with intra-tile coordinates, and by determining the position referred to in temporal prediction, There is an effect that it can be easily determined whether or not.

画面内座標を用いて対象ブロックの左上座標を処理する場合の処理例を示す。タイル内座標系を用いて処理する場合と異なり、タイル左上座標を減算してタイル内座標に変換した後(yColBr-yTile, xColBr-xTile)で、タイルサイズ(wTile, hTile)との比較を行い、タイルサイズを超えているか否かを判定する。また、タイル境界の判定においても、タイル内座標の対象ブロックの位置(yCb-yTile[TileId])と参照ブロックの位置(yColBr-yTile[TileId])をCTUサイズの対数CtbLog2SizeYで右シフトすることで判定を行う。 A processing example of processing the upper left coordinates of the target block using the in-screen coordinates is shown. Unlike when processing using the coordinate system within the tile, after subtracting the upper left coordinate of the tile and converting it to the coordinate within the tile (yColBr-yTile, xColBr-xTile), it is compared with the tile size (wTile, hTile). , determines whether the tile size is exceeded. Also, when determining the tile boundary, the position of the target block in the tile coordinates (yCb-yTile[TileId]) and the position of the reference block (yColBr-yTile[TileId]) are shifted right by the CTU size logarithm CtbLog2SizeY. make a judgment.

xColBr = xCbInPic+cbWidth
yColBr = yCbInPic+cbHeight
xColCtr = xCbInPic+(cbWidth>>1)
yColCtr = yCbInPic+(cbHeight>>1)
if ((((yCb-yTile[TileId])>>CtbLog2SizeY)==((yColBr-yTile[TileId])>>CtbLog2SizeY)) && (yColBr<hPict) && (xColBr<wPict)) {
xRef = ((xColBr>>3)<<3)
yRef = ((yColBr>>3)<<3)
}
else {
xRef = ((xColCtr>>3)<<3)
yRef = ((yColCtr>>3)<<3)
}
図40は、参照ピクチャのタイル分割と対象ピクチャのタイル分割が等しい場合である。この場合、本実施形態では参照範囲をタイル内に限定する。図39(b)に処理の一例を示す。
xColBr = xCbInPic+cbWidth
yColBr = yCbInPic+cbHeight
xColCtr = xCbInPic+(cbWidth>>1)
yColCtr = yCbInPic+(cbHeight>>1)
if ((((yCb-yTile[TileId])>>CtbLog2SizeY)==((yColBr-yTile[TileId])>>CtbLog2SizeY)) &&(yColBr<hPict)&&(xColBr<wPict)) {
xRef = ((xColBr>>3)<<3)
yRef = ((yColBr>>3)<<3)
}
else {
xRef = ((xColCtr>>3)<<3)
yRef = ((yColCtr>>3)<<3)
}
FIG. 40 shows the case where the tile division of the reference picture and the tile division of the target picture are the same. In this case, the reference range is limited within the tile in this embodiment. FIG. 39(b) shows an example of processing.

xColBr = xCbInPic+cbWidth
yColBr = yCbInPic+cbHeight
xColCtr = xCbInPic+(cbWidth>>1)
yColCtr = yCbInPic+(cbHeight>>1)
if ((((yCb-yTile[TileId])>>CtbLog2SizeY)==((yColBr-yTile[TileId])>>CtbLog2SizeY)) && ((yColBr-yTile[TileId])<hTile[TileId]) && ((xColBr-xTile[TileId])<wTile[TileId])) {
xRef = ((xColBr>>3)<<3)
yRef = ((yColBr>>3)<<3)
}
else {
xRef = ((xColCtr>>3)<<3)
yRef = ((yColCtr>>3)<<3)
}
上記の処理は、独立タイルの場合に行っても良い。
xColBr = xCbInPic+cbWidth
yColBr = yCbInPic+cbHeight
xColCtr = xCbInPic+(cbWidth>>1)
yColCtr = yCbInPic+(cbHeight>>1)
if ((((yCb-yTile[TileId])>>CtbLog2SizeY)==((yColBr-yTile[TileId])>>CtbLog2SizeY)) &&((yColBr-yTile[TileId])<hTile[TileId])&& ( (xColBr-xTile[TileId])<wTile[TileId])) {
xRef = ((xColBr>>3)<<3)
yRef = ((yColBr>>3)<<3)
}
else {
xRef = ((xColCtr>>3)<<3)
yRef = ((yColCtr>>3)<<3)
}
The above process may be performed for independent tiles.

予測ブロックの座標を画面内座標からタイル内座標に変換することにより、タイル範囲にあるかどうか、及び、CTU境界にかかるかどうかを簡単に判定することができる効果を奏する。 By converting the coordinates of the predicted block from the intra-screen coordinates to the intra-tile coordinates, it is possible to easily determine whether or not the prediction block is within the tile range and whether or not it crosses the CTU boundary.

(仮想CTUラインを用いる方法)
図14は、仮想CTUラインを設定して、参照ピクチャの動きベクトルを参照する場合の参照範囲を示す図である。本構成では、参照ピクチャを仮想のCTUラインに分割し、対象ブロックに対応する仮想CTUラインの動きベクトルを参照する。
(Method using virtual CTU line)
FIG. 14 is a diagram showing a reference range when a virtual CTU line is set and a motion vector of a reference picture is referenced. In this configuration, the reference picture is divided into virtual CTU lines, and the motion vector of the virtual CTU line corresponding to the target block is referenced.

一つの構成は、参照ピクチャを固定のCTUサイズで分割し、仮想CTUラインを設定する。 One configuration divides the reference picture into fixed CTU sizes and sets virtual CTU lines.

図15は、整数画素ピクチャをCTUの整数倍に制限されないサイズのタイル(フレキシブルタイル)に分割した場合の時間動き予測部の動作を示すフローチャートである。 FIG. 15 is a flowchart showing the operation of the temporal motion prediction unit when an integer pixel picture is divided into tiles (flexible tiles) of sizes not limited to integer multiples of the CTU.

S3001:画面内座標導出
時間動き予測部は、タイル内座標系の(xCbInTile, yCbInTile)から、画面内座標のCTU座標(xCtbInPic, yCtbInPic)、右下座標(xColBr, yColBr)と中心座標(xColCtr, yColCtr)を導出する。なお、タイル内座標系でCT分割(QT, BT, TTなどのマルチツリー分割)を行わない場合などタイル内座標系で処理される場合には、タイル内座標系から画面内座標系への変換は省略できる。
xCtbInPic = xCtbInTile+xTile[currTileId]
yCtbInPic = yCtbInTile+yTile[currTileId]
xColBrInPic = xCbInTile+cbWidth+xTile[currTileId]
yColBrInPic = yCbInTile+cbHeight+yTile[currTileId]
xColCtrInPic = xCbInTile+(cbWidth>>1)+xTile[currTileId]
yColCtrInPic = yCbInTile+(cbHeight>>1)+yTile[currTileId]
S3003:仮想CTUライン内判定
画面内座標で、画面内右下座標(xColBrInPic, yColBrInPic)が、仮想CTUライン内であるか否かを判定する。ここでは、さらに右下座標(xColBrInPic, yColBrInPic)が、仮想CT
Uライン内かつ画面内にあるかを判定する。
S3001: In-screen coordinate derivation The temporal motion prediction unit derives the CTU coordinates (xCtbInPic, yCtbInPic) of the in-screen coordinates, the lower right coordinates (xColBr, yColBr), and the center coordinates (xColCtr, yColCtr). In addition, when processing in the in-tile coordinate system, such as when CT division (multi-tree division such as QT, BT, TT) is not performed in the in-tile coordinate system, conversion from the in-tile coordinate system to the in-screen coordinate system can be omitted.
xCtbInPic = xCtbInTile+xTile[currTileId]
yCtbInPic = yCtbInTile+yTile[currTileId]
xColBrInPic = xCbInTile+cbWidth+xTile[currTileId]
yColBrInPic = yCbInTile+cbHeight+yTile[currTileId]
xColCtrInPic = xCbInTile+(cbWidth>>1)+xTile[currTileId]
yColCtrInPic = yCbInTile+(cbHeight>>1)+yTile[currTileId]
S3003: Judgment within Virtual CTU Line It is judged whether or not the in-screen lower right coordinates (xColBrInPic, yColBrInPic) are within the virtual CTU line. Here, the lower right coordinate (xColBrInPic, yColBrInPic) is the virtual CT
Determine if it is within the U line and within the screen.

判定式=((yColBrInPic>>CtbLog2SizeY) == (yVirCtb>>CtbLog2SizeY)) && (yColBr<hPict) && (xColBr<wPict)
S3004:参照ピクチャの動きベクトル参照
時間動き予測部は、判定式が真の場合には、右下座標の動きベクトルを参照する。ここではさらに座標を8x8などの単位に間引いて参照しても良い。
Judgment formula = ((yColBrInPic>>CtbLog2SizeY) == (yVirCtb>>CtbLog2SizeY)) &&(yColBr<hPict)&&(xColBr<wPict)
S3004: Reference motion vector of reference picture The temporal motion prediction unit refers to the motion vector of the lower right coordinates when the determination formula is true. Here, the coordinates may be further thinned out in units such as 8x8 for reference.

((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
S3005:判定式が偽の場合には、中心座標(xColCtrInPic, yColCtrInPic)の動きベクトルを参照する。ここではさらに座標を8x8などの単位で間引いて参照しても良い。
((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
S3005: If the determination formula is false, refer to the motion vector of the center coordinates (xColCtrInPic, yColCtrInPic). Here, the coordinates may be further thinned out in units such as 8x8 for reference.

((xColCtrInPic>>3)<<3, (yColCtrInPic>>3)<<3)
さらに、中心座標の動きベクトルを参照する前に、以下の判定式を用いて、参照座標が仮想CTUライン内であるか否かを判定してもよい。
((xColCtrInPic>>3)<<3, (yColCtrInPic>>3)<<3)
Furthermore, before referring to the motion vector of the center coordinates, it may be determined whether or not the reference coordinates are within the virtual CTU line using the following determination formula.

判定式=(yColCtrInPic>yVirCtbB)
図16は、仮想CTUラインを設定して、参照ピクチャの動きベクトルを参照する場合の参照範囲を示す図である。本構成では、参照ピクチャをVBSize×VBSizeサイズ単位(Log2VBSize=log2(VBSize))に分割し、対象CTUからみて、この区切り位置を参照CTUラインの上側座標yCtbInPicに設定する、この上側座標yCtbInPicから所定の範囲を、参照ピクチャから参照可能な動きベクトルの範囲に設定する。
Judgment formula = (yColCtrInPic>yVirCtbB)
FIG. 16 is a diagram showing a reference range when a virtual CTU line is set and a motion vector of a reference picture is referenced. In this configuration, the reference picture is divided into VBSize×VBSize size units (Log2VBSize=log2(VBSize)), and when viewed from the target CTU, this division position is set to the upper coordinate yCtbInPic of the reference CTU line. is set to the range of motion vectors that can be referenced from the reference picture.

図17は、整数画素ピクチャをCTUの整数倍に制限されないサイズのタイル(フレキシブルタイル)に分割した場合の時間動き予測部の動作を示すフローチャートである。 FIG. 17 is a flowchart showing the operation of the temporal motion prediction unit when an integer pixel picture is divided into tiles (flexible tiles) of sizes not limited to integer multiples of the CTU.

S3001:画面内座標導出
時間動き予測部は、タイル内座標系の(xCbInTile, yCbInTile)から、画面内座標のCTU座標(xCtbInPic, yCtbInPic)、右下座標(xColBr, yColBr)と中心座標(xColCtr, yColCtr)を導出する。なお、タイル内座標系でCT分割(QT, BT, TTなどのマルチツリー分割)を行わない場合など画面内座標系で処理が行われている場合には、タイル内座標系から画面内座標系への変換は省略できる。
xCtbInTile = (xCbInTile>>Log2VBSize)<<Log2VBSize
yCtbInTile = (yCbInTile>>Log2VBSize)<<Log2VBSize
xCtbInPic = xCtbInTile+xTile[currTileId]
yCtbInPic = yCtbInTile+yTile[currTileId]
xColBrInPic = xCbInTile+cbWidth+xTile[currTileId]
yColBrInPic = yCbInTile+cbHeight+yTile[currTileId]
xColCtrInPic = xCbInTile+(cbWidth>>1)+xTile[currTileId]
yColCtrInPic = yCbInTile+(cbHeight>>1)+yTile[currTileId]
S3002:仮想CTUライン導出
続いて、時間動き予測部は、yCtbInPicをVBSize単位の座標に変換し、仮想CTUラインの上側座標yVirCtbTを導出する。また、所定のサイズ(ここではCTUサイズctuSize)だけ下の位置の下側座標yVirCtbBを設定する。
yVirCtbT = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)
yVirCtbB = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)+ctuSize
なお、VBLog2SizeをCtbLog2SizeYに設定すると、参照ピクチャを固定のCTUサイズ単位で分割した場合と同じ処理となる。
なお、上記では参照範囲をCTUサイズに限定していたが、それより大きいサイズでもよい。例えば、参照ピクチャ上において、対象CTUサイズ+M画素の範囲の動きベクトル
を参照する場合は以下の式を用いる。
yVirCtbB = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)+ctuSize+M
例えばM=16。
S3001: In-screen coordinate derivation The temporal motion prediction unit derives the CTU coordinates (xCtbInPic, yCtbInPic) of the in-screen coordinates, the lower right coordinates (xColBr, yColBr), and the center coordinates (xColCtr, yColCtr). In addition, when processing is performed in the screen coordinate system, such as when CT division (multi-tree division such as QT, BT, TT) is not performed in the tile coordinate system, the screen coordinate system is changed from the tile coordinate system to the screen coordinate system. can be omitted.
xCtbInTile = (xCbInTile>>Log2VBSize)<<Log2VBSize
yCtbInTile = (yCbInTile>>Log2VBSize)<<Log2VBSize
xCtbInPic = xCtbInTile+xTile[currTileId]
yCtbInPic = yCtbInTile+yTile[currTileId]
xColBrInPic = xCbInTile+cbWidth+xTile[currTileId]
yColBrInPic = yCbInTile+cbHeight+yTile[currTileId]
xColCtrInPic = xCbInTile+(cbWidth>>1)+xTile[currTileId]
yColCtrInPic = yCbInTile+(cbHeight>>1)+yTile[currTileId]
S3002: Derivation of Virtual CTU Line Subsequently, the temporal motion prediction unit converts yCtbInPic into coordinates in VBSize units, and derives the upper coordinate yVirCtbT of the virtual CTU line. Also, the lower coordinate yVirCtbB of the position below by a predetermined size (here, the CTU size ctuSize) is set.
yVirCtbT = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)
yVirCtbB = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)+ctuSize
Note that if VBLog2Size is set to CtbLog2SizeY, the processing is the same as when the reference picture is divided into fixed CTU size units.
Although the reference range is limited to the CTU size in the above description, a larger size may be used. For example, the following formula is used to refer to a motion vector in a range of target CTU size+M pixels on a reference picture.
yVirCtbB = ((yCtbInPic>>VBLog2Size)<<VBLog2Size)+ctuSize+M
For example M=16.

S3003:仮想CTUライン内判定
時間動き予測部は、画面内座標で、右下座標(xColBrInPic, yColBrInPic)が、仮想CTUライン内であるか否かを判定する。ここでは、さらに右下座標(xColBrInPic, yColBrInPic)が、仮想CTUライン内かつ画面内にあるかを判定する。仮想CTUライン内の場合には、その参照位置(xColBrInPic,yColBrInPic)の動きベクトルを参照する。
S3003: Judgment within Virtual CTU Line The temporal motion prediction unit judges whether or not the lower right coordinate (xColBrInPic, yColBrInPic) of the in-screen coordinates is within the virtual CTU line. Here, it is further determined whether the lower right coordinates (xColBrInPic, yColBrInPic) are within the virtual CTU line and within the screen. If it is within the virtual CTU line, refer to the motion vector of that reference position (xColBrInPic, yColBrInPic).

判定式=(yColBrInPic<yVirCtbB) && (yColBr<hPict) && (xColBr<wPict)
S3004:参照ピクチャの動きベクトル参照
時間動き予測部は、判定式が真の場合には、参照ピクチャの右下座標の動きベクトルを参照する。ここではさらに座標を8x8などの単位で間引いて参照しても良い。
Judgment formula = (yColBrInPic<yVirCtbB) &&(yColBr<hPict)&&(xColBr<wPict)
S3004: Reference motion vector of reference picture If the determination formula is true, the temporal motion prediction unit refers to the motion vector of the lower right coordinate of the reference picture. Here, the coordinates may be further thinned out in units such as 8x8 for reference.

((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
以下、図示しないが以下の処理を行っても良い。
((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
Although not shown, the following processing may be performed.

S3005:参照ピクチャの動きベクトル参照2
時間動き予測部は、判定式が偽の場合には、参照ピクチャの中心座標(xColCtrInPic, yColCtrInPic)の動きベクトルを参照する。ここではさらに座標を8x8などの単位で間引いて参照しても良い。
S3005: Reference picture motion vector reference 2
The temporal motion prediction unit refers to the motion vector of the center coordinates (xColCtrInPic, yColCtrInPic) of the reference picture when the determination formula is false. Here, the coordinates may be further thinned out in units such as 8x8 for reference.

((xColCtrInPic>>3)<<3, (yColCtrInPic>>3)<<3)
さらに、中心座標の動きベクトルを参照する前に、以下の判定式を用いて、参照座標が仮想CTUライン内であるか否かを判定してもよい。
((xColCtrInPic>>3)<<3, (yColCtrInPic>>3)<<3)
Furthermore, before referring to the motion vector of the center coordinates, it may be determined whether or not the reference coordinates are within the virtual CTU line using the following determination formula.

判定式=(yColCtrInPic<yVirCtbB)
以上の処理の擬似コードは以下のとおりである。
if ((yColBrInPic<yVirCtbB) && (yColBr<hPict) && (xColBr<wPict)) {
(xColBrInPic, yColBrInPic)を用いて動きベクトルを参照する
// 例えば8x8 単位にラウンドした以下の座標でもよい。
Judgment formula = (yColCtrInPic<yVirCtbB)
Pseudocode for the above processing is as follows.
if ((yColBrInPic<yVirCtbB) &&(yColBr<hPict)&&(xColBr<wPict)) {
Reference the motion vector using (xColBrInPic, yColBrInPic)
// For example, the following coordinates rounded to 8x8 units would work.

// ((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
}
else if (yColCtrInPic<yVirCtbB) { // ブロック中心で仮想CTUライン境界判定
(xColCtr, yColCtr)を用いて動きベクトルを参照する
// 例えば8x8単位にラウンドした以下の座標でもよい。
// ((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
}
else if (yColCtrInPic<yVirCtbB) { // Determine virtual CTU line boundary at block center
Reference motion vectors using (xColCtr, yColCtr)
// For example, the following coordinates rounded to 8x8 units would work.

// ((xColCtr>>3)<<3, (yColCtr>>3)<<3)
}
以上の構成の時間動き予測部によれば、参照ブロックのピクチャ内座標yColBrInPicと、対象ピクチャのピクチャ内座標から導出した仮想CTU座標yVirCtbBを比較して、参照ブロックの参照可能性を判定する。ここでは、仮想CTU座標yVirCtbBの導出において、仮想CTU座標を、VBSizeの整数倍とするためにVBLog2Sizeによる右シフトと左シフトを行う。さらに、参照ブロックのピクチャ内座標yColBrInPicが、対象ピクチャのピクチャ内座標から導出した仮想CTU座標yVirCtbBよりも小さい場合に、参照ピクチャの動きベクトルを参照する。これによって、対象ピクチャと参照ピクチャのCTUサイズが異なる場合においても、参照ピクチャにおいて動きベクトルを参照する範囲を仮想CTUラインの範囲に制限されているので、参照ピクチャ上の動きベクトルを予めフェッチして処理することが可
能であり、高速に処理が可能である効果を奏する。また、参照ピクチャにおいて動きベクトルを参照する範囲である仮想CTUラインの設定において、できるだけ対象CTUと同じ位置であることを保ちながら、CTUラインを設定することができる。
// ((xColCtr>>3)<<3, (yColCtr>>3)<<3)
}
According to the above-configured temporal motion prediction unit, the in-picture coordinate yColBrInPic of the reference block and the virtual CTU coordinate yVirCtbB derived from the in-picture coordinate of the target picture are compared to determine the referability of the reference block. Here, in deriving the virtual CTU coordinates yVirCtbB, right shift and left shift by VBLog2Size are performed to make the virtual CTU coordinates integral multiples of VBSize. Furthermore, when the in-picture coordinate yColBrInPic of the reference block is smaller than the virtual CTU coordinate yVirCtbB derived from the in-picture coordinate of the target picture, the motion vector of the reference picture is referred to. As a result, even if the CTU sizes of the target picture and the reference picture are different, the range in which the motion vector is referred to in the reference picture is limited to the range of the virtual CTU line. It is possible to process, and it is effective in being able to process at high speed. Also, in setting the virtual CTU line, which is the range in which the motion vector is referenced in the reference picture, the CTU line can be set while maintaining the same position as the target CTU as much as possible.

(変形例)
上記ではVBSizexVBSizeの粒度で、仮想CTUラインを設定したが、仮想CTUラインの粒度(例えば8×8、つまりVBSize=8)が、CTUサイズの粒度(ctuUnitSize)以下である場合には、仮想CTUラインの導出においてVBSizeに関するシフト処理を省略することができる。
(Modification)
In the above, the virtual CTU line is set with a granularity of VBSize x VBSize, but if the virtual CTU line granularity (e.g., 8 × 8, that is, VBSize = 8) is equal to or smaller than the CTU size granularity (ctuUnitSize), the virtual CTU line The shift processing for VBSize can be omitted in the derivation of .

図18は、整数画素ピクチャをCTUの整数倍に制限されないサイズのタイル(フレキシブルタイル)に分割する場合に、時間動き予測部の動作を示すフローチャートである。この例ではシフト処理を省略している。この場合のS3002の仮想CTUライン導出は、以下の動作であってもよい。 FIG. 18 is a flowchart showing the operation of the temporal motion prediction unit when dividing an integer-pixel picture into tiles (flexible tiles) of sizes not limited to integer multiples of the CTU. In this example, shift processing is omitted. The virtual CTU line derivation in S3002 in this case may be the following operation.

仮想CTUラインの上側座標yVirCtbTを、対象CTU座標の画面内座標から導出する。ここで対象CTU座標がタイル内座標である場合には、対象CTUのタイル内座標(タイル座標系での対象CTU座標)とタイルの画面内座標を加算して、対象CTUの画面内座標を導出して処理する。また、所定のサイズ(ここではCTUサイズctuSize)だけ下の位置の下側座標yVirCtbBを設定する。ここではVBSizeに関するシフト処理が省略されている。
yVirCtbT = yCtbInPic
yVirCtbB = yCtbInPic+ctuSize
続く処理の擬似コードは以下のとおりである。
if ((yColBrInPic<yVirCtbB) && (yColBr<hPict) && (xColBr<wPict)) {
(xColBrInPic, yColBrInPic)を用いて動きベクトルを参照する
// 例えば8x8 単位にラウンドした以下の座標でもよい。
The upper coordinate yVirCtbT of the virtual CTU line is derived from the in-screen coordinates of the target CTU coordinates. Here, when the target CTU coordinates are in-tile coordinates, the in-screen coordinates of the target CTU are added by adding the in-tile coordinates of the target CTU (target CTU coordinates in the tile coordinate system) and the in-screen coordinates of the tile to derive the in-screen coordinates of the target CTU. and process. Also, the lower coordinate yVirCtbB of the position lower by a predetermined size (here, the CTU size ctuSize) is set. The shift processing for VBSize is omitted here.
yVirCtbT = yCtbInPic
yVirCtbB = yCtbInPic + ctuSize
The pseudocode for the subsequent processing is as follows.
if ((yColBrInPic<yVirCtbB) &&(yColBr<hPict)&&(xColBr<wPict)) {
Reference the motion vector using (xColBrInPic, yColBrInPic)
// For example, the following coordinates rounded to 8x8 units would work.

// ((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
}
else if (yColCtrInPic<yVirCtbB) { // ブロック中心で仮想CTUライン境界判定
(xColCtr, yColCtr)を用いて動きベクトルを参照する
// 例えば8x8単位にラウンドした以下の座標でもよい。
// ((xColBrInPic>>3)<<3, (yColBrInPic>>3)<<3)
}
else if (yColCtrInPic<yVirCtbB) { // Determine virtual CTU line boundary at block center
Reference motion vectors using (xColCtr, yColCtr)
// For example, the following coordinates rounded to 8x8 units would work.

// ((xColCtr>>3)<<3, (yColCtr>>3)<<3)
以上の構成の時間動き予測部によれば、参照ブロックのピクチャ内座標yColBrInPicと、対象ピクチャのピクチャ内座標から導出した仮想CTU座標yVirCtbBを比較して、参照ブロックの参照可能性を判定する。
// ((xColCtr>>3)<<3, (yColCtr>>3)<<3)
According to the above-configured temporal motion prediction unit, the in-picture coordinate yColBrInPic of the reference block and the virtual CTU coordinate yVirCtbB derived from the in-picture coordinate of the target picture are compared to determine the referability of the reference block.

ループフィルタ305は、符号化ループ内に設けたフィルタで、ブロック歪やリンギング歪を除去し、画質を改善するフィルタである。ループフィルタ305は、加算部312が生成したCUの復号画像に対し、デブロッキングフィルタ、サンプル適応オフセット(SAO)、適応ループフィルタ(ALF)等のフィルタを施す。 A loop filter 305 is a filter provided in the encoding loop, and is a filter that removes block distortion and ringing distortion to improve image quality. A loop filter 305 applies filters such as a deblocking filter, a sample adaptive offset (SAO), and an adaptive loop filter (ALF) to the decoded image of the CU generated by the addition unit 312 .

参照ピクチャメモリ306は、加算部312が生成したCUの復号画像を、対象ピクチャ及び対象CU毎に予め定めた位置に記憶する。 The reference picture memory 306 stores the decoded image of the CU generated by the adding unit 312 in a predetermined position for each target picture and target CU.

予測パラメータメモリ307は、復号対象のCTUあるいはCU毎に予め定めた位置に予測パラメータを記憶する。具体的には、予測パラメータメモリ307は、パラメータ復号部302が復号したパラメータ及びエントロピー復号部301が分離した予測モードpredMode等を記憶す
る。
The prediction parameter memory 307 stores prediction parameters in predetermined positions for each CTU or CU to be decoded. Specifically, the prediction parameter memory 307 stores the parameters decoded by the parameter decoding unit 302, the prediction mode predMode separated by the entropy decoding unit 301, and the like.

予測画像生成部308には、予測モードpredMode、予測パラメータ等が入力される。また、予測画像生成部308は、参照ピクチャメモリ306から参照ピクチャを読み出す。予測画像生成部308は、予測モードpredModeが示す予測モードで、予測パラメータと読み出した参照ピクチャ(参照ピクチャブロック)を用いてブロックもしくはサブブロックの予測画像を生成する。ここで、参照ピクチャブロックとは、参照ピクチャ上の画素の集合(通常矩形であるのでブロックと呼ぶ)であり、予測画像を生成するために参照する領域である。 A prediction mode predMode, a prediction parameter, and the like are input to the prediction image generation unit 308 . Also, the predicted image generation unit 308 reads a reference picture from the reference picture memory 306 . The predicted image generating unit 308 generates a predicted image of a block or sub-block using the prediction parameter and the read reference picture (reference picture block) in the prediction mode indicated by the prediction mode predMode. Here, a reference picture block is a set of pixels on a reference picture (usually rectangular and therefore called a block), and is an area referred to for generating a prediction image.

逆量子化・逆変換部311は、エントロピー復号部301から入力された量子化変換係数を逆量子化して変換係数を求める。この量子化変換係数は、符号化処理において、予測誤差に対してDCT(Discrete Cosine Transform、離散コサイン変換)、DST(Discrete Sine Transform、離散サイン変換)、KLT(Karyhnen Loeve Transform、カルーネンレーベ変換)等の周波数変換を行い量子化して得られる係数である。逆量子化・逆変換部311は、求めた変換係数について逆DCT、逆DST、逆KLT等の逆周波数変換を行い、予測誤差を算出する。逆量子化・逆変換部311は予測誤差を加算部312に出力する。 The inverse quantization/inverse transform unit 311 inversely quantizes the quantized transform coefficients input from the entropy decoding unit 301 to obtain transform coefficients. These quantized transform coefficients are converted to DCT (Discrete Cosine Transform), DST (Discrete Sine Transform), and KLT (Karyhnen Loeve Transform) for prediction errors in the encoding process. It is a coefficient obtained by performing frequency conversion such as , and quantizing it. The inverse quantization/inverse transform unit 311 performs inverse frequency transform such as inverse DCT, inverse DST, and inverse KLT on the obtained transform coefficients to calculate prediction errors. Inverse quantization/inverse transform section 311 outputs the prediction error to addition section 312 .

加算部312は、予測画像生成部308から入力されたブロックの予測画像と逆量子化・逆変換部311から入力された予測誤差を画素毎に加算して、ブロックの復号画像を生成する。加算部312はブロックの復号画像を参照ピクチャメモリ306に記憶し、また、ループフィルタ305に出力する。 The addition unit 312 adds the predicted image of the block input from the predicted image generation unit 308 and the prediction error input from the inverse quantization/inverse transform unit 311 for each pixel to generate a decoded image of the block. The adder 312 stores the decoded image of the block in the reference picture memory 306 and also outputs it to the loop filter 305 .

(動画像符号化装置の構成)
次に、本実施形態に係る動画像符号化装置11の構成について説明する。図19は、本実施形態に係る動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、予測画像生成部101、減算部102、変換・量子化部103、逆量子化・逆変換部105、加算部106、ループフィルタ107、予測パラメータメモリ(予測パラメータ記憶部、フレームメモリ)108、参照ピクチャメモリ(参照画像記憶部、フレームメモリ)109、符号化パラメータ決定部110、パラメータ符号化部111、エントロピー符号化部104を含んで構成される。
(Configuration of video encoding device)
Next, the configuration of the video encoding device 11 according to this embodiment will be described. FIG. 19 is a block diagram showing the configuration of the video encoding device 11 according to this embodiment. The video encoding device 11 includes a predicted image generation unit 101, a subtraction unit 102, a transformation/quantization unit 103, an inverse quantization/inverse transformation unit 105, an addition unit 106, a loop filter 107, a prediction parameter memory (prediction parameter storage unit , frame memory) 108 , reference picture memory (reference image storage unit, frame memory) 109 , coding parameter determination unit 110 , parameter coding unit 111 and entropy coding unit 104 .

予測画像生成部101は画像Tの各ピクチャを分割した領域であるCU毎に予測画像を生成する。予測画像生成部101は既に説明した予測画像生成部308と同じ動作であり、説明を省略する。 The predicted image generation unit 101 generates a predicted image for each CU, which is an area obtained by dividing each picture of the image T. FIG. The operation of the predicted image generation unit 101 is the same as that of the predicted image generation unit 308 already described, and the description thereof is omitted.

減算部102は、予測画像生成部101から入力されたブロックの予測画像の画素値を、画像Tの画素値から減算して予測誤差を生成する。減算部102は予測誤差を変換・量子化部103に出力する。 The subtraction unit 102 subtracts the pixel values of the predicted image of the block input from the predicted image generation unit 101 from the pixel values of the image T to generate a prediction error. Subtraction section 102 outputs the prediction error to transform/quantization section 103 .

変換・量子化部103は、減算部102から入力された予測誤差に対し、周波数変換によって変換係数を算出し、量子化によって量子化変換係数を導出する。変換・量子化部103は、量子化変換係数をエントロピー符号化部104及び逆量子化・逆変換部105に出力する。 Transform/quantization section 103 calculates transform coefficients by frequency transforming the prediction error input from subtraction section 102, and derives quantized transform coefficients by quantization. The transform/quantization unit 103 outputs the quantized transform coefficients to the entropy coding unit 104 and the inverse quantization/inverse transform unit 105 .

逆量子化・逆変換部105は、動画像復号装置31における逆量子化・逆変換部311(図5)と同じであり、説明を省略する。算出した予測誤差は加算部106に出力される。 The inverse quantization/inverse transform unit 105 is the same as the inverse quantization/inverse transform unit 311 (FIG. 5) in the moving image decoding device 31, and description thereof is omitted. The calculated prediction error is output to addition section 106 .

パラメータ符号化部111は、ヘッダ符号化部1110、CT情報符号化部1111、CU符号化部1112(予測モード符号化部)、エントロピー符号化部104、および図示しないインター予測パラメータ符号化部112とイントラ予測パラメータ符号化部113を備えている。CU符号化部1112はさらにTU符号化部1114を備えている。 Parameter coding section 111 includes header coding section 1110, CT information coding section 1111, CU coding section 1112 (prediction mode coding section), entropy coding section 104, and inter prediction parameter coding section 112 (not shown). An intra prediction parameter coding unit 113 is provided. CU encoding section 1112 further comprises TU encoding section 1114 .

以下、各モジュールの概略動作を説明する。パラメータ符号化部111はヘッダ情報、分割情報、予測情報、量子化変換係数等のパラメータの符号化処理を行う。 The general operation of each module will be described below. A parameter encoding unit 111 performs encoding processing of parameters such as header information, division information, prediction information, and quantized transform coefficients.

CT情報符号化部1111は、QT、MT(BT、TT)分割情報等を符号化する。 CT information encoding section 1111 encodes QT, MT (BT, TT) division information and the like.

CU符号化部1112はCU情報、予測情報、TU分割フラグsplit_transform_flag、CU残差フラグcbf_cb、cbf_cr、cbf_luma等を符号化する。 The CU encoding unit 1112 encodes CU information, prediction information, TU split flag split_transform_flag, CU residual flags cbf_cb, cbf_cr, cbf_luma, and the like.

TU符号化部1114は、TUに予測誤差が含まれている場合に、QP更新情報(量子化補正値)と量子化予測誤差(residual_coding)を符号化する。 TU encoding section 1114 encodes QP update information (quantization correction value) and quantization prediction error (residual_coding) when prediction error is included in TU.

エントロピー符号化部104は、供給元から供給されるシンタックス要素をバイナリデータに変換し、CABAC等のエントロピー符号化方式により符号化データを生成し、出力する。図19に示す例では、シンタックス要素の供給元は、CT情報符号化部1111、CU符号化部1112である。シンタックス要素は、インター予測パラメータ(予測モードpredMode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測識別子inter_pred_idc、参照ピクチャインデックスrefIdxLX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLX)、イントラ予測パラメータ(prev_intra_luma_pred_flag、mpm_idx、rem_selected_mode_flag、rem_selected_mode、rem_non_selected_mode、)、量子化変換係数等である。 The entropy coding unit 104 converts syntax elements supplied from a supply source into binary data, generates coded data by an entropy coding method such as CABAC, and outputs the coded data. In the example shown in FIG. 19, the supply sources of syntax elements are CT information encoding section 1111 and CU encoding section 1112 . The syntax elements are inter prediction parameters (prediction mode predMode, merge flag merge_flag, merge index merge_idx, inter prediction identifier inter_pred_idc, reference picture index refIdxLX, prediction vector index mvp_LX_idx, difference vector mvdLX), intra prediction parameters (prev_intra_luma_pred_flag, mpm_idx, rem_selected_mode_flag , rem_selected_mode, rem_non_selected_mode, ), quantized transform coefficients, and so on.

加算部106は、予測画像生成部101から入力されたブロックの予測画像の画素値と逆量子化・逆変換部105から入力された予測誤差を画素毎に加算して復号画像を生成する。加算部106は生成した復号画像を参照ピクチャメモリ109に記憶する。 The addition unit 106 adds pixel values of the predicted image of the block input from the predicted image generation unit 101 and the prediction error input from the inverse quantization/inverse transform unit 105 for each pixel to generate a decoded image. The addition unit 106 stores the generated decoded image in the reference picture memory 109 .

ループフィルタ107は加算部106が生成した復号画像に対し、デブロッキングフィルタ、SAO、ALFを施す。なお、ループフィルタ107は、必ずしも上記3種類のフィルタを含まなくてもよく、例えばデブロッキングフィルタのみの構成であってもよい。 A loop filter 107 applies a deblocking filter, SAO, and ALF to the decoded image generated by the adder 106 . Note that the loop filter 107 does not necessarily include the three types of filters described above, and may be configured with only a deblocking filter, for example.

予測パラメータメモリ108は、符号化パラメータ決定部110が生成した予測パラメータを、対象ピクチャ及びCU毎に予め定めた位置に記憶する。 The prediction parameter memory 108 stores the prediction parameters generated by the coding parameter determination unit 110 in predetermined positions for each current picture and CU.

参照ピクチャメモリ109は、ループフィルタ107が生成した復号画像を対象ピクチャ及びCU毎に予め定めた位置に記憶する。 The reference picture memory 109 stores the decoded image generated by the loop filter 107 in a predetermined position for each target picture and CU.

符号化パラメータ決定部110は、符号化パラメータの複数のセットのうち、1つのセットを選択する。符号化パラメータとは、上述したQT、BTあるいはTT分割情報、予測パラメータ、あるいはこれらに関連して生成される符号化の対象となるパラメータである。予測画像生成部101は、これらの符号化パラメータを用いて予測画像を生成する。 Coding parameter determination section 110 selects one set from a plurality of sets of coding parameters. The coding parameter is the above-described QT, BT or TT division information, prediction parameters, or parameters to be coded generated in relation to these. The predicted image generating unit 101 generates predicted images using these coding parameters.

符号化パラメータ決定部110は、複数のセットの各々について情報量の大きさと符号化誤差を示すRDコスト値を算出する。RDコスト値は、例えば、符号量と二乗誤差に係数λを乗じた値との和である。符号量は、量子化誤差と符号化パラメータをエントロピー符号化して得られる符号化ストリームTeの情報量である。二乗誤差は、減算部102において算出された予測誤差の二乗和である。係数λは、予め設定されたゼロよりも大きい実数である。符号化パラメータ決定部110は、算出したコスト値が最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部104は、選択した符号化パラメータのセットを符号化ストリームTeとして出力する。符号化パラメータ決定部110は決定した符号化パラメータを予測パラメータメモリ108に記憶する。 Coding parameter determination section 110 calculates an RD cost value indicating the amount of information and the coding error for each of the plurality of sets. The RD cost value is, for example, the sum of the code amount and the value obtained by multiplying the squared error by the coefficient λ. The code amount is the information amount of the encoded stream Te obtained by entropy-encoding the quantization error and encoding parameters. The squared error is the sum of squares of the prediction errors calculated in subtraction section 102 . The coefficient λ is a preset real number greater than zero. Coding parameter determination section 110 selects a set of coding parameters that minimizes the calculated cost value. As a result, entropy encoding section 104 outputs the selected set of encoding parameters as encoded stream Te. Coding parameter determination section 110 stores the determined coding parameters in prediction parameter memory 108 .

なお、上述した実施形態における動画像符号化装置11、動画像復号装置31の一部、例えば、エントロピー復号部301、パラメータ復号部302、ループフィルタ305、予測画像生成部308、逆量子化・逆変換部311、加算部312、予測画像生成部101、減算部102、変換・量子化部103、エントロピー符号化部104、逆量子化・逆変換部105、ループフィルタ107、符号化パラメータ決定部110、パラメータ符号化部111をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、動画像符号化装置11、動画像復号装置31のいずれかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。 Note that a part of the video encoding device 11 and the video decoding device 31 in the above-described embodiment, for example, the entropy decoding unit 301, the parameter decoding unit 302, the loop filter 305, the prediction image generation unit 308, the inverse quantization/inverse Transformation unit 311, addition unit 312, prediction image generation unit 101, subtraction unit 102, transformation/quantization unit 103, entropy coding unit 104, inverse quantization/inverse transformation unit 105, loop filter 107, coding parameter determination unit 110 , the parameter encoding unit 111 may be realized by a computer. In that case, a program for realizing this control function may be recorded in a computer-readable recording medium, and the program recorded in this recording medium may be read into a computer system and executed. The "computer system" here is a computer system built in either the moving image encoding device 11 or the moving image decoding device 31, and includes hardware such as an OS and peripheral devices. The term "computer-readable recording medium" refers to portable media such as flexible discs, magneto-optical discs, ROMs and CD-ROMs, and storage devices such as hard disks built into computer systems. Furthermore, "computer-readable recording medium" means a medium that dynamically stores a program for a short period of time, such as a communication line for transmitting a program via a network such as the Internet or a communication line such as a telephone line. In that case, it may also include a memory that holds the program for a certain period of time, such as a volatile memory inside a computer system that serves as a server or client. Further, the program may be for realizing part of the functions described above, or may be capable of realizing the functions described above in combination with a program already recorded in the computer system.

また、上述した実施形態における動画像符号化装置11、動画像復号装置31の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。動画像符号化装置11、動画像復号装置31の各機能ブロックは個別にプロセッサ化しても良いし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。 Also, part or all of the moving image encoding device 11 and the moving image decoding device 31 in the above-described embodiments may be realized as an integrated circuit such as LSI (Large Scale Integration). Each functional block of the moving image encoding device 11 and the moving image decoding device 31 may be processorized individually, or may be partially or wholly integrated and processorized. Also, the method of circuit integration is not limited to LSI, but may be realized by a dedicated circuit or a general-purpose processor. In addition, when an integrated circuit technology that replaces LSI appears due to advances in semiconductor technology, an integrated circuit based on this technology may be used.

以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 Although one embodiment of the present invention has been described in detail above with reference to the drawings, the specific configuration is not limited to the above-described one, and various design changes and the like can be made without departing from the gist of the present invention. It is possible to

本発明の一態様に係る動画像復号装置は、画像をタイルに分割し、タイルをCTUに分割し、CTU単位に動画像を復号する動画像復号装置であって、タイルの大きさの最小単位を所定の値に設定するヘッダ復号部と、符号化ストリームからCTUを復号するCT情報復号部を備え、上記ヘッダ復号部は、タイルの大きさの最小単位を用いてタイル左上位置とタイルサイズを導出することを特徴とする。 A video decoding device according to an aspect of the present invention is a video decoding device that divides an image into tiles, divides the tiles into CTUs, and decodes the video in units of CTUs, and is a minimum unit of tile size. to a predetermined value, and a CT information decoding unit that decodes the CTU from the encoded stream. The header decoding unit uses the minimum tile size unit to determine It is characterized by deriving

本発明の一態様に係る動画像復号装置において、前記所定の値は、最小CTUサイズであることを特徴とする。 The moving picture decoding device according to an aspect of the present invention is characterized in that the predetermined value is a minimum CTU size.

本発明の一態様に係る動画像復号装置において、前記所定の値は、最小CTUサイズの整数倍であることを特徴とする。 In the video decoding device according to one aspect of the present invention, the predetermined value is an integral multiple of the minimum CTU size.

本発明の一態様に係る動画像復号装置において、前記所定の値は、8もしくは16であることを特徴とする。 In the video decoding device according to one aspect of the present invention, the predetermined value is 8 or 16.

本発明の一態様に係る動画像復号装置において、前記所定の値は、水平方向は最小CTUサイズの整数倍、垂直方向は8もしくは16であることを特徴とする。 In the video decoding device according to an aspect of the present invention, the predetermined value is an integral multiple of the minimum CTU size in the horizontal direction and 8 or 16 in the vertical direction.

本発明の一態様に係る動画像復号装置において、前記タイルの大きさの最小単位は、最小CTUサイズと、タイルサイズの最小単位と最小CTUサイズとの差分値を用いて導出することを特徴とする。 In the video decoding device according to an aspect of the present invention, the minimum unit of tile size is derived using a minimum CTU size and a difference value between the minimum unit of tile size and the minimum CTU size. do.

本発明の一態様に係る動画像復号装置において、前記差分値はSPSの符号化データから復号されることを特徴とする。 In the video decoding device according to an aspect of the present invention, the difference value is decoded from SPS encoded data.

本発明の一態様に係る動画像復号装置において、前記差分値はPPSの符号化データから復号されることを特徴とする。 In the video decoding device according to an aspect of the present invention, the difference value is decoded from PPS encoded data.

本発明の一態様に係る動画像復号装置において、前記タイルの大きさの最小単位はタイルサイズの最小単位はCTUサイズを超えないことを特徴とする。 The moving image decoding device according to an aspect of the present invention is characterized in that the minimum unit of tile size does not exceed a CTU size.

本発明の一態様に係る動画像復号装置において、前記所定の値は、各タイルを独立に処理できる場合は最小CTUサイズ未満の値に設定し、そうでない場合は最小CTUサイズに設定することを特徴とする。 In the video decoding device according to an aspect of the present invention, the predetermined value is set to a value less than the minimum CTU size when each tile can be processed independently, and set to the minimum CTU size otherwise. Characterized by

本発明の一態様に係る動画像復号装置において、前記所定の値は、各タイルを独立に処理できる場合は、そうでない場合よりもタイルの最小単位を小さく設定することを特徴とする。 In the moving picture decoding device according to an aspect of the present invention, the predetermined value is characterized by setting the minimum unit of tiles to be smaller when each tile can be processed independently than in the other case.

本発明の一態様に係る動画像復号装置において、前記所定の値は、サブCU、TMVP用の動きベクトル格納単位、差分量子化パラメータを通知する単位のいづれかに合わせて設定することを特徴とする。 In the video decoding device according to an aspect of the present invention, the predetermined value is set according to any one of sub-CU, motion vector storage unit for TMVP, and difference quantization parameter notification unit. .

本発明の一態様に係る動画像符号化装置は、画像をタイルに分割し、タイルをCTUに分割し、CTU単位に動画像を符号化する動画像符号化装置において、タイルの大きさの最小単位を所定の値に設定するヘッダ符号化部と、CTUを符号化して符号化ストリームを生成するCT情報符号化部を備え、上記ヘッダ符号化部は、タイルの大きさの最小単位を用いてタイル左上位置とタイルサイズを導出することを特徴とする。 A video encoding device according to an aspect of the present invention is a video encoding device that divides an image into tiles, divides the tiles into CTUs, and encodes the video in units of CTUs. A header encoding unit that sets the unit to a predetermined value, and a CT information encoding unit that encodes the CTU and generates an encoded stream. It is characterized by deriving the tile upper left position and the tile size.

〔応用例〕
上述した動画像符号化装置11及び動画像復号装置31は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
[Application example]
The moving image encoding device 11 and the moving image decoding device 31 described above can be used by being installed in various devices for transmitting, receiving, recording, and reproducing moving images. The moving image may be a natural moving image captured by a camera or the like, or may be an artificial moving image (including CG and GUI) generated by a computer or the like.

まず、上述した動画像符号化装置11及び動画像復号装置31を、動画像の送信及び受信に利用できることを、図20を参照して説明する。 First, it will be described with reference to FIG. 20 that the moving image encoding device 11 and the moving image decoding device 31 described above can be used for transmitting and receiving moving images.

図20(a)は、動画像符号化装置11を搭載した送信装置PROD_Aの構成を示したブロック図である。図20(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置11は、この符号化部PROD_A1として利用される。 FIG. 20(a) is a block diagram showing the configuration of a transmission device PROD_A equipped with the video encoding device 11. FIG. As shown in FIG. 20(a), the transmitting device PROD_A includes an encoding unit PROD_A1 that obtains encoded data by encoding a moving image, and modulates a carrier wave with the encoded data obtained by the encoding unit PROD_A1. and a transmitter PROD_A3 for transmitting the modulated signal obtained by the modulator PROD_A2. The video encoding device 11 described above is used as this encoding unit PROD_A1.

送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていて
もよい。図20(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
The transmission device PROD_A uses a camera PROD_A4 for capturing a moving image, a recording medium PROD_A5 for recording the moving image, an input terminal PROD_A6 for externally inputting the moving image, and , and an image processing unit A7 for generating or processing an image. FIG. 20(a) exemplifies the configuration in which the transmitter PROD_A has all of these, but some of them may be omitted.

なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。 The recording medium PROD_A5 may record an unencoded moving image, or record a moving image encoded by an encoding scheme for recording different from the encoding scheme for transmission. can be anything. In the latter case, a decoding unit (not shown) may be interposed between the recording medium PROD_A5 and the encoding unit PROD_A1 to decode the encoded data read from the recording medium PROD_A5 according to the recording encoding method.

図20(b)は、動画像復号装置31を搭載した受信装置PROD_Bの構成を示したブロック図である。図20(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置31は、この復号部PROD_B3として利用される。 FIG. 20(b) is a block diagram showing the configuration of the receiving device PROD_B equipped with the video decoding device 31. As shown in FIG. As shown in FIG. 20(b), the receiver PROD_B includes a receiver PROD_B1 that receives a modulated signal, a demodulator PROD_B2 that obtains encoded data by demodulating the modulated signal received by the receiver PROD_B1, and a demodulator PROD_B2. and a decoding unit PROD_B3 that obtains a moving image by decoding the encoded data obtained by PROD_B2. The video decoding device 31 described above is used as this decoding unit PROD_B3.

受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図20(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。 The receiving device PROD_B supplies the moving image output from the decoding unit PROD_B3 to a display PROD_B4 for displaying the moving image, a recording medium PROD_B5 for recording the moving image, and an output terminal for outputting the moving image to the outside. PROD_B6 may also be provided. FIG. 20(b) exemplifies a configuration in which the receiving device PROD_B has all of these, but some of them may be omitted.

なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。 The recording medium PROD_B5 may be for recording unencoded moving images, or may be encoded by a recording encoding scheme different from the transmission encoding scheme. may In the latter case, an encoding unit (not shown) may be interposed between the decoding unit PROD_B3 and the recording medium PROD_B5 to encode the moving image acquired from the decoding unit PROD_B3 according to the recording encoding method.

なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。 A transmission medium for transmitting the modulated signal may be wireless or wired. Further, the transmission mode for transmitting the modulated signal may be broadcasting (here, transmission mode in which the destination is not specified in advance), or communication (here, transmission mode in which the destination is specified in advance). aspect) may be used. That is, transmission of the modulated signal may be realized by any of wireless broadcasting, wired broadcasting, wireless communication, and wired communication.

例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。 For example, a digital terrestrial broadcasting station (broadcasting equipment, etc.)/receiving station (television receiver, etc.) is an example of a transmitting device PROD_A/receiving device PROD_B that transmits and receives a modulated signal by radio broadcasting. A broadcasting station (broadcasting equipment, etc.)/receiving station (television receiver, etc.) of cable television broadcasting is an example of a transmitting device PROD_A/receiving device PROD_B that transmits/receives a modulated signal by cable broadcasting.

また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線または有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。 In addition, servers (workstations, etc.) and clients (television receivers, personal computers, smartphones, etc.) for VOD (Video On Demand) services and video sharing services using the Internet are transmission devices that transmit and receive modulated signals through communication. This is an example of PROD_A/receiving device PROD_B (usually, in LAN, either wireless or wired transmission medium is used, and in WAN, wired transmission medium is used). Here, personal computers include desktop PCs, laptop PCs, and tablet PCs. Smartphones also include multifunctional mobile phone terminals.

なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアント
は、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
A client of the video sharing service has a function of decoding encoded data downloaded from a server and displaying the data on a display, and a function of encoding a video captured by a camera and uploading it to the server. That is, the client of the video sharing service functions as both the transmitting device PROD_A and the receiving device PROD_B.

次に、上述した動画像符号化装置11及び動画像復号装置31を、動画像の記録及び再生に利用できることを、図21を参照して説明する。 Next, it will be described with reference to FIG. 21 that the moving image encoding device 11 and the moving image decoding device 31 described above can be used for recording and reproducing moving images.

図21(a)は、上述した動画像符号化装置11を搭載した記録装置PROD_Cの構成を示したブロック図である。図21(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置11は、この符号化部PROD_C1として利用される。 FIG. 21(a) is a block diagram showing the configuration of a recording device PROD_C equipped with the moving image encoding device 11 described above. As shown in FIG. 21(a), the recording device PROD_C has an encoding unit PROD_C1 that obtains encoded data by encoding a moving image, and writes the encoded data obtained by the encoding unit PROD_C1 to the recording medium PROD_M. and a writing unit PROD_C2. The video encoding device 11 described above is used as this encoding unit PROD_C1.

なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc:登録商標)やBD(Blu-ray Disc:登録商標)などのように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。 The recording medium PROD_M may be (1) a type built into the recording device PROD_C, such as a HDD (Hard Disk Drive) or SSD (Solid State Drive), or (2) an SD memory. It may be of a type connected to the recording device PROD_C, such as a card or USB (Universal Serial Bus) flash memory. Disc: registered trademark) may be loaded in a drive device (not shown) incorporated in the recording device PROD_C.

また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部PROD_C6を更に備えていてもよい。図21(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。 In addition, the recording device PROD_C includes a camera PROD_C3 for capturing the moving image, an input terminal PROD_C4 for inputting the moving image from the outside, and a receiving terminal for receiving the moving image as a supply source of the moving image to be input to the encoding unit PROD_C1. A unit PROD_C5 and an image processing unit PROD_C6 that generates or processes an image may be further included. FIG. 21(a) exemplifies the configuration in which the recording device PROD_C includes all of these, but some may be omitted.

なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。 Note that the receiving unit PROD_C5 may receive an unencoded moving image, or receive encoded data encoded by an encoding scheme for transmission that is different from the encoding scheme for recording. It may be something to do. In the latter case, it is preferable to interpose a decoding unit for transmission (not shown) that decodes encoded data encoded by an encoding method for transmission between the receiving unit PROD_C5 and the encoding unit PROD_C1.

このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4または受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5または画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3または受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。 Such a recording device PROD_C includes, for example, a DVD recorder, a BD recorder, an HDD (Hard Disk Drive) recorder, etc. (In this case, the input terminal PROD_C4 or the receiver PROD_C5 is the main supply source of moving images.) . In addition, a camcorder (in this case, the camera PROD_C3 is the main source of moving images), a personal computer (in this case, the receiver PROD_C5 or the image processing unit C6 is the main source of moving images), a smartphone (in this case, the camera PROD_C3 is the main source of moving images) In this case, the camera PROD_C3 or the receiver PROD_C5 is the main supply source of moving images) is also an example of such a recording device PROD_C.

図21(B)は、上述した動画像復号装置31を搭載した再生装置PROD_Dの構成を示したブロックである。図21(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置31は、この復号部PROD_D2として利用される。 FIG. 21(B) is a block showing the configuration of a playback device PROD_D equipped with the video decoding device 31 described above. As shown in FIG. 21(b), the playback device PROD_D obtains a moving image by reading out the encoded data written in the recording medium PROD_M and decoding the encoded data read by the reading unit PROD_D1. and a decoding unit PROD_D2. The video decoding device 31 described above is used as this decoding unit PROD_D2.

なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。 Note that the recording medium PROD_M may be (1) a type built into the playback device PROD_D, such as an HDD or SSD, or (2) an SD memory card, USB flash memory, or the like. It may be of a type that is connected to the playback device PROD_D, or (3) like a DVD or BD, it may be loaded into a drive device (not shown) built into the playback device PROD_D. good.

また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図21(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。 Further, the playback device PROD_D includes a display PROD_D3 for displaying the moving image, an output terminal PROD_D4 for outputting the moving image to the outside, and a transmission unit for transmitting the moving image, as destinations to which the moving image output by the decoding unit PROD_D2 is supplied. PROD_D5 may also be provided. FIG. 21(b) exemplifies a configuration in which the playback device PROD_D includes all of these, but some may be omitted.

なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。 The transmission unit PROD_D5 may transmit an unencoded moving image, or transmit encoded data encoded by an encoding scheme for transmission different from the encoding scheme for recording. It may be something to do. In the latter case, it is preferable to interpose an encoding unit (not shown) that encodes a moving image using an encoding method for transmission between the decoding unit PROD_D2 and the transmitting unit PROD_D5.

このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4または送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型またはタブレット型PC(この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。 Such a playback device PROD_D includes, for example, a DVD player, a BD player, an HDD player, etc. (In this case, the output terminal PROD_D4 to which a television receiver or the like is connected is the main supply destination of moving images.) . In addition, television receivers (in this case, display PROD_D3 is the main supply of moving images), digital signage (also called electronic signboards, electronic bulletin boards, etc.), and display PROD_D3 or transmission unit PROD_D5 is the main supply of moving images. first), desktop PC (in this case, output terminal PROD_D4 or transmitter PROD_D5 is the main destination of the video), laptop or tablet PC (in this case, display PROD_D3 or transmitter PROD_D5 An example of such a playback device PROD_D is a smartphone (in this case, the display PROD_D3 or the transmission unit PROD_D5 is the main destination of moving images).

(ハードウェア的実現およびソフトウェア的実現)
また、上述した動画像復号装置31および動画像符号化装置11の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
(Hardware realization and software realization)
Further, each block of the moving image decoding device 31 and the moving image encoding device 11 described above may be realized in hardware by a logic circuit formed on an integrated circuit (IC chip), or may be implemented by a CPU (Central Processing Unit). Unit) may be used for software implementation.

後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random
Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
In the latter case, each of the above devices has a CPU that executes the instructions of the program that implements each function, a ROM (Read Only Memory) that stores the above program, and a RAM (Random Memory) that expands the above program.
Access Memory), and a storage device (recording medium) such as a memory for storing the above program and various data. An object of the embodiments of the present invention is a computer-readable record of the program code (executable program, intermediate code program, source program) of the control program for each of the above devices, which is software for realizing the above functions. It can also be achieved by supplying a medium to each of the devices described above and causing the computer (or CPU or MPU) to read and execute the program code recorded on the recording medium.

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD-ROM(Compact Disc Read-Only Memory)/MOディスク(Magneto-Optical disc)/MD(Mini Disc)/DVD(Digital Versatile Disc)/CD-R(CD Recordable)/ブルーレイディスク(Blu-ray Disc:登録商標)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-Only Memory)/EEPROM(Electrically Erasable and Programmable Read-Only Memory:登録商標)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。 Examples of the recording medium include tapes such as magnetic tapes and cassette tapes, magnetic disks such as floppy (registered trademark) disks/hard disks, CD-ROMs (Compact Disc Read-Only Memory)/MO disks (Magneto-Optical discs). ) / MD (Mini Disc) / DVD (Digital Versatile Disc) / CD-R (CD Recordable) / Discs including optical discs such as Blu-ray Disc (registered trademark), IC cards (including memory cards) / cards such as optical cards, mask ROM / EPROM (Erasable Programmable Read-Only Memory) / EEPROM (Electrically Erasable and Programmable Read-Only Memory: registered trademark) / semiconductor memory such as flash ROM, or PLD (Programmable logic device ) and logic circuits such as FPGA (Field Programmable Gate Array) can be used.

また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital N
etwork)、VAN(Value-Added Network)、CATV(Community Antenna television/Cable Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、BlueTooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance:登録商標)、携帯電話網、衛星回線、地上デジタル放送網等の無線でも利用可能である。なお、本発明の実施形態は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
Further, each device may be configured to be connectable to a communication network, and the program code may be supplied via the communication network. This communication network is not particularly limited as long as it can transmit the program code. Internet, intranet, extranet, LAN (Local Area Network), ISDN (Integrated Services Digital N
network), VAN (Value-Added Network), CATV (Community Antenna television/Cable Television) communication network, Virtual Private Network, telephone line network, mobile communication network, satellite communication network, etc. . Also, the transmission medium constituting this communication network is not limited to a specific configuration or type as long as it can transmit the program code. For example, even wired such as IEEE (Institute of Electrical and Electronic Engineers) 1394, USB, power line carrier, cable TV line, telephone line, ADSL (Asymmetric Digital Subscriber Line) line, infrared rays such as IrDA (Infrared Data Association) and remote control , BlueTooth (registered trademark), IEEE802.11 wireless, HDR (High Data Rate), NFC (Near Field Communication), DLNA (Digital Living Network Alliance: registered trademark), mobile phone networks, satellite circuits, terrestrial digital broadcasting networks, etc. Also available wirelessly. Embodiments of the invention may also be implemented in the form of a computer data signal embedded in a carrier wave, with the program code embodied in electronic transmission.

本発明の実施形態は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The embodiments of the present invention are not limited to the embodiments described above, and various modifications are possible within the scope of the claims. That is, the technical scope of the present invention also includes embodiments obtained by combining technical means appropriately modified within the scope of the claims.

本発明の実施形態は、画像データが符号化された符号化データを復号する動画像復号装置、および、画像データが符号化された符号化データを生成する動画像符号化装置に好適に適用することができる。また、動画像符号化装置によって生成され、動画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。 INDUSTRIAL APPLICABILITY Embodiments of the present invention are preferably applied to a moving image decoding device that decodes encoded image data and a moving image encoding device that generates encoded image data. be able to. Also, the present invention can be suitably applied to the data structure of encoded data generated by a video encoding device and referenced by a video decoding device.

11 動画像符号化装置
31 動画像復号装置
101、308 予測画像生成部
104 エントロビー符号化部(符号化部)
107、305 ループフィルタ
111 パラメータ符号化部
1111 CT情報符号化部(CT分割部)
112 インター予測パラメータ符号化部
113 イントラ予測パラメータ符号化部(イントラ予測部)
301 エントロピー復号部
302 パラメータ復号部(分割部)
3021 CT情報復号部(CT分割部)
303 インター予測パラメータ復号部
304 イントラ予測パラメータ復号部(イントラ予測部)
308 予測画像生成部
309 インター予測画像生成部
310 イントラ予測画像生成部
3036 マージ予測パラメータ導出部
30361 マージ候補導出部(時間動き予測部)
30362 マージ候補選択部
11 moving image encoding device 31 moving image decoding devices 101 and 308 predicted image generation unit 104 entropy encoding unit (encoding unit)
107, 305 loop filter 111 parameter coding unit 1111 CT information coding unit (CT division unit)
112 inter prediction parameter coding unit 113 intra prediction parameter coding unit (intra prediction unit)
301 entropy decoding unit 302 parameter decoding unit (dividing unit)
3021 CT information decoding unit (CT dividing unit)
303 inter prediction parameter decoding unit 304 intra prediction parameter decoding unit (intra prediction unit)
308 predicted image generation unit 309 inter predicted image generation unit 310 intra predicted image generation unit 3036 merge prediction parameter derivation unit 30361 merge candidate derivation unit (temporal motion prediction unit)
30362 merge candidate selector

Claims (7)

タイルインデックスを導出する導出部と、
4分木分割、2分木分割又は、3分木分割を行うCT分割部と、
対象ブロックのマージ候補である時間動きベクトルを、マージ候補リストに格納するマージ候補導出部と、
前記対象ブロックのY座標に、前記対象ブロックの高さを加算することにより、前記対象ブロックの右下位置のY座標を導出し、
前記タイルインデックスで指定される対象タイルの座標とCTUサイズを用いて、仮想座標を導出し、
前記対象ブロックの右下位のY標と前記仮想標とを比較して、右下参照ブロックの参照可能性を判定する時間動き予測部と、を備え、
前記右下参照ブロックが参照可能な場合、前記マージ候補である時間動きベクトルは、前記右下参照ブロックの動きベクトルを用いて導出されることを特徴とする動画像復号装置。
a derivation unit for deriving a tile index;
a CT splitting unit that performs quadtree splitting , binary tree splitting , or triple tree splitting ;
a merge candidate deriving unit that stores temporal motion vectors, which are merge candidates of the target block, in a merge candidate list ;
Deriving the Y coordinate of the lower right position of the target block by adding the height of the target block to the Y coordinate of the target block,
Deriving virtual coordinates using the coordinates of the target tile specified by the tile index and the CTU size,
a temporal motion prediction unit that compares the Y coordinate of the lower right position of the target block with the virtual coordinates to determine the possibility of referring to the lower right reference block;
The video decoding device , wherein when the lower right reference block can be referenced, the temporal motion vector as the merge candidate is derived using the motion vector of the lower right reference block .
前記右下位置のY標が、前記仮想標より上側にある場合、前記マージ候補である時間動きベクトルは、前記右下参照ブロックの動きベクトルを用いて導出され
前記右下位置のY座標が、前記仮想座標より上側にない場合前記マージ候補である時間動きベクトルは、中心参照ブロックの動きベクトルを用いて導出されることを特徴とする請求項1に記載の動画像復号装置。
when the Y coordinate of the lower right position is above the virtual coordinates , the temporal motion vector that is the merge candidate is derived using the motion vector of the lower right reference block;
2. If the Y coordinate of the lower right position is not above the virtual coordinate , the temporal motion vector as the merging candidate is derived using the motion vector of the central reference block. 3. The video decoding device according to .
前記仮想座標は、前記対象ブロックの座標を所定の単位VBSizeの座標に変換することにより導出される第2の仮想標に、前記CTUサイズを加算することにより導出されることを特徴とする請求項1に記載の動画像復号装置。 The virtual coordinates are derived by adding the CTU size to second virtual coordinates derived by converting the Y coordinate of the target block into coordinates of a predetermined unit VBSize. The moving picture decoding device according to claim 1. 前記仮想座標、前記対象ブロックのY座標を前記所定の単位VBSizeの対数値だけ右シフトした後、該対数値だけ左シフトを行うことにより導出されることを特徴とする請求項3に記載の動画像復号装置。 4. The virtual coordinates are derived by right-shifting the Y-coordinate of the target block by a logarithmic value of the predetermined unit VBSize and then left-shifting the logarithmic value. The video decoding device described. タイル単位サイズの整数倍のタイルサイズを復号するヘッダ情報復号部と、
タイル内座標を用いてCTU境界の判定を行うイントラ予測部と、
をさらに備え、
前記CT分割部は、タイル内座標とタイルサイズを用いて4分木分割、2分木分割又は、3分木分割を行うことを特徴とする請求項1に記載の動画像復号装置。
a header information decoding unit that decodes a tile size that is an integral multiple of the tile unit size;
an intra prediction unit that determines CTU boundaries using intra-tile coordinates;
further comprising
2. The moving image according to claim 1, wherein the CT division unit performs quadtree division , binary tree division , or ternary tree division using intra-tile coordinates and tile sizes. decryption device.
タイル単位サイズの整数倍のタイルサイズを復号するヘッダ情報復号部と、
ピクチャ内座標からタイル内座標に変換してCTU境界の判定を行うイントラ予測部と、
をさらに備え、
前記CT分割部は、ピクチャ内座標とタイル左上座標とタイルサイズを用いて4分木分割、2分木分割又は、3分木分割を行うことを特徴とする請求項1に記載の動画像復号装置。
a header information decoding unit that decodes a tile size that is an integral multiple of the tile unit size;
an intra prediction unit that converts from intra-picture coordinates to intra-tile coordinates and determines a CTU boundary;
further comprising
2. The method according to claim 1, wherein the CT partitioning unit performs quadtree partitioning, binary tree partitioning , or triple tree partitioning using intra-picture coordinates , tile upper left coordinates, and tile sizes. The video decoding device described.
タイルインデックスを導出する導出部と、
4分木分割、2分木分割又は、3分木分割を行うCT分割部と、
対象ブロックのマージ候補である時間動きベクトルを、マージ候補リストに格納するマージ候補導出部と、
前記対象ブロックのY座標に、前記対象ブロックの高さを加算することにより、前記対象ブロックの右下位置のY座標を導出し、
前記タイルインデックスで指定される対象タイルの座標とCTUサイズを用いて、仮想座標を導出し、
前記対象ブロックの右下位のY標と前記仮想標とを比較して、右下参照ブロックの参照可能性を判定する時間動き予測部と、を備え
前記右下参照ブロックが参照可能な場合、前記マージ候補である時間動きベクトルは、前記右下参照ブロックの動きベクトルを用いて導出されることを特徴とする動画像符号化装置。
a derivation unit for deriving a tile index;
a CT splitting unit that performs quadtree splitting , binary tree splitting , or triple tree splitting ;
a merge candidate deriving unit that stores temporal motion vectors, which are merge candidates of the target block, in a merge candidate list ;
Deriving the Y coordinate of the lower right position of the target block by adding the height of the target block to the Y coordinate of the target block,
Deriving virtual coordinates using the coordinates of the target tile specified by the tile index and the CTU size,
a temporal motion prediction unit that compares the Y coordinate of the lower right position of the target block with the virtual coordinates to determine the possibility of referring to the lower right reference block;
The video encoding device , wherein when the lower right reference block can be referenced, the temporal motion vector as the merge candidate is derived using the motion vector of the lower right reference block .
JP2018200186A 2018-10-24 2018-10-24 Video encoding device and video decoding device Active JP7281890B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018200186A JP7281890B2 (en) 2018-10-24 2018-10-24 Video encoding device and video decoding device
JP2023079788A JP2023100982A (en) 2018-10-24 2023-05-15 Video encoding device and video decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018200186A JP7281890B2 (en) 2018-10-24 2018-10-24 Video encoding device and video decoding device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023079788A Division JP2023100982A (en) 2018-10-24 2023-05-15 Video encoding device and video decoding device

Publications (3)

Publication Number Publication Date
JP2020068461A JP2020068461A (en) 2020-04-30
JP2020068461A5 JP2020068461A5 (en) 2021-12-02
JP7281890B2 true JP7281890B2 (en) 2023-05-26

Family

ID=70388683

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018200186A Active JP7281890B2 (en) 2018-10-24 2018-10-24 Video encoding device and video decoding device
JP2023079788A Pending JP2023100982A (en) 2018-10-24 2023-05-15 Video encoding device and video decoding device

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023079788A Pending JP2023100982A (en) 2018-10-24 2023-05-15 Video encoding device and video decoding device

Country Status (1)

Country Link
JP (2) JP7281890B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520477A (en) 2011-09-09 2014-08-21 ケィティ、コーポレーション Temporal prediction motion vector induction method and apparatus using such method
US20150245059A1 (en) 2014-02-21 2015-08-27 Panasonic Corporation Image decoding method, image encoding method, image decoding apparatus, and image encoding apparatus
JP2015159531A (en) 2014-02-21 2015-09-03 パナソニック株式会社 Image decoding method, image encoding method, image decoding device and image encoding device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520477A (en) 2011-09-09 2014-08-21 ケィティ、コーポレーション Temporal prediction motion vector induction method and apparatus using such method
US20150245059A1 (en) 2014-02-21 2015-08-27 Panasonic Corporation Image decoding method, image encoding method, image decoding apparatus, and image encoding apparatus
JP2015159531A (en) 2014-02-21 2015-09-03 パナソニック株式会社 Image decoding method, image encoding method, image decoding device and image encoding device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Minhua Zhou,Non-CE9: Modified H positions for memory bandwidth reduction in TMVP derivation,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 19-30 November, 2011,JCTVC-G082,2011年12月29日,pp.1-12,庁内DB(送付可)

Also Published As

Publication number Publication date
JP2020068461A (en) 2020-04-30
JP2023100982A (en) 2023-07-19

Similar Documents

Publication Publication Date Title
WO2018199001A1 (en) Image decoding device and image coding device
WO2018221368A1 (en) Moving image decoding device, and moving image encoding device
WO2019069950A1 (en) Image coding device and image decoding device
WO2018037853A1 (en) Image decoding apparatus and image coding apparatus
WO2021111962A1 (en) Video decoding device
JP2021002780A (en) Video decoding device and video coding device
WO2020137920A1 (en) Prediction image generating device, moving image decoding device, moving image encoding device, and prediction image generating method
WO2020116376A1 (en) Moving image decoding device and moving image encoding device
WO2020045248A1 (en) Video decoding device and video coding device
JP2020120141A (en) Dynamic image encoding device, dynamic image decoding device, and filter device
WO2021015195A1 (en) Image decoding device, image encoding device, image decoding method
JP2020061701A (en) Dynamic image coding device and dynamic image decoding device
WO2019230904A1 (en) Image decoding device and image encoding device
WO2020184366A1 (en) Image decoding device
WO2020004349A1 (en) Video encoding device and video decoding device
WO2020067440A1 (en) Moving image coding device and moving image decoding device
JPWO2018037723A1 (en) Image decoding apparatus and image encoding apparatus
WO2019131349A1 (en) Image decoding device and image coding device
WO2021200658A1 (en) Dynamic image decoding device and dynamic image decoding method
JP7281890B2 (en) Video encoding device and video decoding device
JP7409802B2 (en) Video decoding device and video encoding device
JP2020107961A (en) Moving image encoder and moving image decoder
JP2021034848A (en) Image decoding device
JP7425568B2 (en) Video decoding device, video encoding device, video decoding method, and video encoding method
JP2021153213A (en) Dynamic image encoder and dynamic image decoder

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211018

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211018

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20220607

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230516

R150 Certificate of patent or registration of utility model

Ref document number: 7281890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150