JP7455840B2

JP7455840B2 - ビデオコーディングのためのツリーベース変換ユニット（ｔｕ）区分

Info

Publication number: JP7455840B2
Application number: JP2021533599A
Authority: JP
Inventors: エギルメス、ヒルミ・エネス; セレジン、バディム; サイド、アミール; カルチェビチ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2018-12-19
Filing date: 2019-12-17
Publication date: 2024-03-26
Anticipated expiration: 2039-12-17
Also published as: EP3900337A1; IL283175B1; SA521422205B1; AU2019402886B2; MX2021007190A; AR117456A1; JP2022517908A; AU2019402886A1; CA3120045A1; CL2021001576A1; BR112021010946A2; US11323748B2; WO2020131949A1; PH12021551118A1; US20200204833A1; TW202038617A; CN113170129B; SG11202105070SA; CO2021007864A2; KR20210103481A

Description

[0001] 本出願は、それらの各々が全体として参照により本明細書に組み込まれる、２０１９年１２月１６日に出願された米国出願第１６／７１５，２７４号と、２０１８年１２月１９日に出願された米国仮出願第６２／７８２，２９２号との利益を主張する。

[0002] 本開示は、ビデオ符号化およびビデオ復号に関する。

[0003] デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ－２、ＭＰＥＧ－４、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ：Advanced Video Coding）、ＩＴＵ－ＴＨ．２６５／高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実施する。ビデオデバイスは、そのようなビデオコーディング技法を実施することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間（ピクチャ内）予測および／または時間（ピクチャ間）予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス（例えば、ビデオピクチャまたはビデオピクチャの一部分）が、コーディングツリーユニット（ＣＴＵ：coding tree unit）、コーディングユニット（ＣＵ：coding unit）および／またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャ中の参照サンプルに対する時間予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005] 概して、本開示では、現代のビデオ圧縮規格の要素である、変換コーディングに関係する技法について説明する。例示的な技法は、変換ユニット（ＴＵ：transform unit）などの残差ブロックのよりフレキシブルな区分を提供し得、コーディング利得を改善し得る。

[0006] 一例では、ビデオデータを復号する方法は、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信することを含み、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す。本方法は、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定することをさらに含む。本方法は、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成することをさらに含む。本方法は、残差データを使用して現在ブロックを復号することをさらに含む。

[0007] 別の例では、ビデオデータを復号するためのデバイスが、ビデオデータを記憶するように構成されたメモリを含む。本デバイスは、回路中に実装されたプロセッサをさらに含み、プロセッサは、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成することと、残差データを使用して現在ブロックを復号することとを行うように構成される。

[0008] 別の例では、命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されたとき、プロセッサに、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成することと、残差データを使用して現在ブロックを復号することとを行わせる、コンピュータ可読記憶媒体。

[0009] 別の例では、ビデオデータを復号するためのデバイスは、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信するための手段を含み、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す。本デバイスは、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定するための手段をさらに含む。本デバイスは、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成するための手段をさらに含む。本デバイスは、残差データを使用して現在ブロックを復号するための手段をさらに含む。

[0010] 別の例では、ビデオデータを符号化する方法は、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定することを含む。本方法は、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することをさらに含む。

[0011] 別の例では、ビデオデータを符号化するためのデバイスが、ビデオデータを記憶するように構成されたメモリを含む。本デバイスは、回路中に実装されたプロセッサをさらに含み、プロセッサは、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定することと、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することとを行うように構成される。

[0012] １つまたは複数の例の詳細が添付の図面および以下の説明に記載される。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。

[0013] 本開示の技法を行い得る例示的なビデオ符号化および復号システムを示すブロック図。 [0014] 例示的なクワッドツリーバイナリツリー（ＱＴＢＴ：quadtree binary tree）構造を示す概念図。対応するコーディングツリーユニット（ＣＴＵ：coding tree unit）を示す概念図。 [0015] ＨＥＶＣの残差クワッドツリーに基づく例示的な変換方式を示す概念図。ＨＥＶＣの残差クワッドツリーに基づく例示的な変換方式を示す概念図。 [0016] 適応変換選択を用いたハイブリッドビデオ符号化のための例示的なシステムを示すブロック図。 [0017] 個別の変換実施形態として水平変換を示す概念図。個別の変換実施形態として垂直変換を示す概念図。 [0018] 変換シグナリングを示す概念図。 [0019] ブロック上のそれぞれのツリーベース区分を示す概念図。 [0020] クワッドツリーベース区分と、バイナリツリー区分と、トリプルツリー区分との例を示す概念図。 [0021] 本開示の技法を行い得る例示的なビデオエンコーダを示すブロック図。 [0022] 本開示の技法を行い得る例示的なビデオデコーダを示すブロック図。 [0023] 現在ブロックを符号化するための例示的な方法を示すフローチャート。ビデオデータの現在ブロックを復号するための例示的な方法を示すフローチャート。 [0024] 区分ツリータイプに従って区分される残差ブロックを有するデータの現在ブロックを復号するための例示的な方法を示すフローチャート。 [0025] 区分ツリータイプに従って区分される残差ブロックを有するデータの現在ブロックを符号化するための例示的な方法を示すフローチャート。

詳細な説明

[0026] 本開示は変換コーディングに関する。変換コーディングでは、ビデオエンコーダのために、残差データのブロック（例えば、符号化されている現在ブロックと予測ブロックとの間の残差）がある。残差データは、空間ドメインから周波数ドメインに変換されて、変換係数の変換係数ブロックが生じる。ビデオデコーダは、変換係数ブロック（または場合によっては量子化の後の変換係数ブロック）を受信し、逆量子化（必要な場合）と逆変換とを行って、空間ドメインの値に戻すように残差データを再構築する。

[0027] 変換ユニット（ＴＵ）は、ルーマサンプルの変換ブロックと、対応するクロマサンプルの変換ブロックとを含む。変換ブロックは、復号プロセスにおける変換から生じるサンプルの矩形Ｍ×Ｎブロックであり得、変換は、変換係数のブロックが空間ドメイン値のブロックにコンバートされる復号プロセスの一部であり得る。従って、残差ブロックはＴＵの一例であり得る。残差ブロックは、サンプルドメインから周波数ドメインに変換された残差データであり得、複数の変換係数を含む。変換コーディングは、Ｍ．Ｗｉｅｎ、ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ：ＣｏｄｉｎｇＴｏｏｌｓａｎｄＳｐｅｃｉｆｉｃａｔｉｏｎ、Ｓｐｒｉｎｇｅｒ－Ｖｅｒｌａｇ、ベルリン、２０１５年により詳細に記載されている。

[0028] より詳細に説明されるように、本開示において説明される１つまたは複数の例では、適応多重（またはマルチコア）変換（ＡＭＴ：adaptive multiple transform）または多重変換セット（ＭＴＳ：multiple transform set）と呼ばれる変換方式を用いた変換コーディングのためにいくつかのツリーベース区分設計が使用され得る。ＡＭＴとＭＴＳとは、ビデオコーディング規格間の名称変更により、ＡＭＴは今はＭＴＳと呼ばれるので、同じ変換ツールを指し得る。

[0029] 例示的な変換方式は、米国特許公開第２０１６／０２１９２９０号並びにＸ．Ｚｈａｏ、Ｓ．Ｌｅｅ、Ｊ．Ｃｈｅｎ、Ｌ．Ｚｈａｎｇ、Ｘ．Ｌｉ、Ｙ．Ｃｈｅｎ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ、およびＨ．Ｌｉｕ、ＥｎｈａｎｃｅｄＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍｓｆｏｒＰｒｅｄｉｃｔｉｏｎＲｅｓｉｄｕａｌｓ、２０１５年１月に、また米国特許公開第２０１８／００２０２１８号並びにＸ．Ｚｈａｏ、Ｖ．Ｓｅｒｅｇｉｎ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ、およびＪ．Ｃｈｅｎ、ＩｍｐｒｏｖｅｄＬｏｏｋ－ｕｐＴａｂｌｅｆｏｒＥｎｈａｎｃｅｄＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍ、２０１６年７月に、また２０１９年５月３０日に出願された米国出願第１６／４２６，７４９号並びにＨ．Ｅ．Ｅｇｉｌｍｅｚ、Ｙ．－Ｈ．Ｃｈａｏ、Ａ．Ｓａｉｄ、Ｖ．Ｓｅｒｅｇｉｎ、およびＭ．Ｋａｒｃｚｅｗｉｃｚ、Ａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍｓｗｉｔｈｒｅｄｕｃｅｄｓｉｇｎａｌｉｎｇｏｖｅｒｈｅａｄに記載されている。

[0030] より詳細に説明されるように、いくつかの例では、残差ブロックは、複数の残差サブブロック（例えば、サブＴＵ）に区分され得る。本開示では、残差ブロックが残差サブブロックに区分されるとビデオエンコーダがシグナリングし得、ビデオデコーダが決定し得る仕方と、残差ブロックが区分される様式（例えば、区分タイプ）との例示的な技法について説明する。さらに、サンプルドメイン中の残差データを周波数ドメインに変換するためにビデオエンコーダが利用し得る複数の変換タイプと、周波数ドメインデータをサンプルドメイン中の残差データに戻すように変換し（例えば、逆変換する）ためにビデオデコーダが利用し得る複数の変換タイプとがあり得る。本開示では、変換タイプを決定する例示的な仕方について説明する。

[0031] 図１は、本開示の技法を行い得る例示的なビデオ符号化および復号システム１００を示すブロック図である。本開示の技法は、概して、ビデオデータをコーディング（符号化および／または復号）することを対象とする。概して、ビデオデータは、ビデオを処理するための何らかのデータを含む。従って、ビデオデータは、生の符号化されていないビデオ、符号化されたビデオ、復号された（例えば、再構築された）ビデオ、およびシグナリングデータなどのビデオメタデータを含み得る。

[0032] 図１に示されるように、システム１００は、この例では、宛先デバイス１１６によって復号および表示されるべき符号化ビデオデータを提供するソースデバイス１０２を含む。特に、ソースデバイス１０２は、コンピュータ可読媒体１１０を介して宛先デバイス１１６にビデオデータを提供する。ソースデバイス１０２と宛先デバイス１１６とは、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲のデバイスのいずれかを備え得る。いくつかの場合には、ソースデバイス１０２と宛先デバイス１１６とは、ワイヤレス通信のために装備され得、従って、ワイヤレス通信デバイスと呼ばれることがある。

[0033] 図１の例では、ソースデバイス１０２は、ビデオソース１０４と、メモリ１０６と、ビデオエンコーダ２００と、出力インターフェース１０８とを含む。宛先デバイス１１６は、入力インターフェース１２２と、ビデオデコーダ３００と、メモリ１２０と、ディスプレイデバイス１１８とを含む。本開示によれば、ソースデバイス１０２のビデオエンコーダ２００と、宛先デバイス１１６のビデオデコーダ３００とは、ビデオコーディングのためのツリーベース変換ユニット区分のための技法を適用するように構成され得る。従って、ソースデバイス１０２はビデオ符号化デバイスの例を表し、宛先デバイス１１６はビデオ復号デバイスの例を表す。他の例では、ソースデバイスと宛先デバイスとは、他の構成要素または配置を含み得る。例えば、ソースデバイス１０２は、外部カメラなど、外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイス１１６は、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0034] 図１に示されるシステム１００は一例にすぎない。概して、どんなデジタルビデオ符号化および／または復号デバイスも、ビデオコーディングのためのツリーベース変換ユニット区分のための技法を行い得る。ソースデバイス１０２と宛先デバイス１１６とは、ソースデバイス１０２が宛先デバイス１１６への送信のためにコード化ビデオデータを生成するようなコーディングデバイスの例にすぎない。本開示では、「コーディング」デバイスを、データのコーディング（符号化および／または復号）を行うデバイスとして参照する。従って、ビデオエンコーダ２００とビデオデコーダ３００とは、コーディングデバイス、特に、それぞれビデオエンコーダとビデオデコーダとの例を表す。いくつかの例では、ソースデバイス１０２と宛先デバイス１１６とは、ソースデバイス１０２と宛先デバイス１１６との各々がビデオ符号化および復号構成要素を含むように、実質的に対称的に動作し得る。従って、システム１００は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのための、ソースデバイス１０２と宛先デバイス１１６との間の一方向または双方向ビデオ送信をサポートし得る。

[0035] 概して、ビデオソース１０４は、ビデオデータ（すなわち、生の符号化されていないビデオデータ）のソースを表し、ビデオデータの連続的な一連のピクチャ（「フレーム」とも呼ばれる）をビデオエンコーダ２００に提供し、ビデオエンコーダ２００は、ピクチャのためにデータを符号化する。ソースデバイス１０２のビデオソース１０４は、ビデオカメラ、以前にキャプチャされた生のビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースなど、ビデオキャプチャデバイスを含み得る。さらなる代替として、ビデオソース１０４は、ソースビデオとして、コンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。各場合において、ビデオエンコーダ２００は、キャプチャされたビデオデータ、プリキャプチャされたビデオデータ、またはコンピュータ生成されたビデオデータを符号化する。ビデオエンコーダ２００は、ピクチャを、（「表示順序」と呼ばれることがある）受信順序から、コーディングのためのコーディング順序に並べ替え得る。ビデオエンコーダ２００は、符号化ビデオデータを含むビットストリームを生成し得る。ソースデバイス１０２は、次いで、例えば、宛先デバイス１１６の入力インターフェース１２２による受信および／または取出しのために、出力インターフェース１０８を介して符号化ビデオデータをコンピュータ可読媒体１１０上に出力し得る。

[0036] ソースデバイス１０２のメモリ１０６と、宛先デバイス１１６のメモリ１２０とは、汎用メモリを表す。いくつかの例では、メモリ１０６、１２０は、生のビデオデータ、例えば、ビデオソース１０４からの生のビデオ、およびビデオデコーダ３００からの生の復号ビデオデータを記憶し得る。追加または代替として、メモリ１０６、１２０は、例えば、それぞれ、ビデオエンコーダ２００とビデオデコーダ３００とによって実行可能なソフトウェア命令を記憶し得る。メモリ１０６とメモリ１２０とは、この例ではビデオエンコーダ２００とビデオデコーダ３００とは別個に示されるが、ビデオエンコーダ２００とビデオデコーダ３００とは、機能的に同様または等価な意図で内部メモリをも含み得ることを理解されたい。さらに、メモリ１０６、１２０は、符号化ビデオデータ、例えば、ビデオエンコーダ２００からの出力、およびビデオデコーダ３００への入力を記憶し得る。いくつかの例では、メモリ１０６、１２０の部分は、例えば、生の復号および／または符号化ビデオデータを記憶するために、１つまたは複数のビデオバッファとして割り振られ得る。

[0037] コンピュータ可読媒体１１０は、ソースデバイス１０２から宛先デバイス１１６に符号化ビデオデータを移送することが可能な任意のタイプの媒体またはデバイスを表し得る。一例では、コンピュータ可読媒体１１０は、ソースデバイス１０２が、例えば、無線周波数ネットワークまたはコンピュータベースのネットワークを介して、符号化ビデオデータを宛先デバイス１１６にリアルタイムで直接送信することを可能にするための通信媒体を表す。出力インターフェース１０８は、符号化ビデオデータを含む送信信号を変調し得、入力インターフェース１２２は、ワイヤレス通信プロトコルなどの通信規格に従って、受信された送信信号を復調し得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１０２から宛先デバイス１１６への通信を容易にするために有用であり得る任意の他の機器を含み得る。

[0038] いくつかの例では、ソースデバイス１０２は、出力インターフェース１０８から記憶デバイス１１２に符号化データを出力し得る。同様に、宛先デバイス１１６は、入力インターフェース１２２を介して記憶デバイス１１２から符号化データにアクセスし得る。記憶デバイス１１２は、ハードドライブ、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。

[0039] いくつかの例では、ソースデバイス１０２は、ソースデバイス１０２によって生成された符号化ビデオを記憶し得るファイルサーバ１１４または別の中間記憶デバイスに符号化ビデオデータを出力し得る。宛先デバイス１１６は、ストリーミングまたはダウンロードを介して、ファイルサーバ１１４から、記憶されたビデオデータにアクセスし得る。ファイルサーバ１１４は、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１１６に送信することが可能な任意のタイプのサーバデバイスであり得る。ファイルサーバ１１４は、（例えば、ウェブサイト用の）ウェブサーバ、ファイル転送プロトコル（ＦＴＰ）サーバ、コンテンツ配信ネットワークデバイス、またはネットワーク接続ストレージ（ＮＡＳ）デバイスを表し得る。宛先デバイス１１６は、インターネット接続を含む、任意の標準データ接続を通してファイルサーバ１１４から符号化ビデオデータにアクセスし得る。これは、ファイルサーバ１１４に記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（例えば、Ｗｉ－Ｆｉ（登録商標）接続）、ワイヤード接続（例えば、デジタル加入者線（ＤＳＬ）、ケーブルモデムなど）、またはその両方の組合せを含み得る。ファイルサーバ１１４と入力インターフェース１２２とは、ストリーミング送信プロトコル、ダウンロード送信プロトコル、またはそれらの組合せに従って動作するように構成され得る。

[0040] 出力インターフェース１０８と入力インターフェース１２２とは、ワイヤレス送信機／受信機、モデム、ワイヤードネットワーキング構成要素（例えば、イーサネット（登録商標）カード）、様々なＩＥＥＥ８０２．１１規格のいずれかに従って動作するワイヤレス通信構成要素、または他の物理的構成要素を表し得る。出力インターフェース１０８と入力インターフェース１２２とがワイヤレス構成要素を備える例では、出力インターフェース１０８と入力インターフェース１２２とは、４Ｇ、４Ｇ－ＬＴＥ（登録商標）（ロングタームエボリューション）、ＬＴＥアドバンスト、５Ｇなど、セルラー通信規格に従って、符号化ビデオデータなどのデータを転送するように構成され得る。出力インターフェース１０８がワイヤレス送信機を備えるいくつかの例では、出力インターフェース１０８と入力インターフェース１２２とは、ＩＥＥＥ８０２．１１仕様、ＩＥＥＥ８０２．１５仕様（例えば、ＺｉｇＢｅｅ（登録商標））、Ｂｌｕｅｔｏｏｔｈ（登録商標）規格など、他のワイヤレス規格に従って、符号化ビデオデータなどのデータを転送するように構成され得る。いくつかの例では、ソースデバイス１０２および／または宛先デバイス１１６は、それぞれのシステムオンチップ（ＳｏＣ：system-on-a-chip）デバイスを含み得る。例えば、ソースデバイス１０２は、ビデオエンコーダ２００および／または出力インターフェース１０８に帰属する機能を行うためのＳｏＣデバイスを含み得、宛先デバイス１１６は、ビデオデコーダ３００および／または入力インターフェース１２２に帰属する機能を行うためのＳｏＣデバイスを含み得る。

[0041] 本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ：dynamic adaptive streaming over HTTP）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。

[0042] 宛先デバイス１１６の入力インターフェース１２２は、コンピュータ可読媒体１１０（例えば、通信媒体、記憶デバイス１１２、ファイルサーバ１１４など）から符号化ビデオビットストリームを受信する。符号化ビデオビットストリームは、ビデオブロックまたは他のコード化ユニット（例えば、スライス、ピクチャ、ピクチャのグループ、シーケンスなど）の特性および／または処理を記述する値を有するシンタックス要素など、ビデオデコーダ３００によっても使用される、ビデオエンコーダ２００によって定義されるシグナリング情報を含み得る。ディスプレイデバイス１１８は、復号ビデオデータの復号ピクチャをユーザに表示する。ディスプレイデバイス１１８は、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを表し得る。

[0043] 図１には示されていないが、いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは各々、オーディオエンコーダおよび／またはオーディオデコーダと統合され得、共通のデータストリーム中にオーディオとビデオの両方を含む多重化ストリームを処理するために、適切なＭＵＸ－ＤＥＭＵＸユニット、あるいは他のハードウェアおよび／またはソフトウェアを含み得る。適用可能な場合、ＭＵＸ－ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0044] ビデオエンコーダ２００とビデオデコーダ３００とは各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダおよび／またはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実施され得る。本技法が部分的にソフトウェアで実施されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を行うために１つまたは複数のプロセッサを使用するハードウェアでその命令を実行し得る。ビデオエンコーダ２００とビデオデコーダ３００との各々は、１つまたは複数のエンコーダまたはデコーダに含まれ得、それらのいずれかが、それぞれのデバイス中の複合エンコーダ／デコーダ（ＣＯＤＥＣ）の一部として組み込まれ得る。ビデオエンコーダ２００および／またはビデオデコーダ３００を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話機などのワイヤレス通信デバイスを備え得る。

[0045] ビデオエンコーダ２００とビデオデコーダ３００とは、高効率ビデオコーディング（ＨＥＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６５などのビデオコーディング規格、あるいはマルチビューおよび／またはスケーラブルビデオコーディング拡張などのそれの拡張に従って動作し得る。代替的に、ビデオエンコーダ２００とビデオデコーダ３００とは、共同探査テストモデル（ＪＥＭ：Joint Exploration Test Model）、または汎用ビデオコーディング（ＶＶＣ：Versatile Video Coding）とも呼ばれるＩＴＵ－ＴＨ．２６６など、他のプロプライエタリまたは業界規格に従って動作し得る。ＶＶＣ規格のドラフトは、Ｂｒｏｓｓら、「ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ６）」、ＩＴＵ－ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とのジョイントビデオエキスパーツチーム（ＪＶＥＴ）、第１５回会合：ヨーテボリ、ＳＥ、２０１９年７月３～１２日、ＪＶＥＴ－Ｏ２００１－ｖＥ（以下、「ＶＶＣドラフト６」）に記載されている。ＶＶＣ規格のより最近のドラフトは、Ｂｒｏｓｓら、「ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ７）」、ＩＴＵ－ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とのジョイントビデオエキスパーツチーム（ＪＶＥＴ）、第１６回会合：ジュネーブ、ＣＨ、２０１９年１０月１～１１日、ＪＶＥＴ－Ｐ２００１－ｖ９（以下、「ＶＶＣドラフト７」）に記載されている。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。

[0046] 概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ピクチャのブロックベースのコーディングを行い得る。「ブロック」という用語は、処理されるべき（例えば、符号化されるべき、復号されるべき、あるいは符号化および／または復号プロセスにおいて他の方法で使用されるべき）データを含む構造を一般に意味する。例えば、ブロックは、ルミナンスおよび／またはクロミナンスデータのサンプルの２次元行列を含み得る。概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ＹＵＶ（例えば、Ｙ、Ｃｂ、Ｃｒ）フォーマットで表されるビデオデータをコーディングし得る。すなわち、ピクチャのサンプルのために赤色、緑色、および青色（ＲＧＢ）データをコーディングするのではなく、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分とをコーディングし得、ここで、クロミナンス成分は、赤色相と青色相の両方のクロミナンス成分を含み得る。いくつかの例では、ビデオエンコーダ２００は、符号化より前に、受信されたＲＧＢフォーマット付きデータをＹＵＶ表現にコンバートし、ビデオデコーダ３００は、ＹＵＶ表現をＲＧＢフォーマットにコンバートする。代替的に、前処理および後処理ユニット（図示されず）が、これらのコンバージョンを行い得る。

[0047] 本開示では、概して、ピクチャのコーディング（例えば、符号化および復号）を、ピクチャのデータを符号化または復号するプロセスを含むように参照し得る。同様に、本開示では、ピクチャのブロックのコーディングを、ブロックのデータを符号化または復号するプロセス、例えば、予測および／または残差コーディングを含むように参照し得る。符号化ビデオビットストリームは、概して、コーディング決定（例えば、コーディングモード）とブロックへのピクチャの区分とを表すシンタックス要素の一連の値を含む。従って、ピクチャまたはブロックをコーディングすることへの言及は、概して、ピクチャまたはブロックを形成しているシンタックス要素の値をコーディングすることとして理解されたい。

[0048] ＨＥＶＣは、コーディングユニット（ＣＵ：coding units）、予測ユニット（ＰＵ：prediction units）、および変換ユニット（ＴＵ：transform units）を含む、様々なブロックを定義する。ＨＥＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、クワッドツリー構造に従ってコーディングツリーユニット（ＣＴＵ：coding tree unit）をＣＵに区分する。すなわち、ビデオコーダは、ＣＴＵとＣＵとを４つの等しい重複しない正方形に区分し、クワッドツリーの各ノードは、０個または４個のいずれかの子ノードを有する。子ノードなしのノードは「リーフノード」と呼ばれることがあり、そのようなリーフノードのＣＵは、１つまたは複数のＰＵ並びに／あるいは１つまたは複数のＴＵを含み得る。ビデオコーダは、ＰＵとＴＵとをさらに区分し得る。例えば、ＨＥＶＣでは、残差クワッドツリー（ＲＱＴ：residual quadtree）は、ＴＵの区分を表す。ＨＥＶＣでは、ＰＵはインター予測データを表すが、ＴＵは残差データを表す。イントラ予測されるＣＵは、イントラモードインジケーションなどのイントラ予測情報を含む。

[0049] 別の例として、ビデオエンコーダ２００とビデオデコーダ３００とは、ＪＥＭまたはＶＶＣに従って動作するように構成され得る。ＪＥＭまたはＶＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、ピクチャを複数のコーディングツリーユニット（ＣＴＵ：coding tree units）に区分する。ビデオエンコーダ２００は、クワッドツリーバイナリツリー（ＱＴＢＴ：quadtree-binary tree）構造またはマルチタイプツリー（ＭＴＴ：Multi-Type Tree）構造など、ツリー構造に従ってＣＴＵを区分し得る。ＱＴＢＴ構造は、ＨＥＶＣのＣＵとＰＵとＴＵとの間の分離など、複数の区分タイプの概念を除去する。しかしながら、いくつかの例では、ＴＵとＣＵは別様に区分され得る。すなわち、ＴＵは、ＣＵの形状およびサイズとは異なる形状およびサイズを有する複数のサブＴＵを含み得る。ＱＴＢＴ構造は、クワッドツリー区分に従って区分される第１のレベル、およびバイナリツリー区分に従って区分される第２のレベルという、２つのレベルを含む。ＱＴＢＴ構造のルートノードはＣＴＵに対応する。バイナリツリーのリーフノードはコーディングユニット（ＣＵ：coding units）に対応する。

[0050] ＭＴＴ区分構造では、ブロックは、クワッドツリー（ＱＴ：quadtree）区分と、バイナリツリー（ＢＴ：binary tree）区分と、１つまたは複数のタイプのトリプルツリー（ＴＴ：triple tree）（ターナリツリー（ＴＴ：ternary tree）とも呼ばれる）区分とを使用して区分され得る。トリプルまたはターナリツリー区分は、ブロックが３つのサブブロックに分割される区分である。いくつかの例では、トリプルまたはターナリツリー区分は、中心を通して元のブロックを分けることなしにブロックを３つのサブブロックに分ける。ＭＴＴにおける区分タイプ（例えば、ＱＴ、ＢＴ、およびＴＴ）は、対称的または非対称的であり得る。

[0051] いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分との各々を表すために単一のＱＴＢＴまたはＭＴＴ構造を使用し得、他の例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分のための１つのＱＴＢＴ／ＭＴＴ構造、および両方のクロミナンス成分のための別のＱＴＢＴ／ＭＴＴ構造（またはそれぞれのクロミナンス成分のための２つのＱＴＢＴ／ＭＴＴ構造）など、２つ以上のＱＴＢＴまたはＭＴＴ構造を使用し得る。

[0052] ビデオエンコーダ２００とビデオデコーダ３００とは、ＨＥＶＣに従うクワッドツリー区分、ＱＴＢＴ区分、ＭＴＴ区分、または他の区分構造を使用するように構成され得る。説明の目的で、本開示の技法の説明はＱＴＢＴ区分に関して提示される。しかしながら、本開示の技法は、クワッドツリー区分、または同様に他のタイプの区分を使用するように構成されたビデオコーダにも適用され得ることを理解されたい。

[0053] ブロック（例えば、ＣＴＵまたはＣＵ）は、ピクチャ中で様々な仕方でグループ化され得る。一例として、ブリックは、ピクチャ中の特定のタイル内のＣＴＵ行の矩形領域を参照し得る。タイルは、ピクチャ中の特定のタイル列と特定のタイル行との内のＣＴＵの矩形領域であり得る。タイル列は、ピクチャの高さに等しい高さと、（例えば、ピクチャパラメータセット中などの）シンタックス要素によって指定された幅とを有するＣＴＵの矩形領域を参照する。タイル行は、（例えば、ピクチャパラメータセット中などの）シンタックス要素によって指定された高さと、ピクチャの幅に等しい幅とを有するＣＴＵの矩形領域を参照する。

[0054] いくつかの例では、タイルは複数のブリックに区分され得、それらの各々は、タイル内に１つまたは複数のＣＴＵ行を含み得る。複数のブリックに区分されないタイルもブリックと呼ばれることがある。しかしながら、タイルの真のサブセットであるブリックは、タイルと呼ばれないことがある。

[0055] ピクチャ中のブリックはまた、スライス中に配置され得る。スライスは、もっぱら単一のネットワークアブストラクションレイヤ（ＮＡＬ：network abstraction layer）ユニット中に含まれていることがあるピクチャの整数個のブリックであり得る。いくつかの例では、スライスは、いくつかの完全なタイル、または１つのタイルの完全なブリックの連続シーケンスのみのいずれかを含む。

[0056] 本開示では、例えば、１６×１６サンプルまたは１６掛ける１６のサンプルなど、垂直寸法と水平寸法とに関して、（ＣＵまたは他のビデオブロックなどの）ブロックのサンプル寸法を参照するために「Ｎ×Ｎ（ＮｘＮ）」と「Ｎ掛けるＮ（ＮｂｙＮ）」とを互換的に使用し得る。一般に、１６×１６ＣＵは、垂直方向に１６個のサンプルを有し（ｙ＝１６）、水平方向に１６個のサンプルを有する（ｘ＝１６）。同様に、Ｎ×ＮＣＵは、一般に、垂直方向にＮ個のサンプルを有し、水平方向にＮ個のサンプルを有し、ここで、Ｎは非負整数値を表す。ＣＵ中のサンプルは、行と列とに配置され得る。さらに、ＣＵは、必ずしも、水平方向において垂直方向と同じ数のサンプルを有する必要があるとは限らない。例えば、ＣＵはＮ×Ｍサンプルを備え得、ここで、Ｍは必ずしもＮに等しいとは限らない。

[0057] ビデオエンコーダ２００は、予測および／または残差情報、並びに他の情報を表すＣＵのためにビデオデータを符号化する。予測情報は、ＣＵについて予測ブロックを形成するためにＣＵがどのように予測されるべきかを示す。残差情報は、概して、符号化より前のＣＵのサンプルと予測ブロックとの間のサンプルごとの差分を表す。

[0058] ＣＵを予測するために、ビデオエンコーダ２００は、概して、インター予測またはイントラ予測を通してＣＵについて予測ブロックを形成し得る。インター予測は、概して、以前にコーディングされたピクチャのデータからＣＵを予測することを指し、一方、イントラ予測は、概して、同じピクチャの以前にコーディングされたデータからＣＵを予測することを指す。インター予測を行うために、ビデオエンコーダ２００は、１つまたは複数の動きベクトルを使用して予測ブロックを生成し得る。ビデオエンコーダ２００は、概して、例えば、ＣＵと参照ブロックとの間の差分に関して、ＣＵにぴったり一致する参照ブロックを識別するために動き探索を行い得る。ビデオエンコーダ２００は、参照ブロックが現在ＣＵにぴったり一致するかどうかを決定するために、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）、または他のそのような差分計算を使用して差分メトリックを計算し得る。いくつかの例では、ビデオエンコーダ２００は、単方向予測または双方向予測を使用して現在ＣＵを予測し得る。

[0059] ＪＥＭとＶＶＣとのいくつかの例はまた、インター予測モードと考えられ得る、アフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ２００は、ズームインまたはアウト、回転、パースペクティブの動き、あるいは他の変則の動きタイプなど、非並進の動きを表す２つ以上の動きベクトルを決定し得る。

[0060] イントラ予測を行うために、ビデオエンコーダ２００は、予測ブロックを生成するようにイントラ予測モードを選択し得る。ＪＥＭとＶＶＣとのいくつかの例は、様々な方向性モード、並びに平面モードおよびＤＣモードを含む、６７個のイントラ予測モードを提供する。概して、ビデオエンコーダ２００は、現在ブロック（例えば、ＣＵのブロック）のサンプルをそれから予測すべき、現在ブロックに対する隣接サンプルを記述するイントラ予測モードを選択する。そのようなサンプルは、ビデオエンコーダ２００がラスタ走査順序で（左から右に、上から下に）ＣＴＵとＣＵとをコーディングすると仮定すると、概して、現在ブロックと同じピクチャ中の現在ブロックの上方、上方および左側、または左側にあり得る。

[0061] ビデオエンコーダ２００は、現在ブロックについての予測モードを表すデータを符号化する。例えば、インター予測モードでは、ビデオエンコーダ２００は、様々な利用可能なインター予測モードのうちのどれが使用されるか、並びに対応するモードの動き情報を表すデータを符号化し得る。例えば、単方向または双方向インター予測では、ビデオエンコーダ２００は、高度動きベクトル予測（ＡＭＶＰ）またはマージモードを使用して動きベクトルを符号化し得る。ビデオエンコーダ２００は、アフィン動き補償モードの動きベクトルを符号化するために同様のモードを使用し得る。

[0062] ブロックのイントラ予測またはインター予測などの予測に続いて、ビデオエンコーダ２００は、ブロックについて残差データを計算し得る。残差ブロックなどの残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックについての予測ブロックとの間の、サンプルごとの差分を表す。ビデオエンコーダ２００は、サンプルドメインではなく変換ドメイン中に変換データを生成するために、残差ブロックに１つまたは複数の変換を適用し得る。残差ブロックへの変換の結果は、変換ドメイン（周波数ドメインとも呼ばれる）中の残差ブロックであり得る。残差ブロックはＴＵの一例であり、１つまたは複数の例では、ＴＵは、複数のサブＴＵ（例えば、残差サブブロック）にさらに区分され得る。

[0063] 一例として、ビデオエンコーダ２００は、離散コサイン変換（ＤＣＴ：discrete cosine transform）、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。さらに、ビデオエンコーダ２００は、モード依存非分離可能２次変換（ＭＤＮＳＳＴ：mode-dependent non-separable secondary transform）、信号依存変換、カルーネンレーベ変換（ＫＬＴ：Karhunen-Loeve transform）など、第１の変換に続いて２次変換を適用し得る。ビデオエンコーダ２００は、１つまたは複数の変換の適用に続いて変換係数を生成する。ＤＣＴの使用は、一例として提供され、限定的であると考えられるべきではない。他の変換タイプがあり得、本開示において説明される例は、変換タイプのうちの１つまたは複数を利用することがある。例えば、ビデオエンコーダ２００は、サンプルドメインから変換（例えば、周波数）ドメインへの変換のために使用すべき変換タイプを選択するように構成され得、ビデオデコーダ３００は、変換ドメインからサンプルドメインに戻す変換（例えば、逆変換）のために使用すべき変換タイプを選択するように構成され得る。いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００が同じ変換タイプを選択するように、ビデオエンコーダ２００は、様々な基準に基づいて使用すべき変換タイプを選択するように構成され得、ビデオデコーダ３００は、そのような変換タイプを推論するように構成され得る。変換タイプを推論することによって、ビデオエンコーダ２００は、変換タイプを示す情報を明示的にシグナリングすることが不要であり得、ビデオデコーダ３００は、変換タイプを示す情報を受信することが不要であり得る。

[0064] 上述のように、変換係数を生成するための任意の変換に続いて、ビデオエンコーダ２００は、変換係数の量子化を行い得る。量子化は、一般に、変換係数を表すために使用されるデータの量をできるだけ低減させるために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスを行うことによって、ビデオエンコーダ２００は、変換係数の一部または全部に関連するビット深度を低減し得る。例えば、ビデオエンコーダ２００は、量子化中にｎビット値をｍビット値に切り捨て得、ここで、ｎはｍよりも大きい。いくつかの例では、量子化を行うために、ビデオエンコーダ２００は、量子化されるべき値のビット単位の右シフトを行い得る。

[0065] 量子化に続いて、ビデオエンコーダ２００は、変換係数を走査して、量子化された変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（従って、より低い頻度）の変換係数をベクトルの前方に配置し、より低いエネルギー（従って、より高い頻度）の変換係数をベクトルの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２００は、あらかじめ定義された走査順序を利用して、量子化された変換係数を走査してシリアル化ベクトルを生成し、次いで、ベクトルの量子化された変換係数をエントロピー符号化し得る。他の例では、ビデオエンコーダ２００は適応型走査を行い得る。量子化された変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２００は、例えば、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context-adaptive binary arithmetic coding）に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２００はまた、ビデオデータを復号する際のビデオデコーダ３００による使用のために、符号化ビデオデータに関連付けられたメタデータを記述するシンタックス要素の値をエントロピー符号化し得る。

[0066] ＣＡＢＡＣを行うために、ビデオエンコーダ２００は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、例えば、シンボルの隣接値が０値であるか否かに関係し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。

[0067] ビデオエンコーダ２００は、さらに、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、およびシーケンスベースのシンタックスデータなどのシンタックスデータを、例えば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、あるいはシーケンスパラメータセット（ＳＰＳ：sequence parameter set）、ピクチャパラメータセット（ＰＰＳ：picture parameter set）、またはビデオパラメータセット（ＶＰＳ：video parameter set）などの他のシンタックスデータ中で、ビデオデコーダ３００に対して生成し得る。ビデオデコーダ３００は、対応するビデオデータをどのように復号すべきかを決定するために、そのようなシンタックスデータを同様に復号し得る。

[0068] このようにして、ビデオエンコーダ２００は、符号化ビデオデータ、例えば、ブロック（例えば、ＣＵ）へのピクチャの区分並びにブロックの予測および／または残差情報を記述するシンタックス要素を含むビットストリームを生成し得る。最終的に、ビデオデコーダ３００は、ビットストリームを受信し、符号化ビデオデータを復号し得る。

[0069] 概して、ビデオデコーダ３００は、ビットストリームの符号化ビデオデータを復号するために、ビデオエンコーダ２００によって行われたものの逆プロセスを行う。例えば、ビデオデコーダ３００は、ビデオエンコーダ２００のＣＡＢＡＣ符号化プロセスと逆ではあるが、それと実質的に同様の様式でＣＡＢＡＣを使用してビットストリームのシンタックス要素の値を復号し得る。シンタックス要素は、ＣＴＵのＣＵを定義するために、ＣＴＵへのピクチャの区分情報と、ＱＴＢＴ構造などの対応する区分構造に従う、各ＣＴＵの区分とを定義し得る。シンタックス要素は、ビデオデータのブロック（例えば、ＣＵ）についての予測および残差情報をさらに定義し得る。

[0070] 残差情報は、例えば、量子化された変換係数によって表され得る。ビデオデコーダ３００は、ブロックの残差ブロックを再生するために、ブロックの量子化された変換係数を逆量子化し、逆変換し得る。ビデオデコーダ３００は、ブロックの予測ブロックを形成するために、シグナリングされた予測モード（イントラまたはインター予測）と、関係する予測情報（例えば、インター予測のための動き情報）とを使用する。ビデオデコーダ３００は、次いで、（サンプルごとに）予測ブロックと残差ブロックとを組み合わせて、元のブロックを再生し得る。ビデオデコーダ３００は、ブロックの境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを行うことなど、追加の処理を行い得る。

[0071] 本開示の技法によれば、残差ブロック（例えば、ＴＵ）は、複数の残差サブブロック（例えば、サブＴＵ）を形成するように区分され得る。例えば、ＴＵは、（クワッドツリー区分などの）４つの正方形サブＴＵ、（バイナリ区分などの）２つの矩形サブＴＵ、または（ターナリ区分などの）３つの矩形サブＴＵのうちの１つに区分され得る。別の例は、４つの矩形サブＴＵに区分されたＴＵであり得る。さらに、複数の異なる変換タイプ（例えば、異なるタイプの離散コサイン変換（ＤＣＴ）および離散サイン変換（ＤＳＴ））があり得る。

[0072] 本開示では、残差ブロック（例えば、ＴＵ）が区分されるかどうかをビデオエンコーダ２００がシグナリングし得、ビデオデコーダ３００が決定し得る例示的な仕方と、残差ブロックが区分される（例えば、区分ツリータイプを決定する）様式とについて説明する。また、本開示では、使用すべき変換タイプ（変換カーネルとも呼ばれる）を決定する例示的な仕方について説明する。

[0073] 例えば、ビデオデコーダ３００は、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信し得、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す。ビデオデコーダ３００は、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定し得る。ビデオデコーダ３００は、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成し得る。ビデオデコーダ３００は、残差データを使用して現在ブロックをデコーディング得る。

[0074] 別の例では、ビデオエンコーダ２００は、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定し得る。ビデオエンコーダ２００は、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化し得る。

[0075] 本開示では、概して、シンタックス要素など、ある情報を「シグナリング」することに言及することがある。「シグナリング」という用語は、概して、符号化ビデオデータを復号するために使用されるシンタックス要素および／または他のデータの値の通信を指し得る。すなわち、ビデオエンコーダ２００は、ビットストリーム中でシンタックス要素の値をシグナリングし得る。概して、シグナリングは、ビットストリーム中に値を生成することを指す。上述されたように、ソースデバイス１０２は、実質的にリアルタイムでビットストリームを宛先デバイス１１６に移送するか、または、宛先デバイス１１６による後の取出しのためにシンタックス要素を記憶デバイス１１２に記憶するときに起こり得るようになど、非リアルタイムでビットストリームを宛先デバイス１１６に移送し得る。

[0076] 図２Ａと図２Ｂとは、例示的なクワッドツリーバイナリツリー（ＱＴＢＴ）構造１３０と、対応するコーディングツリーユニット（ＣＴＵ）１３２とを示す概念図である。実線はクワッドツリー分割を表し、点線はバイナリツリー分割を表す。バイナリツリーの各分割（すなわち、非リーフ）ノードでは、どの分割タイプ（すなわち、水平または垂直）が使用されるかを示すために１つのフラグがシグナリングされ、ここで、この例では、０は水平分割を示し、１は垂直分割を示す。クワッドツリー分割では、クワッドツリーノードが、ブロックを、等しいサイズをもつ４つのサブブロックに水平および垂直に分割するので、分割タイプを示す必要がない。従って、ＱＴＢＴ構造１３０の領域ツリーレベル（すなわち、実線）についての（分割情報などの）シンタックス要素と、ＱＴＢＴ構造１３０の予測ツリーレベル（すなわち、破線）についての（分割情報などの）シンタックス要素とを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。ＱＴＢＴ構造１３０の端末リーフノードによって表されるＣＵについての、予測および変換データなどのビデオデータを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。

[0077] 概して、図２ＢのＣＴＵ１３２は、第１および第２のレベルにおいてＱＴＢＴ構造１３０のノードに対応するブロックのサイズを定義するパラメータに関連付けられ得る。これらのパラメータは、（サンプル中のＣＴＵ１３２のサイズを表す）ＣＴＵサイズと、最小クワッドツリーサイズ（最小許容クワッドツリーリーフノードサイズを表すＭｉｎＱＴＳｉｚｅ）と、最大バイナリツリーサイズ（最大許容バイナリツリールートノードサイズを表すＭａｘＢＴＳｉｚｅ）と、最大バイナリツリー深度（最大許容バイナリツリー深度を表すＭａｘＢＴＤｅｐｔｈ）と、最小バイナリツリーサイズ（最小許容バイナリツリーリーフノードサイズを表すＭｉｎＢＴＳｉｚｅ）とを含み得る。

[0078] ＣＴＵに対応するＱＴＢＴ構造のルートノードは、ＱＴＢＴ構造の第１のレベルにおいて４つの子ノードを有し得、それらの各々は、クワッドツリー区分に従って区分され得る。すなわち、第１のレベルのノードは、（子ノードを有しない）リーフノードであるか、あるいは４つの子ノードを有する。ＱＴＢＴ構造１３０の例は、ブランチのために実線を有する親ノードと子ノードとを含むようなノードを表す。第１のレベルのノードが最大許容バイナリツリールートノードサイズ（ＭａｘＢＴＳｉｚｅ）よりも大きくない場合、ノードは、それぞれのバイナリツリーによってさらに区分され得る。１つのノードのバイナリツリー分割は、分割から生じるノードが最小許容バイナリツリーリーフノードサイズ（ＭｉｎＢＴＳｉｚｅ）または最大許容バイナリツリー深度（ＭａｘＢＴＤｅｐｔｈ）に達するまで反復され得る。ＱＴＢＴ構造１３０の例は、ブランチのために破線を有するようなノードを表す。バイナリツリーリーフノードはコーディングユニット（ＣＵ）と呼ばれ、ＣＵは、どんなさらなる区分もない予測（例えば、ピクチャ内またはピクチャ間予測）並びに変換のために使用される。上で論じられたように、ＣＵは「ビデオブロック」または「ブロック」と呼ばれることもある。

[0079] ＱＴＢＴ区分構造の一例では、ＣＴＵサイズは、１２８×１２８（ルーマサンプルおよび２つの対応する６４×６４クロマサンプル）として設定され、ＭｉｎＱＴＳｉｚｅは１６×１６として設定され、ＭａｘＢＴＳｉｚｅは６４×６４として設定され、（幅と高さの両方について）ＭｉｎＢＴＳｉｚｅは４として設定され、ＭａｘＢＴＤｅｐｔｈは４として設定される。クワッドツリー区分は、クワッドツリーリーフノードを生成するために、最初にＣＴＵに適用される。クワッドツリーリーフノードは、１６×１６（すなわち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（すなわち、ＣＴＵサイズ）のサイズを有し得る。リーフクワッドツリーノードが１２８×１２８である場合、リーフクワッドツリーノードは、サイズがＭａｘＢＴＳｉｚｅ（すなわち、この例では、６４×６４）を超えるので、バイナリツリーによってさらに分割されない。そうでない場合、リーフクワッドツリーノードは、バイナリツリーによってさらに区分される。従って、クワッドツリーリーフノードはまた、バイナリツリーのルートノードであり、０としてのバイナリツリー深度を有する。バイナリツリー深度がＭａｘＢＴＤｅｐｔｈ（この例では４）に達したとき、さらなる分割は許可されない。バイナリツリーノードがＭｉｎＢＴＳｉｚｅ（この例では４）に等しい幅を有するとき、それは、さらなる水平分割が許可されないことを暗示する。同様に、ＭｉｎＢＴＳｉｚｅに等しい高さを有するバイナリツリーノードは、さらなる垂直分割がそのバイナリツリーノードのために許可されないことを暗示する。上述されたように、バイナリツリーのリーフノードは、ＣＵと呼ばれ、さらなる区分なしに予測および変換に従ってさらに処理される。

[0080] 上述されたように、ビデオエンコーダ２００は、サンプルドメインではなく変換ドメイン中に変換データを生成するために（例えば、変換ドメイン中に残差ブロックを生成するために）、残差ブロックに１つまたは複数の変換を適用し得る。以下で、離散サイン変換（ＤＳＴ）および離散コサイン変換（ＤＣＴ）などの変換の例について説明する。ＨＥＶＣにおいて使用される変換方式についても説明される。

[0081] 変換は、入力信号の代替表現を導出するプロセスを示す。Ｎ点ベクトルｘ＝［ｘ_０，ｘ_１，…，ｘ_Ｎ－１］^Ｔと、所与のベクトルのセット｛Φ_０，Φ_１，…，Φ_Ｍ－１｝とを仮定すれば、ｘは、Φ_０，Φ_１，…，Φ_Ｍ－１の線形結合を使用して近似されるかまたは正確に表され得、これは、次のように公式化され得る。

[0082] 上記において、

は、ｘの近似または等価物であり得る。ベクトルｆ＝［ｆ_ｉ，ｆ_２，…，ｆ_Ｍ－１］は変換係数ベクトルと呼ばれ、｛Φ_０，Φ_１，…，Φ_Ｍ－１｝は変換基底ベクトルである。

[0083] ビデオコーディングのシナリオでは、変換係数は、ほぼ非相関であり、疎である。例えば、入力ベクトルｘのエネルギーは、数個の変換係数だけに圧縮され、残りの大多数の変換係数は一般に０に近くなる。

[0084] ビデオエンコーダ２００とビデオデコーダ３００とによって使用される変換のための入力データは、異なり得る。例えば、ビデオエンコーダ２００では、変換される入力データは、残差の空間ドメイン値を変換係数ブロックの周波数ドメイン値（例えば、係数値）にコンバートすることによって変換係数ブロックを生成するための残差データである。ビデオデコーダ３００では、変換される入力データは、変換係数ブロックの周波数ドメイン値を残差の空間ドメイン値にコンバートすることによって残差データを生成するための（例えば、場合によっては逆量子化の後の）変換係数ブロックである。ビデオデコーダ３００がビデオエンコーダ２００のプロセスの逆を行うので、ビデオデコーダ３００によって行われる変換は、逆変換と見なされ得る。平易さのために、本開示では、入力データがビデオエンコーダ２００とビデオデコーダ３００について異なり、ビデオデコーダ３００による変換がビデオエンコーダ２００の変換の逆であり得るという理解とともに、入力データの変換について説明する。

[0085] 特定の入力データを仮定すれば、エネルギー圧縮に関する最適な変換は、変換基底ベクトルとして入力データの共分散行列の固有ベクトルを使用する、いわゆるカルーネンレーベ変換（ＫＬＴ）である。従って、ＫＬＴは、データ依存型の変換であり、一般的な数学的公式化を有しない。しかしながら、（例えば、入力データが１次定常マルコフ過程を形成する場合などの）いくつかの仮定の下で、対応するＫＬＴは、実際は、ユニタリー変換の正弦波ファミリーのメンバーであり、これは、２０１９年５月３０日に出願された米国出願第１６／４２６，７４９号並びにＨ．Ｅ．Ｅｇｉｌｍｅｚ、Ｙ．－Ｈ．Ｃｈａｏ、Ａ．Ｓａｉｄ、Ｖ．Ｓｅｒｅｇｉｎ、およびＭ．Ｋａｒｃｚｅｗｉｃｚ、Ａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍｓｗｉｔｈｒｅｄｕｃｅｄｓｉｇｎａｌｉｎｇｏｖｅｒｈｅａｄに紹介されている。ユニタリー変換の正弦波ファミリーは、次のように公式化される変換基底ベクトルを使用して変換を示す。

[0086] 上記において、ｅは、２．７１８２８にほぼ等しい自然対数の底であり、Ａ、Ｂ、およびθは概して複素数であり、ｍの値に依存する。

[0087] 離散フーリエ、コサイン、サイン、および（１次定常マルコフ過程のための）ＫＬＴを含むいくつかのよく知られている変換は、ユニタリー変換のこの正弦波ファミリーのメンバーである。Ｊａｉｎ、Ａ．Ｋ．、Ａｓｉｎｕｓｏｉｄａｌｆａｍｉｌｙｏｆｕｎｉｔａｒｙｔｒａｎｓｆｏｒｍｓ、ＩＥＥＥＴｒａｎｓ．ｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ、１、３５６、１９７９年によれば、離散コサイン変換（ＤＣＴ）および離散サイン変換（ＤＳＴ）ファミリーの完全セットは、異なるタイプ（すなわち、Ａ、Ｂ、およびθの異なる値）に基づいて合計で１６個の変換を含み、ＤＣＴとＤＳＴとのこれらの異なるタイプの完全な定義が以下に与えられる。

[0088] 入力Ｎ点ベクトルがｘ＝［ｘ_０，ｘ_１，…，ｘ_Ｎ－１］^Ｔとして示され、それが、行列を乗算することによってｙ＝［ｙ_０，ｙ_１，…，ｙ_Ｎ－１］^Ｔとして示される別のＮ点変換係数ベクトルに変換されると仮定し、このプロセスは、次の変換公式化のうちの１つに従ってさらに示され得、ここにおいて、ｋは、両端値を含んで０からＮ－１にわたる。

ＤＣＴタイプＩ（ＤＣＴ－１）：

ＤＣＴタイプＩＩ（ＤＣＴ－２）：

[0089] ＤＣＴタイプＩＩＩ（ＤＣＴ－３）：

ＤＣＴタイプＩＶ（ＤＣＴ－４）：

ＤＣＴタイプＶ（ＤＣＴ－５）：

ＤＣＴタイプＶＩ（ＤＣＴ－６）：

ＤＣＴタイプＶＩＩ（ＤＣＴ－７）：

ＤＣＴタイプＶＩＩＩ（ＤＣＴ－８）：

ＤＳＴタイプＩ（ＤＳＴ－１）：

ＤＳＴタイプＩＩ（ＤＳＴ－２）：

ＤＳＴタイプＩＩＩ（ＤＳＴ－３）：

ＤＳＴタイプＩＶ（ＤＳＴ－４）：

ＤＳＴタイプＶ（ＤＳＴ－５）：

ＤＳＴタイプＶＩ（ＤＳＴ－６）：

ＤＳＴタイプＶＩＩ（ＤＳＴ－７）：

ＤＳＴタイプＶＩＩＩ（ＤＳＴ－８）：

[0090] 変換タイプは、変換基底関数の数学的公式化によって指定され、例えば、４点ＤＳＴ－ＶＩＩと８点ＤＳＴ－ＶＩＩは、Ｎの値関係なく同じ変換タイプ有する。

[0091] 一般性の喪失なしに、全ての上記の変換タイプは、以下の一般化された公式化を使用して表され得る。

[0092] 上記の式中で、Ｔは、１つのある変換の定義によって指定される変換行列、例えば、ＤＣＴタイプＩ～ＤＣＴタイプＶＩＩＩまたはＤＳＴタイプＩ～ＤＳＴタイプＶＩＩＩであり、Ｔの行ベクトル、例えば、［Ｔ_ｉ，０，Ｔ_ｉ，１，Ｔ_ｉ，２，…，Ｔ_{ｉ，Ｎ－１}］は、ｉ番目の変換基底ベクトルである。Ｎ点入力ベクトルに適用される変換は、Ｎ点変換と呼ばれる。

[0093] また、１次元入力データｘに適用される上記の変換公式化は、以下のような行列乗算形式で表され得ることに留意されたい。

[0094] 上記の式中で、Ｔは、変換行列を示し、ｘは、入力データベクトルを示し、ｙは、出力変換係数ベクトルを示す。

[0095] 以下で、２次元（２Ｄ）入力データの変換について説明する。上述の変換は、１次元入力データに適用され得、変換はまた、２次元入力データソースに拡張され得る。例えば、Ｘが入力Ｍ×Ｎデータアレイであると仮定する。２Ｄ入力データに変換を適用するいくつかの方法は、分離可能および非分離可能２Ｄ変換を含む。

[0096] 分離可能２Ｄ変換は、以下のように公式化される、Ｘの水平ベクトルおよび垂直ベクトルに連続的に１Ｄ変換を適用する。

[0097] 上記の式中で、ＣおよびＲは、それぞれ、所与のＭ×ＭおよびＮ×Ｎの変換行列を示す。公式化から、Ｃは、Ｘの列ベクトルに１Ｄ変換を適用し、Ｒは、Ｘの行ベクトルに１Ｄ変換を適用する。本開示では、簡単のために、左（垂直）変換および右（水平）変換としてＣおよびＲを示し、それらは両方とも、変換ペアを形成する。Ｃが、Ｒに等しく、直交行列である場合がある。そのような場合、分離可能２Ｄ変換は、ただ１つの変換行列によって決定される。

[0098] 非分離可能２Ｄ変換は、最初に、一例として次の数学的マッピングを行うことによって、Ｘの全ての要素を単一のベクトル、すなわち、Ｘ’に再編成した。

[0099] 次いで、１Ｄ変換Ｔ’が、以下のようにＸ’に適用される。

[0100] 上記の式中で、Ｔ’は、（Ｍ＊Ｎ）×（Ｍ＊Ｎ）変換行列である。

[0101] ビデオコーディングでは、２Ｄ変換が、１Ｄ変換と比較してはるかにより少ない演算（加算、乗算）カウントを必要とするので、分離可能２Ｄ変換が常に適用される。

[0102] 以下で、ＨＥＶＣにおいて適用される変換タイプについて説明する。Ｈ．２６４／ＡＶＣなどのいくつかのビデオコーデックでは、４点および８点離散コサイン変換（ＤＣＴ）タイプＩＩの整数近似値が、イントラ予測残差とインター予測残差の両方に常に適用される。残差サンプルの様々な統計値により良く適応するために、ＤＣＴタイプＩＩ以外の変換のよりフレキシブルなタイプが、後の世代のビデオコーデックにおいて利用される。例えば、ＨＥＶＣでは、４点タイプＶＩＩ離散サイン変換（ＤＳＴ）の整数近似値が、イントラ予測残差のために利用され、これは、Ｓ．Ａ．Ｍａｒｔｕｃｃｉ、「Ｓｙｍｍｅｔｒｉｃｃｏｎｖｏｌｕｔｉｏｎａｎｄｔｈｅｄｉｓｃｒｅｔｅｓｉｎｅａｎｄｃｏｓｉｎｅｔｒａｎｓｆｏｒｍｓ」、ＩＥＥＥＴｒａｎｓ．Ｓｉｇ．ＰｒｏｃｅｓｓｉｎｇＳＰ－４２、１０３８～１０５１（１９９４年）において、ＤＳＴタイプＶＩＩが、イントラ予測方向に沿って生成された残差ベクトルについてＤＣＴタイプＩＩよりも効率的である（例えば、ＤＳＴタイプＶＩＩが、水平イントラ予測方向によって生成された行残差ベクトルについてＤＣＴタイプＩＩよりも効率的である）ことが、理論的に証明され、また実験的に検証されてもいる。ＨＥＶＣでは、４点ＤＳＴタイプＶＩＩの整数近似値は、４×４ルーマイントラ予測残差ブロックにのみ適用される。ＨＥＶＣにおいて使用される４点ＤＳＴ－ＶＩＩが以下に示され、
４×４ＤＳＴ－ＶＩＩ：

[0103] ＨＥＶＣでは、４×４ルーマイントラ予測残差ブロックでない残差ブロックに対して、以下に示されるように、４点、８点、１６点および３２点ＤＣＴタイプＩＩの整数近似値も適用される。

４点ＤＣＴ－ＩＩ：

８点ＤＣＴ－ＩＩ：

１６点ＤＣＴ－ＩＩ：

３２点ＤＣＴ－ＩＩ：

[0104] 図３Ａと図３Ｂとは、ＨＥＶＣの残差クワッドツリーに基づく例示的な変換方式を示す概念図である。ＨＥＶＣでは、残差ブロックの様々な特性を適応させるために、残差クワッドツリー（ＲＱＴ：residual quadtree）を使用する変換コーディング構造が適用され、これは、Ｊ．Ｈａｎ、Ａ．ＳａｘｅｎａおよびＫ．Ｒｏｓｅ、「Ｔｏｗａｒｄｓｊｏｉｎｔｌｙｏｐｔｉｍａｌｓｐａｔｉａｌｐｒｅｄｉｃｔｉｏｎａｎｄａｄａｐｔｉｖｅｔｒａｎｓｆｏｒｍｉｎｖｉｄｅｏ／ｉｍａｇｅｃｏｄｉｎｇ」、ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ）、２０１０年３月、７２６～７２９ページに手短に記載されている。ＲＱＴに関する追加の情報は、ｈｔｔｐ：／／ｗｗｗ．ｈｈｉ．ｆｒａｕｎｈｏｆｅｒ．ｄｅ／ｆｉｅｌｄｓ－ｏｆ－ｃｏｍｐｅｔｅｎｃｅ／ｉｍａｇｅ－ｐｒｏｃｅｓｓｉｎｇ／ｒｅｓｅａｒｃｈ－ｇｒｏｕｐｓ／ｉｍａｇｅ－ｖｉｄｅｏ－ｃｏｄｉｎｇ／ｈｅｖｃ－ｈｉｇｈ－ｅｆｆｉｃｉｅｎｃｙ－ｖｉｄｅｏ－ｃｏｄｉｎｇ／ｔｒａｎｓｆｏｒｍ－ｃｏｄｉｎｇ－ｕｓｉｎｇ－ｔｈｅ－ｒｅｓｉｄｕａｌ－ｑｕａｄｔｒｅｅ－ｒｑｔ．ｈｔｍｌにおいて入手可能である。

[0105] ＲＱＴでは、各ピクチャは、特定のタイルまたはスライスについてラスタ走査順序でコーディングされるコーディングツリーユニット（ＣＴＵ）に分けられる。ＣＴＵは、正方形ブロックであり、クワッドツリー、すなわち、コーディングツリーのルートを表す。ＣＴＵサイズは８×８から６４×６４ルーマサンプルにわたり得るが、一般に６４×６４が使用される。各ＣＴＵは、コーディングユニット（ＣＵ）と呼ばれるより小さい正方形ブロックにさらに分割され得る。ＣＴＵがＣＵに再帰的に分割された後、各ＣＵは、予測ユニット（ＰＵ）と変換ユニット（ＴＵ）とにさらに分けられる。ＴＵへのＣＵの区分は、クワッドツリー手法に基づいて再帰的に行われ、従って、各ＣＵの残差信号は、ツリー構造、すなわち、残差クワッドツリー（ＲＱＴ）によってコーディングされる。ＲＱＴは、４×４から３２×３２ルーマサンプルまでのＴＵサイズを可能にする。

[0106] 図３Ａは、ＣＵ１３４が、文字ａ～ｊで標示された１０個のＴＵを含む一例と、対応するブロック区分とを示す。図３Ｂに示されるＲＱＴ１３６の各ノードは、実際は、図３Ａに対応する変換ユニット（ＴＵ）である。個々のＴＵは、深度優先トラバーサル（depth-first traversal）による再帰的Ｚ走査に従う、アルファベット順として図３Ａに示される深度優先ツリートラバーサル順序で処理される。クワッドツリー手法は、残差信号の変動する空間周波数特性に対する変換の適応を可能にする。

[0107] 一般に、より大きい空間サポートを有するより大きい変換ブロックサイズは、より良い周波数分解能を提供する。しかしながら、より小さい空間サポートを有するより小さい変換ブロックサイズは、より良い空間分解能を提供する。これらの２つ、すなわち、空間分解能と周波数分解能との間のトレードオフは、例えばレートひずみ最適化技法に基づいて、エンコーダモード決定によって選定される。レートひずみ最適化技法は、各コーディングモード（例えば、特定のＲＱＴ分割構造）についてコーディングビットと再構成ひずみとの加重和、すなわち、レートひずみコストを計算し、最小レートひずみコストをもつコーディングモードを最良のモードとして選択する。

[0108] ツリーの最大深度、最小許容変換サイズおよび最大許容変換サイズという、３つのパラメータがＲＱＴにおいて定義される。最小変換サイズと最大変換サイズとは、前の段落において述べられたサポートされるブロック変換に対応する、４×４から３２×３２サンプルまでの範囲内で変動することがある。ＲＱＴの最大許容深度はＴＵの数を制限する。０に等しい最大深度は、各含まれるＴＢが最大許容変換サイズ、例えば、３２×３２に達した場合、コーディングブロック（ＣＢ）がこれ以上分割され得ないことを意味する。

[0109] 全てのこれらのパラメータは、相互作用し、ＲＱＴ構造に影響を及ぼす。ルートＣＢサイズが６４×６４であり、最大深度が０に等しく、最大変換サイズが３２×３２に等しい場合について考える。この場合、ＣＢは、さもなければ、それが、許容されない６４×６４ＴＢにつながることになるので、少なくとも１回区分されなければならない。ＲＱＴパラメータ、すなわち、最大ＲＱＴ深度、最小および最大変換サイズは、シーケンスパラメータセットレベルにおいてビットストリーム中で送信される。ＲＱＴ深度に関して、イントラコード化ＣＵとインターコード化ＣＵとについて異なる値が指定され、シグナリングされ得る。

[0110] クワッドツリー変換は、イントラ残差ブロックとインター残差ブロックの両方に適用される。一般に、現在の残差クワッドツリー区分の同じサイズのＤＣＴ－ＩＩ変換が残差ブロックに適用される。しかしながら、現在の残差クワッドツリーブロックが４×４であり、イントラ予測によって生成される場合、上記の４×４ＤＳＴ－ＶＩＩ変換が適用される。

[0111] ＨＥＶＣでは、より大きいサイズの変換、例えば、６４×６４変換は、主に、それの限られた利益の考慮と、より比較的小さい分解能のビデオに対する比較的高い複雑さとにより、採用されない。

[0112] 図４は、適応変換選択を用いたハイブリッドビデオ符号化のための例示的なシステム１４０を示すブロック図である。本開示において説明される例示的な技法は、図４に示される典型的な適応変換コーディング方式に適用可能であり、ここで、予測残差のブロックごとに、エンコーダによって異なる変換が選定され得、変換の選定は、シグナリングのためにサイド情報として符号化される。

[0113] この例では、システム１４０は、ブロック分離ユニット１４２と、ブロック変換ユニット１４４と、量子化ユニット１４６と、ブロック予測ユニット１４８と、変換バンク１５０と、エントロピーコーディングユニット１５２と、フレームバッファ１５４と、逆変換ユニット１５６と、逆量子化ユニット１５８と、残差生成ユニット１６０と、ブロック再生ユニット１６２とを含む。

[0114] 概して、ブロック分離ユニット１４２が、ビデオデータのピクチャ（すなわち、フレーム）からブロックを生成する。ブロック予測ユニット１４８は、現在ブロックの予測ブロック（ｐ）を生成し、残差生成ユニット１６０は、現在の（コーディングされていない）ブロックと予測ブロック（ｐ）とから残差ブロック（ｒ）を生成する。フレームバッファ１５４（復号ピクチャバッファ（ＤＰＢ）とも呼ばれる）は、現在ピクチャの復号データと、もしあれば、前に復号されたフレームとを記憶する。ブロック予測ユニット１４８は、フレームバッファ１５４に記憶された１つまたは複数のピクチャの、前に復号されたデータから予測ブロックを生成し得る。

[0115] ブロック変換ユニット１４４は、周波数ドメイン中の残差データを表す変換ブロック（Ｔ^（ｔ）ｒ）を生成するために、空間ドメイン中の残差データを含む残差ブロックに１つまたは複数の変換（Ｔ^（ｔ））を適用する。変換（^Ｔ（ｔ））は、例えば、離散コサイン変換（ＤＣＴ）、離散サイン変換（ＤＳＴ）、水平および／または垂直変換、カルーネンレーベ変換（ＫＬＴ）、あるいは任意の他のそのような変換であり得る。ブロック変換ユニット１４４は、変換ブロック（Ｔ^（ｔ）ｒ）を量子化ユニット１４６に提供し、変換（ｔ）のインジケーションを変換バンク１５０とエントロピーコーディングユニット１５２とに提供する。変換バンク１５０は、１つまたは複数の変換行列をブロック変換ユニット１４４と逆変換ユニット１５６とに提供する。

[0116] 本開示の技法によれば、ブロック変換ユニット１４４は、以下で論じられるように、クワッドツリー区分、バイナリツリー区分、ターナリツリー区分、または４ＴＵ区分のうちの１つなどの区分ツリータイプに従って、現在ブロックの残差ブロックを複数の残差サブブロックに区分し得、ブロック変換ユニットは、残差ブロックの区分のインジケーションをエントロピーコーディングユニット１５２に提供し得る。

[0117] 量子化ユニット１４６は、変換ブロックの変換係数を量子化し、量子化された変換ブロックをエントロピーコーディングユニット１５２と逆量子化ユニット１５８とに提供する。エントロピーコーディングユニット１５２は、例えば、変換インジケーション（ｔ）、量子化変換係数、予測情報（例えば、予測モード、およびその予測モードにおいて使用されるべき参照データのロケーションなどの対応する情報、例えば、インター予測のための動き情報）を表すシンタックス要素を符号化する。

[0118] エントロピーコーディングユニット１５２は、残差ブロックに関して、残差ブロックが区分されるかどうか、および残差ブロックが区分される場合、どのように残差ブロックが区分されるかを表すシンタックス要素をエントロピー符号化するために本開示の技法を使用し得る。エントロピーコーディングユニット１５２は、残差ブロックに関して、残差ブロックが区分されるかどうかをシグナリングするフラグを符号化し得る。残差ブロックが複数のサブブロックに区分されるとき、エントロピーコーディングユニット１５２は、残差ブロックの区分タイプを示すインデックス値をも符号化し得る。例えば、ブロック変換ユニット１４４は、ツリータイプのセットについての情報を含むリストを構築するように構成され得る。ツリータイプのセットは、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む。ツリータイプのセットはまた、ターナリツリー区分と４ＴＵ区分とを含み得る。異なるツリータイプの例については、以下でより詳細に説明される。ブロック変換ユニット１４４は、ツリータイプのセットから区分タイプを識別するインデックス値を決定し得、エントロピー符号化ユニット１５２は、インデックス値を符号化し得る。エントロピーコーディングユニット１５２はまた、残差ブロックが水平に区分されるか垂直に区分されるか、区分が対称的であるか非対称的であるかなど、残差ブロックについて任意の他の区分情報を符号化し得る。

[0119] 逆量子化ユニット１５８は、量子化ユニット１４６から受信された量子化変換係数を逆量子化（すなわち、量子化解除）し得る。逆変換ユニット１５６は、区分ブロックが区分されるかどうかと、どのようにそれが区分されるかとを示すエントロピーコード化シンタックス要素に基づいて残差ブロックの区分を決定して、残差ブロックの区分を決定し得、逆量子化ユニット１５８から受信された変換係数に逆変換方式を適用して、現在ブロックの残差ブロック（ｒ’）を再生し得る。ブロック再生ユニット１６２は、さらに、ブロック予測ユニット１４８からの予測ブロック（ｐ）を、再生された残差ブロック（ｒ’）と組み合わせて、復号ブロックを形成し、この復号ブロックはフレームバッファ１５４に記憶される。

[0120] 本開示の技法は、システム１４０、または対応する復号システムによって行われ得る。概して、本開示の技法は、適応変換コーディング方式に適用可能であり、ここで、予測残差のブロックごとに、異なる変換が、ビデオエンコーダ２００によって選択されて、サイド情報としてシグナリングされ、サイド情報を使用してビデオデコーダ３００によって決定され得る。サイド情報は、一例であり、限定的であると考えられるべきではない。

[0121] 実際には、計算複雑さを低減するために、ブロック変換は通常、分離可能様式で計算され、すなわち、水平ラインおよび垂直ラインは、図５Ａおよび図５Ｂに示されるように、独立して変換される。図５Ａと図５Ｂとは、個別の変換実施形態として水平変換と垂直変換とを示す概念図である。図５Ａは、Ｈ個の水平変換１７０のセットを表し、図５Ｂは、Ｗ個の垂直変換１７２のセットを表す。特に、残差値の水平ラインと垂直ラインとは、それぞれ、水平変換１７０と垂直変換１７２とを使用して独立して変換され得る。

[0122] ＨＥＶＣより前のビデオコーディング規格では、固定の分離可能変換のみが使用され、ここでは、ＤＣＴ－２が垂直と水平の両方に使用される。ＨＥＶＣでは、ＤＣＴ－２に加えて、ＤＳＴ－７も、固定の分離可能変換として４×４ブロックのために採用される。米国特許公開第２０１６／０２１９２９０号と、米国特許公開第２０１８／００２０２１８号とは、それらの固定変換の適応拡張をカバーし、米国特許公開第２０１６／０２１９２９０号におけるＡＭＴの一例は、ジョイントビデオエキスパーツチーム（ＪＶＥＴ）の共同探査モデル（ＪＥＭ）、Ｘ．Ｚｈａｏ、Ｊ．Ｃｈｅｎ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ、Ｌ．Ｚｈａｎｇ、Ｘ．Ｌｉ、およびＷ．－Ｊ．Ｃｈｉｅｎ、「Ｅｎｈａｎｃｅｄｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍｆｏｒｖｉｄｅｏｃｏｄｉｎｇ」、Ｐｒｏｃ．ＤａｔａＣｏｍｐｒｅｓｓｉｏｎＣｏｎｆｅｒｅｎｃｅ、７３～８２ページ、２０１６年３月に採用されている。

[0123] 米国特許公開第２０１６／０２１９２９０号と米国特許公開第２０１８／００２０２１８号とに記載のＡＭＴ設計は、ビデオエンコーダ２００がブロックごとに選択するための５つの変換オプションを提示する（この選択は、概してレートひずみメトリックに基づいて行われる）。次いで、選択された変換インデックスは、ビデオデコーダ３００にシグナリングされる。

[0124] 図６は、変換シグナリングを示す概念図である。例えば、図６は、米国特許公開第２０１６／０２１９２９０号と米国特許公開第２０１８／００２０２１８号とにおいて提案されるシグナリングを示し、ここで、デフォルト変換をシグナリングするために１ビットが使用され、４つの変換をシグナリングするために追加の２ビット（すなわち、合計３ビット）が使用される。例えば、５つの変換のうちの１つ（デフォルト変換）は０（すなわち、１ビット）を使用してシグナリングされ、他の４つの変換は３ビット（すなわち、１００、１０１、１１０、および１１１）を使用してシグナリングされる。

[0125] 米国特許公開第２０１６／０２１９２９０号と米国特許公開第２０１８／００２０２１８号とにおいて、デフォルト変換は、垂直と水平の両方にＤＣＴ－２を適用する分離可能２ＤＤＣＴとして選択される。ＡＭＴの残りは、米国特許公開第２０１６／０２１９２９０号におけるイントラモード情報に基づいて定義される。米国特許公開第２０１８／００２０２１８号は、予測モード情報とブロックサイズ情報の両方に基づいてそれらの４つの変換のセットを定義することによって米国特許公開第２０１６／０２１９２９０号の拡張を提案している。

[0126] ＶＶＣ参照ソフトウェアのバージョン、ＶＴＭ３．０では、図６に示されるシグナリング方式が使用される。特に、コーディングユニット（ＣＵ）ごとに、（ｉ）ＤＣＴ２が水平方向と垂直方向の両方に使用されるか、それとも（ｉｉ）水平または垂直に適用される１Ｄ変換を指定するために（ＡＭＴ／ＭＴＳインデックスと呼ばれる）追加の２ビットが使用されるかを決定するために単一のビット（フラグ）が使用される。これらの４つの変換は、所与のブロックの行／列上に適用されるべきＤＳＴ－７／ＤＣＴ－８を割り当てることによって定義される。例えば、ＭＴＳインデックス＝０は、水平と垂直の両方にＤＳＴ－７を適用する分離可能変換に対応し、ＭＴＳインデックス＝１は、水平にＤＣＴ－８を適用し、垂直にＤＳＴ－７を適用することに対応する。

[0127] 現在、ＶＶＣ（および参照ソフトウェアＶＴＭ－３．０）では、変換方式は、変換ユニット（ＴＵ）のためのフレキシブルな区分方法を有しないことがあり、ここで、変換ブロックサイズは、コーディングユニット（ＣＵ）サイズと同じである。実際には、区分により、よりフレキシブルな区分を介して異なる領域中に局所化されたエネルギーを変換が捕捉することが可能になるので、より良い圧縮性能は、（上述された）ＲＱＴなどのＴＵ区分技法を使用して達成され得る。本開示は、ＶＶＣ（ＶＴＭ－３．０）に現在採用されているＡＭＴ／ＭＴＳ方式に適応する様々なツリーベース区分設計を開示する。

[0128] 本開示の態様では、より大きい圧縮性能が達成されることを可能にする変換ユニット（ＴＵ）のためのよりフレキシブルな区分方式について説明し、また、そのような区分のためにどのように変換が選択され得るかについて説明する。例示的な技法は、ビデオエンコーダ２００および／またはビデオデコーダ３００によって行われ得る。平易さのために、例について、図７と図８とを用いて説明される。例えば、図７は、ブロック上のそれぞれのツリーベース区分を示す概念図である。一方、図８は、クワッドツリーベース区分と、バイナリツリー区分と、トリプルツリー区分との例を示す概念図である。図８に示されるように、トリプルツリーベース区分では、ブロック１９２Ａまたはブロック１９２Ｂなどの変換ユニット（ＴＵ）は、３つのサブＴＵ（例えば、Ｐ０、Ｐ１、およびＰ２）に区分される。クワッドツリー区分では、ブロック１９２ＣなどのＴＵは、正方形である４つのサブＴＵ（例えば、Ｐ０、Ｐ１、Ｐ２、およびＰ３）に区分される。バイナリツリー区分では、ブロック１９２Ｄ、ブロック１９２Ｅ、ブロック１９２Ｆ、およびまたはブロック１９２ＤなどのＴＵは、２つのサブＴＵ（例えば、Ｐ０およびＰ１）に区分される。

[0129] ＴＵは、１つのレベルにおいてまたは複数のレベル（深度＞０）において区分され得る。従って、ＴＵは、複数のサブＴＵに区分され得、複数のサブＴＵのうちの１つまたは複数は、それら自体がさらに区分され得る、など。代替的に、ＴＵは区分されなくてよく、ＴＵのブロックサイズは、ＣＵのブロックサイズと同様であり得る（深度＝０）。本開示全体にわたって、「残差ブロック」および
「残差サブブロック」という用語が使用される。ＴＵは、残差ブロックの一例であり、複数のサブＴＵは、複数の残差サブブロックの一例であることと、残差ブロックに関して本明細書で論じられる技法は、ＴＵに等しく適用可能であることとを理解されたい。同様に、ＴＵに関して本明細書で論じられる技法は、残差ブロックにも等しく適用可能である。

[0130] 区分の特定のレベルにおけるＴＵは、ツリーに基づいて区分され得る。ツリーおよび対応する区分の例は、図７に示される例を含む。例えば、クワッドツリー区分１８１Ａは、クワッドツリー１８２に基づくブロックの区分であり、ここで、正方形または非正方形ＴＵは、ＴＵを水平と垂直の両方に区分することによって４つのサブＴＵに区分される。例えば、ブロック１９０Ａは、クワッドツリー区分１８１Ａに従って４つの等しいサイズの正方形ブロックに区分される。４ＴＵ区分１８１Ｂは、クワッドツリー１８４に基づくブロックの区分であり、ここで、正方形または非正方形ＴＵは、ＴＵを水平にのみ区分することによってまたはＴＵを垂直にのみ区分することによって、４つのサブＴＵに区分される。例えば、ブロック１９０Ｂは、４ＴＵ区分に従って４つの垂直矩形区分に垂直に区分され、ブロック１９０Ｃは、４ＴＵ区分に従って４つの水平矩形区分に水平に区分される。そのようなものとして、ＴＵなどの残差ブロックは、クワッドツリー区分１８１Ａ、４ＴＵ区分１８１Ｂのうちの少なくとも１つに従って区分され得る。

[0131] バイナリツリー区分１８１Ｃは、バイナリツリー１８６に基づくブロックの区分であり、ここで、正方形または非正方形ＴＵは、ＴＵを水平または垂直のいずれかに区分することによって取得される、２つのサブＴＵに区分される。ブロック１９０Ｄおよび１９０Ｇは各々、バイナリツリー区分１８１Ｃに従って２つの垂直矩形区分に垂直に区分され、ブロック１９０Ｅおよび１９０Ｆは各々、バイナリツリー区分１８１Ｃに従って２つの水平矩形区分に水平に区分される。ブロック１９０Ｄおよび１９０Ｅは、対称的に区分されて、その結果、ブロック１９０Ｄおよび１９０Ｅは各々、同じサイズの２つの区分を有することになる。一方、ブロック１９０Ｆおよび１９０Ｇは、非対称的に区分されて、その結果、ブロック１９０Ｆおよび１９０Ｇは各々、異なるサイズの２つの区分を有することになる。そのようなものとして、ＴＵなどの残差ブロックは、バイナリツリー区分１８１Ｃに従って区分され得る。トリプルツリー区分１８１Ｄ（ターナリツリー区分とも呼ばれる）は、トリプルツリー１８８（ターナリツリーとしても知られる）に基づくブロックの区分であり、ここで、正方形または非正方形ＴＵは、ＴＵを２つの別個のロケーションにおいて水平または垂直のいずれかに区分することによって取得される、３つのサブＴＵに区分される。例えば、ブロック１９０Ｈは、トリプルツリー区分に従って３つの水平矩形区分に水平に区分され、ブロック１９０Ｉは、トリプルツリー区分に従って３つの垂直矩形区分に垂直に区分される。そのようなものとして、ＴＵなどの残差ブロックは、トリプルツリー区分１８１Ｄに従って区分され得る。

[0132] ＴＵ区分は、正方形または非正方形ＴＵブロックに適用され得る。図７は、正方形ブロックの例示的な区分を示すが、本技法は、矩形であり従って非正方形であるＴＵが、本開示全体にわたって説明される区分ツリーに従って等しく区分され得るように、非正方形ブロックにも適用可能である。例えば、正方形ＴＵがバイナリツリーに従って２つの矩形ＴＵに区分される場合、矩形ＴＵの一方または両方も、区分ツリーのうちの１つに従って区分され得る。従って、ＴＵなどの残差ブロックは、正方形または非正方形であり得、正方形残差ブロックと非正方形残差ブロックの両方が、本明細書において開示される技法に従って等しく区分され得る。

[0133] 区分情報をシグナリングするために、ＴＵに分割があるかどうかを決定するためのフラグ（例えば、分割フラグ）がビットストリーム中でシグナリングされ得る。ＴＵが区分される場合（すなわち、分割フラグが有効にされる場合）、区分のタイプを指定するための追加の区分／分割情報がシグナリングされ得る。そのような追加のインデックス情報は、ツリーのタイプ（例えば、クワッドツリー、バイナリツリー、ターナリツリー、および／または４ＴＵ分割）であり得る。

[0134] 例えば、ビデオエンコーダ２００は、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定し得、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化し得る。同様に、ビデオデコーダは、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信し得、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す。

[0135] 所与の／シグナリングされたツリータイプについて、区分タイプがさらにシグナリングされ得る。例えば、トリプルツリーの場合（例えば、トリプルツリー区分１８１Ｄ）、単一のビットが、ＴＵがブロック１９０Ｈにおけるように水平に分割されるか、またはブロック１９０Ｉにおけるように垂直に分割されるかを指定するための使用であり得る。バイナリツリーの場合（例えば、バイナリツリー区分１８１Ｃ）、シグナリングは、ＴＵが、ブロック１９０Ｅおよび１９０Ｆにおけるように水平に分割されるか、またはブロック１９０Ｄおよび１９０Ｇにおけるように垂直に分割されるかを指定し、並びに、ＴＵが、ブロック１９０Ｄおよび１９０Ｅにおけるように対称的に分割されるか、またはブロック１９０Ｆおよび１９０Ｇにおけるように非対称的に分割されるかを指定し得る。
例えば、残差ブロックの区分ツリータイプを示す情報をシグナリングするビットストリームは、ツリータイプのセットへのインデックス情報を含み得、ツリータイプ情報のセットは、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含み得る。さらに、残差ブロックの区分ツリータイプを示す情報が、区分ツリータイプがバイナリツリー区分のうちの１つであることを示すとき、ビットストリームは、残差ブロックが水平に分割されるか垂直に分割されるかを示す情報をさらにシグナリングし得る。

[0136] いくつかの例では、ＴＵを区分した後に取得されるサブＴＵの集合を仮定すれば、コード化ブロックフラグ（ＶＶＣではｃｂｆと呼ばれる）は、予測モード、区分ツリータイプ、区分タイプ、またはビットストリーム中で符号化される任意の他のサイド情報に応じて推論および／または制限され得る。例えば、図８のブロック１９２Ａおよび１９２Ｂ中でＰ１として示されるサブＴＵは、ｃｂｆシグナリングがＰ１のために必要とされないように、無効にされたｃｂｆフラグ（フラグ＝０）を常に有するように制限され得る。また、各サブＴＵの変換スキップフラグを推論または制限するために同様の方式が使用され得る。

[0137] いくつかの例では、区分の後に取得されるサブＴＵの集合を仮定すれば、サブＴＵごとに、そのサブＴＵに適用される分離可能変換を指定するためのＡＭＴ／ＭＴＳインデックスがシグナリングされ得る。このようにして、各サブＴＵに複数の変換が適用され得る。

[0138] いくつかの例では、ＡＭＴ／ＭＴＳインデックスおよび／またはフラグなどの変換選択は、ＴＵレベルにおいてなおシグナリングされ得、一様なＴＵがサブＴＵに分割される。これらの例では、あらゆるサブＴＵが、シグナリングされた変換選定を使用し得る。この場合、オーバーヘッドがサブＴＵごとに省かれ得、より細かい粒度の変換の利点が依然として利用され得る。

[0139] いくつかの例では、区分の後に取得されるサブＴＵの集合を仮定すれば、サブＴＵの変換カーネルは、水平方向、垂直方向または両方の方向のいずれかにおいて制限または推論され得る。制限または推論の一例は、予測モード、区分ツリータイプ、区分タイプまたは任意の他のサイド情報に基づいて行われる。この場合、ＡＭＴ／ＭＴＳインデックス（または変換定義）は、予測モード、区分ツリータイプ、区分タイプまたは任意の他のサイド情報に基づいて制限または推論され得る。

[0140] いくつかの例では、特定の変換基底を制限または推論する代わりに、コンテキストモデリングは、制限／推論ルールに基づいて適用され得る。一例では、コンテキストは、制限ルールが適用される場合のために割り当てられ、そのような場合、変換選択は、依然として可能である（制限によりこの変換選択が可能でないときに異なる）が、コンテキストは、そのような変換選択をシグナリングするために割り当てられ、その結果、変換オーバーヘッドは、おそらくより効率的にコーディングされ、全ての変換選択が利用可能になる。割り当てられるコンテキストは、おそらく、変換選択シグナリング中にすでに存在しているコンテキストとは異なる別個のコンテキスト。

[0141] 以下の制限の例では、同じルールが、変換選択オーバーヘッドシグナリングにおけるコンテキスト割当てのために使用され得る。そのような設計の例は以下を含む。

[0142] （ブロック１９０Ａとして図７およびブロック１９２Ｃとして図８に示されるような）クワッドツリー区分されたＴＵを仮定すれば、サブＴＵＰ０の変換は、ＤＣＴ－８が垂直と水平の両方に使用されるように制限され得、サブＴＵＰ１の変換は、ＤＳＴ－７が水平に適用され、ＤＳＴ－８が両方とも垂直に使用されるように制限され得、サブＴＵＰ２の変換は、ＤＣＴ－８が水平に適用され、ＤＳＴ－７が両方とも垂直に使用されるように制限され得、サブＴＵＰ３の変換は、ＤＳＴ－７が垂直と水平の両方に使用されるように制限され得る。

[0143] （ブロック１９０Ａとして図７およびブロック１９２Ｃとして図８に示されるように）クワッドツリー区分されたＴＵを仮定すれば、全てのサブＴＵ（Ｐ０、Ｐ１、Ｐ２およびＰ３）は、ＤＳＴ－７が垂直と水平の両方に使用されるように制限され得る。別の例では、ＤＳＴ－７またはＤＣＴ－８の代わりにＤＣＴ－２が使用され得る。

[0144] （ブロック１９０Ｄ～１９０Ｇとして図７およびブロック１９２Ｄ～１９２Ｇとして図８に示されるような）バイナリツリー区分されたＴＵを仮定すれば、サブＴＵの変換は、次のように推論／制限され得る。図７のブロック１９０Ｅおよび１９０Ｆ並びに図８のブロック１９２Ｅおよび１９２Ｆなどの水平分割では、サブＴＵＰ０を変換するために、ＤＣＴ－２は水平に使用され得、ＤＣＴ－８は垂直に使用され得、サブＴＵＰ１を変換するために、ＤＣＴ－２は水平に使用され得、ＤＳＴ－７は垂直に使用され得る。ブロック１９０Ｄおよび１９０Ｇとして図７並びにブロック１９２Ｄおよび１９２Ｇとして図８に示されるような垂直分割では、サブＴＵＰ０を変換するために、ＤＣＴ－８は水平に使用され得、ＤＣＴ－２は垂直に使用され得、サブＴＵＰ１を変換するために、ＤＳＴ－７は水平に使用され得、ＤＣＴ－２は垂直に使用され得る。ＤＣＴ－２の代わりに、ＤＳＴ－７またはＤＣＴ－８も、上記の２つの場合のための変換として使用され得る。

[0145] 上記の方法の１つまたは組合せは、イントラ予測されるＣＵのためにのみ使用され得る。上記の方法の１つまたは組合せは、インター予測されるＣＵのためにのみ使用され得る。上記の方法の１つまたは組合せは、イントラ予測されるＣＵとインター予測されるＣＵの両方のために使用され得る。上記の方法の１つまたは組合せは、ルーマチャネルもしくはクロマチャネルまたは両方のために使用され得る。ＴＵ区分および関連する変換方式は、上記の方法の１つまたは組合せに基づいて定義され得る。

[0146] 図９は、本開示の技法を行い得る例示的なビデオエンコーダ２００を示すブロック図である。図９は、説明の目的で提供されており、本開示において広く例示され、説明される技法を限定するものと考えられるべきではない。説明の目的で、本開示では、ＨＥＶＣビデオコーディング規格および開発中のＨ．２６６ビデオコーディング規格などのビデオコーディング規格のコンテキストにおいて、ビデオエンコーダ２００について説明する。しかしながら、本開示の技法は、これらのビデオコーディング規格に限定されず、一般的にビデオ符号化および復号に適用可能である。

[0147] 図９の例では、ビデオエンコーダ２００は、ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、復号ピクチャバッファ（ＤＰＢ：decoded picture buffer）２１８と、エントロピー符号化ユニット２２０とを含む。ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、ＤＰＢ２１８と、エントロピー符号化ユニット２２０とのいずれかまたは全ては、１つまたは複数のプロセッサにおいてあるいは処理回路において実施され得る。例えば、ビデオエンコーダ２００のユニットは、１つまたは複数の回路または論理要素として、ハードウェア回路の一部として、あるいはＦＰＧＡのプロセッサ、ＡＳＩＣの一部として実施され得る。その上、ビデオエンコーダ２００は、これらおよび他の機能を行うための追加または代替のプロセッサまたは処理回路を含み得る。

[0148] ビデオデータメモリ２３０は、ビデオエンコーダ２００の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオエンコーダ２００は、例えば、ビデオソース１０４（図１）から、ビデオデータメモリ２３０に記憶されたビデオデータを受信し得る。ＤＰＢ２１８は、ビデオエンコーダ２００による後続のビデオデータの予測において使用する参照ビデオデータを記憶する参照ピクチャメモリとして働き得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同期ＤＲＡＭ（ＳＤＲＡＭ）を含むダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ２３０は、図示のように、ビデオエンコーダ２００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0149] 本開示では、ビデオデータメモリ２３０への言及は、特にそのように説明されない限り、ビデオエンコーダ２００の内部のメモリに限定されるものとして解釈されるべきではなく、または特にそのように説明されない限り、ビデオエンコーダ２００の外部のメモリに限定されるものとして解釈されるべきではない。そうではなく、ビデオデータメモリ２３０への言及は、ビデオエンコーダ２００が符号化のために受信するビデオデータ（例えば、符号化されるべきである現在ブロックのビデオデータ）を記憶する参照メモリとして理解されたい。図１のメモリ１０６はまた、ビデオエンコーダ２００の様々なユニットからの出力の一時的記憶を提供し得る。

[0150] 図９の様々なユニットは、ビデオエンコーダ２００によって行われる動作を理解するのを支援するために示される。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実施され得る。固定機能回路は、特定の機能を提供する回路を指し、行なわれ得る動作にプリセットされる。プログラマブル回路は、様々なタスクを行うように、および行われ得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。例えば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義される様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（例えば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が行う動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、ユニットのうちの１つまたは複数は、集積回路であり得る。

[0151] ビデオエンコーダ２００は、算術論理ユニット（ＡＬＵ）、基本機能ユニット（ＥＦＵ）、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオエンコーダ２００の動作が、プログラマブル回路によって実行されるソフトウェアを使用して行われる例では、メモリ１０６（図１）は、ビデオエンコーダ２００が受信し実行するソフトウェアの命令（例えば、オブジェクトコード）を記憶し得るか、またはビデオエンコーダ２００内の別のメモリ（図示されず）が、そのような命令を記憶し得る。

[0152] ビデオデータメモリ２３０は、受信されたビデオデータを記憶するように構成される。ビデオエンコーダ２００は、ビデオデータメモリ２３０からビデオデータのピクチャを取り出し、ビデオデータを残差生成ユニット２０４とモード選択ユニット２０２とに提供し得る。ビデオデータメモリ２３０中のビデオデータは、符号化されるべきである生のビデオデータであり得る。

[0153] モード選択ユニット２０２は、動き推定ユニット２２２と、動き補償ユニット２２４と、イントラ予測ユニット２２６とを含む。モード選択ユニット２０２は、他の予測モードに従ってビデオ予測を行うための追加の機能ユニットを含み得る。例として、モード選択ユニット２０２は、パレットユニット、（動き推定ユニット２２２および／または動き補償ユニット２２４の一部であり得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。

[0154] モード選択ユニット２０２は、概して、符号化パラメータの組合せと、そのような組合せについての得られたレートひずみ値とをテストするために、複数の符号化パスを協調させる。符号化パラメータは、ＣＵへのＣＴＵの区分、ＣＵの予測モード、ＣＵの残差データの変換タイプ、ＣＵの残差データのための量子化パラメータなどを含み得る。モード選択ユニット２０２は、最終的に、他のテストされた組合せよりも良好であるレートひずみ値を有する符号化パラメータの組合せを選択し得る。

[0155] ビデオエンコーダ２００は、ビデオデータメモリ２３０から取り出されたピクチャを一連のＣＴＵに区分し、１つまたは複数のＣＴＵをスライス内にカプセル化し得る。モード選択ユニット２０２は、上述のＨＥＶＣのＱＴＢＴ構造またはクワッドツリー構造など、ツリー構造に従ってピクチャのＣＴＵを区分し得る。上述されたように、ビデオエンコーダ２００は、ツリー構造に従ってＣＴＵを区分することから１つまたは複数のＣＵを形成し得る。そのようなＣＵは、一般に「ビデオブロック」または「ブロック」と呼ばれることもある。

[0156] 概して、モード選択ユニット２０２はまた、現在ブロック（例えば、現在ＣＵ、またはＨＥＶＣでは、ＰＵとＴＵとの重複する部分）についての予測ブロックを生成するように、それの構成要素（例えば、動き推定ユニット２２２、動き補償ユニット２２４、およびイントラ予測ユニット２２６）を制御する。現在ブロックのインター予測のために、動き推定ユニット２２２は、１つまたは複数の参照ピクチャ（例えば、ＤＰＢ２１８に記憶されている１つまたは複数の以前のコード化ピクチャ）中で１つまたは複数のぴったり一致する参照ブロックを識別するために動き探索を行い得る。特に、動き推定ユニット２２２は、例えば、絶対差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of squared differences）、平均絶対差（ＭＡＤ：mean absolute difference）、平均２乗差（ＭＳＤ：mean squared differences）などに従って、現在ブロックに対して潜在的参照ブロックがどのくらい類似しているかを表す値を計算し得る。動き推定ユニット２２２は、概して、現在ブロックと考慮されている参照ブロックとの間のサンプルごとの差分を使用してこれらの計算を行い得る。動き推定ユニット２２２は、現在ブロックに最もぴったり一致する参照ブロックを示す、これらの計算から得られた最も低い値を有する参照ブロックを識別し得る。

[0157] 動き推定ユニット２２２は、現在ピクチャ中の現在ブロックの位置に対して参照ピクチャ中の参照ブロックの位置を定義する１つまたは複数の動きベクトル（ＭＶ）を形成し得る。動き推定ユニット２２２は、次いで、動きベクトルを動き補償ユニット２２４に提供し得る。例えば、単方向インター予測では、動き推定ユニット２２２は、単一の動きベクトルを提供し得るが、双方向インター予測では、動き推定ユニット２２２は、２つの動きベクトルを提供し得る。動き補償ユニット２２４は、次いで、動きベクトルを使用して予測ブロックを生成し得る。例えば、動き補償ユニット２２４は、動きベクトルを使用して参照ブロックのデータを取り出し得る。別の例として、動きベクトルが分数サンプル精度を有する場合、動き補償ユニット２２４は、１つまたは複数の補間フィルタに従って予測ブロックの値を補間し得る。その上、双方向インター予測では、動き補償ユニット２２４は、それぞれの動きベクトルによって識別された２つの参照ブロックについてデータを取り出し、例えば、サンプルごとの平均化または加重平均化を通して、取り出されたデータを組み合わせ得る。

[0158] 別の例として、イントラ予測、またはイントラ予測コーディングのために、イントラ予測ユニット２２６は、現在ブロックに隣接しているサンプルから予測ブロックを生成し得る。例えば、方向性モードでは、イントラ予測ユニット２２６は、隣接サンプルの値を概して数学的に組み合わせ、現在ブロックにわたって規定の方向にこれらの計算された値をポピュレートして、予測ブロックを生成し得る。別の例として、ＤＣモードでは、イントラ予測ユニット２２６は、現在ブロックに対する隣接サンプルの平均を計算し、予測ブロックのサンプルごとにこの得られた平均を含むように予測ブロックを生成し得る。

[0159] モード選択ユニット２０２は、予測ブロックを残差生成ユニット２０４に提供する。残差生成ユニット２０４は、ビデオデータメモリ２３０から現在ブロックの生の非コード化バージョンを受信し、モード選択ユニット２０２から予測ブロックを受信する。残差生成ユニット２０４は、現在ブロックと予測ブロックとの間のサンプルごとの差分を計算する。得られたサンプルごとの差分は、現在ブロックの残差ブロックを定義する。いくつかの例では、残差生成ユニット２０４はまた、残差差分パルスコード変調（ＲＤＰＣＭ：residual differential pulse code modulation）を使用して残差ブロックを生成するために、残差ブロック中のサンプル値の間の差分を決定し得る。いくつかの例では、残差生成ユニット２０４は、バイナリ減算を行う１つまたは複数の減算器回路を使用して形成され得る。

[0160] モード選択ユニット２０２がＣＵをＰＵに区分する例では、各ＰＵは、ルーマ予測ユニットと、対応するクロマ予測ユニットとに関連付けられ得る。ビデオエンコーダ２００とビデオデコーダ３００とは、様々なサイズを有するＰＵをサポートし得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指すことがあり、ＰＵのサイズは、ＰＵのルーマ予測ユニットのサイズを指すことがある。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ビデオエンコーダ２００は、イントラ予測のための２Ｎ×２ＮまたはＮ×ＮのＰＵサイズと、インター予測のための２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、または同様のものの対称的ＰＵサイズとをサポートし得る。ビデオエンコーダ２００とビデオデコーダ３００とはまた、インター予測のための２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズの非対称的区分をサポートし得る。

[0161] モード選択ユニット２０２がＣＵをＰＵにさらに区分しない例では、各ＣＵは、ルーマコーディングブロックと、対応するクロマコーディングブロックとに関連付けられ得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し得る。ビデオエンコーダ２００とビデオデコーダ３００とは、２Ｎ×２Ｎ、２Ｎ×Ｎ、またはＮ×２ＮのＣＵサイズをサポートし得る。

[0162] いくつかの例として、イントラブロックコピーモードコーディング、アフィンモードコーディング、および線形モデル（ＬＭ）モードコーディングなど、他のビデオコーディング技法では、モード選択ユニット２０２は、コーディング技法に関連付けられたそれぞれのユニットを介して、符号化されている現在ブロックの予測ブロックを生成する。パレットモードコーディングなど、いくつかの例では、モード選択ユニット２０２は、予測ブロックを生成せず、代わりに、選択されたパレットに基づいてブロックを再構築すべき様式を示すシンタックス要素を生成し得る。そのようなモードでは、モード選択ユニット２０２は、符号化されるためにこれらのシンタックス要素をエントロピー符号化ユニット２２０に提供し得る。

[0163] 上述されたように、残差生成ユニット２０４は、現在ブロックと、対応する予測ブロックとについて、ビデオデータを受信する。残差生成ユニット２０４は、次いで、現在ブロックの残差ブロックを生成する。残差ブロックを生成するために、残差生成ユニット２０４は、予測ブロックと現在ブロックとの間のサンプルごとの差分を計算する。

[0164] 本開示の技法によれば、現在ブロックの残差ブロック（すなわち、変換ユニット）を生成する一部として、残差生成ユニット２０４は、区分ツリータイプに従って現在ブロックの残差ブロックを複数の残差サブブロック（すなわち、変換ユニット）に区分し得る。残差生成ユニット２０４は、そのような区分を正方形残差ブロック並びに非正方形残差ブロック（例えば、矩形残差ブロック）に行い、正方形残差サブブロック並びに非正方形残差サブブロックを生成し得、残差生成ユニット２０４はまた、残差サブブロックのうちの１つまたは複数を区分し得る。

[0165] 上で論じられたように、区分ブロックは、図７および図８に示されるものなど、クワッドツリー区分、バイナリツリー区分、ターナリツリー区分、または４ＴＵ区分のうちの１つまたは複数に従って残差サブブロックに区分され得る。いくつかの例では、区分ブロックは、クワッドツリー区分またはバイナリツリー区分のうちの１つまたは複数に従って残差サブブロックに区分され得る。

[0166] 残差生成ユニット２０４が、バイナリツリー区分、ターナリツリー区分、または４ＴＵ区分に従って残差ブロックを区分するとき、残差生成ユニット２０４は、残差ブロックを水平に分割するか、または残差ブロックを垂直に分割し得る。例えば、図７のブロック１９０Ｃ、１９０Ｅ、１９０Ｆ、および１９０Ｈは、水平分割の例を示し、図７のブロック１９０Ｂ、１９０Ｄ、１９０Ｇ、および１９０Ｉは、垂直分割の例を示す。

[0167] 残差生成ユニット２０４がバイナリツリー区分またはターナリツリー区分に従って残差ブロックを区分して残差ブロックを水平に分割するかまたは垂直に分割するとき、残差生成ユニット２０４は、残差ブロックを対称的に分割し得るか、または残差ブロックを非対称的に分割し得る。例えば、図７のブロック１９０Ｄおよび１９０Ｅは、対称的分割の例を示し、図７のブロック１９０Ｆおよび１９０Ｇは、非対称的分割の例を示す。

[0168] 変換処理ユニット２０６は、変換係数のブロック（本明細書では「変換係数ブロック」と呼ばれる）を生成するために、残差ブロックに１つまたは複数の変換を適用する。変換処理ユニット２０６は、変換係数ブロックを形成するために、残差ブロックに様々な変換を適用し得る。例えば、変換処理ユニット２０６は、離散コサイン変換（ＤＣＴ）、方向変換、カルーネンレーベ変換（ＫＬＴ）、または概念的に同様の変換を残差ブロックに適用し得る。いくつかの例では、変換処理ユニット２０６は、複数の変換、例えば、１次変換および２次変換、例えば回転変換を残差ブロックに行い得る。いくつかの例では、変換処理ユニット２０６は、変換を残差ブロックに適用しない。

[0169] いくつかの例では、変換処理ユニット２０６は、残差ブロックの区分から生じる複数の残差サブブロックの各々に多重変換（ＭＴ：multiple transform）方式の複数の変換を適用することを含めて、現在ブロックの残差ブロックにＭＴ方式の複数の変換を適用し得る。ＭＴ方式は、例えば、残差ブロックに適用されるべき１次変換と２次変換とを定義し得る。追加または代替として、ＭＴ方式は、上で論じられた図５Ａと図５Ｂとに示されるものなど、水平変換と垂直変換とを定義し得る。いずれの場合も、変換処理ユニット２０６は、変換係数ブロックの変換係数を生成するために、残差ブロックにＭＴ方式の各変換を適用し得る。

[0170] 例えば、変換処理ユニット２０６は、複数の残差サブブロックの各々のための変換を選択し得、ここで、複数の残差サブブロックのうちのそれぞれの残差ブロックのための変換の選択は、それぞれの残差ブロックの多重変換選択（ＭＴＳ：multiple transform selection）インデックスである。このようにして、残差サブブロックごとに多重変換が選択され得る。

[0171] 別の例では、変換処理ユニット２０６は、残差ブロックの区分から生じる複数の残差サブブロックの各々に適用される残差ブロックのための変換を選択し得る。例えば、残差ブロックの区分から生じる各残差サブブロックに適用される残差ブロックのための多重変換が選択され得る。図８のブロック１９２Ｃの例では、ブロック１９２Ｃのための選択された多重変換は、残差サブブロックＰ０、Ｐ１、Ｐ２、およびＰ３の各々に適用され得る。

[0172] 本開示の技法によれば、変換処理ユニット２０６は、複数の残差サブブロックの各々についてコード化ブロックフラグ（ｃｂｆ）および／または変換スキップフラグを決定し得る。コード化ブロックフラグは、残差サブブロックについて少なくとも１つの非０係数変換レベルが送信されるかどうかに関する情報をシグナリングし得る。変換スキップフラグは、残差サブブロックについて変換がスキップされるかどうかに関する情報をシグナリングし得る。

[0173] 本開示の技法によれば、変換処理ユニット２０６は、残差ブロックの区分ツリータイプまたは残差ブロックの区分タイプのうちの１つに少なくとも部分的に基づいて残差ブロックを区分することから生じる複数の残差サブブロックの変換カーネルを決定し得る。

[0174] 本開示の技法によれば、変換処理ユニット２０６は、残差ブロックの区分ツリータイプまたは残差ブロックの区分タイプのうちの１つに少なくとも部分的に基づいて複数の残差サブブロックのためのコンテキスト割当てを決定し得る。いくつかの例では、変換処理ユニット２０６は、現在ブロックのルーマ成分および／または現在ブロックのクロマ成分について複数の残差サブブロックのためのコンテキスト割当てを決定し得る。

[0175] 一例では、変換処理ユニット２０６が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－８が水平変換と垂直変換の両方として使用されると決定し得、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＳＴ－７が水平変換において使用され、ＤＳＴ－８が垂直変換として使用されると決定し得、複数の残差サブブロックのうちの第３の残差サブブロックのためにＤＣＴ－８が水平変換において使用され、ＤＳＴ－７が垂直変換として使用されると決定し得、複数の残差サブブロックのうちの第４の残差サブブロックのためにＤＳＴ－７が水平変換と垂直変換の両方として使用されると決定し得る、。

[0176] 別の例では、変換処理ユニット２０６が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックの各々のためにＤＳＴ－７が水平変換と垂直変換の両方として使用されると決定し得る。

[0177] 別の例では、変換処理ユニット２０６が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの１つまたは複数のためにＤＣＴ－２が水平変換または垂直変換のうちの少なくとも１つとして使用されると決定し得る。従って、例えば、複数の残差サブブロックのうちの１つまたは複数のために、ＤＣＴ－２は水平変換として使用され得、ＤＳＴ－７またはＤＣＴ－８は垂直変換として使用され得、複数の残差サブブロックのうちの１つまたは複数のために、ＤＣＴ－２は垂直変換として使用され得、ＤＳＴ－７またはＤＣＴ－８は水平変換として使用され得る。

[0178] 別の例では、変換処理ユニット２０６が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定し、および残差ブロックの区分タイプが水平分割であると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＣＴ－８が垂直変換として使用されると決定し得、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＳＴ－７が垂直変換として使用されると決定し得る。

[0179] 別の例では、変換処理ユニット２０６が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定し、および残差ブロックの区分タイプが垂直分割であると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－８が水平変換として使用され、ＤＣＴ－２が垂直変換として使用されると決定し得、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＳＴ－７が水平変換として使用され、ＤＣＴ－２が垂直変換として使用されると決定し得る。

[0180] 別の例では、変換処理ユニット２０６が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定したとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの１つまたは複数のために、ＤＳＴ－７またはＤＣＴ－８のうちの１つが、垂直変換または水平変換としてのうちの少なくとも１つとして使用されると決定し得る。ＤＳＴ－７またはＤＣＴ－８の使用は、上述のバイナリツリー区分の例におけるＤＣＴ－２の代わりであり得る。

[0181] いくつかの例では、逆変換処理ユニット２０６は、残差ブロックのサイズに少なくとも部分的に基づいて残差ブロックのためのコンテキスト割当てを決定し得る。例えば、残差ブロックが、１６個以下のサンプル（例えば、１６個のサンプルのサイズを有する４×４ブロック）などの小さいサイズを有するとき、および残差ブロックがバイナリツリー区分に従って区分されるとき、逆変換処理ユニット２０６は、複数の残差サブブロックの各々のためにＤＳＴ－７が水平変換と垂直変換の両方として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを決定し得る。

[0182] 別の例では、残差ブロックが、１６個以上のサンプル（例えば、３２個のサンプルのサイズを有する４×８ブロック）などの大きいサイズを有するとき、および残差ブロックがバイナリツリー区分に従って区分されるとき、変換処理ユニット２０６は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＳＴ－７が垂直変換として使用され、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＣＴ－２が垂直変換として使用され、ＤＳＴ－７が水平変換として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを決定し得る。

[0183] 別の例では、残差ブロックが、２つ以下のサンプル（例えば、２×８ブロック）である水平サイズまたは垂直サイズを有するとき、変換処理ユニット２０６は、複数の残差サブブロックに変換が適用されるべきでないと決定し得る。

[0184] いくつかの例では、変換処理ユニット２０６は、イントラ予測されるブロックである現在ブロック上の複数の残差サブブロックベースのためのコンテキスト割当てを決定し得る。いくつかの例では、変換処理ユニット２０６は、インター予測されるブロックである現在ブロック上の複数の残差サブブロックベースのためのコンテキスト割当てを決定し得る。

[0185] 量子化ユニット２０８は、量子化された変換係数ブロックを生成するために、変換係数ブロック中の変換係数を量子化し得る。量子化ユニット２０８は、現在ブロックに関連付けられた量子化パラメータ（ＱＰ）値に従って変換係数ブロックの変換係数を量子化し得る。ビデオエンコーダ２００は（例えば、モード選択ユニット２０２を介して）、ＣＵに関連付けられたＱＰ値を調整することによって、現在ブロックに関連付けられた変換係数ブロックに適用される量子化の程度を調整し得る。量子化は、情報の損失を導入することがあり、従って、量子化された変換係数は、変換処理ユニット２０６によって生成された元の変換係数よりも低い精度を有し得る。

[0186] 逆量子化ユニット２１０と逆変換処理ユニット２１２とは、変換係数ブロックから残差ブロックを再構築するために、それぞれ、量子化された変換係数ブロックに逆量子化と逆変換とを適用し得る。再構築ユニット２１４は、再構築された残差ブロックと、モード選択ユニット２０２によって生成された予測ブロックとに基づいて、（ある程度のひずみを潜在的にもっているものの）現在ブロックに対応する再構築されたブロックを生成し得る。例えば、再構築ユニット２１４は、再構築されたブロックを生成するために、モード選択ユニット２０２によって生成された予測ブロックからの対応するサンプルに、再構築された残差ブロックのサンプルを加算し得る。

[0187] フィルタユニット２１６は、再構築されたブロックに対して１つまたは複数のフィルタ演算を行い得る。例えば、フィルタユニット２１６は、ＣＵのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を行い得る。いくつかの例では、フィルタユニット２１６の動作はスキップされてよい。

[0188] ビデオエンコーダ２００は、再構築されたブロックをＤＰＢ２１８に記憶する。例えば、フィルタユニット２１６の動作が必要とされない例において、再構築ユニット２１４は、再構築されたブロックをＤＰＢ２１８に記憶し得る。フィルタユニット２１６の動作が必要とされる例では、フィルタユニット２１６は、フィルタ処理された再構築されたブロックをＤＰＢ２１８に記憶し得る。動き推定ユニット２２２と動き補償ユニット２２４とは、後で符号化されるピクチャのブロックをインター予測するために、再構築（および潜在的にフィルタ処理）されたブロックから形成された参照ピクチャをＤＰＢ２１８から取り出し得る。加えて、イントラ予測ユニット２２６は、現在ピクチャ中の他のブロックをイントラ予測するために、現在ピクチャのＤＰＢ２１８中の再構築されたブロックを使用し得る。

[0189] 概して、エントロピー符号化ユニット２２０は、ビデオエンコーダ２００の他の機能構成要素から受信されたシンタックス要素をエントロピー符号化し得る。例えば、エントロピー符号化ユニット２２０は、量子化ユニット２０８からの量子化された変換係数ブロックをエントロピー符号化し得る。別の例として、エントロピー符号化ユニット２２０は、モード選択ユニット２０２からの予測シンタックス要素（例えば、インター予測のための動き情報、またはイントラ予測のためのイントラモード情報）をエントロピー符号化し得る。エントロピー符号化ユニット２２０は、エントロピー符号化データを生成するために、ビデオデータの別の例であるシンタックス要素に対して１つまたは複数のエントロピー符号化演算を行い得る。例えば、エントロピー符号化ユニット２２０は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）動作、ＣＡＢＡＣ動作、可変対可変（Ｖ２Ｖ：variable-to-variable）長コーディング動作、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）動作、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング動作、指数ゴロム符号化動作、または別のタイプのエントロピー符号化動作をデータに対して行い得る。いくつかの例では、エントロピー符号化ユニット２２０は、シンタックス要素がエントロピー符号化されないバイパスモードで動作し得る。

[0190] 本開示の技法によれば、エントロピー符号化ユニット２２０は、残差ブロックのために、残差ブロックに関連する区分情報をエントロピー符号化し得る。残差ブロックに関連するそのような区分情報は、残差ブロックが区分されるかどうかを示し得る。残差ブロックが区分される場合、エントロピー符号化された区分情報は、残差ブロックの区分ツリータイプをさらに示し得る。区分ツリータイプは、クワッドツリー区分、バイナリツリー区分、ターナリツリー区分、または４ＴＵ区分のうちの１つであり得る。区分ツリータイプを示すために、エントロピー符号化された区分情報は、可能な区分タイプのリスト中のインデックスを含み得る。区分ツリータイプが、バイナリツリー区分、ターナリツリー区分、または４ＴＵ区分のうちの１つである場合、エントロピー符号化された区分情報は、残差ブロックが水平に分割されるか垂直に分割されるかを示す残差ブロックの区分タイプを示す情報をさらにシグナリングし得る。さらに、残差ブロックの区分ツリータイプが、バイナリツリー区分またはターナリツリー区分である場合、エントロピー符号化された情報は、ＴＵが対称的に分割されるか非対称的に分割されるかを示す情報をさらにシグナリングし得る。

[0191] エントロピー符号化ユニット２２０はまた、残差ブロックのために、残差ブロックに関連する他の情報をエントロピー符号化し得る。例えば、エントロピー符号化ユニット２２０は、それぞれの残差サブブロックの各々のためのＭＴＳインデックスなど、残差ブロックの区分から生じる複数の残差サブブロックの各々のために選択された変換のインジケーションを符号化し得る。別の例では、エントロピー符号化ユニット２２０は、残差ブロックのために選択された変換のインジケーションを符号化し得、ここで、選択された変換は、残差ブロックの区分から生じる複数の残差サブブロックの各々に適用される。

[0192] 本開示のいくつかの態様によれば、エントロピー符号化ユニット２２０は、残差ブロックの区分から生じる複数の残差サブブロックのためのコンテキスト割当て、または複数の残差サブブロックの変換カーネルに関連する情報を符号化するのを控え得る。代わりに、ビデオデコーダ３００は、残差ブロックが区分されるかどうか、残差ブロックがそれに従って区分された区分ツリータイプ、残差ブロックの区分タイプ、並びにエントロピー符号化ユニット２２０によってエントロピー符号化される他のサイド情報など、エントロピー符号化ユニット２２０によって符号化される残差ブロックに関連する他の情報に基づいて残差ブロックに関するそのような情報を推論し得る。

[0193] ビデオエンコーダ２００は、スライスまたはピクチャのブロックを再構築するために必要とされるエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。特に、エントロピー符号化ユニット２２０は、本開示の本技法に従って、例えば、残差ブロックに関連するエントロピー符号化された区分情報を含むビットストリームを出力し得る。従って、エンコーダ２００が、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定すると、エントロピー符号化ユニット２２０は、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化し得る。

[0194] 上述の動作は、ブロックに関して説明されている。そのような説明は、ルーマコーディングブロックおよび／またはクロマコーディングブロックのための動作であるものとして理解されたい。上述されたように、いくつかの例では、ルーマコーディングブロックとクロマコーディングブロックとは、ＣＵのルーマ成分とクロマ成分とである。いくつかの例では、ルーマコーディングブロックとクロマコーディングブロックとは、ＰＵのルーマ成分とクロマ成分とである。

[0195] いくつかの例では、ルーマコーディングブロックに関して行われる動作は、クロマコーディングブロックのために繰り返される必要はない。一例として、ルーマコーディングブロックのための動きベクトル（ＭＶ）と参照ピクチャとを識別するための動作は、クロマブロックのためのＭＶと参照ピクチャとを識別するために繰り返される必要はない。そうではなく、ルーマコーディングブロックのためのＭＶは、クロマブロックのためのＭＶを決定するためにスケーリングされてよく、参照ピクチャは同じであってよい。別の例として、イントラ予測プロセスは、ルーマコーディングブロックとクロマコーディングブロックについて同じであってよい。

[0196] ビデオエンコーダ２００は、ビデオデータを記憶するように構成されたメモリと、回路中に実装された１つまたは複数の処理ユニットとを含む、ビデオデータを符号化するように構成されたデバイスの一例を表し、１つまたは複数の処理ユニットは、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定することと、残差ブロックが区分されるかどうかを示す情報をシグナリングし、残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することとを行うように構成される。

[0197] 図１０は、本開示の技法を行い得る例示的なビデオデコーダ３００を示すブロック図である。図１０は、説明の目的で提供されており、本開示において広く例示され、説明される技法に対する限定ではない。説明の目的で、本開示では、ＪＥＭと、ＶＶＣと、ＨＥＶＣとの技法に従ってビデオデコーダ３００について説明する。しかしながら、本開示の技法は、他のビデオコーディング規格に構成されたビデオコーディングデバイスによって行われ得る。

[0198] 図１０の例では、ビデオデコーダ３００は、コード化ピクチャバッファ（ＣＰＢ：coded picture buffer）メモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、復号ピクチャバッファ（ＤＰＢ：decoded picture buffer）３１４とを含む。ＣＰＢメモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、ＤＰＢ３１４とのいずれかまたは全ては、１つまたは複数のプロセッサにおいてあるいは処理回路において実施され得る。例えば、ビデオデコーダ３００のユニットは、１つまたは複数の回路または論理要素として、ハードウェア回路の一部として、あるいはＦＰＧＡのプロセッサ、ＡＳＩＣの一部として実施され得る。その上、ビデオデコーダ３００は、これらおよび他の機能を行うための追加または代替のプロセッサまたは処理回路を含み得る。

[0199] 予測処理ユニット３０４は、動き補償ユニット３１６と、イントラ予測ユニット３１８とを含む。予測処理ユニット３０４は、他の予測モードに従って予測を行うための追加のユニットを含み得る。例として、予測処理ユニット３０４は、パレットユニット、（動き補償ユニット３１６の一部を形成し得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。他の例では、ビデオデコーダ３００は、より多数の、より少数の、または異なる機能構成要素を含み得る。

[0200] ＣＰＢメモリ３２０は、ビデオデコーダ３００の構成要素によって復号されるべき、符号化ビデオビットストリームなどのビデオデータを記憶し得る。ＣＰＢメモリ３２０に記憶されるビデオデータは、例えば、コンピュータ可読媒体１１０（図１）から取得され得る。ＣＰＢメモリ３２０は、符号化ビデオビットストリームからの符号化ビデオデータ（例えば、シンタックス要素）を記憶するＣＰＢを含み得る。また、ＣＰＢメモリ３２０は、ビデオデコーダ３００の様々なユニットからの出力を表す一時データなど、コード化ピクチャのシンタックス要素以外のビデオデータを記憶し得る。ＤＰＢ３１４は、概して、ビデオデコーダ３００が符号化ビデオビットストリームの後続のデータまたはピクチャを復号するときに出力しおよび／または参照ビデオデータとして使用し得る復号ピクチャを記憶する。ＣＰＢメモリ３２０とＤＰＢ３１４とは、ＳＤＲＡＭを含むＤＲＡＭ、ＭＲＡＭ、ＲＲＡＭ、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ＣＰＢメモリ３２０とＤＰＢ３１４とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ＣＰＢメモリ３２０は、ビデオデコーダ３００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0201] 追加または代替として、いくつかの例では、ビデオデコーダ３００は、メモリ１２０（図１）からコード化ビデオデータを取り出し得る。すなわち、メモリ１２０は、ＣＰＢメモリ３２０を用いて上で論じられたデータを記憶し得る。同様に、メモリ１２０は、ビデオデコーダ３００の機能の一部または全部が、ビデオデコーダ３００の処理回路によって実行されるべきソフトウェアにおいて実施されたとき、ビデオデコーダ３００によって実行されるべき命令を記憶し得る。従って、ＣＰＢメモリ３２０は、図１０のビデオデコーダ３００の他の構成要素とともに、ビットストリームを受信するための手段の例を表す。

[0202] 図１０に示される様々なユニットは、ビデオデコーダ３００によって行われる動作を理解するのを支援するために示される。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実施され得る。図９と同様に、固定機能回路は、特定の機能を提供する回路を指し、行われ得る動作にプリセットされる。プログラマブル回路は、様々なタスクを行うように、および行われ得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。例えば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義される様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（例えば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が行う動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、ユニットのうちの１つまたは複数は、集積回路であり得る。

[0203] ビデオデコーダ３００は、ＡＬＵ、ＥＦＵ、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオデコーダ３００の動作が、プログラマブル回路上で実行されるソフトウェアによって行われる例では、ビデオデコーダ３００が受信し実行するソフトウェアの命令（例えば、オブジェクトコード）をオンチップまたはオフチップメモリが記憶し得る。

[0204] エントロピー復号ユニット３０２は、ＣＰＢから符号化ビデオデータを受信し、ビデオデータをエントロピー復号してシンタックス要素を再生し得る。予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２とは、ビットストリームから抽出されたシンタックス要素に基づいて復号ビデオデータを生成し得る。

[0205] 概して、ビデオデコーダ３００は、ブロックごとにピクチャを再構築する。ビデオデコーダ３００は、各ブロックに対して個々に再構築演算を行い得る（ここで、現在再構築されているブロック、すなわち、現在復号されているブロックは、「現在ブロック」と呼ばれることがある）。

[0206] エントロピー復号ユニット３０２は、量子化された変換係数ブロックの量子化された変換係数を定義するシンタックス要素、並びに量子化パラメータ（ＱＰ：quantization parameter）および／または変換モードインジケーションなどの変換情報をエントロピー復号し得る。

[0207] 本開示の技法によれば、ビデオデコーダ３００は、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信し得、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す。残差ブロックが区分されるかどうかを示す情報と、残差ブロックの区分ツリータイプを示す情報とは、残差ブロックが区分されるかどうかと、そうである場合、残差ブロックの区分ツリータイプとをシグナリングするシンタックス要素であり得る。

[0208] いくつかの例では、残差ブロックの区分ツリータイプを示す情報は、ツリータイプのセットへのインデックス情報であり得、エントロピー復号ユニット３０２は、受信されたインデックス情報に基づいて区分ツリータイプを決定し得る。例えば、ツリータイプ情報のセットは、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含み得る、
[0209] いくつかの例では、ビデオデコーダ３００によって受信されるビットストリームは、残差ブロックが水平に分割されるか垂直に分割されるか、および／または残差ブロックが対称的に分割されるか非対称的に分割されるかを示す情報をさらに含み得る。

[0210] 例えば、ビットストリームは、残差ブロックについて、残差ブロックが区分されるかどうかをシグナリングするフラグを含み得る。フラグが有効にされる場合、ビットストリームは、クワッドツリー区分、バイナリツリー区分、ターナリツリー区分、および４ＴＵ区分という区分ツリータイプのリスト中のインデックスに対する複数のビットを介してなど、残差ブロックを区分するための区分ツリータイプを示すための、区分ツリータイプのリスト中のインデックスを含み得る。ビットストリームはまた、しかも、必要な場合、残差ブロックが水平に分割されるか垂直に分割されるかと、残差ブロックが対称的に分割されるか非対称的に分割されるかとをシグナリングするフラグを含み得る。

[0211] エントロピー復号ユニット３０２は、ビットストリームから復号されるデータの現在ブロックの残差ブロックに関連する区分情報をエントロピー復号し得る。特に、エントロピー復号ユニット３０２は、残差ブロックが区分されるかどうかを決定するために、区分情報を復号し得る。ビットストリーム中の残差データの区分情報が、残差ブロックが区分されることをシグナリングする場合、エントロピー復号ユニット３０２は、残差ブロックの区分ツリータイプを決定するために、区分情報をさらに復号し得る。残差ブロックの区分ツリータイプに応じて、エントロピー復号ユニット３０２は、残差ブロックが水平に分割されるか垂直に分割されるか、並びに残差ブロックが対称的に分割されるか非対称的に分割されるかを決定するために、ビットストリーム中の残差ブロックの区分情報を復号し得る。従って、エントロピー復号ユニット３０２は、図１０のビデオデコーダ３００の他の構成要素とともに、残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定するための手段の例を表す。

[0212] 加えて、いくつかの例では、エントロピー復号ユニット３０２はまた、データの現在ブロックの残差ブロックについて、残差ブロックに関連する他の情報をエントロピー復号し得る。例えば、エントロピー復号ユニット３０２は、それぞれの残差サブブロックの各々のためのＭＴＳインデックスなど、残差ブロックの区分から生じる複数の残差サブブロックの各々のために選択された変換のインジケーションを復号し得る。

[0213] 別の例では、エントロピー復号ユニット３０２は、残差ブロックのために選択された変換のインジケーションを復号し得、ここで、選択された変換は、残差ブロックの区分から生じる複数の残差サブブロックの各々に適用される。残差ブロックのために選択されたそのような変換は、残差ブロックレベルにおいてビットストリーム中でシグナリングされ、それにより、残差ブロックを複数の残差サブブロックに区分する能力を維持しながら、残差サブブロックの各々について別個の変換を示す必要があることからのオーバーヘッドが省かれ得る。

[0214] 本開示の技法によれば、エントロピー復号ユニット３０２は、現在ブロックの予測モード、残差ブロックの区分ツリータイプ、残差ブロックの区分タイプ、またはビットストリーム中に含まれる任意の他のサイド情報などの情報に基づいて、複数の残差サブブロックの各々についてコード化ブロックフラグ（ｃｂｆ：coded block flag）および／または変換スキップフラグを推論または制限し得る。コード化ブロックフラグは、残差サブブロックについて少なくとも１つの非０係数変換レベルが送信されるかどうかに関する情報をシグナリングし得る。変換スキップフラグは、残差サブブロックについて変換がスキップされるかどうかに関する情報をシグナリングし得る。例えば、エントロピー復号ユニット３０２は、ｃｂｆシグナリングが残差サブブロックのために必要とされないように、無効にされたコード化ブロックフラグ（フラグ＝０）を常に有するように残差サブブロックを制限し得る。

[0215] エントロピー復号ユニット３０２は、逆変換処理ユニット３０８に、残差ブロックに関連するそのような情報を提供し得る。従って、逆量子化ユニット３０６が変換係数ブロックを形成した後に、逆変換処理ユニット３０８は、現在ブロックに関連する残差ブロックを生成するために、逆量子化ユニット３０６によって提供される１つまたは複数の変換係数ブロックとともに残差ブロックに関連するそのような情報を使用し得る。

[0216] 逆量子化ユニット３０６は、量子化の程度と、同様に、逆量子化ユニット３０６が適用すべき逆量子化の程度とを決定するために、量子化された変換係数ブロックに関連するＱＰを使用し得る。逆量子化ユニット３０６は、量子化された変換係数を逆量子化するために、例えば、ビット単位の左シフト演算を行い得る。逆量子化ユニット３０６は、それにより、変換係数を含む変換係数ブロックを形成し得る。

[0217] 逆量子化ユニット３０６が変換係数ブロックを形成した後に、逆変換処理ユニット３０８は、現在ブロックに関連する残差ブロックを生成するために、変換係数ブロックに１つまたは複数の逆変換を適用し得る。例えば、逆変換処理ユニット３０８は、逆ＤＣＴ、逆整数変換、逆カルーネンレーベ変換（ＫＬＴ）、逆回転変換、逆方向変換、または別の逆変換を変換係数ブロックに適用し得る。従って、逆変換処理ユニット３０８は、図１０のビデオデコーダ３００の他の構成要素とともに、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成するための手段の例を表す。

[0218] 本開示の技法によれば、逆変換処理ユニット３０８は、エントロピー復号ユニット３０２から、データの現在ブロックの残差ブロックに関連する区分情報を受信し得、複数の残差サブブロックへの残差ブロックの区分を決定し得る。上で論じられたように、エントロピー復号ユニット３０２は、残差ブロックが区分されるかどうかと、残差ブロックが水平に分割されるか垂直に分割されるかと、残差ブロックが対称的に分割されるか非対称的に分割されるかとを示す、現在ブロックの残差ブロックについての区分情報を復号し得る。逆の処理ユニット３０８は、現在ブロックデータのための残差ブロックの区分から生じる複数の残差サブブロックを決定するために、そのような情報を使用し得る。

[0219] 逆変換処理ユニット３０８は、現在ブロックデータのための残差ブロックの区分から生じる複数の残差サブブロックを生成することを含めて、ビデオデータの現在ブロックの残差ブロックを生成するために、区分情報に少なくとも部分的に基づいて１つまたは複数の変換係数ブロックに１つまたは複数の逆変換を適用し得る。このようにして、逆変換処理ユニット３０８は、ビデオデータの現在ブロックの残差データを生成する。

[0220] いくつかの例では、逆変換処理ユニット３０８は、エントロピー復号ユニット３０２によってビットストリームから復号された情報によって示される１つまたは複数の逆変換を適用し得る。例えば、ビットストリームが、それぞれの残差サブブロックの各々のためのＭＴＳインデックスなど、残差ブロックの区分から生じる複数の残差サブブロックの各々のために選択された変換を示す情報を含む場合、逆変換処理ユニット３０８は、選択された変換を複数の残差サブブロックに適用し得る。別の例では、ビットストリームが、残差ブロックのために選択された変換を示す情報を含む場合、逆変換処理ユニット３０８は、選択された変換を残差ブロック中の複数の残差サブブロックの各々に適用し得る。

[0221] いくつかの例では、逆変換処理ユニット３０８は、ビットストリーム中に含まれる残差ブロックの区分情報および／または他のサイド情報に少なくとも部分的に基づいて、水平方向または垂直方向のうちの少なくとも１つにおいて複数の残差サブブロックの変換カーネルを推論または制限し得る。複数の残差サブブロックの変換カーネルを推論または制限することは、ビットストリーム中に含まれる残差ブロックの区分情報および／または他のサイド情報に少なくとも部分的に基づいて、複数の残差サブブロックのためのＭＴＳインデックスまたは変換定義を推論または制限することを含む。

[0222] 変換カーネルを推論または制限することは、変換カーネルがビットストリーム中で明示的にシグナリングされないことを意味する。代わりに、変換カーネルは、ビットストリーム中の他の情報に少なくとも部分的に基づいて推論または制限され得る。一例では、変換カーネルは、残差ブロックがバイナリツリー区分に従って区分されるか、４ＴＵ区分に従って区分されるか、ターナリツリー区分に従って区分されるかに基づいてなど、ビットストリームによってシグナリングされる残差ブロックの区分ツリータイプに基づいて、残差ツリーが水平に分割されるか垂直に分割されるかに基づいてなど、残差ブロックの区分タイプに基づいて、および／またはビットストリーム中でシグナリングされる任意の他のサイド情報に基づいて推論または制限され得る。逆変換処理ユニット３０８は、ビデオデータの現在ブロックの残差ブロックを生成するために、複数の残差サブブロックのための推論または制限された変換カーネルに少なくとも部分的に基づいて１つまたは複数の変換係数ブロックに１つまたは複数の逆変換を適用し得る。

[0223] いくつかの例では、逆変換処理ユニット３０８は、ビットストリーム中に含まれる残差ブロックの区分情報および／または他のサイド情報に少なくとも部分的に基づいて複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得、逆変換処理ユニット３０８は、ビデオデータの現在ブロックの残差ブロックを生成するために、複数の残差サブブロックのための推論または制限されたコンテキスト割当てに少なくとも部分的に基づいて１つまたは複数の変換係数ブロックに１つまたは複数の逆変換を適用し得る。

[0224] コンテキスト割当てが推論または制限されたとき、複数の残差サブブロックのための変換選択が依然として可能であり得、コンテキストは、そのような変換選択をシグナリングするために割り当てられる。割り当てられるコンテキストは、おそらく、変換選択シグナリング中にすでに存在しているコンテキストとは異なる別個のコンテキスト。その結果、変換オーバーヘッドはより効率的にコーディングされ得、全ての変換選択が利用可能になり得る。

[0225] 複数の残差サブブロックのためのコンテキスト割当てを推論または制限することは、コンテキスト割当てがビットストリーム中で明示的にシグナリングされないことを意味する。代わりに、コンテキスト割当ては、ビットストリーム中の他の情報に少なくとも部分的に基づいて推論または制限され得る。一例では、コンテキスト割当ては、残差ブロックがクワッドツリー区分に従って区分されるか、バイナリツリー区分に従って区分されるか、４ＴＵ区分に従って区分されるか、ターナリツリー区分に従って区分されるかに基づいてなど、ビットストリームによってシグナリングされる残差ブロックの区分ツリータイプに基づいて、残差ツリーが水平に分割されるか垂直に分割されるかに基づいてなど、残差ブロックの区分タイプに基づいて、および／またはビットストリーム中でシグナリングされる任意の他のサイド情報に基づいて推論または制限され得る。いくつかの例では、逆変換処理ユニット３０８は、現在ブロックのルーマ成分および／または現在ブロックのクロマ成分について複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0226] 一例では、逆変換処理ユニット３０８が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、逆変換処理ユニット３０８は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－８が水平変換と垂直変換の両方として使用されるように、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＳＴ－７が水平変換において使用され、ＤＳＴ－８が垂直変換として使用されるように、複数の残差サブブロックのうちの第３の残差サブブロックのためにＤＣＴ－８が水平変換において使用され、ＤＳＴ－７が垂直変換として使用されるように、および複数の残差サブブロックのうちの第４の残差サブブロックのためにＤＳＴ－７が水平変換と垂直変換の両方として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る、。

[0227] 別の例では、逆変換処理ユニット３０８が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、逆変換処理ユニット３０８は、複数の残差サブブロックの各々のためにＤＳＴ－７が水平変換と垂直変換の両方として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0228] 別の例では、逆変換処理ユニット３０８が、残差ブロックがクワッドツリー区分に従って４つの残差サブブロックに区分されると決定したとき、逆変換処理ユニット３０８は、複数の残差サブブロックのうちの１つまたは複数のためにＤＣＴ－２が水平変換または垂直変換のうちの少なくとも１つとして使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。従って、例えば、複数の残差サブブロックのうちの１つまたは複数のために、ＤＣＴ－２は水平変換として推論または制限され得、ＤＳＴ－７またはＤＣＴ－８は垂直変換として推論または制限され得、複数の残差サブブロックのうちの１つまたは複数のために、ＤＣＴ－２は垂直変換として推論または制限され得、ＤＳＴ－７またはＤＣＴ－８は水平変換として推論または制限され得る。

[0229] 別の例では、逆変換処理ユニット３０８が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定し、および残差ブロックの区分タイプが水平分割であると決定したとき、逆変換処理ユニット３０８は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＣＴ－８が垂直変換として使用されるように、および複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＳＴ－７が垂直変換として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0230] 別の例では、逆変換処理ユニット３０８が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定し、および残差ブロックの区分タイプが垂直分割であると決定したとき、変換逆変換処理ユニット３０８は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－８が水平変換として使用され、ＤＣＴ－２が垂直変換として使用されるように、および複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＳＴ－７が水平変換として使用され、ＤＣＴ－２が垂直変換として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0231] 別の例では、逆変換処理ユニット３０８が、残差ブロックがバイナリツリー区分に従って２つの残差サブブロックに区分されると決定したとき、逆変換処理ユニット３０８は、複数の残差サブブロックのうちの１つまたは複数のために、ＤＳＴ－７またはＤＣＴ－８のうちの１つが、水平変換または垂直変換としてのうちの少なくとも１つとして使用されるように、複数の区分サブブロックのためのコンテキスト割当てを推論または制限し得る。ＤＳＴ－７またはＤＣＴ－８の使用は、上述のバイナリツリー区分の例におけるＤＣＴ－２の代わりであり得る。

[0232] いくつかの例では、逆変換処理ユニット３０８は、残差ブロックのサイズに少なくとも部分的に基づいて残差ブロックのためのコンテキスト割当てを推論または制限し得る。例えば、残差ブロックが、１６個以下のサンプル（例えば、１６個のサンプルのサイズを有する４×４ブロック）などの小さいサイズを有するとき、および残差ブロックがバイナリツリー区分に従って区分されるとき、逆変換処理ユニット３０８は、複数の残差サブブロックの各々のためにＤＳＴ－７が水平変換と垂直変換の両方として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0233] 別の例では、残差ブロックが、１６個以上のサンプル（例えば、３２個のサンプルのサイズを有する４×８ブロック）などの大きいサイズを有するとき、および残差ブロックがバイナリツリー区分に従って区分されるとき、逆変換処理ユニット３０８は、複数の残差サブブロックのうちの第１の残差サブブロックのためにＤＣＴ－２が水平変換として使用され、ＤＳＴ－７が垂直変換として使用され、複数の残差サブブロックのうちの第２の残差サブブロックのためにＤＣＴ－２が垂直変換として使用され、ＤＳＴ－７が水平変換として使用されるように、複数の残差サブブロックのためのコンテキスト割当てを推論または制限し得る。

[0234] 別の例では、残差ブロックが、２つ以下のサンプル（例えば、２×８ブロック）である水平サイズまたは垂直サイズを有するとき、逆変換処理ユニット３０８は、複数の残差サブブロックに変換が適用されないと推論または制限し得る。

[0235] いくつかの例では、逆変換処理ユニット３０８は、イントラ予測されるビデオブロックである現在ブロック上の複数の残差サブブロックベースのためのコンテキスト割当てを推論し得る。他の例では、逆変換処理ユニット３０８は、インター予測されるビデオブロックである現在ブロック上の複数の残差サブブロックベースのためのコンテキスト割当てを推論し得る。別の例では、逆変換処理ユニット３０８は、インター予測されるビデオブロックまたはイントラ予測されるビデオブロックである現在ブロック上の複数の残差サブブロックベースのためのコンテキスト割当てを推論し得る。

[0236] さらに、予測処理ユニット３０４は、エントロピー復号ユニット３０２によってエントロピー復号された予測情報シンタックス要素に従って予測ブロックを生成する。例えば、予測情報シンタックス要素が、現在ブロックがインター予測されることを示す場合、動き補償ユニット３１６は、予測ブロックを生成し得る。この場合、予測情報シンタックス要素は、参照ブロックをそれから取り出すべきＤＰＢ３１４中の参照ピクチャ、並びに現在ピクチャ中の現在ブロックのロケーションに対して参照ピクチャ中の参照ブロックのロケーションを識別する動きベクトルを示し得る。動き補償ユニット３１６は、概して、動き補償ユニット２２４（図９）に関して説明されたのと実質的に同様である様式でインター予測プロセスを行い得る。

[0237] 別の例として、予測情報シンタックス要素が、現在ブロックがイントラ予測されることを示す場合、イントラ予測ユニット３１８は、予測情報シンタックス要素によって示されるイントラ予測モードに従って予測ブロックを生成し得る。この場合も、イントラ予測ユニット３１８は、概して、イントラ予測ユニット２２６（図９）に関して説明されたのと実質的に同様である様式でイントラ予測プロセスを行い得る。イントラ予測ユニット３１８は、ＤＰＢ３１４から、現在ブロックに対する隣接サンプルのデータを取り出し得る。

[0238] 再構築ユニット３１０は、予測ブロックと残差ブロックとを使用して現在ブロックを再構築し得る。例えば、再構築ユニット３１０は、現在ブロックを再構築するために、予測ブロックの対応するサンプルに残差ブロックのサンプルを加算し得る。従って、再構築ユニット３１０は、図１０のビデオデコーダ３００の他の構成要素とともに、残差データを使用して現在ブロックを復号するための手段の例を表す。

[0239] フィルタユニット３１２は、再構築されたブロックに対して１つまたは複数のフィルタ演算を行い得る。例えば、フィルタユニット３１２は、再構築されたブロックのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を行い得る。フィルタユニット３１２の動作は、全ての例において必ずしも行われるとは限らない。

[0240] ビデオデコーダ３００は、再構築されたブロックをＤＰＢ３１４に記憶し得る。例えば、フィルタユニット３１２の動作が行われない例において、再構築ユニット３１０は、再構築されたブロックをＤＰＢ３１４に記憶し得る。フィルタユニット３１２の動作が行われる例では、フィルタユニット３１２は、フィルタ処理された再構築されたブロックをＤＰＢ３１４に記憶し得る。上で論じられたように、ＤＰＢ３１４は、イントラ予測のための現在ピクチャのサンプルおよび後続の動き補償のための以前に復号されたピクチャなど、参照情報を予測処理ユニット３０４に提供し得る。その上、ビデオデコーダ３００は、ＤＰＢ３１４からの復号ピクチャ（例えば、復号ビデオ）を、後続のプレゼンテーションのために、図１のディスプレイデバイス１１８などのディスプレイデバイス上に出力し得る。

[0241] このようにして、ビデオデコーダ３００は、ビデオデータを記憶するように構成されたメモリと、回路中に実装された１つまたは複数の処理ユニットとを含む、ビデオ復号デバイスの一例を表し、１つまたは複数の処理ユニットは、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成することと、残差データを使用して現在ブロックを復号することとを行うように構成される。

[0242] 図１１は、現在ブロックを符号化するための例示的な方法を示すフローチャートである。現在ブロックは現在ＣＵを備え得る。ビデオエンコーダ２００（図１および図９）に関して説明されるが、他のデバイスが図１１の方法と同様の方法を行うように構成され得ることを理解されたい。

[0243] この例では、ビデオエンコーダ２００は、初めに、現在ブロックを予測する（３５０）。例えば、ビデオエンコーダ２００は、現在ブロックの予測ブロックを形成し得る。ビデオエンコーダ２００は、次いで、現在ブロックの残差ブロックを計算し得る（３５２）。残差ブロックを計算するために、ビデオエンコーダ２００は、元のコーディングされていないブロックと、現在ブロックの予測ブロックとの間の差分を計算し得る。残差ブロックを計算する一部として、ビデオエンコーダ２００は、クワッドツリー区分またはバイナリツリー区分のうちの少なくとも１つに従って残差ブロックを複数の残差サブブロックに区分し得る。ビデオエンコーダ２００がバイナリツリー区分に従って残差ブロックを区分する場合、ビデオエンコーダ２００は、残差ブロックを水平に区分するかまたは垂直に区分し得る。さらに、ビデオエンコーダ２００がバイナリツリー区分に従って残差ブロックを区分する場合、ビデオエンコーダ２００は、残差ブロックを対称的に区分するかまたは非対称的に区分し得る。

[0244] ビデオエンコーダ２００は、次いで、残差ブロックの係数を変換し、量子化し得る（３５４）。次に、ビデオエンコーダ２００は、残差ブロックの量子化された変換係数を走査し得る（３５６）。走査中に、または走査に続いて、ビデオエンコーダ２００は、変換係数をエントロピー符号化し得る（３５８）。例えば、ビデオエンコーダ２００は、ＣＡＶＬＣまたはＣＡＢＡＣを使用して変換係数を符号化し得る。ビデオエンコーダ２００は、次いで、ブロックのエントロピー符号化されたデータを出力し得る（３６０）。ビデオエンコーダ２００は、ブロックのエントロピー符号化されたデータをビットストリームとして出力し得る。ビットストリームは、残差ブロックに関して、残差ブロックが区分されるかどうかと、残差ブロックを区分するための区分ツリータイプ使用と、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックの区分ツリータイプを示す情報とをシグナリングし得る。

[0245] 図１２は、ビデオデータの現在ブロックを復号するための例示的な方法を示すフローチャートである。現在ブロックは現在ＣＵを備え得る。ビデオデコーダ３００（図１および図１０）に関して説明されるが、他のデバイスが図１２の方法と同様の方法を行うように構成され得ることを理解されたい。

[0246] ビデオデコーダ３００は、エントロピー符号化された予測情報、および現在ブロックに対応する残差ブロックの係数についてのエントロピー符号化されたデータを含むビットストリームなど、現在ブロックのエントロピー符号化されたデータを受信し得る（３７０）。ビデオデコーダ３００は、エントロピー符号化されたデータをエントロピー復号して、現在ブロックについての予測情報を決定し、残差ブロックの係数を再生し得る（３７２）。ビデオデコーダ３００は、現在ブロックの残差ブロックについて、ビットストリームが、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを含むかどうかを決定し得る。

[0247] ビデオデコーダ３００は、現在ブロックの予測ブロックを計算するために、例えば、現在ブロックについての予測情報によって示されるイントラ予測またはインター予測モードを使用して、現在ブロックを予測し得る（３７４）。ビデオデコーダ３００は、次いで、量子化された変換係数のブロックを作成するために、再生された係数を逆走査し得る（３７６）。ビデオデコーダ３００は、次いで、変換係数を逆量子化し、逆変換して、残差ブロックを生成し得る（３７８）。ビデオデコーダ３００は、変換係数を逆変換して残差ブロックを生成するために、残差ブロックの区分に関するそのような情報を使用して、残差ブロックのためのコンテキスト割当てと変換選択とを推論または制限し得る。ビデオデコーダ３００は、最終的に、予測ブロックと残差ブロックとを組み合わせることによって現在ブロックを復号し得る（３８０）。

[0248] 図１３は、区分ツリータイプに従って区分される残差ブロックを有するデータの現在ブロックを復号するための例示的な方法を示すフローチャートである。ビデオデコーダ３００（図１および図１０）に関して説明されるが、他のデバイスが図１３の方法と同様の方法を行うように構成され得ることを理解されたい。いくつかの例では、ビデオデコーダ３００は、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を含み得る。いくつかの例では、ビデオデコーダ３００は、集積回路、マイクロプロセッサ、またはワイヤレス通信デバイスのうちの少なくとも１つを含む。いくつかの例では、ビデオデコーダ３００は、復号ビデオデータを表示するように構成されたディスプレイを含む。

[0249] ビデオデコーダ３００は、ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される残差ブロックに基づいて残差ブロックの区分ツリータイプを示す情報とを受信し得、ここにおいて、残差ブロックは、現在ブロックと予測ブロックとの間の差分を示す（４００）。

[0250] いくつかの例では、区分ツリータイプを示す情報を受信することは、ツリータイプのセットへのインデックス情報を受信することを含み得、ビデオデコーダ３００は、受信されたインデックス情報に基づいて区分ツリータイプを決定し得る。いくつかの例では、ツリータイプ情報のセットは、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、いくつかの例では、区分ツリータイプを決定することは、区分ツリータイプがバイナリツリー区分のちの１つであると決定することを含み得、ビデオデコーダ３００は、残差ブロックが水平に分割されるか垂直に分割されるかを示す情報を受信し得る。

[0251] ビデオデコーダ３００は、残差ブロックが区分されるという受信された情報と、残差ブロックの区分ツリータイプとに基づいて、残差ブロックが区分ツリータイプに従って区分される複数の残差サブブロックを決定し得る（４０２）。

[0252] ビデオデコーダ３００は、区分ツリータイプに従って複数の残差サブブロックに区分される残差ブロックに少なくとも部分的に基づいて現在ブロックの残差データを生成し得る（４０４）。いくつかの例では、ビデオデコーダ３００は、残差ブロックの区分ツリータイプまたは残差ブロックの区分タイプのうちの１つに少なくとも部分的に基づいて、水平方向または垂直方向のうちの少なくとも１つにおいて複数の残差サブブロックの変換カーネルをビットストリームから推論し得、ここで、現在ブロックの残差データを生成することは、複数の残差サブブロックの変換カーネルに少なくとも部分的に基づいて残差データを生成することをさらに含み得る。

[0253] ビデオデコーダ３００は、残差データを使用して現在ブロックを復号し得る（４０６）。

[0254] いくつかの例では、残差データを使用して現在ブロックを復号するために、ビデオデコーダ３００は、現在ブロックの予測モードを表すデータを復号し、予測モードを使用して現在ブロックの予測ブロックを生成し、予測ブロックを残差データと組み合わせて現在ブロックを再生し得る。

[0255] いくつかの例では、現在ブロックは、インター予測またはイントラ予測される。いくつかの例では、現在ブロックは、コーディングユニット（ＣＵ）のルーマブロックを備える。いくつかの例では、現在ブロックは、コーディングユニット（ＣＵ）またはＣＵのブロックであり、現在ブロックの残差ブロックは、変換ユニット（ＴＵ）またはＴＵのブロックであり、複数の残差サブブロックは、非正方形サブＴＵであり、ＣＵとは異なるサイズのものである。

[0256] 図１４は、区分ツリータイプに従って区分される残差ブロックを有するデータの現在ブロックを符号化するための例示的な方法を示すフローチャートである。ビデオエンコーダ２００（図１および図９）に関して説明されるが、他のデバイスが図１４の方法と同様の方法を行うように構成され得ることを理解されたい。いくつかの例では、ビデオエンコーダ２００は、集積回路、マイクロプロセッサ、またはワイヤレス通信デバイスのうちの少なくとも１つを含み得る。いくつかの例では、ビデオエンコーダ２００は、ビデオデータをキャプチャするように構成されたカメラを含み得る。いくつかの例では、ビデオエンコーダ２００は、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を含み得る。

[0257] ビデオエンコーダ２００は、ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定し得る（４５０）。ビデオエンコーダ２００は、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化し得る（４５２）。

[0258] いくつかの例では、残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される残差ブロックの区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリーム。いくつかの例では、ツリータイプ情報のセットは、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む。いくつかの例では、
残差ブロックの区分ツリータイプを示す情報が、区分ツリータイプがバイナリツリー区分のうちの１つであることを示すとき、ビットストリームは、残差ブロックが水平に分割されるか垂直に分割されるかを示す情報をさらにシグナリングする。

[0259] いくつかの例では、現在ブロックは、コーディングユニット（ＣＵ）またはＣＵのブロックであり、現在ブロックの残差ブロックは、変換ユニット（ＴＵ）またはＴＵのブロックであり、複数の残差サブブロックは、非正方形サブＴＵであり、ＣＵとは異なるサイズのものである。

[0260] 上記例に応じて、本明細書で説明された技法のいずれかのいくつかの行為またはイベントは、異なるシーケンスで行い得、追加、マージ、または完全に除外され得る（例えば、全ての説明された行為またはイベントが本技法の実践のために必要であるとは限らない）ことを認識されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、例えば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に行われ得る。

[0261] １つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せにおいて実施され得る。ソフトウェアで実施される場合、機能は、１つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的な有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示において説明された技法の実施のための命令、コードおよび／またはデータ構造を取り出すために、１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0262] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ－ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含むのではなく、代わりに、非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書において使用されるディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびＢｌｕ－ｒａｙディスク（disc）を含み、ここで、ディスク（disk）は通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0263] 命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路など、１つまたは複数のプロセッサによって実行され得る。従って、本明細書において使用される「プロセッサ」および「処理回路」という用語は、前述の構造、または本明細書において説明された技法の実施に好適な任意の他の構造のいずれかを指し得る。加えて、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび／またはソフトウェアモジュール内に提供されるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素において十分に実施され得る。

[0264] 本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（例えば、チップセット）を含む、多種多様なデバイスまたは装置において実施され得る。本開示では、開示される技法を行うように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明されたが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。そうではなく、上述されたように、様々なユニットは、好適なソフトウェアおよび／またはファームウェアとともに、上述された１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされるか、または相互動作可能なハードウェアユニットの集合によって提供され得る。

[0265] 様々な例について説明された。これらおよび他の例は、以下の特許請求の範囲内に入る。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオデータを復号する方法であって、
前記ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される前記残差ブロックに基づいて前記残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記残差ブロックが前記区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、
前記区分ツリータイプに従って前記複数の残差サブブロックに区分される前記残差ブロックに少なくとも部分的に基づいて前記現在ブロックの残差データを生成することと、
前記残差データを使用して前記現在ブロックを復号することとを備える、方法。
［Ｃ２］
前記区分ツリータイプを示す前記情報を受信することが、ツリータイプのセットへのインデックス情報を受信することを備え、前記方法が、前記受信されたインデックス情報に基づいて前記区分ツリータイプを決定することをさらに備える、Ｃ１に記載の方法。
［Ｃ３］
ツリータイプの前記セットが、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、Ｃ２に記載の方法。
［Ｃ４］
前記区分ツリータイプを決定することが、前記区分ツリータイプがバイナリツリー区分であると決定することを備え、前記方法は、前記残差ブロックが水平に分割されるか垂直に分割されるかを示す情報を受信することをさらに備える、Ｃ２に記載の方法。
［Ｃ５］
前記残差ブロックの前記区分ツリータイプまたは前記残差ブロックの区分タイプのうちの１つに少なくとも部分的に基づいて水平方向または垂直方向のうちの少なくとも１つにおいて前記複数の残差サブブロックの変換カーネルを前記ビットストリームから推論することをさらに備え、ここにおいて、
前記現在ブロックの前記残差データを生成することが、前記複数の残差サブブロックの前記変換カーネルに少なくとも部分的に基づいて前記残差データを生成することを備える、Ｃ１に記載の方法。
［Ｃ６］
前記現在ブロックが、インター予測またはイントラ予測される、Ｃ１に記載の方法。
［Ｃ７］
前記現在ブロックが、コーディングユニット（ＣＵ）のルーマブロックを備える、Ｃ１に記載の方法。
［Ｃ８］
前記現在ブロックが、コーディングユニット（ＣＵ）または前記ＣＵのブロックであり、
前記現在ブロックの前記残差ブロックが、変換ユニット（ＴＵ）または前記ＴＵのブロックであり、
前記複数の残差サブブロックが、非正方形サブＴＵであり、前記ＣＵとは異なるサイズのものである、Ｃ１に記載の方法。
［Ｃ９］
前記現在ブロックを復号することが、
前記現在ブロックの予測モードを表すデータを復号することと、
前記予測モードを使用して前記現在ブロックの前記予測ブロックを生成することと、
前記現在ブロックを再生するために、前記予測ブロックを前記残差データと組み合わせることとを備える、Ｃ１に記載の方法。
［Ｃ１０］
ビデオデータを復号するためのデバイスであって、
ビデオデータを記憶するように構成されたメモリと、
回路中に実装されたプロセッサとを備え、前記プロセッサは、
前記ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される前記残差ブロックに基づいて前記残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記残差ブロックが前記区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、
前記区分ツリータイプに従って前記複数の残差サブブロックに区分される前記残差ブロックに少なくとも部分的に基づいて前記現在ブロックの残差データを生成することと、
前記残差データを使用して前記現在ブロックを復号することとを行うように構成された、デバイス。
［Ｃ１１］
前記区分ツリータイプを示す情報を受信するように構成された前記プロセッサが、ツリータイプのセットへのインデックス情報を受信するようにさらに構成され、
前記プロセッサが、前記受信されたインデックス情報に基づいて前記区分ツリータイプを決定するようにさらに構成された、Ｃ１０に記載のデバイス。
［Ｃ１２］
ツリータイプの前記セットが、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、Ｃ１１に記載のデバイス。
［Ｃ１３］
前記区分ツリータイプを決定するように構成された前記プロセッサが、前記区分ツリータイプがバイナリツリー区分であると決定するようにさらに構成され、
前記プロセッサは、前記残差ブロックが水平に分割されるか垂直に分割されるかを示す情報を受信するようにさらに構成された、Ｃ１１に記載のデバイス。
［Ｃ１４］
前記プロセッサが、
前記残差ブロックの前記区分ツリータイプまたは前記残差ブロックの区分タイプのうちの１つに少なくとも部分的に基づいて水平方向または垂直方向のうちの少なくとも１つにおいて前記複数の残差サブブロックの変換カーネルを前記ビットストリームから推論するようにさらに構成され、ここにおいて、
前記現在ブロックの前記残差データを生成するように構成された前記プロセッサが、前記複数の残差サブブロックの前記変換カーネルに少なくとも部分的に基づいて前記残差データを生成するようにさらに構成された、Ｃ１０に記載のデバイス。
［Ｃ１５］
前記現在ブロックが、インター予測またはイントラ予測される、Ｃ１０に記載のデバイス。
［Ｃ１６］
前記現在ブロックが、コーディングユニット（ＣＵ）のルーマブロックを備える、Ｃ１０に記載のデバイス。
［Ｃ１７］
前記現在ブロックが、コーディングユニット（ＣＵ）または前記ＣＵのブロックであり、
前記現在ブロックの前記残差ブロックが、変換ユニット（ＴＵ）または前記ＴＵのブロックであり、
前記複数の残差サブブロックが、非正方形サブＴＵであり、前記ＣＵとは異なるサイズのものである、Ｃ１０に記載のデバイス。
［Ｃ１８］
前記現在ブロックを復号するように構成された前記プロセッサが、
前記現在ブロックの予測モードを表すデータを復号することと、
前記予測モードを使用して前記現在ブロックの前記予測ブロックを生成することと、
前記現在ブロックを再生するために、前記予測ブロックを前記残差データと組み合わせることとを行うようにさらに構成された、Ｃ１０に記載のデバイス。
［Ｃ１９］
前記復号された現在ブロックを表示するように構成されたディスプレイをさらに備える、Ｃ１０に記載のデバイス。
［Ｃ２０］
カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、Ｃ１０に記載のデバイス。
［Ｃ２１］
集積回路、
マイクロプロセッサ、または
ワイヤレス通信デバイスのうちの少なくとも１つを備える、Ｃ１０に記載のデバイス。
［Ｃ２２］
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、プロセッサに、
ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される前記残差ブロックに基づいて前記残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記残差ブロックが前記区分ツリータイプに従って区分される複数の残差サブブロックを決定することと、
前記区分ツリータイプに従って前記複数の残差サブブロックに区分される前記残差ブロックに少なくとも部分的に基づいて前記現在ブロックの残差データを生成することと、
前記残差データを使用して前記現在ブロックを復号することとを行わせる、コンピュータ可読記憶媒体。
［Ｃ２３］
ビデオデータを復号するためのデバイスであって、
前記ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、区分される前記残差ブロックに基づいて前記残差ブロックの区分ツリータイプを示す情報とを受信するための手段と、ここにおいて、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記残差ブロックが前記区分ツリータイプに従って区分される複数の残差サブブロックを決定するための手段と、
前記区分ツリータイプに従って前記複数の残差サブブロックに区分される前記残差ブロックに少なくとも部分的に基づいて前記現在ブロックの残差データを生成するための手段と、
前記残差データを使用して前記現在ブロックを復号するための手段とを備える、デバイス。
［Ｃ２４］
ビデオデータを符号化する方法であって、
ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定することと、
前記残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される前記残差ブロックの前記区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することとを備える、方法。
［Ｃ２５］
前記残差ブロックの前記区分ツリータイプを示す前記情報をシグナリングする前記ビットストリームが、ツリータイプのセットへのインデックス情報を含む、Ｃ２４に記載の方法。
［Ｃ２６］
ツリータイプの前記セットが、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、Ｃ２５に記載の方法。
［Ｃ２７］
前記残差ブロックの前記区分ツリータイプを示す前記情報が、前記区分ツリータイプが前記バイナリツリー区分であることを示すとき、前記ビットストリームは、前記残差ブロックが水平に分割されるか垂直に分割されるかを示す情報をさらにシグナリングする、Ｃ２５に記載の方法。
［Ｃ２８］
現在ブロックが、コーディングユニット（ＣＵ）または前記ＣＵのブロックであり、
前記現在ブロックの前記残差ブロックが、変換ユニット（ＴＵ）または前記ＴＵのブロックであり、
前記複数の残差サブブロックが、非正方形サブＴＵであり、前記ＣＵとは異なるサイズのものである、Ｃ２４に記載の方法。
［Ｃ２９］
ビデオデータを符号化するためのデバイスであって、
ビデオデータを記憶するように構成されたメモリと、
回路中に実装されたプロセッサとを備え、前記プロセッサは、
ビデオデータの現在ブロックの残差ブロックが区分ツリータイプに従って複数の残差サブブロックに区分されると決定することと、
前記残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される前記残差ブロックの前記区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することとを行うように構成された、デバイス。
［Ｃ３０］
前記残差ブロックの前記区分ツリータイプを示す前記情報をシグナリングする前記ビットストリームが、ツリータイプのセットへのインデックス情報を含む、Ｃ２９に記載のデバイス。
［Ｃ３１］
ツリータイプの前記セットが、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、Ｃ３０に記載のデバイス。
［Ｃ３２］
前記ビットストリームが、前記残差ブロックの前記区分ツリータイプが前記バイナリツリー区分であることをシグナリングするとき、前記ビットストリームは、前記残差ブロックが水平に分割されるか垂直に分割されるかを示す前記残差ブロックの区分タイプをさらにシグナリングする、Ｃ３１に記載のデバイス。
［Ｃ３３］
現在ブロックが、コーディングユニット（ＣＵ）または前記ＣＵのブロックであり、
前記現在ブロックの前記残差ブロックが、変換ユニット（ＴＵ）または前記ＴＵのブロックであり、
前記複数の残差サブブロックが、非正方形サブＴＵであり、前記ＣＵとは異なるサイズのものである、Ｃ２９に記載のデバイス。
［Ｃ３４］
前記ビデオデータをキャプチャするように構成されたカメラをさらに備える、Ｃ２９に記載のデバイス。
［Ｃ３５］
カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、Ｃ２９に記載のデバイス。
［Ｃ３６］
集積回路、
マイクロプロセッサ、または
ワイヤレス通信デバイスのうちの少なくとも１つを備える、Ｃ２９に記載のデバイス。

Claims

ビデオデータを復号する方法であって、
前記ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、前記残差ブロックが区分されることに基づく前記残差ブロックの区分ツリータイプを示す情報とを受信することと、ここにおいて、前記区分ツリータイプを示す情報が、前記残差ブロックのみに関連付けられ、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記区分ツリータイプに従った前記残差ブロックの複数の残差サブブロックへの区分を決定することと、
前記残差ブロックの前記複数の残差サブブロックへの前記決定された区分に基づいて、かつ、前記残差ブロックについて、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを明確に示すシンタックス要素を前記ビットストリーム中で受信することなく、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを推論することと、
前記残差ブロックが前記区分ツリータイプに従って前記複数の残差サブブロックに区分されること、および前記推論された変換カーネルを使用すること、に少なくとも一部基づいて、前記現在ブロックの残差データを生成することと、
前記残差データを使用して前記現在ブロックを復号することと、
を備える、方法。
前記区分ツリータイプを示す前記情報を受信することが、ツリータイプのセットへのインデックス情報を受信することを備え、前記方法が、前記受信されたインデックス情報に基づいて前記区分ツリータイプを決定することをさらに備える、請求項１に記載の方法。
ツリータイプの前記セットが、クワッドツリー区分およびバイナリツリー区分のうちの１つまたは複数を含む、請求項２に記載の方法。
前記区分ツリータイプを決定することが、前記区分ツリータイプがバイナリツリー区分であると決定することを備え、前記方法は、前記残差ブロックが水平に分割されるか垂直に分割されるかを示す情報を受信することをさらに備える、請求項２に記載の方法。
前記現在ブロックが、インター予測またはイントラ予測される、請求項１に記載の方法。
前記現在ブロックが、コーディングユニット（ＣＵ）のルーマブロックを備える、請求項１に記載の方法。
前記現在ブロックが、コーディングユニット（ＣＵ）または前記ＣＵのブロックであり、
前記現在ブロックの前記残差ブロックが、変換ユニット（ＴＵ）または前記ＴＵのブロックであり、
前記複数の残差サブブロックが、非正方形サブＴＵであり、前記ＣＵとは異なるサイズのものである、請求項１に記載の方法。
前記現在ブロックを復号することが、
前記現在ブロックの予測モードを表すデータを復号することと、
前記予測モードを使用して前記現在ブロックの前記予測ブロックを生成することと、
前記現在ブロックを再生するために、前記予測ブロックを前記残差データと組み合わせることとを備える、請求項１に記載の方法。
ビデオデータを復号するためのデバイスであって、
前記ビデオデータの符号化表現を備えるビットストリーム中で、残差ブロックが区分されるかどうかを示す情報と、前記残差ブロックが区分されることに基づく前記残差ブロックの区分ツリータイプを示す情報とを受信するための手段と、ここにおいて、前記区分ツリータイプを示す情報が、前記残差ブロックのみに関連付けられ、前記残差ブロックが、現在ブロックと予測ブロックとの間の差分を示す、
前記残差ブロックが区分されるという前記受信された情報と、前記残差ブロックの前記区分ツリータイプとに基づいて、前記区分ツリータイプに従った前記残差ブロックの複数の残差サブブロックへの区分を決定するための手段と、
前記残差ブロックの前記複数の残差サブブロックへの前記決定された区分に基づいて、かつ、前記残差ブロックについて、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを明確に示すシンタックス要を前記ビットストリーム中で受信することなく、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを推論するための手段と、
前記残差ブロックが前記区分ツリータイプに従って前記複数の残差サブブロックに区分されること、および前記推論された変換カーネルを使用すること、に少なくとも一部基づいて、前記現在ブロックの残差データを生成するための手段と、
前記残差データを使用して前記現在ブロックを復号するための手段と、
を備える、デバイス。
請求項２乃至８のいずれか一項に記載の前記方法を実行するための手段をさらに備える、請求項９に記載のデバイス。
前記復号された現在ブロックを表示するように構成されたディスプレイをさらに備える、請求項１０に記載のデバイス。
前記デバイスは、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、請求項１０に記載のデバイス。
集積回路、
マイクロプロセッサ、または
ワイヤレス通信デバイスのうちの少なくとも１つを備える、請求項１０に記載のデバイス。
ビデオデータを符号化する方法であって、
区分ツリータイプに従って、ビデオデータの現在ブロックの残差ブロックを複数の残差サブブロックに区分することと、
前記残差ブロックの前記複数の残差サブブロックへの前記区分に基づいて、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを決定することと、
前記残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される前記残差ブロックの前記区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することと、
を備え、
前記区分ツリータイプを示す前記情報が、前記残差ブロックのみに関連付けられ、前記ビットストリームが、前記複数の残差サブブロックの前記変換タイプのためのシグナリングされるインデックスなしで符号化される、方法。
ビデオデータを符号化するためのデバイスであって、
ビデオデータを記憶するように構成されたメモリと、
回路中に実装されたプロセッサと、を備え、前記プロセッサは、
区分ツリータイプに従って、ビデオデータの現在ブロックの残差ブロックを複数の残差サブブロックに区分することと、
前記残差ブロックの前記複数の残差サブブロックへの前記区分に基づいて、水平方向または垂直方向のうちの少なくとも１つにおける前記複数の残差サブブロックのための変換カーネルの変換タイプを決定することと、
前記残差ブロックが区分されるかどうかを示す情報をシグナリングし、区分される前記残差ブロックの前記区分ツリータイプを示す情報をさらにシグナリングするビデオデータの符号化表現としてビットストリームを符号化することと、を行うように構成され、
前記区分ツリータイプを示す前記情報が、前記残差ブロックのみに関連付けられ、前記ビットストリームが、前記複数の残差サブブロックの前記変換タイプのためのシグナリングされるインデックスなしで符号化される、デバイス。