JP7204891B2

JP7204891B2 - ピクチャパーティショニング方法及び機器

Info

Publication number: JP7204891B2
Application number: JP2021510741A
Authority: JP
Inventors: ジャオ，イン; ヤン，ハイタオ; チェン，ジェンレェ; ジャン，リエン
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-08-28
Filing date: 2019-08-28
Publication date: 2023-01-16
Anticipated expiration: 2039-08-28
Also published as: PH12021550378A1; CL2021000494A1; IL281144A; BR112021003269A2; MX2024009253A; US20230370597A1; AU2023229600A1; NZ773632A; KR102631517B1; KR20210046723A; JP2021536689A; JP7528188B2; US20220329795A1; EP3836542A1; AU2019333452A1; PT3836542T; UA128232C2; EP3836542A4; ZA202101354B; US20210185316A1

Description

本願は、ビデオ符号化の分野に、より正確には、ピクチャパーティショニング（picture partition）方法及び機器に関する。

インターネット技術が急速に発展し、人々の物質的及び精神的文化が益々豊かになるにつれ、インターネット上のビデオ、特に高解像度ビデオのアプリケーションに対する要求が増大している。しかしながら、高解像度ビデオは、非常に大量のデータを有する。限られた帯域幅を有するインターネット上で高解像度ビデオを送信するために、先ず解決される必要のある問題は、ビデオの符号化及び復号である。ビデオ符号化は、広範囲のデジタルビデオアプリケーション、例えば、放送用デジタルテレビ、インターネット及び移動体ネットワークを介するビデオ送信、ビデオチャット及びビデオ会議のようなリアルタイム会話アプリケーション、ＤＶＤ及びＢｌｕｅ－ｒａｙディスク、ビデオコンテンツ取得及び編集システム、及びカムコーダのセキュリティアプリケーションで使用される。

ビデオシーケンスの各ピクチャは、通常、重なり合わないブロックのセットにパーティショニングされ、符号化は、通常、ブロックレベルで実行される。例えば、予測ブロックは、空間（イントラピクチャ）予測及び／又は時間（インターピクチャ）予測を通じて生成される。相応して、予測モードは、イントラ予測モード（空間予測）及びインター予測モード（時間予測）を含んでよい。イントラ予測モードセットは、３５個の異なるイントラ予測モード、例えばＤＣ（又は平均）モード及び平面モードのような無指向性モード、又はＨ．２６５で定義される指向性モードを含んでよく、又は６７個の異なるイントラ予測モード、例えばＤＣ（又は平均）モード及び平面モードのような無指向性モード、又は策定中のＨ．２６６で定義される指向性モードを含んでよい。インター予測モードのセットは、利用可能な参照ピクチャ、及び、例えば参照ピクチャ全体が使用されるか又は参照ピクチャの一部のみが使用されるかに依存する別のインター予測パラメータに依存する。

既存のビデオは、概して、カラービデオであり、ルマ成分に加えてクロマ成分を含む。従って、ルマ成分を符号化及び復号することに加えて、クロマ成分も符号化及び復号される必要がある。しかしながら、符号化及び復号効率は、従来の技術では比較的低い。

本願（又は本開示）の実施形態は、ピクチャパーティショニング機器及び方法を提供する。

第１の態様によると、本発明の実施形態は、ピクチャパーティショニング方法に関する。当該方法は、ビデオストリーム復号又は符号化機器により実行される。当該方法は、現在ノードの分割モードを決定するステップであって、前記現在ノードはルマブロック及びクロマブロックを含む、ステップと、前記現在ノードの前記分割モード及び前記現在ノードのサイズに基づき、前記現在ノードの前記クロマブロックが更に分割されないことを決定するステップと、前記現在ノードの前記クロマブロックが更に分割されないとき、前記現在ノードの前記分割モードに基づき、前記現在ノードの前記ルマブロックを分割するステップと、を含む。

第１の態様における方法によると、前記現在ノードの前記クロマブロックが更に分割されないとき、前記現在ノードの前記ルマブロックのみが分割でき、それにより、符号化及び復号効率を向上し、コーデックの最大スループットを低減し、前記コーデックの実装を容易にする。

第２の態様によると、本発明の実施形態は、プロセッサとメモリとを含むビデオストリーム復号機器に関する。前記メモリは命令を格納し、前記命令は、前記プロセッサに第１の態様による方法を実行できるようにさせる。

第３の態様によると、本発明の実施形態は、プロセッサとメモリとを含むビデオストリーム符号化機器に関する。前記メモリは命令を格納し、前記命令は、前記プロセッサに第１の態様による方法を実行できるようにさせる。

第４の態様によると、コンピュータ可読記憶媒体が提案される。前記コンピュータ可読記憶媒体は、命令を格納し、前記命令が実行されると、１つ以上のプロセッサがビデオデータを符号化できるようにさせられる。前記命令は、前記１つ以上のプロセッサに、第１の態様の任意の可能な実施形態による方法を実行できるようにさせる。

第５の態様によると、本発明の実施形態は、プログラムコードを含むコンピュータプログラムに関する。前記プログラムコードがコンピュータ上で実行されると、第１の態様の任意の可能な実施形態による方法が実行される。

１つ以上の実施形態の詳細は、添付の図面及び以下の説明において説明される。他の特徴、目的、及び利点は、説明、図面、及び請求項から明らかになるだろう。

本願の実施形態における又は背景における技術的ソリューションを更に明確に説明するために、以下は、本願の実施形態又は背景を説明するための添付の図面を説明する。

本発明の実施形態を実施するビデオ符号化システムの例のブロック図である。

図２のエンコーダ２０及び図３のデコーダ３０のうちの一方又は両方を含むビデオ符号化システムの例のブロック図である。

本発明の実施形態を実施するビデオエンコーダの例示的な構造を示すブロック図である。

本発明の実施形態を実施するビデオデコーダの例示的な構造を示すブロック図である。

符号化機器又は復号機器の例を示すブロック図である。

別の符号化機器又は別の復号機器の例を示すブロック図である。

ＹＵＶ形式のサンプルグリッドの例を示す。

５個の異なる分割タイプを示す。５個の異なる分割タイプを示す。５個の異なる分割タイプを示す。５個の異なる分割タイプを示す。５個の異なる分割タイプを示す。

４分木及び２分木分割モードを示す。

本発明の実施形態１による方法のフローチャートである。

本発明の実施形態１のステップ９０６のフローチャートである。

本発明の実施形態３による方法のフローチャートを示す。

以下では、特に断りのない限り、同一の参照符号は同一の又は少なくとも機能的に等価な特徴を表す。

ビデオ符号化は、通常、ビデオ又はビデオシーケンスを形成する、ピクチャのシーケンスの処理を表す。用語「ピクチャ（picture）」、「フレーム（frame）」及び「画像（image）」は、ビデオ符号化の分野では同義語として使用され得る。本願（又は本開示）で使用されるビデオ符号化は、ビデオ符号化又はビデオ復号を示す。ビデオ符号化は、ソース側で実行され、例えば、生ビデオピクチャを処理することにより（例えば、圧縮により）、より効率的な記憶及び／又は送信のために、ビデオピクチャを表現するために必要なデータ量を削減する。ビデオ復号は、宛先側で実行され、通常、エンコーダと比べたとき逆の処理を含み、ビデオピクチャを再構成する。実施形態におけるビデオピクチャの「符号化」は、ビデオシーケンスの「符号化」又は「復号」として理解されるべきである。符号化コンポーネント及び復号コンポーネントの結合は、コーデック（符号化及び復号）とも呼ばれる。

ビデオシーケンスの各ピクチャは、通常、重なり合わないブロックのセットにパーティショニングされ、符号化は、通常、ブロックレベルで実行される。言い換えると、エンコーダ側で、ビデオは、通常、ブロック（ピクチャブロック又はビデオブロックとも呼ばれる）レベルで、例えば空間（イントラピクチャ）予測及び／又は時間（インターピクチャ）予測を使用して予測ブロックを生成し、予測ブロックを現在ブロック（現在処理されている／処理されるべきブロック）から減算して残差ブロックを取得し、残差ブロックを変換し及び残差ブロックを変換ドメインにおいて量子化して送信されるべきデータ量を削減することにより、処理され、つまり符号化される（圧縮される）。デコーダ側では、エンコーダと比べて逆の処理が、符号化又は圧縮されたブロックに適用されて、提示のために現在ブロックを再構成する。更に、エンコーダは、デコーダ処理ループを複製し、その結果、エンコーダ及びデコーダは、後続ブロックを処理する、つまり符号化するために、同一の予測（例えば、イントラ予測及びインター予測）及び／又は再構成を生成する。

用語「ブロック」はピクチャ又はフレームの一部であってよい。主要な用語は、本願において以下の通り定義される。

現在ブロックは、処理中のブロックである。例えば、符号化では、現在ブロックは、現在符号化中のブロックであり、復号では、現在ブロックは、復号中のブロックである。現在処理されているブロックがクロマ成分ブロックである場合、現在処理されているブロックは現在クロマブロックと呼ばれる。現在クロマブロックに対応するルマブロックは、現在ルマブロックと呼ばれてよい。

ＣＴＵは、符号化木単位（coding tree unit）の略語である。ピクチャは複数のＣＴＵを含み、１つのＣＴＵは、通常、１つの正方形ピクチャ領域に対応し、ピクチャ領域内にルマサンプル及びクロマサンプルを含む（又はルマサンプルのみを含んでよく、又はクロマサンプルのみを含んでよい）。ＣＴＵは、シンタックス要素を更に含む。これらのシンタックス要素は、どのように、ＣＴＵを少なくとも１つの符号化単位（coding unit, CU）に分割するか、及び各符号化単位を復号して再構成ピクチャを取得するかについての方法を示す。

ＣＵは、符号化単位の略語である。ＣＵは、通常、Ａ×Ｂ長方形領域に対応し、Ａ×Ｂ個のルマサンプル及びルマサンプルに対応するクロマサンプルを含む。ここで、Ａは長方形の幅であり、Ｂは長方形の高さであり、ＡはＢと同じ又は異なってよい。Ａ及びＢの値は、通常、２の整数乗、例えば、２５６、１２８、６４、３２、１６、８、及び４である。符号化単位は、Ａ×Ｂ長方形領域の再構成ピクチャを取得するために、復号処理を通じて復号されてよい。復号処理は、通常、予測、逆量子化、及び逆変換のような処理を実行することを含み、予測ピクチャ及び残差を生成する。再構成ピクチャは、予測ピクチャ及び残差を重畳することにより取得される。

以下はエンコーダ２０、デコーダ３０及び符号化システム１０の実施形態を、図１A～図３に基づき説明する。

図１Aは、本願（本開示）の技術を利用し得る符号化システム１０、例えばビデオ符号化システム１０の例を示す概念的又は概略的ブロック図である。ビデオ符号化システム１０のエンコーダ２０（例えば、ビデオエンコーダ２０）及びデコーダ３０（例えば、ビデオデコーダ３０）は、本願で説明される種々の例に従うイントラ予測を実行するよう構成され得る装置の例を表す。図１Ａに示すように、符号化システム１０は、符号化データ１３、例えば符号化ピクチャ１３を、符号化データ１３を復号する宛先装置１４に提供するよう構成されるソース装置１２を含む。

ソース装置１２は、エンコーダ２０を含み、追加で又は任意的に、ピクチャソース１６、前処理ユニット１８、例えばピクチャ前処理ユニット１８、及び通信インタフェース又は通信ユニット２２を含んでよい。

ピクチャソース１６は、例えば現実のピクチャをキャプチャする任意のタイプのピクチャキャプチャ装置、及び／又はピクチャピクチャ若しくはコメント（スクリーンコンテンツ符号化では、スクリーン上の何らかのテキストも符号化されるべきピクチャ又は画像の一部と考えられる）を生成する任意のタイプの装置、例えばコンピュータアニメーションピクチャを生成するコンプータグラフィックプロセッサ、又は、現実のピクチャ、コンピュータアニメーションピクチャ（例えば、スクリーンコンテンツ、又は仮想現実（virtual reality, VR）ピクチャ）及び／又はそれらの任意の組み合わせ（例えば、拡張現実（augmented reality, AR）ピクチャ）を取得し及び／又は提供する任意のタイプの他の装置、を含んでよく又はそれであってよい。

ピクチャは、ルマ値を有するサンプルの２次元配列又は行列と考えることができる。配列の中のサンプルは、ピクセル(pixel）（ピクチャ要素（picture element）の短縮形）又はペル（pel）とも呼ばれてよい。配列又はピクチャの水平及び垂直方向（又は軸）にあるサンプルの数は、ピクチャのサイズ及び／又は解像度を定める。色の表現のために、通常、３つの色成分が利用される。具体的に言うと、ピクチャは、３つのサンプル配列として表現され又はそれを含んでよい。ＲＢＧ形式又は色空間では、ピクチャは、対応する赤、緑、及び青色サンプル配列を含む。しかしながら、ビデオ符号化では、各ピクセルは、通常、ルマ／クロマ形式又は色空間で表現される。例えば、ＹＣｂＣｒは、Ｙ（時に、Ｌが代わりに使用される）により示されるルマ成分、及びＣｂ及びＣｒにより示される２つのクロマ成分、を含む。輝度（略してｌｕｍａ）成分Ｙは、明るさ又はグレーレベル強度（例えば、グレイスケールピクチャにおけるような）を表現する。一方で、２つの色度（略してｃｈｒｏｍａ）成分Ｃｂ及びＣｒは、色度又は色情報成分を表現する。したがって、ＹＣｂＣｒ形式のピクチャは、ルマサンプル値（Ｙ）のルマサンプル配列と、クロマ値（Ｃｂ及びＣｒ）の２つのクロマサンプル配列とを含む。ＲＧＢ形式のピクチャは、ＹＣｂＣｒ形式に転換され又は変換されてよく、逆も同様であり、処理は色転換又は変換としても知られる。ピクチャが単色である場合、ピクチャは、ルマサンプル配列のみを含んでよい。

ピクチャソース１６（例えば、ビデオソース１６）は、例えばピクチャをキャプチャするカメラ、前にキャプチャした若しくは生成したピクチャを含む若しくは格納するピクチャメモリのようなメモリ、及び／又はピクチャを取得し若しくは受信するための任意の種類の（内部又は外部）インタフェースであってよい。カメラは、例えば、ソース装置に統合されたローカルカメラ又は内蔵カメラであってよい。メモリは、例えばソース装置に統合されたローカルメモリ又は内蔵メモリであってよい。インタフェースは、例えば、外部ビデオソースからピクチャを受信する外部インタフェースであってよい。外部ビデオソースは、例えば、カメラ、外部メモリ、又は外部ピクチャ生成装置のような、外部ピクチャキャプチャ装置である。外部ピクチャ生成装置は、例えば、外部コンピュータグラフィックプロセッサ、コンピュータ又はサーバである。インタフェースは、任意の独自又は標準化インタフェースプロトコルに従い、任意のタイプのインタフェース、例えば有線若しくは無線インタフェース、又は光インタフェースであってよい。ピクチャデータ１７を取得するインタフェースは、通信インタフェース２２と同じインタフェースであってよく、又は通信インタフェース２２の一部であってよい。

前処理ユニット１８及び前処理ユニット１８により実行される処理と対照的に、ピクチャ又はピクチャデータ１７（例えばビデオデータ１６）は、生ピクチャ又は生ピクチャデータ１７とも呼ばれてよい。

前処理ユニット１８は、（生）ピクチャデータ１７を受信し、ピクチャデータ１７を前処理して、前処理済みピクチャ１９又は前処理済みピクチャデータ１９を取得するよう構成される。例えば、前処理ユニット１８により実行される前処理は、トリミング、色形式変換（例えば、ＲＧＢからＹＣｂＣｒへの変換）、色調整、及びノイズ除去を含んでよい。前処理ユニット１８は光コンポーネントであってよいことが理解され得る。

エンコーダ２０（例えばビデオエンコーダ２０）は、前処理済みピクチャデータ１９を受信し、符号化ピクチャデータ２１を提供するよう構成される（詳細は、例えば図２又は図４に基づき更に後述される）。一例では、エンコーダ２０は、実施形態１～３を実施するよう構成されてよい。

ソース装置１２の通信インタフェース２２は、符号化ピクチャデータ２１を受信し、符号化ピクチャデータ２１を別の装置、例えば宛先装置１４若しくは任意の他の装置へと、記憶又は直接再構成のために送信するよう構成されてよく、又は、相応して符号化データ１３を格納する及び／又は符号化データ１３を別の装置へ送信する前に、符号化ピクチャデータ２１を処理するよう構成されてよい。ここで、別の装置は、例えば、宛先装置１４又は復号又は記憶のための任意の他の装置である。

宛先装置１４は、デコーダ３０（例えば、ビデオデコーダ３０）を含み、追加で、つまり任意的に、通信インタフェース又は通信ユニット２８、後処理ユニット３２、及びディスプレイ装置３４を含んでよい。

宛先装置１４の通信インタフェース２８は、符号化ピクチャデータ２１又は符号化データ１３を、例えばソース装置１２から又は任意の他のソースから直接受信するよう構成される。任意の他のソースは、例えば、符号化ピクチャデータ記憶装置のような記憶装置である。

通信インタフェース２２及び通信インタフェース２８は、符号化ピクチャデータ２１又は符号化データ１３を、ソース装置１２と宛先装置１４との間の直接通信リンクを介して、又は任意のタイプのネットワークを介して、送信又は受信するよう構成されてよい。直接通信リンクは、例えば、直接有線又は無線接続であり、任意のタイプのネットワークは、例えば、有線又は無線ネットワーク又はそれらの任意の組合せ、又は任意のタイプの私設若しくは公衆ネットワーク又はそれらの任意の組合せである。

通信インタフェース２２は、通信リンク又は通信ネットワークを介して送信するために、例えば、符号化ピクチャデータ２１を適切な形式、例えばパケットにパッケージするよう構成されてよい。

通信インタフェース２２の相手方を形成する通信インタフェース２８は、例えば、符号化データ１３をパッケージ解除して符号化ピクチャデータ２１を取得するよう構成されてよい。

通信インタフェース２２及び通信インタフェース２８の両者は、図１Ａのソース装置１２から宛先装置１４への符号化データ１３の矢印により示されるように、単方向通信インタフェースとして構成されてよく、又は、双方向通信インタフェースとして構成されてよく、例えば接続を確立するため、肯定応答し及び通信リンク及び／又は符号化ピクチャデータ伝送のようなデータ送信に関連する任意の他の情報を交換するために、メッセージを送信し及び受信するよう構成されてよい。

デコーダ３０は、符号化ピクチャデータ２１を受信し、復号ピクチャデータ３１又は復号ピクチャ３１を提供するよう構成される（詳細は、例えば図３又は図５に基づき更に後述される）。一例では、デコーダ３０は、実施形態１～３を実施するよう構成されてよい。

宛先装置１４の後プロセッサ３２は、復号ピクチャデータ３１（再構成ピクチャデータとも呼ばれる）、例えば復号ピクチャ１３１を後処理して、後処理ピクチャ３３のような後処理ピクチャデータ３３を取得するよう構成される。後処理ユニット３２により実行される後処理は、例えば色形式変換（例えば、ＹＣｂＣｒからＲＧＢへの変換）、色補正、トリミング、又は再サンプリング、又は、例えば復号ピクチャデータ３１をディスプレイ装置３４による表示のために準備するための任意の他の処理、を含んでよい。

宛先装置１４のディスプレイ装置３４は、ユーザ、ビューア、等にピクチャを表示するために、後処理ピクチャデータ３３を受信するよう構成される。ディスプレイ装置３４は、再構成ピクチャを提示する任意のタイプのディスプレイ、例えば内蔵又は外部ディスプレイ又はモニタであり又はそれを含んでよい。例えば、ディスプレイは、液晶ディスプレイ（liquid crystal display, LCD）、有機発光ダイオード（organic light emitting diode, OLED）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、シリコン上の液晶（liquid crystal on silicon, LCoS）、デジタル光プロセッサ（digital light processor, DLP）、又は任意のタイプの他のディスプレイ、を含んでよい。

図１Ａは、ソース装置１２及び宛先装置１４を別個の装置として示すが、装置の実施形態は、代替として、ソース装置１２及び宛先装置１４の両方、又はソース装置１２及び宛先装置１４の両方の機能、つまりソース装置１２又は対応する機能及び宛先装置１４又は対応する機能を含んでよい。このような実施形態では、ソース装置１２又は対応する機能及び宛先装置１４又は対応する機能は、同じハードウェア及び／又はソフトウェア、別個のハードウェア及び／又はソフトウェア又はそれらの任意の組み合わせを用いて実装されてよい。

説明に基づき当業者に明らかなように、図１Aに示されるソース装置１２及び／又は宛先装置１４内の異なるユニットの機能又は機能の（正確な）分割は、実際の装置及び用途に依存して変化してよい。

エンコーダ２０（例えば、ビデオエンコーダ２０）及びデコーダ３０（例えば、ビデオデコーダ３０）は、種々の適正な回路、例えば、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（digital signal processor, DSP）、特定用途向け集積回路（application－specific integrated circuit, ASIC）、フィールドプログラマブルゲートアレイ（field－programmable gate array, FPGA）、個別ロジック、ハードウェア、又はそれらの任意の組合せ、のうちの任意の１つとして実装されてよい。技術が部分的にソフトウェアを使用して実装される場合、装置は、適正な非一時的コンピュータ可読記憶媒体にソフトウェア命令を格納してよく、該命令を１つ以上のプロセッサのようなハードウェアを用いて実行して、本開示の技術を実行してよい。前述の内容のいずれか（ハードウェア、ソフトウェア、ハードウェアとソフトウェアとの組み合わせ、等を含む）は、１つ以上のプロセッサとして考えられてよい。ビデオエンコーダ２０及びビデオデコーダ３０は、それぞれ、１つ以上のエンコーダ又はデコーダに含まれてよく、エンコーダ又はデコーダのいずれかは、対応する機器の中の結合されたエンコーダ／デコーダ（codec）の部分に統合されてよい。

ソース装置１２は、ビデオ符号化装置又はビデオ符号化機器と呼ばれてよい。宛先装置１４は、ビデオ復号装置又はビデオ復号機器と呼ばれてよい。ソース装置１２及び宛先装置１４は、ビデオ符号化装置又はビデオ符号化機器の例であってよい。

ソース装置１２及び宛先装置１４は、任意のタイプのハンドヘルド又は固定装置、例えばノートブック又はラップトップコンピュータ、移動電話機、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビジョン、ディスプレイ装置、デジタルメディアプレイヤ、ビデオゲーム端末、（コンテンツサービスサーバ、又はコンテンツ配信サーバのような）ビデオストリーミング装置、ブロードキャスト受信装置、又はブロードキャスト送信装置、を含む、広範な装置のうちのいずれかを含んでよく、任意のタイプのオペレーティングシステムを使用してよく又は使用しなくてよい。

幾つかの場合には、ソース装置１２及び宛先装置１４は、無線通信のために装備されてよい。従って、ソース装置１２及び宛先装置１４は、無線通信装置であってよい。

幾つかの場合には、図１Ａに示されるビデオ符号化システム１０は単に例であり、本願の技術は、必ずしも符号化装置と復号装置との間の任意のデータ通信を含まないビデオ符号化設定（例えば、ビデオ符号化又はビデオ復号）に適用可能である。別の例では、データはローカルメモリから読み出される、ネットワークを介してストリーミングされる、等であってよい。ビデオ符号化装置は、データを符号化し、データをメモリに格納してよく、及び／又はビデオ復号装置は、メモリからデータを読み出し、データを復号してよい。幾つかの例では、符号化及び復号は、互いに通信しないが単にデータをメモリへと符号化し及び／又はメモリからデータを読み出しデータを復号する装置により実行される。

理解されるべきことに、ビデオエンコーダ２０を参照して説明した上述の例の各々について、ビデオデコーダ３０は、逆の処理を実行するよう構成されてよい。シグナリングシンタックス要素に関して、ビデオデコーダ３０は、これらのシンタックス要素を受信しパースし、相応して関連するビデオデータを復号するよう構成できる。幾つかの例では、ビデオエンコーダ２０は、シンタックス要素を符号化ビデオビットストリームへとエントロピー符号化してよい。これらの例では、ビデオデコーダ３０は、これらのシンタックス要素をパースし、相応して関連付けられたビデオデータを復号してよい。

図１Ｂは、例示的な実施形態による、図２のエンコーダ２０及び／又は図３のデコーダ３０を含むビデオ符号化システム４０の例の説明図である。システム４０は、本願の種々の技術の組合せを実施できる。図示の実装では、ビデオ符号化システム４０は、画像装置４１、ビデオエンコーダ２０、ビデオデコーダ３０（及び／又は処理ユニット４６の論理回路４７により実装されるビデオエンコーダ／デコーダ）、アンテナ４２、１つ以上のプロセッサ４３、１つ以上のメモリ４４、及び／又はディスプレイ装置４５を含んでよい。

図に示されるように、画像装置４１、アンテナ４２、処理ユニット４６、論理回路４７、ビデオエンコーダ２０、ビデオデコーダ３０、プロセッサ４３、メモリ４４、及び／又はディスプレイ装置４５は、互いに通信できる。説明したように、ビデオ符号化システム４０はビデオエンコーダ２０及びビデオデコーダ３０を用いて図示されたが、別の異なる例では、ビデオ符号化システム４０は、ビデオエンコーダ２０のみ又はビデオデコーダ３０のみを含んでよい。

幾つかの例では、図に示されるように、ビデオ符号化システム４０は、アンテナ４２を含んでよい。例えば、アンテナ４２は、ビデオデータの符号化ビットストリームを送信又は受信するよう構成されてよい。更に、幾つかの例では、ビデオ符号化システム４０はディスプレイ装置４５を含んでよい。ディスプレイ装置４５は、ビデオデータを提示するよう構成されてよい。幾つかの例では、図に示されるように、論理回路４７は、処理ユニット４６により実装されてよい。処理ユニット４６は、特定用途向け集積回路（application－specific integrated circuit, ASIC）ロジック、グラフィックプロセッサ、汎用プロセッサ、等を含んでよい。ビデオ符号化システム４０は、任意的なプロセッサ４３も含んでよい。任意的なプロセッサ４３は、同様に、特定用途向け集積回路（application－specific integrated circuit, ASIC）ロジック、グラフィックプロセッサ、汎用プロセッサ、等を含んでよい。幾つかの例では、論理回路４７は、ハードウェア、例えばビデオ符号化専用ハードウェアにより実装されてよく、プロセッサ４３は、汎用ソフトウェア、オペレーティングシステム、等により実装されてよい。更に、メモリ４４は、任意のタイプのメモリ、例えば、揮発性メモリ（例えば、静的ランダムアクセスメモリ（Static Random Access Memory, SRAM）又は動的ランダムアクセスメモリ（Dynamic Random Access Memory, DRAM））又は不揮発性メモリ（例えば、フラッシュメモリ）であってよい。非限定的な例では、メモリ４４はキャッシュメモリにより実装されてよい。幾つかの例では、論理回路４７は、（例えば、ピクチャバッファの実装のために）メモリ４４にアクセスしてよい。他の例では、論理回路４７及び／又は処理ユニット４６は、ピクチャバッファ等の実装のためにメモリ（例えばキャッシュ）を含んでよい。

幾つかの例では、論理回路により実装されるビデオエンコーダ２０は、（例えば、処理ユニット４６又はメモリ４４により実装される）ピクチャバッファ、及び（例えば、処理ユニット４６により実装される）グラフィック処理ユニットを含んでよい。グラフィック処理ユニットは、ピクチャバッファに通信可能に接続されてよい。グラフィック処理ユニットは、図２を参照して説明された種々のモジュール及び／又は本明細書で説明される任意の他のエンコーダシステム若しくはサブシステムを実装するために、論理回路４７により実装されるビデオエンコーダ２０を含んでよい。論理回路は、本明細書で説明される種々の動作を実行するよう構成されてよい。

ビデオデコーダ３０は、図３のデコーダ３０に関して議論されるような種々のモジュール及び／又は本明細書で説明される任意の他のデコーダシステム若しくはサブシステムを実現するために、論理回路４７により実装されるのと同様の方法で実装されてよい。幾つかの例では、論理回路により実装されるビデオデコーダ３０は、（例えば、処理ユニット２８２０又はメモリ４４により実装される）ピクチャバッファ、及び（例えば、処理ユニット４６により実装される）グラフィック処理ユニットを含んでよい。グラフィック処理ユニットは、ピクチャバッファに通信可能に接続されてよい。グラフィック処理ユニットは、図３を参照して説明される種々のモジュール及び／又は本明細書で説明される任意の他のデコーダシステム若しくはサブシステムを実装するために、論理回路４７により実装されるビデオデコーダ３０を含んでよい。

幾つかの例では、ビデオ符号化システム４０のアンテナ４２は、ビデオデータの符号化ビットストリームを受信するよう構成されてよい。説明したように、符号化ビットストリームは、本明細書で説明されるビデオフレーム符号化に関連する、データ、指示子、インデックス値、モード選択データ、等、例えば、符号化パーティショニングに関連するデータ（例えば、変換係数又は量子化済み変換係数、（説明するような）任意的な指示子、及び／又は符号化パーティショニングを定めるデータ）を含んでよい。ビデオ符号化システム４０は、アンテナ４２に接続され符号化ビットストリームを復号するよう構成されるビデオデコーダ３０を更に含んでよい。ディスプレイ装置４５は、ビデオフレームを提示するよう構成される。

エンコーダ及び符号化方法

図２は、本願の（開示された）技術を実装するよう構成されるビデオエンコーダ２０の例の概略的／概念的ブロック図である。図２の例では、ビデオエンコーダ２０は、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループフィルタユニット２２０、復号ピクチャバッファ（decoded picture buffer, DPB）２３０、予測処理ユニット２６０、及びエントロピー符号化ユニット２７０を含む。予測処理ユニット２６０は、インター予測ユニット２４４、イントラ予測処理ユニット２５４、及びモード選択ユニット２６２を含んでよい。インター予測ユニット２４４は、動き推定ユニット及び動き補償ユニット（図示しない）を含んでよい。図２に示されるビデオエンコーダ２０は、ハイブリッドビデオエンコーダ又はハイブリッドビデオコーデックに基づくビデオエンコーダとも呼ばれてよい。

例えば、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、予測処理ユニット２６０、及びエントロピー符号化ユニット２７０は、エンコーダ２０の順方向信号経路を形成する。一方で、例えば、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループフィルタ２２０、復号ピクチャバッファ（decoded picture buffer, DPB）２３０、予測処理ユニット２６０は、エンコーダの逆方向信号経路を形成し、ビデオエンコーダの逆方向信号経路はデコーダの信号経路に対応する（図３のデコーダ３０を参照）。

エンコーダ２０は、例えば入力２０２を介して、ピクチャ２０１又はピクチャ２０１のブロック２０３、例えばビデオ又はビデオシーケンスを形成するピクチャのシーケンスの中のピクチャを受信する。（特に、ビデオ符号化では、現在ピクチャを他のピクチャ、例えば同じビデオシーケンス、つまり現在ピクチャも含むビデオシーケンスの中の前の符号化及び／又は復号ピクチャと区別するために、）ピクチャブロック２０３は、現在ピクチャブロック又は被符号化ピクチャブロックと呼ばれてもよく、及びピクチャ２０１は、現在ピクチャ又は被符号化ピクチャと呼ばれてよい。

パーティショニング

実施形態では、エンコーダ２０は、ピクチャ２０１をブロック２０３のような複数のブロックにパーティショニングするよう構成されるパーティショニングユニット（図２に示されない）を含んでよい。ピクチャ２０１は、通常、複数の重なり合わないブロックにパーティショニングされる。パーティショニング単位は、同じブロックサイズをビデオシーケンスの全部のピクチャ、及びブロックサイズを定める対応するグリッドに対して使用し、又はピクチャ又はピクチャのサブセット若しくはグループ間のブロックサイズを変更し、各ピクチャを対応するブロックにパーティショニングするよう構成されてよい。

一例では、ビデオエンコーダ２０の予測処理ユニット２６０は、上述のパーティショニング技術の任意の組み合わせを実行するよう構成されてよい。

ピクチャ２０１と同様に、ブロック２０３も、ルマ値（サンプル値）を有するサンプルの２次元配列又は行列と考えられ又は考えられてよいが、ブロック２０３のサイズはピクチャ２０１のサイズより小さい。言い換えると、ブロック２０３は、例えば１つのサンプル配列（例えば、単色ピクチャ２０１の場合には、ルマ配列）、３つのサンプル配列（例えば、カラーピクチャの場合には、１つのルマ配列及び２つのクロマ配列）、又は適用される色形式に依存して任意の他の数の及び／又はタイプの配列を含んでよい。ブロック２０３の水平及び垂直方向（又は軸）にあるサンプルの数は、ブロック２０３のサイズを定める。

図２に示すエンコーダ２０は、ブロック毎にピクチャ２０１を符号化するよう、例えば各ブロック２０３を符号化し及び予測するよう構成される。

残差計算

残差計算ユニット２０４は、残差ブロック２０５を、ピクチャブロック２０３及び予測ブロック２６５（予測ブロック２６５に関する詳細は以下に更に提供される）に基づき、例えば予測ブロック２６５のサンプル値をピクチャブロック２０３のサンプル値からサンプル毎に（ピクセル毎に）減算してサンプルドメインにおける残差ブロック２０５を取得することにより、計算するよう構成される。

変換

変換処理ユニット２０６は、変換、例えば離散コサイン変換（discrete cosine transform, DCT）又は離散サイン変換（discrete sine transform, DST）を残差ブロック２０５のサンプル値に対して適用して、変換ドメインにおける変換係数２０７を取得するよう構成される。変換係数２０７は、変換残差係数とも呼ばれ、変換ドメインにおける残差ブロック２０５を表してよい。

変換処理ユニット２０６は、ＨＥＶＣ／Ｈ．２６５で指定された変換のようなＤＣＴ／ＤＳＴの整数近似を適用するよう構成されてよい。直交ＤＣＴ変換と比べて、このような整数近似は、通常、特定の因子によりスケーリングされる。順方向及び逆変換を用いて処理される残差ブロックの水準を維持するために、追加スケーリング因子が変換処理の部分として適用される。スケーリング因子は、通常、幾つかの制約、例えば、スケーリング因子がシフト操作の２乗であること、変換係数のビット深さ、精度と実装コストとの間のトレードオフ、に基づき選択される。例えば、特定のスケーリング因子は、逆変換、例えばデコーダ３０の側にある逆変換処理ユニット２１２による逆変換（及び例えばエンコーダ２０の側にある逆変換処理ユニット２１２による対応する逆変換）のために指定され、相応して、対応するスケーリング因子は、エンコーダ２０の側にある変換処理ユニット２０６による順方向変換のために指定されてよい。

量子化

量子化ユニット２０８は、変換係数２０７を量子化して、例えばスカラー量子化又はベクトル量子化を適用することにより、量子化済み変換係数２０９を取得するよう構成される。量子化変換係数２０９は、量子化済み残差係数２０９とも呼ばれてよい。量子化処理は、変換係数２０７の一部又は全部に関連するビット深さを低減できる。例えば、ｎビットの変換係数は、量子化の間、ｍビットの変換係数に切り捨てられてよい。ここで、ｎはｍより大きい。量子化の程度は、量子化パラメータ（quantization parameter, QP）を調整することにより、変更されてよい。例えば、スカラー量子化では、より精細な又はより粗い量子化を達成するために異なるスケーリングが適用されてよい。量子化ステップサイズが小さいほど、精細な量子化に対応し、量子化ステップサイズが大きいほど、粗い量子化に対応する。適切な量子化ステップサイズは、量子化パラメータ（quantization parameter, QP）により示されてよい。例えば、量子化パラメータは、適切な量子化ステップサイズの所定のセットに対するインデックスであってよい。例えば、量子化パラメータが小さいほど、精細な量子化（小さな量子化ステップサイズ）に対応してよく、量子化パラメータが大きいほど、粗い量子化（大きな量子化ステップサイズ）に対応してよく、逆も同様である。量子化は、量子化ステップサイズによる除算、例えば逆量子化ユニット２１０により実行される対応する量子化又は逆量子化を含んでよく、又は、量子化ステップサイズによる乗算を含んでよい。ＨＥＶＣのような幾つかの標準に従う実施形態は、量子化ステップサイズを決定するために量子化パラメータを使用し得る。概して、量子化ステップサイズは、除算を含む式の不動点近似を用いて、量子化パラメータに基づき計算されてよい。量子化ステップサイズ及び量子化パラメータの式の不動点近似において使用されるスケーリングのために変更され得る残差ブロックの水準を復元するために、量子化及び逆量子化のための追加のスケーリング因子が導入されてよい。１つの例示的な実装では、逆変換及び逆量子化のスケーリングは結合されてよい。代替として、カスタマイズされた量子化テーブルが使用され、エンコーダからデコーダへ、例えばビットストリームの中でシグナリングされてよい。量子化は、損失動作であり、損失は量子化ステップサイズの増大に伴い増大する。

逆量子化ユニット２１０は、量子化ユニット２０８の逆量子化を量子化済み係数に適用して、逆量子化済み係数２１１を取得するよう、例えば、量子化ユニット２０８と同じ量子化ステップサイズに基づき又はそれを用いて、量子化ユニット２０８により適用された量子化方式の逆を適用するよう構成される。逆量子化済み係数２１１は、逆量子化残差係数２１１とも呼ばれ、変換係数２０７に対応してよいが、通常、量子化により引き起こされる損失のために変換係数と同一ではない。

逆変換処理ユニット２１２は、変換処理ユニット２０６により適用された変換の逆変換、例えば逆離散コサイン変換（discrete cosine transform, DCT）又は逆離散サイン変換（discrete sine transform, DST）を適用して、サンプルドメインにおける逆変換ブロック２１３を取得するよう構成される。逆変換ブロック２１３は、逆変換逆量子化済みブロック２１３又は逆変換残差ブロック２１３とも呼ばれてよい。

再構成ユニット２１４（例えば、加算器２１４）は、例えば再構成残差ブロック２１３のサンプル値と予測ブロック２６５のサンプル値とを加算することにより、逆変換ブロック２１３（つまり、再構成残差ブロック２１３）を予測ブロック２６５に加算して、サンプルドメインにおける再構成ブロック２１５を取得するよう構成される。

任意的に、例えばラインバッファ２１６のバッファユニット２１６（又は略して「バッファ」２１６）は、再構成ブロック２１５及び対応するサンプル値を、例えばイントラ予測のためにバッファリングし又は格納するよう構成される。他の実施形態では、エンコーダは、フィルタリングされていない再構成ブロック及び／又はバッファユニット２１６に格納された対応するサンプル値を、任意のタイプの推定及び／又は予測、例えばイントラ予測のために使用するよう構成されてよい。

例えば、実施形態では、エンコーダ２０は、バッファユニット２１６がイントラ予測２５４のために再構成ブロック２１５を格納するために使用されるだけでなく、ループフィルタユニット２２０（図２に示されない）のためにも使用されるように、及び／又は、例えば、バッファユニット２１６及び復号ピクチャバッファユニット２３０が１つのバッファを形成するように、構成されてよい。他の実施形態では、フィルタリング済みブロック２２１及び／又は復号ピクチャバッファ２３０からのブロック若しくはサンプル（ブロック若しくはサンプルは図２に示されない）は、イントラ予測２５４のための入力又は基礎として使用される。

ループフィルタユニット２２０（又は略して「ループフィルタ」２２０）は、再構成ブロック２１５をフィルタリングし、フィルタリング済みブロック２２１を取得して、ピクセル遷移を円滑化するよう或いはビデオ品質を向上するよう構成される。ループフィルタユニット２２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset, SAO）フィルタ、又はバイラテラルフィルタ、適応ループフィルタ（adaptive loop filter, ALF）、先鋭化若しくは円滑化フィルタのような別のフィルタ、又は共同フィルタ、のような１つ以上のループフィルタを表すことを意図する。ループフィルタユニット２２０はインループフィルタとして図２に示されるが、別の構成では、ループフィルタユニット２２０はポストループフィルタとして実装されてよい。フィルタリング済みブロック２２１は、フィルタリング済み再構成ブロック２２１と呼ばれてもよい。復号ピクチャバッファ２３０は、ループフィルタユニット２２０がフィルタリング動作を再構成符号化ブロックに対して実行した後に、再構成符号化ブロックを格納してよい。

実施形態では、エンコーダ２０（相応して、ループフィルタユニット２２０）は、（サンプル適応オフセット情報のような）ループフィルタパラメータを、例えば直接に又はエントロピー符号化ユニット２７０若しくは任意の他のエントロピー符号化ユニットにより実行されたエントロピー符号化の後に、出力するよう構成されてよい。その結果、例えば、デコーダ３０は、同じループフィルタパラメータを受信し、同じループフィルタパラメータを復号のために適用できる。

復号ピクチャバッファ（decoded picture buffer, DPB）２３０は、ビデオエンコーダ２０によるビデオデータ符号化において使用するために、参照ピクチャデータを格納する参照ピクチャメモリであってよい。ＤＰＢ２３０は、（同期ＤＲＡＭ（synchronous DRAM, SDRAM）、磁気抵抗ＲＡＭ（magnetoresistive RAM, MRAM）、抵抗ＲＡＭ（resistive RAM, RRAM）を含む）動的ランダムアクセスメモリ（dynamic random access memory, DRAM）、又は他のタイプのメモリ装置のような、種々のメモリ装置のうちのいずれか１つにより形成されてよい。ＤＰＢ２３０及びバッファ２１６は、同じメモリ装置又は別個のメモリ装置により提供されてよい。例では、復号ピクチャバッファ（decoded picture buffer, DPB）２３０は、フィルタリング済みブロック２２１を格納するよう構成される。復号ピクチャバッファ２３０は、同じ現在ピクチャの又は異なるピクチャ、例えば前の再構成ピクチャの、他の前のフィルタリング済みブロック、例えば前の再構成フィルタリング済みブロック２２１を格納するよう更に構成されてよく、完全な前の再構成、つまり復号ピクチャ（及び対応する参照ブロック及びサンプル）、及び／又は部分的な再構成現在ピクチャ（及び対応する参照ブロック及びサンプル）を、例えばインター予測のために提供してよい。例では、再構成ブロック２１５がインループフィルタリングを伴わずに再構成された場合、復号ピクチャバッファ（decoded picture buffer, DPB）２３０は再構成ブロック２１５を格納するよう構成される。

予測処理ユニット２６０は、ブロック予測処理ユニット２６０とも呼ばれ、ピクチャブロック２０３（現在ピクチャ２０１の現在ブロック２０３）及び再構成ピクチャデータ、例えば同じ（現在）ピクチャの参照サンプルをバッファ２１６から、及び／又は１つ以上の前の復号ピクチャの参照ピクチャデータ２３１を復号ピクチャバッファ２３０から受信し又は取得し、このようなデータを予測のために処理し、具体的には、インター予測ブロック２４５又はイントラ予測ブロック２５５であってよい予測ブロック２６５を提供するよう構成される。

モード選択ユニット２６２は、予測モード（例えば、イントラ又はインター予測モード）及び／又は残差ブロック２０５の計算のために及び再構成ブロック２１５の再構成のために予測ブロック２６５として使用されるべき対応する予測ブロック２４５又は２５５を選択するよう構成されてよい。

実施形態では、モード選択ユニット２６２は、（例えば、予測処理ユニット２６０によりサポートされる予測モードから）予測モードを選択するよう構成されてよい。予測モードは、最適一致、又は言い換えると最小残差（最小残差は送信又は記憶のための良好な圧縮を意味する）を提供し、又は、最小シグナリングオーバヘッド（最小シグナリングオーバヘッドは、送信又は記憶のための良好な圧縮を意味する）を提供し、又は両者を考慮し若しくはバランスを取る。モード選択ユニット２６２は、レート歪み最適化（rate－distortion optimization, RDO）に基づき、予測モードを決定するよう、つまり、最小レート歪み最適化を提供する予測モードを選択する若しくは関連するレート歪みが予測モード選択基準を少なくとも満たす予測モードを選択するよう構成されてよい。

以下では、エンコーダ２０の例により（例えば、予測処理ユニット２６０を用いて）実行される予測処理、及び（例えば、モード選択ユニット２６２を用いて）実行されるモード選択が更に詳細に説明される。

上述のように、エンコーダ２０は、最良予測モード又は最適予測モードを決定し又は（予め決定された）予測モードのセットから選択するよう構成される。予測モードのセットは、例えばイントラ予測モード及び／又はインター予測モードを含んでよい。

イントラ予測モードセットは、３５個の異なるイントラ予測モードを含んでよく、又は６７個の異なるイントラ予測モードを含んでよく、又は策定中のＨ．２６６で定義されるイントラ予測モードを含んでよい。

インター予測モードのセットは、利用可能な参照ピクチャ（つまり、ＤＢＰ２３０に格納された復号ピクチャの少なくとも一部）、及び、例えば最適一致参照ブロックを検索するために参照ピクチャ全体が使用されるか又は参照ピクチャの一部のみ、例えば現在ブロックの領域の周囲にある検索ウインドウ領域が使用されるかどうかに依存する、及び／又は例えば２分の１ピクセル及び／又は４分の１ピクセル補間のようなピクセル補間が適用されるかどうかに依存する、別のインター予測パラメータに依存する。

上述の予測モードに加えて、スキップモード及び／又は直接モードが適用されてよい。

予測処理ユニット２６０は、例えば、４分木（quad－tree, QT）パーティショニング、２分木（binary－tree, BT）パーティショニング、３分木（triple－tree, TT）パーティショニング、又はそれらの任意の組合せを繰り返し用いて、ブロック２０３をより小さなブロックパーティション又はサブブロックに分割し、例えばブロックパーティション又はサブブロックの各々について予測を実行するよう更に構成されてよい。モード選択は、予測ブロック２０３の木構造の選択、及びブロックパーティション又はサブブロックの各々に適用される予測モードの選択を含む。

インター予測ユニット２４４は、動き推定（motion estimation, ME）ユニット（図２に示されない）及び動き補償（motion compensation, MC）ユニット（図２に示されない）を含んでよい。動き推定ユニットは、ピクチャブロック２０３（現在ピクチャ２０１の現在ピクチャブロック２０３）、及び復号ピクチャ２３１、又は少なくとも１つ以上の前の再構成ブロック、例えば他の／異なる前の復号ピクチャ２３１の１つ以上の再構成ブロックを、動き推定のために受信し又は取得するよう構成される。例えば、ビデオシーケンスは、現在ピクチャ及び前の復号ピクチャ３１を含んでよい。言い換えると、現在ピクチャ及び前の復号ピクチャ３１は、ビデオシーケンスを形成するピクチャのシーケンスの一部であり又はそれを形成してよい。

例えば、エンコーダ２０は、複数の他のピクチャのうちの同じピクチャ又は異なるピクチャの複数の参照ブロックから参照ブロックを選択し、動き推定ユニット（図２に示されない）に、参照ピクチャ及び／又は参照ブロックの位置（座標X及びY）と現在ブロックの位置との間のオフセット（空間オフセット）を、インター予測パラメータとして提供するよう構成されてよい。このオフセットは、動きベクトル（motion vector, MV）とも呼ばれる。

動き補償ユニットは、インター予測パラメータを取得し、例えば受信し、インター予測パラメータに基づき又はそれを用いてインター予測を実行して、インター予測ブロック２４５を取得するよう構成される。動き補償ユニット（図２に示されない）により実行される動き補償は、動き推定を通じて決定された動き／ブロックベクトルに基づき、（場合によってはサブピクセル精度への補間を実行することにより）予測ブロックをフェッチすること又は生成することを含んでよい。補間フィルタリングは、知られているピクセルサンプルから追加ピクセルサンプルを生成してよく、それによりピクチャブロックを符号化するために使用され得る候補予測ブロックの数を増大させる可能性がある。現在ピクチャブロックのＰＵの動きベクトルを受信すると、動き補償ユニット２４６は、参照ピクチャリストのうちの１つの中で動きベクトルの指す予測ブロックの位置を特定してよい。動き補償ユニット２４６は、ビデオスライスのピクチャブロックを復号する際にビデオデコーダ３０による使用のために、ブロック及びビデオスライスに関連付けられたシンタックス要素も生成してよい。

イントラ予測ユニット２５４は、ピクチャブロック２０３（現在ピクチャブロック）及び同じピクチャの１つ以上の前の再構成ブロック、例えば再構成近隣ブロックを、イントラ推定のために、取得し、例えば受信するよう構成される。エンコーダ２０は、例えば、複数の（所定の）イントラ予測モードから、イントラ予測モードを選択するよう構成されてよい。

実施形態では、エンコーダ２０は、最適化基準に基づき、例えば最小残差（例えば、現在ピクチャブロック２０３に最も類似する予測ブロック２５５を提供するイントラ予測モード）又は最小レート歪みに基づき、イントラ予測モードを選択するよう構成されてよい。

イントラ予測ユニット２５４は、例えば、選択されたイントラ予測モードにおけるイントラ予測パラメータに基づき、イントラ予測ブロック２５５を決定するよう更に構成される。いずれの場合にも、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット２５４は、イントラ予測パラメータ、つまり、ブロックの選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット２７０に提供するよう更に構成される。例では、イントラ予測ユニット２５４は、後述するイントラ予測技術の任意の組み合わせを実行するよう構成されてよい。

エントロピー符号化ユニット２７０は、エントロピー符号化アルゴリズム又は方式（例えば、可変長符号化（variable length coding, VLC）方式、コンテキスト適応ＶＬＣ（context adaptive VLC, CAVLC）方式、算術符号化方式、コンテキスト適応バイナリ算術符号化（context adaptive binary arithmetic coding, CABAC）、シンタックスに基づくコンテキスト適応バイナリ算術符号化（syntax－based context－adaptive binary arithmetic coding, SBAC）、確率間隔パーティショニングエントロピー（probability interval partitioning entropy, PIPE）符号化、又は別のエントロピー符号化方法若しくは技術）を、量子化済み残差係数２０９、インター予測パラメータ、イントラ予測パラメータ、及び／又はループフィルタパラメータのうちの１つ又は全部に適用して（又は適用せず）、例えば符号化ビットストリーム２１の形式で出力２７２を介して出力され得る符号化ピクチャデータ２１を取得するよう構成される。符号化ビットストリームは、ビデオデコーダ３０へと送信され、又はビデオデコーダ３０による後の送信又は読み出しのためにアーカイブされてよい。エントロピー符号化ユニット２７０は、符号化中の現在ビデオスライスの他のシンタックス要素をエントロピー符号化するよう更に構成されてよい。

ビデオエンコーダ２０の他の構造的変形は、ビデオストリームを符号化するために使用できる。例えば、非変換に基づくエンコーダ２０は、変換処理ユニット２０６を有しないで、幾つかのブロック又はフレームについて、残差信号を直接量子化してよい。別の実装では、エンコーダ２０は、単一のユニットに結合された、量子化ユニット２０８及び逆量子化ユニット２１０を有してよい。

図３は、本願の技術を実装するよう構成されるビデオデコーダ３０の例を示す。ビデオデコーダ３０は、復号ピクチャ２３１を取得するために、例えばエンコーダ２０により符号化された符号化ピクチャデータ（例えば、符号化ビットストリーム）２１を受信するよう構成される。復号処理において、ビデオデコーダ３０は、ビデオデータ、例えば符号化ビデオスライスのピクチャブロック及び関連付けられたシンタックス要素を表す符号化ビデオビットストリームを、ビデオエンコーダ２０から受信する。

図３の例では、デコーダ３０は、エントロピー復号ユニット３０４、逆量子化ユニット３１０、逆変換処理ユニット３１２、再構成ユニット３１４（例えば、加算器３１４）、バッファ３１６、ループフィルタ３２０、復号ピクチャバッファ３３０、及び予測処理ユニット３６０を含む。予測処理ユニット３６０は、インター予測ユニット３４４、イントラ予測ユニット３５４、及びモード選択ユニット３６２を含んでよい。幾つかの例では、ビデオデコーダ３０は、図２のビデオエンコーダ２０を参照して説明した符号化経路に対して通常逆の復号経路を実行してよい。

エントロピー復号ユニット３０４は、エントロピー復号を、符号化ピクチャデータ２１に対して実行して、例えば量子化済み係数３０９、及び／又は復号符号化パラメータ（図３に示されない）、例えば（復号された）インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、及び／又は他のシンタックス要素のうちのいずれか１つ又は全部を取得するよう構成される。エントロピー復号ユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、及び／又は他のシンタックス要素を、予測処理ユニット３６０に転送するよう更に構成される。ビデオデコーダ３０は、ビデオスライスレベル及び／又はビデオブロックレベルのシンタックス要素を受信してよい。

逆量子化ユニット３１０は逆量子化ユニット１１０と同じ機能を有してよく、逆変換処理ユニット３１２は逆変換処理ユニット２１２と同じ機能を有してよく、再構成ユニット３１４は再構成ユニット２１４と同じ機能を有してよく、バッファ３１６はバッファ２１６と同じ機能を有してよく、ループフィルタ３２０はループフィルタ２２０と同じ機能を有してよく、復号ピクチャバッファ３３０は復号ピクチャバッファ２３０と同じ機能を有してよい。

予測処理ユニット３６０は、インター予測ユニット３４４及びイントラ予測ユニット３５４を含んでよい。インター予測ユニット３４４はインター予測ユニット２４４と機能的に同様であってよく、イントラ予測ユニット３５４はイントラ予測ユニット２５４と機能的に同様であってよい。予測処理ユニット３６０は、通常、ブロック予測を実行し、及び／又は予測ブロック３６５を符号化データ２１から取得し、及び予測関連パラメータ及び／又は選択された予測モードに関する情報を、例えばエントロピー復号ユニット３０４から（明示的に又は暗示的に）受信し又は取得するよう構成される。

ビデオスライスがイントラ符号化（Ｉ）スライスとして符号化されるとき、予測処理ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モード及び現在フレーム又はピクチャの前の復号ブロックからのデータに基づき、現在ビデオスライスのピクチャブロックについて予測ブロック３６５を生成するよう構成される。ビデオフレームがインター符号化（つまり、Ｂ又はＰ）スライスとして符号化されるとき、予測処理ユニット３６０のインター予測ユニット３４４（例えば動き補償ユニット）は、動きベクトル及びエントロピー復号ユニット３０４から受信した他のシンタックス要素に基づき、現在ビデオスライスのビデオブロックについて予測ブロック３６５を生成するよう構成される。インター予測では、予測ブロックは、参照ピクチャリストのうちの１つの中の参照ピクチャのうちの１つから生成されてよい。ビデオデコーダ３０は、ＤＰＢ３３０に格納された参照ピクチャに基づき、規定の構成技術を用いて、参照フレームリスト、リスト０及びリスト１を構成してよい。

予測処理ユニット３６０は、動きベクトル及び他のシンタックス要素をパースすることにより、現在ビデオスライスのビデオブロックについて予測情報を決定し、予測情報を使用して、復号中の現在ビデオブロックについて予測ブロックを生成するよう構成される。例えば、予測処理ユニット３６０は、受信したシンタックス要素のうちの幾つかを使用して、ビデオスライスのビデオブロックを符号化するために使用される予測モード（例えば、イントラ又はインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスの参照ピクチャリストのうちの１つ以上の構成情報、スライスの各インター符号化ビデオブロックの動きベクトル、スライスの各インター符号化ビデオブロックのインター予測状態、及び現在ビデオスライス内のビデオブロックを復号するための他の情報を決定する。

逆量子化ユニット３１０は、ビットストリーム内で提供され、エントロピー復号ユニット３０４により復号された量子化済み変換係数を逆量子化（つまり量子化解除）するよう構成されてよい。逆量子化処理は、ビデオスライス内の各ビデオブロックに対して、ビデオエンコーダ２０により計算された量子化パラメータを使用して、適用されるべき量子化の程度、及び同様に適用されるべき逆量子化の程度を決定することを含んでよい。

逆変換処理ユニット３１２は、ピクセルドメインにおいて残差ブロックを生成するために、逆変換（例えば、逆ＤＣＴ、逆整数変換、又は概念的に類似する逆変換処理）を、変換係数に適用するよう構成される。

再構成ユニット３１４（例えば、加算器３１４）は、例えば再構成残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを加算することにより、逆変換ブロック３１３（つまり、再構成残差ブロック３１３）を予測ブロック３６５に加算して、サンプルドメインにおいて再構成ブロック３１５を取得するよう構成される。

ループフィルタユニット３２０（符号化ループ内にある又は符号化ループの後にある）は、再構成ブロック３１５をフィルタリングし、フィルタリング済みブロック３２１を取得して、ピクセル遷移を円滑化するよう又はビデオ品質を向上するよう構成される。例では、ループフィルタユニット３２０は、後述するフィルタリング技術の任意の組み合わせを実行するよう構成されてよい。ループフィルタユニット３２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset, SAO）フィルタ、又はバイラテラルフィルタ、適応ループフィルタ（adaptive loop filter, ALF）、先鋭化若しくは円滑化フィルタのような別のフィルタ、又は共同フィルタ、のような１つ以上のループフィルタを表すことを意図する。ループフィルタユニット３２０はインループフィルタとして図３に示されるが、別の構成では、ループフィルタユニット３２０はポストループフィルタとして実装されてよい。

所与のフレーム又はピクチャ内の復号ビデオブロック３２１は、次に、後の動き補償のために使用される参照ピクチャを格納する復号ピクチャバッファ３３０に格納される。

デコーダ３０は、例えば、ユーザへの提示又はユーザによる閲覧のために、復号ピクチャ３１を、出力３３２を介して出力するよう構成される。

ビデオデコーダ３０の他の変形は、圧縮ビットストリームを復号するよう構成されてよい。例えば、デコーダ３０は、ループフィルタユニット３２０を有しないで、出力ビデオストリームを生成してよい。例えば、非変換に基づくデコーダ３０は、逆変換処理ユニット３１２を有しないで、幾つかのブロック又はフレームについて、残差信号を直接逆量子化してよい。別の実装では、ビデオデコーダ３０は、単一のユニットに結合された、逆量子化ユニット３１０及び逆変換処理ユニット３１２を有してよい。

図４は、本発明の実施形態による、ビデオ符号化装置４００（例えば、ビデオ符号化装置４００又はビデオ復号装置４００）の概略構造図である。ビデオ符号化装置４００は、本明細書で説明した実施形態を実施するのに適する。実施形態では、ビデオ符号化装置４００は、ビデオデコーダ（例えば、図１Ａのビデオデコーダ３０）、又はビデオエンコーダ（例えば、図１Ａのビデオエンコーダ２０）であってよい。別の実施形態では、ビデオ符号化装置４００は、図１Ａのビデオデコーダ３０又は図１Ａのビデオエンコーダ２０の中の１つ以上のコンポーネントであってよい。

ビデオ符号化装置４００は、データを受信するためのイングレスポート４１０及び受信機ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、論理ユニット、又は中央処理ユニット（ＣＰＵ）４３０と、データを送信するための送信機ユニット（Ｔｘ）４４０及びイグレスポート４５０と、データを格納するためのメモリ４６０と、を含む。ビデオ符号化装置４００は、イングレスポート４１０、受信機ユニット４２０、送信機ユニット４４０、及びイグレスポート４５０に接続された、光若しくは電気信号のイグレス若しくはイングレスのための光－電気コンポーネント及び電気－光（ＥＯ）コンポーネントも含んでよい。

プロセッサ４３０は、ハードウェア及びソフトウェアにより実装される。プロセッサ４３０は、１つ以上のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、ＦＰＧＡ、ＡＳＩＣ、及びＤＳＰとして実装されてよい。プロセッサ４３０は、イングレスポート４１０、受信機ユニット４２０、送信機ユニット４４０、イグレスポート４５０、及びメモリ４６０と通信する。プロセッサ４３０は、符号化モジュール４７０（例えば、符号化モジュール４７０又は復号モジュール４７０）を含む。符号化／復号モジュール４７０は、以上に開示した実施形態を実施する。例えば、符号化／復号モジュール４７０は、種々の符号化動作を実行し、処理し、又は提供する。従って、符号化／復号モジュール４７０は、ビデオ符号化装置４００の機能に実質的な改良を提供し、ビデオ符号化装置４００の異なる状態への変換に影響を与える。代替として、符号化／復号モジュール４７０は、メモリ４６０に格納されプロセッサ４３０により実行される命令として実装される。

メモリ４６０は、１つ以上のディスク、テープドライブ、及び固体ドライブを含み、プログラムが実行のために選択されるときこれらのプログラムを格納するため及びプログラムの実行中に読み出される命令及びデータを格納するためのオーバフローデータ記憶装置として使用されてよい。メモリ４６０は、揮発性及び／又は不揮発性であってよく、読み出し専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ternary content－addressable memory, TCAM）、及び／又は静的ランダムアクセスメモリ（ＳＲＡＭ）であってよい。

図５は、例示的な実施形態による図１Ａのソース装置１２及び宛先装置１４の一方又は両方として使用されてよい機器５００の簡略ブロック図である。機器５００は、本願の技術を実施してよい。ピクチャパーティショニングを実施する機器５００は、複数のコンピューティング装置を含むコンピューティングシステムの形式で、又は移動電話機、タブレットコンピュータ、ラップトップコンピュータ、若しくはデスクトップコンピュータのような単一コンピューティング装置の形式であってよい。

機器５００のプロセッサ５０２は、中央処理ユニットであってよい。代替として、プロセッサ５０２は、情報を制御又は処理できる、既存の又は将来開発される任意の他のタイプの装置又は複数の装置であってよい。図に示されるように、開示の実装はプロセッサ５０２のような単一のプロセッサにより実施できるが、速度及び効率における利益は、１つより多くのプロセッサを用いて達成できる。

実装では、機器５００のメモリ５０４は、読み出し専用メモリ（read only memory, ROM）装置又はランダムアクセスメモリ（random access memory, RAM）装置であり得る。任意の他の適切なタイプの記憶装置が、メモリ５０４として使用できる。メモリ５０４は、バス５１２を用いてプロセッサ５０２によりアクセスされるコード及びデータ５０６を含み得る。メモリ５０４は、オペレーティングシステム５０８及びアプリケーションプログラム５１０を更に含み得る。アプリケーションプログラム５１０は、プロセッサ５０２が本明細書に記載の方法を実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０は、アプリケーション１～Ｎを含んでよく、アプリケーション１～Ｎは、本明細書に記載の方法を実行するビデオ符号化アプリケーションを更に含む。機器５００は、２次記憶５１４の形式の追加メモリも含んでよい。２次記憶５１４は、例えば、モバイルコンピューティング装置と共に使用されるメモリカードであってよい。ビデオ通信セッションは大量の情報を含み得るので、これらの情報は、全体又は部分的に２次記憶５１４に格納され、処理のために必要に応じてメモリ５０４にロードされ得る。

機器５００は、ディスプレイ５１８のような１つ以上の出力装置も含み得る。例では、ディスプレイ５１８は、タッチ入力を感知するよう動作するタッチ感応要素とディスプレイを結合するタッチ感応ディスプレイであってよい。ディスプレイ５１８は、バス５１２を用いてプロセッサ５０２に接続され得る。ユーザが機器５００をプログラミングし又はその他の場合に使用することを可能にする他の出力装置は、ディスプレイ５１８に加えて又はその代替として提供され得る。出力装置がディスプレイである又はそれを含むとき、ディスプレイは、液晶ディスプレイ（liquid crystal display, LCD）、陰極線管（cathode－ray tube, CRT）ディスプレイ、プラズマディスプレイ、又は有機ＬＥＤ（organic LED, OLED）ディスプレイのような発光ダイオード（light emitting diode, LED）ディスプレイを含む異なる方法で実装できる。

機器５００は、ピクチャ感知装置５２０も含み又はそれに接続されてよい。ピクチャ感知装置５２０は、例えば、カメラ、又はピクチャを感知できる既存の又は将来開発される任意の他のピクチャ感知装置５２０である。ピクチャは、例えば、機器５００を実行するユーザのピクチャである。ピクチャ感知装置５２０は、機器５００を実行するユーザに直接向かい合って配置されてよい。例では、ピクチャ感知装置５２０の位置及び光軸は、ピクチャ感知装置５２０の視野がディスプレイ５１８に近接する領域を含み、ディスプレイ５１８が該領域から見えるように、構成されてよい。

機器５００は、また、音声感知装置５２２、例えばマイクロフォン、又は機器５００の近くの音声を感知できる既存の若しくは将来開発される任意の他の音声感知装置を含み又はそれと通信してよい。音声感知装置５２２は、機器５００を実行するユーザに直接向かい合って配置されてよく、機器５００を実行しているユーザにより生成された音声、例えば声若しくは別の音声を受信するよう構成されてよい。

図５は機器５００のプロセッサ５０２及びメモリ５０４を単一のユニットに統合されているように示すが、他の構成が利用されてよい。プロセッサ５０２の実行は、直接接続され、又はローカル領域又は別のネットワークに分散され得る複数の機械（各機械は１つ以上のプロセッサを有する）の中で分散されてよい。メモリ５０４は、ネットワークに基づくメモリ又は機器５００の実行される複数の機械の中のメモリのように、複数の機械に渡り分散できる。ここでは単一のバスとして示されるが、機器５００のバス５１２は複数のバスを含み得る。更に、２次記憶５１４は、機器５００の他のコンポーネントに直接接続でき、又はネットワークを介してアクセスでき、メモリカードのような単一の統合ユニット又は複数のメモリカードのような複数のユニットを含むことができる。機器５００は、従って、広範な構成で実装できる。

本願で上述したように、ルマ（Ｙ）成分を含むことに加えて、カラービデオは、クロマ成分（Ｕ，Ｖ）を更に含む。従って、ルマ成分の符号化に加えて、クロマ成分も符号化される必要がある。カラービデオにおいてルマ成分及びクロマ成分をサンプリングする異なる方法に従い、通常、ＹＵＶ４：４：４、ＹＵＶ４：２：２、及びＹＵＶ４：２：０がある。図６に示すように、×はルマ成分のサンプルを表し、○はクロマ成分のサンプルを表す。
４：４：４形式は、クロマ成分がダウンサンプリングされないことを示す。
４：２：２形式は、ルマ成分と比べて、２：１水平ダウンサンプリングがクロマ成分に実行され、クロマ成分に垂直ダウンサンプリングが実行されないことを示す。２個のＵサンプル又はＶサンプル毎に、各行は４個のＹサンプルを含む。
４：２：０形式は、ルマ成分と比べて、２：１水平ダウンサンプリングがクロマ成分に実行され、クロマ成分に２：１垂直ダウンサンプリングが実行されることを示す。

ビデオデコーダは、３つの異なる分割構造（ＱＴ、ＢＴ、及びＴＴ）に従い、各深さで許容される５個の異なる分割タイプを用いて、ビデオブロックを分割するよう構成されてよい。図７Ａ～図７Ｅに示すように、分割タイプは、４分木分割（ＱＴ分割構造）、水平２分木分割（ＢＴ分割構造）、垂直２分木分割（ＢＴ分割構造）、及び水平中央－端３分木分割（ＴＴ分割構造）、及び垂直中央－端３分木分割（ＴＴ分割構造）を含む。

５個の分割タイプは、以下のように定義される。留意すべきことに、正方形は、長方形の特別な場合として考えられる。

４分木（Quad－tree, QT）分割：ブロックは、同じサイズの４個の長方形ブロックに更に分割される。図７Ａは、４分木分割の例を示す。４分木ＱＴに基づくＣＴＵ分割方法によると、ＣＴＵは、４分木のルートノード（root）として使用される。ＣＴＵは、４分木分割モードに基づき、幾つかのリーフノード（leaf node）に再帰的に分割される。１つのノードは１つのピクチャ領域に対応する。ノードが分割されない場合、該ノードは、リーフノードと呼ばれ、該ノードに対応するピクチャ領域はＣＵになる。ノードが分割される場合、該ノードに対応するピクチャ領域は、同じサイズの４個のピクチャ領域に分割され（４個の領域の長さ及び幅はそれぞれ分割される領域の長さ及び幅の半分である）、各領域は１つのノードに対応する。これらのノードが更に分割されるかどうかは、別個に決定される必要がある。ノードが分割されるべきであるかどうかは、ビットストリーム内にあり該ノードに対応する分割フラグｓｐｌｉｔ＿ｃｕ＿ｆｌａｇにより示される。ルートノードの４分木深さ（qtDepth）は０であり、子ノードの４分木深さは親ノードの４分木深さ＋１である。説明を簡単にするために、本願ではノードのサイズ及び形状は、該ノードに対応するピクチャ領域のサイズ及び形状である。つまり、該ノードは、ピクチャ内の長方形領域である。符号化木の中でノード（node）を分割することにより取得されるノードは、ノードの子ノード（child node）と呼ばれてよく、略して子ノードである。

より具体的には、６４×６４ＣＴＵノード（０の４分木深さを有する）は、ＣＴＵノードに対応するｓｐｌｉｔ＿ｃｕ＿ｆｌａｇに基づき分割されず、６４×６４ＣＵになってよく、或いは、４個の３２×３２ノード（１の４分木深さを有する）に分割されてよい。４個の３２×３２ノードの各々はノードに対応するｓｐｌｉｔ＿ｃｕ＿ｆｌａｇに基づき、更に分割されて又は更に分割されなくてよい。３２×３２ノードが分割され続ける場合、４個の１６×１６ノード（２の４分木深さを有する）が生成される。残りは、ノードが更に分割されなくなるまで、同様に推定され得る。このように、１つのＣＴＵはＣＵの１つのグループに分割される。最小ＣＵサイズ（size）はＳＰＳで指定される。例えば、８×８は最小ＣＵサイズである。前述の再帰的パーティショニング処理では、ノードのサイズが最小ＣＵサイズ（minimum CU size）に等しい場合、ノードは規定により更に分割されず、ノードの分割フラグはビットストリームに含まれる必要がない。

パースを通じて、ノードがリーフノードであり、リーフノードがＣＵであることが分かった後に、ＣＵに対応する符号化情報（予測モード及びＣＵの変換係数のような情報、例えばＨ．２６６におけるシンタックス構造ｃｏｄｉｎｇ＿ｕｎｉｔ（）を含む）が更にパースされる。次に、予測、逆量子化、逆変換、及びループフィルタリングのような復号処理が、符号化情報に基づきＣＵに対して実行されて、ＣＵに対応する再構成画像を生成する。４分木（Quadtree, QT）構造では、ＣＴＵは、ローカルピクチャ特徴に基づき、適切なサイズのＣＵのグループに分割され得る。例えば、平坦な領域はより大きなＣＵに分割され、一方で、テクスチャの豊かな領域はより小さなＣＵに分割される。

ＣＴＵをＣＵのグループに分割するモードは、符号化木（coding tree）に対応する。ＣＴＵにより使用されるべき特定の符号化木は、通常、エンコーダのレート歪み最適化（rate distortion optimization, RDO）技術を用いて決定される。エンコーダは、複数のＣＴＵ分割モードを試し、各分割モードは１つのレート歪みコスト（RD cost）に対応する。エンコーダは、試みられた分割モードのＲＤコストを比較して、ＣＴＵの実際の符号化のためにＣＴＵの最適分割モードとして、最小ＲＤコストを有する分割モードを見付ける。ＣＴＵ分割モードがデコーダにより正しく識別できるように、エンコーダにより試されるＣＴＵ分割モードは、全部、デコーダにより指定された分割ルールに従う必要がある。

垂直２分木（binary tree, BT）分割：ブロックは、同じサイズの２個の長方形ブロックに垂直に分割される。図７Ｂは、垂直２分木分割の例である。

水平２分木分割：ブロックは、同じサイズの２個の長方形ブロックに水平に分割される。図７Ｃは、水平２分木分割の例である。

垂直中央－端３分木（ＴＴ）分割：ブロックは、３個の長方形ブロックに垂直に分割され、２個の端のブロックが同じサイズになり、中央ブロックのサイズが２個の端のブロックのサイズの和になるようにする。図７Ｄは、垂直中央－端３分木分割の例である。

水平中央－端３分木分割：ブロックは、３個の長方形ブロックに水平に分割され、２個の端のブロックが同じサイズになり、中央ブロックのサイズが２個の端のブロックのサイズの和になるようにする。図７Ｅは、水平中央－端３分木分割の例である。

図７Ｂ～図７Ｅの特定の分割方法は、図７Ａの説明と同様であり、詳細はここで再び説明されない。更に、ＱＴ及びＢＴ／ＴＴをカスケードする分割モードが使用されてよく、これは略してＱＴ－ＢＴＴである。つまり、レベル１符号化木のノードは、ＱＴを通じてのみ子ノードに分割でき、レベル１符号化木のリーフノードは、レベル２符号化木のルートノードである。レベル２符号化木のノードは、以下の４つの分割モード：水平２分割、垂直２分割、水平３分割、及び垂直３分割、のうちの１つを用いて子ノードに分割されてよい。レベル２符号化木のリーフノードは、符号化単位である。具体的に、２分木分割及び４分木分割は、カスケード方法で実行され、これは、略してＱＴＢＴ分割モードであってよい。例えば、図８に示されるように、ＣＴＵは、先ずＱＴを通じて分割され、ＱＴリーフノードは、ＢＴを通じて分割され続けることが可能である。図８の右側部分で、各端点は１つのノードを表す。４本の実線に繋がる１つのノードは４分木分割を表し、２本の破線に繋がる１つのノードは２分木分割を表す。分割後に取得されるノードは、ノードの子ノードと呼ばれてよく、略して子ノードである。子ノードの間で、ａ～ｍは１３個のリーフノードであり、各リーフノードは１つのＣＵを表す。２分木ノードでは、１は垂直分割を表し、０は水平分割を表す。図８の左側部分に示されるように、ＣＴＵは１３個のＣＵ：ａ～ｍに分割される。ＱＴＢＴ分割モードでは、各ＣＵはＱＴ深さ（Quad－tree depth, QT depth）及びＢＴ深さ（Binary tree depth, BT depth）を有する。ＱＴ深さは、ＣＵの属するＱＴリーフノードのＱＴ深さを表し、ＢＴ深さは、ＣＵの属するＢＴリーフノードのＢＴ深さを表す。例えば、図８で、ａ及びｂのＱＴ深さは１であり、ａ及びｂのＢＴ深さは２であり、ｃ、ｄ、及びｅのＱＴ深さは１であり、ｃ、ｄ、及びｅのＢＴ深さは１であり、ｆ、ｋ、及びｌのＱＴ深さは２であり、ｆ、ｋ、及びｌのＢＴ深さは１であり、ｉ及びｊのＱＴ深さは２であり、ｉ及びｊのＢＴ深さは０であり、ｇ及びｈのＱＴ深さは２であり、ｇ及びｈのＢＴ深さは２であり、ｍのＱＴ深さは１であり、ｍのＢＴ深さは０である。ＣＴＵが１つのＣＵにのみ分割される場合、ＣＵのＱＴ深さは０であり、ＣＵのＢＴ深さは０である。

特定の深さに関連付けられるブロックについて、エンコーダ２０は、どの分割タイプ（更に分割されないことを含む）が使用されるかを決定し、デコーダ３０に決定した分割タイプを明示的又は暗示的に（例えば、分割タイプは所定のルールから導出されてよい）シグナリングする。エンコーダ２０は、ブロックについて異なる分割タイプを調べるためにレート歪みコストに基づき、使用されるべき分割タイプを決定してよい。

２×Ｍクロマブロック、特に２×２、２×４、又は２×８クロマブロックが、ノードを分割することにより生成された場合、クロマ符号化及び復号効率は比較的低く、ハードウェアデコーダの処理コストは比較的高い。これは、ハードウェアデコーダの実装には望ましくない。現在ノードのクロマブロックが更に分割されないとき、本願の本実施形態では、現在ノードのルマブロックのみが分割されてよく、それにより、符号化及び復号効率を向上し、コーデックの最大スループットを低減し、コーデックの実装を容易にする。具体的に、本願の本実施形態では、分割モードを用いてノードを分割することにより生成された子ノードが、辺の長さが第１閾値であるクロマブロックを含む（又は、辺の長さが第２閾値より短いクロマブロックを含む）とき、ノードに含まれるルマブロックは、この分割モードを用いて分割され、ノードに含まれるクロマブロックは更に分割されない。このモードは、辺の長さが第１閾値である（又は辺の長さが第２閾値より短い）クロマブロックの生成を回避できる。特定の実装では、第１閾値は２であってよく、第２閾値は４であってよい。以下は、実施形態１～３を参照して詳細な説明を提供する。本願の本実施形態では、ＹＵＶ４：２：０のビデオデータ形式を用いて説明が提供され、同様の方法がＹＵＶ４：２：２データについて使用されてよい。

イントラブロックコピー（Intra Block Copy, IBC）符号化ツールは、ＨＥＶＣの拡張標準ＳＣＣにおいて採用され、主にスクリーンコンテンツビデオの符号化効率を向上するために使用される。ＩＢＣモードは、ブロックレベル符号化モードである。エンコーダ側では、ＣＵ毎に最適ブロックベクトル（block vector）又は動きベクトル（motion vector）を見付けるために、ブロックマッチング（block matching, BM）方法が使用される。動きベクトルは、ここでは、主に、現在ブロックから参照ブロックへの変位を表すために使用され、変位ベクトル（displacement vector）とも呼ばれる。参照ブロックは、現在ピクチャ内の再構成ブロックである。ＩＢＣモードは、イントラ予測モード又はインター予測モード以外の第３の予測モードと考えられてよい。記憶空間を節約し、デコーダの複雑さを低減するために、ＶＴＭ４におけるＩＢＣモードは、現在ＣＴＵの所定領域の再構成部分のみが予測のために使用されることを可能にする。

ＶＴＭでは、ＣＵレベルで、現在ＣＵのためにＩＢＣモードが使用されるかどうかを示すためにフラグが使用される。ＩＢＣモードは、ＩＢＣＡＭＶＰモード、ＩＢＣスキップモード、又はＩＢＣマージモードに分類される。

実施形態１
図９は、本発明の実施形態１による方法９００のフローチャートである。

ステップ９０１：現在ノードが分割される必要があるかどうかを決定する。ここで、現在ノードはルマブロック及びクロマブロックを含む。

現在ノードが子ノードに更に分割されない場合、現在ノードは符号化単位（coding unit, CU）であり、ステップ９１０が実行されて、パースを通じて符号化単位に関する情報を取得する。或いは、現在ノードが分割される必要がある場合、ステップ９０２が実行される。

本発明の実施形態１は、ビデオ復号機器、具体的には図３～図５のうちのいずれか１つで説明された機器により実施されてよい。

本発明の実施形態１は、代替として、ビデオ符号化機器、具体的には図２、図４、及び図５のうちのいずれか１つで説明された機器により実施されてよい。

実施形態１がビデオ復号機器により実施されるとき、ステップ９０２は：ビデオ復号機器が、ビットストリームをパースして、現在ノードの分割モードを決定する、である。現在ノードの分割モードは、４分割（ＱＴ）、水平２分割（horizontal BT）、水平３分割（horizontal TT）、垂直２分割（Vertical BT）、及び垂直３分割（Vertical TT）、のうちの少なくとも１つであってよく、又は別の分割モードであってよい。これは、本発明の本実施形態において限定されない。現在ノードの分割モードに関する情報は、通常、ビットストリーム内で送信され、現在ノードの分割モードは、ビットストリーム内の対応するシンタックス要素をパースすることにより取得できる。

実施形態１がビデオ符号化機器により実施されるとき、ステップ９０２は：現在ノードを分割する方法を決定する、である。

ステップ９０４：現在ノードの分割モード及び現在ノードのサイズに基づき、現在ノードのクロマブロックが分割される必要があるかどうかを決定する。現在ノードのクロマブロックが更に分割されないとき、ステップ９０６を実行する。或いは、現在ノードのクロマブロックが分割される必要があるとき、ステップ９０８を実行する。

具体的に、実装では、辺の長さが第１閾値であるクロマブロック（又は、辺の長さが第２閾値より短いクロマブロック）が、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、辺の長さが第１閾値であるクロマブロックを含む（又は、辺の長さが第２閾値より短いクロマブロックを含む）と決定された場合、現在ノードのクロマブロックは更に分割されない。例えば、第１閾値は２であってよく、第２閾値は４であってよい。

本発明の本実施形態では、辺の長さが第１閾値であるクロマブロックは、幅又は高さが第１閾値であるクロマブロックである。

別の実装では、例えば、条件１～条件５のいずれか１つが真であるとき、現在ノードのクロマブロックは更に分割されないと決定されてよく、その他の場合、現在ノードのクロマブロックは分割される必要があると決定される。
条件１：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが垂直２分割である。
条件２：現在ノードの高さが第２閾値の２倍に等しく、現在ノードの分割モードが水平２分割である。
条件３：現在ノードの幅が第２閾値の４倍に等しく、現在ノードの分割モードが垂直３分割である。
条件４：現在ノードの高さが第２閾値の４倍に等しく、現在ノードの分割モードが水平３分割である。又は、
条件５：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが４分割である。

通常、現在ノードの幅は、現在ノードに対応するルマブロックの幅であり、現在ノードの高さは、現在ノードに対応するルマブロックの高さである。特定の実装では、例えば、第２閾値は４であってよい。

第３の実装では、幅が第１閾値であるクロマブロック（又は、幅が第２閾値より狭いクロマブロック）が、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、幅が第１閾値であるクロマブロックを含む（又は、幅が第２閾値より狭いクロマブロックを含む）と決定された場合、現在ノードのクロマブロックは更に分割されない。例えば、第１閾値は２であってよく、第２閾値は４であってよい。

第４の実装では、クロマサンプル数が第３閾値より少ないクロマブロックが、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、クロマサンプル数が第３閾値より少ないクロマブロックを含むと決定された場合、現在ノードのクロマブロックは更に分割されない。例えば、第３閾値は１６であってよい。この場合、クロマサンプル数が１６より少ないクロマブロックは、限定ではないが、２×２クロマブロック、２×４クロマブロック、及び４×２クロマブロックを含む。第３閾値は８であってよい。この場合、クロマサンプル数が８より少ないクロマブロックは、限定ではないが、２×２クロマブロックを含む。

具体的に、条件１又は条件２のいずれかが真である場合、クロマサンプル数が第３閾値より少ないクロマブロックが、現在ノードの分割モードに基づき現在ノードを分割することにより生成されると決定されてよい。その他の場合、現在ノードの分割モードに基づき現在ノードを分割することにより、クロマサンプル数が第３閾値より少ないクロマブロックが生成されないと決定されてよい。
条件１：現在ノードの幅と高さとの積は、１２８より小さく、現在ノードの分割モードは、垂直２分割又は水平２分割である。又は、
条件２：現在ノードの幅と高さとの積は、２５６より小さく、現在ノードの分割モードは、垂直３分割、水平３分割、又は４分割である。

具体的に、別の実装では、条件３又は条件４のいずれかが真である場合、クロマサンプル数が第３閾値より少ないクロマブロックが、現在ノードの分割モードに基づき現在ノードを分割することにより生成されると決定されてよい。その他の場合、現在ノードの分割モードに基づき現在ノードを分割することにより、クロマサンプル数が第３閾値より少ないクロマブロックが生成されないと決定されてよい。
条件３：現在ノードの幅と高さとの積は、６４に等しく、現在ノードの分割モードは、垂直２分割、水平２分割、４分割、水平３分割、又は垂直３分割である。又は、
条件４：現在ノードの幅と高さとの積は、１２８に等しく、現在ノードの分割モードは、垂直３分割又は水平３分割である。

第５の実装では、高さが第１閾値であるクロマブロック（又は、高さが第２閾値より低いクロマブロック）が、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、高さが第１閾値であるクロマブロック（又は、高さが第２閾値より低いクロマブロック）を含むと決定された場合、現在ノードのクロマブロックは更に分割されない。例えば、第１閾値は２であってよく、第２閾値は４であってよい。

ステップ９０６：現在ノードの分割モードに基づき、現在ノードのルマブロック（luma block）を分割して、現在ノードの子ノード（ルマブロックの子ノードとも呼ばれてよく、略してルマノード）を取得する。各子ノードは、ルマブロックのみを含む。現在ノードのクロマブロック（chroma block）は更に分割されず、クロマブロックのみを含む符号化単位になる。

任意的に、図１０に示すように、ステップ９０６はステップ９０６２を更に含んでよい：現在ノードのルマブロックをパースして、現在ノードのルマブロック内のサブ領域の各々の予測情報及び残差情報を取得する。ここで、各サブ領域は１つの子ノードに対応する。

具体的に、ステップ９０６２は、以下の方法のうちのいずれか１つを用いて実施されてよい。

方法１：規定によりルマブロックの各子ノードを更に分割しない（つまり、各ルマノードは符号化単位であり、ルマブロックの１つの子ノードは、ルマブロックのみを含む１つの符号化単位に対応する）。ルマブロックの子ノードについて符号化単位データを順にパースして、各ルマブロックの予測情報及び残差情報を取得する。ルマノードのルマブロックは、現在ノードのルマブロック内のサブ領域であり、ルマノードのルマブロックは現在ノードのルマブロックを構成する。

方法２：ルマブロックの子ノードが、順に更に分割され続ける必要があるかどうかを決定する。子ノードが更に分割される必要があるとき、子ノードの分割モード及び対応する符号化単位データをパースする。より具体的に、ルマノードが更に分割されない場合、ルマノードに対応する符号化単位データがパースされて、ルマノードのルマブロックに対応する予測情報及び残差情報を取得する。或いは、ルマノードが分割され続ける場合、現在ノードのルマブロックのサブ領域の各々の予測情報及び残差情報が決定されるまで、ルマノードの子ノード（留意すべきことに、子ノードは依然としてルマブロックのみを含む）が分割される必要があるかどうかが決定され続ける。

予測情報は、限定ではないが、予測モード（イントラ予測モード又はインター予測モードを示す）、イントラ予測モード、動き情報、等を含む。ルマブロックのイントラ予測モードは、平面モード（Planar Mode）、直流モード（DC Mode）、角度モード（angular Mode）、及びクロマ導出モード（chroma derived mode, DM）のうちの１つであってよい。動き情報は、予測方向（前方、後方、又は両方向）、参照インデックス（reference index）、及び／又は動きベクトル（motion vector）のような情報を含んでよい。

残差情報は、符号化ブロックフラグ（coded block flag, CBF）、変換係数、及び／又は変換タイプ（例えば、ＤＣＴ－２、ＤＳＴ－７、又はＤＣＴ－８）、等を含む。

任意的に、図１０に示すように、ステップ９０６はステップ９０６４を更に含んでよい：クロマブロックの予測情報及び／又は残差情報を取得する。

具体的に、ステップ９０６４は、ステップ９０６４２及びステップ９０６４４を含んでよい。ステップ９０６４２は、ステップ９０６４２Ａ又はステップ９０６４２Ｂであってよい。

ステップ９０６４２Ａは、具体的に以下を含む：

現在ノードのルマブロックのプリセット位置の予測モードを、現在ノードのクロマブロックの予測モードとして取得する。現在ノードのルマブロックの左上角の位置は、（ｘ０，ｙ０）として表されてよく、サイズはＷ×Ｈである。この場合、プリセット位置は、限定ではないが、ルマブロックの左上角、右下角（ｘ０＋Ｗ－１，ｙ０＋Ｈ－１）、中心（ｘ０＋Ｗ／２，ｙ０＋Ｈ／２）、（ｘ０＋Ｗ／２，０）、又は（０，ｙ０＋Ｈ／２）、等を含んでよい。予測モードは、プリセット位置にあるピクセルにイントラ予測又はインター予測が実行されるかどうか、例えばＨＥＶＣにおいてシンタックス要素ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇにより示される情報を示す。例えば、ＶＴＭでは、プリセット位置の予測モードがＩＢＣモードかどうかは、シンタックス要素ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇにより示される情報に基づき決定されてよい。

プリセット位置の予測モードがインター予測である場合、クロマブロックの予測モードを決定するために、以下の方法のうちの１つが使用される。

方法１：クロマブロックにインター予測を実行して、クロマブロックの動き情報として、プリセット位置の動き情報を取得する。

方法２：クロマブロックにインター予測を実行し、クロマブロックをクロマ予測サブブロックに分割し（ここで、クロマ予測サブブロックのサイズは、例えば幅が２クロマサンプルであり高さが２クロマサンプルである）、以下の方法でクロマ予測サブブロックの動き情報を取得する。

クロマ予測サブブロックに対応するルマピクチャ位置にあるルマブロックに対してインター予測が実行される場合、クロマ予測サブブロックに対応するルマピクチャ位置の動き情報は、クロマ予測サブブロックの動き情報として使用される。その他の場合、プリセット位置の動き情報が、クロマ予測サブブロックの動き情報として取得される。

ＹＵＶ４：２：０ピクチャでは、クロマピクチャ内のクロマ予測サブブロックの座標は（ｘＣ，ｙＣ）と示される。この場合、クロマ予測サブブロックに対応するルマピクチャ位置の座標は、（ｘＣ＜＜１，ｙＣ＜＜１）である。

方法３：フラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇをパースして、クロマブロックに対してイントラ予測又はインター予測が実行されるかどうかを決定する。クロマブロックに対してイントラ予測が実行される場合、クロマブロックのイントラ予測モードとして、ビットストリームからイントラ予測モードをパースする。或いは、クロマブロックに対してインター予測が実行される場合、クロマブロックの動き情報として、プリセット位置の動き情報を取得する。

方法４：フラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇをパースして、クロマブロックに対してイントラ予測又はインター予測が実行されるかどうかを決定する。クロマブロックに対してイントラ予測が実行される場合、クロマブロックのイントラ予測モードとしてビットストリームからイントラ予測モードをパースする。ここで、イントラ予測モードは、クロスコンポーネント線形モデルモード及びＤＭモードのうちの１つであってよく、ＤＭモードに対応するルマイントラ予測モードは平面モードに設定される。或いは、クロマブロックに対してインター予測が実行される場合、クロマブロックをクロマ予測サブブロックに分割する。ここで、クロマ予測サブブロックの動き情報は、以下の方法で取得される。

フラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇをパースするために使用されるコンテキストモデルは、例えばモデル番号２を有するプリセットモデルである。

プリセット位置の予測モードがイントラ予測である場合、クロマブロックに対してイントラ予測が実行され、イントラ予測モードは、クロマブロックのイントラ予測モードとして、ビットストリームからパースされる。代替として、クロマブロックのイントラ予測モードは、直流モード、平面モード、角度モード、クロスコンポーネント線形モデルモード、又はＤＭモードのうちの１つであることが直接決定される。

プリセット位置の予測モードがＩＢＣモードである場合、クロマブロックはＩＢＣモードで予測されて、クロマブロックの変位ベクトル情報として、プリセット位置の変位ベクトル（displacement vector）情報を取得する。或いは、プリセット位置の予測モードがＩＢＣモードである場合、クロマブロックの予測モードは、フラグｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇに基づき決定される：
１）ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが１である場合、クロマブロックのためにＩＢＣモードが使用される。より具体的には、クロマブロックのＩＢＣを予測する方法は、ＶＴＭ４．０における方法であってよい。つまり、クロマブロックは２×２サブブロックに分割され、各サブブロックの変位ベクトルは、サブブロックに対応するルマ領域の変位ベクトルに等しい。或いは、
２）ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが０である場合、クロマブロックのためにイントラ予測モード又はインター予測モードが使用される。

イントラ予測モードが使用されるとき、シンタックス要素がビットストリームからパースされて、クロマイントラ予測モードを決定する。代替として、クロマブロックのイントラ予測モードがクロマイントラ予測モードセットに属することが直接決定される。クロマイントラ予測モードセットは、直流モード、平面モード、角度モード、クロスコンポーネント線形モデル、及びＤＭモードを含む。

インター予測モードが使用されるとき、プリセット位置の動き情報は、クロマブロックの動き情報として取得されてよい。

留意すべきことに、ビットストリーム内にｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが存在しないとき、現在ノードの位置するピクチャのタイプがＩフレーム／Ｉスライスであり、ＩＢＣモードが使用を許可される場合、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇは規定により１である。つまり、クロマブロックには、規定によりＩＢＣモードが使用される。或いは、現在ノードの位置するピクチャのタイプがＰ／Ｂフレーム／スライスである場合、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが規定により０である。

ＶＴＭでは、プリセット位置の予測モードがＩＢＣモードかどうかは、シンタックス要素ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇにより示される情報に基づき決定されてよい。例えば、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが１である場合、それは、ＩＢＣ予測モードが使用されることを示す。或いは、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが０である場合、それは、ＩＢＣモードが使用されないことを示す。ビットストリーム内にｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇが存在しないとき、Ｉフレーム／Ｉスライス内ならば、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇの値はｓｐｓ＿ｉｂｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値と等しく、Ｐフレーム／スライス又はＢフレーム／スライス内ならば、ｐｒｅｄ＿ｍｏｄｅ＿ｉｂｃ＿ｆｌａｇは０である。ｓｐｓ＿ｉｂｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１のとき、それは、現在ピクチャを復号する処理において現在ピクチャが参照ピクチャとして使用されることが許可されることを示す。或いは、ｓｐｓ＿ｉｂｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０のとき、それは、現在ピクチャを復号する処理において現在ピクチャが参照ピクチャとして使用されることが許可されないことを示す。

クロマブロックのイントラ予測モードは、直流モード、平面モード、角度モード、クロスコンポーネント線形モデル（cross－component linear model, CCLM）モード、及びクロマ導出モード（chroma derived mode, DM）、例えば、ＶＴＭにおけるＤＣモード、平面モード、角度モード、クロスコンポーネント線形モデルモード、及びクロマ導出モード、のうちの１つであってよい。

ステップ９０６４２Ｂは、具体的に以下を含む：

現在ノードの複数のルマブロックの予測モードを取得し、以下の方法を用いて、現在ノードに対応するクロマブロックの予測モードを決定する。

複数のルマブロックの全部に対してイントラ予測が実行される場合、クロマブロックに対してイントラ予測が実行され、イントラ予測モードは、クロマブロックのイントラ予測モードとして、ビットストリームからパースされる。

複数のルマブロックの全部に対してインター予測が実行される場合、クロマ予測モードを決定するために、以下の方法のうちの１つが使用される。

方法１：クロマブロックにインター予測を実行して、クロマブロックの動き情報として、プリセット位置の動き情報を取得する。プリセット位置は、実施形態１におけるものと同じ意味を有する。

方法２：フラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇをパースして、クロマブロックに対してイントラ予測又はインター予測が実行されるかどうかを決定する。クロマブロックに対してイントラ予測が実行される場合、クロマブロックのイントラ予測モードとして、ビットストリームからイントラ予測モードをパースする。或いは、クロマブロックに対してインター予測が実行される場合、クロマブロックの動き情報として、プリセット位置の動き情報を取得する。

複数のルマブロックについて、インター予測及びイントラ予測が含まれる場合、クロマブロックのモード情報は、以下の方法のうちの１つで決定されてよい。
（１）プリセット位置の予測モードがインター予測である場合、クロマブロックに対してインター予測が実行され、クロマブロックの動き情報として、プリセット位置の動き情報を取得する。
（２）プリセット位置の予測モードがイントラ予測である場合、クロマブロックに対してイントラ予測が実行され、クロマブロックのイントラ予測モードとして、ビットストリームからイントラ予測モードがパースされる。或いは、クロマブロックのイントラ予測モードが、直流モード、平面モード、角度モード、クロスコンポーネント線形モデルモード、又はＤＭモードのうちの１つであることが直接決定される。
（３）プリセット位置の予測モードがＩＢＣモードである場合、クロマブロックはＩＢＣモードで予測され、クロマブロックの変位ベクトル情報として、プリセット位置の変位ベクトル情報を取得する。及び、
（４）クロマ予測モードが、モードセットの中の１つのモードとして直接指定される。ここで、モードセットは、ＡＭＶＰモード、ＩＢＣモード、スキップモード、直流モード、平面モード、角度モード、クロスコンポーネント線形モデルモード、及びＤＭモードを含む。

ステップ９０６４４：クロマブロックの残差情報をパースする。クロマブロックの残差情報は、変換単位に含まれる。変換タイプは規定によりＤＣＴ－２であってよい。

ステップ９０８：現在ノードを子ノードに分割する。ここで、各子ノードはルマブロック及びクロマブロックを含む。ステップ９０１は、各子ノードに対して実行され、子ノードの分割モードに対してパースが実行され続け、子ノード（ノードとも呼ばれる）が更に分割される必要があるかどうかを決定する。

ルマブロックのサブ領域分割モード及びサブ領域の各々の予測情報及び残差情報が取得された後に、インター予測処理又はイントラ予測処理が、サブ領域の対応する予測モードに基づき各サブ領域に対して実行されて、サブ領域のインター予測ピクチャ又はイントラ予測ピクチャを取得してよい。次に、逆量子化及び逆変換処理が、サブ領域の各々の残差情報に基づき、変換係数に対して実行され、残差ピクチャを取得する。残差ピクチャは、対応するサブ領域において予測ピクチャに重畳され、ルマブロックの再構成ピクチャを生成する。

クロマブロックの予測情報及び残差情報が取得された後に、インター予測処理又はイントラ予測処理が、クロマブロックの予測モードに基づきクロマブロックに対して実行されて、クロマブロックのインター予測ピクチャ又はイントラ予測ピクチャを取得してよい。次に、逆量子化及び逆変換処理が、クロマブロックの残差情報に基づき、変換係数に対して実行され、残差ピクチャを取得する。残差ピクチャは、クロマブロックの予測ピクチャに重畳され、クロマブロックの再構成ピクチャを生成する。

本発明の実施形態１では、現在ノードのクロマブロックが更に分割されないとき、当該方法は、現在ノードのルマブロックのみを分割するために使用されてよく、それにより、符号化及び復号効率を向上し、コーデックの最大スループットを低減し、コーデックの実装を容易にする。

実施形態２
実施形態１と比べて、ステップ９０６２に以下の制約が追加される。ルマノード（つまり、ルマブロックの子ノード）に対して同じ予測モードが使用される。つまり、各ルマノードに対して、イントラ予測又はインター予測が実行される。他のステップは実施形態１におけるものと同様であり、詳細は再び説明されない。

以下の方法のうちのいずれか１つが、ルマノードに対して同じ予測モードを使用するために使用されてよい。

方法１：現在フレームがＩフレームである場合、規定により、現在ノードの全部の子ノードに対して、イントラ予測が実行される。或いは、現在フレームがＰフレーム又はＢフレームである場合、パース処理が実行される第１ノード（略して第１子ノードであってよい）がパースされて、第１ノードの予測モードを取得する。残りの子ノード（略してルマノードである）の予測モードは、規定により、パース処理の実行される第１ノードの予測モードである。或いは、
方法２：現在フレームがＩフレームである場合、規定により、現在ノードの全部の子ノードに対してイントラ予測が実行される。或いは、現在フレームがＰフレーム又はＢフレームである場合、規定により、現在ノードの全部の子ノードに対してインター予測が実行される。

実施形態３
図１１は、本発明の実施形態３による方法のフローチャート１１００である。実施形態３は、ステップ１１０４を除き、実施形態１と同様である。

ステップ１１０４：現在ノードの分割モードに基づき、現在ノードのサイズ、及び現在ノードの中でパース処理の実行される第１ノード（略して第１子ノードであってよい）の予測モード、現在ノードのクロマブロックが分割されるかどうか、を決定する。ここで、第１子ノードはルマブロックのみを含む。同じ予測モードが、現在ノードの複数の子ノードに対して実行される。各子ノードは、ルマブロックのみを含む。

現在ノードの分割モード及び現在ノードのサイズが先ず決定されるか、又は第１子ノードの予測モードが先ず決定されるかどうかは、本発明の本施形態で限定されない。

実施形態１又は２に基づき、実施形態３では、現在ノードのクロマブロックの分割モード、対応する予測情報パースモード、及び対応する残差情報パースモードは、現在ノードの第１子ノードの予測モードを参照して決定される。

実装では、現在ノードの分割モード及び現在ノードのサイズに基づき、現在ノードを分割することにより生成された子ノードが、辺の長さが第１閾値と等しい又は辺の長さが第２閾値より短いマクロブロックを含むこと、及び第１子ノードの予測モードがイントラ予測であることが決定される。この場合、現在ノードのクロマブロックは更に分割されない。実施形態１と同様に、例えば、第１閾値は２であってよく、第２閾値は４であってよい。

別の実装では、第１子ノードの予測モードは、イントラ予測であり、条件１～条件５のいずれか１つが真である。
条件１：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが垂直２分割である。
条件２：現在ノードの高さが第２閾値の２倍に等しく、現在ノードの分割モードが水平２分割である。
条件３：現在ノードの幅が第２閾値の４倍に等しく、現在ノードの分割モードが垂直３分割である。
条件４：現在ノードの高さが第２閾値の４倍に等しく、現在ノードの分割モードが水平３分割である。又は、
条件５：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが４分割であり、現在ノードのクロマブロックは更に分割されない。

第１子ノードの予測モードがイントラ予測であるとき、第１実施形態と同様に、第３の実装では、幅が第１閾値であるクロマブロック（又は、幅が第２閾値より狭いクロマブロック）が、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、幅が第１閾値であるクロマブロック（又は、幅が第２閾値より狭いクロマブロック）を含むと決定され、第１子ノードの予測モードがイントラ予測である場合、現在ノードのクロマブロックは更に分割されない。例えば、第１閾値は２であってよく、第２閾値は４であってよい。

第１子ノードの予測モードがイントラ予測であるとき、第１実施形態と同様に、第４の実装では、クロマサンプル数が第３閾値より少ないクロマブロックが、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、クロマサンプル数が第３閾値より少ないクロマブロックを含むと決定され、第１子ノードの予測モードがイントラ予測である場合、現在ノードのクロマブロックは更に分割されない。例えば、第３閾値は１６であってよい。この場合、クロマサンプル数が１６より少ないクロマブロックは、限定ではないが、２×２クロマブロック、２×４クロマブロック、及び４×２クロマブロックを含む。第３閾値は８であってよい。この場合、クロマサンプル数が８より少ないクロマブロックは、限定ではないが、２×２クロマブロックを含む。

第１子ノードの予測モードがイントラ予測であるとき、第１実施形態と同様に、第５の実装では、高さが第１閾値であるクロマブロック（又は、高さが第２閾値より低いクロマブロック）が、現在ノードの分割モードに基づき現在ノードを分割することにより生成されるかどうかが決定されてよい。現在ノードを分割することにより生成された子ノードが、高さが第１閾値であるクロマブロック（又は、高さが第２閾値より低いクロマブロック）を含むと決定され、第１子ノードの予測モードがイントラ予測である場合、現在ノードのクロマブロックは更に分割されない。例えば、第１閾値は２であってよく、第２閾値は４であってよい。

現在ノードのクロマブロックが更に分割されない場合、現在ノードのクロマブロックは、クロマブロックのみを含む符号化単位になる。方法１１００は、クロマブロックの予測情報及び／又は残差情報を取得するステップを更に含んでよい。

別の実装では、現在ノードの分割モード及び現在ノードのサイズに基づき、現在ノードを分割することにより生成された子ノードが、辺の長さが閾値より短いクロマブロックを含むと決定される。第１子ノードの予測モードがインター予測である場合、現在ノードのクロマブロックは、現在ノードの分割モードに基づき分割される。任意的に、クロマブロックの対応する子ノードの動き情報は、現在ノードの子ノードの動き情報に基づき決定される。例えば、現在ノードのクロマブロックの子ノードの動き情報は、対応するルマノードの動き情報として設定されてよい（つまり、クロマブロックの各子ノードの動き情報は、ビットストリームからパースされる必要がない）。クロマブロックの子ノードは、クロマブロックの子ノードの残差情報を取得するためにパースされる。

第１子ノードの予測モードがインター予測であるとき、以下の条件のいずれか１つが真である。
条件１：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが垂直２分割である。
条件２：現在ノードの高さが第２閾値の２倍に等しく、現在ノードの分割モードが水平２分割である。
条件３：現在ノードの幅が第２閾値の４倍に等しく、現在ノードの分割モードが垂直３分割である。
条件４：現在ノードの高さが第２閾値の４倍に等しく、現在ノードの分割モードが水平３分割である。又は、
条件５：現在ノードの幅が第２閾値の２倍に等しく、現在ノードの分割モードが４分割である場合、現在ノードのクロマブロックは依然として分割される必要がある。

実施形態３では、クロマブロック分割モード、対応する予測情報パースモード、及び対応する残差情報パースモードは、ルマノードの予測モードに基づき決定されてもよい。このように、より高い柔軟性が達成される。更に、ルマノードの予測モードがイントラ予測であるとき、現在ノードのクロマブロックは更に分割されない。それにより、クロマ符号化及び復号効率を向上し、コーデックの最大スループットを低減し、コーデックの実装を容易にする。

ＣＵレベルの幾つかのシンタックス構造は、表１に示され得る。現在ノードが子ノードに更に分割されない場合、現在ノードは符号化単位であり、符号化単位の予測ブロックは以下のシンタックス構造に従いパースされる。

ｓｋｉｐ＿ｆｌａｇはスキップモードを表すフラグである。ｓｋｉｐ＿ｆｌａｇの値が１であるとき、それは、スキップモードが現在ＣＵに使用されることを示す。或いは、ｓｋｉｐ＿ｆｌａｇの値が０であるとき、それは、スキップモードが現在ＣＵに使用されないことを示す。

ｍｅｒｇｅ＿ｆｌａｇは直接モードを表すフラグである。ｍｅｒｇｅ＿ｆｌａｇの値が１であるとき、それは、マージモードが現在ＣＵに使用されることを示す。或いは、ｍｅｒｇｅ＿ｆｌａｇの値が０であるとき、それは、マージモードが使用されないことを示す。

ｃｕ＿ｐｒｅｄ＿ｍｏｄｅは、符号化単位の予測モードを表すフラグである。ｃｕ＿ｐｒｅｄ＿ｍｏｄｅの値が１であるとき、それは、イントラ予測モードが現在符号化単位に使用されることを示す。或いは、ｃｕ＿ｐｒｅｄ＿ｍｏｄｅの値が０であるとき、それは、共通インター予測モードが現在符号化単位に使用されることを示す。
表１

ＣＵレベルの幾つかのシンタックスパースは、表２に示され得る。表２は単なる例である。表２で、ｓｋｉｐ＿ｆｌａｇの意味は、表１のｓｋｉｐ＿ｆｌａｇのものと同じであり、ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの意味は、表１のｃｕ＿ｐｒｅｄ＿ｍｏｄｅのものと同じである。

ｃｕ＿ｓｋｉｐ＿ｆｌａｇはスキップモードを表すフラグである。ｃｕ＿ｓｋｉｐ＿ｆｌａｇの値が１であるとき、それは、スキップモードが現在ＣＵに使用されることを示す。或いは、ｃｕ＿ｓｋｉｐ＿ｆｌａｇの値が０であるとき、それは、スキップモードが現在ＣＵに使用されないことを示す。

ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇは、符号化単位の予測モードを表すフラグである。ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が１であるとき、それは、イントラ予測モードが現在予測単位に使用されることを示す。或いは、ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が０であるとき、それは、共通インター予測モードが現在予測単位に使用されることを示す。ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が１である場合、ＣｕＰｒｅｄＭｏｄｅ［ｘ０］［ｙ０］の値はＭＯＤＥ＿ＩＮＴＲＡである。或いは、ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が０である場合、ＣｕＰｒｅｄＭｏｄｅ［ｘ０］［ｙ０］の値はＭＯＤＥ＿ＩＮＴＥＲである。
表２

８×Ｍ（又はＭ×８）のサイズを有するノードは、垂直２分割（又は水平２分割）モードで、４×Ｍ（又はＭ×４）のサイズを有する２個の子ノードに分割される。同様に、１６×Ｍ（又はＭ×１６）のサイズを有するノードは、垂直拡張４分割（又は水平拡張４分割）モードで、４×Ｍ（又はＭ×４）のサイズを有する４個の子ノード、及び８×Ｎ（又はＮ×８）のサイズを有する１個の子ノードに分割される。同様に、１６×Ｍ（又はＭ×１６）のサイズを有するノードは、垂直３分割（又は水平３分割）モードで分割されて、２個の４×Ｍ（又はＭ×４）のサイズを有する子ノード、及び８×Ｍ（又はＭ×８）のサイズを有する１個の子ノードを生成する。ＹＵＶ４：２：０のデータ形式では、クロマ成分の解像度はルマ成分の１／２である。つまり、４×Ｍノードは、１個の４×Ｍルマブロック及び２個の２×（Ｍ／２）クロマブロックを含む。ハードウェアデコーダでは、小さなブロック（具体的には２×２、２×４、及び２×８のサイズを有する）の処理コストは、比較的高い。しかしながら、この分割モードでは、２×２、２×４、等のサイズを有する小さなブロックが生成され、これは、ハードウェアデコーダの実装にとって望ましくない。ハードウェアデコーダでは、小さなブロックの処理の複雑さが比較的高く、これは、具体的に以下の３つの態様で実現される。

（１）イントラ予測における問題：ハードウェア設計では、処理速度を向上するために、１６個のピクセルが、通常、イントラ予測では同時に１回処理され、２×２、２×４、４×２等のサイズを有する小さなブロックは１６個より少ないピクセルを含み、イントラ予測処理性能を低下させる。

（２）係数符号化における問題：ＨＥＶＣでは、変換係数符号化は、１６個の係数を含む係数グループ（coefficient group, CG）に基づくが、２×２、２×４、４×２等のサイズを有する小さなブロックは、４又は８個の変換係数を含む。結果として、４個の係数及び８個の係数を含む係数グループが、これらの小さなブロックの係数符号化をサポートするために追加される必要がある。その結果、実装の複雑さが増大する。

（３）インター予測における問題：小さなブロックに対するインター予測は、データ帯域幅に対する比較的高い要件を生じ、復号処理速度にも影響する。

ノードが分割モードに基づき更に分割され、生成された子ノードのうちの１つが、辺の長さが２であるクロマブロックを含むとき、子ノードに含まれるルマブロックは、この分割モードで更に分割され続け、子ノードに含まれるクロマブロックは更に分割されない。このモードは、辺の長さが２であるクロマブロックの生成を回避し、デコーダの最大スループットを低減し、デコーダの実装を容易にできる。更に、ルマブロック予測モードに基づきクロマブロック予測モードを決定する方法が提案され、符号化効率を効果的に向上する。

本発明で提供される方法は、前述の実施形態におけるビデオコーデックに適用されてよい。

実施形態４
本実施形態は、ビデオ復号におけるブロック分割モードに関する。本実施形態におけるビデオデータ形式はＹＵＶ４：２：０形式である。同様のモードは、ＹＵＶ４：２：２データに使用されてよい。

ステップ１：ノードＡの分割モードＳをパースする。ここで、ノードＡが分割され続ける場合、ステップ２が実行される。或いは、現在ノードが子ノードに更に分割されない場合、現在ノードは１つの符号化単位に対応し、符号化単位に関する情報は、パースを通じて取得される。

ノードＡの分割モードは、４分割、垂直２分割、水平２分割、垂直３分割、及び水平３分割、のうちの少なくとも１つであってよく、又は別の分割モードであってよい。ノードＡの分割モードは、本発明で限定されない。現在ノードの分割モード情報は、ビットストリーム内で送信されてよく、現在ノードの分割モードは、ビットストリーム内の対応するシンタックス要素をパースすることにより取得されてよい。現在ノードの分割モードは、代替として、プリセットルールに従い決定されてよく、本発明で限定されない。

ステップ２：分割モードＳに基づきノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ノードＢのクロマブロックが小さなブロックであるかどうか（又は、ノードＡの幅、高さ、及び／又は分割モード、及び／又はノードＢの幅及び高さが、条件のうちの少なくとも１つを満たすかどうか）を決定する。ノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ノードＢのクロマブロックが小さなブロックである場合、ステップ３～ステップ６が実行される。

具体的に、ノードＡの少なくとも１つの子ノードＢのクロマブロックがサブブロックであるかどうかを決定するために、以下の方法のうちの１つが使用されてよい。
（１）ノードＡの少なくとも１つの子ノードＢのクロマブロックが、２×２、２×４、又は４×２のサイズを有する場合、ノードＡの少なくとも１つの子ノードＢのクロマブロックは、小さなブロックである。
（２）ノードＡの少なくとも１つの子ノードＢのクロマブロックの幅又は高さが２である場合、ノードＡの少なくとも１つの子ノードＢのクロマブロックは小さなブロックである。
（３）ノードＡが１２８個のルマサンプルを含み、ノードＡに対して３分木分割が実行された、又は、ノードＡが６４個のルマサンプルを含み、ノードＡに対して２分木分割が実行され、４分木分割モード又は３分木分割モードの場合、ノードＡの少なくとも１つの子ノードＢのクロマブロックは小さなブロックである。
（４）ノードＡが２５６個のルマサンプルを含み、ノードが３分木分割モード又は４分木分割モードで分割された、又は、ノードＡが１２８個のルマサンプルを含み、ノードが２分木分割モードで分割された場合、ノードＡの少なくとも１つの子ノードＢのクロマブロックは小さなブロックである。
（５）ノードＡがＮ１個のルマサンプルを含み、ノードＡに対して３分木分割が実行された場合、ここでＮ１は６４、１２８、又は２５６である。
（６）ノードＡがＮ２個のルマサンプルを含み、ノードＡに対して４分木分割が実行された場合、ここでＮ２は６４、又は２５６である。或いは、
（７）ノードＡがＮ３個のルマサンプルを含み、ノードＡが２分木分割モードで分割された場合、ここでＮ３は６４、１２８、又は２５６である。

留意すべきことに、ノードＡが１２８個のルマサンプルを含むことは、現在ノードの面積が１２８である、又はノードＡの幅と高さとの積が１２８である、として記載されることもある。詳細はここに説明されない。

ステップ３：イントラ予測又はインター予測がノードＡのカバレッジ領域内の全部の符号化単位に対して実行される、と制限する。全部の符号化単位に対するイントラ予測及びインター予測では、小さなブロックに対する並列処理がハードウェアにより実施されてよく、それにより、符号化及び復号性能を向上する。

ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測又はインター予測を実行することを決定するために、以下の方法のうちの１つが使用されてよい。

方法１：シンタックステーブル内のフラグに基づき、決定が行われる。

分割モードＳに基づきノードＡを分割することにより取得された少なくとも１つの子ノードＢのクロマブロックが、小さなブロックである（及びノードＡのクロマブロックが小さなブロックではない）場合、フラグｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇがビットストリームからパースされる。ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が０であるとき、それは、ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測が実行されることを示す。或いは、ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値が１であるとき、それは、ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行されることを示す。ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇは、ブロック分割処理の中でパースされる必要のあるシンタックス要素であってよい。シンタックス要素がパースされるとき、ノードＡのカバレッジ領域内の符号化単位のｃｕ＿ｐｒｅｄ＿ｍｏｄｅは、もはやパースされなくてよく、ｃｕ＿ｐｒｅｄ＿ｍｏｄｅの値は、ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値に対応する規定値である。

留意すべきことに、イントラ予測モードのみが、ノードＡの子ノードのために使用できる、例えば、ノードＡがイントラピクチャ内にある（つまり、ノードＡの位置するピクチャのタイプがイントラタイプ又はＩタイプである）、又はノードＡがイントラピクチャ内にあり、シーケンスのためにＩＢＣ技術が使用されない場合、ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇの値は規定により１であり、ｃｏｎｓ＿ｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇはビットストリーム内に存在しない。ＩＢＣ技術は、インター予測に属してよく、又はイントラ予測に属してよい。

方法２：ノードＡの領域内の第１ノードの予測モードに基づき、決定が行われる。

ノードＡの領域内の第１符号化単位Ｂ０の予測モード（ここで、第１符号化単位Ｂ０の予測モードは限定されない）がパースされる。Ｂ０の予測モードがイントラ予測である場合、ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行される。或いは、Ｂ０の予測モードがインター予測である場合、ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測が実行される。

ステップ４：ノードＡのカバレッジ領域内の符号化単位に使用される予測モードに基づき、ノードＡのクロマブロック分割モード及びルマブロック分割モードを決定する。

ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測モードが使用される場合、ノードＡのルマブロックは分割モードＳに基づき分割されて、Ｎ個のルマ符号化木ノードを取得する。ノードＡのクロマブロックは分割されず、１つのクロマ符号化ブロック（略してクロマＣＢである）に対応する。Ｎ個のルマ符号化木ノードは、更に分割されないことに限定されてよく、又は限定されなくてよい。ルマ子ノードが分割され続ける場合、再帰的分割を実行するために、ルマ子ノードの分割モードがパースされる。ルマ符号化木ノードが更に分割されない場合、ルマ符号化木ノードは、ルマ符号化ブロック（略してルマＣＢである）に対応する。クロマＣＢに対応するクロマ変換ブロック及びクロマ符号化ブロックは、同じサイズを有し、クロマ予測ブロック及びクロマ符号化ブロックは同じサイズを有する。

ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測モードが使用される場合、ノードＡのルマブロック及びクロマブロックは、分割モードＳに基づき、ルマブロック及びクロマブロックを含むＮ個の符号化木ノードに更に分割され、Ｎ個の符号化木ノードは、分割され続けてよく又は分割されなくてよく、ルマブロック及びクロマブロックを含む符号化単位に対応してよい。

ステップ５：ノードＡを分割することにより取得されたＣＵの予測情報及び残差情報をパースする。

予測情報は、予測モード（イントラ予測モード又は非イントラ予測モードを示す）、イントラ予測モード、インター予測モード、動き情報、等を含む。動き情報は、予測方向（前方、後方、又は両方向）、参照インデックス（reference index）、及び動きベクトル（motion vector）のような情報を含んでよい。

残差情報は、符号化ブロックフラグ（coded block flag, CBF）、変換係数、変換タイプ（例えば、ＤＣＴ－２、ＤＳＴ－７、ＤＣＴ－８）、等を含む。変換タイプは規定によりＤＣＴ－２であってよい。

イントラ予測のみが、ノードＡを分割することにより取得された各ＣＵに対して実行できることが限定される場合、ノードＡを分割することにより取得されたルマＣＢの予測ブロックのパースは、ｓｋｉｐ＿ｆｌａｇ、ｍｅｒｇｅ＿ｆｌａｇ、及びｃｕ＿ｐｒｅｄ＿ｍｏｄｅがそれぞれ０、０、及び１に設定されること（つまり、ｓｋｉｐ＿ｆｌａｇ、ｍｅｒｇｅ＿ｆｌａｇ、及びｃｕ＿ｐｒｅｄ＿ｍｏｄｅのいずれもビットストリーム内に存在しない）、又は、ｓｋｉｐ＿ｆｌａｇ及びｃｕ＿ｐｒｅｄ＿ｍｏｄｅがそれぞれ規定により０及び１に設定されること（つまり、ｓｋｉｐ＿ｆｌａｇ及びｃｕ＿ｐｒｅｄ＿ｍｏｄｅのいずれもビットストリーム内に存在しない）、及びルマＣＢのイントラ予測モード情報がパースされることを含み、ノードＡを分割することにより取得されたクロマＣＢの予測ブロックのパースは、クロマＣＢのイントラ予測モードのパースを含む。クロマＣＢのイントラ予測モードをパースする方法は、以下であってよい。（１）ビットストリームからシンタックス要素をパースして、クロマＣＢのイントラ予測モードを取得する。及び（２）クロマＣＢのイントラ予測モードを、クロマイントラ予測モードセットの中の１つの予測モード、例えば、クロスコンポーネント線形モデルモード、ＤＭモード（chroma derived mode, DM）、又はＩＢＣモード、のうちの１つに直接設定する。

ノードＡを分割することにより取得される各ＣＵに対してインター予測のみが実行できることが限定される場合、ノードＡを分割することにより取得されるＣＵの予測モードのパースは、ｓｋｉｐ＿ｆｌａｇ又は／及びｍｅｒｇｅ＿ｆｌａｇをパースすること、ｃｕ＿ｐｒｅｄ＿ｍｏｄｅを規定により０に設定すること、及びパースを通じて、マージインデックス（merge index）、インター予測方向（inter dir）、参照インデックス（reference index）、動きベクトル予測インデックス（motion vector predictor index）、及び動きベクトル差（motion vector difference）のようなインター予測ブロックを取得することを含む。

ｓｋｉｐ＿ｆｌａｇはスキップモードを表すフラグである。ｓｋｉｐ＿ｆｌａｇの値が１であるとき、それは、スキップモードが現在ＣＵに使用されることを示す。或いは、ｓｋｉｐ＿ｆｌａｇの値が０であるとき、それは、スキップモードが現在ＣＵに使用されないことを示す。ｍｅｒｇｅ＿ｆｌａｇはマージモードを表すフラグである。ｍｅｒｇｅ＿ｆｌａｇの値が１であるとき、それは、マージモードが現在ＣＵに使用されることを示す。或いは、ｍｅｒｇｅ＿ｆｌａｇの値が０であるとき、それは、マージモードが使用されないことを示す。ｃｕ＿ｐｒｅｄ＿ｍｏｄｅは、符号化単位の予測モードを表すフラグである。ｃｕ＿ｐｒｅｄ＿ｍｏｄｅの値が１であるとき、それは、現在予測単位に対してイントラ予測が実行されることを示す。或いは、ｃｕ＿ｐｒｅｄ＿ｍｏｄｅの値が０であるとき、それは、現在予測単位に対して共通インター予測が実行されることを示す（インター予測方向、参照インデックス、動きベクトル予測インデックス、及び動きベクトル差成分のような情報はビットストリーム内で識別される）。

留意すべきことに、本実施形態では、イントラ予測モードは、符号化ブロックの位置するピクチャの空間参照ピクセルを用いて符号化ブロックの予測を生成するための予測モード、例えば直流モード（direct current mode, DC mode）、平面モード（Planar mode）、又は角度モード（angular mode）であり、又は、テンプレートマッチングモード（template matching mode）及びＩＢＣモードである。

インター予測モードは、符号化ブロックの参照ピクチャ内の時間的参照ピクセルを用いて符号化ブロックの予測を生成する予測モード、例えば、スキップモード（Skip mode）、マージモード（Merge mode）、ＡＭＶＰ（advanced motion vector prediction）モード、又は共通インターモード若しくはＩＢＣモードである。

ステップ６：各ＣＵを復号して、ノードＡに対応するピクチャブロックの再構成信号を取得する。

例えば、各ＣＵの予測ブロックは、ＣＵに対してインター予測処理又はイントラ予測処理を実行して、ＣＵのインター予測ピクチャ又はイントラ予測ピクチャを取得する。次に、逆量子化及び逆変換処理が、各ＣＵの残差情報に基づき、変換係数に対して実行され、残差ピクチャを取得する。残差ピクチャは、対応する領域において予測ピクチャに重畳され、再構成ピクチャを生成する。

実施形態４における分割モードによると、イントラ予測の実行される小さなクロマブロックが生成されない。それにより、小さなブロックのイントラ予測における問題を解消する。

実施形態５
本実施形態のステップ１、ステップ２、ステップ３、及びステップ６は、実施形態４のものと同じである。

ステップ４：ノードＡのクロマブロック分割モード及びルマブロック分割モードを決定する。

ノードＡのルマブロックは、分割モードＳに基づき分割され続けて、Ｎ個のルマ符号化木ノードを生成する。ノードＡのクロマブロックは、更に分割されず、１つのクロマ符号化ブロック（クロマＣＢ）に対応する。クロマＣＢに対応するクロマ変換ブロック及びクロマ符号化ブロックは同じサイズを有する。［注：実施形態４と比べて、本実施形態では、インター予測モード又はイントラ予測モードが使用されるかが限定されるかどうかに拘わらず、クロマブロックは常に分割されず、ルマブロックは、ノードＡのカバレッジ領域の予測モードに拘わらず分割モードＳに基づき常に分割される。］

ステップ５：ノードＡを分割することにより取得されたＣＵの予測ブロック及び残差情報をパースする。

ノードＡを分割することにより取得された各ＣＵに対してイントラ予測のみが実行できることが限定される場合、処理は実施形態４におけるものと同じである。

ノードＡを分割することにより取得される各ＣＵに対してインター予測のみが実行できることが限定される場合、ノードＡを分割することにより取得されるルマＣＢの予測モードのパースは、ｓｋｉｐ＿ｆｌａｇ又は／及びｍｅｒｇｅ＿ｆｌａｇをパースすること、ｃｕ＿ｐｒｅｄ＿ｍｏｄｅを規定により０に設定すること、及びパースを通じて、マージインデックス（merge index）、インター予測方向（inter dir）、参照インデックス（reference index）、動きベクトル予測インデックス（motion vector predictor index）、及び動きベクトル差（motion vector difference）のようなインター予測ブロックを取得することを含む。ルマＣＢ内の各４×４サブブロックの動き情報は、パースを通じて取得されるインター予測ブロックから導出される。

ノードＡを分割することにより取得された各ＣＵに対してインター予測のみが実行できることが限定される場合、ノードＡを分割することにより取得されたクロマＣＢの予測ブロックはパースされる必要がなく、クロマＣＢは、２×２クロマサブブロックに分割される（ここで、分割モードは分割モードＳであってよい）。各２×２クロマサブブロックの動き情報は、２×２クロマサブブロックに対応する４×４ルマ領域の動き情報である。

実施形態５における分割モードによると、イントラ予測の実行される小さなクロマブロックも、１６ピクセルより少ない変換ブロックも、生成されない。従って、イントラ予測及び係数符号化における上述の問題は、実施形態５において解消される。

実施形態６
本実施形態のステップ１、ステップ２、ステップ３、ステップ４、及びステップ６は、実施形態５のものと同じである。

ノードＡを分割することにより取得された各ＣＵに対してイントラ予測のみが実行できることが限定される場合、処理は実施形態５におけるものと同じである。

ノードＡを分割することにより取得された各ＣＵに対してインター予測のみが実行できることが限定される場合、ノードＡを分割することにより取得されるルマＣＢの予測ブロックのパースは実施形態５におけるものと同じである。

ノードＡを分割することにより取得された各ＣＵに対してインター予測のみが実行できることが限定される場合、ノードＡを分割することにより取得されたクロマＣＢの予測ブロックは、パースされる必要がなく、クロマ予測ブロック及びクロマ符号化ブロックは同じサイズを有し、クロマＣＢの動き情報は、クロマＣＢに対応するルマ領域内の特定のプリセット位置（例えば、ルマ領域の中央、右下角、又は左上角）の動き情報である。

実施形態６における分割モードによると、イントラ予測の実行される小さなクロマブロック、小さなブロックの変換ブロック、及びインター予測の生成される小さなクロマブロックのいずれも、生成されない。

実施形態７
ステップ１：ステップ１は、実施形態４のステップ１と同じである。

ステップ２：分割モードＳに基づきノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ブロックＢのルマブロックが４×４ルマブロックであるかどうか（ノードＡの幅、高さ、及び／又は分割モード、及び／又はノードＢの幅及び高さが、ケース１の条件のうちの少なくとも１つを満たすかどうか）を決定する。

ノードＡのサイズ（つまり、幅及び高さ）、及び／又は分割モードＳが、ケース１の条件のうちの少なくとも１つを満たす場合、ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行されることが限定される。その他の場合、分割モードＳに基づきノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ノードＢのクロマブロックが小さなブロックであるかどうか（ノードＡのサイズ及び／又は分割モードＳ、及び／又はノードＢの幅及び高さが、ケース２の条件のうちの少なくとも１つを満たすかどうか）が決定され、「はい」の場合、ステップ３～ステップ６が実行される。

具体的に、ノードＡの少なくとも１つの子ノードＢのクロマブロックが小さなブロックであることを決定する方法には以下の２つのケースがある。

ケース１：

以下のプリセット条件のうちの１つ以上が真である場合、ノードＡは、分割モードＳに基づき分割されて、４×４ルマブロックを取得する。
（１）ノードＡがＭ１個のピクセルを含み、ノードＡの分割モードが４分木分割である。例えば、Ｍ１は６４である。
（２）ノードＡがＭ２個のピクセルを含み、ノードＡの分割モードが３分木分割である。例えば、Ｍ２は６４である。
（３）ノードＡがＭ３個のピクセルを含み、ノードＡの分割モードが２分木分割である。例えば、Ｍ３は３２である。
（４）ノードＡの幅が第２閾値の４倍に等しく、ノードＡの高さが第２閾値に等しく、ノードＡの分割モードが垂直３分木分割である。
（５）ノードＡの幅が第２閾値に等しく、ノードＡの高さが第２閾値の４倍に等しく、ノードＡの分割モードが水平３分木分割である。
（６）ノードＡの幅が第２閾値の２倍に等しく、ノードＡの高さが第２閾値に等しく、現在ノードの分割モードが垂直２分木分割である。
（７）ノードＡの高さが第２閾値の２倍に等しく、ノードＡの幅が第２閾値に等しく、現在ノードの分割モードが水平２分木分割である。又は、
（８）ノードＡの幅又は／及び高さが第２閾値の２倍であり、ノードＡの分割モードが４分木分割である。

サイズは、ノードＡに対応するピクチャ領域の幅及び高さ、又は、ノードＡに対応するピクチャ領域に含まれるルマサンプルの数、又はノードＡに対応するピクチャ領域の面積であってよい。

ケース２：
（１）ノードＡの少なくとも１つの子ノードＢのクロマブロックは、２×４又は４×２のサイズを有する。
（２）ノードＡの少なくとも１つの子ノードＢのクロマブロックの幅又は高さは、２である。
（３）ノードＡが１２８個のルマサンプルを含み、ノードＡに対して３分木分割が実行される、又は、ノードＡが６４個のルマサンプルを含み、ノードＡに対して２分木分割、４分木分割、又は３分木分割が実行される。
（４）ノードＡが２５６個のルマサンプルを含み、ノードに対して３分木分割又は４分木分割が実行される、又は、ノードＡが１２８個のルマサンプルを含み、ノードに対して２分木分割が実行される。
（５）ノードＡがＮ１個のルマサンプルを含み、ノードＡに対して３分木分割が実行され、ここでＮ１は６４、１２８、又は２５６である。
（６）ノードＡがＮ２個のルマサンプルを含み、ノードＡに対して４分木分割が実行され、ここでＮ２は６４、又は２５６である。或いは、
（７）ノードＡがＮ３個のルマサンプルを含み、ノードＡに対して２分木分割が実行され、ここでＮ３は６４、１２８、又は２５６である。

ステップ３：ステップ３は、実施形態４のステップ３と同じである。

ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測モードが使用される場合、ノードＡのルマブロック及びクロマブロックは、分割モードＳに基づき分割されて、ノードＡの子ノード及び／又はノードＡのカバレッジ領域内の子ノードを取得する。ノードＡの子ノード及び／又はノードＡのカバレッジ領域内の子ノードの分割モードに基づき、４×４ルマブロックが生成された場合、子ノードの分割モードは許可されず、又は子ノードは分割され続けることができない。例えば、ノードＡが８×８のサイズを有し、水平２分木分割（又は垂直２分木分割）モードでノードＡを分割することにより２個の８×４（又は２個の４×８）ノードが生成された場合、８×４（又は４×８）ノードは４×４ブロックへと分割され続ける。この場合、８×４（又は４×８）ノードは分割され続けることができない。

ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測モードが使用される場合、実施形態４、５、及び６における方法は、実装方法として使用されてよく、詳細はここで再び説明されない。例えば、ノードＡのルマブロックが分割され、ノードＡのクロマブロックは分割されない。

このステップは、実施形態４におけるステップ５と同じであり、詳細はここで再び説明されない。

ステップ６は、実施形態４におけるステップ６の方法で実施されてよく、ここで更に説明されない。

実施形態８
ステップ１：ステップ１は、実施形態４のステップ１と同じである。

ステップ２：分割モードＳに基づきノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ブロックＢのルマブロックが４×４ルマブロックであるかどうか（ノードＡの幅、高さ、及び／又は分割モード、及び／又はノードＢの幅及び高さが、ケース１の条件のうちの少なくとも１つを満たすかどうか）を決定する。ノードＡのサイズ（つまり、幅及び高さ）及び／又は分割モードＳが、ケース１の条件のうちの少なくとも１つを満たす場合、ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行されることが限定される。又は、
分割モードＳに基づきノードＡを分割することにより取得された子ノードの中の少なくとも１つの子ノードＢのクロマブロックが小さなブロックであるかどうか（又は、ノードＡのサイズ及び／又は分割モードＳ、及び／又はノードＢの幅及び高さが、ケース２の条件のうちの少なくとも１つを満たすかどうかが決定され、ステップ３～ステップ６が実行される。

ケース１：

以下のプリセット条件のうちの１つ以上が真である場合、ノードＡは、分割モードＳに基づき分割されて、４×４ルマブロックを取得する。
（１）ノードＡがＭ１個のピクセルを含み、ノードＡの分割モードが４分木分割である。例えば、Ｍ１は６４である。
（２）ノードＡがＭ２個のピクセルを含み、ノードＡの分割モードが３分木分割である。例えば、Ｍ２は１２８である。
（３）ノードＡがＭ３個のピクセルを含み、ノードＡの分割モードが２分木分割である。例えば、Ｍ３は３２である。
（４）ノードＡの幅が第２閾値の４倍に等しく、ノードＡの高さが第２閾値に等しく、ノードＡの分割モードが垂直３分木分割である。
（５）ノードＡの幅が第２閾値に等しく、ノードＡの高さが第２閾値の４倍に等しく、ノードＡの分割モードが水平３分木分割である。
（６）ノードＡの幅が第２閾値の２倍に等しく、ノードＡの高さが第２閾値に等しく、現在ノードの分割モードが垂直２分木分割である。
（７）ノードＡの高さが第２閾値の２倍に等しく、ノードＡの幅が第２閾値に等しく、現在ノードの分割モードが水平２分木分割である。又は、
（８）ノードＡの幅又は／及び高さが第２閾値の２倍であり、ノードＡの分割モードが４分木分割である。

留意すべきことに、ノードＡが１２８個のルマサンプルを含むことは、現在ノードの面積が１２８である、又はノードＡの幅と高さとの積が１２８である、として記載されることもある。詳細はここに記載されない。

ステップ３。ステップ３は、実施形態４のステップ３と同じである。

ステップ４。ノードＡのカバレッジ領域内の符号化単位に使用される予測モードに基づき、ノードＡのクロマブロック分割モード及びルマブロック分割モードを決定する。

ノードＡのカバレッジ領域内の全部の符号化単位にインター予測モードが使用される場合、ノードＡの子ノード及び／又はノードＡのカバレッジ領域内の子ノードを取得するために、ノードＡのルマブロック及びクロマブロックは、分割モードＳに基づき分割される。ノードＡの子ノード及び／又はノードＡのカバレッジ領域内の子ノードの分割モードに基づき、４×４ルマブロックが生成された場合、子ノードの分割モードは許可されず、又は子ノードは分割され続けることができない。例えば、ノードＡが８×８のサイズを有し、水平２分木分割（又は垂直２分木分割）モードでノードＡを分割することにより２個の８×４（又は２個の４×８）ノードが生成された場合、８×４（又は４×８）ノードは４×４ブロックへと分割され続ける。この場合、８×４（又は４×８）ノードは分割され続けることができない。

ステップ５。ノードＡを分割することにより取得されたＣＵの予測ブロック及び残差情報をパースする。

ステップ６。各ＣＵを復号して、ノードＡに対応するピクチャブロックの再構成信号を取得する。

実施形態９
現在領域が１回分割されて、４×４ルマブロックを生成する場合（例えば、６４個のルマサンプルがＱＴモードで分割される、又は１２８個のルマサンプルがＴＴモードで分割される）、イントラモードのみが規定により現在領域に対して使用できることが限定される。

その他の場合、インターモードのみ又はイントラモードのみが現在領域に対して使用できることを示すために、フラグが転送される。

インターモードのみが現在領域に対して使用できることが限定される場合、ルマ及びクロマは一緒に分割される。現在領域内のノードが分割されて、４×４ルマブロックを生成する場合、この分割は許可されない。例えば、現在ノードが８×８であり、ＨＢＴ（又はＶＢＴ）モードで分割され、２個の８×４ノードを生成する場合。これらのノードが分割され続けて、４×４ＣＵを生成する場合、これらの８×４ノードは分割され続けることができない。

イントラモードのみが領域に対して使用できることが限定される場合、この実装は、元の実装と同じである（ルマが分割されるが、クロマは分割されない）。

本発明の本実施形態は、イントラ予測モードが比較的小さな面積を有するクロマブロックに対して使用されることを回避し、及びデコーダのハードウェアのパイプライン処理及び実装を容易にするために、ブロック分割方法を提供する。更に、インター予測では、幾つかの予測モードのシンタックス要素をパースする処理は、スキップされてよく、それにより符号化の複雑さを低減する。

この方法で、係数符号化における問題が解消され、符号化の複雑さが低減される。

ブロック分割方法は、以下の通りであってよい。

ノードＡの分割モードがパースされる。

分割モードＳに基づきノードＡが分割された後に、少なくとも１つの子ノードＢのクロマブロックが小さなブロックとして取得されるかどうかが決定される。（ノードＡの幅、高さ、及び／又は分割モード、及び／又はノードＢの幅及び高さが前述の条件のうちの少なくとも１つを満たすかどうかが決定される。）
ノードＡが分割モードＳに基づき分割された後に、少なくとも１つの子ノードＢのクロマブロックが小さなブロックとして取得されると決定された場合、イントラ予測モードまたはインター予測モードが、ノードＡのカバレッジ領域内の全部の符号化単位に対して使用される。

ノードＡのクロマブロック及びルマブロックを分割し続けるかどうかが決定される。

ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行される場合、ノードＡのルマブロックは、分割モードＳに基づき分割され続け、ノードＡのクロマブロックは更に分割されない。ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測が実行される場合、ノードＡのルマブロック及びクロマブロックは、分割モードＳに基づき、ルマブロック及びクロマブロックを含むＮ個の符号化木ノードに分割され続ける。

ノードＡのルマブロックは、分割モードＳに基づき分割され続け、ノードＡのクロマブロックは更に分割されない。クロマ変換ブロック及びクロマ符号化ブロックは同じサイズを有する。

ノードＡのカバレッジ領域内の全部の符号化単位に対してイントラ予測が実行されるとき、クロマ予測ブロック及びクロマ符号化ブロックは同じサイズを有する。或いは、ノードＡのカバレッジ領域内の全部の符号化単位に対してインター予測が実行されるとき、クロマ予測ブロックはサブブロックに分割され（ここで、サブブロックはクロマ符号化ブロックより小さい）、各サブブロックの動きベクトルは、サブブロックに対応するルマ領域内の動きベクトルである。

ノードＡのルマブロックは、分割モードＳに基づき更に分割される。ノードＡのクロマブロックは、更に分割されない。クロマブロックに対応するクロマ変換ブロック及びクロマ符号化ブロックは同じサイズを有し、クロマ予測ブロック及びクロマ符号化ブロックは同じサイズを有し、クロマＣＢの動き情報はクロマＣＢに対応するルマ領域内の特定のプリセット位置の動き情報である。

例えば、理解されるべきことに、記載の方法を参照して開示された内容は、当該方法を実行するよう構成される対応する装置又はシステムについても当てはまり得る、逆も同様である。例えば、１つ以上の特定の方法のステップが説明される場合、添付の図面にそのような１つ以上のユニットが明示的に説明され又は図示されない場合でも、対応する装置は、説明される１つ以上の方法のステップを実行するために、機能ユニットのような１つ以上のユニットを含んでよい（例えば、１つ以上のステップを実行する１つのユニット、又はそれぞれが複数のステップのうちの１つ以上を実行する複数のユニット）。更に、例えば、特定の機器が機能ユニットのような１つ以上のユニットに基づき説明される場合、添付の図面にそのような１つ以上のステップが明示的に説明され又は図示されない場合でも、対応する方法は、１つ以上のユニットの機能を実行するための１つのステップを含んでよい（例えば、１つ以上のユニットの機能を実行するための１つのステップ、又はそれぞれが複数のユニットのうちの１つ以上の機能を実行するために使用される複数のステップ）。更に、理解されるべきことに、本明細書で説明される例示的な実施形態及び／又は態様の特徴は、特に断りのない限り、互いに結合されてよい。

１つ以上の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせにより実装されてよい。ソフトウェアで実装される場合、機能は、１つ以上の命令又はコードとしてコンピュータ可読媒体に格納され又はそれを介して送信され、ハードウェアに基づく処理ユニットにより実行されてよい。コンピュータ可読媒体は、データ記憶媒体のような有形媒体に対応するコンピュータ可読記憶媒体、又は例えば通信プロトコルに従いある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体、を含んでよい。この方法では、コンピュータ可読媒体は、通常、（１）非一時的有形コンピュータ可読記憶媒体、又は（２）信号若しくは搬送波のような通信媒体、に対応してよい。データ記憶媒体は、本発明で説明された技術の実装のために命令、コード、及び／又はデータ構造を読み出すために、１つ以上のコンピュータ又は１つ以上のプロセッサによりアクセス可能な任意の利用可能な媒体であってよい。コンピュータプログラムプロダクトは、コンピュータ可読媒体を含んでよい。

例により、限定ではなく、このようなタイプのコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ、又は別の光ディスク記憶、磁気ディスク記憶、又は別の磁気記憶装置、フラッシュメモリ、又は所要のプログラムコードを命令又はデータ構造の形式で格納するために使用可能な、コンピュータによりアクセス可能な任意の他の媒体、を含み得る。更に、任意の接続は、コンピュータ可読媒体として適切に参照される。例えば、命令がウェブサイト、サーバ、又は別のリモートソースから、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者線（digital subscriber line, DSL）、又は赤外線、無線、及びマイクロ波のような無線技術を用いて送信される場合、同軸ケーブル、光ファイバケーブル、より対線、ＤＳＬ、又は赤外線、無線、及びマイクロ波のような無線技術は、媒体の定義に含まれる。しかしながら、理解されるべきことに、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は別の一時的媒体を含まないが、実際には非一時的有形記憶媒体を対象とする。本明細書で使用されるように、ディスク及び光ディスクは、コンパクトディスク（compact disc, CD）、レーザディスク、光ディスク、デジタルバーサタイルディスク（digital versatile disc, DVD）、ソフトディスク、及びブルーレイディスクを含む。ディスクは、通常、データを磁気的に再生し、一方、光ディスクは、データを光学的にレーザによりデータを再生する。前述の結合も、コンピュータ可読媒体の範囲に含まれるべきである。

命令は、１つ以上のデジタル信号プロセッサ（digital signal processor, DSP）、汎用マイクロプロセッサ、特定用途向け集積回路（application specific integrated circuit, ASIC）、フィールドプログラマブルロジックアレイ（field programmable logic array, FPGA）、又は他の等価な集積又は個別論理回路、のような１つ以上のプロセッサにより実行されてよい。従って、本明細書で使用される用語「プロセッサ」は、前述の構造又は本明細書で説明された技術を実施するために適用可能な別の構造のうちの任意の１つを表してよい。更に、幾つかの態様では、本明細書で説明された機能は、符号化及び復号又は結合されたコーデックに組み込まれるために構成される専用ハードウェア及び／又はソフトウェアモジュール内で提供されてよい。更に、技術は、全部、１つ以上の回路又は論理素子で実装されてよい。

本開示の技術は、無線、ハンドセット、集積回路（integrated circuit, IC）、又はＩＣのセット（例えば、チップセット）を含む広範な装置又は機器の中で実装されてよい。種々のコンポーネント、モジュール、又はユニットは、開示の技術を実行するよう構成される装置の機能的側面を強調するために、本開示で説明されたが、異なるハードウェアユニットによる達成を必ずしも要求しない。正確には、上述のように、ユニットは、適切なソフトウェア及び／又はファームウェアと組み合わせて、コーデックハードウェアユニット内で結合され、又は１つ以上のプロセッサを含む相互運用ハードウェアユニットの集合により提供されてよい。

Claims

ピクチャパーティショニング方法であって、
現在ノードの分割モードを決定するステップであって、前記現在ノードはルマブロック及びクロマブロックを含む、ステップと、
前記現在ノードの前記分割モード及び前記現在ノードのサイズに基づき、前記現在ノードの前記クロマブロックが更に分割されないことを決定するステップと、
前記現在ノードの前記分割モードに基づき、前記現在ノードの前記ルマブロックを分割するステップと、
を含み、
前記現在ノードの幅が閾値の２倍に等しく、前記現在ノードの前記分割モードが垂直２分割であるとき、又は、
前記現在ノードの幅が閾値の４倍に等しく、前記現在ノードの前記分割モードが垂直３分割であるとき、
前記現在ノードの前記クロマブロックは更に分割されず、前記閾値は４である、方法。
前記現在ノードの前記クロマブロックが更に分割されないことを決定する前記ステップは、
前記現在ノードの前記分割モード及び前記現在ノードの前記サイズに基づき、前記現在ノードを分割することにより生成された子ノードが、辺の長さが前記閾値より短いクロマブロックを含むことを決定するとき、前記現在ノードの前記クロマブロックは更に分割されない、ことを含む、請求項１に記載の方法。
前記現在ノードの子ノードを取得するために、前記現在ノードの前記ルマブロックは、前記現在ノードの前記分割モードに基づき分割され、各子ノードはルマブロックのみを含む、請求項１～２のいずれか一項に記載の方法。
前記方法は、
前記ルマブロックの中のサブ領域の各々の予測情報及び残差情報を取得するために、前記現在ノードの前記ルマブロックの情報をパースするステップであって、前記サブ領域は前記子ノードと１対１対応である、ステップ、を更に含む請求項３に記載の方法。
前記子ノードは、規定により更に分割されず、各子ノードは、ルマブロックのみを含む１つの符号化単位に対応する、請求項３又は４に記載の方法。
前記方法は、
前記現在ノードの前記クロマブロックが更に分割されないとき、前記クロマブロックの予測モードを取得するステップ、を更に含む請求項１～５のいずれか一項に記載の方法。
前記現在ノードの前記クロマブロックの前記予測モードは、前記現在ノードのプリセット位置にあるルマブロックの予測モードに基づき決定される、請求項６に記載の方法。
第１フラグに基づき前記クロマブロックの前記予測モードを決定するために、前記第１フラグがパースされる、
請求項６に記載の方法。
インター予測モードが、前記現在ノードの前記クロマブロックに使用されるとき、
前記プリセット位置にある前記ルマブロックの動き情報は、前記クロマブロックの動き情報として取得される、又は、
前記クロマブロックは、クロマ予測サブブロックに分割され、前記クロマ予測サブブロックの動き情報が取得される、
請求項７に記載の方法。
前記第１フラグに基づき、前記クロマブロックにイントラ予測モードが使用されると決定されるとき、イントラ予測モードは、ビットストリームからパースされ、前記クロマブロックの前記イントラ予測モードとして使用され、
前記第１フラグに基づき、前記クロマブロックにインター予測モードが使用されると決定されるとき、プリセット位置にある前記ルマブロックの動き情報が、前記クロマブロックの動き情報として取得され、又は、
前記第１フラグに基づき、前記クロマブロックに前記インター予測モードが使用されると決定されるとき、前記クロマブロックはクロマ予測サブブロックに分割され、前記クロマ予測サブブロックの動き情報が取得される、
請求項８に記載の方法。
前記クロマ予測サブブロックの動き情報が取得されることは、
前記クロマ予測サブブロックに対応するルマピクチャ位置にあるルマブロックに対してインター予測が実行される場合、前記クロマ予測サブブロックに対応する前記ルマピクチャ位置における動き情報は、前記クロマ予測サブブロックの前記動き情報として使用され、
その他の場合、前記プリセット位置における動き情報が、前記クロマ予測サブブロックの前記動き情報として使用される、
ことを含む、請求項９又は１０に記載の方法。
前記プリセット位置にある前記ルマブロックに使用される前記予測モードが、イントラ予測モードであるとき、前記イントラ予測モードは、前記現在ノードの前記クロマブロックに使用される、請求項７に記載の方法。
イントラ予測モードは、前記現在ノードの前記クロマブロックの前記イントラ予測モードとしてビットストリームからパースされる、又は、
前記現在ノードの前記クロマブロックの前記イントラ予測モードは、直流モード、平面モード、角度モード、クロスコンポーネント線形モデルモード、又はクロマ導出ＤＭモード、のうちの１つである、請求項１２に記載の方法。
前記プリセット位置にある前記ルマブロックに使用される前記予測モードが、イントラブロックコピー（ＩＢＣ）モードであるとき、
前記ＩＢＣモードは、前記現在ノードの前記クロマブロックに使用される、又は、
第２フラグに基づき前記クロマブロックの前記予測モードを決定するために、前記第２フラグがパースされる、
請求項７に記載の方法。
前記ＩＢＣモードが、前記現在ノードの前記クロマブロックに使用されるとき、前記方法は、前記プリセット位置にある前記ルマブロックの変位ベクトル情報を前記現在ノードの前記クロマブロックの変位ベクトル情報として取得するステップ、を更に含む請求項１４に記載の方法。
前記第２フラグの値が第１値である場合、前記クロマブロックにイントラ予測モードが使用され、
前記第２フラグの値が第２値である場合、前記クロマブロックにインター予測モードが使用される、
請求項１４に記載の方法。
前記方法は、
分割を通じて取得された複数のルマブロックの予測モードを取得するステップと、
分割を通じて取得された前記複数のルマブロックの前記予測モードに基づき、前記現在ノードの前記クロマブロックの前記予測モードを決定するステップと、
を更に含む請求項６に記載の方法。
前記複数のルマブロックに使用される前記予測モードが、イントラ予測モードであるとき、前記イントラ予測モードは、前記現在ノードの前記クロマブロックに使用される、請求項１７に記載の方法。
前記複数のルマブロックに使用される前記予測モードが、インター予測モードであるとき、プリセット位置にあるルマブロックの動き情報は、前記現在ノードの前記クロマブロックに前記インター予測モードが使用されるとき、前記現在ノードの前記クロマブロックの動き情報として使用され、又は、
前記複数のルマブロックに使用される前記予測モードが、インター予測モードであるとき、第１フラグに基づき前記クロマブロックの前記予測モードを決定するために、前記第１フラグがパースされる、
請求項１７に記載の方法。
前記第１フラグに基づき、前記クロマブロックにイントラ予測モードが使用されると決定されるとき、イントラ予測モードは、ビットストリームからパースされ、前記クロマブロックの前記イントラ予測モードとして使用され、又は、
前記第１フラグに基づき、前記クロマブロックに前記インター予測モードが使用されると決定されるとき、プリセット位置にあるルマブロックの動き情報が、前記クロマブロックの動き情報として取得される、
請求項１９に記載の方法。
前記複数のルマブロックに使用される前記予測モードが、インター予測モード及びイントラ予測モードを含むとき、前記現在ノードのプリセット位置にあるルマブロックの予測モードは、前記現在ノードの前記クロマブロックの前記予測モードとして取得される、請求項１７に記載の方法。
前記現在ノードを含む現在フレームがＩフレームである場合、前記現在ノードの各子ノードにイントラ予測モードが使用され、又は、
前記現在ノードを含む現在フレームがＰフレーム又はＢフレームである場合、第１子ノードの予測モードを取得するために、前記第１子ノードがパースされ、残りの子ノードの予測モードは、前記第１子ノードの前記予測モードと同じであり、前記第１子ノードは最初にパースされるノードである、請求項１～２１のいずれか一項に記載の方法。
前記現在ノードを含む現在フレームがＩフレームである場合、前記現在ノードの各子ノードにイントラ予測モードが使用され、又は、
前記現在ノードを含む現在フレームがＰフレーム又はＢフレームである場合、前記現在ノードの各子ノードにインター予測モードが使用される、
請求項１～２１のいずれか一項に記載の方法。
前記現在ノードの前記分割モード、前記現在ノードの前記サイズ、及び前記現在ノードの第１子ノードの予測モードに基づき、前記現在ノードの前記クロマブロックが更に分割されないことを決定し、前記第１子ノードはルマブロックのみを含み、前記第１子ノードは最初にパースされるノードである、請求項１～２３のいずれか一項に記載の方法。
前記現在ノードの前記分割モード、及び前記現在ノードの前記サイズに基づき、前記現在ノードを分割することにより生成された子ノードが、辺の長さが前記閾値より短いクロマブロックを含み、前記第１子ノードの前記予測モードがイントラ予測モードであり、前記現在ノードの前記クロマブロックは更に分割されないことを決定する、請求項２４に記載の方法。
前記第１子ノードの前記予測モードがイントラ予測であり、以下の条件：
前記現在ノードの幅が前記閾値の２倍に等しく、前記現在ノードの前記分割モードが垂直２分割であるとき、又は、
前記現在ノードの高さが前記閾値の２倍に等しく、前記現在ノードの前記分割モードが水平２分割であるとき、又は、
前記現在ノードの幅が前記閾値の４倍に等しく、前記現在ノードの前記分割モードが垂直３分割であるとき、又は、
前記現在ノードの高さが前記閾値の４倍に等しく、前記現在ノードの前記分割モードが水平３分割であるとき、又は、
前記現在ノードの幅が前記閾値の２倍に等しく、前記現在ノードの前記分割モードが４分割であるとき、
のうちのいずれか１つが真であるとき、前記現在ノードの前記クロマブロックは更に分割されない、請求項２５に記載の方法。
前記現在ノードの前記分割モード、及び前記現在ノードの前記サイズに基づき、前記現在ノードを分割することにより生成された子ノードが、辺の長さが前記閾値より短い前記クロマブロックを含むことを決定し、
第１子ノードの予測モードがインター予測である場合、前記現在ノードの前記クロマブロックは、前記現在ノードの前記分割モードに基づき分割され、前記第１子ノードは最初にパースされるノードである、請求項１～２４のいずれか一項に記載の方法。
前記方法は、
前記現在ノードの前記子ノードの動き情報に基づき、前記クロマブロックの対応する子ノードの動き情報を決定するステップ、
を更に含む請求項２７に記載の方法。
前記現在ノードの前記分割モード及び前記現在ノードの前記サイズに基づき、前記現在ノードを分割することにより生成された子ノードが、幅が前記閾値より狭い前記クロマブロックを含むことを決定するとき、前記現在ノードの前記クロマブロックは更に分割されない、請求項１～２３のいずれか一項に記載の方法。
前記現在ノードの前記分割モード及び前記現在ノードの前記サイズに基づき、前記現在ノードを分割することにより生成された子ノードが、クロマサンプル数が１６より少ないクロマブロックを含むことを決定するとき、前記現在ノードの前記クロマブロックは更に分割されない、請求項１～２３のいずれか一項に記載の方法。
前記現在ノードの幅と高さとの積が１２８より小さく、前記現在ノードの前記分割モードが垂直２分割又は水平２分割であるとき、又は、
前記現在ノードの幅と高さとの積が２５６より小さく、前記現在ノードの前記分割モードが垂直３分割、水平３分割、又は４分割であるとき、又は、
前記現在ノードの幅と高さとの積が６４に等しく、前記現在ノードの前記分割モードが垂直２分割、水平２分割、４分割、水平３分割、又は垂直３分割であるとき、又は、
前記現在ノードの幅と高さとの積が１２８に等しく、前記現在ノードの前記分割モードが垂直３分割又は水平３分割であるとき、
前記現在ノードの前記クロマブロックは更に分割されない、請求項３０に記載の方法。
前記現在ノードの前記分割モードは、４分割（ＱＴ）、水平２分割（horizontal BT）、水平３分割（horizontal TT）、垂直２分割（Vertical BT）、及び垂直３分割（Vertical TT）、のうちの少なくとも１つを含む、請求項１～３１のいずれか一項に記載の方法。
前記現在ノードの幅と高さとの積が６４に等しく、前記現在ノードの前記分割モードが４分木分割又は３分木分割であるとき、又は、
前記現在ノードの幅と高さとの積が３２に等しく、前記現在ノードの前記分割モードが２分木分割であるとき、
前記現在ノードの前記クロマブロックは更に分割されない、請求項１に記載の方法。
前記現在ノードの前記クロマブロックが分割される必要があるかどうかは、前記現在ノードの前記分割モード、前記現在ノードの前記サイズ、及び前記現在ノードに対応する分割フラグ（split_cu_flag）に基づき決定される、請求項１～３３のいずれか一項に記載の方法。
前記現在ノードのデータ形式、前記現在ノードの前記分割モード、及び前記現在ノードの前記サイズに基づき、前記現在ノードの前記クロマブロックが更に分割されるかどうかを決定する、請求項１～３４のいずれか一項に記載の方法。
前記現在ノードの前記データ形式はＹＵＶ４：２：０又はＹＵＶ４：２：２である、請求項３５に記載の方法。
前記現在ノードのカバレッジ領域内の全部の符号化単位に対して、イントラ予測又はインター予測が実行される、請求項３５に記載の方法。
プロセッサとメモリとを含み、前記メモリは命令を格納し、前記命令は、前記プロセッサに、請求項１～３７のいずれか一項に記載の方法を実行できるようにさせる、ビデオストリーム復号機器。
プロセッサとメモリとを含み、前記メモリは命令を格納し、前記命令は、前記プロセッサに、請求項１～３７のいずれか一項に記載の方法を実行できるようにさせる、ビデオストリーム符号化機器。
互いに接続された不揮発性メモリとプロセッサとを含み、前記メモリはプログラム命令を格納するよう構成され、前記プログラム命令は、前記プロセッサに、請求項１～３７のいずれか一項に記載の方法を実行できるようにさせる、復号装置。
互いに接続された不揮発性メモリとプロセッサとを含み、前記メモリはプログラム命令を格納するよう構成され、前記プログラム命令は、前記プロセッサに、請求項１～３７のいずれか一項に記載の方法を実行できるようにさせる、符号化装置。