JP7355829B2

JP7355829B2 - ビデオエンコーダ、ビデオデコーダ、及び対応する方法

Info

Publication number: JP7355829B2
Application number: JP2021538887A
Authority: JP
Inventors: ガオ，ハン; エセンリク，セミ; チェン，ジエンローァ; メハーコトラ，アナンド; ワーン，ビヤオ; ジャオ，ジージエ
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-09-18
Filing date: 2019-09-18
Publication date: 2023-10-03
Anticipated expiration: 2039-09-18
Also published as: DK3847818T3; CN114071165B; CN112740689B; PT3847818T; EP3847818B1; AU2019344400A1; CN114071165A; ZA202102113B; EP3847818A1; US20210006786A1; AU2019344400C1; WO2020057572A1; US11930171B2; CN112740689A; PL3847818T3; BR122023023994A2; KR20240056655A; EP4366310A1; BR122023024004A2; ES2973667T3

Description

本願の実施形態は、概して、ビデオ符号化の分野に関し、特にブロック分割及びパーティションに関する。

ビデオ符号化（ビデオ符号化及び復号）は、広範囲のデジタルビデオアプリケーション、例えば、放送用デジタルテレビ、インターネット及び移動体ネットワークを介するビデオ送信、ビデオチャットのようなリアルタイム会話アプリケーション、ビデオ会議、ＤＶＤ及びＢｌｕｅ－ｒａｙディスク、ビデオコンテンツ取得及び編集システム、及びセキュリティアプリケーションのカムコーダで使用される。

１９９０年のＨ．２６１標準におけるブロックに基づくハイブリッドビデオ符号化アプローチの開発以来、新しいビデオ符号化技術及びツールが開発され、新しいビデオ符号化標準の基礎を形成した。更なるビデオ符号化標準は、MPEG－１ビデオ、MPEG－２ビデオ、ITU－T H.２６２/MPEG－２、ITU－T H.２６３、ITU－T H.２６４/MPEG－４、Part １０、高度ビデオ符号化（Advanced Video Coding (AVC)）、ITU－T H.２６５/高効率ビデオ符号化（High Efficiency Video Coding (HEVC)）、ITU－T H.２６６/バーサタイルビデオ符号化（Versatile video coding (VVC)）及び拡張、例えばこれらの標準のスケーラビリティ及び／又は３次元（３Ｄ）拡張を含む。ビデオ生成及び使用が益々ユビキタスになるにつれ、ビデオトラフィックは、通信ネットワーク及びデータ記憶において最大の負荷になり、相応して、大部分のビデオ符号化標準の目標のうちの１つは、ピクチャ品質を犠牲にすることなく、その前の代と比べてビットレートの低減を達成することであった。最新の高効率ビデオ符号化（ＨＥＶＣ）が、品質を犠牲にすることなく、ＡＶＣの約２倍多くのビデオを圧縮できても、ＨＥＶＣと比べてビデオを更に圧縮することが新しい技術のために熱望されている。

本願（又は本開示）の実施形態は、独立請求項による符号化及び復号の機器及び方法を提供する。

前述の及び他の目的は、独立請求項の主題により達成される。更なる実装形式は、従属請求項、説明、及び図面から明らかである。

標準から、幾つかの特徴の定義は以下の通りである。
ピクチャパラメータセット（picture parameter set (PPS)）：各スライスヘッダの中に見られるシンタックス要素により決定されるような、０個以上の符号化ピクチャ全体に適用するシンタックス要素を含むシンタックス構造。
シーケンスパラメータセット（sequence parameter set (SPS)）：各スライスヘッダの中に見られるシンタックス要素により参照されるＰＰＳの中に見られるシンタックス要素の内容により決定されるような、０個以上のＣＶＳ全体に適用するシンタックス要素を含むシンタックス構造。
スライスヘッダ：スライス内で表現される最初の又は全部のブリックに関するデータ要素を含む符号化スライスの部分。
サブピクチャ：ピクチャ内の１つ以上のスライスの長方形領域。
スライスは、完全なタイルの数又は１つのタイルの完全なブリックの連続するシーケンスのみのいずれかで構成される。
タイル：ピクチャ内の特定のタイル列及び特定のタイル行の中のＣＴＵの長方形領域。

ピクチャは、１つ以上のタイル行及び１つ以上のタイル列に分割される。タイルは、ピクチャの長方形領域をカバーするＣＴＵのシーケンスである。
タイルは、１つ以上のブリックに分割され、その各々はタイル内の多数のＣＴＵ列で構成される。
複数のブリックにパーティションされないタイルは、ブリックとも呼ばれる。しかしながら、タイルの真部分集合であるブリックは、タイルと呼ばれない。
スライスは、ピクチャの多数のタイル又はタイルの多数のブリックのいずれかを含む。
サブピクチャは、ピクチャの長方形領域を集合的にカバーする１つ以上のスライスを含む。

スライスの２つのモード、つまりラスタスキャンスライスモード及び長方形スライスモードがサポートされる。ラスタスキャンスライスモードでは、スライスは、ピクチャのタイルラスタスキャンの中で、タイルのシーケンスを含む。長方形スライスモードでは、スライスは、ピクチャの長方形領域を集合的に形成する、ピクチャの多数のブリックを含む。長方形スライスの中のブリックは、スライスのブリックラスタスキャンの順である。

本発明の第１の態様によると、復号装置により実施されるビデオビットストリームの復号の方法であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記復号方法は、
前記ビデオビットストリームからオーバーライドフラグを取得するステップと、
前記オーバーライドフラグの前記値がオーバーライド値であるとき、前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得するステップと、
前記第１パーティション制約情報に従い、前記画像領域のブロックをパーティションするステップと、を含む方法が提供される。

本アプローチは、各画像領域が、パラメータセットの中の複数の画像領域のパーティション制約情報以外に、それ自体のパーティション制約情報を有することを可能にする。従って、本アプローチは、効率的なビットストリームパース、及び特に、効率的なパーティション制約情報シグナリングを可能にする。

前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得する前記ステップは、前記画像領域ヘッダを表す前記データから、前記画像領域の第１パーティション制約情報を取得するステップを含んでよい。

前記オーバーライド値はプリセットされてよい。

前記オーバーライド値は、真、偽、０、又は１を含む。

前記画像領域ヘッダは、前記画像領域の全部又は一部に関する前記データ要素を含むセット又は構造であってよい。

第１の態様による方法の可能な実装形式では、従って、前記復号方法は、前記ビデオビットストリームからオーバーライド有効化フラグを取得するステップであって、前記オーバーライド有効化フラグの前記値は有効化値である、ステップを更に含む。

前記有効化値はプリセットされてよい。

前記有効化値は、真、偽、０、又は１を含む。

第１の態様による方法の可能な実装形式では、従って、前記復号方法は、
前記ビデオビットストリームからオーバーライド有効化フラグを取得するステップを更に含み、
前記ビデオビットストリームから前記オーバーライドフラグを取得する前記ステップは、前記オーバーライド有効化フラグの前記値が有効化値であるとき、前記ビデオビットストリームから前記オーバーライドフラグを取得するステップを含む。

前記有効化値はプリセットされてよい。

前記有効化値は、真、偽、０、又は１を含む。

オーバーライド有効化フラグの提供により、前記オーバーライドは、効率的な方法で制御されてよく、従って、ブロックパーティションに関連するシンタックス要素の扱いにおいて柔軟性を増大する。前記オーバーライド有効化フラグが前記有効化値に設定されるとき、前記オーバーライドフラグは前記ビットストリームから更に抽出されてよいことに留意する。或いは、オーバーライドフラグは、前記ビットストリームから抽出されなくてよく、このような場合にはオーバーライドが適用されない。むしろ、第２又は第３パーティション制約が、前記ブロックをパーティションするために使用されてよい。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記復号方法は、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ、を更に含む。前記第２パーティション制約情報は、前記パラメータセットから又は前記パラメータセットの中にあってよい。

前記パラメータセットは、シーケンスパラメータセット（ＳＰＳ）又はピクチャパラメータセット（ＰＰＳ）又は任意の他のパラメータセットであってよい。

前記無効化値は前記有効化値と異なる。

前記無効化値はプリセットされてよい。

前記無効化値は、真、偽、０、又は１を含む。

前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記第１パーティション制約情報は、前記ビデオビットストリーム内に存在しなくてよく、前記第１パーティション制約情報の前記値は、前記第２パーティション制約情報の前記値と等しいと推定されてよい。

前記パラメータセットは、０個以上の符号化ピクチャ全体又は前記画像領域を含む符号化ビデオシーケンスに適用するシンタックス要素を含むセット又は構造であってよい。

前記パラメータセットは、前記画像領域ヘッダと異なる。

例えば、前記第２パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。これらの及び更なるパラメータの任意の組合せ／サブセットは、前記パーティション制約を構成するためにシグナリングされてよい。

最小許容４分木リーフノードサイズの前記情報は、最小許容４分木リーフノードサイズの前記値を取得するために、デルタ値であってよい。例えば、最小許容４分木リーフノードサイズの前記情報は、sps_log２_min_qt_size_intra_slices_minus２、sps_log２_min_qt_size_inter_slices_minus２、又はlog２_min_qt_size_minus２であってよい。

最大許容３分木ルートノードサイズの前記情報は、最大許容３分木ルートノードサイズの前記値を取得するために、デルタ値であってよい。例えば、最大許容３分木ルートノードサイズの前記情報は、sps_log２_diff_ctu_max_tt_size_intra_slices、sps_log２_diff_ctu_max_tt_size_inter_slices、又はlog２_diff_ctu_max_tt_sizeであってよい。

最大許容２分木ルートノードサイズの前記情報は、最大許容２分木ルートノードサイズの前記値を取得するために、デルタ値であってよい。例えば、最大許容２分木ルートノードサイズの前記情報は、sps_log２_diff_ctu_max_bt_size_intra_slices、sps_log２_diff_ctu_max_bt_size_inter_slices、又はlog２_diff_ctu_max_bt_sizeであってよい。

例えば、最大マルチタイプ木深さの情報は、sps_max_mtt_hierarchy_depth_inter_slices、sps_max_mtt_hierarchy_depth_intra_slices、又はmax_mtt_hierarchy_depthであってよい。

追加又は代替として、前記第２パーティション制約情報は、イントラモードにおけるブロックのパーティション制約情報、又はインターモードにおけるブロックのパーティション制約情報を含む。

前記第２パーティション制約情報は、別々にシグナリングされる、イントラモードにおけるブロックの前記パーティション制約情報、及びインターモードにおけるブロックのパーティション制約情報の両方を含んでよい。しかしながら、本発明はそれにより限定されず、イントラモードにおけるブロックの前記パーティション制約情報、及びインターモードにおけるブロックのパーティション制約情報の両方に共通する１つのパーティション制約情報が存在してよい。

イントラモードにおける前記ブロック、又はインターモードにおける前記ブロックは、前記パラメータセットを参照する。

前記パラメータセットは、シーケンスパラメータセット（ＳＰＳ）又はピクチャパラメータセット（ＰＰＳ）を含んでよい。

イントラモードにおける前記ブロックは、前記パラメータセットを参照する２（Ｉ）に等しいslice_typeを有するスライス内のＣＴＵの中にあってよく、或いは、インターモードにおける前記ブロックは、前記パラメータセットを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライス内のＣＴＵの中にあってよい。

追加又は代替として、前記第２パーティション制約情報は、ルマブロックのパーティション制約情報、及び／又はクロマブロックのパーティション制約情報を含む。

前記ルマブロック、又は前記クロマブロックは、前記パラメータセットを参照する。

前記ルマブロック、又は前記クロマブロックは、前記パラメータセットを参照するスライス内のＣＴＵの中にあってよい。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記ビデオビットストリームからオーバーライド有効化フラグを取得する前記ステップは、前記パラメータセットから前記オーバーライド有効化フラグを取得するステップ、又は、前記パラメータセットの中の前記オーバーライド有効化フラグを取得するステップ、を含む。

前記パラメータセットから前記オーバーライド有効化フラグを取得する前記ステップは、前記パラメータセットを表す前記データから前記オーバーライド有効化フラグを取得するステップを含んでよい。前記パラメータセットは、シーケンスパラメータセット（ＳＰＳ）又はピクチャパラメータセット（ＰＰＳ）又は任意の他のパラメータセットであってよい。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームから前記オーバーライドフラグを取得する前記ステップは、前記画像領域ヘッダから前記オーバーライドフラグを取得するステップを含む。

前記画像領域ヘッダから前記オーバーライドフラグを取得する前記ステップは、前記画像領域ヘッダを表す前記データから前記オーバーライドフラグを取得するステップを含んでよい。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。

例えば、前記画像領域は、スライス、タイル、又はサブピクチャを含み、前記画像領域ヘッダは、前記スライスのスライスヘッダ、前記タイルのタイルヘッダ、又は前記サブピクチャのヘッダを含む。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含んでよく、前記復号方法は、
前記オーバーライドフラグの前記値が前記オーバーライド値ではないとき、前記パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップＳ２３０、又は、前記パラメータセットの中の前記ビデオビットストリームの第２パーティション制約情報に従い前記画像領域の前記ブロックをパーティションするステップＳ２３０、を更に含む。

前記オーバーライド値が真であり、前記オーバーライドフラグの値が前記オーバーライド値ではないことは、前記オーバーライドフラグの前記値が偽であることを意味する。

前記オーバーライド値が１であり、前記オーバーライドフラグの値が前記オーバーライド値ではないことは、前記オーバーライドフラグの前記値が０であることを意味する。

本発明の第２の態様によると、符号化装置により実施されるビデオビットストリームの符号化の方法であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記符号化方法は、
前記画像領域のブロックのパーティションが前記画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定するステップと、
前記ブロックのパーティションが前記第１パーティション制約情報に従うと決定すると、前記第１パーティション制約情報に従い前記画像領域のブロックをパーティションするステップと、
オーバーライドフラグの前記値をオーバーライド値に設定するステップと、
前記オーバーライドフラグの前記データを前記ビデオビットストリームに含めるステップと、を含む。

第２の態様による方法の可能な実装形式では、従って、前記符号化方法は、
第１パーティション制約情報に従う前記ブロックのパーティションが有効化されるかどうかを決定するステップと、
第１パーティション制約情報に従う前記ブロックのパーティションが有効化されると決定すると、オーバーライド有効化フラグの前記値を有効化値に設定するステップと、
前記オーバーライド有効化フラグの前記データを前記ビデオビットストリームに含めるステップと、を更に含む。

前記画像領域のブロックのパーティションが前記画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定する前記ステップは、第１パーティション制約情報に従う前記ブロックのパーティションが有効化されると決定すると、前記画像領域のブロックのパーティションが前記画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定するステップを含む。

例えば、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記符号化方法は、
第１パーティション制約情報に従う前記ブロックのパーティションが有効化されないと決定すると、前記パラメータセットの中の前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップと、
オーバーライド有効化フラグの前記値を無効化値に設定するステップと、を更に含む。

追加又は代替として、前記第２パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。

例えば、前記第２パーティション制約情報は、ルマブロックのパーティション制約情報、又はクロマブロックのパーティション制約情報を含む。

第２の態様の任意の前述の実装又は第２の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記オーバーライド有効化フラグは前記パラメータセットの中にある。

例えば、前記オーバーライドフラグは、前記画像領域ヘッダの中にある。

実施形態のうちのいずれかに追加又は代替として、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。

実施形態のうちのいずれかに追加又は代替として、前記画像領域は、スライス、タイル、又はサブピクチャを含み、前記画像領域ヘッダは、前記スライスのスライスヘッダ、前記タイルのタイルヘッダ、又は前記サブピクチャのヘッダを含む。

例えば、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記復号方法は、
前記ブロックのパーティションが前記第１パーティション制約情報に従わないと決定すると、前記パラメータセットの中の前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ（Ｓ３６０）と、
前記オーバーライドフラグの前記値を非オーバーライド値に設定するステップと、を更に含む。

第２の態様による方法は、第１の態様による第１機器の実装形式に対応する実装形式に拡張できる。従って、前記方法の実装形式は、前記第１機器の対応する実装形式の特徴を含む。

第２の態様による方法の利点は、第１の態様による第１機器の対応する実装形式のものと同じである。

第本発明の第３の態様によると、デコーダであって、
１つ以上のプロセッサと、
前記プロセッサに接続され前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体と、を含み、
前記プログラミングは、前記プロセッサにより実行されると、第１の態様又は第１の態様の任意の可能な実装による上述の復号方法のいずれかを実行するよう前記デコーダを構成する、デコーダが提供される。

本発明の第４の態様によると、エンコーダであって、
１つ以上のプロセッサと、
前記プロセッサに接続され前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体と、を含み、
前記プログラミングは、前記プロセッサにより実行されると、第２の態様又は第２の態様の任意の可能な実装による上述の復号方法のいずれかによる方法を実行するよう前記エンコーダを構成する、エンコーダが提供される。

第５の態様によると、実行されると１つ以上のプロセッサをビデオデータを符号化するよう構成させる命令を格納したコンピュータ可読記憶媒体が提案される。前記命令は、前記１つ以上のプロセッサに、第１又は第２の態様、又は第１又は第２の態様の任意の可能な実装による方法を実行させる。

第６の態様によると、本発明は、コンピュータ上で実行されると第１又は第２の態様又は第１又は第２の態様の任意の可能な実施形態による方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。

本発明の第７の態様によると、ビデオビットストリームを復号するデコーダであって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記デコーダは、
前記ビデオビットストリームからオーバーライドフラグを取得するオーバーライド決定ユニットと、
前記オーバーライドフラグの前記値がオーバーライド値であるとき、前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得するパーティション制約決定ユニットと、
前記第１パーティション制約情報に従い、前記画像領域のブロックをパーティションするブロックパーティションユニットと、
を含むデコーダが提供される。

本発明の第１の態様による方法は、本発明の第７の態様によるデコーダにより実行できる。本発明の第３の態様によるデコーダの更なる特徴及び実装形式は、本発明の第１の態様又は第１の態様の任意の可能な実装による方法の特徴及び実装形式に対応する。本発明の第８の態様によると、ビデオビットストリームの符号化のためのエンコーダであって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記エンコーダは、
第１パーティション制約情報に従い前記画像領域のブロックをパーティションするブロックパーティションユニットと、
前記画像領域の第１パーティション制約情報を前記画像領域ヘッダに挿入し、オーバーライドフラグの前記値をオーバーライド値に設定し、及び前記ビデオビットストリームに前記オーバーライドフラグを挿入するビットストリーム生成器と、を含むエンコーダが提供される。

本発明の第２の態様による方法は、本発明の第８の態様によるエンコーダにより実行できる。本発明の第８の態様によるエンコーダの更なる特徴及び実装形式は、本発明の第２の態様又は第２の態様の任意の可能な実装による方法の特徴及び実装形式に対応する。

明確さの目的で、ここに開示される実施形態のうちの任意の１つは、他の実施形態のうちの任意の１つ以上と結合されて、本開示の範囲内にある新しい実施形態を生成してよい。

本発明の第９の態様によると、ビデオビットストリームであって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記ビデオビットストリームは、前記画像領域の第１パーティション制約情報が前記画像領域ヘッダの中に存在するかどうかを指定するオーバーライドフラグを更に含む、ビデオビットストリームが提供される。

第９の態様による方法の可能な実装形式では、従って、前記ビデオビットストリームは、前記オーバーライドフラグが前記画像領域ヘッダの中に存在するかどうかを指定するオーバーライド有効化フラグを更に含む。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記オーバーライド有効化フラグは、前記パラメータセット又は前記パラメータセットを表すデータの中にある。

第１の態様の任意の前述の実装又は第１の態様による方法の可能な実装形式では、従って、前記オーバーライドフラグは前記画像領域ヘッダ又は前記画像領域ヘッダを表すデータの中にある。

１つ以上の実施形態の詳細は、添付の図面及び以下の説明において説明される。他の特徴、目的、及び利点は、説明、図面、及び請求項から明らかになるだろう。

以下では、本発明の実施形態は、添付の図面及び図を参照して更に詳細に説明される。
本発明の実施形態を実施するよう構成されるビデオ符号化システムの例を示すブロック図である。本発明の実施形態を実施するよう構成されるビデオ符号化システムの別の例を示すブロック図である。本発明の実施形態を実施するよう構成されるビデオエンコーダの例を示すブロック図である。本発明の実施形態を実施するよう構成されるビデオデコーダの例示的な構造を示すブロック図である。符号化機器又は復号機器の例を示すブロック図である。符号化機器又は復号機器の別の例を示すブロック図である。４分木２分木（quad－tree－binary－tree (QTBT)）構造を用いるブロックパーティションの例の説明図である。図６のＱＴＢＴ構造を用いるブロックパーティションに対応する木構造の例の説明図である。水平３分木パーティションタイプの例の説明図である。垂直３分木パーティションタイプの例の説明図である。実施形態による復号方法を示すフロー図である。実施形態による復号方法を示すフロー図である。例示的なデコーダを示すブロック図である。例示的なエンコーダを示すブロック図である。オーバーライドフラグに関する実施形態による符号化方法を示すフロー図である。オーバーライド有効化フラグに関する実施形態による符号化方法を示すフロー図である。コンテンツ配信サービスを実現するコンテンツ供給システムの例示的な構造を示すブロック図である。端末装置の例の構造を示すブロック図である。以下では、特に断りのない限り、同一の参照符号は同一の又は少なくとも機能的に等価な特徴を表す。本発明の実施形態を実施するよう構成されるビデオエンコーダの例を示すブロック図である。本発明の実施形態を実施するよう構成されるビデオデコーダの例示的な構造を示すブロック図である。

以下では、明示的に断りのない場合、同一の参照符号は同一の又は少なくとも機能的に等価な特徴を表す。

以下の説明では、本開示の部分を形成し、図示により本発明の実施形態の特定の態様又は本発明の実施形態が使用され得る特定の態様を示す、添付の図面を参照する。本発明の実施形態は、他の態様で使用され、図に示されない構造的又は論理的変化を含んでよいことが理解される。以下の詳細な説明は、従って、限定的意味と考えられるべきではなく、本発明の範囲は添付の特許請求の範囲により定められる。

例えば、記載の方法に関連する開示は、方法を実行するよう構成される対応する装置又はシステムにも当てはまってよく、逆も同様であることが理解される。例えば、１又は複数の特定の方法のステップが説明される場合、このような１つ以上のユニットが明示的に説明され又は図中に示されない場合でも、対応する装置は、説明される１又は複数の方法のステップを実行するために、１又は複数のユニット、例えば機能ユニットを含んでよい（例えば、１つのユニットが１又は複数のステップを実行し、又は複数のユニットの各々が複数のステップのうちの１つ以上を実行する）。他方で、例えば、特定の機器が１又は複数のユニット、例えば機能ユニットに基づき説明される場合、このような１又は複数のステップが明示的に説明され又は図中に示されない場合でも、対応する方法は、１又は複数のユニットの機能を実行するための１つのステップを含んでよい（例えば、１つのステップが１又は複数のユニットの機能を実行し、又は複数のステップの各々が複数のユニットのうちの１つ以上の機能を実行する）。更に、ここで説明される種々の例示的な実施形態及び／又は態様の特徴は、特に断りのない限り、互いに結合されてよいことが理解される。

ビデオ符号化は、標準的に、ビデオ又はビデオシーケンスを形成する、ピクチャのシーケンスの処理を表す。用語「ピクチャ」の代わりに、用語「フレーム」又は「画像」がビデオ符号化の分野では同義語として使用され得る。本願（又は本開示）で使用されるビデオ符号化は、ビデオ符号化又はビデオ復号を示す。ビデオ符号化は、ソース側で実行され、標準的に、元のビデオピクチャを処理して（例えば、圧縮による）、（より効率的な記憶及び／又は送信のために）ビデオピクチャを表現するために必要なデータ量を削減することを含む。ビデオ復号は、宛先側で実行され、標準的に、エンコーダに対して反対の処理を含み、ビデオピクチャを再構成する。ビデオピクチャ（又は後述するように一般的にピクチャ）の「符号化」を参照する実施形態は、ビデオシーケンスの「符号化」又は「復号」のいずれかに関連すると理解されるべきである。符号化部分及び復号部分の結合は、コーデック（Coding and Decoding (CODEC)）とも呼ばれる。

無損失ビデオ符号化の場合には、元のビデオピクチャが再構成可能である。つまり、再構成ビデオピクチャは、元のビデオピクチャと同じ品質を有する（伝送損失、又は記憶若しくは送信中に他のデータ損失が無いと仮定する）。損失ビデオ符号化の場合には、例えば量子化による更なる圧縮が実行され、ビデオピクチャを表現するデータ量を削減する。これは、デコーダ側で完全に再構成できない。つまり、再構成ビデオピクチャの品質は、元のビデオピクチャの品質と比べて低い又は悪い。

Ｈ．２６１以降の幾つかのビデオ符号化標準は、「損失ハイブリッドビデオコーデック」のグループに属する（つまり、サンプルドメインにおける空間及び時間予測と、変換ドメインにおける量子化を適用する２Ｄ変換符号化と、を結合する）。ビデオシーケンスの各ピクチャは、標準的に、重なり合わないブロックのセットにパーティションされ、符号化は、標準的に、ブロックレベルで実行される。言い換えると、エンコーダにおいて、例えば空間（イントラピクチャ）予測及び時間（インターピクチャ）予測を用いて予測ブロックを生成し、予測ブロックを現在ブロック（現在処理されている／処理されるべきブロック）から減算して残差ブロックを取得し、残差ブロックを変換し、及び変換ドメインで残差ブロックを量子化して、送信されるべきデータ量を削減し（圧縮）することにより、ビデオは標準的にブロック（ビデオブロック）レベルで処理され、つまり符号化される。一方で、デコーダにおいて、エンコーダと比べて逆の処理が、符号化された又は圧縮されたブロックに対して部分的に適用されて、提示するために現在ブロックを再構成する。更に、エンコーダは、デコーダ処理ループを複製して、後続のブロックを処理する、つまり符号化するために、両方が同一の予測（例えば、イントラ及びインター予測）及び／又は再構成を生成するようにする。

ここで使用されるとき、用語「ブロック」はピクチャ又はフレームの一部であってよい。説明の便宜上、本発明の実施形態は、ここで、高効率ビデオ符号化（High－Efficiency Video Coding (HEVC)）、又はＩＴＵ－Ｔビデオ符号化専門家委員会（ITU－T Video Coding Experts Group (VCEG)）及びＩＳＯ／ＩＥＣ動画専門家委員会（Motion Picture Experts Group (MPEG)）のビデオ符号化に関する共同作業部会（Joint Collaboration Team on Video Coding, JCT－VC）により開発されたバーサタイルビデオ符号化（Versatile video coding (VVC)）のリファレンスソフトウェアを参照して説明される。当業者は、本発明の実施形態がＨＥＶＣ又はＶＶＣに限定されないことを理解するだろう。ＣＵ、ＰＵ、及びＴＵを参照し得る。ＨＥＶＣでは、ＣＴＵは、符号化木として示される４分木構造を用いてＣＵに分割される。ピクチャ領域をインターピクチャ（時間）又はイントラピクチャ（空間）予測を用いて符号化するかどうかの決定は、ＣＵレベルで行われる。各ＣＵは、ＰＵ分割タイプに従い、１、２、又は４個のＰＵに更に分割できる。１個のＰＵ内で、同じ予測処理が適用され、関連情報がＰＵ毎にデコーダへ送信される。ＰＵ分割タイプに基づき予測処理を適用することにより、残差ブロックを取得した後に、ＣＵは、ＣＵの符号化木と同様の別の４分木構造に従い、変換ユニット（transform unit (TU)）にパーティションすることができる。ビデオ圧縮技術の最新の進展では、４分木及び２分木（Qual－tree and binary tree (QTBT)）パーティションフレームが、符号化ブロックをパーティションするために使用される。ＱＴＢＴブロック構造では、ＣＵは正方形又は長方形形状のいずれかを有し得る。例えば、符号化木ユニット（coding tree unit (CTU)）は、先ず、４分木構造によりパーティションされる。４分木のリーフノードは、２分木構造により更にパーティションされる。２分木のリーフノードは、符号化単位（coding unit (CU)）と呼ばれ、任意の更なるパーティションを伴わず、予測及び変換処理のためにセグメント化が使用される。これは、ＣＵ、ＰＵ、及びＴＵが、ＱＴＢＴ符号化ブロック構造において同じブロックサイズを有することを意味する。並行して、多重パーティション、例えば３分木パーティションも、ＱＴＢＴブロック構造と一緒に使用するために提案された。用語「装置」は、「機器」、「デコーダ」、又は「エンコーダ」であってもよい。

エンコーダ２０の以下の実施形態では、デコーダ３０及び符号化システム１０は図１～３に基づき説明される。

図１Ａは、本願（本開示）の技術を利用し得る例示的な符号化システム１０、例えばビデオ符号化システム１０を示す概念的又は概略的ブロック図である。ビデオ符号化システム１０のエンコーダ２０（例えば、ビデオエンコーダ２０）及びデコーダ３０（例えば、ビデオデコーダ３０）は、本願で説明される種々の例に従う技術を実行するよう構成され得る装置の例を表す。図１Ａに示すように、符号化システム１０は、符号化データ１３、例えば符号化ピクチャ１３を、例えば、符号化データ１３を復号する宛先装置１４に提供するよう構成されるソース装置１２を含む。

ソース装置１２は、エンコーダ２０を含み、追加でつまり任意で、ピクチャソース１６、前処理ユニット１８、例えばピクチャ前処理ユニット１８、及び通信インタフェース又は通信ユニット２２を含んでよい。

ピクチャソース１６は、例えば現実のピクチャをキャプチャする任意の種類のピクチャキャプチャ装置、及び／又は任意の種類のピクチャ若しくはコメント（スクリーンコンテンツ符号化では、スクリーン上の何らかのテキストも符号化されるべきピクチャ又は画像の一部と考えられる）生成装置、例えばコンピュータアニメーションピクチャを生成するコンピュータグラフィックプロセッサ、又は現実世界のピクチャ、コンピュータアニメーションピクチャ（例えば、スクリーンコンテンツ、仮想現実（virtual reality (VR)）ピクチャ）及び／又はそれらの任意の組み合わせ（例えば、拡張現実（augmented reality (AR)）ピクチャ）を取得し及び／又は提供する任意の種類の装置、を含んでよく又はそれであってよい。ピクチャソースは、前述のピクチャのうちのいずれかを格納する任意の種類のメモリ又は記憶装置であってよい。

（デジタル）ピクチャは、強度値を有するサンプルの２次元配列又は行列であり又はそのように考えることができる。配列の中のサンプルは、ピクセル（pixel）（ピクチャ要素の短縮形）又はペル（pel）とも呼ばれてよい。配列又はピクチャの水平及び垂直方向（又は軸）にあるサンプルの数は、ピクチャのサイズ及び／又は解像度を定める。色の表現のために、標準的に３つの色成分が利用される。つまり、ピクチャは、３つのサンプル配列で表現され又はそれを含んでよい。ＲＢＧ形式又は色空間では、ピクチャは、対応する赤、緑、及び青色サンプル配列を含む。しかしながら、ビデオ符号化では、各ピクセルは、標準的に、輝度／色度形式、又は色空間、例えば、Ｙ（時には代わりにＬが使用されることもある）により示される輝度成分と及びＣｂ及びＣｒにより示される２つの色度成分を含むＹＣｂＣｒとで表現される。輝度（又は略してｌｕｍａ）成分Ｙは、明るさ又はグレーレベル強度（例えば、グレイスケールピクチャのような）を表現する。一方で、２つの色度（又は略してｃｈｒｏｍａ）成分Ｃｂ及びＣｒは、色度又は色情報成分を表現する。従って、ＹＣｂＣｒ形式のピクチャは、輝度サンプル値（Ｙ）の輝度サンプル配列と、色度値（Ｃｂ及びＣｒ）の２つの色度サンプル配列とを含む。ＲＧＢ形式のピクチャは、ＹＣｂＣｒ形式に転換され又は変換されてよく、逆も同様であり、処理は色転換又は色変換としても知られる。ピクチャが単色である場合、ピクチャは、輝度サンプル配列のみを含んでよい。

ピクチャソース１６（例えば、ビデオソース１６）は、例えばピクチャをキャプチャするカメラ、前にキャプチャした若しくは生成したピクチャを含む若しくは格納するメモリ、例えばピクチャメモリ、及び／又はピクチャを取得し若しくは受信するための任意の種類の（内部又は外部）インタフェースであってよい。カメラは、例えば、ソース装置に統合されたローカル又は内蔵カメラであってよい。メモリは、例えばソース装置に統合されたローカル又は内蔵メモリであってよい。インタフェースは、例えば、ピクチャを外部ビデオソース、例えばカメラのような外部ピクチャキャプチャ装置、外部メモリ、又は外部ピクチャ生成装置、例えば外部コンピュータグラフィックプロセッサ、コンピュータ若しくはサーバから受信する外部インタフェースであってよい。インタフェースは、任意の特性又は標準化インタフェースプロトコルに従い、任意の種類のインタフェース、例えば有線若しくは無線インタフェース、光インタフェースであり得る。ピクチャデータ１７を取得するインタフェースは、通信インタフェース２２と同じインタフェース又はその一部であってよい。

前処理ユニット１８及び前処理ユニット１８により実行される処理と対照的に、ピクチャ又はピクチャデータ１７（例えばビデオデータ１６）は、生ピクチャ又は生ピクチャデータ１７とも呼ばれてよい。

前処理ユニット１８は、（生）ピクチャデータ１７を受信し、ピクチャデータ１７に前処理を実行して、前処理済みピクチャ１９又は前処理済みピクチャデータ１９を取得するよう構成される。前処理ユニット１８により実行される前処理は、例えばトリミング、色形式変換（例えば、ＲＧＢからＹＣｂＣｒへ）、色補正、又はノイズ除去を含んでよい。前処理ユニット１８は光コンポーネントであってよいことが理解できる。

エンコーダ２０（例えばビデオエンコーダ２０）は、前処理済みピクチャデータ１９を受信し、符号化ピクチャデータ２１を提供するよう構成される（更なる詳細は、例えば図２又は図４に基づき後述される）。

ソース装置１２の通信インタフェース２２は、符号化ピクチャデータ２１を受信し、符号化ピクチャデータ２１（又はその任意の更なる処理済みバージョン）を通信チャネル１３を介して、別の装置、例えば宛先装置１４若しくは任意の他の装置へと、記憶又は直接再構成のために送信し、又は、復号又は格納のために符号化データ１３を格納し及び／又は符号化データ１３を別の装置、例えば宛先装置１４又は任意の他の装置へと、送信する前にそれぞれ、符号化ピクチャデータ２１を処理するよう構成されてよい。

宛先装置１４は、デコーダ３０（例えば、ビデオデコーダ３０）を含み、追加で、つまり任意で、通信インタフェース又は通信ユニット２８、後処理ユニット３２、及びディスプレイ装置３４を含んでよい。

宛先装置１４の通信インタフェース２８は、符号化ピクチャデータ２１（又はその任意の更なる処理済みバージョン）又は符号化データ１３を、例えばソース装置１２から直接に又は任意の他のソース、例えば記憶装置、例えば符号化ピクチャデータ記憶装置から受信し、符号化ピクチャデータ２１をデコーダ３０へ提供するよう構成される。

通信インタフェース２２及び通信インタフェース２８は、符号化ピクチャデータ２１又は符号化データ１３を、ソース装置１２と宛先装置１４との間の通信リンク、例えば直接有線又は無線接続を介して、又は任意の種類のネットワーク、例えば有線又は無線ネットワーク、又はそれらの任意の組み合わせ、又は任意の種類の私設又は公衆ネットワーク、又はそれらの任意の種類の組み合わせを介して送信又は受信するよう構成されてよい。

通信インタフェース２２は、例えば、符号化ピクチャデータ２１を適切な形式、例えばパケットにパッケージし、及び／又は通信リンク又は通信ネットワークを介して送信するために、任意の種類の送信符号化若しくは処理を用いて符号化ピクチャデータを処理するよう構成されてよい。

通信インタフェース２８は、通信インタフェース２２の相手方を形成し、例えば、送信されたデータを受信し、任意の種類の対応する送信復号若しくは処理を用いて送信データを処理し、及び／又は符号化データ１３をパッケージ解除して符号化ピクチャデータ２１を取得するよう構成されてよい。

通信インタフェース２２及び通信インタフェース２８の両方は、図１Ａでソース装置１２から宛先装置１４を指す符号化ピクチャデータ１３の矢印により示されるように、単方向通信インタフェース、又は、双方向通信インタフェースとして構成されてよく、例えば接続を確立するため、通信リンク及び／又はデータ送信、例えば符号化ピクチャデータ送信に関連する任意の他の情報に肯定応答しこれを交換するために、例えばメッセージを送信し及び受信するよう構成されてよい。

デコーダ３０は、符号化ピクチャデータ２１を受信し、復号ピクチャデータ３１又は復号ピクチャ３１を提供するよう構成される（更なる詳細は、例えば図３又は図５に基づき後述される）。

宛先装置１４の後プロセッサ３２は、復号ピクチャデータ３１（再構成ピクチャデータとも呼ばれる）、例えば復号ピクチャ３１を後処理して、後処理済みピクチャデータ３３、例えば後処理済みピクチャ３３を取得するよう構成される。後処理ユニット３２により実行される後処理は、例えば色形式変換（例えば、ＹＣｂＣｒからＲＧＢへ）、色補正、トリミング、又は再サンプリング、又は、例えば復号ピクチャデータ３１を例えばディスプレイ装置３４による表示のために準備するための任意の他の処理、を含んでよい。

宛先装置１４のディスプレイ装置３４は、例えばユーザ又はビューアにピクチャを表示するために、後処理済みピクチャデータ３３を受信するよう構成される。ディスプレイ装置３４は、再構成ピクチャを提示する任意の種類のディスプレイ、例えば内蔵又は外部ディスプレイ又はモニタであり又はそれを含んでよい。ディスプレイは、例えば液晶ディスプレイ（liquid crystal displays (LCD)）、有機発光ダイオード（organic light emitting diodes (OLED)）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、シリコン上の液晶（liquid crystal on silicon (LCoS)）、デジタル光プロセッサ（digital light processor(DLP)）又は任意の種類の他のディスプレイを含んでよい。

図１Ａはソース装置１２及び宛先装置１４を別個の装置として示すが、装置の実施形態は、ソース装置１２又は対応する機能と宛先装置１４又は対応する機能の両方又は両方の機能を含んでもよい。このような実施形態では、ソース装置１２又は対応する機能及び宛先装置１４又は対応する機能は、同じハードウェア及び／又はソフトウェア又は別個のハードウェア及び／又はソフトウェア又はそれらの任意の組み合わせを用いて実装されてよい。

説明に基づき当業者に明らかなように、図１Ａに示されるようなソース装置１２及び／又は宛先装置１４内の異なるユニット又は機能の存在及びその（正確な）分割は、実際の装置及び用途に依存して変化してよい。

エンコーダ２０（例えば、ビデオエンコーダ２０）及びデコーダ３０（例えば、ビデオデコーダ３０）はそれぞれ、１つ以上のマイクロプロセッサ、デジタル信号プロセッサ（digital signal processors (DSP)）、特定用途向け集積回路（application－specific integrated circuits (ASIC)）、フィールドプログラマブルゲートアレイ（field－programmable gate arrays (FPGA)）、個別ロジック、ハードウェア、又はそれらの任意の組み合わせのような、様々な適切な回路のうちのいずれかとして実装されてよい。技術が部分的にソフトウェアで実装される場合、装置は、適切な非一時的コンピュータ可読記憶媒体内のソフトウェアのための命令を格納してよく、命令を１つ以上のプロセッサを用いるハードウェアで実行して、本開示の技術を実行してよい。前述のいずれか（ハードウェア、ソフトウェア、ハードウェアとソフトウェアとの組み合わせ、等を含む）は、１つ以上のプロセッサであると考えられてよい。ビデオエンコーダ２０及びビデオデコーダ３０の各々は、１つ以上のエンコーダ又はデコーダに含まれてよく、いずれも、結合されたエンコーダ／デコーダ（encoder/decoder (CODEC)）の部分としてそれぞれの装置内に統合されてよい。

エンコーダ２０は、図２のエンコーダ２０に関して議論したような種々のモジュール及び／又はここで説明される任意の他のエンコーダシステム若しくはサブシステムを実現するために、処理回路４６により実装されてよい。デコーダ３０は、図３のデコーダ３０に関して議論したような種々のモジュール及び／又はここで説明された任意の他のデコーダシステム若しくはサブシステムを実現するために、処理回路４６により実装されてよい。処理回路は、後に議論されるような種々の動作を実行するよう構成されてよい。図５に示すように、技術が部分的にソフトウェアで実装される場合、装置は、適切な非一時的コンピュータ可読記憶媒体内のソフトウェアのための命令を格納してよく、該命令を１つ以上のプロセッサを用いるハードウェアで実行して、本開示の技術を実行してよい。ビデオエンコーダ２０及びビデオデコーダ３０のいずれも、例えば図１Ｂに示されるように、単一の装置内の結合されたエンコーダ／デコーダ（encoder/decoder (CODEC)）の部分として統合されてよい。

ソース装置１２は、ビデオ符号化装置又はビデオ符号化機器と呼ばれてよい。宛先装置１４は、ビデオ復号装置又はビデオ復号機器と呼ばれてよい。ソース装置１２及び宛先装置１４は、ビデオ符号化装置又はビデオ符号化機器の例であってよい。

ソース装置１２及び宛先装置１４は、任意の種類のハンドヘルド又は固定装置、例えばノートブック又はラップトップコンピュータ、移動電話機、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビジョン、ディスプレイ装置、デジタルメディアプレイヤ、ビデオゲームコンソール、（コンテンツサービスサーバ、又はコンテンツ配信サーバのような）ビデオストリーミング装置、ブロードキャスト受信装置、ブロードキャスト送信装置、等を含む、広範な装置のうちのいずれかを含んでよく、任意の種類のオペレーティングシステムを使用してよく又は使用しなくてよい。

幾つかの場合には、ソース装置１２及び宛先装置１４は、無線通信のために装備されてよい。従って、ソース装置１２及び宛先装置１４は、無線通信装置であってよい。

幾つかの場合には、図１Ａに示されるビデオ符号化システム１０は単に例であり、本願の技術は、必ずしも符号化装置と復号装置との間の任意のデータ通信を含まないビデオ符号化設定（例えば、ビデオ符号化又はビデオ復号）に適用してよい。他の例では、データはローカルメモリから読み出される、ネットワークを介してストリーミングされる、等であってよい。ビデオ符号化装置は、データを符号化しメモリに格納してよく、及び／又はビデオ復号装置はデータをメモリから読み出し復号してよい。幾つかの例では、符号化及び復号は、互いに通信しないが単にデータをメモリへと符号化し及び／又はメモリからデータを読み出し復号する装置により実行される。

説明の便宜上、本発明の実施形態は、ここで、例えば高効率ビデオ符号化（High－Efficiency Video Coding (HEVC)）、又はバーサタイルビデオ符号化（Versatile Video coding (VVC)）のリファレンスソフトウェア、ＩＴＵ－Ｔビデオ符号化専門家委員会（Video Coding Experts Group (VCEG)）及びＩＳＯ／ＩＥＣ動画専門家委員会（Motion Picture Experts Group (MPEG)）のビデオ符号化に関する共同作業部会（Joint Collaboration Team on Video Coding (JCT－VC)）により開発された次世代ビデオ符号化標準を参照して説明される。当業者は、本発明の実施形態がＨＥＶＣ又はＶＶＣに限定されないことを理解するだろう。

理解されるべきことに、ビデオエンコーダ２０を参照して説明した上述の例の各々について、ビデオデコーダ３０は、相互的処理を実行するよう構成されてよい。シグナリングシンタックス要素に関して、ビデオデコーダ３０は、このようなシンタックス要素を受信しパースし、相応して関連するビデオデータを復号するよう構成されてよい。幾つかの例では、ビデオエンコーダ２０は、１つ以上のシンタックス要素を符号化ビデオビットストリームへとエントロピー符号化してよい。このような例では、ビデオデコーダ３０は、このようなシンタックス要素をパースし、相応して関連するビデオデータを復号してよい。

図１Ｂは、例示的な実施形態による、図２のエンコーダ２０及び／又は図３のデコーダ３０を含む別の例示的なビデオ符号化システム４０の説明図である。システム４０は、本願において説明される種々の例に従う技術を実施できる。図示の実装では、ビデオ符号化システム４０は、画像装置４１、ビデオエンコーダ１００、ビデオデコーダ３０（及び／又は処理ユニット４６の論理回路４７により実装されるビデオコーダ）、アンテナ４２、１つ以上のプロセッサ４３、１つ以上のメモリストア４４、及び／又はディスプレイ装置４５を含んでよい。

図示のように、画像装置４１、アンテナ４２、処理ユニット４６、論理回路４７、ビデオエンコーダ２０、ビデオデコーダ３０、プロセッサ４３、メモリストア４４、及び／又はディスプレイ装置４５は、互いに通信可能であってよい。議論されるように、ビデオエンコーダ２０及びビデオデコーダ３０の両方と共に示されるが、ビデオ符号化システム４０は、種々の例においてビデオエンコーダ２０のみ又はビデオデコーダ３０のみを含んでよい。

示されるように幾つかの例では、ビデオ符号化システム４０はアンテナ４２を含んでよい。アンテナ４２は、例えばビデオデータの符号化ビットストリームを送信又は受信するよう構成されてよい。更に、幾つかの例では、ビデオ符号化システム４０はディスプレイ装置４５を含んでよい。ディスプレイ装置４５は、ビデオデータを提示するよう構成されてよい。示されるように、幾つかの例では、論理回路４７は処理ユニット４６により実装されてよい。処理ユニット４６は、特定用途向け集積回路（application－specific integrated circuit (ASIC)）ロジック、グラフィックプロセッサ、汎用プロセッサ、等を含んでよい。ビデオ符号化システム４０も、同様に特定用途向け集積回路（application－specific integrated circuit (ASIC)）ロジック、グラフィックプロセッサ、汎用プロセッサ、等を含んでよい任意的なプロセッサ４３を含んでよい。幾つかの例では、論理回路４７は、ハードウェア、ビデオ符号化専用ハードウェア、等により実装されてよく、プロセッサ４３は、汎用ソフトウェア、オペレーティングシステム、等により実装されてよい。更に、メモリストア４４は、揮発性メモリ（例えば、静的ランダムアクセスメモリ（Static Random Access Memory (SRAM)）、動的ランダムアクセスメモリ（Dynamic Random Access Memory (DRAM)）、等）又は不揮発性メモリ（例えば、フラッシュメモリ、等）、等のような任意の種類のメモリであってよい。非限定的な例では、メモリストア４４はキャッシュメモリにより実装されてよい。幾つかの例では、論理回路４７は、（例えば画像バッファの実装のために）メモリストア４４にアクセスしてよい。他の例では、論理回路４７及び／又は処理ユニット４６は、画像バッファ等の実装のためにメモリストア（例えばキャッシュ等）を含んでよい。

幾つかの例では、論理回路により実装されるビデオエンコーダ１００は、（例えば、処理ユニット４６又はメモリストア４４のいずれかによる）画像バッファ、及び（例えば、処理ユニット４６による）グラフィック処理ユニットを含んでよい。グラフィック処理ユニットは、画像バッファに通信可能に接続されてよい。グラフィック処理ユニットは、図２に関して議論したような種々のモジュール及び／又はここで説明される任意の他のエンコーダシステム若しくはサブシステムを実現するために、論理回路４７により実装されるようなビデオエンコーダ１００を含んでよい。論理回路は、ここで議論されるような種々の動作を実行するよう構成されてよい。

ビデオデコーダ３０は、図３のデコーダ３０に関して議論したような種々のモジュール及び／又はここで説明された任意の他のデコーダシステム若しくはサブシステムを実現するために、論理回路４７により実装されるのと同様の方法で実装されてよい。幾つかの例では、ビデオデコーダ３０は、論理回路を介して実装されてよく、（例えば、処理ユニット４２０又はメモリストア４４のいずれかによる）画像バッファ、及び（例えば、処理ユニット４６による）グラフィック処理ユニットを含んでよい。グラフィック処理ユニットは、画像バッファに通信可能に接続されてよい。グラフィック処理ユニットは、図３に関して議論したような種々のモジュール及び／又はここで説明される任意の他のデコーダシステム若しくはサブシステムを実現するために、論理回路４７により実装されるようなビデオデコーダ３０を含んでよい。

幾つかの例では、ビデオ符号化システム４０のアンテナ４２は、ビデオデータの符号化ビットストリームを受信するよう構成されてよい。議論したように、符号化ビットストリームは、符号化パーティションに関連するデータ（例えば、変換係数又は量子化済み変換係数、（議論するような）任意的な指示子、及び／又は符号化パーティションを定めるデータ）のような、ここで議論されるビデオフレームの符号化に関連するデータ、指示子、インデックス値、モード選択データ、等を含んでよい。ビデオ符号化システム４０は、アンテナ４２に接続され符号化ビットストリームを復号するよう構成されるビデオデコーダ３０も含んでよい。ディスプレイ装置４５は、ビデオフレームを提示するよう構成される。

図２は、本願の技術を実施するよう構成される例示的なビデオエンコーダ２０の概略的／概念的ブロック図を示す。図２の例では、ビデオエンコーダ２０は、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、逆量子化ユニット２１０及び逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループフィルタユニット２２０、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０、予測処理ユニット２６０、及びエントロピー符号化ユニット２７０を含む。予測処理ユニット２６０は、インター予測ユニット２４４、イントラ予測処理ユニット２５４、及びモード選択ユニット２６２を含んでよい。インター予測ユニット２４４は、動き推定ユニット及び動き補償ユニット（図示しない）を含んでよい。図２に示すようなビデオエンコーダ２０は、ハイブリッドビデオエンコーダ又はハイブリッドビデオコーデックに従うビデオエンコーダとも呼ばれてよい。

例えば、残差計算ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、予測処理ユニット２６０、及びエントロピー符号化ユニット２７０は、エンコーダ２０の順方向信号経路を形成する。一方で、例えば、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、バッファ２１６、ループフィルタ２２０、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０、予測処理ユニット２６０は、エンコーダの逆方向信号経路を形成し、エンコーダの逆方向信号経路はデコーダの信号経路に対応する（図３のデコーダ３０を参照）。

逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループフィルタ２２０、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０、インター予測ユニット２４４、及びイントラ予測ユニット２５４は、ビデオエンコーダ２０の「内蔵デコーダ」を形成するとも表される。

エンコーダ２０は、例えば入力２０２により、ピクチャ２０１又はピクチャ２０１のブロック２０３、例えばビデオ又はビデオシーケンスを形成するピクチャのシーケンスのピクチャを受信するよう構成される。ピクチャブロック２０３は、（特に、ビデオ符号化では、現在ピクチャを他のピクチャ、例えば同じビデオシーケンス、つまり現在ピクチャも含むビデオシーケンスの前に符号化され及び／又は復号されたピクチャと区別するために）現在ピクチャブロック又は符号化されるべきピクチャブロックとも、またピクチャ２０１は、現在ピクチャ又は符号化されるべきピクチャとも呼ばれてよい。

（デジタル）ピクチャは、強度値を有するサンプルの２次元配列又は行列と考えられる又は考えることができる。配列の中のサンプルは、ピクセル（pixel）（ピクチャ要素の短縮形）又はペル（pel）とも呼ばれてよい。配列又はピクチャの水平及び垂直方向（又は軸）にあるサンプルの数は、ピクチャのサイズ及び／又は解像度を定める。色の表現のために、標準的に３つの色成分が利用される。つまり、ピクチャは、３つのサンプル配列で表現され又はそれを含んでよい。ＲＢＧ形式又は色空間では、ピクチャは、対応する赤、緑、及び青色サンプル配列を含む。しかしながら、ビデオ符号化では、各ピクセルは、標準的に、輝度及び色度形式、又は色空間、例えば、Ｙ（時には代わりにＬが使用される）により示される輝度成分とＣｂ及びＣｒにより示される２つの色度成分とを含むＹＣｂＣｒで表現される。輝度（又は略してｌｕｍａ）成分Ｙは、明るさ又はグレーレベル強度（例えば、グレイスケールピクチャのような）を表現する。一方で、２つの色度（又は略してｃｈｒｏｍａ）成分Ｃｂ及びＣｒは、色度又は色情報成分を表現する。従って、ＹＣｂＣｒ形式のピクチャは、輝度サンプル値（Ｙ）の輝度サンプル配列と、色度値（Ｃｂ及びＣｒ）の２つの色度サンプル配列とを含む。ＲＧＢ形式のピクチャは、ＹＣｂＣｒ形式に転換され又は変換されてよく、逆も同様であり、処理は色転換又は色変換としても知られる。ピクチャが単色である場合、ピクチャは、輝度サンプル配列のみを含んでよい。従って、ピクチャは、例えば、単色形式のルマサンプルの配列又はルマサンプルの配列、及び４：２：０、４：２：２、及び４：４：４色形式のクロマサンプルの２つの対応する配列であってよい。

パーティショニング

エンコーダ２０の実施形態は、ピクチャ２０１を複数の（標準的には重なり合わない）ピクチャブロック２０３にパーティションするよう構成されるパーティションユニット（図２に示されない）を含んでよい。これらのブロックは、ルートブロック、マクロブロック（Ｈ．２６４／ＡＶＣ）又は符号化木ブロック（coding tree block (CTB)）又は符号化木単位（coding tree unit (CTU)）（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）と呼ばれてもよい。パーティションユニットは、同じブロックサイズをビデオシーケンスの全部のピクチャ、及びブロックサイズを定める対応するグリッドに対して使用し、又はピクチャ又はピクチャの部分集合若しくはグループ間のブロックサイズを変更し、各ピクチャを対応するブロックにパーティションするよう構成されてよい。

更なる実施形態では、ビデオエンコーダは、ピクチャ２０１のブロック２０３、例えばピクチャ２０１を形成する１つの、幾つかの、又は全部のブロックを直接受信するよう構成されてよい。ピクチャブロック２０３は、現在ピクチャブロック又は符号化されるべきピクチャブロックとも呼ばれてよい。

一例では、ビデオエンコーダ２０の予測処理ユニット２６０は、上述のパーティション技術の任意の組み合わせを実行するよう構成されてよい。

ピクチャ２０１と同様に、ブロック２０３は、ここでも、強度値（サンプル値）を有するサンプルの２次元配列又は行列であり又は考えることができるが、ピクチャ２０１より小さい次元である。言い換えると、ブロック２０３は、例えば１つのサンプル配列（例えば、単色ピクチャ２０１の場合には、ルマ配列）、又は３つのサンプル配列（例えば、カラーピクチャ２０１の場合には、ルマ及び２つのクロマ配列）、又は適用される色形式に依存して任意の他の数の及び／又は種類の配列を含んでよい。ブロック２０３の水平及び垂直方向（又は軸）にあるサンプルの数は、ブロック２０３のサイズを定める。従って、ブロックは、例えばサンプルのＭ×Ｎ（Ｍ列×Ｎ行）配列、又は変換係数のＭ×Ｎ配列であってよい。

図２に示すようなエンコーダ２０は、ブロック毎にピクチャ２０１を符号化するよう構成される。例えば、符号化及び予測がブロック２０３毎に実行される。

図２に示すようなビデオエンコーダ２０の実施形態は、スライス（ビデオスライスとも呼ばれる）を用いてピクチャをパーティション及び／又は符号化するよう更に構成されてよい。ここで、ピクチャは、（標準的に重なり合わない）１つ以上のスライスにパーティションされ又はそれを用いて符号化されてよく、各スライスは、１つ以上のブロック（例えばＣＴＵ）又はブロックの１つ以上のグループ（例えば、タイル（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）又はブリック（ＶＶＣ））を含んでよい。

図２に示すようなビデオエンコーダ２０の実施形態は、スライス／タイルグループ（ビデオタイルグループとも呼ばれる）及び／又はタイル（ビデオタイルとも呼ばれる）にピクチャをパーティション及び／又は符号化するよう更に構成されてよい。ここで、ピクチャは、（標準的に重なり合わない）１つ以上のスライス／タイルグループにパーティションされ又はそれを用いて符号化されてよく、各スライス／タイルグループは、例えば１つ以上のブロック（例えばＣＴＵ）又は１つ以上のタイルを含んでよく、各タイルは、例えば長方形形状であってよく、１つ以上のブロック（例えばＣＴＵ）、例えば完全な又は部分的ブロックを含んでよい。

残差計算
残差計算ユニット２０４は、残差ブロック２０５を、ピクチャブロック２０３及び予測ブロック２６５（予測ブロック２６５に関する更なる詳細は後に提供される）に基づき、例えば予測ブロック２６５のサンプル値をピクチャブロック２０３のサンプル値からサンプル毎に（ピクセル毎に）減算してサンプルドメインにおける残差ブロック２０５を取得することにより、計算するよう構成される。

変換
変換処理ユニット２０６は、変換、例えば離散コサイン変換（discrete cosine transform (DCT)）又は離散サイン変換（discrete sine transform (DST)）を残差ブロック２０５のサンプル値に対して適用して、変換ドメインにおける変換係数２０７を取得するよう構成される。変換係数２０７は、変換残差係数とも呼ばれ、変換ドメインにおける残差ブロック２０５を表してよい。

変換処理ユニット２０６は、ＨＥＶＣ／Ｈ．２６５のために指定された変換のようなＤＣＴ／ＤＳＴの整数近似を適用するよう構成されてよい。直交ＤＣＴ変換と比べて、このような整数近似は、標準的に、特定の因子によりスケーリングされる。順方向及び逆変換により処理される残差ブロックのノルムを維持するために、追加スケーリング因子が変換処理の部分として適用される。スケーリング因子は、標準的に、スケーリング因子がシフト演算のために２のべき乗であること、変換係数のビット深さ、精度と実装コストとの間のトレードオフ、等のような特定の制約に基づき選択される。特定のスケーリング因子は、例えば、例えばデコーダ３０における逆変換処理ユニット２１２による逆変換（及び例えばエンコーダ２０における逆変換処理ユニット２１２による対応する逆変換）のために指定され、例えばエンコーダ２０における変換処理ユニット２０６による順方向変換のための対応するスケーリング因子が相応して指定されてよい。

ビデオエンコーダ２０の実施形態（それぞれ、変換処理ユニット２０６）は、例えば直接又はエントロピー符号化ユニット２７０により符号化又は圧縮される、変換パラメータ、例えば、変換又は複数の変換のタイプ、を出力するよう構成されてよい。その結果、例えば、ビデオデコーダ３０は、復号のために変換パラメータを受信し使用してよい。

量子化
量子化ユニット２０８は、変換係数２０７を量子化して、例えばスカラー量子化又はベクトル量子化を適用することにより、量子化済み変換係数２０９を取得するよう構成される。量子化済み変換係数２０９は、量子化済み残差係数２０９とも呼ばれてよい。量子化処理は、変換係数２０７の一部又は全部に関連するビット深さを低減してよい。例えば、ｎビットの変換係数は、量子化の間、ｍビットの変換係数に丸め込まれてよい。ここで、ｎはｍより大きい。量子化の程度は、量子化パラメータ（quantization parameter (QP)）を調整することにより、変更されてよい。例えば、スカラー量子化では、より精細な又は粗い量子化を達成するために異なるスケーリングが適用されてよい。量子化ステップサイズが小さいほど、精細な量子化に対応する。一方で、量子化ステップサイズが大きいほど、粗い量子化に対応する。適用可能な量子化ステップは、量子化パラメータ（quantization parameter (QP)）により示されてよい。量子化パラメータは、例えば、適用可能な量子化ステップサイズの所定のセットに対するインデックスであってよい。例えば、小さい量子化パラメータは、精細な量子化（小さい量子化ステップサイズ）に対応してよく、大きな量子化パラメータは粗い量子化（大きな量子化ステップサイズ）に対応してよく、逆も同様である。量子化は、量子化ステップサイズによる除算を含んでよい。例えば逆量子化２１０による対応する又は逆の逆量子化は、量子化ステップサイズによる乗算を含んでよい。幾つかの標準、例えばＨＥＶＣに従う実施形態は、量子化ステップサイズを決定するために量子化パラメータを使用するよう構成されてよい。通常、量子化ステップサイズは、除算を含む式の不動点近似を用いて、量子化パラメータに基づき計算されてよい。量子化ステップサイズ及び量子化パラメータの式の不動点近似において使用されるスケーリングのために変更され得る残差ブロックのノルムを復元するために、量子化及び逆量子化のための追加のスケーリング因子が導入されてよい。１つの例示的な実装では、逆変換及び逆量子化のスケーリングは結合されてよい。代替として、カスタマイズされた量子化テーブルが使用され、エンコーダからデコーダへ、例えばビットストリームの中でシグナリングされてよい。量子化は、損失動作であり、損失は量子化ステップサイズの増大に伴い増大する。

ビデオエンコーダ２０の実施形態（それぞれ、量子化ユニット２０８）は、例えば直接又はエントロピー符号化ユニット２７０により符号化される、量子化パラメータ（quantization parameters (QP)）を出力するよう構成されてよい。その結果、例えば、ビデオデコーダ３０は、復号のために量子化パラメータを受信し適用してよい。

逆量子化ユニット２１０は、例えば、量子化ユニット２０８と同じ量子化ステップサイズに基づき又はそれを用いて、量子化ユニット２０８により適用された量子化方式の逆を適用することにより、量子化済み係数に対して量子化ユニット２０８の逆量子化を適用して、逆量子化済み係数２１１を取得するよう構成される。逆量子化済み係数２１１は、逆量子化済み残差係数２１１とも呼ばれ、標準的には量子化による損失のために変換係数と同じではないが、変換係数２０７に対応してよい。

逆変換処理ユニット２１２は、変換処理ユニット２０６により適用された変換の逆変換、例えば逆離散コサイン変換（inverse discrete cosine transform (DCT)）又は逆離散サイン変換（inverse discrete sine transform (DST)）を適用して、サンプルドメインにおける逆変換ブロック２１３を取得するよう構成される。逆変換ブロック２１３は、逆変換逆量子化済みブロック２１３又は逆変換残差ブロック２１３とも呼ばれてよい。

再構成ユニット２１４（例えば、加算器２１４）は、逆変換ブロック２１３（つまり再構成残差ブロック２１３）を予測ブロック２６５に加算して、例えば再構成残差ブロック２１３のサンプル値と予測ブロック２６５のサンプル値とを加算することにより、サンプルドメインにおける再構成ブロック２１５を取得するよう構成される。

任意で、バッファユニット２１６（略して「バッファ」２１６）、例えばラインバッファ２１６は、再構成ブロック２１５及びそれぞれのサンプル値を、例えばイントラ予測のためにバッファリングし又は格納するよう構成される。更なる実施形態では、エンコーダは、フィルタリングされていない再構成ブロック及び／又はバッファユニット２１６に格納されたそれぞれのサンプル値を、任意の種類の推定及び／又は予測、例えばイントラ予測のために使用するよう構成されてよい。

エンコーダ２０の実施形態は、例えば、バッファユニット２１６がイントラ予測２５４のためだけでなく、ループフィルタユニット２２０（図２に示されない）のためにも再構成ブロック２１５を格納するために使用されるように、及び／又はバッファユニット２１６及び復号ピクチャバッファユニット２３０が１つのバッファを形成するように、構成されてよい。更なる実施形態は、フィルタリング済みブロック２２１及び／又は復号ピクチャバッファ２３０からのブロック若しくはサンプル（両方とも図２に示されない）をイントラ予測２５４のための入力又は基礎として使用するよう構成されてよい。

ループフィルタユニット２２０（又は略して「ループフィルタ」２２０）は、再構成ブロック２１５をフィルタリングして、フィルタリング済みブロック２２１を取得するよう、例えばピクセル遷移を円滑化するよう或いはビデオ品質を向上するよう構成される。ループフィルタユニット２２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset (SAO)）フィルタ又は他のフィルタ、例えばバイラテラルフィルタ又は適応ループフィルタ（adaptive loop filter (ALF)）又は先鋭化若しくは円滑化フィルタ又は共同フィルタのような１つ以上のフィルタを表すことを意図する。ループフィルタユニット２２０はインループフィルタであるとして図２に示されるが、他の構成では、ループフィルタユニット２２０は後置きループフィルタとして実装されてよい。フィルタリング済みブロック２２１は、フィルタリング済み再構成ブロック２２１と呼ばれてもよい。復号ピクチャバッファ２３０は、ループフィルタユニット２２０がフィルタリング動作を再構成符号化ブロックに対して実行した後に、再構成符号化ブロックを格納してよい。

ループフィルタユニット２２０（又は略して「ループフィルタ」２２０）は、再構成ブロック２１５をフィルタリングして、フィルタリング済みブロック２２１を取得するよう、又は通常、再構成サンプルをフィルタリングしてフィルタリング済みサンプル値を取得するよう構成される。ループフィルタユニットは、例えば、ピクセル遷移を円滑化し、又はその他の場合にはビデオ品質を向上するよう構成される。ループフィルタユニット２２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset (SAO)）フィルタ又は１つ以上の他のフィルタ、例えば適応ループフィルタ（adaptive loop filter (ALF)）、ノイズ抑制フィルタ（noise suppression filter (NSF)）又はそれらの任意の組合せのような１つ以上のループフィルタを含んでよい。例では、ループフィルタユニット２２０は、デブロッキングフィルタ、ＳＡＯフィルタ、及びＡＬＦフィルタを含んでよい。フィルタリング処理の順序は、デブロッキングフィルタ、ＳＡＯ、及びＡＬＦであってよい。別の例では、クロマスケーリングを伴うルママッピング（luma mapping with chroma scaling (LMCS)）と呼ばれる処理（つまり、適応型インループリシェーパ）が、追加される。この処理は、デブロッキングの前に実行される。別の例では、デブロッキングフィルタ処理は、内部サブブロックエッジ、例えばアフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（sub－block transform (SBT)）エッジ、及びイントラサブパーティション（intra sub－partition (ISP)）エッジにも適用されてよい。ループフィルタユニット２２０はインループフィルタであるとして図２に示されるが、他の構成では、ループフィルタユニット２２０は後置きループフィルタとして実装されてよい。フィルタリング済みブロック２２１は、フィルタリング済み再構成ブロック２２１と呼ばれてもよい。

ビデオエンコーダ２０の実施形態（それぞれ、ループフィルタユニット２２０）は、例えば直接又はエントロピー符号化ユニット２７０により符号化される、（ＳＡＯフィルタパラメータ又はＡＬＦフィルタパラメータ又はＬＭＣＳパラメータのような）ループフィルタパラメータを出力するよう構成されてよい。その結果、例えば、デコーダ３０は、復号のために同じループフィルタパラメータ又はそれぞれのループフィルタを受信し適用してよい。

エンコーダ２０（それぞれループフィルタユニット２２０）の実施形態は、例えば直接に又は任意の他のエントロピー符号化ユニット２７０又は任意の他のエントロピー符号化ユニットによりエントロピー符号化された（サンプル適応オフセット情報のような）ループフィルタパラメータを出力するよう構成されてよい。その結果、例えば、デコーダ３０は、同じループフィルタパラメータを受信し、復号のために適用してよい。

復号ピクチャバッファ（decoded picture buffer (DPB)）２３０は、ビデオエンコーダ２０によるビデオデータの符号化において使用するために、参照ピクチャデータを格納する参照ピクチャメモリであってよい。ＤＰＢ２３０は、同期ＲＡＭ（synchronous DRAM (SDRAM)）を含む動的ランダムアクセスメモリ（dynamic random access memory (DRAM)）、磁気抵抗ＲＡＭ（magnetoresistive RAM (MRAM)）、抵抗ＲＡＭ（resistive RAM (RRAM)）、又は他の種類のメモリ装置のような、種々のメモリ装置のうちのいずれかにより形成されてよい。ＤＰＢ２３０及びバッファ２１６は、同じメモリ装置又は別個のメモリ装置により提供されてよい。幾つかの例では、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０は、フィルタリング済みブロック２２１を格納するよう構成される。復号ピクチャバッファ２３０は、同じ現在ピクチャの又は異なるピクチャ、例えば前の再構成ピクチャの他の前のフィルタリング済みブロック、例えば前の再構成及びフィルタリング済みブロック２２１を格納するよう更に構成されてよく、完全な前の再構成、つまり復号ピクチャ（及び対応する参照ブロック及びサンプル）、及び／又は部分的な再構成現在ピクチャ（及び対応する参照ブロック及びサンプル）を、例えばインター予測のために提供してよい。幾つかの例では、再構成ブロック２１５が再構成されるがインループフィルタリングを伴わない場合、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０は、１つ以上のフィルタリングされていない再構成ブロック２１５、又は一般的には、例えば再構成ブロック２１５がループフィルタユニット２２０によりフィルタリングされない場合には、フィルタリングされていない再構成サンプルを、又は再構成ブロック又はサンプルの任意の他の更に処理されたバージョンを格納するよう構成される。

予測処理ユニット２６０は、ブロック予測処理ユニット２６０とも呼ばれ、ブロック２０３（現在ピクチャ２０１の現在ブロック２０３）及び再構成ピクチャデータ、例えば同じ（現在）ピクチャの参照サンプルをバッファ２１６から、及び／又は１又は複数の前の復号ピクチャからの参照ピクチャデータ２３１を復号ピクチャバッファ２３０から受信し又は取得し、このようなデータを予測のために処理し、つまりインター予測ブロック２４５又はイントラ予測ブロック２５５であってよい予測ブロック２６５を提供するよう構成される。

モード選択ユニット２６２は、予測モード（例えば、イントラ又はインター予測モード）及び／又は残差ブロック２０５の計算のために及び再構成ブロック２１５の再構成のために予測ブロック２６５として使用されるべき対応する予測ブロック２４５又は２５５を選択するよう構成されてよい。

モード選択ユニット２６２の実施形態は、最も適する又は言い換えると最小残差（最小残差は送信又は記憶のためのより良い圧縮を意味する）又は最小シグナリングオーバヘッド（最小シグナリングオーバヘッドは送信又は記憶のためのより良い圧縮を意味する）を提供する又は両者を考慮する若しくはバランスを取る予測モードを（例えば、予測処理ユニット２６０によりサポートされるものから）選択するよう構成されてよい。モード選択ユニット２６２は、レート歪み最適化（rate distortion optimization (RDO)）に基づき、予測モードを決定するよう、つまり、最小のレート歪み最適化を提供する若しくは関連付けられたレート歪みが予測モード選択基準を少なくとも満たす予測モードを選択するよう構成されてよい。

以下では、例示的なエンコーダ２０により実行される予測処理（例えば、予測処理ユニット２６０）及び（例えばモード選択ユニット２６２による）モード選択が更に詳細に説明される。

上述の実施形態に追加又は代替として、図１７による別の実施形態では、モード選択ユニット２６０は、パーティションユニット２６２、インター予測ユニット２４４、及びイントラ予測ユニット２５４を含み、元のピクチャデータ、例えば元のブロック２０３（現在ピクチャ１７の現在ブロック２０３）、及び再構成ピクチャデータ、例えば同じ（現在）ピクチャの及び／又は１つ又は複数の前の復号ピクチャからの、例えば復号ピクチャバッファ２３０若しくは他のバッファ（例えば、図示されないラインバッファ）からのフィルタリングされた及び／又はフィルタリングされていない再構成サンプル又はブロック、を受信し又は取得するよう構成される。再構成ピクチャデータは、予測ブロック２６５又は予測子２６５を取得するために、予測、例えばインター予測又はイントラ予測のために参照ピクチャデータとして使用される。

モード選択ユニット２６０は、（パーティションしないことを含む）現在ブロック予測モードのパーティション、及び予測モード（例えば、イントラ又はインター予測モード）を決定又は選択し、残差ブロック２０５の計算のため及び再構成ブロック２１５の再構成のために使用される対応する予測ブロック２０５を生成するよう構成されてよい。

モード選択ユニット２６０の実施形態は、最良の一致又は言い換えると最小残差（最小残差は送信又は記憶のためのより良い圧縮を意味する）又は最小シグナリングオーバヘッド（最小シグナリングオーバヘッドは送信又は記憶のためのより良い圧縮を意味する）を提供する又は両者を考慮する若しくはバランスを取るパーティション及び予測モードを（例えば、モード選択ユニット２６０によりサポートされる又は利用可能なものから）選択するよう構成されてよい。モード選択ユニット２６０は、レート歪み最適化（rate distortion optimization (RDO)）に基づき、パーティション及び予測モードを決定するよう、つまり、最小のレート歪みを提供する予測モードを選択するよう構成されてよい。この文脈における「最良」、「最小」、「最適」、等のような用語は、必ずしも全体的な「最良」、「最小」、「最適」、等を表さないが、閾値を超える又はそれより下である値のような終了若しくは選択基準、又は「準最適選択」であるが複雑さ及び処理時間の削減をもたらす可能性のある他の制約の充足を表してもよい。

言い換えると、パーティションユニット２６２は、ビデオシーケンスからのピクチャを符号化木単位（coding tree unit (CTU)）のシーケンスにパーティションし、ＣＴＵ２０３は、例えば４分木パーティション（quad－tree－partitioning (QT)）、２分パーティション（binary partitioning (BT)）、又は３分木パーティション（triple－tree－partitioning (TT)）、又はそれらの任意の組み合わせを繰り返し使用して、更に小さいブロックパーティション又はサブブロック（これもまたブロックを形成する）に更にパーティションされてよく、例えば各ブロックパーティション又はサブブロックに対して予測を実行するよう更に構成されてよい。ここで、モード選択は、パーティション済みブロック２０３の木構造の選択を含み、予測モードはブロックパーティション又はサブブロックの各々に適用される。

以下では、例示的なビデオエンコーダ２０により実行される（例えば、パーティションユニット２６０による）パーティション及び（インター予測ユニット２４４及びイントラ予測ユニット２５４による）予測処理が更に詳細に説明される。

パーティショニング
パーティションユニット２６２は、ビデオシーケンスからのピクチャを、符号化木単位（coding tree unit (CTU）のシーケンスにパーティションするよう構成されてよく、パーティションユニット２６２は、符号化木単位（coding tree unit (CTU））２０３を、更に小さいパーティション、例えば更に小さい正方形若しくは長方形ブロックサイズにパーティション（又は分割）してよい。３個のサンプル配列を有するピクチャでは、ＣＴＵは、ルマサンプルのＮ×Ｎブロックと一緒に、クロマサンプルの２個の対応するブロックで構成される。ＣＴＵ内のルマブロックの最大許容サイズは、策定中のバーサタイルビデオ符号化（versatile video coding (VVC)）１２８×１２８であるよう指定されるが、将来には１２８×１２８以外の値、例えば２５６×２５６であるよう指定され得る。ピクチャのＣＴＵは、スライス／タイルグループ、タイル又はブリックとしてクラスタ化／グループ化されてよい。タイルは、ピクチャの長方形領域をカバーし、タイルは、１つ以上のブリックに分割できる。ブリックは、タイル内の多数のＣＴＵ行で構成される。複数のブリックにパーティションされないタイルは、ブリックと呼ぶことができる。しかしながら、ブリックはタイルの真部分集合であり、タイルと呼ばれない。ＶＶＣでサポートされるタイルグループの２つのモード、つまりラスタスキャンスライス／タイルグループモード、及び長方形スライスモードがある。ラスタスキャンタイルグループモードでは、スライス／タイルグループは、ピクチャのタイルラスタスキャンの中で、タイルのシーケンスを含む。長方形スライスモードでは、スライスは、ピクチャの長方形領域を集合的に形成する、ピクチャの多数のブリックを含む。長方形スライスの中のブリックは、スライスのブリックラスタスキャンの順である。これらの更に小さいブロック（これは、サブブロックとも呼ばれてよい）は、一層小さいパーティションに更にパーティションされてよい。これは、木パーティション又は階層木パーティションとも呼ばれる。ここで、例えばルート木レベル０（階層レベル０、深さ０）にあるルートブロックは、再帰的にパーティションされて、例えば、次のより下の木レベルにある２つ以上のブロック、例えば木レベル１（階層レベル１、深さ１）にあるノードにパーティションされてよい。ここで、例えば終了基準が充足された、例えば最大木深さ又は最小ブロックサイズに達したために、パーティションが終了するまで、これらのブロックは、再び、次のより下の木レベル、例えば木レベル２（階層レベル２、深さ２）の２つ以上のブロックにパーティションされてよい、等である。更にパーティションされないブロックは、木のリーフブロック又はリーフノードとも呼ばれる。２個のパーティションへのパーティションを用いる木は、２分木（binary－tree (BT)）と呼ばれ、３個のパーティションへのパーティションを用いる木は３分木（ternary－tree (TT)）と呼ばれ、４個のパーティションへのパーティションを用いる木は４分木（quad－tree (QT)）と呼ばれる。

例えば、符号化木単位（coding tree unit (CTU)）は、ルマサンプルのＣＴＢ、３個のサンプル配列を有するピクチャのクロマサンプルの２個の対応するＣＴＢ、又は単色ピクチャ又は３個の別個の色平面及びサンプルを符号化するために使用されるシンタックス構造を用いて符号化されるピクチャのサンプルのＣＴＢであり又はそれを含んでよい。相応して、符号化木単位（coding tree block (CTB)）は、Ｎの何らかの値のサンプルのＮ×Ｎブロックであってよい。その結果、ＣＴＢへのコンポーネントの分割はパーティションである。符号化単位（coding unit (CU)）は、ルマサンプルの符号化ブロック、３個のサンプル配列を有するピクチャのクロマサンプルの２個の対応する符号化ブロック、又は単色ピクチャ又は３個の別個の色平面及びサンプルを符号化するために使用されるシンタックス構造を用いて符号化されるピクチャのサンプルの符号化ブロックであり又はそれを含んでよい。相応して、符号木単位（coding block (CB)）は、Ｍ及びＮの何らかの値のサンプルのＭ×Ｎブロックであってよい。その結果、符号化ブロックへのＣＴＢの分割はパーティションである。

例えばＨＥＶＣに従う実施形態では、符号化木単位（coding tree unit (CTU)）は、符号化木として示される４分木構造を用いてＣＵに分割されてよい。ピクチャ領域をインターピクチャ（時間）又はイントラピクチャ（空間）予測を用いて符号化するかどうかの決定は、リーフＣＵレベルで行われる。各リーフＣＵは、ＰＵ分割タイプに従い、１、２、又は４個のＰＵに更に分割できる。１個のＰＵ内で、同じ予測処理が適用され、関連情報がＰＵ毎にデコーダへ送信される。ＰＵ分割タイプに基づき予測処理を適用することにより、残差ブロックを取得した後に、リーフＣＵは、ＣＵの符号化木と同様の別の４分木構造に従い、変換ユニット（transform unit (TU)）にパーティションすることができる。

例えば、バーサタイルビデオ符号化（Versatile Video Coding (VVC)）と呼ばれる現在策定中の最新のビデオ符号化標準に従う実施形態では、２分及び３分を用いる結合された４分木ネストマルチタイプ木は、例えば符号化木単位をパーティションするために使用されるセグメント化構造を分割する。符号化木単位の中の符号化木構造では、ＣＵは正方形又は長方形形状のいずれかを有し得る。例えば、符号化木単位（coding tree unit (CTU)）は、先ず、４分木によりパーティションされる。次に、４分木リーフノードは、マルチタイプ木構造により更にパーティションされ得る。マルチタイプ木構造には４個の分割タイプ、垂直２分割（SPLIT_BT_VER）、水平２分割（SPLIT_BT_HOR）、垂直３分割（SPLIT_TT_VER）、及び水平３分割（SPLIT_TT_HOR）がある。マルチタイプ木リーフノードは、符号化単位（coding unit (CU)）と呼ばれ、ＣＵが最大変換長に対して大きすぎない限り、このセグメント化は、任意の更なるパーティションを伴わずに予測及び変換処理のために使用される。これは、大部分の場合において、ＣＵ、ＰＵ、及びＴＵが、ネストマルチタイプ木符号化ブロック構造を有する４分木において同じブロックサイズを有することを意味する。最大のサポートされる変換長がＣＵの色成分の幅又は高さより小さいとき、例外が生じる。ＶＶＣは、ネストマルチタイプ木符号化木構造を有する４分木において、パーティション分割情報のユニークなシグナリングメカニズムを開発する。シグナリングメカニズムでは、符号化木単位（coding tree unit (CTU)）は、４分木のルートとして取り扱われ、４分木構造により最初にパーティションされる。各４分木リーフノードは（それを可能にするために十分に大きいとき）、次に、マルチタイプ木構造により更にパーティションされる。マルチタイプ木構造では、第１フラグ（mtt_split_cu_flag）は、ノードが更にパーティションされるかどうかを示すためにシグナリングされる。ノードが更にパーティションされるとき、第２フラグ（mtt_split_cu_vertical_flag）は、分割方向を示すためにシグナリングされる。次に、第３フラグ（mtt_split_cu_binary_flag）は、分割が２分割又は３分割であるかどうかを示すためにシグナリングされる。mtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagの値に基づき、ＣＵのマルチタイプ木分割モード（MttSplitMode）が、所定のルール又はテーブルに基づきデコーダにより導出できる。留意すべきことに、特定の設計、例えばＶＶＣハードウェアデコーダにおける６４×６４ルマブロック及び３２×３２クロマパイプライン設計では、図６に示されるように、ルマ符号化ブロックの幅又は高さのいずれかが６４より大きいとき、ＴＴ分割は禁止される。クロマ符号化ブロックの幅又は高さのいずれかが３２より大きいときも、ＴＴ分割は禁止される。パイプライン設計は、ピクチャを、ピクチャ内の重なり合わない単位として定義される仮想パイプラインデータ単位（Virtual pipeline data unit (VPDU)）に分割する。ハードウェアデコーダでは、連続するＶＰＤＵは、複数のパイプライン段により同時に処理される。ＶＰＤＵサイズは、大部分のパイプライン段においてバッファサイズにほぼ比例する。従って、ＶＰＤＵサイズを小さく保つことが重要である。大部分のハードウェアデコーダでは、ＶＰＤＵサイズは、最大変換ブロック（transform block (TB)）サイズに設定できる。しかしながら、ＶＶＣでは、３分木（ternary tree (TT)）及び２分木（binary tree (BT)）パーティションは、ＶＰＤＵサイズの増大をもたらし得る。

更に、留意すべきことに、木ノードブロックの一部が下又は右のピクチャ境界を越えると、木ノードブロックは、全ての符号化ＣＵの全部のサンプルがピクチャ境界の内側に位置するまで、強制的に分割される。

一例として、イントラサブパーティション（Intra Sub－Partition (ISP)）ツールは、ルマイントラ予測ブロックを、ブロックサイズに依存して水平又は垂直に２又は４個のサブパーティションに分割してよい。

一例では、ビデオエンコーダ２０のモード選択ユニット２６０は、ここに記載のパーティション技術の任意の組み合わせを実行するよう構成されてよい。

上述のように、エンコーダ２０は、最良の又は最適な予測モードを決定し又は（予め決定された）予測モードのセットから選択するよう構成される。予測モードのセットは、例えばイントラ予測モード及び／又はインター予測モードを含んでよい。

イントラ予測モードのセットは、３５個の異なるイントラ予測モード、例えばＨ．２６５で定義されたようなＤＣ（又は平均）モード及び平面モードのような無指向性モードを含んでよく、又は６７個の異なるイントラ予測モード、例えばＶＣＣのために定義されたようなＤＣ（又は平均）モード及び平面モードのような無指向性モード若しくは指向性モードを含んでよい。一例として、幾つかの従来の角度イントラ予測モードは、例えばＶＶＣで定義されたような非正方形ブロックのための広角イントラ予測モードにより適応して置き換えられる。別の例として、ＤＣ予測のための分割操作を回避するために、より長い辺のみが、非正方形ブロックについて平均を計算するために使用される。そして、平面モードのイントラ予測の結果は、位置依存イントラ予測結合（position dependent intra prediction combination (PDPC)）方法により更に変更されてよい。

イントラ予測ユニット２５４は、イントラ予測モードのセットのうちのイントラ予測モードに従いイントラ予測ブロック２６５を生成するために、同じ現在ピクチャの近隣ブロックの再構成サンプルを使用するよう構成される。

イントラ予測ユニット２５４（又は一般的にモード選択ユニット２６０）は、イントラ予測パラメータ（又は一般的にブロックについて選択されたイントラ予測モードを示す情報）を、エントロピー符号化ユニット２７０に、符号化ピクチャデータ２１に含めるためにシンタックス要素２６６の形式で出力するよう更に構成される。その結果、例えば、ビデオデコーダ３０は、復号のために予測パラメータを受信し及び使用してよい。

インター予測モードの（又は可能な）インター予測モードのセットは、利用可能な参照ピクチャ（つまり、例えばＤＢＰ２３０に格納された、前の少なくとも部分的に復号されたピクチャ）及び他のインター予測パラメータに、例えば、参照ピクチャの全体又は部分のみが、例えば参照ピクチャの現在ブロックの領域周辺の検索ウインドウ領域が最良の適合する参照ブロックを検索するために使用されるか、及び／又は、例えば、ピクセル補間、例えばハーフ／セミペル、４分の１ペル、及び／又は１６分の１ペル補間が適用されるか否かに依存する。

上述の予測モードに加えて、スキップモード、直接モード、及び／又は他のインター予測モードが適用されてよい。

例えば、拡張マージ予測、このようなモードのマージ候補リストは、以下の５個のタイプの候補、順に：空間近隣ＣＵからの空間ＭＶＰ、同一位置のＣＵからの時間ＭＶＰ、ＦＩＦＯテーブルからの履歴に基づくＭＶＰ、ペア毎の平均ＭＶＰ、及びゼロＭＶＰを含むことにより、構成される。そして、双方向一致に基づくデコーダ側動きベクトル精緻化（decoder side motion vector refinement (DMVR)）が、マージモードのＭＶの精度を向上するために適用されてよい。ＭＶＤを伴うマージモード（Merge mode with MVD (MMVD)）、これは、動きベクトル差を伴うマージモードに由来する。ＭＭＶＤフラグは、ＭＭＶＤモードがＣＵのために使用されるかどうかを指定するために、スキップフラグ及びマージフラグを送信した直後にシグナリングされる。そして、ＣＵレベル適応動きベクトル精度（adaptive motion vector resolution (AMVR)）方式が適用されてよい。ＡＭＶＲは、ＣＵのＭＶＤが異なる正確さで符号化されることを可能にする。現在ＣＵの予測モードに依存して、現在ＣＵのＭＶＤは適応的に選択できる。ＣＵがマージモードで符号化されるとき、結合インター／イントラ予測（combined inter/intra prediction (CIIP)）モードは現在ＣＵに適用されてよい。インター及びイントラ予測信号の加重平均が、ＣＩＩＰ予測を取得するために実行される。アフィン動き補償予測、ブロックのアフィン動きフィールドは、２個の制御点（４パラメータ）又は３個の制御点動きベクトル（６パラメータ）の動き情報により記述される。サブブロックに基づく時間動きベクトル予測（Subblock－based temporal motion vector prediction (SbTMVP)）、これは、ＨＥＶＣにおける時間動きベクトル予測（temporal motion vector prediction (TMVP)）と同様であるが、現在ＣＵの中のサブＣＵの動きベクトルを予測する。前にＢＩＯと呼ばれた双方向光フロー（Bi－directional optical flow (BDOF)）は、特に乗算の回数及び乗数のサイズの観点で、遙かに少ない計算しか必要としない、より簡易なバージョンである。三角形パーティションモード、このようなモードでは、ＣＵは、対角線分割又は非対角線分割のいずれかを用いて２個の三角形の形状のパーティションに均等に分割される。更に、双予測モードは、２個の予測信号の加重平均を可能にするために、単純な平均を超えて拡張される。

上述の予測モードに加えて、スキップモード及び／又は直接モードが適用されてよい。

予測処理ユニット２６０は、例えば４分木パーティション（quad－tree－partitioning (QT)）、２分木パーティション（binary partitioning (BT)）、３分木パーティション（ternary－tree－partitioning (TT)）、又はそれらの任意の組み合わせを繰り返し使用して、ブロック２０３を更に小さいブロックパーティション又はサブブロックにパーティションし、例えば各ブロックパーティション又はサブブロックに対して予測を実行するよう更に構成されてよい。ここで、モード選択は、パーティション済みブロック２０３の木構造及びブロックパーティション又はサブブロックの各々に適用される予測モードの選択を含む。

インター予測ユニット２４４は、動き推定（motion estimation (ME)）ユニット（図２に示されない）及び動き補償（motion compensation (MC)）ユニット（図２に示されない）を含んでよい。動き推定ユニットは、ピクチャブロック２０３（現在ピクチャ２０１の現在ブロック２０３）、及び復号ピクチャ２３１、又は前の再構成ブロックのうちの少なくとも１つ又は複数、例えば１又は複数の他の／異なる前の復号ピクチャ２３１のうちの再構成ブロックを、動き推定のために受信し又は取得するよう構成される。例えば、ビデオシーケンスは、現在ピクチャ及び前の復号ピクチャ２３１を含んでよい。又は、言い換えると、現在ピクチャ及び前の復号ピクチャ２３１は、ビデオシーケンスを形成するピクチャのシーケンスの一部であり又はそれを形成してよい。

エンコーダ２０は、例えば、複数の他のピクチャの同じ又は異なるピクチャの複数の参照ブロックから、参照ブロックを選択し、参照ピクチャ（又は参照ピクチャインデックス）及び／又は参照ブロックの位置（ｘ，ｙ座標）と現在ブロックの位置との間のオフセット（空間オフセット）を、インター予測パラメータとして動き推定ユニット（図２に示されない）に提供するよう構成されてよい。このオフセットは、動きベクトル（motion vector (MV)）とも呼ばれる。

動き補償ユニットは、インター予測パラメータを取得し、例えば受信し、インター予測パラメータに基づき又はそれを用いてインター予測を実行して、インター予測ブロック２６５を取得するよう構成される。動き補償ユニット（図２に示されない）により実行される動き補償は、動き推定により決定された動き／ブロックベクトルに基づき、予測ブロックをフェッチし又は生成し、場合によってはサブピクセル精度への補間を実行することを含んでよい。補間フィルタリングは、追加ピクセルサンプルを生成してよく、従ってピクチャブロックを符号化するために使用され得る候補予測ブロックの数を増大させる可能性がある。現在ピクチャブロックのＰＵの動きベクトルを受信すると、動き補償ユニットは、参照ピクチャリストのうちの１つの中で動きベクトルの指す予測ブロックの位置を特定してよい。動き補償ユニットは、ビデオスライスのピクチャブロックを復号する際にビデオデコーダ３０による使用のために、ブロック及びビデオスライスに関連するシンタックス要素も生成してよい。

イントラ予測ユニット２５４は、ピクチャブロック２０３（現在ピクチャブロック）及び同じピクチャの１又は複数の前の再構成ブロック、例えば再構成近隣ブロックを、イントラ推定のために、取得し、例えば受信するよう構成される。エンコーダ２０は、例えば、複数の（所定の）イントラ予測モードから、イントラ予測モードを選択するよう構成されてよい。

エンコーダ２０の実施形態は、最適化基準、例えば最小残差（例えば、現在ピクチャブロック２０３に最も類似する予測ブロック２５５を提供するイントラ予測モード）又は最小レート歪みに基づき、イントラ予測モードを選択するよう構成されてよい。

イントラ予測ユニット２５４は、イントラ予測パラメータ、例えば選択されたイントラ予測モードに基づき、イントラ予測ブロック２５５を決定するよう更に構成される。いずれの場合にも、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット２５４は、また、イントラ予測パラメータ、つまり、ブロックについて選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット２７０に提供するよう構成される。一例では、イントラ予測ユニット２５４は、後述するイントラ予測技術の任意の組み合わせを実行するよう構成されてよい。

エントロピー符号化ユニット２７０は、エントロピー符号化アルゴリズム又は方式（例えば、可変長符号化（variable length coding (VLC)）方式、コンテキスト適応型ＶＬＣ方式（context adaptive VLC (CALVC)）、算術符号化方式、コンテキスト適応型バイナリ算術符号化（context adaptive binary arithmetic coding (CABAC)）、シンタックスに基づくコンテキスト適応バイナリ算術符号化（syntax－based context－adaptive binary arithmetic coding (SBAC)）、確率区間区分エントロピー（probability interval partitioning entropy (PIPE)）符号化又は別のエントロピー符号化方法若しくは技術）を量子化済み残差係数２０９、インター予測パラメータ、イントラ予測パラメータ、及び／又はループフィルタパラメータに、個々に又は一緒に適用して（又は全く適用せず）、出力２７２により例えば符号化ビットストリーム２１の形式で出力され得る符号化ピクチャデータ２１を取得するよう構成される。符号化ビットストリーム２１は、ビデオデコーダ３０へと送信され、又はビデオデコーダ３０による後の送信又は読み出しのためにアーカイブされてよい。エントロピー符号化ユニット２７０は、符号化中の現在ビデオスライスの他のシンタックス要素をエントロピー符号化するよう更に構成され得る。

ビデオエンコーダ２０の他の構造的変形は、ビデオストリームを符号化するために使用され得る。例えば、非変換に基づくエンコーダ２０は、変換処理ユニット２０６を有しないで、特定のブロック又はフレームについて、残差信号を直接量子化できる。別の実装では、エンコーダ２０は、単一のユニットに結合された、量子化ユニット２０８及び逆量子化ユニット２１０を有し得る。

図３は、本願の技術を実施するよう構成される例示的なビデオデコーダ３０を示す。ビデオデコーダ３０は、復号ピクチャ１３１を取得するために、例えばエンコーダ１００により符号化ピクチャデータ（例えば、符号化ビットストリーム）２１を受信するよう構成される。復号処理の間、ビデオデコーダ３０は、ビデオデータ、例えば符号化ビデオスライスのピクチャブロック及び関連するシンタックス要素を表す符号化ビデオストリームを、ビデオエンコーダ１００から受信する。

図３の例では、デコーダ３０は、エントロピー復号ユニット３０４、逆量子化ユニット３１０、逆変換処理ユニット３１２、再構成ユニット３１４（例えば、加算器３１４）、バッファ３１６、ループフィルタ３２０、復号ピクチャバッファ３３０、及び予測処理ユニット３６０を含む。予測処理ユニット３６０は、インター予測ユニット３４４、イントラ予測ユニット３５４、及びモード選択ユニット３６２を含んでよい。ビデオデコーダ３０は、幾つかの例では、図２からビデオエンコーダ１００に関して説明した符号化経路に対して通常相互的な復号経路を実行してよい。

エンコーダ２０に関して説明したように、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構成ユニット２１４、ループフィルタ２２０、復号ピクチャバッファ（decoded picture buffer (DPB)）２３０、インター予測ユニット３４４、及びイントラ予測ユニット３５４は、ビデオエンコーダ２０の「内蔵デコーダ」を形成するとも表される。従って、逆量子化ユニット３１０は逆量子化ユニット１１０と機能的に同一であってよく、逆変換処理ユニット３１２は逆変換処理ユニット２１２と機能的に同一であってよく、再構成ユニット３１４は再構成ユニット２１４と機能的に同一であってよく、ループフィルタ３２０はループフィルタ２２０と機能的に同一であってよく、復号ピクチャバッファ３３０は復号ピクチャバッファ２３０と機能的に同一であってよい。従って、それぞれのユニット及びビデオ２０エンコーダの機能について提供された説明は、相応して、ビデオデコーダ３０のそれぞれのユニット及び機能に適用する。

エントロピー復号ユニット３０４は、エントロピー復号を、符号化ピクチャデータ２１に対して実行して、例えば量子化済み係数３０９、及び／又は復号された符号化パラメータ（図３に示されない）、例えばインター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、及び／又は他のシンタックス要素のうちの（復号された）いずれか又は全部を取得するよう構成される。エントロピー復号ユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、及び／又は他のシンタックス要素を、予測処理ユニット３６０に転送するよう更に構成される。ビデオデコーダ３０は、ビデオスライスレベル及び／又はビデオブロックレベルのシンタックス要素を受信してよい。

エントロピー復号ユニット３０４は、ビットストリーム２１（又は一般的に符号化ピクチャデータ２１）をパースし、例えば符号化ピクチャデータ２１にエントロピー復号を実行して、例えば量子化済み係数３０９及び／又は復号された符号化パラメータ（図３に示されない）、例えばインター予測パラメータ（例えば、参照ピクチャインデックス及び動きベクトル）、イントラ予測パラメータ（例えば、イントラ予測モード又はインデックス）、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、及び／又は他のシンタックス要素、のうちのいずれか又は全部を取得するよう構成される。エントロピー復号ユニット３０４は、エンコーダ２０のエントロピー符号化ユニット２７０に関して説明したような符号化方式に対応する復号アルゴリズム又は方式を適用するよう構成されてよい。エントロピー復号ユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、及び／又は他のシンタックス要素をモード適用ユニット３６０に、及び他のパラメータをデコーダ３０の他のユニットに提供するよう更に構成されてよい。ビデオデコーダ３０は、ビデオスライスレベル及び／又はビデオブロックレベルのシンタックス要素を受信してよい。スライス及びそれぞれのシンタックス要素に追加又は代替として、タイルグループ及び／又はタイル及びそれぞれのシンタックス要素が受信され及び／又は使用されてよい。

逆量子化ユニット３１０は逆量子化ユニット１１０と機能的に同一であってよく、逆変換処理ユニット３１２は逆変換処理ユニット１１２と機能的に同一であってよく、再構成ユニット３１４は再構成ユニット１１４と機能的に同一であってよく、バッファ３１６はバッファ１１６と機能的に同一であってよく、ループフィルタ３２０はループフィルタ１２０と機能的に同一であってよく、復号ピクチャバッファ３３０は復号ピクチャバッファ１３０と機能的に同一であってよい。

デコーダ３０の実施形態は、パーティションユニット（図３に示されない）を含んでよい。一例では、ビデオデコーダ３０の予測処理ユニット３６０は、上述のパーティション技術の任意の組み合わせを実行するよう構成されてよい。

予測処理ユニット３６０は、インター予測ユニット３４４及びイントラ予測ユニット３５４を含んでよい。ここで、インター予測ユニット３４４はインター予測ユニット１４４と機能的に似ていてよく、イントラ予測ユニット３５４はイントラ予測ユニット１５４と機能的に似ていてよい。予測処理ユニット３６０は、標準的に、ブロック予測を実行し、及び／又は予測ブロック３６５を符号化データ２１から取得し、及び予測関連パラメータ及び／又は選択された予測モードに関する情報を、例えばエントロピー復号ユニット３０４から（明示的に又は暗示的に）受信し又は取得するよう構成される。

ビデオスライスがイントラ符号化（intra coded (I)）スライスとして符号化されるとき、予測処理ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モード及び現在フレーム又はピクチャの前の復号ブロックからのデータに基づき、現在ビデオスライスのピクチャブロックについて予測ブロック３６５を生成するよう構成される。ビデオフレームがインター符号化（つまり、Ｂ又はＰ）スライスとして符号化されるとき、予測処理ユニット３６０のインター予測ユニット３４４（例えば動き補償ユニット）は、動きベクトル及びエントロピー復号ユニット３０４から受信した他のシンタックス要素に基づき、現在ビデオスライスのビデオブロックについて予測ブロック３６５を生成するよう構成される。インター予測では、予測ブロックは、参照ピクチャリストのうちの１つの中の参照ピクチャのうちの１つから生成されてよい。ビデオデコーダ３０は、ＤＰＢ３３０に格納された参照ピクチャに基づき、規定構成技術を用いて、参照フレームリスト：リスト０及びリスト１を構成してよい。

予測処理ユニット３６０は、動きベクトル及び他のシンタックス要素をパースすることにより、現在ビデオスライスのビデオブロックについて予測情報を決定し、予測情報を使用して、復号されている現在ビデオブロックについて予測ブロックを生成するよう構成される。例えば、予測処理ユニット３６０は、受信したシンタックス要素のうちの幾つかを使用して、ビデオスライスのビデオブロックを符号化するために使用される予測モード（例えば、イントラ又はインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスの参照ピクチャリストのうちの１つ以上の構成情報、スライスの各インター符号化ビデオブロックの動きベクトル、スライスの各インター符号化ビデオブロックのインター予測状態、及び現在ビデオスライス内のビデオブロックを復号するための他の情報を決定する。

逆量子化ユニット３１０は、ビットストリーム内で提供され、エントロピー復号ユニット３０４により復号された量子化済み変換係数を逆量子化、つまり量子化解除するよう構成される。逆量子化処理は、量子化の程度、及び同様に適用されるべき逆量子化の程度を決定するために、ビデオスライス内の各ビデオブロックに対する、ビデオエンコーダ１００により計算された量子化パラメータの使用を含んでよい。

逆量子化ユニット３１０は、量子化パラメータ（quantization parameter (QP)）（又は一般的に逆量子化に関する情報）及び量子化済み係数を、符号化ピクチャデータ２１から（例えばエントロピー復号ユニット３０４により例えばパース及び／又は復号することにより）受信し、及び量子化パラメータに基づき逆量子化を復号された量子化済み係数３０９に適用して、変換係数３１１とも呼ばれてよい逆量子化済み係数３１１を取得するよう構成されてもよい。

逆変換処理ユニット３１２は、ピクセルドメインにおいて残差ブロックを生成するために、逆変換、例えば、逆ＤＣＴ、逆整数変換、又は概念的に類似する逆変換処理を、変換係数に適用するよう構成される。

逆変換処理ユニット３１２は、変換係数３１１とも呼ばれる逆量子化済み係数３１１を受信し、サンプルドメインにおいて再構成残差ブロック２１３を取得するために逆量子化済み係数３１１に変換を適用するよう構成されてもよい。再構成残差ブロック２１３は、変換ブロック３１３とも呼ばれてよい。変換は、逆変換、例えば、逆ＤＣＴ、逆ＤＳＴ、逆整数変換、又は概念的に同様の逆変換処理であってよい。逆変換処理ユニット３１２は、変換パラメータ又は対応する情報を、符号化ピクチャデータ２１から（例えばエントロピー復号ユニット３０４により例えばパース及び／又は復号することにより）受信して、逆量子化済み係数３１１に適用されるべき変換を決定するよう更に構成されてよい。

再構成ユニット３１４（例えば、加算器３１４）は、逆変換ブロック３１３（つまり再構成残差ブロック３１３）を予測ブロック３６５に加算して、例えば再構成残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを加算することにより、サンプルドメインにおける再構成ブロック３１５を取得するよう構成される。

ループフィルタユニット３２０（符号化ループ内又は符号化ループの後にある）は、再構成ブロック３１５をフィルタリングして、フィルタリング済みブロック３２１を取得するよう、例えばピクセル遷移を円滑化するよう又はその他の場合にはビデオ品質を向上するよう構成される。一例では、ループフィルタユニット３２０は、後述するフィルタリング技術の任意の組み合わせを実行するよう構成されてよい。ループフィルタユニット３２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset (SAO)）フィルタ又は他のフィルタ、例えばバイラテラルフィルタ又は適応ループフィルタ（adaptive loop filter (ALF)）又は先鋭化若しくは円滑化フィルタ又は共同フィルタのような１つ以上のループフィルタを表すことを意図する。ループフィルタユニット３２０はインループフィルタであるとして図３に示されるが、他の構成では、ループフィルタユニット３２０は後置きループフィルタとして実装されてよい。

ループフィルタユニット３２０は、デブロッキングフィルタ、サンプル適応オフセット（sample－adaptive offset (SAO)）フィルタ又は１つ以上の他のフィルタ、例えば適応ループフィルタ（adaptive loop filter (ALF)）、ノイズ抑制フィルタ（noise suppression filter (NSF)）又はそれらの任意の組合せのような１つ以上のループフィルタも含んでもよい。例では、ループフィルタユニット２２０は、デブロッキングフィルタ、ＳＡＯフィルタ、及びＡＬＦフィルタを含んでよい。フィルタリング処理の順序は、デブロッキングフィルタ、ＳＡＯ、及びＡＬＦであってよい。別の例では、クロマスケーリングを伴うルママッピング（luma mapping with chroma scaling (LMCS)）と呼ばれる処理（つまり、適応型インループリシェーパ）が、追加される。この処理は、デブロッキングの前に実行される。別の例では、デブロッキングフィルタ処理は、内部サブブロックエッジ、例えばアフィンサブブロックエッジ、ＡＴＭＶＰサブブロックエッジ、サブブロック変換（sub－block transform (SBT)）エッジ、及びイントラサブパーティション（intra sub－partition (ISP)）エッジにも適用されてよい。

所与のフレーム又はピクチャ内の復号ビデオブロック３２１は、次に、後の動き補償のために使用される参照ピクチャを格納する復号ピクチャバッファ３３０に格納される。

ピクチャの復号ビデオブロック３２１は、次に、他のピクチャのための後の動き補償のための参照ピクチャとして及び／又はそれぞれディスプレイ出力のために復号ピクチャ３３１を格納する復号ピクチャバッファ３３０に格納される。

デコーダ３０は、ユーザへの提示又は閲覧のために、復号ピクチャ３３１を、例えば出力３３２を介して出力するよう構成される。

ビデオデコーダ３０の他の変形は、圧縮ビデオストリームを復号するために使用され得る。例えば、デコーダ３０は、ループフィルタユニット３２０を有しないで、出力ビデオストリームを生成できる。例えば、非変換に基づくデコーダ３０は、逆変換処理ユニット３１２を有しないで、特定のブロック又はフレームについて、残差信号を直接逆量子化できる。別の実装では、ビデオデコーダ３０は、単一のユニットに結合された、逆量子化ユニット３１０及び逆変換処理ユニット３１２を有し得る。

上述の実施形態に追加又は代替として、図１８による別の実施形態では、インター予測ユニット３４４は、インター予測ユニット２４４と（特に動き補償ユニットと）同一であってよく、イントラ予測ユニット３５４は、インター予測ユニット２５４と機能的に同一であってよく、パーティション及び／又は予測パラメータ又は符号化ピクチャデータ２１から（例えばエントロピー復号ユニット３０４により例えばパース及び／又は復号することにより）受信したそれぞれの情報に基づく、分割又はパーティション決定及び予測を実行する。モード適用ユニット３６０は、再構成ピクチャ、ブロック、又はそれぞれの（フィルタリング済み又はフィルタリングされていない）サンプルに基づき、ブロック毎に予測（イントラ又はインター予測）を実行して、予測ブロック３６５を取得するよう構成されてよい。

ビデオスライスがイントラ符号化（intra coded (I)）スライスとして符号化されるとき、モード適用ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モード及び現在ピクチャの前の復号ブロックからのデータに基づき、現在ビデオスライスのピクチャブロックについて予測ブロック３６５を生成するよう構成される。ビデオピクチャがインター符号化（つまり、Ｂ又はＰ）スライスとして符号化されるとき、モード適用ユニット３６０のインター予測ユニット３４４（例えば動き補償ユニット）は、動きベクトル及びエントロピー復号ユニット３０４から受信した他のシンタックス要素に基づき、現在ビデオスライスのビデオブロックについて予測ブロック３６５を生成するよう構成される。インター予測では、予測ブロックは、参照ピクチャリストのうちの１つの中の参照ピクチャのうちの１つから生成されてよい。ビデオデコーダ３０は、ＤＰＢ３３０に格納された参照ピクチャに基づき、規定構成技術を用いて、参照フレームリスト：リスト０及びリスト１を構成してよい。同じ又は同様のことが、スライス（例えば、ビデオスライス）に追加又は代替として、タイルグループ（例えば、ビデオタイルグループ）及び／又はタイル（例えば、ビデオタイル）を用いる実施形態に又はそれにより適用されてよい。例えば、ビデオは、Ｉ、Ｐ、又はＢタイルグループ及び／又タイルを用いて符号化されてよい。

モード適用ユニット３６０は、動きベクトル又は関連情報及び他のシンタックス要素をパースすることにより、現在ビデオスライスのビデオブロックについて予測情報を決定し、予測情報を使用して、復号されている現在ビデオブロックについて予測ブロックを生成するよう構成される。例えば、モード適用ユニット３６０は、受信したシンタックス要素のうちの幾つかを使用して、ビデオスライスのビデオブロックを符号化するために使用される予測モード（例えば、イントラ又はインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）、スライスの参照ピクチャリストのうちの１つ以上の構成情報、スライスの各インター符号化ビデオブロックの動きベクトル、スライスの各インター符号化ビデオブロックのインター予測状態、及び現在ビデオスライス内のビデオブロックを復号するための他の情報を決定する。同じ又は同様のことが、スライス（例えば、ビデオスライス）に追加又は代替として、タイルグループ（例えば、ビデオタイルグループ）及び／又はタイル（例えば、ビデオタイル）を用いる実施形態に又はそれにより適用されてよい。例えば、ビデオは、Ｉ、Ｐ、又はＢタイルグループ及び／又タイルを用いて符号化されてよい。

図３に示すようなビデオデコーダ３０の実施形態は、スライス（ビデオスライスとも呼ばれる）を用いてピクチャをパーティション及び／又は復号するよう構成されてよい。ここで、ピクチャは、（標準的に重なり合わない）１つ以上のスライスにパーティションされ又はそれを用いて復号されてよく、各スライスは、１つ以上のブロック（例えばＣＴＵ）又はブロックの１つ以上のグループ（例えば、タイル（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）又はブリック（ＶＶＣ））を含んでよい。

図３に示すようなビデオデコーダ３０の実施形態は、スライス／タイルグループ（ビデオタイルグループとも呼ばれる）及び／又はタイル（ビデオタイルとも呼ばれる）を用いてピクチャをパーティション及び／又は復号するよう構成されてよい。ここで、ピクチャは、（標準的に重なり合わない）１つ以上のスライス／タイルグループにパーティションされ又はそれを用いて復号されてよく、各スライス／タイルグループは、例えば１つ以上のブロック（例えばＣＴＵ）又は１つ以上のタイルを含んでよく、各タイルは、例えば長方形形状であってよく、１つ以上のブロック（例えばＣＴＵ）、例えば完全な又は部分的ブロックを含んでよい。

ビデオデコーダ３０の他の変形は、符号化ピクチャデータ２１を復号するために使用され得る。例えば、デコーダ３０は、ループフィルタユニット３２０を有しないで、出力ビデオストリームを生成できる。例えば、非変換に基づくデコーダ３０は、逆変換処理ユニット３１２を有しないで、特定のブロック又はフレームについて、残差信号を直接逆量子化できる。別の実装では、デコーダ３０は、単一のユニットに結合された、逆量子化ユニット３１０及び逆変換処理ユニット３１２を有し得る。

理解されるべきことに、エンコーダ２０及びデコーダ３０において、現在ステップの処理結果は、更に処理され、次に次のステップへ出力されてよい。例えば、補間フィルタリング、動きベクトル導出又はループフィルタリングの後に、クリップ又はシフトのような更なる動作が、補間フィルタリング、動きベクトル導出又はループフィルタリングの処理結果に対して実行されてよい。

図４は、本開示の実施形態によるビデオ符号化装置４００の概略図である。ビデオ符号化装置４００は、ここに説明したような開示の実施形態を実施するのに適する。実施形態では、ビデオ符号化装置４００は、図１Ａのビデオデコーダ３０のようなデコーダ、又は図１Ａのビデオエンコーダ２０のようなエンコーダであってよい。実施形態では、ビデオ符号化装置４００は、上述のような図１Ａのビデオデコーダ３０又は図１Ａのビデオエンコーダ２０の１つ以上のコンポーネントであってよい。

ビデオ符号化装置４００は、データを受信するためのイングレスポート４１０及び受信機ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、論理ユニット、又は中央処理ユニット（central processing unit (CPU)）４３０と、データを送信するための送信機ユニット（Ｔｘ）４４０及びイグレスポート４５０と、データを格納するためのメモリ４６０と、を含む。ビデオ符号化装置４００は、イングレスポート４１０、受信機ユニット４２０、送信機ユニット４４０、及びイグレスポート４５０に接続された、光若しくは電気信号のイグレス若しくはイングレスのための光－電気（optical－to－electrical (OE)）コンポーネント及び電気－光（electrical－to－optical (EO)）コンポーネントも含んでよい。

プロセッサ４３０は、ハードウェア及びソフトウェアにより実装される。プロセッサ４３０は、１つ以上のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、ＦＰＧＡ、ＡＳＩＣ、及びＤＳＰとして実装されてよい。プロセッサ４３０は、イングレスポート４１０、受信機ユニット４２０、送信機ユニット４４０、イグレスポート４５０、及びメモリ４６０と通信する。プロセッサ４３０は、符号化モジュール４７０を含む。符号化モジュール４７０は、上述の開示の実施形態を実装する。例えば、符号化モジュール４７０は、種々の符号化動作を実装し、処理し、準備し、又は提供する。符号化モジュール４７０の中に含まれるものは、従って、ビデオ符号化装置４００の機能に実質的な改良を提供し、ビデオ符号化装置４００の異なる状態への変換をもたらす。代替として、符号化モジュール４７０は、メモリ４６０に格納されプロセッサ４３０により実行される命令として実装される。

メモリ４６０は、１つ以上のディスク、テープドライブ、及び固体ドライブを含み、プログラムが実行のために選択されるとき該プログラムを格納するため及びプログラムの実行中に読み出される命令及びデータを格納するためのオーバフローデータ記憶装置として使用されてよい。メモリ４６０は、揮発性及び／又は不揮発性であってよく、読み出し専用メモリ（read－only memory (ROM)）、ランダムアクセスメモリ（random access memory (RAM)）、三値連想メモリ（ternary content－addressable memory (TCAM)）、及び／又は静的ランダムアクセスメモリ（static random－access memory (SRAM)）であってよい。

図５は、例示的な実施形態による図１からのソース装置３１０及び宛先装置３２０の一方又は両方として使用されてよい機器５００の簡略ブロック図である。機器５００は、上述の本願の技術を実装できる。機器５００は、複数のコンピューティング装置を含むコンピューティングシステムの形式、又は単一コンピューティング装置、例えば移動電話機、タブレットコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、デスクトップコンピュータ、等の形式であり得る。

機器５００内のプロセッサ５０２は、中央処理ユニットであり得る。代替として、プロセッサ５０２は、現在存在する又は今後開発される情報を操作し又は処理できる任意の他の種類の装置又は複数の装置であり得る。開示の実装は示されるように単一のプロセッサ、例えばプロセッサ５０２により実施できるが、速度及び効率における利益は、１つより多くのプロセッサを用いて達成できる。

機器５００内のメモリ５０４は、一実装では、読み出し専用メモリ（read only memory (ROM)）装置又はランダムアクセスメモリ（random access memory (RAM)）装置であり得る。任意の他の適切な種類の記憶装置が、メモリ５０４として使用できる。メモリ５０４は、バス５１２を用いてプロセッサ５０２によりアクセスされるコード及びデータ５０６を含み得る。メモリ５０４は、オペレーティングシステム５０８及びアプリケーションプログラム５１０を更に含み得る。アプリケーションプログラム５１０は、プロセッサ５０２がここに記載の方法を実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０は、ここに記載の方法を実行するビデオ符号化アプリケーションを更に含むアプリケーション１～Ｎを含むことができる。機器５００は、例えばモバイルコンピューティング装置と共に使用されるメモリカードであり得る２次記憶５１４の形式の追加メモリも含み得る。ビデオ通信セッションは有意な量の情報を含み得るので、それらは、全体又は部分的に２次記憶５１４に格納され、処理のために必要に応じてメモリ５０４にロードされ得る。機器５００は、ディスプレイ５１８のような１つ以上の出力装置も含み得る。ディスプレイ５１８は、一例では、タッチ入力を感知するよう動作するタッチ感応要素とディスプレイを結合するタッチ感応ディスプレイであってよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２と結合され得る。

機器５００は、ディスプレイ５１８のような１つ以上の出力装置も含み得る。ディスプレイ５１８は、一例では、タッチ入力を感知するよう動作するタッチ感応要素とディスプレイを結合するタッチ感応ディスプレイであってよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２と結合され得る。ユーザが機器５００をプログラミングし又はその他の場合に使用することを可能にする他の出力装置は、ディスプレイ５１８に加えて又はその代替として提供され得る。出力装置がディスプレイである又はそれを含むとき、ディスプレイは、液晶ディスプレイ（liquid crystal display (LCD)）、陰極線管（cathode－ray tube (CRT)）ディスプレイ、プラズマディスプレイ、又は有機ＬＥＤ（organic LED (OLED)）ディスプレイのような発光ダイオード（light emitting diode (LED)）ディスプレイを含む種々の方法で実装できる。

機器５００は、また、画像感知装置５２０、例えばカメラ、又は機器５００を操作しているユーザの画像のような画像を感知できる現存の若しくは今後開発される任意の他の画像感知装置５２０を含み又はそれと通信できる。画像感知装置５２０は、機器５００を操作するユーザに向けられるように位置決めされ得る。一例では、画像感知装置５２０の位置及び光軸は、視野がディスプレイ５１８のすぐ隣にある領域を含み及びそれからディスプレイ５１８が見えるよう構成され得る。

機器５００は、また、音声感知装置５２２、例えばマイクロフォン、又は機器５００の近くの音声を感知できる現存の若しくは今後開発される任意の他の音声感知装置を含み又はそれと通信できる。音声感知装置５２２は、機器５００を操作しているユーザに向けられるよう位置決めでき、ユーザが機器５００を操作している間にユーザにより生成される音声、例えば会話又は他の発言を受信するよう構成できる。

図５は機器５００のプロセッサ５０２及びメモリ５０４を単一のユニットに統合されているように示すが、他の構成が利用できる。プロセッサ５０２の動作は、ローカルエリア又は他のネットワークに渡り又は直接結合され得る複数の機械（各機械は１つ以上のプロセッサを有する）に渡り分散できる。メモリ５０４は、ネットワークに基づくメモリ又は機器５００の動作を実行する複数の機械の中のメモリのように、複数の機械に渡り分散できる。ここでは単一のバスとして示されるが機器５００のバス５１２は複数のバスで構成できる。更に、２次記憶５１４は、機器５００の他のコンポーネントに直接結合でき、又はネットワークを介してアクセスでき、メモリカードのような単一の統合ユニット又は複数のメモリカードのような複数のユニットを含むことができる。機器５００は、従って、様々な構成で実装できる。

次世代ビデオ符号化（Next Generation Video Coding (NGVC)）は、ＣＵ、ＰＵ、及びＴＵ概念の分離を除去し、ＣＵパーティション形状の更なる柔軟性をサポートする。ＣＵのサイズは、符号化ノードのサイズに対応し、正方形又は非正方形（例えば、長方形）の形状であってよい。

追加又は代替として、ＴＵ又はＰＵは、ＣＵを分割することによっても取得できる。

J. An et al., “Block partitioning structure for next generation video coding”, International Telecommunication Union, COM１６－C９６６, September ２０１５（以後、“VCEG proposal COM１６－C９６６”）では、ＨＥＶＣ以後の将来のビデオ符号化標準のために４分木２分木（quad－tree－binary－tree (QTBT)）パーティション技術が提案された。シミュレーションは、提案されたＱＴＢＴ構造が使用されるＨＥＶＣにおける４分木構造よりも効率的であることを示している。ＨＥＶＣでは、小さいブロックのインター予測は、動き補償のメモリアクセスを削減するよう制約され、インター予測は４×４ブロックについてサポートされない。ＪＥＭのＱＴＢＴでは、これらの制約は除去される。

ＱＴＢＴでは、ＣＵは正方形又は長方形形状のいずれかを有し得る。図６に示されるように、符号化木単位（coding tree unit (CTU)）は、先ず、４分木構造によりパーティションされる。４分木のリーフノードは、２分木構造により更にパーティションできる。２分木分割には、対称水平分割及び対称垂直分割の２つの分割タイプがある。各々の場合に、ノードは、水平又は垂直のいずれかに、ノードを中央で分割することにより分割される。２分木のリーフノードは符号化単位（coding unit, CU）と呼ばれ、任意の更なるパーティションを伴わず、予測及び変換処理のためにセグメント化が使用される。これは、ＣＵ、ＰＵ、及びＴＵが、ＱＴＢＴ符号化ブロック構造において同じブロックサイズを有することを意味する。ＣＵは、時には異なる色成分の符号化ブロック（coding block (CB)）で構成され、例えば４：２：０クロマ形式のＰ及びＢスライスの場合には、１個のＣＵが１個のルマＣＢと２個のクロマＣＢとを含み、時には単一の成分のＣＢで構成され、例えばＩスライスの場合には、１個のＣＵが１個のルマＣＢのみ又はたった２個のクロマＣＢを含む。

以下のパラメータは、ＱＴＢＴパーティション方式のために定義される。
－CTUサイズ：４分木のルートノードサイズ、ＨＥＶＣと同じ概念。
－MinQTSize：最小許容４分木リーフノードサイズ。
－MaxBTSize：最大許容２分木ルートノードサイズ。
－MaxBTDepth：最大許容２分木深さ。
－MinBTSize：最小許容２分木リーフノードサイズ。

ＱＴＢＴパーティション構造の一例では、４分木ノードがMinQTSizeと等しい又はそれより小さいサイズを有するとき、更なる４分木は考慮されない。それは、サイズがMaxBTSizeを超えるので、２分木により更に分割されない。その他の場合、リーフ４分木ノードは、２分木により更にパーティションされ得る。従って、４分木リーフノードは２分木のルートノードでもあり、それは０のような２分木深さを有する。２分木深さがMaxBTDepth（つまり４）に達すると、更なる分割は考慮されない。２分木ノードがMinBTSize（つまり４）に等しい幅を有するとき、更なる水平分割は考慮されない。同様に、２分木ノードがMinBTSizeに等しい高さを有するとき、更なる垂直分割は考慮されない。２分木のリーフノードは、任意の更なるパーティションを伴わず、予測及び変換処理により更に処理される。ＪＥＭでは、最大ＣＴＵサイズは２５６×２５６ルマサンプルである。２分木のリーフノード（ＣＵ）は、任意の更なるパーティションを伴わず、（例えば、予測処理及び変換処理を実行することにより）更に処理されてよい。

図６は、ＱＴＢＴパーティション技術を用いてパーティションされたブロック３０（例えば、ＣＴＢ）の例を示す。図６に示されるように、ＱＴＢＴパーティション技術を用いて、ブロックの各々は、各ブロックの中央を通じて対称的に分割される。図７は、図６のブロックパーティションに対応する木構造を示す。図７の実線は４分木分割を示し、破線は２分木分割を示す。一例では、２分木の各分割（つまり、非リーフ）ノードでは、実行される分割のタイプ（例えば、水平又は垂直）を示すために、シンタックス要素（例えば、フラグ）がシグナリングされる。ここで、０は水平分割を示し、１は垂直分割を示す。４分木分割では、４分木分割が常にブロックを水平及び垂直に等しいサイズを有する４個のサブブロックに分割するので、分割タイプを示す必要がない。

図７に示されるように、ノード５０で、ブロック３０は、図６に示される４個のブロック３１、３２、３３、及び３４に、ＱＴパーティションを用いて分割される。ブロック３４は、更に分割されず、従ってリーフノードである。ノード５２で、ブロック３１は、ＢＴパーティションを用いて２個のブロックに更に分割される。図７に示されるように、ノード５２は、垂直分割を示す１でマークされる。このように、ノード５２における分割は、ブロック３７と、ブロック３５及び３６の両方を含むブロックとを生じる。ブロック３５及び３６は、ノード５４における更なる垂直分割により生成される。ノード５６で、ブロック３２は、ＢＴパーティションを用いて２個のブロック３８及び３９に更に分割される。

ノード５８で、ブロック３３は、ＱＴパーティションを用いて４個の等しいサイズのブロックに分割される。ブロック４３及び４４は、このＱＴパーティションから生成され、更に分割されない。ノード６０で、左上ブロックは、先ず垂直２分木分割を用いて分割されて、ブロック４０及び右垂直ブロックを生じる。右垂直ブロックは、次に、水平２分木分割を用いて、ブロック４１及び４２に分割される。ノード５８において４分木分割から生成された右下ブロックは、ノード６２において水平２分木分割を用いてブロック４５及び４６に分割される。図７に示されるように、ノード６２は、水平分割を示す０でマークされる。

ＱＴＢＴに加えて、ＱＴＢＴに基づくＣＵ構造におけるＢＴを置き換えるためにマルチタイプ木（multi－type－tree (MTT)）と称されるブロックパーティション構造が提案される。これは、ＣＴＵのブロックを得るためにＣＴＵがＱＴパーティションにより先ず分割され得、次にブロックがＭＴＴパーティションにより２次的に分割され得ることを意味する。

ＭＴＴパーティション構造は、なお、再帰的木構造である。ＭＴＴでは、複数の異なるパーティション構造（例えば、２つ以上）が使用される。例えば、ＭＴＴ技術によると、２つ以上の異なるパーティション構造が、木構造の各深さにおいて該木構造のそれぞれの非リーフノードに対して使用されてよい。木構造の中のノードの深さは、該ノードから木構造のルートへのパスの長さ（例えば、分割の数）を表してよい。

ＭＴＴでは、ＢＴパーティション及び３分木（ternary－tree (TT)）パーティションの２つのパーティションタイプがある。パーティションタイプは、ＢＴパーティション及びＴＴパーティションから選択できる。ＴＴパーティション構造は、ＴＴパーティション構造がブロックを中央で分割しない点で、ＱＴ又はＢＴ構造と異なる。ブロックの中央領域は、同じサブブロックの中に一緒に残る。４個のブロックを生じるＱＴ、又は２個のブロックを生じる２分木と異なり、ＴＴパーティション構造による分割は３個のブロックを生じる。ＴＴパーティション構造による例示的なパーティションタイプは、対称パーティションタイプ（水平及び垂直の両方）、並びに非対称パーティションタイプ（水平及び垂直の両方）を含む。更に、ＴＴパーティション構造による対称パーティションタイプは、非一様／非同形又は一様／同形であってよい。ＴＴパーティション構造による非対称パーティションタイプは、非一様／非同形である。一例では、ＴＴパーティション構造は、以下のパーティションタイプ：水平一様／同形対称３分木、垂直一様／同形対称３分木、水平非一様／非同形対称３分木、垂直非一様／非同形対称３分木、水平非一様／非同形非対称３分木、又は垂直非一様／非同形非対称３分木パーティションタイプのうちの少なくとも１つを含んでよい。

一般的に、非一様／非同形対称３分木パーティションタイプは、ブロックの中央線に関して対称なパーティションタイプであるが、結果として生じる３個のブロックのうちの少なくとも１つは、他の２個と同じサイズではない。１つの好適な例は、端のブロックがブロックの４分の１のサイズであり、中央ブロックがブロックの２分の１のサイズである場合である。一様／同形対称３分木パーティションタイプは、ブロックの中央線に関して対称なパーティションタイプであるが、結果として生じるブロックは全部同じサイズである。このようなパーティションは、ブロック高さ又は幅が、垂直又は水平分割に依存して、３の倍数である場合に可能である。非一様／非同形非対称３分木パーティションタイプは、ブロックの中央線に関して対称ではないパーティションタイプであり、結果として生じるブロックのうちの少なくとも１つは、他の２個と同じサイズではない。

図８は、任意の例示的な水平３分木パーティションタイプを示す概念図である。図９は、任意の例示的な垂直３分木パーティションタイプを示す概念図である。図８及び図９の両方で、ｈは、ルマ又はクロマサンプルの中のブロックの高さを表し、ｗは、ルマ又はクロマサンプルの中のブロックの幅を表す。ブロックのそれぞれの中央線は、ブロックの境界を表さないことに留意する（つまり、３分木パーティションは、中央線でブロックを通じて分割しない）。むしろ、中央線は、特定のパーティションタイプが元のブロックの中央線に対して対称又は非対称であるかどうかを示すために使用される。中央線は、また、分割の方向に沿う。

図８に示されるように、ブロック７１は、水平一様／同形対称パーティションタイプによりパーティションされる。水平一様／同形対称パーティションタイプは、ブロック７１の中央線に対して対称の上及び下半分を生成する。水平一様／同形対称パーティションタイプは、それぞれｈ／３の高さ及びｗの幅を有する等しいサイズの３個のサブブロックを生成する。水平一様／同形対称パーティションタイプは、ブロック７１の高さが３により均等に分割可能であるとき、可能である。

ブロック７３は、水平非一様／非同形対称パーティションタイプによりパーティションされる。水平非一様／非同形対称パーティションタイプは、ブロック７３の中央線に対して対称の上及び下半分を生成する。水平非一様／非同形対称パーティションタイプは、等しいサイズの２個のブロック（例えば、ｈ／４の高さを有する上及び下ブロック）、及び異なるサイズの中央ブロック（例えば、ｈ／２の高さを有する中央ブロック）を生成する。一例では、水平非一様／非同形対称パーティションタイプに従い、中央ブロックの領域は上及び下ブロックの結合領域と等しい。幾つかの例では、水平非一様／非同形対称パーティションタイプは、２のべき乗（例えば、２、４、８、１６、３２、等）である高さを有するブロックでは優先されてよい。

ブロック７５は、水平非一様／非同形非対称パーティションタイプによりパーティションされる。水平非一様／非同形非対称パーティションタイプは、ブロック７５の中央線に対して対称な上及び下半分を生成しない（つまり、上及び下半分は非対称である）。図８の例では、水平非一様／非同形非対称パーティションタイプは、ｈ／４の高さを有する上ブロック、３ｈ／８の高さを有する中央ブロック、及び３ｈ／８の高さを有する下ブロックを生成する。勿論、他の非対称構成が使用されてよい。

図９に示されるように、ブロック８１は、垂直一様／同形対称パーティションタイプによりパーティションされる。垂直一様／同形対称パーティションタイプは、ブロック８１の中央線に対して対称の左及び右半分を生成する。垂直一様／同形対称パーティションタイプは、それぞれｗ／３の幅及びｈの幅を有する等しいサイズの３個のサブブロックを生成する。垂直一様／同形対称パーティションタイプは、ブロック８１の幅が３により均等に分割可能であるとき、可能である。

ブロック８３は、垂直非一様／非同形対称パーティションタイプによりパーティションされる。垂直非一様／非同形対称パーティションタイプは、ブロック８３の中央線に対して対称の左及び右半分を生成する。垂直非一様／非同形対称パーティションタイプは、８３の中央線に対して対称の左及び右半分を生成する。垂直非一様／非同形対称パーティションタイプは、等しいサイズの２個のブロック（例えば、ｗ／４の幅を有する左及右ブロック）、及び異なるサイズの中央ブロック（例えば、ｗ／２の幅を有する中央ブロック）を生成する。一例では、垂直非一様／非同形対称パーティションタイプに従い、中央ブロックの領域は左及び右ブロックの結合領域と等しい。幾つかの例では、垂直非一様／非同形対称パーティションタイプは、２のべき乗（例えば、２、４、８、１６、３２、等）である幅を有するブロックでは優先されてよい。

ブロック８５は、垂直非一様／非同形非対称パーティションタイプによりパーティションされる。垂直非一様／非同形非対称パーティションタイプは、ブロック８５の中央線に対して対称な左及び右半分を生成しない（つまり、左及び右半分は非対称である）。図９の例では、垂直非一様／非同形非対称パーティションタイプは、ｗ／４の幅を有する左ブロック、３ｗ／８の幅を有する中央ブロック、及び３ｗ／８の幅を有する右ブロックを生成する。勿論、他の非対称構成が使用されてよい。

ＱＴＢＴのパラメータに加えて、以下のパラメータが、ＭＩＴパーティション方式のために定義される。
－MaxBTSize：最大許容２分木ルートノードサイズ。
－MinBtSize：最小許容２分木ルートノードサイズ。
－MaxMttDepth：最大マルチタイプ木深さ。
－MaxMttDepthオフセット：最大マルチタイプ木深さオフセット。
－MaxTtSize：最大許容３分木ルートノードサイズ。
－MinTtSize：最小許容３分木ルートノードサイズ。
－MinCbSize：最小許容符号化ブロックサイズ。

本開示の実施形態は、本願の実施形態に従い、図２のビデオエンコーダ２０又は図３のビデオデコーダ３０のようなビデオエンコーダ又はビデオデコーダにより実装されてよい。パーティションユニットを含む、ビデオエンコーダ２０又はビデオデコーダ３０の１つ以上の構造要素は、本開示の実施形態の技術を実行するよう構成されてよい。

[JVET－K１００１－v４], JVET AHG report, J.－R.Ohm, G.J.Sulivan, http://phenix.int－evry.fr/jvet/では、MinQtSizeYのシンタックス要素（log２_min_qt_size_intra_slices_minus２及びlog２_min_qt_size_inter_slices_minus２）、及びMaxMttDepthのシンタックス要素（max_mtt_hierarchy_depth_inter_slices及びmax_mtt_hierarchy_depth_intra_slices）は、ＳＰＳの中でシグナリングされる。

ルマＣＴＢサイズとMaxBtSizeYとの間の差のシンタックス要素（log２_diff_ctu_max_bt_size）は、スライスヘッダの中でシグナリングされる。

CtbSizeY及び対応するシンタックス要素log２_ctu_size_minus２は、ルマサンプルの数の観点で、最大符号化ブロックサイズのサイズを示す。

MinCbSizeYは、ＣＴＵ（coding tree unit）の４分木分割から生じるリーフブロックの最小ルマサイズとして定義される。サイズは、ブロックの幅又は高さのいずれかをサンプルの数で示すことができる。それは、また、正方形ブロックの場合には、幅及び高さを一緒に示し得る。一例として、MinQtSizeYが１６に等しい場合、１６より小さい又は等しいサイズを有する符号化ブロックは、４分木分割方法を用いて子ブロックにパーティションできない。従来のMinQtSizeYでは、log２_min_qt_size_intra_slices_minus２及びlog２_min_qt_size_inter_slices_minus２は、最小４分木ブロックサイズを示すために使用される。サイズの指示は、間接指示であることもできることに留意し、log２_min_qt_size_intra_slices_minus２が、最小４分木ブロックのルマサンプルの数の２進対数（基数２）であり得ることを意味する。MaxMttDepthは、４分木リーフ又はＣＴＵのマルチタイプ木分割から生じる符号化単位の最大階層構造深さとして定義される。符号化木単位（又はＣＴＢ、Coding Tree Block）は、ピクチャフレームをパーティションするために使用される最大ブロックサイズを記述する。MaxMttDepthは、子ブロックを取得するために適用できる連続する２又は３分割の数の上限を記述する。例として、ＣＴＵサイズは１２８×１２８であり（幅が１２８に等しく、高さが１２８に等しい）、MaxMttDepthが１に等しいと仮定する。この場合、親ブロック（サイズが１２８×１２８）は、先ず、２分割を用いて２個の１２８×６４子ブロックに分割できる。しかしながら、許容２分割の最大数に達するので、子ブロックは、（１２８×３２又は６４×６４子ブロックのいずれかを生じる）任意の連続する２分割を適用できない。MaxMttDepthは、最大２分割深さ又は最大３分割深さ、或いは両方を、同時に制御できることに留意する。２及び３分割の両方を同時に制御する場合、１回の２分割、その後に続く１回の３分割は、２回の階層構造分割として数えることができる。従来のMaxMttDepthでは、max_mtt_hierarchy_depth_inter_slices及びmax_mtt_hierarchy_depth_intra_slicesは、マルチタイプ木から生じる符号化単位の最大階層構造深さを示すために使用される。

シンタックス要素の名称は、それらが従来技術において現れるように使用されることに留意する。しかしながら、名称は変更可能であり、従って、重要であると考えられるべきものはシンタックス要素の論理的意味であることが明確にされるべきである。

MaxBtSizeYは、サンプルの数の観点で、２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）として定義される。例として、MaxBtSizeYが６４に等しい場合、幅又は高さのいずれかにおいてサイズのより大きい符号化ブロックは、２分割を用いて分割できない。これは、サイズ１２８×１２８を有するブロックが２分割を用いて分割できないことを意味し、一方で、サイズ６４×６４を有するブロックは２分割を用いて分割できる。

MinBtSizeＹは、サンプルの数の観点で、２分割を用いて分割可能な符号化ブロックの最小ルマサイズ（幅又は高さ）として定義される。例として、MinBtSizeＹが１６に等しい場合、幅又は高さのいずれかにおいてサイズのより小さい又は等しい符号化ブロックは、２分割を用いて分割できない。これは、サイズ８×８を有するブロックが２分割を用いて分割できないことを意味し、一方で、サイズ３２×３２を有するブロックは２分割を用いて分割できる。

MinCbSizeYは、最小符号化ブロックサイズとして定義される。例として、MinCbSizeYは８に等しいことが可能である。これは、結果として生じる子ブロックが幅又は高さのいずれかでMinCbSizeYより小さいことが保証されるので、サイズ８×８を有する親ブロックが分割モードのうちのいずれかを用いて分割できないことを意味する。第２の例によると、MinCbSizeYが８に等しい場合、サイズ８×１６を有する親ブロックは、例えば４分木分割を用いてパーティションできない。何故なら、結果として生じる４個の子ブロックが４×８のサイズ（幅が４に等しく、高さが８に等しい）を有することになり得、結果として生じる子ブロックの幅の幅がMinCbSizeYより小さくなり得るからである。第２の例では、幅及び高さを独立して制限するために２個の異なるシンタックス要素が使用できるが、MinCbSizeYがブロックの幅及び高さの両方に適用すると仮定された。

MinTbSizeYは、サンプルの数の観点で、３分割を用いて分割可能な符号化ブロックの最小変換ブロックサイズとして定義される。例として、MinTbSizeYが１６に等しい場合、幅又は高さのいずれかにおいてサイズのより小さい又は等しい符号化ブロックは、３分割を用いて分割できない。これは、サイズ８×８を有するブロックが３分割を用いて分割できないことを意味し、一方で、サイズ３２×３２を有するブロックは３分割を用いて分割できる。

シーケンスパラメータセットＲＢＳＰ（Raw Byte Sequence Payload）シンタックス（[JVET－K１００１－v４]のSection ７.３.２.１）
［Ed.(BB)：予備的な基本SPS、更なる研究対象であり、更なる仕様開発中である。］

これらのシンタックステーブルでは、太字はビットストリームに含まれるシンタックス要素である。太字で示されない要素は、更なるシンタックス単位のための条件又はプレースホルダである。

スライスヘッダシンタックス（[JVET－K１００１－v４]のSection ７.３.３）
［Ed.(BB)：予備的な基本スライスヘッダ、更なる研究対象であり、更なる仕様開発中である。］

シンタックス要素のセマンティクス、つまり、ビットストリームに含まれるシンタックス要素がどのように解釈されるべきかも、標準で提供される。以下では、上述の要素のセマンティクスが提供される。

シーケンスパラメータセットＲＢＳＰセマンティクス（[JVET－K１００１－v４]のSection ７.４.３.１）
log２_ctu_size_minus２＋２は、各ＣＴＵのルマ符号化木ブロックサイズを指定する。

変数CtbLog２SizeY、 CtbSizeY、MinCbLog２SizeY、MinCbSizeY、MinTbLog２SizeY、MaxTbLog２SizeY、PicWidthInCtbsY、PicHeightInCtbsY、PicSizeInCtbsY、PicWidthInMinCbsY、PicHeightInMinCbsY、PicSizeInMinCbsY、PicSizeInSamplesY、PicWidthInSamplesC、及びPicHeightInSamplesCは、以下のように導出される。

log２_min_qt_size_intra_slices_minus２＋２は、２（Ｉ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズを指定する。log２_min_qt_size_intra_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。

［Ed.(BB)：４分木のリーフは、符号化単位又はネストマルチタイプ木のルートのいずれかであることができる。］

log２_min_qt_size_inter_slices_minus２＋２は、０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズを指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。

max_mtt_hierarchy_depth_inter_slicesは、０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さを指定する。max_mtt_hierarchy_depth_inter_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。

max_mtt_hierarchy_depth_intra_slicesは、２（Ｉ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さを指定する。max_mtt_hierarchy_depth_intra_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。

スライスヘッダセマンティクス（[JVET－K１００１－v４]のSection ７.４.４）

log２_diff_ctu_max_bt_sizeは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。

log２_diff_ctu_max_bt_sizeが存在しないとき、log２_diff_ctu_max_bt_sizeの値は２に等しいと推定される。

変数MinQtLog２SizeY、MaxBtLog２SizeY、MinBtLog２SizeY、MaxTtLog２SizeY、MinTtLog２SizeY、MaxBtSizeY、MinBtSizeY、MaxTtSizeY、MinTtSizeY、及びMaxMttDepthは、以下のように導出される。

［Ed.(BB)：現在、Ｉスライスの最大ＢＴサイズ（CtbLog２SizeY-２、例えば１２８×１２８ルマサンプルのＣＴＵサイズでは、３２×３２ルマサンプル及び対応するクロマサンプル）と同様に、最大ＴＴサイズは固定される（Ｉスライスでは３２×３２ルマサンプル及び対応するクロマサンプル、Ｐ／Ｂスライスでは６４×６４ルマサンプル及び対応するクロマサンプル）。］

本開示の実施形態１では：
実施形態１は、ＳＰＳ（sequence parameter sets）の中での、スライスタイプ毎に個別のパーティション制約関連高レベルシンタックス要素（例えば、MinQtSizeY、MaxMttDepht、MaxBtSizeY）のシグナリング、及び／又は、パーティション制約オーバーライド有効化（又は無効化）フラグのシグナリングに関する。

スライスヘッダの中で、パーティション制約オーバーライドフラグをシグナリングすることは、以下を意味する：
フラグが真である場合、
スライスヘッダの中のパーティション制約関連高レベルシンタックス要素をオーバーライドし、ここで、オーバーライドは、スライスヘッダの中の要素を再シグナリングすることを意味する。
その他の場合、
スライスタイプに基づき、ＳＰＳからシグナリングされた値により、パーティション制約関連高レベルシンタックス要素を推定する。

言い換えると、１つ以上のパーティション制約パラメータがスライスヘッダの中で又はＳＰＳのようなパラメータセットの中でシグナリングされるかどうかを示すために、パーティション制約オーバーライドフラグは、スライスヘッダの中でシグナリングされる。パラメータセットは、必ずしもＳＰＳである必要がないことに留意する。それは、ＰＰＳ、又は例えば１つより多くのスライスに、例えばビデオの１つ以上のピクチャに関連する任意の他の種類のパラメータセットであることも可能である。

代替として、
ＳＰＳでは、パーティション制約関連高レベルシンタックス要素（例えば、MinQtSizeY、MaxMttDepht、MaxBtSizeY）は、特徴又はインデックスに基づき個々に組になってシグナリングされ、パーティション制約オーバーライド有効化（又は無効化）フラグがシグナリングされる。

スライスヘッダの中で、パーティション制約オーバーライドフラグがシグナリングされ、及び：
フラグが真である場合、
スライスヘッダの中のパーティション制約関連高レベルシンタックス要素をオーバーライドし、ここで、オーバーライドは、スライスヘッダの中の要素を再シグナリングすることを意味する。
その他の場合、
シグナリングを個別化するために使用される特徴又はインデックスに基づき、ＳＰＳからシグナリングされた値により、パーティション制約関連高レベルシンタックス要素を推定する。

シグナリング及びオーバーライドの位置に関し、代替として、例えば：
パーティション制約関連高レベルシンタックス要素のシグナリングは、パラメータセットの中で実行でき、オーバーライド動作は、スライスヘッダの中で実行できる。

パーティション制約関連高レベルシンタックス要素のシグナリングは、パラメータセットの中で実行でき、オーバーライド動作は、タイルヘッダの中で実行できる。

パーティション制約関連高レベルシンタックス要素のシグナリングは、第１パラメータセットの中で実行でき、オーバーライド動作は、第２パラメータセットの中で実行できる。

パーティション制約関連高レベルシンタックス要素のシグナリングは、スライスヘッダの中で実行でき、オーバーライド動作は、タイルヘッダの中で実行できる。

一般的に、パーティション制約関連高レベルシンタックス要素のシグナリングが第１パラメータセットの中で実行され、オーバーライド動作が第２パラメータセットの中で実行されるとき、第１セットが第２パラメータセットより大きな画像／ビデオ領域に関連するという点で、効率的な符号化が達成され得る。

技術的利点（例えば、ＳＰＳ内のシグナリング、スライスヘッダ内のオーバーライド）：高レベルパーティション制約は、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフを制御する。本発明は、個々のスライスについてトレードオフを制御する柔軟性を保証する。

エンコーダ及び復号の両方は、同じ（対応する）動作を行う。

従来技術に基づく対応するシンタックス及びセマンティクス変更は、以下に示される：
変更されたシーケンスパラメータセットＲＢＳＰシンタックス（[JVET－K１００１－v４]のSection ７.３.２.１）
［Ed.(BB)：予備的な基本SPS、更なる研究対象であり、更なる仕様開発中である。］

変更されたスライスヘッダシンタックス（[JVET－K１００１－v４]のSection ７.３.３）
［Ed.(BB)：予備的な基本スライスヘッダ、更なる研究対象であり、更なる仕様開発中である。］

変更されたシーケンスパラメータセットＲＢＳＰセマンティクス（[JVET－K１００１－v４]のSection ７.４.３.１）

１に等しいpartition_constraint_override_enabled_flagは、ＳＰＳを参照するスライスについて、スライスヘッダの中のpartition_constraint_override_flagの存在を指定する。０に等しいpartition_constraint_override_enabled_flagは、ＳＰＳを参照するスライスについて、スライスヘッダの中のpartition_constraint_override_flagの不存在を指定する。

sps_log２_min_qt_size_intra_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズがＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズを指定する。log２_min_qt_size_intra_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。

sps_log２_min_qt_size_inter_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズがＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズを指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。

sps_max_mtt_hierarchy_depth_inter_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さが、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さを指定する。max_mtt_hierarchy_depth_inter_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。

sps_max_mtt_hierarchy_depth_intra_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さが、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さを指定する。max_mtt_hierarchy_depth_intra_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。

sps_log２_diff_ctu_max_bt_size_intra_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。

sps_log２_diff_ctu_max_bt_size_inter_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。

変更されたスライスヘッダセマンティクス（[JVET－K１００１－v４]のSection ７.４.４）
１に等しいpartition_constraint_override_flagは、パーティション制約パラメータがスライスヘッダの中に存在することを指定する。０に等しいpartition_constraint_override_flagは、パーティション制約パラメータがスライスヘッダの中に存在しないことを指定する。存在しないとき、partition_cosntraints_override_flagの値は０に等しいと推定される。

log２_min_qt_size_minus２＋２は、現在スライスについて、ＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズを指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、log２_min_qt_size_minus２の値は、slice_typeが２（Ｉ）に等しい場合にsps_log２_min_qt_size_intra_slices_minus２に等しいと推定され、slice_typeが０（Ｂ）又は１（Ｐ）に等しい場合にsps_log２_min_qt_size_inter_slices_minus２に等しいと推定される。

max_mtt_hierarchy_depthは、現在スライスについて、４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さを指定する。max_mtt_hierarchy_depth_intra_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、max_mtt_hierarchy_depthの値は、２（Ｉ）に等しいslice_typeによりsps_max_mtt_hierarchy_depth_intra_slicesに等しいと推定され、０（Ｂ）又は１（Ｐ）に等しいslice_typeによりsps_max_mtt_hierarchy_depth_inter_slicesに等しいと推定される。

log２_diff_ctu_max_bt_sizeは、現在スライスについて、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、log２_diff_ctu_max_bt_sizeの値は、２（Ｉ）に等しいslice_typeによりsps_log２_diff_ctu_max_bt_size_intra_slicesに等しいと推定され、０（Ｂ）又は１（Ｐ）に等しいslice_typeによりsps_log２_diff_ctu_max_bt_size_inter_slicesに等しいと推定される。

本開示の実施形態１の代替実装では、以下に記載される：
シーケンスパラメータセット（ＳＰＳ）は、符号化ビデオシーケンス全体に適用し、符号化ビデオシーケンス（略してＣＶＳ）内のピクチャ毎に変化しないパラメータを含む。同じＣＶＳ内の全部のピクチャは同じＳＰＳを使用する。

ＰＰＳは、同じ符号化ビデオシーケンス内の異なるピクチャについて変化してよいパラメータを含む。しかしながら、異なるスライス符号化タイプ（Ｉ、Ｐ、及びＢ）を有するものでも、複数のピクチャが同じＰＰＳを参照してよい。

本開示の実施形態１で言及したように、高レベルパーティション制約は、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフを制御する。個々のピクチャ／スライスにおいて複雑さと符号化効率との間の柔軟な制御の利点に対処するために、実施形態１における方法（パーティション制約シンタックス要素をＳＰＳ内でシグナリングし、スライスヘッダの中でシグナリングされるパーティション制約オーバーライドフラグに基づきスライスヘッダ内のパーティション制約シンタックス要素をオーバーライドする）の代わりに、パーティション制約シンタックス要素（MinQtSizeY、MaxMttDepth、MaxBtSizeY、MaxTtSizeY、等）は、パーティションの複雑さとピクチャレベルのパーティションからの符号化効率とのトレードオフを調整するために、ＰＰＳの中でシグナリングされる。各ピクチャが個々のＰＰＳを使用する場合、調整は、個々のピクチャに適用される。複数のピクチャが同じＰＰＳを参照する場合、同じ調整がピクチャに対して適用される。

パーティション制約シンタックス要素のＰＰＳレベルシグナリングは、１つのグループの中でシグナリングできる。例えば、ＰＰＳの中で、MinQtSizeYのための１つの指示子、MaxMttDepthのための１つの指示子、MaxBtSizeYのための１つの指示子、及びMaxTtSizeYのための１つの指示子が、シグナリングされる。この場合、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフの調整可能性は異なるピクチャ毎に個別である。

パーティション制約シンタックス要素のＰＰＳレベルのシグナリングは、スライスタイプに基づき２個のグループの中でシグナリングすることもできる。例えば、ＰＰＳの中で、MinQtSizeYのための１つのイントラスライス指示子、MinQtSizeYのための１つのインタースライス指示子、MaxMttDepthのための１つのイントラスライス指示子、MaxMttDepthのための１つのインター指示子、MaxBtSizeYのための１つのイントラスライス指示子、MaxBtSizeYのための１つのインタースライス指示子、MaxTtSizeYのための１つのイントラスライス指示子、及びMaxTtSizeYのための１つのインタースライス指示子が、シグナリングされる。この場合、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフの調整可能性はスライスのタイプ（イントラ又はインター）毎に個別である。

パーティション制約シンタックス要素のＰＰＳレベルのシグナリングは、スライスの識別（例えば、インデックス）に基づき複数のグループの中でシグナリングできる。例えば、１つのピクチャが３個のスライスに分割される場合、ＰＰＳの中で、MinQtSizeYのスライス識別に基づく３個の異なる指示子、MaxMttDepthのスライス識別に基づく３個の異なる指示子、及びMaxBtSizeYのスライス識別に基づく３個の異なる指示子、及びMaxTtSizeYのスライス識別に基づく３個の異なる指示子が、シグナリングされる。この場合、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフの調整可能性はスライス毎に個別である。

実施形態１における方法と比較して、この代替実装の利点は、指示構造が簡略化されることである。この方法では、パーティションの複雑さとパーティションからの符号化ゲインとの間のトレードオフを柔軟に調整するために、スライスヘッダの中のパーティション制約シンタックス要素のオーバーライドは必要ない。

他方で、実施形態１における方法と比較して、この代替実装は、幾つかのシナリオにおいて限定される。この方法は、ＰＰＳの中でパーティション制約をシグナリングするだけである。それは、複数のピクチャが同じＰＰＳを参照する場合、パーティションの複雑さとパーティションからの符号化ゲインとの間のトレードオフをピクチャ毎に個別に調整できないことを意味する。更に、調整が主要ピクチャについてのみ必要である場合、この方法は、ＰＰＳの中で冗長な情報をシグナリングするだろう。

複数のパーティション制約シンタックス要素が、（ＰＰＳ、ＶＰＳ、ＳＰＳのような）パラメータセットレベル又は（ピクチャヘッダ、スライスヘッダ、又はタイルヘッダのような）ヘッダにおいてシグナリングされる。

本開示の実施形態２では：
実施形態は以下を意味する：
・パーティション高レベルシンタックス制約要素は、ＳＰＳの中でシグナリングできる。
・パーティション高レベルシンタックス制約要素は、スライスヘッダの中でオーバーライドできる。
・パーティション高レベルシンタックス制約要素は、規定値を使用できる。
・ＢＴ及びＴＴはＳＰＳの中で無効化できる。
・ＢＴ及びＴＴはスライスヘッダの中で無効化できる。
・ＢＴ及びＴＴ有効化（無効化）フラグは、ＳＰＳの中でシグナリングされ、スライスヘッダの中でオーバーライドできる。

技術的利点（例えば、ＳＰＳ内のシグナリング、スライスヘッダ内のオーバーライド）：高レベルパーティション制約は、パーティションの複雑さとパーティションからの符号化効率との間のトレードオフを制御する。本発明は、個々のスライスについてトレードオフを制御する柔軟性を保証する。規定値及びＢｔＴｔ有効化（無効化機能）について、要素を制御する更に多くの柔軟性がある。

従来技術に基づく対応する変更は、以下に示される：

変更されたシーケンスパラメータセットＲＢＳＰシンタックス（[JVET－K１００１－v４]のSection ７.３.２.１）
［Ed.(BB)：予備的な基本SPS、更なる研究対象であり、更なる仕様開発中である。］

１に等しいpartition_constraint_control_present_flagは、ＳＰＳの中のパーティション制約制御シンタックス要素の存在を指定する。０に等しいpartition_constraint_control_present_flagは、ＳＰＳの中のパーティション制約制御シンタックス要素の不存在を指定する。

１に等しいsps_btt_enabled_flagは、マルチタイプ木パーティションの動作が、slice_btt_enable_flagの存在しないＳＰＳを参照するスライスに適用されることを指定する。０に等しいsps_btt_enabled_flagは、マルチタイプ木パーティションの動作が、slice_btt_enable_flagの存在しないＳＰＳを参照するスライスに適用されないことを指定する。存在しないとき、sps_btt_enabled_flagの値は１に等しいと推定される。

１に等しいpartition_constraint_override_enabled_flagは、ＳＰＳを参照するスライスについて、スライスヘッダの中のpartition_constraint_override_flagの存在を指定する。０に等しいpartition_constraint_override_enabled_flagは、ＳＰＳを参照するスライスについて、スライスヘッダの中のpartition_constraint_override_flagの不存在を指定する。存在しないとき、partition_constraint_override_enabled_flagの値は０に等しいと推定される。

sps_log２_min_qt_size_intra_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズの初期値がＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックのＳＰＳの中の最小ルマサイズの初期値を指定する。log２_min_qt_size_intra_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、sps_log２_min_qt_size_intra_slices_minus２の値は０に等しいと推定される。

sps_log２_min_qt_size_inter_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズの初期値がＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックのＳＰＳの中の最小ルマサイズの初期値を指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、sps_log２_min_qt_size_inter_slices_minus２の値は０に等しいと推定される。

sps_max_mtt_hierarchy_depth_inter_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さの初期値が、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位のＳＰＳの中の最大階層構造深さの初期値を指定する。max_mtt_hierarchy_depth_inter_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_btt_enabled_flagが１に等しい場合、
sps_max_mtt_hierarchy_depth_inter_slicesの値は３に等しいと推定される。
その他の場合、
sps_max_mtt_hierarchy_depth_inter_slicesの値は０に等しいと推定される。

sps_max_mtt_hierarchy_depth_intra_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さの初期値が、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位のＳＰＳの中の最大階層構造深さの初期値を指定する。max_mtt_hierarchy_depth_intra_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_btt_enabled_flagが１に等しい場合、
sps_max_mtt_hierarchy_depth_intra_slicesの値は３に等しいと推定される。
その他の場合、
sps_max_mtt_hierarchy_depth_intra_slicesの値は０に等しいと推定される。

sps_log２_diff_ctu_max_bt_size_intra_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックのＳＰＳの中の最大ルマサイズ（幅又は高さ）との間の差の初期値が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックのＳＰＳの中の最大ルマサイズ（幅又は高さ）との間の差の初期値を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_btt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_bt_size_intra_slicesの値は２に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_bt_size_intra_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

sps_log２_diff_ctu_max_bt_size_inter_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックのＳＰＳの中の最大ルマサイズ（幅又は高さ）との間の差の初期値が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックのＳＰＳの中の最大ルマサイズ（幅又は高さ）との間の差の初期値を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_btt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_bt_size_inter_slicesの値は０に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_bt_size_inter_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

変更されたスライスヘッダセマンティクス（[JVET－K１００１－v４]のSection ７.４.４）
１に等しいpartition_constraint_override_flagは、パーティション制約パラメータがスライスヘッダの中に存在することを指定する。０に等しいpartition_constraint_override_flagは、パーティション制約パラメータがスライスヘッダの中に存在しないことを指定する。存在しないとき、partition_constraints_override_flagの値は０に等しいと推定される。

１に等しいslice_btt_enabled_flagは、マルチタイプ木パーティションの動作が、現在スライスに適用されることを指定する。０に等しいslice_btt_enabled_flagは、マルチタイプ木パーティションの動作が、現在スライスに適用されないことを指定する。slice_btt_enabled_flagが存在しないとき、それはsps_btt_enabled_flagに等しいと推定される。

log２_min_qt_size_minus２＋２は、現在スライスについて、ＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズを指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、log２_min_qt_size_minus２の値は、２（Ｉ）に等しいslice_typeによりsps_log２_min_qt_size_intra_slices_minus２に等しいと推定され、０（Ｂ）又は１（Ｐ）に等しいslice_typeによりsps_log２_min_qt_size_inter_slices_minus２に等しいと推定される。

本開示の実施形態３では：
MaxTTSizeY（３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ））がＳＰＳ（又は他のパラメータセット又はスライスヘッダ）の中でシグナリングされる場合、実施形態１又は実施形態２は、上述のパーティションパラメータについてのものと同じ方法で適用され得る。

技術的利点：MaxTtSizeYシンタックス要素の指示子をシグナリングする本発明は、要素の制御に更なる柔軟性があることを保証する。

シンタックス変更は、実施形態１又は実施形態２に基づく。

変更されたシーケンスパラメータセットＲＢＳＰシンタックス（[JVET－K１００１－v４]のSection ７.３.２.１）

本開示の実施形態４では：
実施形態２のbtt_enabled_flagをbt_enalbed_flag及びtt_eabled_flagとして分けて、ｂｔ及びｔｔ分割を別個に有効化又は無効化する。

技術的利点：ＢＴ有効化フラグ及びＴＴ有効化フラグを別個にシグナリングすることは、パーティション制約シンタックス要素を制御する更なる柔軟性を提供する。

シンタックス及びセマンティクスは実施形態２に基づき変化する。

シーケンスパラメータセットＲＢＳＰセマンティクス（[JVET－K１００１－v４]のSection ７.４.３.１）
１に等しいpartition_constraint_control_present_flagは、ＳＰＳの中のパーティション制約制御シンタックス要素の存在を指定する。０に等しいpartition_constraint_control_present_flagは、ＳＰＳの中のパーティション制約制御シンタックス要素の不存在を指定する。

１に等しいsps_bt_enabled_flagは、２分木パーティションの動作が、slice_bt_enable_flagの存在しないＳＰＳを参照するスライスに適用されることを指定する。０に等しいsps_bt_enabled_flagは、２分木パーティションの動作が、slice_bt_enable_flagの存在しないＳＰＳを参照するスライスに適用されないことを指定する。存在しないとき、sps_bt_enabled_flagの値は１に等しいと推定される。

１に等しいsps_tt_enabled_flagは、３分木パーティションの動作が、slice_tt_enable_flagの存在しないＳＰＳを参照するスライスに適用されることを指定する。０に等しいsps_tt_enabled_flagは、３分木パーティションの動作が、slice_tt_enable_flagの存在しないＳＰＳを参照するスライスに適用されないことを指定する。存在しないとき、sps_tt_enabled_flagの値は１に等しいと推定される。

sps_log２_min_qt_size_intra_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズがＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズを指定する。log２_min_qt_size_intra_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、sps_log２_min_qt_size_intra_slices_minus２の値は０に等しいと推定される。

sps_log２_min_qt_size_inter_slices_minus２＋２は、ＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズがＳＰＳを参照するスライスのスライスヘッダの中に存在するＣＴＵの４分木分割から生じるリーフブロックの最小ルマサイズによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中のＣＴＵの４分木分割から生じるリーフブロックの規定最小ルマサイズを指定する。log２_min_qt_size_inter_slices_minus２の値は、０～CtbLog２SizeY-２の両端を含む範囲に包含されるべきである。存在しないとき、sps_log２_min_qt_size_inter_slices_minus２の値は０に等しいと推定される。

sps_max_mtt_hierarchy_depth_inter_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さが、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さを指定する。max_mtt_hierarchy_depth_inter_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_bt_enabled_flagが１に等しい、又はsps_tt_enabled_flagが１に等しい場合、
sps_max_mtt_hierarchy_depth_inter_slicesの値は３に等しいと推定される。
その他の場合、
sps_max_mtt_hierarchy_depth_inter_slicesの値は０に等しいと推定される。

sps_max_mtt_hierarchy_depth_intra_slicesは、４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さが、ＳＰＳを参照するスライスのスライスヘッダの中に存在する４分木リーフのマルチタイプ木分割から生じる符号化単位の最大階層構造深さによりオーバーライドされない限り、ＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の４分木リーフのマルチタイプ木分割から生じる符号化単位の規定最大階層構造深さを指定する。max_mtt_hierarchy_depth_intra_slicesの値は、０～CtbLog２SizeY-MinTbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_btt_enabled_flagが１に等しい、sps_tt_enabled_flagが１に等しい場合、
sps_max_mtt_hierarchy_depth_intra_slicesの値は３に等しいと推定される。
その他の場合、
sps_max_mtt_hierarchy_depth_intra_slicesの値は０に等しいと推定される。

sps_log２_diff_ctu_max_bt_size_intra_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_bt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_bt_size_intra_slicesの値は２に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_bt_size_intra_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

sps_log２_diff_ctu_max_bt_size_inter_slicesは、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。log２_diff_ctu_max_bt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_bt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_bt_size_inter_slicesの値は０に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_bt_size_inter_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

sps_log２_diff_ctu_max_tt_size_intra_slicesは、ルマＣＴＢサイズと３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する２（Ｉ）に等しいslice_typeを有するスライスの中の３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。sps_log２_diff_ctu_max_tt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_tt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_tt_size_intra_slicesの値は２に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_tt_size_intra_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

sps_log２_diff_ctu_max_tt_size_inter_slicesは、ルマＣＴＢサイズと３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差が、ルマＣＴＢサイズとＳＰＳを参照するスライスのスライスヘッダの中に存在する３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差によりオーバーライドされない限り、ルマＣＴＢサイズとＳＰＳを参照する０（Ｂ）又は１（Ｐ）に等しいslice_typeを有するスライスの中の３分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の規定差を指定する。log２_diff_ctu_max_tt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、
sps_tt_enabled_flagが１に等しい場合、
sps_log２_diff_ctu_max_tt_size_inter_slicesの値は１に等しいと推定される。
その他の場合、
sps_log２_diff_ctu_max_tt_size_inter_slicesの値はCtbLog２SizeY-MinCbLog２SizeYに等しいと推定される。

１に等しいslice_btt_enabled_flagは、マルチタイプ木パーティションの動作が、現在スライスに適用されないことを指定する。０に等しいslice_btt_enabled_flagは、マルチタイプ木パーティションの動作が、現在スライスに適用されることを指定する。slice_btt_enabled_flagが存在しないとき、それはsps_btt_enabled_flagに等しいと推定される。

log２_diff_ctu_max_tt_sizeは、現在スライスについて、ルマＣＴＢサイズと２分割を用いて分割可能な符号化ブロックの最大ルマサイズ（幅又は高さ）との間の差を指定する。log２_diff_ctu_max_tt_sizeの値は、０～CtbLog２SizeY-MinCbLog２SizeYの両端を含む範囲に包含されるべきである。存在しないとき、log２_diff_ctu_max_tt_sizeの値は、２（Ｉ）に等しいslice_typeによりsps_log２_diff_ctu_max_tt_size_intra_slicesに等しいと推定され、０（Ｂ）又は１（Ｐ）に等しいslice_typeによりsps_log２_diff_ctu_max_tt_size_inter_slicesに等しいと推定される。

図１０は、復号装置により実施されるビデオビットストリームの復号の対応する方法を示し、ビデオビットストリームは、画像領域を表すデータと画像領域の画像領域ヘッダとを含む。復号方法は、ビデオビットストリームからオーバーライドフラグ（partition_constraint_override_flag）を取得するステップＳ１１０と、オーバーライドフラグの値がオーバーライド値（例えば、１）であるとき、画像領域ヘッダから画像領域の第１パーティション制約情報を取得するステップＳ１２０と、第１パーティション制約情報に従い、画像領域のブロックをパーティションするステップＳ１３０と、を含む。フラグが設定されない場合、パーティション制約情報は、画像領域ヘッダと異なるソースから取得されてよい。画像領域はスライス又はタイルであってよい。

図１１は、図１０のフローチャートを組み込むフローチャートを示す。更に、フローチャートに示される方法は、ビデオビットストリームからオーバーライド有効化フラグ（partition_constraint_override_enabled_flag）を取得するステップＳ２１０と、オーバーライド有効化フラグの値が有効化値（例えば、１）であるとき、ビデオビットストリームからオーバーライドフラグを取得するステップＳ１１０と、を含む。更に、オーバーライドフラグの値がオーバーライド値ではないとき（例えば、オーバーライドフラグの値が０である）、画像領域のブロックをパーティションするステップＳ２３０は、パラメータセットからのビデオビットストリームについての第２パーティション制約情報に従い実行されてよい。更に、オーバーライド有効化フラグの値が無効化値であるとき（例えば、オーバーライド有効化フラグの値が０である）、画像領域のブロックをパーティションするステップＳ２３０は、パラメータセットからのビデオビットストリームについての第２パーティション制約情報に従い実行されてよい。

本発明の実施形態における特定の特徴については、上述の関連する復号方法の実施形態を参照する。詳細はここで再び記載されない。

図１２は、ビデオビットストリームを復号するデコーダ１２００を示す。ビデオビットストリームは、画像領域を表すデータと、画像領域の画像領域ヘッダとを含む。デコーダは、ビデオビットストリームからオーバーライドフラグを取得するオーバーライド決定ユニット１２１０と、オーバーライドフラグの値がオーバーライド値であるとき、画像領域ヘッダから画像領域の第１パーティション制約情報を取得するパーティション制約決定ユニット１２２０と、第１パーティション制約情報に従い、画像領域のブロックをパーティションするブロックパーティションユニット１２３０と、を含む。

本発明の実施形態におけるデコーダ１２００の中のユニットの特定の機能については、本発明の復号方法の実施形態の関連する説明を参照する。詳細はここで再び記載されない。

デコーダ１２００の中のユニットは、ソフトウェア又は回路により実装されてよい。

デコーダ１２００は、デコーダ３０、ビデオ符号化装置４００、若しくは機器５００、又はデコーダ３０、ビデオ符号化装置４００、若しくは機器５００の部分であってよい。

エンコーダ１３００は、エンコーダ２０、ビデオ符号化装置４００、若しくは機器５００、又はエンコーダ２０、ビデオ符号化装置４００、若しくは機器５００の部分であってよい。

図１３は、ビデオビットストリームを符号化するエンコーダ１３００を示し、ビデオビットストリームは、画像領域を表すデータと画像領域の画像領域ヘッダとを含む。エンコーダは、画像領域のブロックのパーティションが画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定するパーティション決定ユニット１３１０と、ブロックのパーティションが第１パーティション制約情報に従うと決定すると、第１パーティション制約情報に従い画像領域のブロックをパーティションするブロックパーティションユニット１３２０と、オーバーライドフラグの値をオーバーライド値に設定するオーバーライドフラグ設定ユニット１３３０と、オーバーライドフラグをビデオビットストリームに挿入するビットストリーム生成器１３４０と、を含む。

本発明の実施形態におけるエンコーダ１３００の中のユニットの特定の機能については、本発明の符号化方法の実施形態の関連する説明を参照する。詳細はここで再び記載されない。

エンコーダ１３００の中のユニットは、ソフトウェア又は回路により実装されてよい。

図１４Ａは、符号化装置により実施されるビデオビットストリームの符号化の方法のフロー図を示し、ビデオビットストリームは、画像領域を表すデータと画像領域の画像領域ヘッダとを含む。符号化方法は、画像領域のブロックのパーティションが画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定するステップＳ３１０と、ブロックのパーティションが第１パーティション制約情報に従うと決定すると（ステップＳ３１０で「はい」）、第１パーティション制約情報に従い画像領域のブロックをパーティションするステップＳ３２０と、オーバーライドフラグの値をオーバーライド値に設定するステップＳ３２５と、オーバーライドフラグのデータをビデオビットストリームに含めるステップＳ３３０と、を含む。

幾つかの例示的な実施形態では、ブロックをパーティションすることが第１パーティション制約情報に従わないと決定すると（ステップＳ３１０で「いいえ」）、第２パーティション制約情報に従い画像領域のブロックをパーティションしＳ３６０、オーバーライドフラグの値をオーバーライド値に設定するＳ３６５。

図１４Ｂは、第１パーティション制約情報に従いブロックをパーティションすることが有効化されるかどうかを決定するステップＳ３７０を含む符号化方法を示す。第１パーティション制約情報に従いブロックをパーティションすることが有効化される（べきであると決定される）と決定すると、方法は、オーバーライド有効化フラグの値を有効化値に設定するステップＳ３４０と、オーバーライド有効化フラグのデータをビデオビットストリームに含めるステップＳ３５０と、を含む。更に、第１パーティション制約情報に従いブロックをパーティションすることが有効化される（べきであると決定される）と決定すると、画像領域のブロックをパーティションすることが、画像領域ヘッダの中の第１パーティション制約情報に従うかどうかを決定するＳ３１０。

幾つかの例示的な実施形態では、第１パーティション制約情報に従いブロックをパーティションすることが有効化されない（つまり無効化される）（べきであると決定される）と決定すると、方法は、オーバーライド有効化フラグの値を非有効化（無効化）値に設定するステップＳ３８０を含む。

以下は、上述の実施形態で示されたような符号化方法及び復号方法及びそれらを使用するシステムの適用の説明である。

図１４は、コンテンツ配信サービスを実現するコンテンツ供給システム３１００を示すブロック図である。このコンテンツ供給システム３１００は、キャプチャ装置３１０２、端末装置３１０６を含み、及び任意的にディスプレイ３１２６を含む。キャプチャ装置３１０２は、通信リンク３１０４を介して端末装置３１０６と通信する。通信リンクは、上述の通信チャネル１３を含んでよい。通信リンク３１０４は、限定ではないが、ＷＩＦＩ、イーサネット、ケーブル、無線（３Ｇ／４Ｇ／５Ｇ）、ＵＳＢ、又はそれらの任意の種類の組み合わせ、等を含む。

キャプチャ装置３１０２は、データを生成し、上述の実施形態で示したような符号化方法によりデータを符号化してよい。代替として、キャプチャ装置３１０２は、データをストリーミングサーバ（図に示されない）へ配信してよく、サーバは、データを符号化し、符号化データを端末装置３１０６へ送信する。キャプチャ装置３１０２は、限定ではないが、カメラ、スマートフォン又はＰａｄ、コンピュータ又はラップトップ、ビデオ会議システム、ＰＤＡ、車載装置、又はそれらのいずれかの組み合わせ、等を含む。例えば、キャプチャ装置３１０２は、上述のようなソース装置１０２を含んでよい。データがビデオを含むとき、キャプチャ装置３１０２に含まれるビデオエンコーダ２０は、実際に、ビデオ符号化処理を実行してよい。データがオーディオ（つまり、音声）を含むとき、キャプチャ装置３１０２に含まれるオーディオエンコーダは、実際に、オーディオ符号化処理を実行してよい。幾つかの実用的なシナリオでは、キャプチャ装置３１０２は、符号化ビデオ及びオーディオデータを、それらを一緒に多重化することにより、配信する。他の実用的なシナリオでは、例えば、ビデオ会議システムで、符号化オーディオデータ及び符号化ビデオデータは、多重化されない。キャプチャ装置３１０２は、符号化オーディオデータ及び符号化ビデオデータを端末装置３１０６へ別個に配信する。

コンテンツ供給システム３１００では、端末装置３１０は、符号化データを受信し再生する。端末装置３１０６は、上述の符号化データを復号する能力を有するスマートフォン又はＰａｄ３１０８、コンピュータ又はラップトップ３１１０、ネットワークビデオレコーダ（network video recorder (NVR)）／デジタルビデオレコーダ（digital video recorder (DVR)）３１１２、ＴＶ３１１４、セットトップボックス（set top box (STB)）３１１６、ビデオ会議システム３１１８、ビデオ監視システム３１２０、パーソナルデジタルアシスタント（personal digital assistant (PDA)）３１２２、車載装置３１２４、又はそれらの任意の組合せ等のような、データ受信及び復元能力を備えた装置であり得る。例えば、端末装置３１０６は、上述のような宛先装置１４を含んでよい。符号化データがビデオを含むとき、端末装置に含まれるビデオデコーダ３０は、ビデオ復号を実行するよう優先される。符号化データがオーディオを含むとき、端末装置に含まれるオーディオデコーダは、オーディオ復号処理を実行するよう優先される。

自身のディスプレイを備える端末装置、例えば、スマートフォン、又はＰａｄ３１０８、コンピュータ又はラップトップ３１１０、ネットワークビデオレコーダ（network video recorder (NVR)）／デジタルビデオデコーダ（digital video recorder (DVR)）３１１２、ＴＶ３１１４、パーソナルデジタルアシスタント（personal digital assistant (PDA)）３１２２、又は車載装置３１２４では、端末装置は復号データを自身のディスプレイに供給できる。ディスプレイを備えない端末装置、例えばＳＴＢ３１１６、ビデオ会議システム３１１８、又はビデオ監視システム３１２０では、外部ディスプレイ３１２６が、復号データを受信し表示するためにそれに接続される。

このシステム内の各装置が符号化又は復号を実行するとき、上述の実施形態において示されたように、ピクチャ符号化装置又はピクチャ復号装置が使用できる。

図１５は、端末装置３１０６の例の構造を示す図である。端末装置３１０６がキャプチャ装置３１０２からストリームを受信した後に、プロトコル処理ユニット３２０２は、ストリームの送信プロトコルを分析する。プロトコルは、限定ではないが、リアルタイムストリーミングプロトコル（Real Time Streaming Protocol (RTSP)）、ハイパーテキスト転送プロトコル（Hyper Text Transfer Protocol (HTTP)）、ＨＴＴＰライブストリーミングプロトコル（HTTP Live streaming protocol (HLS)）、ＭＰＥＧ－ＤＡＳＨ、リアルタイムトランスポートプロトコル（Real－time Transport protocol (RTP)）、リアルタイムメッセージングプロトコル（Real Time Messaging Protocol (RTMP)）、又は任意の種類のそれらの組み合わせ、等を含む。

プロトコル処理ユニット３２０２がストリームを処理した後に、ストリームファイルが生成される。ファイルは、逆多重化ユニット３２０４へと出力される。逆多重化ユニット３２０４は、多重化データを符号化オーディオデータ及び符号化ビデオデータに分離できる。上述のように、幾つかの実用的なシナリオでは、例えば、ビデオ会議システムで、符号化オーディオデータ及び符号化ビデオデータは、多重化されない。この状況では、符号化データは、逆多重化ユニット３２０４を通らずに、ビデオデコーダ３２０６及びオーディオデコーダ３２０８へと送信される。

逆多重化処理により、ビデオエレメンタリストリーム（elementary stream (ES)）、オーディオＥＳ、及任意の代替が生成される。上述の実施形態において説明したようなビデオデコーダ３０を含むビデオデコーダ３２０６は、上述の実施形態において示したような復号方法によりビデオＥＳを復号して、ビデオフレームを生成し、このデータを同期ユニット３２１２に供給する。オーディオデコーダ３２０８は、オーディオＥＳを復号してオーディオフレームを生成し、このデータを同期ユニット３２１２に供給する。代替として、ビデオフレームは、同期ユニット３２１２に供給する前に、バッファ（図１５に示されない）に格納してよい。同様に、オーディオフレームは、同期ユニット３２１２に供給する前に、バッファ（図１５に示されない）に格納してよい。

同期ユニット３２１２は、ビデオフレーム及びオーディオフレームを同期化し、ビデオ／オーディオをビデオ／オーディオディスプレイ３２１４に供給する。例えば、同期ユニット３２１２は、ビデオ及びオーディオ情報の提示を同期化する。情報は、符号化オーディオ及び視覚データの提示に関するタイムスタンプ、及びデータストリーム自体の配信に関するタイムスタンプを用いてシンタックス内に符号化してよい。

サブタイトルがストリームに含まれる場合、サブタイトルデコーダ３２１０は、サブタイトルを復号し、それをビデオフレーム及びオーディオフレームと同期化させ、ビデオ／オーディオ／サブタイトルをビデオ／オーディオ／サブタイトルディスプレイ３２１６に供給する。

本発明は、上述のシステムに限定されず、上述の実施形態におけるピクチャ符号化装置又はピクチャ復号装置のいずれも、他のシステム、例えば車両システムに組み込むことができる。

数学演算子
本願で使用される数学演算子は、Ｃプログラミング言語で使用されるものと同様である。しかしながら、整数除算及び算術シフト演算の結果は、より正確に定義され、べき乗と実数値の除算のような追加の演算子が定義される。番号付け及び計数規則は、一般的に０から開始する。例えば、「第１」は０番目と等価であり、「第２」は１番目と等価である、等である。

論理演算子
以下の論理演算子は以下のように定義される。

関係演算子
以下の関係演算子は以下のように定義される。

関係演算子がシンタックス要素又は値「ｎａ」（not applicable）を割り当てられた変数に適用されるとき、値「ｎａ」は、シンタックス要素又は変数の個別の値として扱われる。値「ｎａ」は、任意の他の値に等しくないと考えられる。

ビット演算子
以下のビット演算子は以下のように定義される。

& ビット毎の「論理積」。整数引数に作用するとき、２の補数整数表現に作用する。別の引数より少ないビットを含む２値引数に作用するとき、より短い引数は、０に等しいより上位のビットを追加することにより拡張される。

｜ビット毎の「論理和」。整数引数に作用するとき、２の補数整数表現に作用する。別の引数より少ないビットを含む２値引数に作用するとき、より短い引数は、０に等しいより上位のビットを追加することにより拡張される。

＾ビット毎の「排他的論理和」。整数引数に作用するとき、整数値の２の完全な表現に作用する。別の引数より少ないビットを含む２値引数に作用するとき、より短い引数は、０に等しいより上位のビットを追加することにより拡張される。

x>>y ｘ×ｙの２進数の２の補数整数表現の算術右シフト。この関数は、ｙの非負整数値についてのみ定義される。右シフトの結果としての最上位ビット（most significant bit (MSB)）へとシフトされたビットは、シフト演算前のｘのMSBに等しい値を有する。

x<<y ｘ×ｙの２進数の２の補数整数表現の算術左シフト。この関数は、ｙの非負整数値についてのみ定義される。左シフトの結果としての最下位ビット（least significant bit(LSB)）へとシフトされたビットは、０に等しい値を有する。

１つ以上の例では、説明された関数は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせにより実装されてよい。ソフトウェアで実装される場合、機能は、１つ以上の命令又はコードとしてコンピュータ可読媒体に格納され又はそれを介して送信され、ハードウェアに基づく処理ユニットにより実行されてよい。コンピュータ可読媒体は、データ記憶媒体のような有形媒体に対応するコンピュータ可読記憶媒体、又は例えば通信プロトコルに従いある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体、を含んでよい。この方法では、コンピュータ可読媒体は、一般的に、（１）非一時的である有形コンピュータ可読記憶媒体、又は（２）信号若しくは搬送波のような通信媒体、に対応してよい。データ記憶媒体は、本開示で説明された技術の実装のために命令、コード、及び／又はデータ構造を読み出すために、１つ以上のコンピュータ又は１つ以上のプロセッサによりアクセス可能な任意の利用可能な媒体であってよい。コンピュータプログラムプロダクトは、コンピュータ可読媒体を含んでよい。

例により、限定ではなく、このようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ、又は他の光ディスク記憶、磁気ディスク記憶、又は他の磁気記憶装置、フラッシュメモリ、又は所要のプログラムコードを命令又はデータ構造の形式で格納するために使用可能な、コンピュータによりアクセス可能な任意の他の媒体、を含み得る。また、任意の接続は、適正にコンピュータ可読媒体と呼ばれる。命令がウェブサイト、サーバ、又は他のリモートソースから、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者線（digital subscriber line (DSL)）、又は赤外線、無線、及びマイクロ波のような無線技術を用いて送信される場合、同軸ケーブル、光ファイバケーブル、より対線、ＤＳＬ、又は赤外線、無線、及びマイクロ波のような無線技術は、媒体の定義に含まれる。しかしながら、理解されるべきことに、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とする。ディスク（disk）及びディクス（disc）は、ここで使用されるとき、コンパクトディスク（compact disc (CD)）、レーザディスク、光ディスク、デジタルバーサタイルディスク（digital versatile disc (DVD)）、フロッピーディスク、及びブルーレイディスクを含み、ディスク（disk）は通常データを磁気的に再生し、ディスク（disc）はデータをレーザにより光学的に再生する。前述の結合も、コンピュータ可読媒体の範囲に含まれるべきである。

命令は、１つ以上のデジタル信号プロセッサ（digital signal processor (DSP)）、汎用マイクロプロセッサ、特定用途向け集積回路（application specific integrated circuit (ASIC)）、フィールドプログラマブルロジックアレイ（field programmable logic array (FPGA)）、又は他の等価な集積又は個別論理回路、のような１つ以上のプロセッサにより実行されてよい。従って、用語「プロセッサ」は、ここで使用されるとき、前述の構造のうちのいずれか、又はここに記載される技術の実装に適する任意の他の構造を表してよい。更に、幾つかの態様では、ここに説明された機能は、符号化及び復号又は結合されたコーデックに組み込まれるために構成される専用ハードウェア及び／又はソフトウェアモジュール内で提供されてよい。更に、技術は、全部、１つ以上の回路又は論理素子で実装され得る。

本開示の技術は、無線ハンドセット、集積回路（integrated circuit (IC)）、又はＩＣのセット（例えば、チップセット）を含む種々の装置又は機器の中で実装されてよい。種々のコンポーネント、モジュール、又はユニットは、開示の技術を実行するよう構成される装置の機能的側面を強調するために、本開示で説明されたが、異なるハードウェアユニットによる実現を必ずしも要求しない。むしろ、上述のように、種々のユニットは、適切なソフトウェア及び／又はファームウェアと組み合わせて、コーデックハードウェアユニット内で結合され、又は上述のような１つ以上のプロセッサを含む相互運用ハードウェアユニットの集合により提供されてよい。

一例では、符号化装置により実施される符号化の方法であって、パーティション制約情報に従い画像領域のブロックをパーティションするステップと、１つ以上のパーティション制約シンタックス要素を含むビットストリームを生成するステップであって、１つ以上のパーティション制約シンタックス要素はパーティション制約情報を示し、１つ以上のパーティション制約シンタックス要素はピクチャパラメータセット（picture parameter set (PPS)）レベルでシグナリングされる、ステップと、を含む方法が提供される。

例えば、パーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さの情報（MaxMttDepth）、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報、から選択された１つ以上を含む。

例えば、幾つかの実施形態では、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報を含む。

幾つかの実施形態では、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報を含む。

上述の任意の方法で、パーティション制約情報は：Ｎ個のスライスタイプに対応するＮ個のセット若しくはグループのパーティション制約情報、又はＮ個のスライスインデックスに対応するＮ個のセット若しくはグループのパーティション制約情報、を含む。ここで、各セット若しくはグループのパーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報から選択された１つ以上を含み、Ｎは正整数である。

方法は、パーティション制約情報に従い画像領域のブロックをパーティションするステップと、複数のパーティション制約シンタックス要素を含むビットストリームを生成するステップであって、複数のパーティション制約シンタックス要素はパーティション制約情報を示し、複数のパーティション制約シンタックス要素はパラメータセットレベル又はヘッダでシグナリングされる、ステップと、を含んでよい。

例えば、複数のパーティション制約シンタックス要素は、ビデオパラメータセット（video parameter set (VPS)）レベル、シーケンスパラメータセット（sequence parameter set (SPS)）レベル、ピクチャパラメータセット（picture parameter set (PPS)）レベル、ピクチャヘッダ、スライスヘッダ、又はタイルヘッダ、のうちのいずれか１つでシグナリングされる。

幾つかの例示的な実装では、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、及び最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報を含む。

例えば、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報を含む。

幾つかの実施形態では、パーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さの情報（MaxMttDepth）、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報、から選択された２つ以上を含む。

例えば、パーティション制約情報は：Ｎ個のスライスタイプに対応するＮ個のセット若しくはグループのパーティション制約情報、又はＮ個のスライスインデックスに対応するＮ個のセット若しくはグループのパーティション制約情報、を含む。ここで、各セット若しくはグループのパーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報から選択された２つ以上を含み、Ｎは正整数である。

実施形態によると、復号装置により実施される復号の方法であって、１つ以上のパーティション制約シンタックス要素をビットストリームからパースするステップであって、１つ以上のパーティション制約シンタックス要素はパーティション制約情報を示し、１つ以上のパーティション制約シンタックス要素は、ビットストリームのピクチャパラメータセット（picture parameter set (PPS)）レベルから取得される、ステップと、パーティション制約情報に従い画像領域のブロックをパーティションするステップと、を含む方法が提供される。

幾つかの実装では、パーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さの情報（MaxMttDepth）、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報、から選択された１つ以上を含む。

例えば、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、及び最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報を含む。パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報を含んでよい。

幾つかの実施形態では、パーティション制約情報は：Ｎ個のスライスタイプに対応するＮ個のセット若しくはグループのパーティション制約情報、又はＮ個のスライスインデックスに対応するＮ個のセット若しくはグループのパーティション制約情報、を含む。ここで、各セット若しくはグループのパーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報から選択された１つ以上を含み、Ｎは正整数である。

実施形態によると、復号装置により実施される復号の方法であって、複数のパーティション制約シンタックス要素をビットストリームからパースするステップであって、複数のパーティション制約シンタックス要素はパーティション制約情報を示し、複数のパーティション制約シンタックス要素は、ビットストリームのパラメータセットレベル又はビットストリームのヘッダから取得される、ステップと、パーティション制約情報に従い画像領域のブロックをパーティションするステップと、を含む方法が提供される。

例えば、複数のパーティション制約シンタックス要素は、ビデオパラメータセット（video parameter set (VPS)）レベル、シーケンスパラメータセット（sequence parameter set (SPS)）レベル、ピクチャパラメータセット（picture parameter set (PPS)）レベル、ピクチャヘッダ、スライスヘッダ、又はタイルヘッダ、のうちのいずれか１つから取得される。

例えば、パーティション制約情報は、最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さ（MaxMttDepth）の情報、及び最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報を含む。

幾つかの実装では、パーティション制約情報は、以下：最小許容４分木リーフノードサイズ（MinQtSizeY）の情報、最大マルチタイプ木深さの情報（MaxMttDepth）、最大許容２分木ルートノードサイズ（MaxBtSizeY）の情報、及び最大許容３分木ルートノードサイズ（MaxTtSizeY）の情報、から選択された２つ以上を含む。

幾つかの例では、パーティション制約情報は、異なるスライスタイプに対応する又は異なるスライスインデックスに対応するパーティション制約情報を含む。

例えば、パーティション制約情報は、イントラモードにおけるパーティション制約情報、及び／又はインターモードにおけるパーティション制約情報を含む。

実施形態のうちの任意のものにおいて、画像領域は、ピクチャ、又はピクチャの部分を含む。

幾つかの実施形態では、ピクチャパラメータセット（picture parameter set (PPS)）からのマルチタイプ木パーティション有効化フラグの値が、ブロックのマルチタイプ木パーティションを有効化するとき、ピクチャパラメータセットからのパーティション制約情報をパースし、パーティション制約情報に従いマルチタイプ木パーティションを画像領域のブロックに適用する。

実施形態によると、エンコーダであって、上述の方法のうちのいずれかを実行するための処理回路を含むエンコーダが提供される。

実施形態によると、デコーダであって、上述の方法のうちのいずれかを実行するための処理回路を含むデコーダが提供される。

実施形態によると、コンピュータプログラムプロダクトであって、上述の方法のうちのいずれかに従う方法を実行するためのプログラムコードを含むコンピュータプログラムプロダクトが提供される。

実施形態によると、デコーダであって、１つ以上のプロセッサと、プロセッサに接続されプロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、プログラミングは、プロセッサにより実行されると、上述の復号方法のいずれかによる方法を実行するようデコーダを構成する、非一時的コンピュータ可読記憶媒体と、を含むデコーダが提供される。

実施形態によると、エンコーダであって、１つ以上のプロセッサと、プロセッサに接続されプロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、プログラミングは、プロセッサにより実行されると、上述の復号方法のいずれかによる方法を実行するようエンコーダを構成する、非一時的コンピュータ可読記憶媒体と、を含むエンコーダが提供される。

第１の態様によると、本発明は、復号装置により実施されるビデオビットストリームの復号の方法であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記復号方法は、
前記ビデオビットストリームからオーバーライドフラグを取得するステップと、
前記オーバーライドフラグ（例えば、partition_constraint_override_flag）の前記値がオーバーライド値であるとき、前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得するステップと、
前記第１パーティション制約情報に従い、前記画像領域のブロックをパーティションするステップと、を含む方法に関する。

可能な実装では、前記第１パーティション制約情報に従い前記画像領域のブロックをパーティションする前記ステップは、前記第１パーティション制約情報に従い、前記画像領域のブロックをサブブロックにパーティションするステップを含む。前記復号方法は、前記サブブロックを再構成するステップを更に含む。

可能な実装では、前記復号方法は、
前記ビデオビットストリームからオーバーライド有効化フラグを取得するステップ、を更に含み、
前記オーバーライド有効化フラグ（例えば、partition_constraint_override_enabled_flag）の前記値が有効化値であるとき、前記ビデオビットストリームから前記オーバーライドフラグを取得する。

可能な実装では、前記復号方法は、
前記ビデオビットストリームからパーティション制約制御存在フラグを取得するステップ、を更に含み、
前記パーティション制約制御存在フラグ（例えば、partition_constraint_control_present_flag）の前記値が真であるとき、前記ビデオビットストリームから前記オーバーライド有効化フラグを取得する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記パーティション制約制御存在フラグの前記値が偽であることは、前記パラメータセットの中のパーティション制約制御シンタックス要素の不存在を指定する。

可能な実装では、前記パラメータセットは、ピクチャパラメータセット又はシーケンスパラメータセットである。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記復号方法は、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ、を更に含む。

可能な実装では、前記第２パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。

可能な実装では、前記第２パーティション制約情報は、画像領域に関連する異なるパラメータに対応する又は異なるインデックスに対応する、パーティション制約情報を含む。

可能な実装では、前記第２パーティション制約情報は、イントラモードにおけるパーティション制約情報、又はインターモードにおけるパーティション制約情報を含む。

可能な実装では、前記第２パーティション制約情報は、ルマブロックのパーティション制約情報、又はクロマブロックのパーティション制約情報を含む。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記ビデオビットストリームからオーバーライド有効化フラグを取得する前記ステップは、前記パラメータセットから前記オーバーライド有効化フラグを取得するステップを含む。

可能な実装では、前記ビデオビットストリームからオーバーライドフラグを取得する前記ステップは、前記画像領域ヘッダから前記オーバーライドフラグを取得するステップを含む。

可能な実装では、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含む。

可能な実装では、前記画像領域は、スライス又はタイルを含み、前記画像領域ヘッダは、前記スライスのスライスヘッダ、又は前記タイルのタイルヘッダを含む。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記復号方法は、
前記オーバーライドフラグの前記値が前記オーバーライド値ではないとき、前記パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ、を更に含む。

可能な実装では、前記画像領域ヘッダからのマルチタイプ木パーティション有効化フラグ（例えば、slice_btt_enabled_flag）の値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、第１パーティション制約情報を取得し、前記第１パーティション制約情報に従いマルチタイプ木パーティションを前記画像領域の前記ブロックに適用する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記画像領域ヘッダからの前記マルチタイプ木パーティション有効化フラグが存在せず、前記パラメータセットからのマルチタイプ木パーティション有効化フラグ（例えば、sps_btt_enabled_flag）の値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、前記パラメータセットから前記ビデオビットストリームの第２パーティション制約情報を取得し、前記第２パーティション制約情報に従い前記画像領域の前記ブロックにマルチタイプ木パーティションを適用する。

第２の態様によると、本発明は、復号装置により実施されるビデオビットストリームの復号の方法であって、前記ビデオビットストリームは、ブロックを表すデータと、前記ビデオビットストリームの第１パラメータセットとを含み、前記復号方法は、
前記ビデオビットストリームからオーバーライドフラグを取得するステップと、
前記オーバーライドフラグの前記値がオーバーライド値であるとき、前記第１パラメータセットから前記ブロックの第１パーティション制約情報を取得するステップと、
前記第１パーティション制約情報に従い、前記ブロックをパーティションするステップと、を含む方法に関する。

可能な実装では、前記第１パーティション制約情報に従い前記ブロックをパーティションする前記ステップは、前記第１パーティション制約情報に従い、前記ブロックをサブブロックにパーティションするステップを含む。前記復号方法は、前記サブブロックを再構成するステップを更に含む。

可能な実装では、前記復号方法は、
前記ビデオビットストリームからオーバーライド有効化フラグを取得するステップ、を更に含み、
前記オーバーライド有効化フラグの前記値が有効化値であるとき、前記ビデオビットストリームから前記オーバーライドフラグを取得する。

可能な実装では、前記復号方法は、
前記ビデオビットストリームからパーティション制約制御存在フラグを取得するステップ、を更に含み、
前記パーティション制約制御存在フラグの前記値が真であるとき、前記ビデオビットストリームから前記オーバーライド有効化フラグを取得する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、前記パーティション制約制御存在フラグの前記値が偽であることは、前記パラメータセットの中のパーティション制約制御シンタックス要素の不存在を指定する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、前記復号方法は、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記第２パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記ブロックをパーティションするステップ、を更に含む。

可能な実装では、前記第２パーティション制約情報は、前記ビデオビットストリームにより表される画像領域に関連する異なるパラメータセットに対応する又は異なるインデックスに対応する、パーティション制約情報を含む。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、前記ビデオビットストリームからオーバーライド有効化フラグを取得する前記ステップは、前記第２パラメータセットから前記オーバーライド有効化フラグを取得するステップを含む。

可能な実装では、前記ビデオビットストリームからオーバーライドフラグを取得する前記ステップは、前記第１パラメータセットから前記オーバーライドフラグを取得するステップを含む。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、
第１パラメータセットはピクチャパラメータセットであり、前記第２パラメータセットはシーケンスパラメータセットである。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、前記復号方法は、
前記オーバーライドフラグの前記値がオーバーライド値ではないとき、前記第２パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記ブロックをパーティションするステップ、を更に含む。

可能な実装では、前記第１パラメータセットからのマルチタイプ木パーティション有効化フラグの値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、第１パーティション制約情報を取得し、前記第１パーティション制約情報に従いマルチタイプ木パーティションを前記ブロックに適用する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２パラメータセットを表すデータを更に含み、前記第１パラメータセットからの前記マルチタイプ木パーティション有効化フラグが存在せず、前記第２パラメータセットからのマルチタイプ木パーティション有効化フラグの値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、前記第２パラメータセットから前記ビデオビットストリームの第２パーティション制約情報を取得し、前記第２パーティション制約情報に従い前記ブロックにマルチタイプ木パーティションを適用する。

第３の態様によると、本発明は、復号装置により実施されるビデオビットストリームの復号の方法であって、前記ビデオビットストリームは、第１画像領域を表すデータと、前記第１画像領域の第１画像領域ヘッダとを含み、前記復号方法は、
前記ビデオビットストリームからオーバーライドフラグを取得するステップと、
前記オーバーライドフラグの前記値がオーバーライド値であるとき、前記第１画像領域ヘッダから前記第１画像領域の第１パーティション制約情報を取得するステップと、
前記第１パーティション制約情報に従い、前記第１画像領域のブロックをパーティションするステップと、を含む方法に関する。

可能な実装では、前記第１パーティション制約情報に従い前記第１画像領域の前記ブロックをパーティションする前記ステップは、前記第１パーティション制約情報に従い、前記第１画像領域の前記ブロックをサブブロックにパーティションするステップを含む。前記復号方法は、前記サブブロックを再構成するステップを更に含む。

可能な実装では、前記ビデオビットストリームは、第２画像領域を表すデータと、前記第２画像領域の第２画像領域ヘッダと、を更に含み、前記パーティション制約制御存在フラグの前記値が偽であることは、前記第２画像領域ヘッダの中のパーティション制約制御シンタックス要素の不存在を指定する。

可能な実装では、前記ビデオビットストリームは、第２画像領域を表すデータと、前記第２画像領域の第２画像領域ヘッダと、を更に含み、前記復号方法は、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記第２画像領域ヘッダからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記第１画像領域の前記ブロックをパーティションするステップであって、前記第２画像領域は前記第１画像領域の前記ブロックを含む、ステップ、を更に含む。

可能な実装では、第２パーティション制約情報は、イントラモードにおけるパーティション制約情報、又はインターモードにおけるパーティション制約情報を含む。

可能な実装では、前記ビデオビットストリームは、第２画像領域を表すデータと、前記第２画像領域の第２画像領域ヘッダと、を更に含み、前記ビデオビットストリームからオーバーライド有効化フラグを取得する前記ステップは、前記第２画像領域ヘッダから前記オーバーライド有効化フラグを取得するステップを含む。

可能な実装では、前記ビデオビットストリームからオーバーライドフラグを取得する前記ステップは、前記第１画像領域ヘッダから前記オーバーライドフラグを取得するステップを含む。

可能な実装では、前記ビデオビットストリームは、第２画像領域を表すデータと、前記第２画像領域の第２画像領域ヘッダと、を更に含み、
前記第１画像領域ヘッダはスライスヘッダであり、前記第２画像領域ヘッダはタイルヘッダであり、前記第１画像領域はスライスであり、前記第２画像領域はタイルであり、前記タイルは前記スライスを含む、又は、
前記第１画像領域ヘッダはタイルヘッダであり、前記第２画像領域ヘッダはスライスヘッダであり、前記第１画像領域はタイルであり、前記第２画像領域はスライスであり、前記スライスは前記タイルを含む。

可能な実装では、前記ビデオビットストリームは、第２画像領域を表すデータと、前記第２画像領域の第２画像領域ヘッダと、を更に含み、前記復号方法は、
前記オーバーライドフラグの前記値がオーバーライド値ではないとき、前記第２画像領域ヘッダからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記第１画像領域の前記ブロックをパーティションするステップであって、前記第２画像領域は前記第１画像領域の前記ブロックを含む、ステップ、を更に含む。

可能な実装では、前記第１画像領域ヘッダからのマルチタイプ木パーティション有効化フラグの値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、第１パーティション制約情報を取得し、前記第１パーティション制約情報に従いマルチタイプ木パーティションを前記第１画像領域の前記ブロックに適用する。

可能な実装では、前記ビデオビットストリームは、前記ビデオビットストリームの第２画像領域ヘッダを表すデータを更に含み、前記第１画像領域ヘッダからの前記マルチタイプ木パーティション有効化フラグが存在せず、前記第２画像領域ヘッダからのマルチタイプ木パーティション有効化フラグの値が、前記ブロックのマルチタイプ木パーティションを有効化するとき、前記第２画像領域ヘッダから前記ビデオビットストリームの第２パーティション制約情報を取得し、前記第２パーティション制約情報に従い前記画像領域の前記ブロックにマルチタイプ木パーティションを適用する。

第４の態様によると、本発明は、プロセッサとメモリとを含む、ビデオストリームを復号する機器に関する。メモリは、前記プロセッサに、第１の態様、第２の態様、若しくは第３の態様、又は第１の態様、第２の態様、若しくは第３の態様の任意の可能な実施形態による方法を実行させる命令を格納している。

第５の態様によると、実行されると１つ以上のプロセッサをビデオデータを符号化するよう構成させる命令を格納したコンピュータ可読記憶媒体が提案される。前記命令は、前記１つ以上のプロセッサに、第１の態様、第２の態様、若しくは第３の態様、又は第１の態様、第２の態様、若しくは第３の態様の任意の可能な実施形態による方法を実行させる。

第６の態様によると、本発明は、コンピュータ上で実行されると、第１の態様、第２の態様、若しくは第３の態様又は第１の態様、第２の態様、若しくは第３の態様の任意の可能な実施形態による方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。

纏めると、本開示は、符号化及び復号機器、並びに符号化及び復号方法を提供する。特に、本開示は、ブロックパーティション及びビットストリームの中でパーティションパラメータをシグナリングすることに関する。画像領域ヘッダの中のオーバーライドフラグはブロックが第１パーティション制約情報に従いパーティションされるか否かを示す。オーバーライドフラグは、ビットストリームに含まれ、ブロックは相応してパーティションされる。

Claims

復号装置により実施されるビデオビットストリームの復号の方法であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記ビデオビットストリームは前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記復号の方法は、
前記ビデオビットストリームの前記パラメータセットからオーバーライド有効化フラグを取得するステップ（Ｓ２１０）であって、前記パラメータセットはシーケンスパラメータセット（ＳＰＳ）である、ステップと、
前記オーバーライド有効化フラグの値が有効化値であるとき、前記ビデオビットストリームの前記画像領域ヘッダからオーバーライドフラグを取得するステップ（Ｓ１１０）であって、前記オーバーライドフラグは、前記画像領域ヘッダからの第１パーティション制約情報又は前記パラメータセットからの第２パーティション制約情報が前記画像領域のブロックをパーティションするために使用されるべきかどうかを示し、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含み、前記第２パーティション制約情報は、前記最小許容４分木リーフノードサイズの情報、前記最大マルチタイプ木深さの情報、前記最大許容３分木ルートノードサイズの情報、又は前記最大許容２分木ルートノードサイズの情報を含む、ステップと、
前記オーバーライドフラグの値がオーバーライド値であるとき、前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得するステップ（Ｓ１２０）と、
前記第１パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ（Ｓ１３０）と、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記パラメータセットからの前記第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ（Ｓ２３０）、
を含む復号方法。
前記第２パーティション制約情報は、イントラモードにおけるブロックのパーティション制約情報、又はインターモードにおけるブロックのパーティション制約情報を含む、請求項１に記載の復号方法。
前記第２パーティション制約情報は、ルマブロックのパーティション制約情報、又はクロマブロックのパーティション制約情報を含む、請求項１に記載の復号方法。
前記復号方法は、
前記オーバーライドフラグの値が前記オーバーライド値ではないとき、前記パラメータセットからの前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ（Ｓ２３０）、
を更に含む請求項１～３のいずれか一項に記載の復号方法。
符号化装置により実施されるビデオビットストリームの符号化の方法であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記ビデオビットストリームは前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記符号化の方法は、
第１パーティション制約情報に従う前記画像領域のブロックのパーティションが有効化されるかどうかを決定するステップ（３７０）と、
前記第１パーティション制約情報に従う前記ブロックのパーティションが有効化されると決定すると、前記画像領域のブロックのパーティションが前記画像領域ヘッダの中の第１パーティション制約情報又は前記パラメータセットからの第２パーティション制約情報に従うかどうかを決定するステップ（Ｓ３１０）であって、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含み、前記第２パーティション制約情報は、前記最小許容４分木リーフノードサイズの情報、前記最大マルチタイプ木深さの情報、前記最大許容３分木ルートノードサイズの情報、又は前記最大許容２分木ルートノードサイズの情報を含む、ステップと、
オーバーライド有効化フラグの値を有効化値に設定するステップ（Ｓ３４０）と、
前記ブロックのパーティションが前記第１パーティション制約情報に従うと決定すると、
前記第１パーティション制約情報に従い前記画像領域のブロックをパーティションすし（Ｓ３２０）、オーバーライドフラグの値をオーバーライド値に設定するステップ（Ｓ３２５）と、
前記オーバーライドフラグのデータを前記ビデオビットストリームの前記画像領域ヘッダに含めるステップ（Ｓ３３０）と、
前記第１パーティション制約情報に従う前記ブロックのパーティションが有効化されないと決定すると、
前記パラメータセットの中の前記第２パーティション制約情報に従い、前記ブロックをパーティションし、前記オーバーライド有効化フラグの値を無効化値に設定するステップと、
前記オーバーライド有効化フラグのデータを前記ビデオビットストリームの前記パラメータセットに含めるステップ（Ｓ３５０）であって、前記パラメータセットはシーケンスパラメータセット（ＳＰＳ）である、ステップと、
を含む符号化方法。
前記第２パーティション制約情報は、イントラモードにおけるパーティション制約情報、又はインターモードにおけるパーティション制約情報を含む、請求項５に記載の符号化方法。
前記第２パーティション制約情報は、ルマブロックのパーティション制約情報、又はクロマブロックのパーティション制約情報を含む、請求項５に記載の符号化方法。
前記符号化方法は、
前記ブロックのパーティションが前記第１パーティション制約情報に従わないと決定すると、前記パラメータセットの中の前記ビデオビットストリームの第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするステップ（Ｓ３６０）と、
前記オーバーライドフラグの前記値を非オーバーライド値に設定するステップ（Ｓ３６５）と、
を更に含む請求項５～７のいずれか一項に記載の符号化方法。
請求項１～８のいずれか一項に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。
コーダであって、
１つ以上のプロセッサと、
前記プロセッサに接続され前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記プロセッサにより実行されると、請求項１～８のいずれか一項に記載の方法を実行するよう前記コーダを構成する、非一時的コンピュータ可読記憶媒体と、
を含むコーダ。
デコーダ／エンコーダであって、請求項１～８のいずれかに記載の方法を実行するための処理回路を含むデコーダ／エンコーダ。
ビデオビットストリームを復号するデコーダ（１２００）であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記デコーダは、
前記ビデオビットストリームの前記パラメータセットからオーバーライド有効化フラグを取得するオーバーライド決定ユニット（１２１０）であって、前記パラメータセットはシーケンスパラメータセット（ＳＰＳ）であり、前記オーバーライド有効化フラグの値が有効化値であるとき、前記オーバーライド決定ユニットは、前記ビデオビットストリームからオーバーライドフラグを取得するよう構成され、前記オーバーライドフラグは、前記画像領域ヘッダからの第１パーティション制約情報又は前記パラメータセットからの第２パーティション制約情報が、前記画像領域のブロックをパーティションするために使用されるべきかを示し、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含み、前記第２パーティション制約情報は、前記最小許容４分木リーフノードサイズの情報、前記最大マルチタイプ木深さの情報、前記最大許容３分木ルートノードサイズの情報、又は前記最大許容２分木ルートノードサイズの情報を含む、オーバーライド決定ユニットと、
前記オーバーライドフラグの値がオーバーライド値であるとき、前記画像領域ヘッダから前記画像領域の第１パーティション制約情報を取得するパーティション制約決定ユニット（１２２０）と、
前記第１パーティション制約情報に従い、前記画像領域のブロックをパーティションするブロックパーティションユニット（１２３０）と、
を含み、
前記オーバーライド有効化フラグの前記値が無効化値であるとき、前記ブロックパーティションユニットは、前記パラメータセットからの前記第２パーティション制約情報に従い、前記画像領域の前記ブロックをパーティションするよう構成される、デコーダ。
ビデオビットストリームを符号化するエンコーダ（１３００）であって、前記ビデオビットストリームは、画像領域を表すデータと、前記画像領域の画像領域ヘッダとを含み、前記ビデオビットストリームは、前記ビデオビットストリームのパラメータセットを表すデータを更に含み、前記エンコーダは、
第１パーティション制約情報に従う前記画像領域のブロックのパーティションが有効化されるかどうかを決定するパーティション決定ユニット（１３１０）であって、前記第１パーティション制約情報に従う前記ブロックのパーティションが有効化されると決定すると、前記パーティション決定ユニットは、前記画像領域のブロックのパーティションが前記画像領域ヘッダの中の第１パーティション制約情報又は前記パラメータセットからの第２パーティション制約情報に従うかどうかを決定するよう構成され、前記第１パーティション制約情報は、最小許容４分木リーフノードサイズの情報、最大マルチタイプ木深さの情報、最大許容３分木ルートノードサイズの情報、又は最大許容２分木ルートノードサイズの情報を含み、前記第２パーティション制約情報は、前記最小許容４分木リーフノードサイズの情報、前記最大マルチタイプ木深さの情報、前記最大許容３分木ルートノードサイズの情報、又は前記最大許容２分木ルートノードサイズの情報を含む、パーティション決定ユニット（１３１０）と、
前記ブロックのパーティションが前記第１パーティション制約情報に従うと決定すると、前記第１パーティション制約情報に従い前記画像領域のブロックをパーティションするブロックパーティションユニット（１３２０）と、
前記ブロックのパーティションが前記第１パーティション制約情報に従うと決定すると、オーバーライドフラグの値をオーバーライド値に設定するオーバーライドフラグ設定ユニット（１３３０）と、
前記第１パーティション制約情報に従う前記ブロックのパーティションが有効化されないと決定すると、前記ブロックパーティションユニットは、前記パラメータセットの中の前記第２パーティション制約情報に従い前記ブロックをパーティションするよう構成され、前記オーバーライドフラグ設定ユニットは、オーバーライド有効化フラグの前記値を無効化値に設定するよう構成され、
前記オーバーライドフラグと前記オーバーライド有効化フラグを前記ビデオビットストリームに挿入するビットストリーム生成器（１３４０）と、
を含むエンコーダ。
プログラムコードを格納した非一時的コンピュータ可読媒体であって、前記プログラムコードは、コンピュータ装置により実行されると、前記コンピュータ装置に請求項１～８のいずれかに記載の方法を実行させる、非一時的コンピュータ可読媒体。