JP7422901B2

JP7422901B2 - ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム

Info

Publication number: JP7422901B2
Application number: JP2022570739A
Authority: JP
Inventors: シュウ，シャオユウ; チェン，イウェン; マ，ツンチュアン; ジュ，ホンジェン; チェン，ウェイ; ワン，シャンリン; ユ，ビン
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-05-20
Filing date: 2021-05-20
Publication date: 2024-01-26
Anticipated expiration: 2041-05-20
Also published as: KR20230004941A; KR20240042167A; US20230110988A1; CN115516864A; EP4154541A1; CN117278750A; WO2021236988A1; JP2024023200A; EP4154541A4; MX2022014528A; JP2024059937A; JP2023522482A

Description

関連出願の相互参照
本出願は、２０２０年５月２０日に出願された米国仮出願番号第６３／０２７，７１８号、タイトル「ビデオ符号化におけるシンタックス要素のシグナリング」に対する優先権を主張し、その全体が参照により援用される。

本開示は、ビデオコーディングおよび圧縮に関し、特に、限定はされないが、ビデオ符号化の際のシンタックス要素のシグナリングの方法および装置に関する。

様々なビデオ符号化技法がビデオデータを圧縮するために使用されることがある。ビデオ符号化は、１つまたは複数のビデオ符号化規格に従って実施される。例えば、ビデオ符号化規格としては、汎用ビデオ符号化（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ：ＶＶＣ）、ジョイント探索テストモデル（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎｔｅｓｔＭｏｄｅｌ：ＪＥＭ）、高性能ビデオ符号化（Ｈ．２６５／Ｈｉｇｈ－ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ：ＨＥＶＣ）、高度ビデオ符号化（Ｈ．２６４／ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ：ＡＶＣ）、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）符号化などが挙げられる。ビデオ符号化は、一般に、ビデオ画像またはシーケンスに存在する冗長性を活用する予測方法（例えば、インター予測、イントラ予測など）を利用する。ビデオ符号化技法の重要な目的は、ビデオ品質の低下を回避するかまたは最小化するのと共に、より低いビットレートを使用する形式にビデオデータを圧縮することである。

本開示は、ビデオコーディングの際のシンタックス要素のシグナリングに関する技法の例を提供する。

本開示の第１の態様によれば、ビデオコーディングのための方法が提供される。この方法は、復号器がピクチャパラメータセット（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ：ＰＰＳ）に対応するピクチャが２以上のネットワーク抽象化層（ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ：ＮＡＬ）ユニットを含んでいるかどうか、および、２以上のＮＡＬユニットが同じＮＡＬユニットタイプを有しているかどうかを特定する、ＰＰＳ内の第１のシンタックス要素を受信することを含む。さらに、復号器は、ピクチャヘッダ（ＰｉｃｔｕｒｅＨｅａｄｅｒ：ＰＨ）に対応するピクチャがイントラランダムアクセスポイント（ＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ：ＩＲＡＰ）ピクチャまたは段階的イントラリフレッシュ（ＧｒａｄｕａｌＩｎｔｒａＲｅｆｒｅｓｈｉｎｇ：ＧＤＲ）ピクチャであるかどうかを特定する、ＰＨ内の第２のシンタックス要素を受信する。さらに、復号器は、１である第２のシンタックス要素の値に基づいて、第１のシンタックス要素の値を判定し、または、第１のシンタックス要素の値に基づいて第２のシンタックス要素の値を判定する。

本開示の第２の態様によれば、ビデオコーディングのための方法を提供する。この方法は、復号器がシンタックス要素を受信し、かつシンタックス要素の値に基づいて復号化プロセスを実施することを含む。さらに、シンタックス要素は、ピクチャのネットワーク抽象化層（ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ：ＮＡＬ）ユニットが同じＮＡＬユニットタイプを有しているかどうかを特定し、ピクチャが、階的復号化リフレッシュ（ＧＤＲ）ピクチャ、または、イントラランダムアクセスポイント（ＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ：ＩＲＡＰ）ピクチャであるとき、シンタックス要素の前記値は０である。

本開示の第３の態様によれば、ビデオコーディングのための装置が提供される。この装置は、１つまたは複数のプロセッサ、および該１つまたは複数のプロセッサによって実行可能な命令を記憶するように構成されたメモリを備える。１つまたは複数のプロセッサは、命令が実行されると、本開示の第１の態様に従う任意の方法を実施するように構成される。

本開示の第４の態様によれば、ビデオコーディングのための装置が提供される。この装置は、１つまたは複数のプロセッサ、および該１つまたは複数のプロセッサによって実行可能な命令を記憶するように構成されたメモリを備える。１つまたは複数のプロセッサは、命令が実行されると、本開示の第２の態様に従う任意の方法を実施するように構成される。

本開示の第５の態様によれば、１つまたは複数のコンピュータプロセッサによって実行されると、該１つまたは複数のコンピュータプロセッサに本開示の第１の態様に従う任意の方法を実施させるコンピュータ実行可能命令を記憶するビデオコーディングのための非一時的コンピュータ可読記憶媒体が提供される。

本開示の第６の態様によれば、１つまたは複数のコンピュータプロセッサによって実行されると、該１つまたは複数のコンピュータプロセッサに本開示の第２の態様に従う任意の方法を実施させるコンピュータ実行可能命令を記憶するビデオコーディングのための非一時的コンピュータ可読記憶媒体が提供される。

本開示の第７の態様によれば、プロセッサによって実行されると、本開示の第１の態様の方法を実施する命令を有する、コンピュータ可読記憶媒体に記憶されたプログラムが提供される。

本開示の第８の態様によれば、プロセッサによって実行されると、本開示の第２の態様の方法を実施する命令を有する、コンピュータ可読記憶媒体に記憶されたプログラムが提供される。

本開示の例のより具体的な説明は、添付図面に示されている特定の例を参照することによって行われる。これらの図面は、いくつかの例のみを描いており、したがって、範囲を限定するものではないと見なされるものであり、各例について、添付の図面を使用することによって、さらに具体的かつ詳細に説明および解説する。

図１は、本開示のいくつかの実装形態に従った例示的ビデオ符号器を示すブロック図である。

図２は、本開示のいくつかの実装形態に従った例示的ビデオ復号器を示すブロック図である。

図３は、本開示のいくつかの実装形態に従った複数の符号化ツリーユニット（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ：ＣＴＵ）に分割されたピクチャの例を示す図である。

図４Ａは、本開示のいくつかの実装形態に従ったマルチタイプツリー分割モデルを示す略図である。図４Ｂは、本開示のいくつかの実装形態に従ったマルチタイプツリー分割モデルを示す略図である。図４Ｃは、本開示のいくつかの実装形態に従ったマルチタイプツリー分割モデルを示す略図である。図４Ｄは、本開示のいくつかの実装形態に従ったマルチタイプツリー分割モデルを示す略図である。

図５は、本開示のいくつかの実装形態に従った複数のインターピクチャ間のイントラ符号化領域を示す図である。

図６は、本開示のいくつかの実装形態に従ったビデオ符号化のための例示的装置を示すブロック図である。

図７は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフロー図である。

図８は、本開示のいくつかの実装形態に従った映像符号化の例示的プロセスを示すフロー図である。

図９は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフロー図である。

図１０は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフロー図である。

次に、添付図面にその例が示されている具体的な実装形態を詳細に参照する。以下、発明を実施するための形態では、本明細書で提示する主題に対する理解を助けるために、非限定的で具体的な多数の詳細について記載する。しかし、様々な変形例を使用できることは、当業者には明らかである。例えば、本明細書で提示する主題は、デジタルビデオ能力を備える多くの種類の電子デバイスに実装され得ることが当業者には明らかである。

本明細書全体における「一実施形態」、「ある実施形態」、「例」、「いくつかの実施形態」、「いくつかの例」、または類似の用語に対する言及は、記載されている特定の特性、構造、または特徴が、少なくとも１つの実施形態または例に含まれることを意味する。さらに、１つまたはいくつかの実施形態に関して記載される特性、構造、要素、または特徴もまた、別段の明示的な定めがない限り、他の実施形態に適用可能である。

本開示の全体を通して、用語「第１」、「第２」、「第３」などは、全て、例えば、デバイス、コンポーネント、組成物、ステップなどの関連する要素に対する参照のために命名されるものであり、別段の明示的な定めがない限り、空間的または時間的順序を意味するものではない。例えば、「第１のデバイス」および「第２のデバイス」は、別々に形成された２つのデバイス、または同じデバイスの２つのパーツ、コンポーネントもしくは動作可能状態を意味する場合があり、また任意に命名する場合がある。

用語「モジュール」、「サブモジュール」、「電気回路」、「サブ電気回路」、「回路」、「サブ回路」、「ユニット」、または「サブユニット」は、１つまたは複数のプロセッサによって実行され得る符号または命令を記憶するメモリ（共有、専用、またはグループ）を含む場合がある。モジュールは、記憶される符号または命令を含む、または含まない１つまたは複数の電気回路を含む場合がある。モジュールまたは電気回路は、直接または間接的に接続された１つまたは複数のコンポーネントを含む場合がある。これらのコンポーネントは、互いに物理的に接続されていてもいなくてもよく、または互いに近くに配置されていてもいなくてもよい。

本明細書で使用される場合、用語「～する場合」または「～するとき」は、文脈によっては「の際に」または「に応じて」と理解される場合がある。これらの用語は、請求項に記載されていたとしても、関連する制限または特性が条件付きまたは任意であることを意味しない場合がある。例えば、方法は、i)条件Ｘが存在するとき、または存在する場合、機能または動作Ｘ’が実施され、ii)条件Ｙが存在するとき、または存在する場合、機能または動作Ｙ’が実施される、というステップを含む場合がある。方法は、機能または動作Ｘ’を実施する能力および機能または動作Ｙ’を実施する能力の両方を用いて実行される場合がある。したがって、機能Ｘ’およびＹ’の両方が、異なる時間で、方法の複数の実行に基づいて実施されてよい。

ユニットまたはモジュールは、純粋にソフトウェアによって、純粋にハードウェアによって、またはハードウェアとソフトウェアとの組み合わせによって実装されてよい。純粋なソフトウェア実装形態では、例えば、ユニットまたはモジュールは、特定の機能を実施するために互いに直接または間接的に接続された、機能上関連する符号化ブロックまたはソフトウェアコンポーネントを含む場合がある。

図１は、ブロックベース処理を用いる多数のビデオ符号化規格と共に使用される場合がある、例示的なブロックベースハイブリッドビデオ符号器１００を示すブロック図である。符号器１００では、ビデオフレームは、処理のために複数のビデオブロックに分割される。所与のビデオブロックごとに、インター予測アプローチまたはイントラ予測アプローチのいずれかに基づいて、予測が行われる。インター予測では、１つまたは複数の予測子が、過去に再構築されたフレームからの画素に基づいて、動き推定および動き補償を通して形成される。イントラ予測では、予測子が、現在のフレーム内の再構築画素に基づいて形成される。モード判定を通して、最良の予測子が、現在のブロックを予測するために選択される場合がある。

現在のビデオブロックとその予測子との差を表す予測残差は、変換回路１０２に送信される。次に、変換係数が、エントロピー低減のために変換回路１０２から量子化回路１０４に送信される。次に、量子化係数が、圧縮されたビデオビットストリームを生成するためにエントロピー符号化回路１０６に供給される。図１に示すように、ビデオブロック分割情報、動きベクトル、参照ピクチャインデックス、およびイントラ予測モードなどの、インター予測回路および／またはイントラ予測回路１１２からの予測関連情報１１０もまた、エントロピー符号化回路１０６を通して供給され、圧縮されたビデオビットストリーム１１４に保存される。

符号器１００では、復号器関連回路もまた、予測目的で画素を再構築するために必要とされる。まず、予測残差が逆量子化回路１１６および逆変換回路１１８を通して再構築される。この再構築予測残差は、現在のビデオブロックに関するフィルタ無し再構築画素を生成するために、ブロック予測子１２０と組み合わされる。

イントラ予測（「空間予測」とも称される）は、同じビデオピクチャおよび／またはスライス内の既に符号化されている近傍のブロックのサンプル（参照サンプルと称される）からの画素を使用して、現在のビデオブロックを予測する。空間予測により、ビデオ信号に固有の空間的冗長性が低減される。

インター予測（「時間予測」とも称される）は、既に符号化されているビデオピクチャからの再構成画素を使用して、現在のビデオブロックを予測する。時間予測により、ビデオ信号に固有の時間的冗長性が低減される。所与の符号化ユニット（ＣｏｄｉｎｇＵｎｉｔ：ＣＵ）または符号化ブロックに関する時間予測信号は、通常、現在のＣＵとその時間的参照との間の動きの量および方向を示す１つまたは複数の動きベクトル（ＭｏｔｉｏｎＶｅｃｔｏｒ：ＭＶ）によってシグナリングされる。さらに、複数の参照ピクチャがサポートされている場合、１つの参照ピクチャインデックスが追加的に送信され、これは、時間予測信号が参照ピクチャ記憶装置内のどの参照ピクチャから来るかを識別するために使用される。

空間予測および／または時間予測が実施された後、符号器１００内のイントラ／インターモード判定回路１２１は、例えば、レート－歪み最適化法に基づいて、最良の予測モードを選択する。次に、ブロック予測子１２０は、現在のビデオブロックから減算され、かつ得られた予測残差は、変換回路１０２および量子化回路１０４を使用して非相関化される。得られた量子化された残差係数は、逆量子化回路１１６によって逆量子化され、逆変換回路１１８によって逆変換されて、再構築残差が形成され、次に、この再構築残差が予測ブロックに再度追加されて、ＣＵの再構築信号が形成される。さらに、デブロッキングフィルタ、サンプル適応オフセット（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ：ＳＡＯ）、および／または適応ループ内フィルタ（Ａｄａｐｔｉｖｅｉｎ－ＬｏｏｐＦｉｌｔｅｒ：ＡＬＦ）などのループ内フィルタ１１５が、再構築ＣＵに適用されてよく、その後、再構築ＣＵは、ピクチャバッファ１１７の参照ピクチャ記憶装置に入れられ、さらなるビデオブロックを符号化するために使用される。出力ビデオビットストリーム１１４を形成するために、符号化モード（インターまたはイントラ）予測モード情報、動き情報、および量子化された残差係数は、全て、エントロピー符号化ユニット１０６に送信され、さらに圧縮およびパックされてビットストリームが形成される。

例えば、デブロッキングフィルタは、ＡＶＣ、ＨＥＶＣだけではなく、ＶＶＣの最新バージョンで利用可能である。ＨＥＶＣでは、ＳＡＯ（サンプル適応オフセット）と呼ばれる追加のループ内フィルタが、符号化効率をさらに向上させるために規定されている。ＶＶＣ規格の最新バージョンでは、ＡＬＦ（適応ループフィルタ）と呼ばれるさらに別のループ内フィルタが、積極的に調査されており、最終的な規格に含まれる可能性が高い。

これらのループ内フィルタ操作は任意のものである。これらの操作の実施は、符号化効率およびビジュアル品質の改善を助ける。これらはまた、計算量を節約するために、符号器１００によって決定される場合にオフにされることもある。

イントラ予測は、通常、フィルタ無し再構築画素に基づき、一方、インター予測は、これらのフィルタオプションが、符号器１００によってオンにされる場合フィルタ有り再構築画素に基づくという点に留意すべきである。

図２は、多数のビデオ符号化規格と共に使用される場合がある、例示的なブロックベースビデオ復号器２００を示すブロック図である。復号器２００は、図１の符号器１００内に常駐する再構築関連セクションに類似している。復号器２００では、入力ビデオビットストリーム２０１が、まず、エントロピー復号化２０２を通して復号化されて、量子化係数レベルおよび予測関連情報が導出される。次に、量子化係数レベルは、逆量子化２０４かつ逆変換２０６を通して処理され、再構築予測残差が得られる。イントラ／インターモード選択器２１２に実装されているブロック予測子メカニズムは、復号化された予測情報に基づいて、イントラ予測２０８または動き補償２１０のいずれかを実施するように構成される。フィルタ無し再構築画素のセットは、加算器２１４を使用して、逆変換２０６からの再構築予測残差およびブロック予測子メカニズムによって生成された予測出力を加算することによって得られる。

再構築ブロックは、さらに、ループ内フィルタ２０９に通され、その後、参照ピクチャ記憶装置として機能するピクチャバッファ２１３に記憶される。ピクチャバッファ２１３内の再構築ビデオは、表示デバイスを駆動するために送信され、さらに、将来のビデオブロックを予測するために使用される。ループ内フィルタ２０９がオンになっている状況では、これらの再構築画素に対してフィルタリング操作が実施されて、最終の再構築ビデオ出力２２２が導出される。

汎用ビデオ符号化（ＶＶＣ）
２０１８年４月１０日から２０日にかけて、米国のサンディエゴで行われた第１０回ＪＶＥＴ会議において、ＪＶＥＴは、その参照ソフトウェア実装形態としてのＶＶＣおよびＶＶＣテストモード１（ＶＶｃＴｅｓｔＭｏｄｅｌ１：ＶＴＭ１）の第１ドラフトを規定した。ＶＶＣの初期の新しい符号化機能として、ネストされたマルチタイプツリーを伴うクワッドツリーを含むことが決定された。マルチタイプツリーは、２分割および３分割の両方を含む符号化ブロック分割構造である。それ以降、符号化プロセスおよび復号化プロセスの両方が実装された参照ソフトウェアＶＴＭが開発され、その後のＪＶＥＴ会議で更新された。

ＶＶＣでは、入力ビデオのピクチャは、ＣＴＵと呼ばれるブロックに分割される。ＣＴＵは、ネストされたマルチタイプツリー構造を伴うクワッドツリーを使用して、同じ予測モード（例えば、イントラまたはインター）を共有する画素の領域を画定するＣＵと共に、ＣＵに分割される。用語「ユニット」は、輝度および彩度などの全ての成分をカバーする画像の領域を規定する場合がある。用語「ブロック」は、特定の成分（例えば、輝度）をカバーする領域を規定ために使用される場合があるが、異なる成分（例えば、輝度対彩度）のブロックは、４：２：０などの彩度サンプリングフォーマットを考慮する場合は空間的位置が異なる場合がある。

ピクチャのＣＴＵへの分割
図３は、本開示のいくつかの実装形態に従った複数のＣＴＵ３０２に分割されたピクチャ３００の例を示す図である。

ＶＶＣでは、ピクチャは、一連のＣＴＵに分割される。ＣＴＵ概念は、ＨＥＶＣの概念と同じである。３つのサンプルアレイを有するピクチャの場合、ＣＴＵは、彩度サンプルの対応する２つのブロックと共に輝度サンプルのN×Nブロックで構成される。

ＣＴＵ内の輝度ブロックの最大許容サイズは、128×128と規定されている（ただし、輝度変換ブロックの最大サイズは64×64である）。

ツリー構造を使用するＣＴＵの分割
ＨＥＶＣでは、ＣＴＵは、符号化ツリーと呼ばれる４要素ツリー構造を使用してＣＵに分割されて、種々のローカル特性に適応される。インターピクチャ（時間）またはイントラピクチャ（空間）予測を使用してピクチャエリアを符号化するかどうかの判定は、リーフＣＵレベルで行われる。各リーフＣＵは、ＰＵ分割タイプに従って、さらに、１つ、２つ、または４つのＰＵに分割され得る。１つのＰＵ内では、同じ予測プロセスが行われ、関連する情報が、ＰＵ単位で復号器に伝送される。ＰＵ分割タイプに基づく予測プロセスの実行による残差ブロックの取得後、リーフＣＵは、ＣＵの符号化ツリーと類似の別の４要素ツリー構造に従って、変換ユニット（ＴｒａｎｓｆｏｒｍＵｎｉｔ:ＴＵ）に分割することができる。ＨＥＶＣ構造の主要な特性の１つは、ＣＵ、ＰＵ、およびＴＵを含む複数の分割概念を有することである。

ＶＶＣでは、２分割および３分割セグメンテーション構造を用いるネストされたマルチタイプツリーを伴うクワッドツリーは、複数の分割ユニットタイプの概念に取って代わり、すなわち、最大変換長に対してサイズが大きすぎるＣＵにとって必要な場合を除いて、ＣＵ、ＰＵおよびＴＵ概念の分断を取り除き、ＣＵ分割形状のさらなる柔軟性をサポートする。符号化ツリー構造では、ＣＵは、正方形または長方形のいずれかの形状を有する場合がある。ＣＴＵは、まず、４要素ツリー（別名、クワッドツリー）構造によって分割される。次に、４要素ツリーリーフノードが、マルチタイプツリー構造によってさらに分割され得る。

図４Ａから４Ｄは、本開示のいくつかの実装形態に従ったマルチタイプツリー分割モデルを示す略図である。図４Ａから４Ｄに示すように、マルチタイプツリー構造には、４つの分割タイプ、縦２分割４０２（SPLIT_BT_VER）、横２分割４０４（SPLIT_BT_HOR）、縦３分割４０６（SPLIT_TT_VER）、および横３分割４０８（SPLIT_TT_HOR）がある。マルチタイプツリーリーフノードは、ＣＵと呼ばれ、ＣＵが最大変換長に対して大きすぎない限り、このセグメンテーションが、いずれのさらなる分割も伴うことなく予測および変換処理に使用される。これは、ほとんどの場合、ネストされたマルチタイプツリー符号化ブロック構造を伴うクワッドツリー内で、ＣＵ、ＰＵ、およびＴＵが同じブロックサイズを有することを意味する。最大サポート変換長がＣＵの色成分の幅または高さよりも小さい場合、例外が発生する。

ＶＶＣにおけるシンタックス
ＶＶＣでは、シンタックスシグナリングのビットストリームの最初の層は、ビットストリームがＮＡＬユニットのセットに分割されているＮＡＬである。いくつかのＮＡＬユニットは、ＳＰＳおよびＰＰＳなどの共通制御パラメータを復号器にシグナリングする。その他のものは、ビデオデータを含んでいる。ビデオ符号化層（ＶｉｄｅｏＣｏｄｉｎｇＬａｙｅｒ:ＶＣＬ）ＮＡＬユニットは、符号化されたビデオのスライスを含んでいる。符号化されたピクチャは、アクセスユニットと呼ばれ、かつ１つまたは複数のスライスとして符号化される場合がある。

符号化されたビデオシーケンスは、即時復号器リフレッシュ（ＩｎｓｔａｎｔａｎｅｏｕｓＤｅｃｏｄｅｒＲｅｆｒｅｓｈ:ＩＤＲ）ピクチャで始まる。それに続く全てのビデオピクチャは、スライスとして符号化される。新しいＩＤＲピクチャは、以前のビデオセグメントが終わり、新しいビデオセグメントが始まることをシグナリングする。各ＮＡＬユニットは、１バイトのヘッダで始まり、未加工のバイトシーケンスペイロード（ＲａｗＢｙｔｅＳｅｑｕｅｎｃｅＰａｙｌｏａｄ:ＲＢＳＰ）が続く。ＲＢＳＰは符号化されたスライスを含んでいる。スライスは、２値符号化され、それにより、それらは、長さが整数のバイトであることを保証するために０ビットでパディングされる場合がある。スライスは、スライスヘッダおよびスライスデータから構成される。スライスデータは、一連のＣＵとして規定される。

ピクチャヘッダ概念は、第１６回ＪＶＥＴ会議で採用され、ピクチャの最初のＶＣＬＮＡＬユニットとしてピクチャごとに1回伝送されるようになった。以前、スライスヘッダにあったいくつかのシンタックス要素をこのピクチャヘッダにグループ化することも提案された。ピクチャごとに１回伝送されることだけが機能上必要なシンタックス要素は、特定の画像に対して複数回スライスで伝送されるのではなく、ピクチャヘッダに移動することができた。

ＶＶＣ規格では、シンタックステーブルが、全ての許容されるビットストリームのシンタックスの上位セットを規定している。シンタックスに対する別の制約が、他の節で直接または間接的に特定される場合がある。下記の表１および表２は、ＶＶＣにおけるスライスヘッダおよびＰＨのシンタックステーブルである。いくつかのシンタックスの意味も、シンタックステーブルの後に例示している。

選択されたシンタックス要素の意味
ph_temporal_mvp_enabled_flagは、ピクチャヘッダ（ＰＨ）に関連付けられたスライスのインター予測に時間的動きベクトル予測子が使用できるかどうかを特定する。ph_temporal_mvp_enabled_flagが０に等しい場合、ＰＨに関連付けられたスライスのシンタックス要素は、スライスの復号化の際に時間的動きベクトル予測子が使用されないように制約されるものとする。その他の場合（ph_temporal_mvp_enabled_flagが１に等しい場合）、時間的動きベクトル予測子は、ＰＨに関連付けられたスライスの復号化の際に使用されてよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は、０に等しいと推測される。復号化されたピクチャバッファ（ＤｅｃｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ：ＤＰＢ）内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

サブブロックベースのマージＭＶＰ候補の最大値であるMaxNumSubblockMergeCandは、以下のように導出される。

１に等しいslice_collocated_from_l0_flagは、時間的動きベクトル予測に使用される同一位置ピクチャが参照ピクチャリスト０から導出されることを特定する。０に等しいslice_collocated_from_l0_flagは、時間的動きベクトル予測に使用される同一位置ピクチャが参照ピクチャリスト１から導出されることを特定する。slice_typeがＢまたはＰに等しく、ph_temporal_mvp_enabled_flagが１に等しく、かつslice_collocated_from_l0_flagが存在しない場合、下記が適用される。
- rpl_info_in_ph_flagが１に等しい場合、slice_collocated_from_l0_flagは、ph_collocated_from_l0_flagに等しいと推測される。
- その他の場合（rpl_info_in_ph_flagが０に等しく、slice_typeがＰに等しい場合）、slice_collocated_from_l0_flagの値は、１に等しいと推測される。

slice_collocated_ref_idxは、時間的動きベクトル予測に使用される同一位置ピクチャの参照インデックスを特定する。

slice_typeがＰに等しい場合、またはslice_typeがＢに等しく、かつslice_collocated_from_l0_flagが１に等しい場合、slice_collocated_ref_idxは、参照ピクチャリスト０のエントリを意味し、またslice_collocated_ref_idxの値は、０以上からNumRefIdxActive[0]-1以下の範囲とする。

slice_typeがＢに等しく、かつslice_collocated_from_l0_flagが０に等しい場合、slice_collocated_ref_idxは、参照ピクチャリスト１のエントリを意味し、またslice_collocated_ref_idxの値は、０以上からNumRefIdxActive[1]-1以下の範囲とする。
slice_collocated_ref_idxが存在しない場合、下記が適用される。
-rpl_info_in_ph_flagが１に等しい場合、slice_collocated_ref_idxの値は、ph_collocated_ref_idxに等しいと推測される。
-その他の場合（rpl_info_in_ph_flagが０に等しい場合）、slice_collocated_ref_idxの値は、０に等しいと推測される。

slice_collocated_ref_idxによって参照されるピクチャは符号化されたピクチャの全てのスライスに対して同じであることが、ビットストリーム適合の要件である。

slice_collocated_ref_idxによって参照される参照ピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値は、それぞれ、現在のピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値と等しく、かつRprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]は０に等しいことが、ビットストリーム適合の要件である。

RprConstraintsActive[i][j]の値は、以下に要約するようにＶＶＣ規格のセクション8.3.2で導出されることに留意されたい。

参照ピクチャリスト構築のための復号化プロセス
本プロセスは、非ＩＤＲピクチャのスライスごとに復号化プロセスの最初に起動される。参照ピクチャは、参照インデックスを通してアドレス指定される。参照インデックスは、参照ピクチャリストへのインデックスである。Ｉスライスを復号化する場合、スライスデータの復号化に参照ピクチャリストを使用しない。Ｐスライスを復号化する場合、スライスデータの復号化に参照ピクチャリスト０（すなわち、RefPicList[0]）のみが使用される。Ｂスライスを復号化する場合、スライスデータの復号化に参照ピクチャリスト０および参照ピクチャリスト１（すなわち、RefPicList[1]）の両方が使用される。

非ＩＤＲピクチャのスライスごとの復号化プロセスの開始時に、参照ピクチャリストRefPicList[0]およびRefPicList[1]が導出される。参照ピクチャリストは、8.3.3小節で規定されているように、またはスライスデータの復号化の際に、参照ピクチャの作成に使用される。

ピクチャの最初のスライスではない非ＩＤＲピクチャのＩスライスの場合、RefPicList[0]およびRefPicList[1]が、ビットストリーム適合性チェックのために導出される場合があるが、それらの導出は、現在のピクチャ、または復号順で現在のピクチャに続くピクチャの復号化に必要ではない。ピクチャの最初のスライスではないＰスライスの場合、RefPicList[1]が、ビットストリーム適合性チェックのために導出される場合があるが、その導出は、現在のピクチャ、または復号順で現在のピクチャに続くピクチャの復号化に必要ではない。

参照ピクチャリストRefPicList[0]およびRefPicList[1]、参照ピクチャスケーリング比RefPicScale[i][j][0]およびRefPicScale[i][j][1]、ならびに参照ピクチャスケールフラグRprConstraintsActive[0][j]およびRprConstraintsActive[1][j]は、下記のように導出される。

scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offsetおよびscaling_win_bottom_offsetは、スケーリング比計算向けのピクチャサイズに適用されるオフセットを特定する。存在しない場合、scaling_win_left_offset、scaling_win_right_offset、scaling_win_top_offset、およびscaling_win_bottom_offsetの値は、それぞれ、pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset、およびpps_conf_win_bottom_offsetに等しいと推測される。

SubWidthC*(scaling_win_left_offset+scaling_win_right_offset)の値は、pic_width_in_luma_samples未満であり、SubHeightC*(scaling_win_top_offset+scaling_win_bottom_offset)の値は、pic_height_in_luma_samples未満である。

変数PicOutputWidthLおよびPicOutputHeightLは下記のように導出される。
このＰＰＳを参照する現在のピクチャの参照ピクチャのrefPicOutputWidthLおよびrefPicOutputHeightLが、それぞれ、PicOutputWidthLおよびPicOutputHeightLであるとする。以下の条件の全てを満たすことが、ビットストリーム適合の要件である。
-PicOutputWidthL*2は、refPicWidthInLumaSamples以上である。
-PicOutputHeightL*2は、refPicHeightInLumaSamples以上である。
-PicOutputWidthLは、refPicWidthInLumaSamples*8以下である。
-PicOutputHeightLは、refPicHeightInLumaSamples*8以下である。
-PicOutputWidthL*pic_width_max_in_luma_samplesは、refPicOutputWidthL*(pic_width_in_luma_samples-Max(8,MinCbSizeY))以上である。
-PicOutputHeightL*pic_height_max_in_luma_samplesは、refPicOutputHeightL*(pic_height_in_luma_samples-Max(8,MinCbSizeY))以上である。

ＮＡＬユニットシンタックス
ＨＥＶＣと同様に、ＶＶＣ規格では、ＮＡＬユニットの基本情報を特定するために、各ＮＡＬユニットの初めに、全長２バイトの１つのＮＡＬユニットヘッダテーブルが、シグナリングされる。表３は、現在のＮＡＬユニットヘッダに存在するシンタックス要素を示している。

表３では、最初のビットがforbidden_zero_bitであり、これは、伝送中になんらかのエラーが発生したかどうかを特定するために使用される。０はＮＡＬユニットが正常であることを意味し、１はシンタックス違反があることを意味する。したがって、正常なビットストリームの場合、その対応する値は、０に等しいものとする。次のビットは、nuh_reserved_zero_bitであり、これは、将来の使用のために確保され、０に等しい。それに続く６ビットは、ＮＡＬユニットが属している層を識別するシンタックスnuh_layer_idの値を特定するために使用される。nuh_layer_idの値は、０以上から５５以下の範囲である。nuh_layer_idの他の値は、将来の使用のために確保される。その後、シンタックス要素nal_unit_typeが、ＮＡＬユニットタイプ、すなわち、表４に規定されているような、ＮＡＬユニットに含まれるＲＢＳＰデータ構造のタイプを特定するために使用される。

段階的イントラリフレッシュ
低遅延およびエラー回復は、実用的なビデオ伝送システムで考慮されるべき２つの重要な因子である。ＩＲＡＰピクチャを定期的に挿入するイントラリフレッシュは、時間的ピクチャ間のエラー伝播を制限するために、かつビットストリームのエラー回復能力を高めるために一般的に使用される。しかし、インター符号化の符号化効率がイントラ符号化よりもはるかに優れているため、固定伝送速度でネットワークを通して送られる場合に、比較的大きなサイズのイントラピクチャは、場合により遅延問題の原因になることがある。このことは、望ましくないネットワーク輻輳およびパケット損失につながる可能性がある。このような問題を解決するために、図５に示すように、複数のインターピクチャ間でイントラ符号化領域を分散する段階的イントラリフレッシュ（ＧＤＲ）がＶＶＣ規格に採用された。図５に示すように、２つの領域が画定される。部分２は、クリーン領域を表している。クリーン領域は、現在のＧＤＲ期間にリフレッシュされた画素に相当し、かつダーティ領域は、リフレッシュされていない1つの領域に相当する。部分１は、イントラ符号化が適用された符号化ブロックを表している。ＧＤＲの原理は、同じＧＤＲ期間内の時間的参照ピクチャのリフレッシュされた領域のみから派生する画素を使用してクリーン領域の画素が再構築されることを保証することである。現在のＶＶＣでは、ピクチャヘッダ内でシグナリングされる３つのＧＤＲ関連シンタックス要素ph_gdr_or_irap_pic_flag、ph_gdr_pic_flagおよびph_recovery_poc_cntが存在する。表５は、ピクチャヘッダ内の対応するＧＤＲシグナリングおよび関連付けられた意味を示している。

１に等しいph_gdr_or_irap_pic_flagは、現在のピクチャがＧＤＲまたはＩＲＡＰピクチャであることを特定する。０に等しいph_gdr_or_irap_pic_flagは、現在のピクチャがＧＤＲピクチャではなく、かつＩＲＡＰピクチャである場合もあるし、そうでない場合もあることを特定する。

１に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャがＧＤＲピクチャであることを特定する。０に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャがＧＤＲピクチャでないことを特定する。存在しない場合、ph_gdr_pic_flagの値は、０に等しいと推測される。sps_gdr_enabled_flagが０に等しい場合、ph_gdr_pic_flagの値は、０に等しいものとする。

ph_gdr_or_irap_pic_flagが１に等しく、ph_gdr_pic_flagが０に等しい場合、ＰＨに関連付けられたピクチャはＩＲＡＰピクチャである。

ph_recovery_poc_cntは、出力順での復号化されたピクチャの回復ポイントを特定する。現在のピクチャがＧＤＲピクチャである場合、変数のrecoveryPointPocValは、以下のように導出される。

現在のピクチャがＧＤＲピクチャであり、CLVSにおける復号順で現在のＧＤＲピクチャに続き、recoveryPointPocValに等しいPicOrderCntValを有するピクチャpicAが存在する場合、ピクチャpicAは回復ポイントピクチャとして参照される。その他の場合、CLVSにおけるrecoveryPointPocValより大きいPicOrderCntValを有する出力順での最初のピクチャが、回復ポイントピクチャとして参照される。回復ポイントピクチャは、復号順で現在のＧＤＲピクチャの前にあってはならない。現在のＧＤＲピクチャに関連付けられ、かつrecoveryPointPocValより小さいPicOrderCntValを有するピクチャは、ＧＤＲピクチャの回復ピクチャとして参照される。ph_recovery_poc_cntの値は、０以上からMaxPicOrderCntLsb-1以下の範囲である。

sps_gdr_enabled_flagが１に等しく、現在のピクチャのPicOrderCntValが関連付けられたＧＤＲピクチャのrecoveryPointPocVal以上である場合、出力順での現在の復号化されたピクチャおよび次の復号化されたピクチャは、復号順で関連付けられＧＤＲピクチャより前の、先のＩＲＡＰピクチャ（存在すれば）から復号化プロセスを開始することによって作成された対応するピクチャに正確に一致する。

１つのピクチャ内で混在するＮＡＬタイプ
１つのピクチャ内のスライスのＮＡＬタイプが同一である必要があるＨＥＶＣ規格とは異なり、１つのピクチャ内でＩＲＡＰおよび非ＩＲＡＰのＮＡＬユニットタイプの混在が可能である。このような機能の目的は、サブピクチャを用いる領域ベースランダムアクセスにある。例えば、３６０度ビデオストリーミングの場合、ある３６０度ビデオの一部の領域は、他の領域よりもより多くのユーザに視聴される可能性がある。符号化効率と平均ビューポイント切替遅延とのトレードオフを改善するために、より頻繁にＩＲＡＰピクチャを使用して、他の領域よりもより視聴されている領域を符号化することができる。このような理由のために、1つのフラグpps_mixed_nalu_types_in_pic_flagがＰＰＳに導入される。フラグが１に等しい場合、そのフラグはＰＰＳを参照する各ピクチャが２つ以上のＮＡＬユニットを有し、かつＮＡＬユニットが同じ値のnal_unit_typeを有していないことを示す。その他の場合（フラグが０に等しい場合）、ＰＰＳを参照する各ピクチャが１つまたは複数のＮＡＬユニットを有し、かつＰＰＳを参照する各ピクチャのＮＡＬユニットが同じ値のnal_unit_typeを有する。加えて、フラグpps_mixed_nalu_types_in_pic_flagが１に等しい場合、任意の特定のピクチャに対して、一部のＮＡＬユニットが１つの特定のＩＲＡＰＮＡＬユニットタイプを有し、他のものが１つの特定の非ＩＲＡＰＮＡＬユニットタイプを有するという１つのビットストリーム適合制約がさらに適用される。換言すれば、下記のように規定されているように、任意の特定のピクチャのＮＡＬユニットは、２つ以上のＩＲＡＰＮＡＬユニットタイプを有することができず、かつ２つ以上の非ＩＲＡＰＮＡＬユニットタイプを有することができない。

任意の特定のピクチャのＶＣＬＮＡＬユニットに対して、下記が適用される。
-pps_mixed_nalu_types_in_pic_flagが０に等しい場合、nal_unit_typeの値はピクチャの全てのＶＣＬＮＡＬユニットに対して同じであり、かつピクチャまたはＰＵは、ピクチャまたはＰＵの符号化されたスライスＮＡＬユニットと同じＮＡＬユニットタイプを有すると見なされる。
-その他の場合（pps_mixed_nalu_types_in_pic_flagが１に等しい場合）、下記が適用される。
-ピクチャは、少なくとも２つのサブピクチャを有するものとする。
-ピクチャのＶＣＬＮＡＬユニットは、２つ以上の異なるnal_unit_type値を有する。
-GDR_NUTに等しいnal_unit_typeを有するピクチャのＶＣＬＮＡＬユニットはない。
-ピクチャの少なくとも１つのサブピクチャのＶＣＬＮＡＬユニットが、IDR_W_RADL、IDR_N_LP、またはCRA_NUTに等しいnal_unit_typeの特定の値を有する場合、ピクチャ内の他のサブピクチャのＶＣＬＮＡＬユニットは全て、TRAIL_NUTに等しいnal_unit_typeを有するものとする。

現在のＶＶＣでは、mvd_l1_zero_flagは、いずれの条件的制約を伴うことなくピクチャヘッダ（ＰＨ）内でシグナリングされる。しかし、フラグmvd_l1_zero_flagによって制御される特性は、スライスが双方向予測スライス（Ｂスライス）である場合にのみ適用可能である。したがって、フラグシグナリングは、ピクチャヘッダに関連付けられたスライスがＢスライスでない場合、冗長となる。

同様に、別の例では、シーケンスパラメータセット（ＳＰＳ）内でシグナリングされる対応する有効フラグ（sps_bdof_pic_present_flag、sps_dmvr_pic_present_flag）のみが真のときのみ、それぞれph_disable_bdof_flagおよびph_disable_dmvr_flagがＰＨ内でシグナリングされる。しかし、図６に示すように、フラグph_disable_bdof_flagおよびph_disable_dmvr_flagによって制御される特性は、スライスが双方向予測スライス（Ｂスライス）である場合にのみ適用可能である。したがって、これらの２つのフラグのシグナリングは、ピクチャヘッダに関連付けられたスライスがＢスライスでない場合、冗長または無益である。

もう１つの例として、表７に示すように、シンタックス要素ph_collocated_from_l0_flagで、同一位置ピクチャがリスト０またはリスト１からのものであることを示すことが考えられる。別の例としては、図８に示すように、双方向予測の予測のための重み付け表に関するシンタックス要素であるシンタックスpred_weight_table()が考えられる。

問題は、シンタックスph_temporal_mvp_enabled_flagに関連する。現在のＶＶＣでは、ＴＭＶＰ（ＴｅｍｐｏｒａｌｍｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）導出のために選択される同一位置ピクチャの解像度が現在のピクチャの解像度と同じであるため、下記に示すようなph_temporal_mvp_enabled_flagの値をチェックするビットストリーム適合制約が存在する。
ＤＰＢ内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

しかし、現在のＶＶＣでは、同一位置ピクチャの解像度がＴＭＶＰの有効化に影響を及ぼすだけではなく、スケーリング比計算向けのピクチャサイズに適用されるオフセットもまたＴＭＶＰの有効化に影響を及ぼす。しかし、現在のＶＶＣでは、ph_temporal_mvp_enabled_flagのビットストリーム適合においてオフセットは考慮されていない。

さらに、slice_collocated_ref_idxによって参照されるピクチャが符号化されたピクチャの全てのスライスに対して同じであることが、ビットストリーム適合の要件である。しかし、符号化されたピクチャが複数のスライスを有し、これらの全てのスライスの間で共通の参照ピクチャが存在しない場合、このビットストリーム適合性が満たされる可能性はない。さらに、このようなケースでは、ph_temporal_mvp_enabled_flagは０に制約される必要がある。

現在のＶＶＣ規格によれば、ＩＲＡＰピクチャは、関連付けられたＮＡＬユニットの全てが、ＩＲＡＰＮＡＬタイプに属する同じnal_unit_typeを有する１つのピクチャとして参照される。具体的には、以下の記述がＶＶＣ規格におけるＩＲＡＰピクチャを定義するために使用される。
イントラランダムアクセスポイント（ＩＲＡＰ）ピクチャ：全てのＶＣＬＮＡＬユニットがIDR_W_RADL以上からCRA_NUT以下の範囲の同じ値のnal_unit_typeを有する符号化されたピクチャである。

ＩＲＡＰピクチャは、その復号化プロセスでインター予測を使用せず、CRAピクチャまたはＩＤＲピクチャである場合がある。復号順でのビットストリームの最初のピクチャは、ＩＲＡＰまたはＧＤＲピクチャである必要がある。参照が必要な場合に必要なパラメータセットが利用可能であるならば、CLVSにおける復号順でのＩＲＡＰピクチャおよびそれに続く全ての非RASLピクチャは、復号順でＩＲＡＰピクチャより前にあるいずれのピクチャの復号化プロセスも実施することなく、正確に復号化することが可能である。

ＩＲＡＰピクチャに対するpps_mixed_nalu_types_in_pic_flagの値は、０に等しい。ピクチャに対するpps_mixed_nalu_types_in_pic_flagが０に等しく、かつピクチャの任意のスライスがIDR_W_RADL以上からCRA_NUT以下の範囲のnal_unit_typeを有する場合、ピクチャの全ての他のスライスは、同じ値のnal_unit_typeを有し、かつピクチャはＩＲＡＰピクチャであると認識される。

上記のことから分かるように、各ＩＲＡＰピクチャに対して、そのピクチャが参照する対応するＰＰＳは、そのpps_mixed_nalu_types_in_pic_flagが０に等しくなければならない。同様に、現在のＶＶＣ規格では、ＧＤＲピクチャは、ピクチャに関連付けられた全てのＮＡＬのnal_unit_typeが下記のように規定されたGDR_NUTに等しい場合の１つのピクチャとして参照される。
段階的復号化リフレッシュ（ＧＤＲ）ピクチャ：各ＶＣＬＮＡＬユニットがGDR_NUTに等しいnal_unit_typeを有するピクチャである。

１つのＧＤＲピクチャのＮＡＬユニットの全てが同じＮＡＬタイプを有する必要があることから、ＧＤＲピクチャが参照する対応するＰＰＳ内のフラグpps_mixed_nalu_types_in_pic_flagは１に等しくすることができない。

その一方で、２つのフラグ、すなわちph_gdr_or_irap_pic_flagおよびph_gdr_pic_flagが、１つのピクチャが１つのＩＲＡＰピクチャまたは１つのＧＤＲピクチャであるかどうかを示すためにピクチャヘッダ内でシグナリングされる。フラグph_gdr_or_irap_pic_flagが１に等しく、フラグph_gdr_pic_flagが０に等しい場合、現在のピクチャは、１つのＩＲＡＰピクチャである。フラグph_gdr_or_irap_pic_flagが１に等しく、フラグph_gdr_pic_flagが１に等しい場合、現在のピクチャは、１つのＧＤＲピクチャである。現在のＶＶＣ規格によれば、ＰＰＳ内のフラグpps_mixed_nalu_types_in_pic_flagの値を考慮するこなく、これらの２つのフラグは、１または0としてシグナリングされることが許容されている。しかし、前述したように、ピクチャのＮＡＬユニットが同じnal_unit_typeを有する場合、つまり、必然的に対応するpps_mixed_nalu_types_in_pic_flagは０である場合にのみ１つのピクチャが１つのＩＲＡＰピクチャまたは１つのＧＤＲピクチャとすることができる。したがって、ピクチャヘッダ内の既存のＩＲＡＰ／ＧＤＲシグナリングは、ph_gdr_or_irap_pic_flagおよびph_gdr_pic_flagのいずれかまたは両方が１に等しく（つまり、現在のピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャのいずれかであることを示し）、かつ対応するpps_mixed_naly_types_in_pic_flagが１に等しい（つまり、現在のピクチャで複数のＮＡＬタイプが存在する）場合に問題がある。

フラグmvd_l1_zero_flag、ph_disable_bdof_flag、およびph_disable_dmvr_flagによって制御される特性が、スライスが双方向予測スライス（Ｂスライス）である場合にのみ利用可能であるため、本開示の方法に従って、関連付けられたスライスがＢスライスである場合にのみこれらのフラグをシグナリングすることを提案する。参照ピクチャリストがＰＨ内でシグナリングされる場合（例えば、rpl_info_in_ph_flag=1）、それは、符号化されたピクチャの全てのスライスがＰＨ内でシグナリングされた同じ参照ピクチャを使用することを意味することを留意されたい。したがって、参照ピクチャリストがＰＨ内でシグナリングされ、かつ現在のピクチャが双方向予測でないことをシグナリングされた参照ピクチャリストが示す場合、フラグmvd_l1_zero_flag、ph_disable_bdof_flagおよびph_disable_dmvr_flagはシグナリングされる必要はない。第１の実施形態では、ピクチャヘッダ内のシンタックスの一部に関して送信される不適切な値に起因する冗長なシグナリングまたは未定義の復号化動作を防ぐために、ピクチャヘッダ（ＰＨ）内で送信されるこれらのシンタックスにいくつかの条件が追加される。実施形態に基づく一部の例について、下記に例示するが、ここで、変数num_ref_entries[i][RplsIdx[i]]は、リストｉ内の参照ピクチャの数を表している。

あるいは、これらの条件をよりコンパクトな形態で記述しても同じ結果が得られる。双方向予測スライス（Ｂスライス）または双方向予測ピクチャは、少なくとも１つのリスト１参照ピクチャを必ず有しているため、現在のスライス／ピクチャがリスト１の参照ピクチャを有しているかどうかだけをチェックすればよい。代替的な条件チェックの例を下記に示す。

mvd_l1_zero_flagの意味もまた、それがシグナリングされないケースに対処するために修正される。

１に等しいmvd_l1_zero_flagは、mvd_coding(x0,y0,1)シンタックス構造が構文解析されず、かつMvdL1[x0][y0][compIdx]およびMvdCpL1[x0][y0][cpIdx][compIdx]が、compIdx=0..1およびcpIdx=0..2に関して０に等しく設定されていることを示す。０に等しいmvd_l1_zero_flagは、mvd_coding(x0,y0,1)シンタックス構造が構文解析されることを示す。存在しない場合、mvd_l1_zero_flagの値は、０に等しいと推測される。

シンタックス要素ph_disable_dmvr_flagの条件付きシグナリングのいくつかの例を下記に示す。

同様に、代替的な条件チェックの例も下記に示す。

ph_disable_dmvr_flagの意味もまた、それがシグナリングされないケースに対処するために修正される。

１に等しいph_disable_dmvr_flagは、復号器動きベクトル洗練に基づくインター双予測がＰＨに関連付けられたスライスでは無効であることを特定する。０に等しいph_disable_dmvr_flagは、復号器動きベクトル洗練に基づくインター双予測がＰＨに関連付けられたスライスで有効である場合もあるし、有効でない場合もあることを特定する。

ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は０に等しいと推測される。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが１に等しい場合、ph_disable_dmvr_flagの値は１に等しいと推測される。
-その他の場合（sps_dmvr_enabled_flagが０に等しい場合）、ph_disable_dmvr_flagの値は１に等しいと推測される。

ph_disable_dmvr_flagの値が存在しない場合のその値の代替的な導出方法を下記に示す。
-全ての条件がph_disable_dmvr_flagの値の導出のために考慮され、その値が明確にシグナリングされるか、または暗黙に導出される場合：sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は０に等しいと推測される。
-sps_dmvr_enabled_flagが０に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は１に等しいと推測される。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが０に等しい場合、ph_disable_dmvr_flagの値はＸに等しいと推測される（Ｘは明確にシグナリングされる）。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_dmvr_flagの値はＸに等しいと推測される（Ｘは明確にシグナリングされる）。
-その他の場合（sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_dmvr_flagの値は１に等しいと推測される。

シンタックス要素ph_disable_dmvr_flagは、第３および第４の条件下で明確にシグナリングされるため、ph_disable_dmvr_flagが存在しない場合、ph_disable_dmvr_flagの導出からこれらが省かれる場合がある。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は０に等しいと推測される。
-sps_dmvr_enabled_flagが０に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は１に等しいと推測される。
-その他の場合（sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_dmvr_flagの値は１に等しいと推測される。

条件は下記のように簡略に書き換えることができる。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_enabled_flagが１に等しく、かつsps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は０に等しいと推測される。
-その他の場合（sps_dmvr_enabled_flagが０に等しいか、またはsps_dmvr_pic_present_flagが１に等しい場合）、ph_disable_dmvr_flagの値は１に等しいと推測される。

ph_disable_dmvr_flagの値が存在しない場合のその値の別の代替的な導出方法を下記に示す。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_pic_present_flagが０に等しい場合）、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-sps_dmvr_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが０に等しい場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-sps_dmvr_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが１に等しく、さらにnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-その他の場合（sps_dmvr_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが１に等しく、さらにnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_dmvr_flagの値は１に等しいと推測される。

シンタックス要素ph_disable_dmvr_flagは、第２および第３の条件下で明確にシグナリングされるため、ph_disable_dmvr_flagが存在しない場合、ph_disable_dmvr_flagの導出からこれらが省かれる場合がある。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_pic_present_flagが０に等しい場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-その他の場合、ph_disable_dmvr_flagの値は、１に等しいと推測される。

シンタックス要素ph_disable_bdof_flagの条件付きシグナリングのいくつかの例を下記に示す。

同様に、代替的な条件チェックの例も下記に示す。

ph_disable_bdof_flagの意味もまた、それがシグナリングされないケースに対処するために修正される。

１に等しいph_disable_bdof_flagは、双方向指向性光学的フローインター予測に基づくインター双予測がＰＨに関連付けられたスライスでは無効であることを特定する。０に等しいph_disable_bdof_flagは、双方向指向性光学的フローインター予測に基づくインター双予測がＰＨに関連付けられたスライスで有効である場合もあるし、有効でない場合もあることを特定する。

ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は０に等しいと推測される。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しい場合、ph_disable_dmvr_flagの値は１に等しいと推測される。
-その他の場合（sps_bdof_enabled_flagが０に等しい場合）、ph_disable_bdof_flagの値は１に等しいと推測される。

ph_disable_bdof_flagの値が存在しない場合のその値の代替的な導出方法を下記に示す。
全ての条件がph_disable_bdof_flagの値の導出のために考慮され、その値が明確にシグナリングされるか、または暗黙に導出される場合：
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は０に等しいと推測される。
-sps_bdof_enabled_flagが０に等しく、かつsps_bdof_pic_present_flagが０に等しい場合、ph_disable_bdof_flagの値は１に等しいと推測される。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが０に等しい場合、ph_disable_bdof_flagの値はＸに等しいと推測される（Ｘは明確にシグナリングされる）。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_bdof_flagの値はＸに等しいと推測される（Ｘは明確にシグナリングされる）。
-その他の場合（sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_bdof_flagの値は１に等しいと推測される。

シンタックス要素ph_disable_bdof_flagは、第３および第４の条件下で明確にシグナリングされるため、ph_disable_bdof_flagが存在しない場合、ph_disable_bdof_flagの導出からこれらが省かれる場合がある。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は０に等しいと推測される。
-sps_bdof_enabled_flagが０に等しく、かつsps_bdof_pic_present_flagが０に等しい場合、ph_disable_bdof_flagの値は１に等しいと推測される。
-その他の場合（sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しく、さらにrpl_info_in_ph_flagが１に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_bdof_flagの値は１に等しいと推測される。

条件は下記のように簡略に書き換えることができる。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は０に等しいと推測される。
-その他の場合（sps_bdof_enabled_flagが０に等しいか、またはsps_bdof_pic_present_flagが1に等しい場合）、ph_disable_bdof_flagの値は１に等しいと推測される。

ph_disable_bdof_flagの値が存在しない場合のその値の別の代替的な導出方法を下記に示す。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_pic_present_flagが０に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-sps_bdof_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが０に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-sps_bdof_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが１に等しく、さらにnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-その他の場合（sps_bdof_pic_present_flagが１に等しく、かつrpl_info_in_ph_flagが１に等しく、さらにnum_ref_entries[1][RplsIdx[1]]==0の場合）、ph_disable_bdof_flagの値は１に等しいと推測される。

シンタックス要素ph_disable_bdof_flagは、第２および第３の条件下で明確にシグナリングされるため、ph_disable_bdof_flagが存在しない場合、ph_disable_bdof_flagの導出からこれらが省かれる場合がある。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_pic_present_flagが０に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-その他の場合、ph_disable_bdof_flagの値は、１に等しいと推測される。

さらに、シンタックス要素ph_collocated_from_l0_flagおよびweight_table()に対するシグナリング条件は、２つのタイプのシンタックス要素が関連付けられたスライスがＢスライスである場合にのみ利用可能であるため、修正される。修正されるシンタックス要素シグナリングの例を下記の表９から１１に示す。

ph_collocated_from_l0_flagの意味もまた、それがシグナリングされないケースに対処するために修正される。

１に等しいph_collocated_from_l0_flagは、時間的動きベクトル予測に使用される同一位置ピクチャが参照ピクチャリスト０から導出されることを特定する。０に等しいph_collocated_from_l0_flagは、時間的動きベクトル予測に使用される同一位置ピクチャが参照ピクチャリスト１から導出されることを特定する。

ph_collocated_from_l0_flagが存在しない場合、下記が適用される。
-num_ref_entries[0][RplsIdx[0]]が１より大きい場合、ph_collocated_from_l0_flagの値は１であると推測される。
-その他の場合（num_ref_entries[1][RplsIdx[1]]が１より大きい場合）、ph_collocated_from_l0_flagの値は０であると推測される。

同様に、代替的な条件チェックの例も下記に示す。

pred_weight_table()内のシンタックス要素の意味もまた、それらがシグナリングされないケースに対処するために修正される。

pps_weighted_bipred_flagおよびwp_info_in_ph_flagの両方が１に等しい場合、num_l1_weightsは参照ピクチャリスト１内のエントリに対してシグナリングされた重みの数を特定する。num_l1_weightsの値は、０以上からMin(15,num_ref_entries[1][RplsIdx[1]])以下の範囲とする。

変数NumWeightsL1は以下のように導出される。

pred_weight_table()内のシンタックス要素の意味における、num_l1_weightsの値が存在しない場合のその値の代替的な導出方法を下記に示す。
pps_weighted_bipred_flagおよびwp_info_in_ph_flagの両方が１に等しい場合、num_l1_weightsは参照ピクチャリスト１内のエントリに対してシグナリングされた重みの数を特定する。num_l1_weightsの値は、０以上からMin(15,num_ref_entries[1][RplsIdx[1]])以下の範囲とする。存在しない場合、num_l1_weightsの値は、０に等しいと推測される。

変数NumWeightsL1は以下のように導出される。

pred_weight_table()内のシンタックス要素の意味における、num_l1_weightsの値が存在しない場合のその値の別の代替的な導出方法を下記に示す。

概念的に、シグナリング冗長ビットを避けるためにＢスライスでのみ利用可能な任意のシンタックス要素に関するリスト０およびリスト１の両方の参照ピクチャリストからの参照ピクチャを現在のピクチャが有するかどうかをチェックするためにシグナリング条件を追加することを提案する。チェック条件は、参照ピクチャリスト（例えば、リスト０／リスト１の参照ピクチャリスト）の両方のサイズをチェックするといった前述の方法に限定されず、またチェック条件は、現在のピクチャがリスト０およびリスト１の両方の参照ピクチャリストからの参照ピクチャを有するかどうかを示す任意の他の方法であってもよい。例えば、フラグは、現在のピクチャがリスト０およびリスト１の両方の参照ピクチャを有するかどうかを示すためにシグナリングされてよい。

ＰＨ内でシンタックス要素はシグナリングされないが、参照ピクチャリスト情報がシグナリングされる場合、シンタックス要素の値は、現在のピクチャがリスト０およびリスト１の両方の参照ピクチャを有するか、またはリスト０かリスト１かどちらかのみの参照ピクチャを有するかの情報を使用して導出される。一例では、ph_collocated_from_l0_flagがシグナリングされない場合、その値は、現在のピクチャが有する唯一の参照ピクチャであると推測される。別の例では、sps_bdof_enabled_flagが１に等しく、かつsps_bdof_pic_present_flagが１に等しいが、ph_disable_bdof_flagがシグナリングされない場合、それは、ph_disable_bdof_flagに対する提案したシグナリング条件に従ってnum_ref_entries[0][RplsIdx[0]]が０に等しいか、またはnum_ref_entries[1][RplsIdx[1]]が０に等しいかを暗に示している。したがって、この条件下でph_disable_bdof_flagはシグナリングされず、１であると推測される。現在のＶＶＣでは、同一位置ピクチャの解像度がＴＭＶＰの有効化に影響を及ぼす可能性があるだけではなく、スケーリング比計算向けのピクチャサイズのために適用されるオフセットもまたＴＭＶＰの有効化に影響を及ぼす可能性がある。しかし、現在のＶＶＣでは、ph_temporal_mvp_enabled_flagのビットストリーム適合においてオフセットは考慮されていない。第２の実施形態では、下記に示すように、ph_temporal_mvp_enabled_flagの値が、スケーリング比計算向けのピクチャサイズに適用されるオフセットに依存することを要求する現在のＶＶＣにビットストリーム適合制約を加えることを提案する。

ＤＰＢ内で、現在のピクチャと同じ空間分解能およびスケーリング比計算向けのピクチャサイズに適用される同じオフセットを有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

上記の文章は、次のように別の方法で書くこともできる。

ＤＰＢ内で、０に等しい関連変数値RprConstraintsActive[i][j]を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

現在のＶＶＣでは、slice_collocated_ref_idxによって参照されるピクチャが符号化されたピクチャの全てのスライスに対して同じであることが、ビットストリーム適合の要件である。しかし、符号化されたピクチャが複数のスライスを有し、これらの全てのスライスの間で共通の参照ピクチャが存在しない場合、このビットストリーム適合性が満たされる可能性はない。本開示の第３の実施形態では、ph_temporal_mvp_enabled_flagに対するビットストリーム適合の要件は、現在のピクチャの全てのスライスの間で共通の参照ピクチャが存在するかどうかを考慮に入れるように修正される。実施形態に基づいて、ＶＶＣ規格に対するいくつかの例示的変形形態を以下に例示する。

ph_temporal_mvp_enabled_flagは、ＰＨに関連付けられたスライスのインター予測に時間的動きベクトル予測子が使用できるかどうかを特定する。ph_temporal_mvp_enabled_flagが０に等しい場合、ＰＨに関連付けられたスライスのシンタックス要素は、スライスの復号化の際に時間的動きベクトル予測子が使用されないように制約されるものとする。その他の場合（ph_temporal_mvp_enabled_flagが１に等しい場合）、時間的動きベクトル予測子は、ＰＨに関連付けられたスライスの復号化の際に使用されてよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は、０に等しいと推測される。ＤＰＢ内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。ＰＨに関連付けられたスライスの全てで共通の参照ピクチャが存在しない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

ph_temporal_mvp_enabled_flagは、ＰＨに関連付けられたスライスのインター予測に時間的動きベクトル予測子が使用できるかどうかを特定する。ph_temporal_mvp_enabled_flagが０に等しい場合、ＰＨに関連付けられたスライスのシンタックス要素は、スライスの復号化の際に時間的動きベクトル予測子が使用されないように制約されるものとする。その他の場合（ph_temporal_mvp_enabled_flagが１に等しい場合）、時間的動きベクトル予測子は、ＰＨに関連付けられたスライスの復号化の際に使用されてよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は、０に等しいと推測される。ＤＰＢ内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。ＰＨに関連付けられたインタースライスの全てで共通の参照ピクチャが存在しない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

ph_temporal_mvp_enabled_flagは、ＰＨに関連付けられたスライスのインター予測に時間的動きベクトル予測子が使用できるかどうかを特定する。ph_temporal_mvp_enabled_flagが０に等しい場合、ＰＨに関連付けられたスライスのシンタックス要素は、スライスの復号化の際に時間的動きベクトル予測子が使用されないように制約されるものとする。その他の場合（ph_temporal_mvp_enabled_flagが１に等しい場合）、時間的動きベクトル予測子は、ＰＨに関連付けられたスライスの復号化の際に使用されてよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は、０に等しいと推測される。ＤＰＢ内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。ＰＨに関連付けられた非イントラスライスの全てで共通の参照ピクチャが存在しない場合、ph_temporal_mvp_enabled_flagの値は０に等しいものとする。

一例では、slice_collocated_ref_idxに対するビットストリーム適合は、下記のように簡略化される。
slice_collocated_ref_idxによって参照される参照ピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値は、それぞれ、現在のピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値と等しく、かつRprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]は０に等しいことが、ビットストリーム適合の要件である。

pps_mixed_nalu_types_in_pic_flagの値が１に等しい場合、ＰＰＳを参照する各ピクチャが２つ以上のＮＡＬユニットを有するが、それらのＮＡＬユニットが同じnal_unit_typeを有していない。他方では、現在のピクチャヘッダシグナリングでは、関連付けられたＰＰＳ内のフラグpps_mixed_nalu_types_in_pic_flagの値が１に等しい場合であっても、ph_gdr_or_irap_pic_flagおよびph_gdr_pic_flagの値は１としてシグナリングされることが許容されている。１つのＩＲＡＰピクチャまたは１つのＧＤＲピクチャのＮＡＬユニットが同じnal_unit_typeを有していなければならないため、このようなシグナリングシナリオは、許容されるべきではない。

一例では、ＰＰＳ内のpps_mixed_nalu_types_in_pic_flagの値に対して、ピクチャヘッダ内のフラグph_gdr_or_irap_pic_flagの存在を条件付けることを提案する。具体的には、pps_mixed_nalu_types_in_pic_flagの値が０に等しい場合にのみph_gdr_or_irap_pic_flagがシグナリングされる。その他の場合、フラグpps_mixed_nalu_types_in_pic_flagが１に等しい場合、フラグph_gdr_or_irap_pic_flagはシグナリングされず、かつ０であると推測される。表１２は、提案した修正を適用したものを例示している。

一例では、フラグpps_mixed_nalu_types_in_pic_flagが１に等しい場合、シグナリングされたフラグph_gdr_or_irap_pic_flagの対応する値が１に等しくなることを要求するために、１つのビットストリーム適合制約を提案する。具体的には、提案するビットストリーム適合制約は、以下のように特定することができる。

１に等しいph_gdr_or_irap_pic_flagは、現在のピクチャがＧＤＲまたはＩＲＡＰピクチャであることを特定する。０に等しいph_gdr_or_irap_pic_flagは、現在のピクチャがＧＤＲピクチャではなく、かつＩＲＡＰピクチャである場合もあるし、そうでない場合もあることを特定する。pps_mixed_nalu_types_in_pic_flagの値が１に等しい場合、ph_gdr_or_irap_pic_flagの値は０に等しいものとする。

一例では、pps_mixed_nalu_types_in_pic_flagのシグナリングを、ＰＰＳレベルから、ピクチャレベル、スライスレベル、またはその他の符号化レベルに移行することを提案する。例えば、フラグがピクチャヘッダに移行されると仮定すると、フラグの名前はph_mixed_nalu_type_in_pic_flagに変更される可能性がある。追加として、ph_gdr_or_irap_pic_flagのシグナリングを条件付けるためにフラグを使用することを提案する。具体的には、フラグph_mixed_nalu_type_in_pic_flagが０に等しい場合にのみph_gdr_or_rap_pic_flagがシグナリングされる。その他の場合、フラグph_mixed_nalu_type_in_pic_flagが１の場合、フラグph_gdr_or_rap_pic_flagsはシグナリングされず、かつ０であると推測される。別の例では、ph_mixed_nalu_type_in_pic_flagの値が１に等しい場合、ph_gdr_or_irap_pic_flagの値は０に等しくなければならないといったビットストリーム適合制約を加えることを提案する。さらに別の例では、ph_mixed_nalu_type_in_pic_flagの存在を条件付けるためにph_gdr_or_irap_pic_flagを使用することを提案する。具体的には、ph_gdr_or_rap_pic_flagの値が０に等しい場合にのみフラグph_mixed_nalu_type_in_pic_flagがシグナリングされる。その他の場合、ph_gdr_or_rap_pic_flagの値が１に等しい場合、フラグph_mixed_nalu_type_in_pic_flagはシグナリングされず、かつ常に０であると推測される。

一例では、ＩＲＡＰピクチャでもＧＤＲピクチャでもないピクチャのみにpps_mixed_nalu_types_in_pic_flagの値を適用することを提案する。具体的には、このような方法によって、pps_mixed_nalu_types_in_pic_flagの意味を以下のように修正する必要がある。
１に等しいpps_mixed_nalu_types_in_pic_flagは、ＰＰＳを参照するＩＲＡＰピクチャでもＧＤＲピクチャでもない各ピクチャが２つ以上のＶＣＬＮＡＬユニットを有し、かつＶＣＬＮＡＬユニットは同じ値のnal_unit_typeを有していないことを特定する。０に等しいpps_mixed_nalu_types_in_pic_flagは、ＰＰＳを参照するＩＲＡＰピクチャでもＧＤＲピクチャでもない各ピクチャが１つまたは複数のＶＣＬＮＡＬユニットを有し、かつＰＰＳを参照する各ピクチャのＶＣＬＮＡＬユニットが同じ値のnal_unit_typeを有していることを特定する。

他方では、現在のＶＶＣ規格では、１つのＧＤＲピクチャのＮＡＬユニットの全てがGDR_NUTに等しい同じnal_unit_typeを有していなければならないことが要求される。pps_mixed_nal_types_in_pic_flagの対応する値が０に等しくなるようにＧＤＲピクチャの定義に以下のビットストリーム適合制約が適用される。

段階的復号化リフレッシュ（ＧＤＲ）ピクチャ：各ＶＣＬＮＡＬユニットがGDR_NUTに等しいnal_unit_typeを有するピクチャである。ＧＤＲピクチャに対するpps_mixed_nalu_types_in_pic_flagの値は０に等しい。ピクチャに対するpps_mixed_nalu_types_in_pic_flagが０に等しく、かつピクチャの任意のスライスがGDR_NUTであるnal_unit_typeを有する場合、ピクチャの全ての他のスライスは、同じ値のnal_unit_typeを有し、かつピクチャの最初のスライスの受信後にピクチャがＧＤＲピクチャであると認識される。

別の実施形態では、ＮＡＬユニットヘッダからＧＤＲＮＡＬユニットタイプを削除するの同時に、現在のピクチャがＧＤＲピクチャであるかどうかを示すシンタックス要素ph_gdr_or_irap_pic_flagおよびph_gdr_pic_flagのみを使用することを提案する。

pps_mixed_nalu_types_in_pic_flagの制約がＩＲＡＰピクチャおよびＧＤＲピクチャの両方に適用される上記の方法とは異なり、以下では、制約がＩＲＡＰピクチャに適用されるが、ＧＤＲピクチャには適用されない３つの方法を提案する。

一例では、ＰＰＳ内のpps_mixed_nalu_types_in_pic_flagの値に対して、ピクチャヘッダ内のフラグph_gdr_pic_flagの存在を条件付けることを提案する。具体的には、pps_mixed_nalu_types_in_pic_flagの値が０に等しい場合にのみフラグph_gdr_pic_flagがシグナリングされる。その他の場合、フラグpps_mixed_nalu_types_in_pic_flagが１に等しい場合、フラグph_gdr_pic_flagはシグナリングされず、かつ０であると推測され、すなわち、現在のピクチャは１つのＧＤＲピクチャにはなり得ない。対応するピクチャヘッダテーブル（表１３）は、提案したシグナリング条件が適用された後、以下のように修正される。

１に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャがＧＤＲピクチャであることを特定する。０に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャがＧＤＲピクチャでないことを特定する。存在しない場合、ph_gdr_pic_flagの値は、pps_mixed_nalu_types_in_pic_flagが0の場合は０に等しく、pps_mixed_nalu_types_in_pic_flagが１の場合はph_gdr_or_irap_pic_flagの値に等しいと推測される。sps_gdr_enabled_flagが０に等しい場合、ph_gdr_pic_flagの値は、０に等しいものとする。

一例では、ph_gdr_or_irap_pic_flagが１であり、かつpps_mixed_nalu_types_in_pic_flagが１である場合ph_gdr_pic_flagは１に等しくなければならないといった１つのビットストリーム適合制約を導入することを提案し、これは、以下のように特定される：
１に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャはＧＤＲピクチャであることを特定する。０に等しいph_gdr_pic_flagは、ＰＨに関連付けられたピクチャはＧＤＲピクチャではないことを特定する。存在しない場合、ph_gdr_pic_flagの値は、０に等しいと推測される。sps_gdr_enabled_flagが０に等しい場合、ph_gdr_pic_flagの値は、０に等しいものとする。ph_gdr_or_irap_pic_flagが１に等しく、かつpps_mixed_nalu_types_in_pic_flagが１に等しい場合、ph_gdr_pic_flagの値は１に等しくなければならない。ph_gdr_or_irap_pic_flagが１に等しく、ph_gdr_pic_flagが０に等しい場合、ＰＨに関連付けられたピクチャはＩＲＡＰピクチャである。

一例では、非ＩＲＡＰピクチャのみにフラグpps_mixed_nalu_types_in_pic_flagを適用することを提案する。具体的には、この方法では、pps_mixed_nalu_types_in_pic_flagの意味は以下のように修正される必要がある：
１に等しいpps_mixed_nalu_types_in_pic_flagは、ＰＰＳを参照する各非ＩＲＡＰピクチャが２つ以上のＶＣＬＮＡＬユニットを有し、かつＶＣＬＮＡＬユニットが同じ値のnal_unit_typeを有していないことを特定する。０に等しいpps_mixed_nalu_types_in_pic_flagは、ＰＰＳを参照する各非ＩＲＡＰピクチャが１つまたは複数のＶＣＬＮＡＬユニットを有し、かつＰＰＳを参照する各ピクチャのＶＣＬＮＡＬユニットが同じ値のnal_unit_typeを有することを特定する。

上記方法は、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ：ＤＳＰ）、デジタル信号処理デバイス（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＤｅｖｉｃｅ：ＤＳＰＤ）、プログラマブル論理デバイス（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ：ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ：ＦＰＧＡ）、コントローラ、マイクロコントローラ、マイクロプロセッサまたはその他の電子的コンポーネントを含む、１つまたは複数の回路を備えた装置を使用して実行することができる。装置は、前述の方法を実施するために、他のハードウェアまたはソフトウェアコンポーネントと組み合わせた回路を使用してもよい。上記に開示した各モジュール、サブモジュール、ユニット、またはサブユニットは、１つまたは複数の回路を使用して少なくとも部分的に実装されてよい。

図６は、本開示のいくつかの実装形態に従ったビデオ符号化のための例示的装置を示すブロック図である。装置６００は、モバイル電話、タブレットコンピュータ、デジタルブロードキャスト端末、タブレットデバイスまたは携帯情報端末などの端末であってよい。

図６に示すように、装置６００は、処理コンポーネント６０２、メモリ６０４、電源供給コンポーネント６０６、マルチメディアコンポーネント６０８、オーディオコンポーネント６１０、入力／出力（Input/Output：Ｉ／Ｏ）インターフェース６１２、センサコンポーネント６１４、および通信コンポーネント６１６のうち１つまたは複数を含んでいてもよい。

処理コンポーネント６０２は、通常、表示、電話、データ通信、カメラ操作および録音動作に関する操作など、装置６００の全体的な操作を制御する。処理コンポーネント６０２は、上記方法のステップの全てまたは一部を完了するための命令を実行する１つまたは複数のプロセッサ６２０を含んでいてもよい。さらに、処理コンポーネント６０２は、処理コンポーネント６０２と他のコンポーネントとの間の相互作用を促進する１つまたは複数のモジュールを含んでいてもよい。例えば、処理コンポーネント６０２は、マルチメディアコンポーネント６０８と処理コンポーネント６０２との間の相互作用を促進するマルチメディアモジュールを含んでいてもよい。

メモリ６０４は、装置６００の操作をサポートするために様々なタイプのデータを記憶するように構成される。そのようなデータの例としては、装置６００上で動作する任意のアプリケーションまたは方法に対する命令、連絡先データ、電話帳データ、メッセージ、写真、ビデオ、などが挙げられる。メモリ６０４は、任意のタイプの揮発性もしくは不揮発性記憶デバイスまたはこれらの組み合わせによって実装されてもよく、またはメモリ６０４は、静的ランダムアクセスメモリ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ：ＳＲＡＭ）、電気的消去可能プログラマブル読み取り専用メモリ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＥＥＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＥＰＲＯＭ）、プログラマブル読み取り専用メモリ（ＰｒｏｇｒａｍｍａｂｌｅＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＰＲＯＭ）、読み取り専用メモリ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＲＯＭ）、磁気メモリ、フラッシュメモリ、磁気ディスクまたはコンパクトディスクであってもよい。

電源供給コンポーネント６０６は、装置６００の異なるコンポーネントに電力を供給する。電源供給コンポーネント６０６は、電源供給管理システム、１つまたは複数の電源供給部、および装置６００の電力を生成、管理、および分配することに関する他のコンポーネントを含んでいてもよい。

マルチメディアコンポーネント６０８は、装置６００とユーザとの間の出力インターフェースを提供するスクリーンを含む。いくつかの例では、スクリーンは、液晶ディスプレイ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ：ＬＣＤ）およびタッチパネル（ＴｏｕｃｈＰａｎｅｌ：ＴＰ）を含む場合がある。スクリーンがタッチパネルを含む場合、スクリーンは、ユーザからの入力信号を受信するタッチスクリーンとして実装されてよい。タッチパネルは、タッチパネルへの接触、スライド、およびジェスチャを検出する１つまたは複数のタッチセンサを含んでいてもよい。タッチセンサは、接触またはスライド動作の境界のみを検出するだけではなく、接触またはスライド動作に関連する期間および圧力も検出することができる。いくつかの例では、マルチメディアコンポーネント６０８は、フロントカメラおよび／またはリアカメラを含んでいてもよい。装置６００が、撮影モードまたはビデオモードなどの動作モードの場合、フロントカメラおよび／またはリアカメラは、外部マルチメディアデータを受信することができる。

オーディオコンポーネント６１０は、音声信号を出力および／または入力するように構成される。例えば、オーディオコンポーネント６１０は、マイクロフォン（MICrophone：ＭＩＣ）を含む。装置６００が、コールモード、録音モード、および音声認識モードなどの動作モードの場合、マイクロフォンは、外部音声信号を受信するように構成される。受信された音声信号は、さらに、メモリ６０４に記憶されるか、または通信コンポーネント６１６を介して送信されてよい。いくつかの例では、オーディオコンポーネント６１０は、音声信号を出力するスピーカーをさらに含んでいてもよい。

Ｉ／Ｏインターフェース６１２は、処理コンポーネント６０２と周辺装置インターフェースモジュールとの間にインターフェースを形成する。上記の周辺装置インターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンとしては、ホームボタン、ボリュームボタン、スタートボタン、およびロックボタンを挙げることができるが、これらに限定されない。

センサコンポーネント６１４は、装置６００に関する異なる態様の状態評価を提供するための１つまたは複数のセンサを含む。例えば、センサコンポーネント６１４は、装置６００のオン／オフ状態、およびコンポーネントの相対位置を検出することができる。例えば、コンポーネントは、装置６００のディスプレイおよびキーパッドである。センサコンポーネント６１４はまた、装置６００または装置６００のコンポーネントの配置変化、装置６００に対するユーザの接触の存在もしくは不存在、装置６００の方向もしくは加速／減速、および装置６００の温度変化を検出することもできる。センサコンポーネント６１４は、なんらかの物理的接触を伴わずに近くの対象物の存在を検出するように構成された近接センサを含んでいてもよい。センサコンポーネント６１４は、イメージングアプリケーションで使用されるＣＭＯＳまたはＣＣＤ画像センサなどの光学的センサを含んでいてもよい。いくつかの例では、センサコンポーネント６１４は、加速センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ、または温度センサをさらに含んでいてもよい。

通信コンポーネント６１６は、装置６００と他のデバイスとの間の有線または無線通信を促進するように構成される。装置６００は、WiFi、4Gまたはこれらの組み合わせなどの通信規格に基づいて、無線ネットワークにアクセスすることができる。一例では、通信コンポーネント６１６は、ブロードキャスト信号またはブロードキャスト関連情報を、ブロードキャストチャネルを介して外部ブロードキャスト管理システムから受信する。一例では、通信コンポーネント６１６は、短距離通信を促進するための近距離無線通信（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ：ＮＦＣ）モジュールをさらに含んでいてもよい。例えば、ＮＦＣモジュールは、無線周波数識別情報（ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩＤｅｎｔｉｆｉｃａｔｉｏｎ：ＲＦＩＤ）技術、赤外線データ協会（ＩｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ：ＩｒＤＡ）技術、超広帯域（Ｕｌｔｒａ－ＷｉｄｅＢａｎｄ：ＵＷＢ）技術、ブルートゥース（登録商標）（ＢｌｕｅＴｏｏｔｈ：ＢＴ）技術、および他の技術に基づいて実装されてよい。

一例では、装置６００は、前述の方法を実施するために、特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、デジタル信号処理デバイス（ＤＳＰＤ）、ログラマブル論理デバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、コントローラ、マイクロコントローラ、マイクロプロセッサまたはその他の電子的要素のうち１つまたは複数によって実装されてよい。

非一時的コンピュータ可読記憶媒体は、例えば、ハードディスクドライブ（ＨａｒｄＤｉｓｋＤｒｉｖｅ：ＨＤＤ）、ソリッドステートドライブ（Ｓｏｌｉｄ－ＳｔａｔｅＤｒｉｖｅ：ＳＳＤ）、フラッシュメモリ、ハイブリッドドライブもしくはソリッドステートハイブリッドドライブ（Ｓｏｌｉｄ－ＳｔａｔｅＨｙｂｒｉｄＤｒｉｖｅ：ＳＳＨＤ）、読み取り専用メモリ（ＲＯＭ）、コンパクトディスク読み取り専用メモリ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＣＤ－ＲＯＭ）、磁気テープ、フロッピーディスクなどであってよい。

ステップ７０２で、プロセッサ６２０は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられたピクチャが１つまたは複数のＮＡＬユニットを含んでいるかどうか、および、１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有しているかどうかを特定するＰＰＳ内の第１のシンタックス要素を受信する。

ステップ７０４で、プロセッサ６２０は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられたピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであるかどうかを特定するＰＨ内の第２のシンタックス要素を受信する。

ステップ７０６で、プロセッサ６２０は、第２のシンタックス要素の値に基づいて第１のシンタックス要素の値を判定する。

いくつかの例では、プロセッサ６２０は、復号器に実装される。

いくつかの例では、１に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが２つ以上のＶＣＬＮＡＬユニットを含んでおり、かつ２つ以上のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが１つまたは複数のＶＣＬＮＡＬユニットを含んでおり、かつ１つまたは複数のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していることを特定する。

いくつかの例では、１に等しい第２のシンタックス要素は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられたピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであることを特定し、また０に等しい第２のシンタックス要素は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられたピクチャが、ＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定する。

いくつかの例では、プロセッサ６２０は、ピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであると判定するのに応じて、第１のシンタックス要素の値が０になるように要求するために、第１のシンタックス要素に対して制約を適用することによって、第２のシンタックス要素の値に基づいて第１のシンタックス要素の値を制約する。

図８は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフ
ロー図である。

ステップ８０２で、プロセッサ６２０は、ピクチャが１つまたは複数のＮＡＬユニットを含むかどうか、および、１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有するかどうかを特定する第１のシンタックス要素を受信する。

ステップ８０４で、プロセッサ６２０は、第１のシンタックス要素に基づいて、ピクチャに関連付けられたＰＨ内の第２のシンタックス要素を判定する。

いくつかの例では、第２のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであるかどうかを特定する。

いくつかの例では、第１のシンタックス要素はピクチャに関連付けられたＰＰＳ内でシグナリングされる。

いくつかの例では、第１のシンタックス要素は、前述したようにpps_mixed_nalu_types_in_pic_flagであってもよい。

いくつかの例では、プロセッサ６２０は、第１のシンタックス要素が０に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされると判定することと、第１のシンタックス要素が１に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされないと判定し、かつ第２のシンタックス要素が０であると推測することとによって、第１のシンタックス要素に基づいてピクチャに関連付けられたＰＨ内の第２のシンタックス要素を制約し、ここで、１に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが２つ以上のＮＡＬユニットを含んでおり、かつ２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが１つまたは複数のＮＡＬユニットを含んでおり、かつ１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有していることを特定する。さらに、１に等しい第２のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであることを特定し、また０に等しい第２のシンタックス要素は、ピクチャがＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定する。

いくつかの例では、プロセッサ６２０は、第１のシンタックス要素および第２のシンタックス要素の両方を受信することと、第１のシンタックス要素が１に等しいと判定するのに応じて、受信した第２のシンタックス要素の値が０になるように要求するために１つの制約を適用することとによって、第１のシンタックス要素に基づいてピクチャに関連付けられたＰＨ内の第２のシンタックス要素を制約する。１に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが２つ以上のＮＡＬユニットを含んでおり、かつ２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第２のシンタックス要素は、ピクチャがＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定する。第１のシンタックス要素は、前述したようにpps_mixed_nalu_types_in_pic_flagであってもよい。

いくつかの例では、第１のシンタックス要素は、ピクチャに関連付けられたＰＨ内でシグナリングされる。いくつかの例では、第１のシンタックス要素は、前述したようにph_mixed_nalu_types_in_pic_flagであってもよい。

いくつかの例では、プロセッサ６２０は、第１のシンタックス要素が０に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされると判定することと、第１のシンタックス要素が１に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされないと判定し、かつ第２のシンタックス要素は０であると推測することとによって、第１のシンタックス要素に基づいてＰＨ内の第２のシンタックス要素を制約する。１に等しい第１のシンタックス要素は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが、２つ以上のＮＡＬユニットを含んでおり、かつ２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第１のシンタックス要素は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが１つまたは複数のＮＡＬユニットを含んでおり、かつ１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有することを特定する。１に等しい第２のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであることを特定し、また０に等しい第２のシンタックス要素は、ピクチャがＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定する。いくつかの例では、第２のシンタックス要素は、前述したようにph_gdr_or_rap_pic_flagであってもよい。

いくつかの例では、プロセッサ６２０は、第１のシンタックス要素および第２のシンタックス要素の両方を受信することと、第１のシンタックス要素が１に等しいと判定するのに応じて、受信した第２のシンタックス要素の値が０になるように要求するために１つの制約を適用することとによって、第１のシンタックス要素に基づいてＰＨ内の第２のシンタックス要素を制約する。１に等しい第１のシンタックス要素は、ＰＨを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが２つ以上のＮＡＬユニットを含んでおり、かつ２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第２のシンタックス要素は、ピクチャがＧＤＲピクチャでもＩＲＡＰピクチャでもないことを特定する。

いくつかの例では、第２のシンタックス要素は、ピクチャがＧＤＲピクチャであるかどうかを特定し、また第１のシンタックス要素は、ピクチャに関連付けられたＰＰＳ内でシグナリングされる。さらに、プロセッサ６２０は、第１のシンタックス要素が０に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされると判定することと、第１のシンタックス要素が１に等しいと判定するのに応じて、第２のシンタックス要素がＰＨ内でシグナリングされないと判定し、かつ第２のシンタックス要素の値は０であると推測することとによって、第１のシンタックス要素に基づいてピクチャに関連付けられたＰＨ内でシグナリングされる第２のシンタックス要素を制約する。１に等しい第１のシンタックス要素は、PPSを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが、２つ以上のＮＡＬユニットを含んでおり、かつ２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第１のシンタックス要素は、PPSを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが１つまたは複数のＮＡＬユニットを含んでおり、かつ１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有することを特定する。０に等しい第２のシンタックス要素は、ＰＨに関連付けられたピクチャがＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定する。

いくつかの例では、プロセッサ６２０は、第２のシンタックス要素がＰＨ内でシグナリングされないと判定するのに応じて第１のシンタックス要素の値をさらに判定し、第１のシンタックス要素の値が０であると判定するのに応じて、第２のシンタックス要素の値は０であると推測し、かつ第１のシンタックス要素の値が１であると判定するのに応じて第２のシンタックス要素の値が、ＰＨ内でシグナリングされる第３のシンタックス要素の値であると推測する。第３のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであるかどうかを特定する。

いくつかの例では、プロセッサ６２０は、さらに、ＰＰＳ内でシグナリングされた有効フラグの値に従って、ＰＨ内の第２のシンタックス要素の値を判定する。有効フラグは、ピクチャがＧＤＲピクチャとして有効であるかどうかを特定するためのものである。さらに、プロセッサ６２０は、有効フラグの値が０に等しいと判定するのに応じて第２のシンタックス要素の値が０であると判定する。いくつかの例では、有効フラグは、前述したようにsps_gdr_enabled_flagであってもよい。

いくつかの例では、第２のシンタックス要素は、ピクチャがＧＤＲピクチャであるかどうかを特定し、また第１のシンタックス要素は、ピクチャに関連付けられたＰＰＳ内でシグナリングされる。さらに、プロセッサ６２０は、第１のシンタックス要素およびＰＨ内でシグナリングされた第３のシンタックス要素に基づいて、ピクチャに関連付けられたＰＨ内で第２のシンタックス要素がシグナリングされるように制約することによって、第１のシンタックス要素に基づいてピクチャに関連付けられたＰＨ内でシグナリングされる第２のシンタックス要素を制約する。第３のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであるかどうかを特定する。いくつかの例では、第３のシンタックス要素は、前述したようにph_gdr_or_irap_pic_flagであってよい。

いくつかの例では、プロセッサ６２０は、さらに、第３のシンタックス要素が１に等しく、かつ第１のシンタックス要素が０に等しいと判定するのに応じて、第２のシンタックス要素が１であると判定する。０に等しい第１のシンタックス要素は、ＰＰＳを参照するか、それに対応するか、またはそれに関連付けられた各ピクチャが１つまたは複数のＮＡＬユニットを含んでおり、かつ１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有していることを特定する。１に等しい第２のシンタックス要素は、ＰＨに関連付けられたピクチャがＧＤＲピクチャであることを特定し、また１に等しい第３のシンタックス要素は、ピクチャがＧＤＲピクチャまたはＩＲＡＰピクチャであることを特定する。

図９は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフ
ロー図である。ステップ９０２で、プロセッサ６２０はシンタックス要素を受信する。シンタックス要素は、前述したようにピクチャに関連付けられたＰＰＳ内でシグナリングされるpps_mixed_nalu_types_in_pic_flagであってよい。ステップ９０４で、プロセッサ６２０はシンタックス要素の値に基づいて復号化プロセスを実施する。

いくつかの例では、ピクチャに対するシンタックス要素が０に等しく、かつピクチャの任意のスライスがGDR_NUTに等しいnal_unit_typeを有する場合、ＧＤＲピクチャのシンタックス要素の値は０に等しく、ピクチャの他の全てのスライスは同じ値のnal_unit_typeを有し、かつピクチャの最初のスライスの受信後にピクチャがＧＤＲピクチャであると認識される。

いくつかの例では、プロセッサ６２０は、シンタックス要素の値が０に等しく、かつピクチャのスライスがGDR_NUTに等しいＮＡＬユニットタイプを含んでいると判定するのに応じて、ピクチャの他の全てのスライスが同じＮＡＬユニットタイプを含んでおり、かつピクチャの最初のスライスの受信後にピクチャがＧＤＲピクチャであると判定してもよい。

図１０は、本開示のいくつかの実装形態に従ったビデオ符号化の例示的プロセスを示すフロー図である。ステップ１００２で、プロセッサ６２０は、ＰＰＳに対応するピクチャが１つまたは複数のＮＡＬユニットを含んでいるかどうか、および、１つまたは複数のＮＡＬユニットが同じＮＡＬユニットタイプを有しているかどうかを特定するＰＰＳ内の第１のシンタックス要素を受信する。

ステップ１００４で、プロセッサ６２０は、ＰＨに対応するピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであるかどうかを特定するＰＨ内の第２のシンタックス要素を受信する。

ステップ１００６で、プロセッサ６２０は、第１のシンタックス要素の値に基づいて第２のシンタックス要素の値を判定する。

いくつかの例では、プロセッサ６２０は、復号器に実装されていてもよい。

いくつかの例では、１に等しい第１のシンタックス要素は、ＰＰＳに対応する各ピクチャが２つ以上のＶＣＬＮＡＬユニットを含んでおり、かつ２つ以上のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、また０に等しい第１のシンタックス要素は、ＰＰＳに対応する各ピクチャが１つまたは複数のＶＣＬＮＡＬユニットを含んでおり、かつ１つまたは複数のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していることを特定する。

いくつかの例では、１に等しい第２のシンタックス要素は、ＰＨに対応するピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであることを特定し、また０に等しい第２のシンタックス要素は、ＰＨに対応するピクチャが、ＩＲＡＰピクチャでもＧＤＲピクチャでもないことを特定している。

いくつかの例では、プロセッサ６２０は、他のスライスのＮＡＬタイプがスライスのＮＡＬタイプと同じになるように要求するためにピクチャの他のスライスのＮＡＬタイプに対して第１の制約を適用し、かつ第２のシンタックス要素の値が１になるように要求するように第２のシンタックス要素に対して第２の制約を適用してもよい。

いくつかの例では、ビデオ符号化のための非一時的コンピュータ可読記憶媒体を提供する。非一時的コンピュータ可読記憶媒体は、１つまたは複数のコンピュータプロセッサ６２０によって実行されると、１つまたは複数のコンピュータプロセッサ６２０に図７に示した方法を実施させるコンピュータ実行可能命令を記憶する。

いくつかの例では、ビデオ符号化のための非一時的コンピュータ可読記憶媒体を提供する。非一時的コンピュータ可読記憶媒体は、１つまたは複数のコンピュータプロセッサ６２０によって実行されると、１つまたは複数のコンピュータプロセッサ６２０に図８に示した方法を実施させるコンピュータ実行可能命令を記憶する。

いくつかの例では、ビデオ符号化のための非一時的コンピュータ可読記憶媒体を提供する。非一時的コンピュータ可読記憶媒体は、１つまたは複数のコンピュータプロセッサ６２０によって実行されると、１つまたは複数のコンピュータプロセッサ６２０に図9に示した方法を実施させるコンピュータ実行可能命令を記憶する。

いくつかの例では、ビデオ符号化のための非一時的コンピュータ可読記憶媒体を提供する。非一時的コンピュータ可読記憶媒体は、１つまたは複数のコンピュータプロセッサ６２０によって実行されると、１つまたは複数のコンピュータプロセッサ６２０に図１０に示した方法を実施させるコンピュータ実行可能命令を記憶する。

本開示の説明は、例示の目的で提示したが、本開示を網羅するまたは制限することを意図していない。いくつかの修正、変形、および代替の実装形態が、上記の説明および関連する図面で提示した教示の利益を有する当業者にとって明らかであろう。

これらの例は、開示の原理を説明し、当業者が様々な実装形態に関する開示を理解し、意図された特定の用途に適した様々な修正を加えた基礎となる原則および様々な実装形態を最善に利用できるようにするために選択され、記載された。したがって、開示の範囲は、開示された実装形態の具体例に限定されるものではなく、修正およびその他の実装形態が、本開示の範囲に含まれることを意図していると理解されるべきである。

Claims

ビデオコーディングのための方法であって、
復号器によって、ピクチャパラメータセット（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ：ＰＰＳ）に対応するピクチャが２つ以上のネットワーク抽象化層（ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ：ＮＡＬ）ユニットを含んでいるかどうか、および、前記２つ以上のＮＡＬユニットが同じＮＡＬユニットタイプを有しているかどうかを特定する、前記ＰＰＳ内の第１のシンタックス要素を受信することと、
前記復号器によって、ピクチャヘッダ（ＰｉｃｔｕｒｅＨｅａｄｅｒ：ＰＨ）に対応するピクチャがイントラランダムアクセスポイント（ＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ：ＩＲＡＰ）ピクチャまたは段階的復号化リフレッシュ（ＧｒａｄｕａｌＤｅｃｏｄｉｎｇＲｅｆｒｅｓｈ：ＧＤＲ）ピクチャであるかどうかを特定する、前記ＰＨ内の第２のシンタックス要素を受信することと、
前記復号器によって、前記第２のシンタックス要素の値に基づいて前記第１のシンタックス要素の値を判定することと、
を含む方法であって、
前記第２のシンタックス要素の値に基づいて前記第１のシンタックス要素の値を判定することは、前記第２のシンタックス要素の値が１であると判定するのに応じて、前記復号器によって、前記第１のシンタックス要素の値が０であると判定し、０である前記第１のシンタックス要素の前記値は、前記ＰＰＳに対応する各ピクチャが２つ以上のＶＣＬＮＡＬユニットを含んでおり、かつ前記２つ以上のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していることを特定し、１である前記第２のシンタックス要素の前記値は、前記ＰＨに対応する前記ピクチャがＩＲＡＰピクチャまたはＧＤＲピクチャであることを特定すること、
を含む、方法。
１に等しい前記第１のシンタックス要素の前記値は、前記ＰＰＳに対応する各ピクチャが２つ以上のビデオ符号化層（ＶｉｄｅｏＣｏｄｉｎｇＬａｙｅｒ：ＶＣＬ）ＮＡＬユニットを含んでおり、かつ前記２つ以上のＶＣＬＮＡＬユニットが同じＮＡＬユニットタイプを有していないことを特定し、０に等しい前記第２のシンタックス要素の前記値は、前記ＰＨに対応する前記ピクチャがＧＤＲピクチャではないことを特定する、
請求項１に記載の方法。
ビデオコーディングのための装置であって、
１つまたは複数のプロセッサと、
前記１つまたは複数のプロセッサによって実行される命令を記憶するように構成されたメモリとを備え、
前記１つまたは複数のプロセッサは、前記命令が実行されると、請求項１または２に記載の方法を実施するように構成される、装置。
ビデオコーディングのための非一時的コンピュータ可読記憶媒体であって、１つまたは複数のコンピュータプロセッサによって実行されると、前記１つまたは複数のコンピュータプロセッサに請求項１または２に記載の方法を実施させる、コンピュータ実行可能命令を記憶する、非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると、請求項１または２に記載の方法を実施する命令を有する、コンピュータ可読記憶媒体に記憶されたプログラム。