JP2023529198A

JP2023529198A - マルチレイヤビデオコーディングのピクチャヘッダ制約

Info

Publication number: JP2023529198A
Application number: JP2022575907A
Authority: JP
Inventors: ワン，イェ－クイ
Original assignee: ByteDance Inc
Current assignee: ByteDance Inc
Priority date: 2020-06-12
Filing date: 2021-06-11
Publication date: 2023-07-07
Also published as: KR20230021664A; US20240121441A1; EP4150901A1; US11930221B2; EP4150901A4; WO2021252978A1; US11943483B2; US20230105096A1; CN115885512A; CN115918067A; WO2021252976A1; CN115836526A; US20230113199A1; US20230104910A1; WO2021252973A1

Abstract

マルチレイヤコーディングのためのピクチャヘッダ制約の方法、システム及びデバイスを説明する。ビデオ処理の例示的な方法は、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、第２構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第１構文要素の値に対する制約を指定し、第２構文要素は、現在のピクチャのピクチャ順序カウント（ＰＯＣ）の最上位ビット（ＭＳＢ）サイクルの値を指定する。

Description

［関連出願の相互参照］
適用可能な特許法及び／又はパリ条約に基づく規則の下で、本出願は、２０２０年６月１２日に出願された米国仮特許出願第６３／０３８，６０１号の優先権及び利益を適時に主張するために行われる。法の下のすべての目的のために、前述の出願の開示全体は、参照によって本出願の開示の一部として組み込まれる。

［技術分野］
本特許文書は、画像及びビデオのコーディング及び復号に関する。

デジタルビデオは、インターネット及び他のデジタル通信ネットワークにおける最大の帯域幅使用を占める。ビデオを受信及び表示することが可能な接続ユーザデバイスの数が増加するにつれて、デジタルビデオの利用のための帯域幅需要が増加し続けることが予想される。

本特許文書は、ビデオ符号化、復号又は処理を実行するためにビデオエンコーダ及びデコーダによって使用することができる、マルチレイヤコーディングのピクチャヘッダ制約のための技術を開示する。

１つの例示的な態様において、ビデオ処理方法が開示される。本方法は、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、第２構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第１構文要素の値に対する制約を指定し、第２構文要素は、現在のピクチャのピクチャ順序カウント（ＰＯＣ：picture order count）の最上位ビット（ＭＳＢ：most significant bit）サイクルの値を指定する。

別の例示的な態様において、ビデオ処理方法が開示される。本方法は、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、構文要素がない場合にピクチャ順序カウント（ＰＯＣ）の導出を指定し、構文要素は、現在のピクチャのＰＯＣの最上位ビット（ＭＳＢ）サイクルの値を指定する。

更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットＡＵを備え、ルールは、ＡＵの出力順序がＡＵの復号順序と異なることに応答して、ビットストリームでは漸次復号リフレッシュ（ＧＤＲ：gradual decode refresh）ピクチャが許容されないことを指定する。

更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内の複数のレイヤを備え、フォーマットルールは、第１レイヤについてのエンドオブシーケンス（ＥＯＳ：end of sequence）ネットワーク抽象化レイヤ（ＮＡＬ：network abstraction layer）ユニットが、ビットストリーム内の第１アクセスユニット（ＡＵ）内に存在することに応答して、ビットストリーム内の第１ＡＵに続くＡＵ内の第１レイヤの１つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ：coded layer video sequence start）ピクチャであることを指定する。

更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを含み、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内の複数のレイヤを備え、フォーマットルールは、第１アクセスユニット内の第１ピクチャが、クリーンランダムアクセス（ＣＲＡ：clean random access）ピクチャ又は漸次復号リフレッシュ（ＧＤＲ：gradual decoding refresh）ピクチャであるコーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ）ピクチャであることに応答して、第２ピクチャがＣＬＶＳＳピクチャであることを指定する。

更に別の例示的な態様において、ビデオ処理方法が開示される。本方法は、１つ以上のピクチャを備えるビデオと、ルールに従ってビデオのビットストリームとの間の変換を実行するステップを含み、ルールは、ビットストリームが少なくとも、出力される第１ピクチャを備えることを指定し、第１ピクチャは出力レイヤ内にあり、第１ピクチャは、１に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ（ＨＲＤ：hypothetical reference decoder）に関連付けられる除去プロセスとに影響を及ぼす。

更に別の例示的態様において、ビデオエンコーダ装置が開示される。ビデオエンコーダは、上述の方法を実装するよう構成されるプロセッサを備える。

更に別の例示的態様において、ビデオデコーダ装置が開示される。ビデオデコーダは、上述の方法を実装するよう構成されるプロセッサを備える。

更に別の例示的態様において、コードが記憶されるコンピュータ読取可能媒体が開示される。コードは、本明細書で説明される方法のうちの１つをプロセッサ実行可能なコードの形態で具現化する。

これら及び他の特徴は、本文書を通して説明される。

本明細書で開示される様々な技術が実装され得る、例示的なビデオ処理システムを示すブロック図である。

ビデオ処理に使用される例示的なハードウェアプラットフォームのブロック図である。

本開示のいくつかの実施形態を実装することができる、例示的なビデオコーディングシステムを示すブロック図である。

本開示のいくつかの実施形態を実装することができる、エンコーダの例を示すブロック図である。

本開示のいくつかの実施形態を実装することができる、デコーダの例を示すブロック図である。

ビデオ処理の例示的な方法のフローチャートを示す図である。ビデオ処理の例示的な方法のフローチャートを示す図である。ビデオ処理の例示的な方法のフローチャートを示す図である。ビデオ処理の例示的な方法のフローチャートを示す図である。ビデオ処理の例示的な方法のフローチャートを示す図である。ビデオ処理の例示的な方法のフローチャートを示す図である。

セクションの見出しは、本文書において、理解の容易性のために使用されており、各セクションで開示される技術及び実施形態の適用可能性をそのセクションのみに限定するものではない。さらに、Ｈ．２６６の用語は、一部の説明において、理解の容易性のためだけに使用され、開示される技術の範囲を限定するためには使用されない。このように、本明細書で説明される技術は、他のビデオコーデックプロトコル及び設計にも適用可能である。

１．導入
本文書は、ビデオコーディング技術に関する。具体的には、シングルレイヤビデオコーディングとマルチレイヤビデオコーディングの両方をサポートするビデオコーデックのレベル及びビットストリーム適合性を定義することに関する。これは、シングルレイヤビデオコーディング及びマルチレイヤビデオコーディングをサポートする任意のビデオコーディング標準又は非標準ビデオコーデック、例えば開発中のＶＶＣ（Versatile Video Coding）に適用され得る。
２．略語
ＡＰＳ適応パラメータセット（Adaptation Parameter Set）
ＡＵアクセスユニット（Access Unit）
ＡＵＤアクセスユニットデリミタ（Access Unit Delimiter）
ＡＶＣアドバンスドビデオコーディング（Advanced Video Coding）
ＣＬＶＳコーディングされたレイヤビデオシーケンス（Coded Layer Video Sequence）
ＣＬＶＳＳコーディングされたレイヤビデオシーケンス開始（Coded Layer Video Sequence Start）
ＣＰＢコーディングされたピクチャバッファ（Coded Picture Buffer）
ＣＲＡクリーンランダムアクセス（Clean Random Access）
ＣＴＵコーディングツリーユニット（Coding Tree Unit）
ＣＶＳコーディングされたビデオシーケンス（Coded Video Sequence）
ＤＣＩ復号能力情報（Decoding Capability Information）
ＤＰＢ復号されたピクチャバッファ（Decoded Picture Buffer）
ＥＯＢエンドオブビットストリーム（End Of Bitstream）
ＥＯＳエンドオブシーケンス（End Of Sequence）
ＧＤＲ漸次復号リフレッシュ（Gradual Decoding Refresh）
ＨＥＶＣ高効率ビデオコーディング（High Efficiency Video Coding）
ＨＲＤ仮想参照デコーダ（Hypothetical Reference Decoder）
ＩＤＲ即時復号リフレッシュ（Instantaneous Decoding Refresh）
ＩＬＰインターレイヤ予測（Inter-Layer Prediction）
ＩＬＲＰインターレイヤ参照ピクチャ（Inter-Layer Reference Picture）
ＪＥＭ共同探査モデル（Joint Exploration Model）
ＬＴＲＰ長期参照ピクチャ（Long-Term Reference Picture）
ＭＣＴＳ動き制約タイルセット（Motion-Constrained Tile Sets）
ＮＡＬネットワーク抽象化レイヤ（Network Abstraction Layer）
ＯＬＳ出力レイヤセット（Output Layer Set）
ＰＨピクチャヘッダ（Picture Header）
ＰＯＣピクチャ順序カウント（Picture Order Count）
ＰＰＳピクチャパラメータセット（Picture Parameter Set）
ＰＴＬプロファイル、層及びレベル（Profile, Tier and Level）
ＰＵピクチャユニット（Picture Unit）
ＲＡＰランダムアクセスポイント（Random Access Point）
ＲＢＳＰ生バイトシーケンスペイロード（Raw Byte Sequence Payload）
ＳＥＩ補足強化情報（Supplemental Enhancement Information）
ＳＬＩサブピクチャレベル情報（Subpicture Level Information）
ＳＰＳシーケンスパラメータセット（Sequence Parameter Set）
ＳＴＲＰ短期参照ピクチャ（Short-Term Reference Picture）
ＳＶＣスケーラブルビデオコーディング（Scalable Video Coding）
ＶＣＬビデオコーディングレイヤ（Video Coding Layer）
ＶＰＳビデオパラメータセット（Video Parameter Set）
ＶＴＭＶＶＣテストモデル（VVC Test Model）
ＶＵＩビデオユーザビリティ情報（Video Usability Information）
ＶＶＣ Versatile Video Coding

３．最初の議論
ビデオコーディング規格は、主に、周知のＩＴＵ－Ｔ及びＩＳＯ／ＩＥＣ規格の開発を通して発展してきた。ＩＴＵ－ＴはＨ．２６１及びＨ．２６３を作り、ＩＳＯ／ＩＥＣはＭＰＥＧ－１及びＭＰＥＧ－４Ｖｉｓｕａｌを作り、２つの組織は共同で、Ｈ．２６２／ＭＰＥＧ－２Ｖｉｄｅｏ及びＨ．２６４／ＭＰＥＧ－４アドバンスドビデオコーディング（ＡＶＣ）及びＨ．２６５／ＨＥＶＣ規格を作り出した。Ｈ．２６２から、ビデオコーディング規格は、時間的予測と変換コーディングが利用されるハイブリッドビデオコーディング構造に基づいている。ＨＥＶＣを越える将来のビデオコーディング技術を探求するために、ＶＣＥＧとＭＰＥＧによって共同でＪＶＥＴ（Joint Video Exploration Team）が２０１５年に設立された。それ以来、ＪＶＥＴによって多くの新たな方法が採用されており、ＪＥＭ（Joint Exploration Model）と名付けられた基準ソフトウェアに入れられている。ＪＶＥＴ会議は四半期に１回同時開催されており、新たなコーディング規格はＨＥＶＣと比較して５０％のビットレート低減を目指している。新たなビデオコーディング規格は、２０１８年４月のＪＶＥＴ会議においてＶＶＣ（Versatile Video Coding）として正式に命名され、そのときにＶＶＣテストモデル（ＶＴＭ）の最初のバージョンがリリースされた。ＶＶＣ標準化に寄与する継続的な努力が行われているため、ＪＶＥＴ会議ごとに新たなコーディング技術がＶＶＣ規格に採用されている。ＶＶＣワーキングドラフト及びテストモデルＶＴＭは、その後、毎回会議後に更新される。ＶＶＣプロジェクトは現在、２０２０年７月の会議で技術的完成（ＦＤＩＳ）を目指している。

３．１．ＨＥＶＣ及びＶＶＣにおけるランダムアクセスとそのサポート
ランダムアクセスは、復号順序でビットストリームの最初のピクチャではないピクチャから、ビットストリームのアクセスと復号を開始することを指す。ブロードキャスト／マルチキャスト及びマルチパーティ・ビデオ会議におけるチューニングとチャネル切り替え、ローカル再生とストリーミングにおけるシーク、並びにストリーミングにおけるストリーム適応をサポートするために、ビットストリームは、頻繁なランダムアクセスポイントを含む必要があり、そのようなランダムアクセスポイントは、典型的には、イントラコーディングされたピクチャであるが、（例えば漸次復号リフレッシュの場合）インターコーディングされたピクチャであってもよい。

ＨＥＶＣは、ＮＡＬユニットタイプを通して、ＮＡＬユニットヘッダ内のイントラランダムアクセスポイント（ＩＲＡＰ：intra random access points）ピクチャのシグナリングを含む。３つのタイプのＩＲＡＰピクチャ、すなわち、即時デコーダリフレッシュ（ＩＤＲ：instantaneous decoder refresh）ピクチャ、クリーンランダムアクセス（ＣＲＡ：clean random access）ピクチャ及びブロークンリンクアクセス（ＢＬＡ：broken link access）ピクチャがサポートされる。ＩＤＲピクチャは、現在のグループオブピクチャ（ＧＯＰ：group-of-pictures）の前のいかなるピクチャも参照しないように、インターピクチャ予測構造を制約しており、従来的に、クローズドＧＯＰランダムアクセスポイントと呼ばれる。ＣＲＡピクチャは、特定のピクチャが現在のＧＯＰの前のピクチャを参照することを可能にすることによって制限を緩和し、それらのすべては、ランダムアクセスの場合に廃棄される。ＣＲＡピクチャは、従来的に、オープンＧＯＰランダムアクセスポイントと呼ばれる。ＢＬＡピクチャは、通常、例えばストリーム切り替えの間にＣＲＡピクチャにおける２つのビットストリーム又はその一部のスプライシングに由来する。ＩＲＡＰピクチャのより良いシステム使用を可能にするために、全部で６つの異なるＮＡＬユニットが、ＩＲＡＰピクチャのプロパティをシグナリングするために定義され、これは、ＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）[７]で定義されるストリームアクセスポイントタイプにより良くマッチするために使用されることができ、これはＨＴＴＰ（ＤＡＳＨ）［８］上の動的適応ストリーミングにおけるランダムアクセスサポートに利用される。

ＶＶＣは、３つのタイプのＩＲＡＰピクチャと、２つのタイプのＩＤＲピクチャ（１つのタイプは関連するＲＡＤＬピクチャを伴い、他のタイプは関連するＲＡＤＬピクチャを伴わない）と、１つのタイプのＣＲＡピクチャをサポートする。これらは基本的にはＨＥＶＣのものと同じである。ＨＥＶＣのＢＬＡピクチャタイプはＶＶＣに含まれないが、それは主に２つの理由による：ｉ）ＢＬＡピクチャの基本的な機能性を、ＣＲＡピクチャとエンドオブシーケンスＮＡＬユニットによって実現することができ、その存在は、後続のピクチャがシングルレイヤビットストリーム内で新たなＣＶＳを開始することを示す。ｉｉ）ＮＡＬユニットヘッダのＮＡＬユニットタイプフィールドに６ビットではなく５ビットを使用することによって示されるように、ＶＶＣの開発中にＨＥＶＣよりも少ないＮＡＬユニットタイプを指定したいという要望があった。

ＶＶＣとＨＥＶＣの間のランダムアクセスサポートにおける別の重要な違いは、ＶＶＣにおけるより規範的な方法でのＧＤＲのサポートである。ＧＤＲでは、ビットストリームの復号は、インターコーディングされたピクチャから開始することができ、最初は、ピクチャ領域全体を正しく復号することはできないが、複数のピクチャの後では、ピクチャ領域全体が正しいであろう。ＡＶＣとＨＥＶＣも、ＧＤＲランダムアクセスポイントとリカバリポイントのシグナリングのためにリカバリポイントＳＥＩメッセージを使用して、ＧＤＲをサポートする。ＶＶＣでは、新たなＮＡＬユニットタイプがＧＤＲピクチャの指示のために指定され、リカバリポイントはピクチャヘッダ構文構造でシグナリングされる。ＣＶＳとビットストリームは、ＧＤＲピクチャで開始することが許容される。これは、ビットストリーム全体が、単一のイントラコーディングされたピクチャなしに、インターコーディングされたピクチャのみを含むことを許容されることを意味する。この方法でＧＤＲサポートを指定する主な利点は、ＧＤＲに準拠した挙動（conforming behavior）を提供することである。ＧＤＲは、ピクチャ全体をイントラコーディングすることとは対照的に、イントラコーディングされたスライス又はブロックを複数のピクチャに分配することによって、エンコーダがビットストリームのビットレートを平滑化することを可能にし、したがって、大幅なエンドツーエンド遅延の低減を可能にし、これは今日では、無線ディスプレイ、オンラインゲーム、ドローンベースのアプリケーションのような超低遅延アプリケーションがより一般的になっているので、以前よりも重要であると考えられる。

ＶＶＣにおける別のＧＤＲ関連の機能は、仮想境界シグナリングである。ＧＤＲピクチャとそのリカバリポイントとの間のピクチャにおける、リフレッシュされた領域（すなわち、正しく復号された領域）とリフレッシュされていない領域との間の境界を、仮想境界としてシグナリングすることができ、シグナリングされると、境界を横切るインループフィルタリングは適用されず、したがって、境界又はその近くではいくつかのサンプルの復号不一致は生じないであろう。これは、アプリケーションが、ＧＤＲプロセス中に正しく復号された領域を表示することを決定するときに役立ち得る。

ＩＲＡＰピクチャとＧＤＲピクチャを、ランダムアクセスポイント（ＲＡＰ）ピクチャと総称することができる。

３．２．シーケンス内のピクチャ解像度の変更
ＡＶＣ及びＨＥＶＣでは、新たなＳＰＳを使用する新たなシーケンスがＩＲＡＰピクチャで開始しない限り、ピクチャの空間解像度は変化しない可能性がある。ＶＶＣは、常にイントラコーディングされるＩＲＡＰピクチャを符号化することなく、ある位置においてシーケンス内でピクチャ解像度の変更を可能にする。この特徴は、参照ピクチャが、復号されている現在のピクチャとは異なる解像度を有するときに、インター予測のために使用される当該参照ピクチャの再サンプリングを必要とするので、この特徴は、参照ピクチャ再サンプリング（ＲＰＲ：reference picture resampling）と称されることがある。

スケーリング比は、１／２（参照ピクチャから現在のピクチャへの２倍のダウンサンプリング）以上かつ８（８倍のアップサンプリング）以下に制限される。参照ピクチャと現在のピクチャとの間の様々なスケーリング比を扱うために、異なる周波数カットオフを有する３つのセットの再サンプリングフィルタが指定される。３つのセットの再サンプリングフィルタは、それぞれ、１／２から１／１.７５、１／１.７５から１／１.２５及び１／１.２５から８の範囲のスケーリング比に適用される。各セットの再サンプリングフィルタは、ルマについて１６相（phase）、クロマについて３２相を有し、これは動き補償補間フィルタの場合と同じである。実際に、通常のＭＣ補間プロセスは、１／１.２５から８の範囲のスケーリング比を有する再サンプリングプロセスの特別なケースである。水平及び垂直スケーリング比は、ピクチャ幅及び高さと、参照ピクチャ及び現在のピクチャについて指定された左、右、上及び下のスケーリングオフセットとに基づいて導出される。

ＨＥＶＣとは異なるこの機能をサポートするためのＶＶＣ設計の他の態様は、以下を含む：ｉ）ピクチャ解像度及び対応する適合ウィンドウが、ＳＰＳの代わりにＰＰＳでシグナリングされるが、ＳＰＳでは、最大ピクチャ解像度がシグナリングされる。ｉｉ）シングルレイヤビットストリームでは、各ピクチャストア（１つの復号されたピクチャの記憶のためのＤＰＢにおけるスロット）は、最大ピクチャ解像度を有する復号されたピクチャを記憶するために必要とされるバッファサイズを占める。

３．３．一般的な及びＶＶＣにおけるスケーラブルビデオコーディング（ＳＶＣ）
スケーラブルビデオコーディング（ＳＶＣ、単にビデオコーディングにおけるスケーラビリティと称されることもある）は、参照レイヤ（ＲＬ：reference layer）と称されることもあるベースレイヤ（ＢＬ：base layer）及び１つ以上のスケーラブルエンハンスメントレイヤ（ＥＬ：enhancement layer）が使用されるビデオコーディングを指す。ＳＶＣでは、ベースレイヤは、ベースレベルの品質でビデオデータを担持することができる。１つ以上のエンハンスメントレイヤは、例えばより高い空間、時間及び／又は信号対雑音（ＳＮＲ）レベルをサポートするために、追加のビデオデータを担持することができる。エンハンスメントレイヤは、以前に符号化されたレイヤに対して定義され得る。例えば下部レイヤがＢＬとして機能してよく、上部レイヤがＥＬとして機能してもよい。中間レイヤは、ＥＬ又はＲＬのいずれか又はその両方として機能し得る。例えば中間レイヤ（例えば最下位レイヤでも最上位レイヤでもないレイヤ）は、中間レイヤの下にあるレイヤ、例えばベースレイヤ又は任意の介在するエンハンスメントレイヤについてのＥＬであってよく、同時に、中間レイヤの上にある１つ以上のエンハンスメントレイヤについてのＲＬとして機能し得る。同様に、ＨＥＶＣ規格のマルチビュー又は３Ｄ拡張では、複数のビューが存在してもよく、あるビューの情報が、別のビューの情報（例えば動き推定、動きベクトル予測及び／又は他の冗長性）をコーディング（例えば符号化又は復号）するために利用され得る。

ＳＶＣでは、エンコーダ又はデコーダによって使用されるパラメータは、それらが利用され得るコーディングレベル（例えばビデオレベル、シーケンスレベル、ピクチャレベル、スライスレベル等）に基づいて、パラメータセットにグループ化される。例えばビットストリーム内の異なるレイヤの１つ以上のコーディングされたビデオシーケンスによって利用され得るパラメータは、ビデオパラメータセット（ＶＰＳ）に含まれてよく、コーディングされたビデオシーケンス内の１つ以上のピクチャによって利用されるパラメータは、シーケンスパラメータセット（ＳＰＳ）に含まれてよい。同様に、ピクチャ内の１つ以上のスライスによって利用されるパラメータは、ピクチャパラメータセット（ＰＰＳ）に含まれてよく、単一のスライスに特有である他のパラメータは、スライスヘッダに含まれてよい。同様に、特定のレイヤが所与の時間にどのパラメータセットを使用しているかの指示は、様々なコーディングレベルで提供され得る。

ＶＶＣにおける参照ピクチャ再サンプリング（ＲＰＲ）のサポートのおかげで、空間スケーラビリティサポートのために必要とされるアップサンプリングは、単にＲＰＲアップサンプリングフィルタを使用するだけでよいので、複数のレイヤ、例えばＶＶＣではＳＤ及びＨＤ解像度を有する２つのレイヤを含むビットストリームのサポートを、いずれの追加の信号処理レベルコーディングツールも必要とせずに設計することができる。それにもかかわらず、スケーラビリティのサポートには、（スケーラビリティをサポートしないときと比べて）高レベルの構文変更が必要とされる。スケーラビリティのサポートは、ＶＶＣバージョン１で指定される。ＡＶＣ及びＨＥＶＣの拡張を含む、いずれかの以前のビデオコーディング規格におけるスケーラビリティのサポートとは異なり、ＶＶＣスケーラビリティの設計は、可能な限りシングルレイヤデコーダ設計に好ましいようにされている。マルチレイヤビットストリームのための復号能力は、あたかもビットストリーム内にはシングルレイヤしか存在しないかのような方法で指定される。例えばＤＰＢサイズのような復号能力は、復号されるべきビットストリーム内のレイヤの数に依存しない方法で指定される。基本的に、シングルレイヤビットストリームのために設計されたデコーダは、マルチレイヤビットストリームを復号できるようにするためにはあまり変更を必要としない。ＡＶＣ及びＨＥＶＣのマルチレイヤ拡張の設計と比較して、ＨＬＳ態様は、いくつかの柔軟性を犠牲にして、著しく単純化されている。例えばＩＲＡＰＡＵは、ＣＶＳに存在するレイヤの各々についてのピクチャを含むことが要求される。

３．４．パラメータセット
ＡＶＣ、ＨＥＶＣ及びＶＶＣは、パラメータセットを指定する。パラメータセットのタイプは、ＳＰＳ、ＰＰＳ、ＡＰＳ及びＶＰＳを含む。ＳＰＳ及びＰＰＳは、ＡＶＣ、ＨＥＶＣ及びＶＶＣのすべてにおいてサポートされる。ＶＰＳはＨＥＶＣから導入されており、ＨＥＶＣとＶＶＣの両方に含まれる。ＡＰＳはＡＶＣにもＨＥＶＣにも含まれていなかったが、最新のＶＶＣドラフトテキストには含まれる。

ＳＰＳはシーケンスレベルヘッダ情報を担持するように設計され、ＰＰＳは、まれに変化するピクチャレベルヘッダ情報を担持するように設計された。ＳＰＳ及びＰＰＳでは、まれに変化する情報をシーケンス又はピクチャごとに繰り返す必要がなく、したがって、この情報の冗長的なシグナリングを回避することができる。さらに、ＳＰＳ及びＰＰＳの使用は、重要なヘッダ情報の帯域外送信を可能にし、冗長送信の必要性を回避するだけでなく、エラー耐性も改善する。

ＶＰＳは、マルチレイヤビットストリーム内のすべてのレイヤに共通するシーケンスレベルのヘッダ情報を担持するために導入された。
ＡＰＳは、コーディングにかなりのビットを必要とするこのようなピクチャレベル又はスライスレベルの情報を担持するために導入され、複数のピクチャによって共有されることができ、シーケンスにおいては、非常に多くの異なるバリエーションが存在する可能性がある。

４．開示される技術的解決策によって対処される技術的問題
ＶＶＣにおけるＰＯＣ、ＧＤＲ、ＥＯＳ及び静止画プロファイルの最新の設計は、以下の問題を有する：
１）vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が０に等しく、現在のレイヤの参照レイヤの現在のＡＵ内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagは０に等しくなければならないことが要求される。しかしながら、参照レイヤ内のそのようなピクチャは、Ｃ．６節で指定される一般的なサブビットストリーム抽出プロセスによって除去される可能性がある。したがって、ＰＯＣの導出は正しくない。
２）ph_poc_msb_cycle_present_flagの値がＰＯＣ導出プロセスで使用されるが、フラグが存在しない可能性があり、その場合は推定される値は存在しない。
３）ＧＤＲ機能は、主に、使用される低エンドツーエンド遅延アプリケーションに有益である。したがって、低エンドツーエンド遅延アプリケーションに適さない方法でビットストリームが符号化されるとき、その使用を許容しないことは理にかなっている。
４）レイヤのＥＯＳＮＡＬユニットが、マルチレイヤビットストリームのＡＵ内に存在するとき、これは、このＡＵへジャンプするシーク操作があったこと又はこのＡＵがビットストリーム・スプライシングポイントであることを意味する。２つの状況のいずれにとっても、レイヤ間にインターレイヤ依存性があるかどうかにかかわらず、同じビットストリームの別のレイヤではコンテンツは連続的であるのに、このレイヤは同じコンテンツに対して連続的ではないということは意味がない。
５）出力すべきピクチャを持たないビットストリームを有する可能性がある。これは、一般にすべてのプロファイルに対して又は静止画プロファイルのみに対して、許容されるべきではない。

５．実施形態及び解決策のリスト
上記の問題点及び他の問題を解決するために、以下に要約される方法が開示される。項目は、一般的な概念を説明するための例と見なされるべきであり、狭義に解釈されるべきではない。さらに、これらの項目を、個々に又は任意の方法で組み合わせて適用することができる。
１）問題１を解決するために、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が０に等しく、現在のレイヤの参照レイヤの現在のＡＵ内にピクチャが存在するとき、ph_poc_msb_cycle_present_flagが０に等しいことを要求する代わりに、より厳しい条件下で、ph_poc_msb_cycle_present_flagの値が０に等しいことが要求され得る。
ａ）一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が０に等しく、現在のピクチャのスライスのRefPicList[ 0 ]又はRefPicList[ 1 ]内にＩＬＲＰエントリが存在するとき、ph_poc_msb_cycle_present_flagの値が０に等しいことが要求される。
ｂ）一例では、vps_independent_layer_flag[ GeneralLayerIdx[ nuh_layer_id ] ]が０に等しく、現在のレイヤの参照レイヤの現在のＡＵ内にあるrefpicLayerIdに等しいnuh_layer_idを有し、かつMax( 0, vps_max_tid_il_ref_pics_plus1[ currLayerIdx ][ refLayerIdx ] - 1 )以下のTemporalIdを有する、ピクチャが存在するとき、ph_poc_msb_cycle_present_flagの値が０に等しいことが要求され、ここで、currLayerIdx及びrefLayerIdxは、それぞれ、GeneralLayerIdx[ nuh_layer_id ]及びGeneralLayerIdx[ refpicLayerId ]に等しい。
ｃ）一例では、ph_poc_msb_cycle_present_flagの値が０に等しいことは全く要求されない。
２）問題２を解決するために、ＰＯＣ導出プロセスで「ph_poc_msb_cycle_present_flagが１（０）に等しいこと」を使用する代わりに、「ph_poc_msb_cycle_valが存在する（存在しない）」を使用する。
３）問題３を解決するために、ＧＤＲピクチャが低エンドツーエンド遅延アプリケーションにおいてのみ使用されることが想定され、ＧＤＲピクチャは、ＡＵの出力順序と復号順序が異なるときは許容され得ない。
ａ）一例では、sps_gdr_enabled_flagが１に等しいとき、ＣＬＶＳのすべてのピクチャの復号順序と出力順序は同じであるべきことが要求される。この制約はまた、ＡＵの復号順序と出力順序が、マルチレイヤビットストリームにおいて同じであることも義務付けることに注意されたい。なぜなら、ＡＵ内のすべてのピクチャは復号順序において連続することが要求され、ＡＵ内のすべてのピクチャが同じ出力順序を有するからである。
ｂ）一例では、sps_gdr_enabled_flagが、ＣＶＳ内のピクチャによって参照されるＳＰＳについて１に等しいとき、ＣＶＳ内のすべてのＡＵの復号順序と出力順序は同じであるべきことが要求される。
ｃ）一例では、sps_gdr_enabled_flagが、ピクチャによって参照されるＳＰＳについて１に等しいとき、ビットストリーム内のすべてのＡＵの復号順序と出力順序は同じであるべきことが要求される。
ｄ）一例では、sps_gdr_enabled_flagが、ビットストリーム内に存在するＳＰＳについて１に等しいとき、ビットストリーム内のすべてのＡＵの復号順序と出力順序は同じであるべきことが要求される。
ｅ）一例では、sps_gdr_enabled_flagが、（ビットストリーム内にあることによって又は外部の手段を通して提供される）ビットストリームのＳＰＳについて１に等しいとき、ビットストリーム内のすべてのＡＵの復号順序と出力順序は同じであるべきことが要求される。
４）問題４を解決するために、レイヤのＥＯＳＮＡＬユニットがマルチレイヤビットストリームのＡＵ内に存在するとき、すべて又は特定の上位レイヤの各々における次のピクチャがＣＬＶＳＳピクチャであることが要求される。
ａ）一例では、ＡＵａｕＡが、レイヤｌａｙｅｒＡ内にＥＯＳＮＡＬユニットを含むとき、ＣＶＳに存在し、かつｌａｙｅｒＡを参照レイヤとして有する、各レイヤｌａｙｅｒＢごとに、復号順序でａｕＡに続くＡＵにおいて復号順序でｌａｙｅｒＢ内の第１ピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｂ）一例では、代替的に、ＡＵａｕＡが、レイヤｌａｙｅｒＡ内にＥＯＳＮＡＬユニットを含むとき、ＣＶＳ内に存在し、かつｌａｙｅｒＡよりも上位レイヤである、レイヤｌａｙｅｒＢごとに、復号順序でａｕＡに続くＡＵにおいて復号順序でｌａｙｅｒＢ内の第１ピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｃ）一例では、代替的に、ＡＵａｕＡ内の１つのピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ＣＶＳ内に存在する各レイヤｌａｙｅｒＡごとに、ａｕＡ内にｌａｙｅｒＡについてのピクチャｐｉｃＡが存在する場合、ｐｉｃＡがＣＬＶＳＳピクチャであるべきであり、そうでない場合（ｕＡ内にｌａｙｅｒＡについてのピクチャが存在しない場合）、復号順序でａｕＡに続くＡＵ内のｌａｙｅｒＡについての復号順序で第１ピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｄ）一例では、代替的に、ＡＵａｕＡ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ｌａｙｅｒＢより上位である、ＣＶＳ内に存在する各レイヤｌａｙｅｒＡごとに、ａｕＡ内にｌａｙｅｒＡについてのピクチャｐｉｃＡが存在する場合、ｐｉｃＡがＣＬＶＳＳピクチャであるべきであり、そうでない場合（ｕＡ内にｌａｙｅｒＡについてのピクチャが存在しない場合）、復号順序でａｕＡに続くＡＵ内のｌａｙｅｒＡについての復号順序で第１ピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｅ）一例では、代替的に、ＡＵａｕＡ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ｌａｙｅｒＢを参照レイヤとして有する、ＣＶＳ内に存在する各レイヤｌａｙｅｒＡごとに、ａｕＡ内にｌａｙｅｒＡについてのピクチャｐｉｃＡが存在する場合、ｐｉｃＡがＣＬＶＳＳピクチャであるべきであり、そうでない場合（ｕＡ内にｌａｙｅｒＡについてのピクチャが存在しない場合）、復号順序でａｕＡに続くＡＵ内のｌａｙｅｒＡについての復号順序で第１ピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｆ）一例では、代替的に、ＡＵ内にＥＯＳＮＡＬユニットが存在するとき、ＣＶＳ内に存在する各レイヤごとに、ＡＵ内にＥＯＳＮＡＬユニットが存在するべきであることが指定される。
ｇ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内にＥＯＳＮＡＬユニットが存在するとき、ｌａｙｅｒＢよりも上位である、ＣＶＳ内に存在する各レイヤごとに、ＡＵ内にＥＯＳＮＡＬユニットが存在するべきであることが指定される。
ｈ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内にＥＯＳＮＡＬユニットが存在するとき、ｌａｙｅｒＢを参照レイヤとして有する、ＣＶＳ内に存在する各レイヤごとに、ＡＵ内にＥＯＳＮＡＬユニットが存在するべきであることが指定される。
ｉ）一例では、代替的に、ＡＵ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ＡＵ内のすべてのピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｊ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ｌａｙｅｒＢより上位のすべてのレイヤ内のＡＵ内のピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｋ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ｌａｙｅｒＢを参照レイヤとして有する、すべてのレイヤ内のＡＵ内のピクチャが、ＣＬＶＳＳピクチャであるべきことが指定される。
ｌ）一例では、代替的に、ＡＵ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ＡＵは、ＣＶＳ内に存在する各レイヤごとに、ピクチャを有するべきであり、ＡＵ内のすべてのピクチャがＣＬＶＳＳピクチャであるべきことが指定される。
ｍ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ＡＵは、ＣＶＳ内に存在するｌａｙｅｒＢより上位の各レイヤごとに、ピクチャを有するべきであり、ＡＵ内のすべてのピクチャがＣＬＶＳＳピクチャであるべきことが指定される。
ｎ）一例では、代替的に、ＡＵ内のレイヤｌａｙｅｒＢ内のピクチャが、ＣＲＡピクチャ又はＧＤＲピクチャであるＣＬＶＳＳピクチャであるとき、ＡＵは、ＣＶＳ内に存在するｌａｙｅｒＢを参照レイヤとして有する各レイヤごとに、ピクチャを有するべきであり、ＡＵ内のすべてのピクチャがＣＬＶＳＳピクチャであるべきことが指定される。
５）問題５を解決するために、ビットストリームは、出力される少なくとも１つのピクチャを有するべきであることが指定される。
ａ）一例では、ビットストリームが１つのピクチャのみを含むとき、ピクチャは、１に等しいph_pic_output_flagを有するべきであることが指定される。
ｂ）一例では、ビットストリームは、出力レイヤ内にあり、かつ１に等しいph_pic_output_flagを有する、少なくとも１つのピクチャを有するべきであることが指定される。
ｃ）例では、上記制約のいずれかは、１つ以上の静止画プロファイルの定義の一部として、例えばＭａｉｎ１０静止画プロファイル（Main 10 Still Picture profile）及びＭａｉｎ４：４：４１０静止画プロファイル（Main 4:4:4 10 Still Picture profile）として指定される。
ｄ）例では、上記制約のいずれかは、プロファイルの定義の一部ではなく、それが任意のプロファイルに当てはまるよう指定される。
６．実施形態

６．１．第１実施形態
この実施形態は、項目１～項目５及びそれらの副項目の一部についてのものである。

図１は、本明細書で開示される様々な技術が実装され得る例示的なビデオ処理システム１０００を示すブロック図である。様々な実装は、システム１０００の構成要素の一部又はすべてを含み得る。システム１０００は、ビデオコンテンツを受け取るための入力１００２を含み得る。ビデオコンテンツは、生又は非圧縮フォーマットで、例えば８ビット又は１０ビットの多成分画素値で受け取られてよく、あるいは圧縮又は符号化フォーマットであってもよい。入力１００２は、ネットワークインタフェース、周辺バスインタフェース又はストレージインタフェースを表し得る。ネットワークインタフェースの例は、イーサネット（登録商標）、受動光ネットワーク（ＰＯＮ）等のような有線インタフェースと、Ｗｉ－Ｆｉ又はセルラインタフェースのような無線インタフェースを含む。

システム１０００は、本文書で説明される様々なコーディング又は符号化方法を実装し得るコーディング構成要素１００４を含み得る。コーディング構成要素１００４は、入力１００２からコーディング構成要素１００４の出力へビデオの平均ビットレートを低減して、ビデオのコーディングされた表現を生成し得る。したがって、コーディング技術は、ビデオ圧縮又はビデオトランスコーディング技術と呼ばれることがある。コーディング構成要素１００４の出力は、構成要素１００６によって表されるように、記憶され得るか又は接続された通信を介して送信され得る。入力１００２で受け取られたビデオの記憶又は通信されたビットストリーム（又はコーディングされた）表現は、構成要素１００８によって、ディスプレイインタフェース１０１０に送られる画素値又は表示可能なビデオを生成するために使用され得る。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ復元と呼ばれることがある。さらに、特定のビデオ処理操作は、「コーディング」操作又はツールと称されるが、コーディングツール又は操作はエンコーダで使用され、コーディングの結果を反転する、対応する復号ツール又は操作が、デコーダによって実行されることになることが理解されよう。

周辺バスインタフェース又はディスプレイインタフェースの例には、ユニバーサルシリアルバス（ＵＳＢ）又は高解像度マルチメディアインタフェース（ＨＤＭＩ（登録商標））又はディスプレイポート等が含まれ得る。ストレージインタフェースの例には、ＳＡＴＡ（serial advanced technology attachment）、ＰＣＩ、ＩＤＥインタフェース等が含まれる。本文書において説明される技術は、携帯電話、ラップトップ、スマートフォンあるいはデジタルデータ処理及び／又はビデオ表示を実行することができる他のデバイスのような、様々な電子デバイスにおいて具体化され得る。

図２は、ビデオ処理装置２０００のブロック図である。装置２０００は、本明細書で説明される方法の１つ以上を実装するために使用され得る。装置２０００は、スマートフォン、タブレット、コンピュータ、モノのインターネット（ＩｏＴ）受信機等において具体化され得る。装置２０００は、１つ以上のプロセッサ２００２、１つ以上のメモリ２００４及びビデオ処理ハードウェア２００６を含み得る。プロセッサ２００２は、本文書において（例えば図６～図９において）説明される１つ以上の方法を実装するように構成され得る。メモリ（複数のメモリ）２００４は、本明細書で説明される方法及び技術を実装するために使用されるデータ及びコードを記憶するために使用され得る。ビデオ処理ハードウェア２００６は、ハードウェア回路内で、本文書で説明されるいくつかの技術を実装するために使用され得る。いくつかの実施形態において、ハードウェア２００６は、部分的又は全体的に、１つ以上のプロセッサ２００２、例えばグラフィクスプロセッサ内に存在してもよい。

図３は、本開示の技術を利用し得る例示的なビデオコーディングシステム１００を示すブロック図である。図３に示されるように、ビデオコーディングシステム１００は、ソースデバイス１１０と宛先デバイス１２０を含み得る。ソースデバイス１１０は符号化ビデオデータを生成し、ビデオ符号化デバイスと称されることがある。宛先デバイス１２０は、ソースデバイス１１０によって生成された符号化ビデオデータを復号することができ、ビデオ復号デバイスと称されることがある。ソースデバイス１１０は、ビデオソース１１２、ビデオエンコーダ１１４及び入力／出力（Ｉ／Ｏ）インタフェース１１６を含み得る。

ビデオソース１１２は、ビデオキャプチャデバイス、ビデオコンテンツプロバイダからビデオデータを受け取るためのインタフェース及び／又はビデオデータを生成するためのコンピュータグラフィクスシステムのようなソース又はそのようなソースの組合せを含み得る。ビデオデータは、１つ以上のピクチャを備え得る。ビデオエンコーダ１１４は、ビデオソース１１２からのビデオデータを符号化してビットストリームを生成する。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットのシーケンスを含み得る。ビットストリームは、コーディングされたピクチャ及び関連するデータを含み得る。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連するデータは、シーケンスパラメータセット、ピクチャパラメータセット及び他の構文構造を含み得る。Ｉ／Ｏインタフェース１１６は、変調器／復調器（モデム）及び／又は送信機を含み得る。符号化されたビデオデータは、Ｉ／Ｏインタフェース１１６を介してネットワーク１３０ａを通って宛先デバイス１２０に直接送信され得る。符号化されたビデオデータはまた、宛先デバイス１２０によるアクセスのために記憶媒体／サーバ１３０ｂ上に記憶され得る。

宛先デバイス１２０は、Ｉ／Ｏインタフェース１２６、ビデオデコーダ１２４及びディスプレイデバイス１２２を含み得る。

Ｉ／Ｏインタフェース１２６は、受信機及び／又はモデムを含み得る。Ｉ／Ｏインタフェース１２６は、ソースデバイス１１０又は記憶媒体／サーバ１３０ｂから符号化されたビデオデータを取得し得る。ビデオデコーダ１２４は、符号化されたビデオデータを復号し得る。ディスプレイデバイス１２２は、復号されたビデオデータをユーザに表示し得る。ディスプレイデバイス１２２は、宛先デバイス１２０と一体化されてよく、あるいは外部ディスプレイデバイスとインタフェースするよう構成される宛先デバイス１２０の外部にあってもよい。

ビデオエンコーダ１１４及びビデオデコーダ１２４は、ＨＥＶＣ（High Efficiency Video Coding）規格、ＶＶＣ（Versatile Video Coding）規格並びに他の現在の及び／又は更なる規格のような、ビデオ圧縮規格に従って動作し得る。

図４は、ビデオエンコーダ２００の一例を示すブロック図であり、これは、図３に示されるシステム１００内のビデオエンコーダ１１４であり得る。

ビデオエンコーダ２００は、本開示の技術のいずれか又はすべてを実行するよう構成され得る。図４の例では、ビデオエンコーダ２００は複数の機能構成要素を含む。本開示で説明される技術は、ビデオエンコーダ２００の様々な構成要素の間で共有され得る。いくつかの例において、プロセッサは、本開示で説明される技術のいずれか又はすべてを実行するように構成され得る。

ビデオエンコーダ２００の機能構成要素は、分割ユニット２０１と、モード選択ユニット２０３、動き推定ユニット２０４、動き補償ユニット２０５及びイントラ予測ユニット２０６を含み得る予測ユニット２０２と、残差生成ユニット２０７と、変換ユニット２０８と、量子化ユニット２０９と、逆量子化ユニット２１０と、逆変換ユニット２１１と、再構成ユニット２１２と、バッファ２１３と、エントロピー符号化ユニット２１４とを含み得る。

他の例では、ビデオエンコーダ２００は、より多くの、より少ない又は異なる機能構成要素を含み得る。一例では、予測ユニット２０２は、イントラブロックコピー（ＩＢＣ）ユニットを含み得る。ＩＢＣユニットは、少なくとも１つの参照ピクチャが、現在のビデオブロックが配置されているピクチャである、ＩＢＣモードで予測を実行し得る。

さらに、動き推定ユニット２０４及び動き補償ユニット２０５のようないくつかの構成要素は、高度に統合されてもよいが、図４の例では、説明の目的のために別個に表されている。

分割ユニット２０１は、ピクチャを１つ以上のビデオブロックに分割（partition）し得る。ビデオエンコーダ２００及びビデオデコーダ３００は、様々なビデオブロックサイズをサポートし得る。

モード選択ユニット２０３は、例えばエラー結果に基づいて、コーディングモード、すなわちイントラ又はインターのうちの１つを選択し、結果として得られるイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成するように残差生成ユニット２０７に提供し、かつ参照ピクチャとして使用するために符号化ブロックを再構成するように再構成ユニット２１２に提供し得る。ある例では、モード選択ユニット２０３は、予測がインター予測信号とイントラ予測信号に基づく、イントラ及びインター予測の組合せ（ＣＩＩＰ：combination of intra and inter predication）モードを選択し得る。モード選択ユニット２０３はまた、インター予測の場合に、ブロックに対する動きベクトルの解像度（例えばサブピクセル又は整数ピクセル精度）を選択し得る。

現在のビデオブロックにおいてインター予測を実行するために、動き推定ユニット２０４は、バッファ２１３からの１つ以上の参照フレームを現在のビデオブロックに対して比較することによって、現在のビデオブロックの動き情報を生成し得る。動き補償ユニット２０５は、動き情報と、現在のビデオブロックに関連付けられるピクチャ以外のバッファ２１３からのピクチャの復号されたサンプルとに基づいて、現在のビデオブロックについて予測されるビデオブロックを決定し得る。

動き推定ユニット２０４と動き補償ユニット２０５は、例えば現在のビデオブロックがＩスライス内にあるか、Ｐスライス内にあるか又はＢスライス内にあるかに応じて、現在のビデオブロックについて異なる操作を実行し得る。

いくつかの例では、動き推定ユニット２０４は、現在のビデオブロックについて、一方向予測を実行することができ、動き推定ユニット２０４は、現在のビデオブロックの参照ビデオブロックについて、リスト０又はリスト１内の参照ピクチャを検索することができる。次いで、動き推定ユニット２０４は、参照ビデオブロックと、現在のビデオブロックと参照ビデオブロックとの間の空間変位を示す動きベクトルとを含む、リスト０又はリスト１内の参照ピクチャを示す参照インデックスを生成し得る。動き推定ユニット２０４は、参照インデックス、予測方向インジケータ及び動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット２０５は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のブロックの予測ビデオブロックを生成し得る。

他の例では、動き推定ユニット２０４は、現在のビデオブロックについて、双方向予測を実行することができ、動き推定ユニット２０４は、現在のビデオブロックの参照ビデオブロックについて、リスト０内の参照ピクチャを検索してよく、また現在のビデオブロックの別の参照ビデオブロックについて、リスト１内の参照ピクチャを検索することができる。次いで、動き推定ユニット２０４は、参照ビデオブロックと、該参照ビデオブロックと現在のビデオブロックとの間の空間変位を示す動きベクトルとを含む、リスト０及びリスト１内の参照ピクチャを示す参照インデックスを生成し得る。動き推定ユニット２０４は、参照インデックス及び現在のビデオブロックの動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット２０５は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成し得る。

いくつかの例では、動き推定ユニット２０４は、デコーダの復号処理のために動き情報のフルセットを出力し得る。

いくつかの例では、動き推定ユニット２０４は、現在のビデオについて動き情報のフルセットを出力しないことがある。むしろ、動き推定ユニット２０４は、別のビデオブロックの動き情報を参照して、現在のビデオブロックの動き情報をシグナリングし得る。例えば動き推定ユニット２０４は、現在のビデオブロックの動き情報が、隣接するビデオブロックの動き情報と十分に類似していると判断し得る。

一例では、動き推定ユニット２０４は、現在のビデオブロックに関連付けられる構文構造において、現在のビデオブロックが別のビデオブロックと同じ動き情報を有することをビデオデコーダ３００に指示する値を指示し得る。

別の例では、動き推定ユニット２０４は、現在のビデオブロックに関連付けられる構文構造において、別のビデオブロック及び動きベクトル差（ＭＶＤ：motion vector difference）を識別し得る。動きベクトル差は、現在のビデオブロックの動きベクトルと、指示されたビデオブロックの動きベクトルとの間の差を示す。ビデオデコーダ３００は、指示されたビデオブロックの動きベクトルと動きベクトル差を使用して、現在のビデオブロックの動きベクトルを決定し得る。

上述のように、ビデオエンコーダ２００は、動きベクトルを予測的にシグナリングし得る。ビデオエンコーダ２００によって実装され得る予測シグナリング技術の２つの例は、アドバンスドベクトル予測（ＡＭＶＰ：advanced motion vector predication）とマージモードシグナリングを含む。

イントラ予測ユニット２０６は、現在のビデオブロックに対してイントラ予測を実行し得る。イントラ予測ユニット２０６が現在のビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット２０６は、同じピクチャ内の他のビデオブロックの復号されたサンプルに基づいて、現在のビデオブロックについての予測データを生成し得る。現在のビデオブロックについての予測データは、予測されるビデオブロックと様々な構文要素とを含み得る。

残差生成ユニット２０７は、現在のビデオブロックから、現在のビデオブロックの予測ビデオブロックを減算することによって（例えばマイナス記号によって示される）、現在のビデオブロックについての残差データを生成し得る。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプル構成要素に対応する残差ビデオブロックを含み得る。

他の例では、例えばスキップモードにおいて、現在のビデオブロックについて現在のビデオブロックの残差データが存在しないことがあり、残差生成ユニット２０７は減算操作を実行しないことがある。

変換処理ユニット２０８は、１つ以上の変換を、現在のビデオブロックに関連付けられる残差ビデオブロックに適用することによって、現在のビデオブロックについての１つ以上の変換係数ビデオブロックを生成し得る。

変換処理ユニット２０８が、現在のビデオブロックに関連付けられる変換係数ビデオブロックを生成した後、量子化ユニット２０９は、現在のビデオブロックに関連付けられる１つ以上の量子化パラメータ（ＱＰ）値に基づいて、現在のビデオブロックに関連付けられる変換係数ビデオブロックを量子化し得る。

逆量子化ユニット２１０及び逆変換ユニット２１１は、変換係数ビデオブロックから残差ビデオブロックを再構成するために、それぞれ、逆量子化及び逆変換を変換係数ビデオブロックに適用し得る。再構成ユニット２１２は、再構成された残差ビデオブロックを、予測ユニット２０２によって生成された１つ以上の予測ビデオブロックからの対応するサンプルに追加して、バッファ２１３における記憶のために、現在のブロックに関連付けられる再構成ビデオブロックを生成し得る。

再構成ユニット２１２がビデオブロックを再構成した後、ループフィルタリング操作を実行して、ビデオブロック内のビデオブロッキングアーチファクトを低減し得る。

エントロピー符号化ユニット２１４は、ビデオエンコーダ２００の他の機能構成要素からデータを受け取り得る。エントロピー符号化ユニット２１４がデータを受け取ると、エントロピー符号化ユニット２１４は、１つ以上のエントロピー符号化操作を実行して、エントロピー符号化データを生成し、エントロピー符号化データを含むビットストリームを出力し得る。

図５は、図３に図示されるシステム１００内のビデオデコーダ１２４であり得るビデオデコーダ３００の一例を示すブロック図である。

ビデオデコーダ３００は、本開示の技術のいずれか又はすべてを実行するよう構成され得る。図５の例では、ビデオデコーダ３００は、複数の機能構成要素を含む。本開示で説明される技術は、ビデオデコーダ３００の様々な構成要素の間で共有され得る。いくつかの例において、プロセッサは、本開示で説明される技術のいずれか又はすべてを実行するよう構成され得る。

図５の例では、ビデオデコーダ３００は、エントロピー復号ユニット３０１、動き補償ユニット３０２、イントラ予測ユニット３０３、逆量子化ユニット３０４、逆変換ユニット３０５、再構成ユニット３０６及びバッファ３０７を含む。ビデオデコーダ３００は、いくつかの例では、ビデオエンコーダ２００（図４）を参照して説明した符号化パスと概ね逆の復号パスを実行し得る。

エントロピー復号ユニット３０１は、符号化ビットストリームを取り出し得る。符号化ビットストリームは、エントロピーコーディングされたビデオデータ（例えばビデオデータの符号化ブロック）を含み得る。エントロピー復号ユニット３０１は、エントロピーコーディングされたビデオデータを復号することができ、エントロピー復号されたビデオデータから、動き補償ユニット３０２は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス及び他の動き情報を含む、動き情報を決定し得る。動き補償ユニット３０２は、例えばＡＭＶＰ及びマージモードを実行することによって、そのような情報を決定し得る。

動き補償ユニット３０２は、動き補償されたブロックを生成することができ、場合によっては、補間フィルタに基づいて補間を実行することができる。サブピクセル精度で使用される補間フィルタの識別子は、構文要素に含まれ得る。

動き補償ユニット３０２は、ビデオブロックの符号化中にビデオエンコーダ２００によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルについての補間値を算出し得る。動き補償ユニット３０２は、受け取った構文情報に従ってビデオエンコーダ２００によって使用される補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。

動き補償ユニット３０２は、構文情報の一部を使用して、符号化ビデオシーケンスのフレーム及び／又はスライスを符号化するために使用されるブロックのサイズと、符号化ビデオシーケンスのピクチャの各マクロブロックがどのように分割されるかを記述する分割情報と、各分割がどのように符号化されるかを示すモードと、各インター符号化ブロックについての１つ以上の参照フレーム（及び参照フレームリスト）と、符号化ビデオシーケンスを復号するための他の情報を決定し得る。

イントラ予測ユニット３０３は、例えばビットストリームで受け取ったイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成し得る。逆量子化ユニット３０４は、ビットストリームにおいて提供され、かつエントロピー復号ユニット３０１によって復号される、量子化されたビデオブロック係数を逆量子化する、すなわち、脱量子化する。逆変換ユニット３０５は、逆変換を適用する。

再構成ユニット３０６は、残差ブロックを、動き補償ユニット３０２又はイントラ予測ユニット３０３によって生成された対応する予測ブロックと合算して、復号されたブロックを形成し得る。所望であれば、ブロッキネス（blockiness）アーチファクトを除去するために、デブロッキングフィルタも適用して、復号されたブロックをフィルタリングしてもよい。次いで、復号されたビデオブロックはバッファ３０７に記憶され、バッファ３０７は、後続の動き補償／イントラ予測のために参照ブロックを提供し、また、ディスプレイデバイス上における提示のために復号されたビデオも生成する。

図６～図１１は、例えば図１～図５に示される実施形態において上述した技術的解決策を実装することができる例示的な方法を示す。

図６は、ビデオ処理の例示的な方法６００のフローチャートを示す。方法６００は、動作６１０において、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに準拠し、フォーマットルールは、第２構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第１構文要素の値に対する制約を指定し、第２構文要素は、現在のピクチャのピクチャ順序カウント（ＰＯＣ）の最上位ビット（ＭＳＢ）サイクルの値を指定する。

図７は、ビデオ処理の例示的な方法７００のフローチャートを示す。方法７００は、動作７１０において、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに準拠し、フォーマットルールは、構文要素が存在しない場合に、ピクチャ順序カウント（ＰＯＣ）の導出を指定し、構文要素は、現在のピクチャのＰＯＣの最上位ビット（ＭＳＢ）サイクルの値を指定する。

図８は、ビデオ処理の例示的な方法８００のフローチャートを示す。方法８００は、動作８１０において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットＡＵを備え、ルールは、ＡＵの出力順序がＡＵの復号順序と異なることに応答して、漸次復号リフレッシュ（ＧＤＲ）ピクチャがビットストリームにおいて許容されないことを指定する。

図９は、ビデオ処理の例示的な方法９００のフローチャートを示す。方法９００は、動作９１０において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内に複数のレイヤを備え、フォーマットルールは、第１レイヤのエンドオブシーケンス（ＥＯＳ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットが、ビットストリーム内の第１アクセスユニット（ＡＵ）内に存在していることに応答して、ビットストリーム内の第１ＡＵに続くＡＵ内の第１レイヤの１つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ）ピクチャであることを指定する。

図１０は、ビデオ処理の例示的な方法１０００のフローチャートを示す。方法１０００は、動作１０１０において、ビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内に複数のレイヤを備え、フォーマットルールは、第１アクセスユニット内の第１ピクチャが、クリーンランダムアクセス（ＣＲＡ）ピクチャ又は漸次復号リフレッシュ（ＧＤＲ）ピクチャであるコーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ）ピクチャであることに応答して、第２ピクチャがＣＬＶＳＳピクチャであることを指定する。

図１１は、ビデオ処理の例示的な方法１１００のフローチャートを示す。方法１１００は、動作１１１０において、ルールに従って、１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行することを含み、ルールは、ビットストリームが、出力される少なくとも第１ピクチャを備えることを指定し、第１ピクチャは出力レイヤ内にあり、第１ピクチャは１に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ（ＨＲＤ）に関連付けられる除去プロセスとに影響を及ぼす。

以下の解決策は、前のセクション（例えば項目１～５）で議論された技術の例示的な実施形態を示す。

いくつかの実施形態によって好ましい解決策のリストを次に提供する。

Ａ１．ビデオ処理の方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに準拠し、該フォーマットルールは、第２構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第１構文要素の値に対する制約を指定し、第２構文要素は、現在のピクチャのピクチャ順序カウント（ＰＯＣ）の最上位ビット（ＭＳＢ）サイクルの値を指定する。

Ａ２．解決策Ａ１の方法において、
第１構文要素の値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ（ＩＬＲＰ）エントリが現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、フラグは、インデックス化レイヤ（indexed layer）がインターレイヤ予測を使用するかどうかを指定する。

Ａ３．解決策Ａ２の方法において、
参照ピクチャリストは、第１参照ピクチャリスト（RefPicList[ 0 ]）又は第２参照ピクチャリスト（RefPicList[ 1 ]）を備える。

Ａ４．解決策Ａ２の方法において、
ゼロに等しい第１構文要素の値は、第２構文要素がピクチャヘッダ構文構造内に存在しないことを指定する。

Ａ５．解決策Ａ２の方法において、
ゼロに等しいフラグの値は、インデックス化レイヤがインターレイヤ予測を使用することを許容されることを指定する。

Ａ６．解決策Ａ１の方法において、
第１構文要素の値は、フラグの値がゼロに等しく、かつピクチャが、（ｉ）現在のレイヤの参照レイヤ内の現在のアクセスユニット（ＡＵ）内にある第２識別子に等しい第１識別子と、（ｉｉ）閾値以下の第３識別子とを有することに応答して、ゼロに等しく、フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、第１識別子は、ビデオコーディングレイヤ（ＶＣＬ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットが属するレイヤを指定し、第２識別子は、参照ピクチャが属するレイヤを指定し、第３識別子は、時間的識別子であり、閾値は、イントラランダムアクセスピクチャ（ＩＲＡＰ）ピクチャでもなく、漸次復号リフレッシュ（ＧＤＲ）ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ（ＩＲＬＰ）として使用されるかどうかを指定する第２構文要素に基づく。

Ａ７．解決策Ａ６の方法において、
第１識別子はnuh_layer_idであり、第２識別子はrefpicLayerIdであり、第３識別子はTemporalIdであり、第２構文要素はvps_max_tid_il_ref_pics_plus1である。

Ａ８．解決策Ａ１の方法において、
第１構文要素は、ゼロであることは全く要求されない。

Ａ９．解決策Ａ２～Ａ８のいずれかの方法において、
第１構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、第２構文要素はph_poc_msb_cycle_valである。

Ａ１０．ビデオ処理の方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームはフォーマットルールに準拠し、フォーマットルールは、構文要素が存在しない場合に、ピクチャ順序カウント（ＰＯＣ）の導出を指定し、構文要素は、現在のピクチャのＰＯＣ最上位ビット（ＭＳＢ）サイクルの値を指定する。

Ａ１１．解決策Ａ１０の方法において、
構文要素はph_poc_msb_cycle_valである。

Ａ１２．ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットＡＵを備え、ルールは、ＡＵの出力順序がＡＵの復号順序と異なることに応答して、ビットストリームでは漸次復号リフレッシュ（ＧＤＲ）ピクチャが許容されないことを指定する。

Ａ１３．解決策Ａ１２の方法において、
コーディングされたレイヤビデオシーケンス（ＣＬＶＳ）内のすべてのピクチャの出力順序と復号順序は、フラグが１に等しいことに応答して、同一であり、フラグは、ＧＤＲピクチャが有効であるかどうかを指定する。

Ａ１４．解決策１２の方法において、
ＡＵの出力順序と復号順序は、フラグが、コーディングされたビデオシーケンス（ＣＶＳ）内のピクチャによって参照されるシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して、同一であり、フラグは、ＧＤＲピクチャが有効であるかどうかを指定する。

Ａ１５．解決策Ａ１２の方法において、
ＡＵの出力順序と復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して、同一であり、フラグは、ＧＤＲピクチャが有効であるかどうかを指定する。

Ａ１６．解決策Ａ１２の方法において、ＡＵの出力順序及び復号順序は、フラグが、ビットストリーム内のシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して、同一であり、フラグは、ＧＤＲピクチャが有効であるかどうかを指定する。

Ａ１７．解決策Ａ１３～Ａ１６のいずれかの方法において、
フラグは、sps_gdr_enabled_flagである。

いくつかの実施形態によって好ましい解決策の別のリストを次に提供する。

Ｂ１．ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内に複数のレイヤを備え、フォーマットルールは、第１レイヤについてのエンドオブシーケンス（ＥＯＳ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットが、ビットストリーム内の第１アクセスユニット（ＡＵ）内に存在することに応答して、ビットストリーム内の第１ＡＵに続くＡＵ内の第１レイヤの１つ以上の上位レイヤの各々の後続のピクチャが、コーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ）ピクチャであることを指定する。

Ｂ２．解決策Ｂ１の方法において、
フォーマットルールは、第１レイヤを含むコーディングされたビデオシーケンス（ＣＶＳ）内に存在し、第１レイヤを参照レイヤとして使用する第２レイヤについての復号順序において、第１ピクチャがＣＬＶＳＳ画像であることを更に指定する。

Ｂ３．解決策Ｂ１の方法において、
１つ以上の上位レイヤは、すべて又は特定の上位レイヤを備える。

Ｂ４．解決策Ｂ１の方法において、
フォーマットルールは、第１レイヤを含むコーディングされたビデオシーケンス（ＣＶＳ）内に存在し、第１レイヤよりも上位レイヤである第２レイヤについての復号順序において、第１ピクチャがＣＬＶＳＳピクチャであることを更に指定する。

Ｂ５．解決策Ｂ１の方法において、
フォーマットルールは、ＥＯＳＮＡＬユニットが、ビットストリーム内のコーディングされたビデオシーケンス（ＣＶＳ）の各レイヤ内に存在することを更に指定する。

Ｂ６．解決策Ｂ１の方法において、
フォーマットルールは、第１レイヤを含むコーディングされたビデオシーケンス（ＣＶＳ）内に存在し、第１レイヤより上位レイヤである第２レイヤが、ＥＯＳＮＡＬユニットを備えることを更に指定する。

Ｂ７．解決策Ｂ１の方法において、
フォーマットルールは、第１レイヤを含むコーディングされたビデオシーケンス（ＣＶＳ）内に存在し、第１レイヤを参照レイヤとして使用する第２レイヤが、ＥＯＳＮＡＬユニットを備えることを更に指定する。

Ｂ８．ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、ビットストリームは、フォーマットルールに従って１つ以上のピクチャを備える複数のアクセスユニットＡＵ内に複数のレイヤを備え、フォーマットルールは、第１アクセスユニット内の第１ピクチャが、クリーンランダムアクセス（ＣＲＡ）ピクチャ又は漸次復号リフレッシュ（ＧＤＲ）ピクチャであるコーディングされたレイヤビデオシーケンス開始（ＣＬＶＳＳ）ピクチャであることに応答して、第２ピクチャがＣＬＶＳＳピクチャであることを指定する。

Ｂ９．解決策Ｂ８の方法において、
第２ピクチャは、第１アクセスユニット内のレイヤのピクチャである。

Ｂ１０．解決策Ｂ８の方法において、
第１レイヤは第１ピクチャを備え、第２ピクチャは、第１レイヤより上位である第２レイヤ内のピクチャである。

Ｂ１１．解決策Ｂ８の方法において、
.第１レイヤは第１ピクチャを備え、第２ピクチャは、第１レイヤを参照レイヤとして使用する第２レイヤ内のピクチャである。

Ｂ１２．解決策Ｂ８の方法において、
第２ピクチャは、第１アクセスユニットに続く第２アクセスユニットの復号順序において第１ピクチャである。

Ｂ１３．解決策Ｂ８の方法において、
第２ピクチャは、第１アクセスユニット内の任意のピクチャである。

Ｂ１４．解決策Ｂ１～Ｂ１３のいずれかの方法において、
ＣＬＶＳＳピクチャは、１に等しいフラグを有する（ＩＲＡＰ）ピクチャ又は（ＧＤＲ）ピクチャである、コーディングされたピクチャであり、１に等しいフラグは、関連するピクチャが、ビットストリーム内に存在しないピクチャへの参照を備えるという決定があると、関連するピクチャがデコーダによって出力されないことを指示する。

いくつかの実施形態によって好ましい解決策の更に別のリストが次に提供される。

Ｃ１．ビデオ処理の方法であって、
ルールに従って、１つ以上のピクチャを備えるビデオと、ビデオのビットストリームとの間の変換を実行するステップを備え、ルールは、ビットストリームが少なくとも、出力される第１ピクチャを備えることを指定し、第１ピクチャは出力レイヤ内にあり、第１ピクチャは、１に等しい構文要素を備え、構文要素は、復号されたピクチャ出力と、仮想参照デコーダ（ＨＲＤ）に関連付けられる除去プロセスとに影響を及ぼす。

Ｃ２．解決策Ｃ１の方法において、
ルールはすべてのプロファイルに当てはまり、ビットストリームは任意のプロファイルに準拠することが許容される。

Ｃ３．解決策Ｃ２の方法において、
構文要素はph_pic_output_flagである。

Ｃ４．解決策Ｃ２の方法において、
プロファイルは、Ｍａｉｎ１０静止画プロファイル又はＭａｉｎ４：４：４１０静止画プロファイルである。

解決策の以下のリストは、上記に列挙される解決策の各々に当てはまる。

Ｏ１．上記解決策のいずれかの方法において、
変換は、ビットストリームからビデオを復号することを含む。

Ｏ２．上記解決策のいずれかの方法において、
変換は、ビデオをビットストリームに符号化することを含む。

Ｏ３．ビデオを表すビットストリームをコンピュータ読取可能記録媒体に記憶する方法であって、
上記解決策のいずれか１つ以上に記載される方法に従って、ビデオからビットストリームを生成するステップと、ビットストリームをコンピュータ読取可能記録媒体に記憶するステップと、を備える。

Ｏ４．請求項１乃至７のいずれか１つ以上に記載される方法を実装するよう構成されたプロセッサを備える、ビデオ処理装置。

Ｏ５．命令が記憶されたコンピュータ読取可能媒体であって、
命令は、実行されると、プロセッサに上記解決策の１つ以上に記載される方法を実装させる、コンピュータ読取可能媒体。

Ｏ６．上記解決策のいずれか１つ以上に記載の方法に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。

Ｏ７．ビットストリームを記憶するためのビデオ処理装置であって、
当該ビデオ処理装置は、上記解決策のいずれか１つ以上に記載される方法を実装するよう構成される。

Ｐ１．ビデオ処理方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオのピクチャ内のピクチャ順序カウントの最上位ビットサイクルの存在を示す構文要素の値に対する制約を指定する。

Ｐ２．解決策Ｐ１の方法において、
フォーマットルールは、独立値フラグがゼロ値に設定され、かつピクチャの少なくとも１つのスライスがその参照リスト内のインターレイヤ参照ピクチャを使用するとき、構文要素の値が０であることを指定する。

Ｐ３．解決策Ｐ１～Ｐ２のいずれかの方法において、
フォーマットルールは、コーディングされた表現内に構文要素を含まないことによって構文要素のゼロの値が指示されることを指定する。

Ｐ４．ビデオ処理方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、変換は、アクセスユニットの出力順序がアクセスユニットの復号順序と異なる場合に、漸次復号リフレッシュピクチャが許容されないことを指定するルールに準拠する。

Ｐ５．ビデオ処理方法であって、
１つ以上のビデオピクチャを備えるビデオレイヤを備えるビデオと、該ビデオのコーディングされた表現との間の変換を実行するステップを備え、コーディングされた表現はフォーマットルールに準拠し、フォーマットルールは、ビデオシーケンスの終了（end of a video sequence）を示す第１ネットワーク抽象化レイヤユニット（ＮＡＬ）が、レイヤのアクセスユニット内に存在する場合、コーディングされた表現内の上位レイヤの各々の次のピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有さなければならないことを指定する。

Ｐ６．解決策Ｐ５の方法において、
フォーマットルールは、レイヤを参照レイヤとして使用する第２レイヤの復号順序における第１ピクチャが、コーディングされたレイヤビデオシーケンス開始タイプを有するべきことを更に指定する。

Ｐ７．解決策Ｐ１～Ｐ５のいずれかの方法において、
変換を実行するステップは、ビデオを符号化してコーディングされた表現を生成するステップを含む。

Ｐ８．解決策Ｐ１～Ｐ５のいずれかの方法において、
変換を実行するステップは、コーディングされた表現を解析及び復号してビデオを生成するステップを含む。

Ｐ９．解決策Ｐ１～Ｐ８の１つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ復号装置。

Ｐ１０．解決策Ｐ１～Ｐ８の１つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ符号化装置。

Ｐ１１．コンピュータコードが記憶されたコンピュータプログラム製品であって、
コードは、プロセッサによって実行されると、プロセッサに、解決策Ｐ１～Ｐ８のいずれかに記載される方法を実装させる。

本文書において、「ビデオ処理」という用語は、ビデオ符号化、ビデオ復号、ビデオ圧縮又はビデオ復元を指すことがある。例えばビデオ圧縮アルゴリズムは、ビデオの画素表現から対応するビットストリーム表現へ又はその逆の変換中に適用され得る。現在のビデオブロックのビットストリーム表現（又は単にビットストリーム）は、例えば構文によって定義されるように、共同配置されるか又はビットストリーム内の異なる場所に拡散されるビットに対応し得る。例えばマクロブロックは、変換されてコーディングされたエラー残差値に関して、またビットストリーム内のヘッダ及び他のフィールド内のビットを使用して符号化され得る。

本文書において説明される、開示される及び他の解決策、実施例、実施形態、モジュール及び機能的動作は、デジタル電子回路において、あるいは本文書で開示される構造及びそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア又はハードウェアにおいて、あるいはそれらの１つ以上の組合せにおいて実装されることができる。開示される及び他の実施形態を、１つ以上のコンピュータプログラム製品として、すなわちデータ処理装置による実行のため又はデータ処理装置の動作を制御するために、コンピュータ読取可能媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実装することができる。コンピュータ読取可能媒体は、機械読取可能ストレージデバイス、機械読取可能記憶基板、メモリデバイス、機械読取可能伝搬信号に影響を与える組成物又は１つ以上のそれらの組合せとすることができる。「データ処理装置」という用語は、例としてプログラマブルプロセッサ、コンピュータあるいは複数のプロセッサ又はコンピュータを含む、データを処理するためのすべての装置、デバイス及び機械を包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムのための実行環境を作成するコード、例えばプロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム又はそれらの１つ以上の組合せを構成するコードを含むことができる。伝搬信号は、人工的に生成された信号、例えば適切な受信器装置への伝送のために情報を符号化するために生成される、機械生成電気信号、光学信号又は電磁信号である。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト又はコードとしても知られる）を、コンパイル又は解釈された言語を含む、任意の形態のプログラミング言語で書くことができ、それは、スタンドアロンプログラムとして、あるいはコンピューティング環境における使用に適したモジュール、構成要素、サブルーチン又は他のユニットとして含む、任意の形態で展開することができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応しない。プログラムは、他のプログラム又はデータ（例えばマークアップ言語文書に記憶される１つ以上のスクリプト）を保持するファイルの一部内に、問題のプログラムに専用の単一ファイル内に、あるいは複数の協調ファイル（例えば１つ以上のモジュール、サブプログラム又はコードの一部を記憶するファイル）内に記憶されることができる。コンピュータプログラムは、１つのコンピュータにおいて、あるいは１つのサイトに配置されるか又は複数のサイトに分散されて通信ネットワークによって相互接続される複数のコンピュータにおいて実行されるように展開されることができる。

本文書で説明されるプロセス及び論理フローを、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって実行することができ、入力データに対して作用し、出力を生成することによって、機能を実行することができる。プロセス及び論理フローはまた、例えばＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）のような特殊目的論理回路によって実行されることもでき、そのようなものとして装置も実装することもできる。

コンピュータプログラムの実行に適したプロセッサは、例として、汎用及び専用マイクロプロセッサの両方と、任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般に、プロセッサは、読取専用メモリ又はランダムアクセスメモリ又はその両方から命令及びデータを受け取ることになる。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令及びデータを記憶するための１つ以上のメモリデバイスである。一般に、コンピュータはまた、データを記憶するための１つ以上の大容量ストレージデバイス、例えば磁気ディスク、磁気光ディスク又は光ディスクを含むか、そこからデータを受け取り、そこにデータを転送し又はその両方を行うために動作可能に結合される。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ読取可能媒体は、例として、半導体メモリデバイス、例えばＥＰＲＯＭ、ＥＥＰＲＯＭ及びフラッシュメモリデバイス；磁気ディスク、例えば内部ハードディスク又はリムーバブルディスク;光磁気ディスク;並びにＣＤＲＯＭ及びＤＶＤ－ＲＯＭディスクを含む、すべての形態の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、特殊目的論理回路によって補足されるか又はその中に内蔵されることができる。

この特許文書は多くの詳細を含むが、これらは、いずれかの主題の範囲又は特許請求され得る範囲に対する限定として解釈されるべきではなく、むしろ、特定の技術の特定の実施形態に特有である可能性がある特徴の説明と解釈されるべきである。この特許文書において別個の実施形態の文脈で説明される特定の特徴を、単一の実施形態で組み合わせて実装することもできる。反対に、単一の実施形態の文脈において説明される様々な特徴を、複数の実施形態において別個に又は任意の適切な副次的組合せで実装することもできる。さらに、特徴は、特定の組合せにおいて作用するものとして上述され、最初にそのように特許請求されることもあるが、特許請求される組合せからの１つ以上の特徴が、場合によっては、その組合せから切り出される可能性があり、特許請求される組合せは、副次的組合せ又は副次的組合せのバリエーションに向けられる可能性がある。

同様に、動作は図面において特定の順序で示されるが、これは、所望の結果を達成するために、このような動作が、示される特定の順序で又は順番に実行すること、あるいは例示されたすべての動作を実行することを要求するものとして理解されるべきではない。さらに、この特許文書で説明される実施形態における様々なシステム構成要素の分離は、すべての実施形態においてこのような分離を必要とするものとして理解されるべきではない。

いくつかの実装及び実施例のみを説明したが、この特許文書で説明され、例示されているものに基づいて、他の実装、拡張及び変形がなされることができる。

［関連出願の相互参照］
本出願は、２０２０年６月１２日に出願された米国仮特許出願第６３／０３８，６０１号の優先権及び利益を主張する、２０２１年６月１１日に出願された国際特許出願第ＰＣＴ／ＵＳ２０２１／０３７１１８号に基づく。上述の特許出願は全て、その全体が参照により本明細書に組み込まれる。

Claims

ビデオ処理の方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームはフォーマットルールに準拠し、
前記フォーマットルールは、第２構文要素が現在のピクチャのピクチャヘッダ構文構造内に存在するかどうかを指定する第１構文要素の値に対する制約を指定し、
前記第２構文要素は、前記現在のピクチャのピクチャ順序カウント（ＰＯＣ）の最上位ビット（ＭＳＢ）サイクルの値を指定する、
方法。
前記第１構文要素の前記値は、フラグの値がゼロに等しく、かつインターレイヤ参照ピクチャ（ＩＬＲＰ）エントリが前記現在のピクチャのスライスの参照ピクチャリスト内にあることに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定する、
請求項１に記載の方法。
前記参照ピクチャリストは、第１参照ピクチャリスト（RefPicList[ 0 ]）又は第２参照ピクチャリスト（RefPicList[ 1 ]）を備える、
請求項２に記載の方法。
ゼロに等しい前記第１構文要素の前記値は、前記第２構文要素が前記ピクチャヘッダ構文構造内に存在しないことを指定する、
請求項２に記載の方法。
ゼロに等しい前記フラグの前記値は、前記インデックス化レイヤが前記インターレイヤ予測を使用することを許容されることを指定する、
請求項２に記載の方法。
前記第１構文要素の前記値は、フラグの値がゼロに等しく、かつピクチャが（ｉ）現在のレイヤの参照レイヤ内の現在のアクセスユニット（ＡＵ）内にある第２識別子に等しい第１識別子と、（ｉｉ）閾値以下の第３識別子とを有することに応答して、ゼロに等しく、前記フラグは、インデックス化レイヤがインターレイヤ予測を使用するかどうかを指定し、前記第１識別子は、ビデオコーディングレイヤ（ＶＣＬ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットが属するレイヤを指定し、前記第２識別子は、参照ピクチャが属するレイヤを指定し、前記第３識別子は、時間的識別子であり、前記閾値は、イントラランダムアクセスピクチャ（ＩＲＡＰ）ピクチャでも漸次復号リフレッシュ（ＧＤＲ）ピクチャでもない、インデックス化レイヤ内のピクチャが、インデックス化レイヤ内のピクチャを復号するためのインターレイヤ参照ピクチャ（ＩＲＬＰ）として使用されるかどうかを指定する第２構文要素に基づく、
請求項１に記載の方法。
前記第１識別子はnuh_layer_idであり、前記第２識別子はrefpicLayerIdであり、前記第３識別子はTemporalIdであり、前記第２構文要素はvps_max_tid_il_ref_pics_plus1である、
請求項６に記載の方法。
前記第１構文要素は、ゼロであることは全く要求されない、
請求項１に記載の方法。
前記第１構文要素はph_poc_msb_cycle_present_flagであり、フラグはvps_independent_layer_flagであり、前記第２構文要素はph_poc_msb_cycle_valである、
請求項２乃至８のいずれかに記載の方法。
ビデオ処理の方法であって、
１つ以上のピクチャを備えるビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームはフォーマットルールに準拠し、
前記フォーマットルールは、構文要素がない場合にピクチャ順序カウント（ＰＯＣ）の導出を指定し、
前記構文要素は、現在のピクチャの前記ＰＯＣの最上位ビット（ＭＳＢ）サイクルの値を指定する、
方法。
前記構文要素はph_poc_msb_cycle_valである、
請求項１０に記載の方法。
ビデオ処理の方法であって、
ビデオと、該ビデオのビットストリームとの間の変換を実行するステップを備え、
前記ビットストリームは、ルールに従ってピクチャを備えるアクセスユニットＡＵを備え、
前記ルールは、前記ＡＵの出力順序が前記ＡＵの復号順序と異なることに応答して、漸次復号リフレッシュ（ＧＤＲ）ピクチャが前記ビットストリームでは許容されないことを指定する、
方法。
コーディングされたレイヤビデオシーケンス（ＣＬＶＳ）内のすべてのピクチャの出力順序と復号順序は、フラグが１に等しいことに応答して同一であり、前記フラグは、ＧＤＲピクチャが有効であるかどうかを指定する、
請求項１２に記載の方法。
前記ＡＵの前記出力順序と前記復号順序は、フラグが、コーディングされたビデオシーケンス（ＣＶＳ）内のピクチャによって参照されるシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して同一であり、前記フラグは、ＧＤＲピクチャが有効であるかどうかを指定する、
請求項１２に記載の方法。
前記ＡＵの前記出力順序と前記復号順序は、フラグが、ピクチャによって参照されるシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して同一であり、前記フラグは、ＧＤＲピクチャが有効であるかどうかを指定する、
請求項１２に記載の方法。
前記ＡＵの前記出力順序と前記復号順序は、フラグが、前記ビットストリーム内のシーケンスパラメータセット（ＳＰＳ）について１に等しいことに応答して同一であり、前記フラグは、ＧＤＲピクチャが有効であるかどうかを指定する、
請求項１２に記載の方法。
前記フラグはsps_gdr_enabled_flagである、
請求項１３乃至１６のいずれかに記載の方法。
前記変換は、前記ビットストリームから前記ビデオを復号することを含む、
請求項１乃至１７のいずれかに記載の方法。
前記変換は、前記ビデオを前記ビットストリームに符号化することを含む、
請求項１乃至１７のいずれかに記載の方法。
ビデオを表すビットストリームをコンピュータ読取可能記録媒体に記憶する方法であって、
請求項１乃至１７のいずれか１つ以上に記載された方法に従って、前記ビデオから前記ビットストリームを生成するステップと、
前記ビットストリームを前記コンピュータ読取可能記録媒体に記憶するステップと、
を備える、方法。
請求項１乃至２０のいずれか１つ以上に記載される方法を実装するよう構成されるプロセッサを備える、ビデオ処理装置。
命令が記憶されたコンピュータ読取可能媒体であって、前記命令は、実行されると、プロセッサに請求項１乃至２０の１つ以上に記載の方法を実装させる、コンピュータ読取可能媒体。
請求項１乃至２０のいずれか１つ以上に従って生成されたビットストリームを記憶するコンピュータ読取可能媒体。
ビットストリームを記憶するためのビデオ処理装置であって、当該ビデオ処理装置は、請求項１乃至２０のいずれか１つ以上に記載される方法を実装するよう構成される、
ビデオ処理装置。