JP7372426B2

JP7372426B2 - ビデオビットストリームの中のオフセットによる参照ピクチャ再サンプリングの方法

Info

Publication number: JP7372426B2
Application number: JP2022168634A
Authority: JP
Inventors: チョイ，ビョンドゥ; ウェンジャー，ステファン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2019-09-24
Filing date: 2022-10-20
Publication date: 2023-10-31
Anticipated expiration: 2040-09-22
Also published as: US20210092391A1; US11641472B2; AU2023203696A1; KR20210125599A; CN113632463A; AU2020356392A1; EP4035355A4; US11317093B2; US20240179319A1; JP7164734B2; AU2020356392B2; JP2022191451A; EP4035355A1; JP2023179748A; SG11202110811PA; US20220210428A1; CA3136266A1; US11943446B2; WO2021061630A1; US20230239476A1

Description

［関連出願］
本願は、参照により全体がここに組み込まれる、２０１９年９月２４日に出願した米国仮特許出願番号第６２/９０５,３１９号、及び２０２０年９月１６日に出願した米国特許出願番号第１７/０２２,７２７号、の優先権を主張する。

［技術分野］
開示の主題は、ビデオコーディング及び復号に関し、より具体的には、再サンプリングピクチャサイズ指示を有する参照ピクチャ再サンプリングのシグナリングに関する。

動き補償と共にインターピクチャ予測を用いるビデオコーディング及び復号が知られている。非圧縮デジタルビデオは、一連のピクチで構成されることができ、各ピクチャは、例えば１９２０×１０８０個のルミナンスサンプル及び関連するクロミナンスサンプルの空間次元を有する。一連のピクチャは、例えば毎秒６０ピクチャ又は６０Hｚの固定又は可変ピクチャレート（略式にフレームレートとしても知られている）を有し得る。非圧縮ビデオは、かなりのビットレート要件を有する。例えば、８ビット／サンプルの１０８０ｐ６０４：２：０ビデオ（６０Hzフレームレートで１９２０×１０８０ルミナンスサンプル解像度）は、１．５Ｇｂｉｔ／ｓに近い帯域幅を必要とする。１時間のこのようなビデオは６００Ｇｂｙｔｅより多くの記憶空間を必要とする。

ビデオコーディング及び復号の１つの目的は、圧縮を通じて、入力ビデオ信号の中の冗長性の削減であり得る。圧縮は、幾つかの場合には大きさで２桁以上も、前述の帯域幅又は記憶空間要件を軽減するのを助けることができる。損失又は無損失圧縮の両方、及びそれらの組み合わせが利用できる。無損失圧縮は、元の信号の正確なコピーが圧縮された元の信号から再構成可能である技術を表す。損失圧縮を用いると、再構成された信号は、元の信号と同一ではないが、元の信号と再構成された信号との間の歪みは、意図される用途のために有用な再構成された信号を生成するのに十分に小さい。ビデオの場合には、損失圧縮が広く利用される。耐えうる歪みの量は、アプリケーションに依存し、例えば、特定の消費者ストリーミングアプリケーションのユーザは、テレビジョン投稿アプリケーションのユーザよりも高い歪みに耐え得る。達成可能な圧縮比は、許容可能／耐性歪みが高いほど、高い圧縮比を生じ得ることを反映できる。

ビデオエンコーダ及びデコーダは、例えば動き補償、変換、量子化、及びエントロピーコーディングを含む幾つかの広い分類からの技術を利用できる。このうちの幾つかが以下に紹介される。

歴史的に、ビデオエンコーダ及びデコーダは、多くの場合にコーディングビデオシーケンス（coded video sequence (CVS)）、グループオブピクチャ（Group of Pictures (GOP)）、又は同様のマルチピクチャ時間フレームについて定義され一定のままである所与のピクチャサイズで動作する傾向がある。例えば、ＭＰＥＧ－２では、システム設計は、Ｉピクチャでだけでなく、従って標準的にＧＯＰについて、シーンのアクティビティのような要因に依存して水平方向の解像度（従って、ピクチャサイズ）を変更することが知られている。ＣＶＳの中の異なる解像度の使用のための参照ピクチャの再サンプリングは、例えばITU－T Rec. H.２６３ Annex P により知られている。しかしながら、ここで、ピクチャサイズは変化しないので、参照ピクチャのみが再サンプリングされ、結果として（ダウンサンプリングの場合には）ピクチャキャンバスの部分のみが使用され、（アップサンプリングの場合には）シーンの部分のみがキャプチャされる可能性がある。更に、H.２６３ Annex Qは、上方向又は下方向に、（各次元において）２の倍数で個々のマクロブロックの再サンプリングを許容する。ここでも、ピクチャサイズは同じままである。Ｈ．２６３ではマクロブロックのサイズは固定され、従ってシグナリングされる必要がない。

予測ピクチャにおけるピクチャサイズの変更は、近年のビデオコーディングにおいてより主流となっている。例えば、ＶＰ９は、参照ピクチャ再サンプリング及びピクチャ全体の解像度の変化を許容する。同様に、ＶＶＣを対象としている特定の提案（例えば、参照によりここに全体が組み込まれる、Hendry, et. al, “On adaptive resolution change (ARC) for VVC”, Joint Video Team document JVET－M０１３５－v１, Jan９－１９, ２０１９を含む）は、異なる－より高い又はより低い－解像度への参照ピクチャ全体の再サンプリングを許容する。該文献では、シーケンスパラメータセットの中にコーディングされピクチャパラメータセットの中のピクチャ毎のシンタックス要素により参照されるべき異なる候補解像度が提案される。

実施形態では、少なくとも１つのプロセッサを用いて符号化ビデオビットストリームを復号する方法が提供され、前記方法は、
参照ピクチャ再サンプリングのために適合ウインドウが使用されないことを示すフラグを取得するステップと、
前記フラグが、前記参照ピクチャ再サンプリングのために前記適合ウインドウが使用されないことを示すことに基づき、再サンプリングピクチャサイズがシグナリングされるかどうかを決定するステップと、
前記再サンプリングピクチャサイズがシグナリングされるという決定に基づき、前記再サンプリングピクチャサイズに基づき再サンプリング比を決定するステップと、
前記再サンプリングピクチャサイズがシグナリングされないという決定に基づき、出力ピクチャサイズに基づき前記再サンプリング比を決定するステップと、
前記再サンプリング比を用いて現在ピクチャに対して前記参照ピクチャ再サンプリングを実行するステップと、を含む。

実施形態では、符号化ビデオビットストリームを復号する装置が提供され、前記装置は、
プログラムコードを格納するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、前記プログラムコードにより命令される通りに動作するよう構成される少なくとも１つのプロセッサと、
を含み、前記プログラムコードは、
前記少なくとも１つのプロセッサに、参照ピクチャ再サンプリングのために適合ウインドウが使用されないことを示すフラグを取得させるよう構成される取得コードと、
前記少なくとも１つのプロセッサに、前記フラグが、前記参照ピクチャ再サンプリングのために前記適合ウインドウが使用されないと示すことに基づき、再サンプリングピクチャサイズがシグナリングされるかどうかを決定させるよう構成される第１決定コードと、
前記少なくとも１つのプロセッサに、前記再サンプリングピクチャサイズがシグナリングされるという決定に基づき、前記再サンプリングピクチャサイズに基づき再サンプリング比を決定させるよう構成される第２決定コードと、
前記少なくとも１つのプロセッサに、前記再サンプリングピクチャサイズがシグナリングされないという決定に基づき、出力ピクチャサイズに基づき前記再サンプリング比を決定させるよう構成される第３決定コードと、
前記少なくとも１つのプロセッサに、前記再サンプリング比を用いて現在ピクチャに対して前記参照ピクチャ再サンプリングを実行させるよう構成される実行コードと、を含む。

実施形態では、命令を格納している非一時的コンピュータ可読媒体が提供され、前記命令は、符号化ビデオビットストリームを復号する装置の１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、
参照ピクチャ再サンプリングのために適合ウインドウが使用されないことを示すフラグを取得させ、
前記フラグが、前記参照ピクチャ再サンプリングのために前記適合ウインドウが使用されないことを示すことに基づき、再サンプリングピクチャサイズがシグナリングされるかどうかを決定させ、
前記再サンプリングピクチャサイズがシグナリングされるという決定に基づき、前記再サンプリングピクチャサイズに基づき再サンプリング比を決定させ、
前記再サンプリングピクチャサイズがシグナリングされないという決定に基づき、出力ピクチャサイズに基づき前記再サンプリング比を決定させ、
前記再サンプリング比を用いて現在ピクチャに対して前記参照ピクチャ再サンプリングを実行させる。

開示の主題の更なる特徴、特性、及び種々の利点は、以下の詳細な説明及び添付の図面から一層明らかになるだろう。

実施形態による、通信システムの簡易ブロック図の概略図である。

実施形態による、デコーダの簡易ブロック図の概略図である。

実施形態による、エンコーダの簡易ブロック図の概略図である。

実施形態によるＡＲＣパラメータをシグナリングするオプションの概略図である。

実施形態によるシンタックステーブルの例の概略図である。実施形態によるシンタックステーブルの例の概略図である。

実施形態によるＰＰＳの中でのピクチャサイズ及び適合ウインドウのシグナリングの概略図である。

実施形態による、符号化ビデオビットストリームを復号する例示的な処理のフローチャートである。

一実施形態による、コンピュータシステムの概略図である。

図１は、本発明の一実施形態による通信システム（１００）の簡易ブロック図を示す。システム（１００）は、ネットワーク（１５０）を介して相互接続される少なくとも２つの端末（１１０～１２０）を含んでよい。データの一方向送信では、第１端末（１１０）は、ネットワーク（１５０）を介して他の端末（１２０）へ送信するために、ビデオデータをローカル位置でコーディングしてよい。第２端末（１２０）は、ネットワーク（１５０）から他の端末のコーディングビデオデータを受信し、コーディングデータを復号して、復元したビデオデータを表示してよい。単方向データ伝送は、メディアサービングアプリケーション等で共通であってよい。

図１は、例えばビデオ会議中に生じ得る、コーディングビデオの双方向送信をサポートするために適用される第２の端末ペア（１３０、１４０）を示す。データの双方向送信では、各端末（１３０、１４０）は、ネットワーク（１５０）を介して他の端末へ送信するために、ローカルでキャプチャしたビデオデータをコーディングしてよい。各端末１３０、１４０は、また、他の端末により送信されたコーディングビデオデータを受信してよく、コーディングデータを復号してよく、及び復元したビデオデータをローカルディスプレイ装置で表示してよい。

図１では、端末装置（１１０～１４０）は、サーバ、パーソナルコンピュータ、及びスマートフォンとして示されてよいが、本開示の原理はこれらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤ、及び／又は専用ビデオ会議設備による適用がある。ネットワーク（１５０）は、端末（１１０～１４０）の間でコーディングビデオデータを運ぶ任意の数のネットワークを表し、例えば有線及び／又は無線通信ネットワークを含む。通信ネットワーク（１５０）は、回線切り替え及び／又はパケット切り替えチャネルでデータを交換してよい。代表的なネットワークは、電子通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び／又はインターネットを含む。本発明の議論の目的で、ネットワーク（１５０）のアーキテクチャ及びトポロジは、以下で特に断りの無い限り、本開示の動作にとって重要でないことがある。

図２は、開示の主題の適用の一例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を示す。開示の主題は、例えばビデオ会議、デジタルＴＶ、ＣＤ、ＤＶＤ、メモリスティック、等を含むデジタル媒体への圧縮ビデオの格納、他のビデオ可能アプリケーション、等に等しく適用可能である。

ストリーミングシステムは、例えば非圧縮ビデオサンプルストリーム（２０２）を生成するビデオソース（２０１）、例えばデジタルカメラを含み得るキャプチャサブシステム（２１３）を含んでよい。サンプルストリーム（２０２）は、符号化ビデオビットストリームと比べるとき高データ容量を強調するために太線で示され、カメラ（２０１）に結合されるエンコーダ（２０３）により処理できる。エンコーダ（２０３）は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み、以下に詳述するように開示の主題の態様を可能にし又は実装することができる。符号化ビデオビットストリーム（２０４）は、サンプルストリームと比べたとき、低データ容量を強調するために細線で示され、将来の使用のためにストリーミングサーバ（２０５）に格納できる。１つ以上のストリーミングクライアント（２０６、２０８）は、ストリーミングサーバ（２０５）にアクセスして、符号化ビデオビットストリーム（２０４）のコピー（２０７、２０９）を読み出すことができる。クライアント（２０６）は、ビデオデコーダ（２１０）を含むことができる。ビデオデコーダ（３１０）は、符号化ビットストリーム（２０７）の入来するコピーを復号し、ディスプレイ（２１２）又は他のレンダリング装置（図示しない）においてレンダリング可能な出力ビデオサンプルストリーム（２１１）を生成する。幾つかのストリーミングシステムでは、ビデオビットストリーム（２０４、２０７、２０９）は、特定のビデオコーディング／圧縮規格に従い符号化できる。これらの規格の例は、ITU－T Recommendation H.２６５を含む。策定中のビデオコーディング規格は、略式にVVC（Versatile Video Coding）として知られている。開示の主題は、ＶＶＣの文脈で使用されてよい。

図３は、本開示の実施形態によるビデオデコーダ（２１０）の機能ブロック図であり得る。

受信機（３１０）は、ビデオデコーダ（２１０）により復号されるべき１つ以上のコーディングビデオシーケンス、同じ又は別の実施形態では、一度に１つのコーディングビデオシーケンスを受信してよい。ここで、各コーディングビデオシーケンスの復号は、他のコーディングビデオシーケンスと独立している。コーディングビデオシーケンスは、符号化ビデオデータを格納する記憶装置へのハードウェア／ソフトウェアリンクであってよいチャネル（３１２）から受信されてよい。受信機（３１０）は、他のデータ、例えば、それぞれの使用エンティティ（図示しない）へと転送され得るコーディング音声データ及び／又は補助データストリームと共に、符号化ビデオデータを受信してよい。受信機（３１０）は、他のデータからコーディングビデオシーケンスを分離してよい。ネットワークジッタを除去するために、バッファメモリ（３１５）は、受信機（３１０）とエントロピーデコーダ／パーサ（３２０）（以後、「パーサ」）との間に接続されてよい。受信機（３１０）が、十分な帯域幅の記憶／転送装置から制御可能に、又はアイソクロナス（isosynchronous）ネットワークから、データを受信しているとき、バッファ（３１５）は、必要なくてよく又は小さくできる。インターネットのようなベストエフォート型パケットネットワークで使用する場合、バッファ（３１５）が必要であってよく、比較的大きくすることができ、有利なことに適応サイズにすることができる。

ビデオデコーダ（２１０）は、エントロピーコーディングビデオシーケンスからシンボル（３２１）を再構成するために、パーサ（３２０）を含んでよい。これらのシンボルのカテゴリは、デコーダ（２１０）の動作を管理するために使用される情報、及び場合によっては図３に示したようにデコーダの統合部分ではないがデコーダに接続され得るディスプレイ（２１２）のようなレンダリング装置を制御するための情報を含む。レンダリング装置のための制御情報は、SEI（Supplementary Enhancement Information）メッセージ又はVUI（Video Usability Information）パラメータセットフラグメント（図示しない）の形式であってよい。パーサ（３２０）は、受信された符号化ビデオシーケンスをパース／エントロピー復号してよい。コーディングビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト依存性を有する又は有しない算術的コーディング、等を含む、当業者によく知られた原理に従うことができる。パーサ（３２０）は、コーディングビデオシーケンスから、ビデオデコーダの中のピクセルのサブグループのうちの少なくとも１つについて、該グループに対応する少なくとも１つのパラメータに基づき、サブグループパラメータのセットを抽出してよい。サブグループは、ＧＯＰ（Groups of Picture）、ピクチャ、サブピクチャ、タイル、スライス、ブリック、マクロブロック、コーディング木単位（Coding Tree Unit ：CTU）、コーディング単位（Coding Unit：CU）、ブロック、変換単位（Transform Unit：TU）、予測単位（Prediction Unit：PU）、等を含み得る。タイルは、ピクチャ内の特定のタイル列及び行の中で長方形領域のＣＵ／ＣＴＵを示してよい。ブリックは、特定のタイル内の長方形領域のＣＵ/ＣＴＵ行を示してよい。スライスは、ＮＡＬ単位に含まれる、ピクチャの１つ以上のブリックを示してよい。サブピクチャは、ピクチャ内の１つ以上のスライスの長方形領域を示してよい。エントロピーデコーダ／パーサは、コーディングビデオシーケンスから、変換係数、量子化パラメータ値、動きベクトル、等のような情報も抽出してよい。

パーサ（３２０）は、バッファ（３１５）から受信したビデオシーケンスに対してエントロピー復号／パース動作を実行して、シンボル（３２１）を生成してよい。

シンボル（３２１）の再構成は、コーディングビデオピクチャ又はその部分の種類（例えば、インター及びイントラピクチャ、インター及びイントラブロック）及び他の要因に依存して、複数の異なるユニットを含み得る。どのユニットがどのように含まれるかは、パーサ（３２０）によりコーディングビデオシーケンスからパースされたサブグループ制御情報により制御できる。パーサ３２０と以下の複数のユニットとの間のこのようなサブグループ制御情報のフローは、明確さのために示されない。

既に言及した機能ブロックを超えて、デコーダ（２１０）は、後述のように、多数の機能ユニットに概念的に細分化できる。商用的制約の下で動作する実際の実装では、これらのユニットの多くは、互いに密に相互作用し、少なくとも部分的に互いに統合され得る。しかしながら、開示の主題を説明する目的で、機能ユニットへの以下の概念的細分化は適切である。

第１ユニットは、スケーラ／逆変換ユニット３５１である。スケーラ／逆変換ユニット（３５１）は、量子化された変換係数、及び、どの変換が使用されるべきか、ブロックサイズ、量子化係数、量子化スケーリングマトリクス、等を含む制御情報を、パーサ（３２０）からのシンボル（３２１）として受信する。これは、アグリゲータ（３５５）に入力され得るサンプル値を含むブロックを出力できる。

幾つかの例では、スケーラ／逆変換ユニット（３５１）の出力サンプルは、イントラコーディングブロック、つまり、前に再構成されたピクチャからの予測情報を使用しないが現在ピクチャの前に再構成された部分からの予測情報を使用可能なブロック、に属することができる。このような予測情報は、イントラピクチャ予測ユニット（３５２）により提供できる。幾つかの場合には、イントラピクチャ予測ユニット（３５２）は、再構成中のブロックと同じサイズ及び形状のブロックを、現在（部分的には再構成された）ピクチャ（３５８）からフェッチした周囲の既に再構成された情報を用いて、生成する。アグリゲータ（３５５）は、幾つかの場合には、サンプル毎に、イントラ予測ユニット（３５２）の生成した予測情報を、スケーラ／逆変換ユニット（３５１）により提供された出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（３５１）の出力サンプルは、インターコーディングされた、場合によっては動き補償されたブロックに関連し得る。このような場合には、動き補償予測ユニット（３５３）は、参照ピクチャメモリ（３５７）にアクセスして、予測のために使用されるサンプルをフェッチできる。ブロックに関連するシンボル（３２１）に従いフェッチしたサンプルを動き補償した後に、これらのサンプルは、アグリゲータ（３５５）により、出力サンプル情報を生成するために、スケーラ／逆変換ユニットの出力に追加され得る（この場合、残差サンプル又は残差信号と呼ばれる）。動き補償予測ユニットが予測サンプルをフェッチする参照ピクチャメモリ内のアドレスは、例えばＸ、Ｙ及び参照ピクチャコンポーネントを有し得るシンボル（３２１）の形式で、動き補償予測ユニットの利用可能な動きベクトルにより制御できる。動き補償は、サブサンプルの正確な動きベクトルが使用中であるとき参照ピクチャメモリからフェッチされたサンプル値の補間、動きベクトル予測メカニズム、等も含み得る。

アグリゲータ（３５５）の出力サンプルは、ループフィルタユニット（３５６）において種々のループフィルタリング技術を受け得る。ビデオ圧縮技術は、コーディングビデオビットストリームに含まれ且つパーサ（３２０）からのシンボル（３２１）としてループフィルタユニット（３５６）に利用可能にされたパラメータにより制御されるが、コーディングピクチャ又はコーディングビデオシーケンスの（復号順序で）前の部分の復号中に取得されたメタ情報にも応答し、前に再構成されループフィルタリングされたサンプル値にも応答し得るインループフィルタ技術を含み得る。

ループフィルタユニット（３５６）の出力は、レンダー装置（２１２）へと出力でき及び将来のインターピクチャ予測で使用するために参照ピクチャメモリに格納され得るサンプルストリームであり得る。

特定のコーディングピクチャは、一旦完全に再構成されると、将来の予測のための参照ピクチャとして使用できる。コーディングピクチャが完全に再構成され、コーディングピクチャが（例えばパーサ（３２０）により）参照ピクチャとして識別されると、現在参照ピクチャ（３５８）は、参照ピクチャバッファ（３５７）の一部になることができ、後続のコーディングピクチャの再構成を開始する前に、新鮮な現在ピクチャメモリを再割り当てできる。

ビデオデコーダ（２１０）は、ITU－T Rec. H.２６５のような規格で策定され得る所定のビデオ圧縮技術に従い復号動作を実行してよい。コーディングビデオシーケンスが、ビデオ圧縮技術又は規格で、具体的にはその中のプロファイル文書で指定された、ビデオ圧縮技術又は規格のシンタックスに従うという意味で、コーディングビデオシーケンスは、使用中のビデオ圧縮技術又は規格により指定されたシンタックスに従ってよい。また、遵守のために必要なことは、コーディングビデオシーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルにより定められる限界の範囲内であることであり得る。幾つかの場合には、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えばメガサンプル／秒で測定される）、最大参照ピクチャサイズ、等を制限する。レベルにより設定される限界は、幾つかの場合には、ＨＲＤ（Hypothetical Reference Decoder）仕様及びコーディングビデオシーケンスの中でシグナリングされるＨＤＲバッファ管理のためのメタデータを通じて更に制限され得る。

実施形態では、受信機（３１０）は、符号化ビデオと共に追加（冗長）データを受信してよい。追加データは、コーディングビデオシーケンスの部分として含まれてよい。追加データは、データを正しく復号するため及び／又は元のビデオデータをより正確に再構成するために、ビデオデコーダ２１０により使用されてよい。追加データは、例えば、時間的、空間的、又はＳＮＲ拡張レイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、等の形式であり得る。

図４は、本開示の一実施形態によるビデオエンコーダ（２０３）の機能ブロック図であり得る。

エンコーダ（２０３）は、ビデオサンプルを、エンコーダ（２０３）によりコーディングされるべきビデオ画像をキャプチャし得るビデオソース（２０１）（エンコーダの部分ではない）から受信してよい。

ビデオソース（２０１）は、エンコーダ（２０３）によりコーディングされるべきソースビデオシーケンスを、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビット、．．．）、任意の色空間（例えば、BT.６０１ Y CrCB, RGB,．．．）、及び任意の適切なサンプリング構造（例えば、Y CrCb ４:２:０, Y CrCb ４:４:４）のデジタルビデオサンプルストリームの形式で、提供してよい。メディア提供システムでは、ビデオソース（２０１）は、前に準備されたビデオを格納する記憶装置であってよい。ビデオ会議システムでは、ビデオソース（２０３）は、ビデオシーケンスとしてローカル画像情報をキャプチャするカメラであってよい。ビデオデータは、続けて閲覧されると動きを与える複数の個別ピクチャとして提供されてよい。ピクチャ自体は、ピクセルの空間的配列として組織化されてよい。各ピクセルは、使用中のサンプリング構造、色空間、等に依存して、１つ以上のサンプルを含み得る。当業者は、ピクセルとサンプルとの間の関係を直ちに理解できる。以下の説明はサンプルに焦点を当てる。

実施形態によると、エンコーダ（２０３）は、ソースビデオシーケンスのピクチャを、コーディングビデオシーケンス（４４３）へと、リアルタイムに又はアプリケーションにより要求される任意の他の時間制約の下でコーディングし圧縮してよい。適切なコーディング速度の実施は、制御部（４５０）の１つの機能である。制御部は、後述するように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確さのために図示されない。制御部により設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、．．．）、ピクチャサイズ、GOP（group of pictures）レイアウト、最大動きベクトル探索範囲、等を含み得る。当業者は、特定のシステム設計のために最適化されたビデオエンコーダ（２０３）に関連し得るとき、制御部４５０の他の機能を直ちに識別できる。

幾つかのビデオエンコーダは、当業者が「コーディングループ」として直ちに認識する中で動作する。非常に簡略化した説明として、コーディングループは、エンコーダ（４３０）（以後、「ソースコーダ」）（コーディングされるべき入力ピクチャと参照ピクチャとに基づき、シンボルを生成する）及びエンコーダ（２０３）内に組み込まれ、シンボルを再構成して、（シンボルとコーディングビデオビットストリームとの間の任意の圧縮が開示の主題において考慮されるビデオ圧縮技術の中で無損失であるとき）（リモート）デコーダが生成し得るサンプルデータを生成する（ローカル）デコーダ（４３３）の符号化部分を含むことができる。再構成されたサンプルストリームは、参照ピクチャメモリ４３４に入力される。シンボルストリームの復号が、デコーダ位置（ローカル又はリモート）と独立にビット正確な結果をもたらすとき、参照ピクチャバッファの内容も、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分が、復号中に予測を用いるときデコーダが「見る」のと正確に同じサンプル値を、参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理（及び、例えばチャネルエラーのために同期性が維持できない場合には、結果として生じるドリフト）は、当業者によく知られている。

「ローカル」デコーダ（４３３）の動作は、図３と関連して以上に詳述した「リモート」デコーダ（２１０）のものと同じであり得る。簡単に図４も参照すると、しかしながら、シンボルが利用可能であり、エントロピーコーダ（４４５）及びパーサ（３２０）によるコーディングビデオシーケンスへのシンボルの符号化／復号が無損失であり得るので、チャネル（３１２）、受信機（３１０）、バッファ（３１５）、及びパーサ（３２０）を含むデコーダ（２１０）のエントロピー復号部分は、ローカルデコーダ（４３３）に完全に実装されなくてよい。

この点で行われる考察は、デコーダ内に存在するパース／エントロピー復号を除く任意のデコーダ技術も、対応するエンコーダ内と実質的に同一の機能形式で存在する必要があるということである。この理由から、開示の主題は、デコーダ動作に焦点を当てる。エンコーダ技術の説明は、それらが包括的に説明されるデコーダ技術の逆であるので、省略できる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。

動作中、幾つかの例では、ソースコーダ（４３０）は、動き補償された予測コーディングを実行してよい。これは、「参照フレーム」として指定されたビデオシーケンスからの１つ以上の前にコーディングされたフレームを参照して予測的に入力フレームをコーディングする。この方法では、コーディングエンジン（４３２）は、入力フレームのピクセルブロックと、入力フレームに対する予測基準として選択されてよい参照フレームのピクセルブロックとの間の差分をコーディングする。

ローカルビデオデコーダ（４３３）は、ソースコーダ（４３０）により生成されたシンボルに基づき、参照フレームとして指定されてよいフレームのコーディングビデオデータを復号してよい。コーディングエンジン（４３２）の動作は、有利なことに、損失処理であってよい。コーディングビデオデータがビデオデコーダ（図４に図示されない）において復号され得るとき、再構成ビデオシーケンスは、標準的に、幾つかのエラーを有するソースビデオシーケンスの複製であってよい。ローカルビデオデコーダ（４３３）は、参照フレームに対してビデオデコーダにより実行され得る復号処理を複製し、参照ピクチャキャッシュ（４３４）に格納されるべき再構成参照フレームを生じ得る。このように、エンコーダ（２０３）は、（伝送誤りが無ければ）遠端ビデオデコーダにより取得される再構成参照フレームと共通の内容を有する再構成参照フレームのコピーをローカルに格納してよい。

予測器（４３５）は、コーディングエンジン（４３２）のために予測探索を実行してよい。つまり、コーディングされるべき新しいフレームについて、予測器（４３５）は、新しいピクチャのための適切な予測基準として機能し得る（候補参照ピクセルブロックのような）サンプルデータ又は参照ピクチャ動きベクトル、ブロック形状、等のような特定のメタデータについて、参照ピクチャメモリ（４３４）を検索してよい。予測器（４３５）は、適切な予測基準を見付けるために、サンプルブロック－ピクセルブロック毎に動作してよい。幾つかの例では、予測器（４３５）により取得された検索結果により決定されるように、入力ピクチャは、参照ピクチャメモリ（４３４）に格納された複数の参照ピクチャから引き出された予測基準を有してよい。

制御部（４５０）は、例えば、ビデオデータの符号化のために使用されるパラメータ及びサブグループパラメータの設定を含む、ビデオコーダ（４３０）のコーディング動作を管理してよい。

全ての前述の機能ユニットの出力は、エントロピーコーダ（４４５）におけるエントロピーコーディングを受けてよい。エントロピーコーダは、ハフマンコーディング、可変長コーディング、算術コーディング、等のような当業者によく知られた技術に従いシンボルを無損失圧縮することにより、種々の機能ユニットにより生成されたシンボルを、コーディングビデオシーケンスへと変換する。

送信機（４４０）は、コーディングビデオデータを格納し得る記憶装置へのハードウェア／ソフトウェアリンクであってよい通信チャネル（４６０）を介する伝送のために準備するために、エントロピーコーダ（４４５）により生成されたコーディングビデオシーケンスをバッファリングしてよい。送信機（４４０）は、ビデオコーダ（４３０）からのコーディングビデオデータを、送信されるべき他のデータ、例えばコーディング音声データ及び／又は補助データストリーム（図示されないソース）とマージ（merge）してよい。

制御部（４５０）は、エンコーダ（２０３）の動作を管理してよい。コーディング中、制御部（４５０）は、それぞれのピクチャに適用され得るコーディング技術に影響し得る特定のコーディングピクチャタイプを、各コーディングピクチャに割り当ててよい。例えば、ピクチャは、多くの場合、以下のピクチャタイプのうちの１つとして割り当てられてよい。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の任意の他のフレームを使用せずにコーディング及び復号され得るピクチャであってよい。幾つかのビデオコーデックは、例えばIDR（Independent Decoder Refresh）ピクチャを含む異なる種類のイントラピクチャを許容する。当業者は、Ｉピクチャの変形、及びそれらの個々の適用及び特徴を認識する。

予測ピクチャ（Ｐピクチャ）は、殆どの場合、各ブロックのサンプル値を予測するために１つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いてコーディング及び復号され得るピクチャであってよい。同様に、マルチ予測ピクチャは、単一のブロックの再構成のために、２つより多くの参照ピクチャ及び関連付けられたメタデータを使用できる。

ソースピクチャは、共通に、複数のサンプルブロック（例えば、それぞれ４×４、８×８、４×８、又は１６×１６個のサンプルのブロック）に空間的に細分化され、ブロック毎にコーディングされてよい。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てにより決定される他の（既にコーディングされた）ブロックへの参照により予測的にコーディングされてよい。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてよく、又はそれらは同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてよい（空間予測又はイントラ予測）。Ｐピクチャのピクセルブロックは、１つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、予測的にコーディングされてよい。Ｂピクチャのブロックは、１つ又は２つの前にコーディングされた参照ピクチャを参照して、空間予測を介して又は時間予測を介して、非予測的にコーディングされてよい。

ビデオコーダ（２０３）は、ITU－T Rec. H.２６５のような所定のビデオコーディング技術又は規格に従いコーディング動作を実行してよい。その動作において、ビデオコーダ（２０３）は、入力ビデオシーケンスの中の時間的及び空間的冗長性を利用する予測コーディング動作を含む種々の圧縮動作を実行してよい。コーディングビデオデータは、したがって、使用されているビデオコーディング技術又は規格により指定されたシンタックスに従ってよい。

一実施形態では、送信機（４４０）は、符号化ビデオと共に追加データを送信してよい。ビデオコーダ（４３０）は、このようなデータをコーディングビデオシーケンスの部分として含んでよい。追加データは、時間／空間／ＳＮＲ拡張レイヤ、冗長ピクチャ及びスライスのような他の形式の冗長データ、SEI（Supplementary Enhancement Information）メッセージ、VUI（Visual Usability Information）パラメータセットフラグメント、等を含んでよい。

最近、複数の意味論的に独立したピクチャ部分の単一のビデオピクチャへの圧縮ドメインアグリゲーション又は抽出が、注目を浴びている。特に、例えば、３６０コーディング又は特定の監視アプリケーションのコンテキストで、複数の意味論的に独立したソースピクチャ（例えば、立方体投影された３６０度シーンの６個の立方体表面、又は複数カメラ監視設定の場合の個々のカメラ入力）は、所与の時点における異なるシーン毎のアクティビティに対応するために、別個の適応解像度設定を必要とすることがある。言い換えると、エンコーダは、所与の時点で、３６０度全体又は監視シーンを生成する異なる意味論的に独立したピクチャについて異なる再サンプリング因子を使用するよう選択してよい。単一のピクチャに結合されるとき、これは参照ピクチャ再サンプリングが実行されること、及びコーディングピクチャの部分について、適応解像度コーディングシグナリングが利用可能であることを要求する。

以下では、この説明の残りの部分で参照される幾つかの用語が紹介される。

サブピクチャは、幾つかの場合には、サンプル、ブロック、マクロブロック、コーディングユニット、又は意味論的にグループ化され変更された解像度で独立にコーディングされてよい同様のエンティティの長方形構成を表してよい。１つ以上のサブピクチャは、ピクチャを形成してよい。１つ以上のコーディングサブピクチャは、コーディングピクチャを形成してよい。１つ以上のサブピクチャは、ピクチャに組み立てられてよく、１つ以上のサブピクチャは、ピクチャから抽出されてよい。特定の環境では、１つ以上のコーディングサブピクチャは、サンプルレベルに変換することなく、圧縮ドメインにおいてコーディングピクチャへと組み立てられてよく、同じ又は他の場合には、１つ以上のコーディングサブピクチャは、圧縮ドメインにおいてコーディングピクチャから抽出されてよい。

参照ピクチャ再サンプリング（Reference Picture Resampling (RPR)）又は適応解像度変更（Adaptive Resolution Change (ARC)）は、例えば参照ピクチャ再サンプリングにより、コーディングビデオシーケンス内のピクチャ又はサブピクチャの解像度の変更を許容するメカニズムを表してよい。ＲＰＲ／ＡＲＣパラメータは、以下では、適応解像度変更を実行するために必要な制御情報を表す。これは、例えば、フィルタパラメータ、スケーリング因子、出力及び／又は参照ピクチャの解像度、種々の制御フラグ、等を含んでよい。

実施形態では、コーディング及び復号は、単一の意味論的に独立したコーディングビデオピクチャに対して実行されてよい。独立したＲＰＲ／ＡＲＣパラメータによる複数のサブピクチャのコーディング／復号の意味、及びその暗示される追加の複雑さを説明する前に、ＲＰＲ／ＡＲＣパラメータのシグナリングが説明されるべきである。

図５Ａ～５Ｅを参照すると、ＲＰＲ／ＡＲＣパラメータをシグナリングする幾つかの実施形態が示される。実施形態の各々と共に記されるように、それらは、コーディング効率、複雑さ、及びアーキテクチャの観点で、特定の利点及び特定の欠点を有することがある。ビデオコーディング規格又は技術は、ＲＰＲ／ＡＲＣパラメータをシグナリングするために、これらの実施形態、又は関連技術から分かるオプション、のうちの１つ以上を選択してよい。実施形態は、相互に排他的でなくてよく、或いは、アプリケーションの必要、技術的に関連する規格、又はエンコーダの選択に基づき、交換されてよい。

ＲＰＲ／ＡＲＣパラメータのクラスは以下を含んでよい：

－Ｘ及びＹ次元において別個の又は結合された、アップ／ダウンサンプル因子。

－時間次元の追加に伴う、所与の数のピクチャについて一定速度ズームイン／アウトを示す、アップ／ダウンサンプル因子。

－上述の２つのうちのいずれかは、因子を含むテーブルを指してよい１つ以上のおそらく短いシンタックス要素のコーディングを含んでよい。

－Ｘ又はＹ次元における、結合された又は別個の、入力ピクチャ、出力ピクチャ、参照ピクチャ、コーディングピクチャの、サンプル、ブロック、マクロブロック、コーディングユニット（coding units (CUs)）、又は任意の他の適切な粒度のユニット内の解像度。１つより多くの解像度がある場合（例えば、入力ピクチャについて１つ、参照ピクチャについて１つ）、特定の場合には、値の１つのセットが、値の別のセットから推定されてよい。これは、例えば、フラグの使用により制御することができる。更に詳細な例については以下を参照する。

－「ワーピング（warping）」座標は、ここでも上述のような適切な粒度で、H.２６３ Annex P で使用されるものを含む。H.２６３ Annex Pは、このようなワーピング座標をコーディングするための１つの効率的な方法を定義するが、他の更に効率的な可能性のある方法も考案される可能性がある。例えば、Annex Pのワーピング座標の可変長リバーシブルＨｕｆｆｍａｎ型コーディングは、適切な長さのバイナリコーディングにより置き換えられる。ここで、バイナリコードワードの長さは、例えば、最大ピクチャサイズから導出され、場合によっては特定の係数により乗算され特定の値によりオフセットされ得、従って、最大ピクチャサイズの境界の外部での「ワーピング」を可能にする。

－アップ又はダウンサンプリングフィルタパラメータ実施形態では、アップ及び／又はダウンサンプリングのための単一のフィルタのみがあってよい。しかしながら、実施形態では、フィルタ設計において更なる柔軟性を可能にすることが望ましい場合があり、これは、フィルタパラメータのシグナリングを必要とする場合がある。このようなパラメータは、可能なフィルタ設計のリスト内のインデックスを通じて選択されてよい。フィルタは完全に指定されてよく（例えば、フィルタ係数のリストを通じて、適切なエントロピーコーディング技術を用いて）、フィルタは、アップ／ダウンサンプル比を通じて暗示的に選択されてよく、該アップ／ダウンサンプル比に従い上述のメカニズムのうちのいずれかに従いシグナリングされる、等である。

以下では、コードワードを通じて示される、アップ／ダウンサンプル因子（Ｘ及びＹ次元の両方で使用されるべき同じ因子）の有限セットのコーディングを想定する。そのコードワードは、例えばＨ．２６４及びＨ．２６５のようなビデオコーディング仕様における特定のシンタックス要素について共通のＥｘｔ－Ｇｏｌｏｍｂコードを使用する可変長コードワードであってよい。アップ／ダウンサンプル因子への値の１つの適切なマッピングは、例えば表１に従うことができる。
表１

多くの同様のマッピングが、ビデオ圧縮技術又は規格において利用可能なアプリケーションの必要並びにアップ及びダウンスケールメカニズムの能力に従い、考案され得る。表は、より多くの値に拡張され得る。値は、Ｅｘｔ－Ｇｏｌｏｍｂコード以外のエントロピーコーディングメカニズムにより、例えばバイナリコーディングを用いて表されてもよい。それは、再サンプリング因子がビデオ処理エンジン（主にエンコーダ及びデコーダ）自体の外部で、例えばＭＡＮＥにより対象とされるとき、特定の利点を有してよい。留意すべきことに、解像度の変化が要求されない状況では、Ｅｘｔ－Ｇｏｌｏｍｂコードは、短く、上述の表の中では、単一のビットのみになるよう選択できる。それは、最も一般的な場合にバイナリコードを使用することに勝るコーディング効率の利点を有し得る。

表中のエントリの数は、それらの意味と共に、完全に又は部分的に設定可能であってよい。例えば、表の基本的概要は、シーケンス又はデコーダパラメータセットのような「高（high）」パラメータセットの中で伝達されてよい。実施形態では、１つ以上のこのような表が、ビデオコーディング技術又は規格の中で定義されてよく、例えばデコーダ又はシーケンスパラメータセットを通じて選択されてよい。

以下は、上述のようにコーディングされたアップサンプリング／ダウンサンプリング因子（ＡＲＣ情報）がビデオコーディング技術又は規格シンタックスにどのように含まれるかを説明する。同様の検討は、１つ又は幾つかのコードワード制御アップ／ダウンサンプリングフィルタに適用され得る。フィルタ又は他のデータ構造のために比較的に大容量のデータが必要とされるときの議論については以下を参照する。

図５に示されるように、Ｈ．２６３ Annex Pは、ＡＲＣ情報（５０２）を４個のワーピング座標の形式で、ピクチャヘッダ（５０１）に、具体的にはＨ．２６３ＰＬＵＳＰＴＹＰＥ（５０３）ヘッダ拡張に含める。これは、（ａ）利用可能なピクチャヘッダがあるとき、及び（ｂ）ＡＲＣ情報の頻繁な変更が期待されるとき、賢明な設計選択であり得る。しかしながら、Ｈ．２６３型のシグナリングを使用するときのオーバヘッドは非常に大きくなることがあり、ピクチャヘッダが過渡的特性であり得るので、スケーリング係数がピクチャ境界の間に属しないことがある。

同じ又は別の実施形態では、図６Ａ～６Ｂに概要が示されるように、ＡＲＣパラメータのシグナリングが以下に詳細に説明される。図６Ａ～６Ｂは、少なくとも１９９３年以降、例えばビデオコーディング規格において使用されるようなＣ型プログラミングにおおよそ従う記述を用いて表現されるタイプのシンタックス図を示す。太字体の行は、ビットストリーム内に現れるシンタックス要素を示す。太字ではない行は、制御フロー又は変数の設定を示すことがある。

図６Ａに示すように、（場合によっては長方形の）ピクチャ部分に適用可能なヘッダの例示的なシンタックス構造としてのタイルグループヘッダ（６０１）は、条件付きで、可変長のＥｘｔ－Ｇｏｌｏｍｂコーディングされたシンタックス要素dec_pic_size_idx（６０２）（太字で示される）を含み得る。タイルグループヘッダ内のこのシンタックス要素の存在は、適応解像度（６０３）、ここでは太字で示されないフラグの値の使用において制御できる。これは、フラグがビットストリーム内に、シンタックスダイアグラム内で生じるポイントで、存在することを意味する。このピクチャ又は部分について適応解像度が使用されるか否かは、ビットストリーム内又は外の高レベルシンタックス構造の中でシグナリングできる。示される例では、それは、以下に概説するシーケンスパラメータセットの中でシグナリングされる。

図６Ｂを参照すると、シーケンスパラメータセット（６１０）の抜粋も示される。示される最初のシンタックス要素は、adaptive_pic_resolution_change_flag（６１１）である。真のとき、そのフラグは、適応解像度の使用を示すことができ、それは特定の制御情報を必要とし得る。例では、このような制御情報は、パラメータセット（６１２）の中のｉｆ（）文に基づくフラグの値及びタイルグループヘッダ（６０１）に基づき、条件付きで存在する。

適応解像度が使用されるとき、本例では、サンプルのユニットの中に出力解像度がコーディングされる（６１３）。参照符号６１３は、output_pic_width_in_luma_samples及びoutput_pic_height_in_luma_samplesの両方を表し、これらは出力ピクチャの解像度を一緒に定義し得る。その他の場合、ビデオコーディング技術又は規格では、どの値にも特定の制限が定義できる。例えば、レベル定義は、合計の出力サンプルの数を制限してよく、これは、それら２つのシンタックス要素の値の積であり得る。また、特定のビデオコーディング技術又は規格、又は例えばシステム規格のような外部技術又は規格は、番号付けの範囲（例えば、一方又は両方の次元が２のべき乗の数値により除算可能でなければならい）、又はアスペクト比（例えば、幅及び高さが４：３又は１６：９のような関係になければならない）を制限してよい。このような制限は、ハードウェア実装を実現するため又は他の理由で導入されてよく、従来良く知られている。

特定のアプリケーションでは、エンコーダは、デコーダに、サイズが出力ピクチャサイズであることを暗示的に想定させるのではなく、特定の参照ピクチャサイズを使用するよう指示することが推奨され得る。本例では、シンタックス要素reference_pic_size_present_flag（６１４）は、参照ピクチャ次元（６１５）（ここでも参照符号は幅及び高さの両方を表す）の条件付きの存在を制御する。

最終的に、幅及び高さを有する可能な復号ピクチャの表が示される。このような表は、例えば、テーブル指示（num_dec_pic_size_in_luma_samples_minus１）（６１６）により表現できる。「minus１」は、シンタックス要素の値の解釈を表し得る。例えば、コーディングされた値が０（ゼロ）である場合、１つのテーブルエントリが存在する。値が５である場合、６個のテーブルエントリが存在する。テーブル内の各「行」について、復号ピクチャの幅及び高さがシンタックス（６１７）に含まれる。

存在するテーブルエントリ（６１７）は、タイルグループヘッダ内のシンタックス要素dec_pic_size_idx（６０２）を用いてインデックス付けできる。それにより、タイルグループ毎に異なる復号サイズ、事実上のズーム倍率を可能にする。

特定のビデオコーディング技術又は規格、例えばＶＰ９は、空間的スケーラビリティを有効にするために、時間スケーラビリティと関連して（開示の主題と全く異なる方法でシグナリングされる）特定の形式の参照ピクチャ再サンプリングを実施することにより、空間的スケーラビリティをサポートする。特に、特定の参照ピクチャは、空間拡張層の基礎を形成するために、ＡＲＣ型の技術を用いて、より高い解像度へとアップサンプリングされてよい。これらのアップサンプリングされたピクチャは、詳細を追加するために、高解像度における通常の予測メカニズムを使用して、精緻化され得る。

ここで議論される実施形態は、このような環境で使用できる。特定の場合には、同じ又は別の実施形態で、ＮＡＬユニットヘッダ内の値、例えばTemporal IDフィールドが、時間だけでなく空間層も示すために使用できる。そうすることで、特定のシステム設計に特定の利点がもたらされる可能性がある。例えば、ＮＡＬユニットヘッダTemporal ID値に基づき時間層選択フォワーディングのために生成され最適化された既存の選択フォワーディングユニット（Selected Forwarding Units (SFU)）は、拡張可能な環境で、変更無しに使用できる。それを有効にするために、コーディングピクチャサイズと時間層との間のマッピングがＮＡＬユニットヘッダ内のTemporal IDフィールドにより示されるという要件が存在し得る。

実施形態では、適合ウインドウサイズはＰＰＳ内でシグナリングされてよい。適合ウインドウパラメータは、参照ピクチャの適合ウインドウサイズが現在ピクチャの適合ウインドウサイズと異なるとき、再サンプリング比を計算するために使用されてよい。デコーダは、再サンプリング処理が必要かどうかを決定するために、各ピクチャの適合ウインドウサイズを認識する必要があってよい。

実施形態では、参照ピクチャ再サンプリング（reference picture resampling (RPR)）のためのスケール係数は、適合ウインドウパラメータから導出され得る、現在ピクチャと参照ピクチャとの間の出力幅及び出力高さに基づき計算されてよい。これは、復号ピクチャサイズを用いるのと比べて、スケーリング係数をより正確に計算することを可能にし得る。これは、小さなパディング領域を有する、出力ピクチャサイズが復号ピクチャサイズとほぼ同一である大部分のビデオシーケンスについて良好に動作し得る。

しかしながら、これは、種々の問題も引き起こし得る。例えば、没入型媒体アプリケーションについて（例えば、３６０立方体マップ、立体視的、ポイントクラウド）、大きなオフセット値により、適合ウインドウサイズが復号ピクチャサイズと全く異なるとき、適合ウインドウサイズに基づくスケーリング係数の計算は、異なる解像度を有するインター予測の品質を保証しなくてよい。極端な場合には、参照ピクチャ内の現在CUの同一位置領域は存在しなくてよい。RPRがマルチレイヤを伴うスケーラビリティのために使用されるとき、適合ウインドウオフセットは、レイヤに跨がる参照領域の計算のために使用されなくてよい。ＳＨＶＣ（HEVC Scalability Extension）では、各々の直接依存レイヤの参照領域は、ＰＰＳ拡張の中で明示的にシグナリングされてよいことに留意する。特定の領域（サブピクチャ）をターゲットとするサブビットストリームがビットストリーム全体から抽出されるとき、適合ウインドウサイズは、ピクチャサイズと全く一致しない。パラメータがスケーリング計算のために使用される限り、ビットストリームが符号化されると、適合ウインドウパラメータは更新できないことに留意する。

上述の潜在的な問題に基づき、適合ウインドウサイズに基づくスケーリング係数の計算は、代替パラメータが必要とされる角の場合（corner case）を有してよい。代替として、適合ウインドウパラメータがスケーリング係数の計算のために使用できないとき、ＲＰＲのスケーリング及びスケーラビリティ（Scalability）を計算するために使用できる参照領域パラメータをシグナリングすることが提案される。

実施形態では、図７を参照すると、conformance_window_flagは、ＰＰＳ内でシグナリングされてよい。conformance_window_flagが１に等しいことは、適合クロッピングウインドウオフセットパラメータがＰＰＳ内で次に続くことを示してよい。conformance_window_flagが０に等しいことは、適合クロッピングウインドウオフセットパラメータが存在しないことを示してよい。

実施形態では、更に図７を参照すると、conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、及びconf_win_bottom_offsetは、出力のためのピクチャ座標の中で指定される長方形領域の観点から、復号処理から出力されるＰＰＳを参照するピクチャのサンプルを指定する。conformance_window_flagが０に等しいとき、conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、及びconf_win_bottom_offsetの値は、０に等しいと推定されてよい。

実施形態では、フラグはＰＰＳ又は別のパラメータセット内に存在してよく、再サンプリングピクチャサイズ（幅及び高さ）がＰＰＳ又は別のパラメータセットの中で明示的にシグナリングされるか否かを示してよい。再サンプリングピクチャサイズパラメータが明示的にシグナリングされる場合、現在ピクチャと参照ピクチャとの間の再サンプリング比は、再サンプリングピクチャサイズパラメータに基づき計算されてよい。

実施形態では、図７を参照すると、use_conf_win_for_rpr_flagが０に等しいことは、resampled_pic_width_in_luma_samples及びresampled_pic_height_in_luma_samplesが、適切な場所に、例えばＰＰＳ内で次に続くことを示してよい。

実施形態では、use_conf_win_for_rpr_flagが１に等しいことは、resampling_pic_width_in_luma_samples及びresampling_pic_height_in_luma_samplesが存在しないことを示してよい。

実施形態では、resampling_pic_width_in_luma_samplesは、再サンプリングのために、ルマサンプルのユニットの中のＰＰＳを参照する各参照ピクチャの幅を指定してよい。resampling_pic_width_in_luma_samplesは０に等しくなくてよく、Max(８,MinCbSizeY)の整数倍であってよく、pic_width_max_in_luma_samples以下であってよい。

実施形態では、resampling_pic_height_in_luma_samplesは、再サンプリングのために、ルマサンプルのユニットの中のＰＰＳを参照する各参照ピクチャの高さを指定してよい。resampling_pic_height_in_luma_samplesは０に等しくなくてよく、Max(８,MinCbSizeY)の整数倍であってよく、pic_height_max_in_luma_sample以下であってよい。

実施形態では、シンタックス要素resampling_pic_width_in_luma_samplesが存在しないとき、resampling_pic_width_in_luma_samplesの値はPicOutputWidthLに等しいと推定されてよい。

シンタックス要素resampling_pic_height_in_luma_samplesが存在しないとき、resampling_pic_height_in_luma_samplesの値はPicOutputHeightLに等しいと推定されてよい。

実施形態では、参照ピクチャ再サンプリングを伴う小数補間（fractional interpolation）処理の例は以下のように処理されてよい。

変数fRefWidthは、ルマサンプル内の参照ピクチャのresampling_pic_width_in_luma_samplesに等しく設定されてよい。

変数fRefHeightは、ルマサンプル内の参照ピクチャのresampling_pic_height_in_luma_samplesに等しく設定されてよい。

動きベクトルmvLXは、(refMvLX－mvOffset)に等しく設定されてよい。

cIdxが０に等しい場合、スケーリング係数及びそれらの固定点表現は、以下の式１及び式２に従い定義されてよい。

実施形態では、図８を参照すると、use_conf_win_for_rpr_flagが０に等しいことは、resampled_pic_width_in_luma_samples及びresampled_pic_height_in_luma_samplesが、ＰＰＳ内で次に続くことを指定してよい。use_conf_wid_for_rpr_flagが１に等しいことは、resampling_pic_width_in_luma_samples及びresampling_pic_height_in_luma_samplesが存在しないことを指定してよい。

実施形態では、ref_region_left_offsetは、復号ピクチャ内の参照領域の左上ルマサンプルの間の水平オフセットを指定してよい。ref_region_left_offsetの値は、両端を含む－２^１４～２^１４－１の範囲であるべきである。存在しないとき、ref_region_left_offsetの値はconf_win_left_offsetに等しいと推定されてよい。

実施形態では、ref_region_top_offsetは、復号ピクチャ内の参照領域の左上ルマサンプルの間の垂直オフセットを指定してよい。ref_region_top_offsetの値は、両端を含む－２^１４～２^１４－１の範囲であるべきである。存在しないとき、ref_region_top_offsetの値はconf_win_right_offsetに等しいと推定されてよい。

実施形態では、ref_region_right_offsetは、復号ピクチャ内の参照領域の右下ルマサンプルの間の水平オフセットを指定してよい。ref_layer_right_offsetの値は、両端を含む－２^１４～２^１４－１の範囲であるべきである。存在しないとき、ref_region_right_offsetの値はconf_win_top_offsetに等しいと推定されてよい。

実施形態では、ref_region_bottom_offsetは、復号ピクチャ内の参照領域の右下ルマサンプルの間の垂直オフセットを指定してよい。ref_layer_bottom_offsetの値は、両端を含む－２^１４～２^１４－１の範囲であるべきである。存在しないとき、ref_region_bottom_offset[ref_loc_offset_layer_id[i]]の値はconf_win_bottom_offsetに等しいと推定されてよい。

変数PicRefWidthL及びPicRefHeightLは、以下に示すように、式３及び式４に示されるように導出されてよい。

変数fRefWidthは、ルマサンプル内の参照ピクチャのPicRefWidthLに等しく設定されてよい。

変数fRefHeightは、ルマサンプル内の参照ピクチャのPicRefHeightLに等しく設定されてよい。

cIdxが０に等しい場合、スケーリング係数及びそれらの固定点表現は、以下の式５及び式６に示すように定義されてよい。

参照サンプルパディングのための境界ブロックの左上座標(xSbInt_L,ySbInt_L)は、(xSb+(mvLX[０]>>４),ySb+(mvLX[１]>>４))に等しく設定されてよい。

予測ルマサンプルアレイpredSamplesLXの内部の各ルマサンプル位置(x_L=０..sbWidth－１+brdExtSize,y_L=０..sbHeight－１+brdExtSize)について、対応する予測ルマサンプル値predSamplesLX[x_L][y_L]は、以下のように導出されてよい。
(refxSb_L,refySb_L)及び(refx_L,refy_L)が、１／１６サンプルユニットの中で与えられる動きベクトル(refMvLX,refMvLX)により指されるルマ位置であるとする。変数refxSb_L、refx_L、refySb_L、及びrefy_Lは、以下に示すように、式７～式１０に示されるように導出されてよい。

図９は、符号化ビデオビットストリームを復号する例示的な処理９００のフローチャートである。幾つかの実装では、図９の１つ以上の処理ブロックは、デコーダ２１０により実行されてよい。幾つかの実装では、図９の１つ以上の処理ブロックは、エンコーダ２０３のような、デコーダ２１０と別個の又はそれを含む別の装置又は装置のグループにより実行されてよい。

図９に示されるように、処理９００は、参照ピクチャ再サンプリングのために適合ウインドウが使用されないことを示すフラグを取得するステップを含んでよい。

更に図９に示されるように、処理９００は、フラグが、参照ピクチャ再サンプリングのために適合ウインドウが使用されないことを示すことに基づき、再サンプリングピクチャサイズがシグナリングされるかどうかを決定するステップを含んでよい（ブロック９２０）。

第２フラグが、再サンプリングピクチャサイズはシグナリングされることを示すと決定された場合（ブロック９２０でＹＥＳ）、処理９００は、ブロック９３０へ、次にブロック９５０へ進んでよい。ブロック９３０で、処理９００は、再サンプリングピクチャサイズに基づき再サンプリング比を決定するステップを含んでよい。

第２フラグが、参照ピクチャ再サンプリングのために適合ウインドウが使用されることを示さないと決定された場合、（ブロック９２０でNO）、処理９００は、ブロック９４０へ、次にブロック９５０へ進んでよい。ブロック９４０で、処理９００は、出力ピクチャサイズに基づき再サンプリング比を決定するステップを含んでよい。

更に図９に示されるように、処理９００は、再サンプリング比を用いて現在ピクチャに対して参照ピクチャ再サンプリングを実行するステップ（ブロック９５０）を含んでよい。

実施形態では、フラグは、ピクチャパラメータセットの中でシグナリングされてよい。

実施形態では、再サンプリングピクチャサイズは、再サンプリングピクチャサイズの幅及び再サンプリングピクチャサイズの高さのうちの少なくとも１つとして、符号化ビデオビットストリームの中でシグナリングされてよい。

実施形態では、幅及び高さのうちの少なくとも１つは、ピクチャパラメータセットの中でシグナリングされてよい。

実施形態では、幅及び高さのうちの少なくとも１つは、幅及び前記高さのうちの少なくとも１つに含まれるルマサンプルの数として表現されてよい。

実施形態では、幅及び高さのうちの少なくとも１つは、現在ピクチャの端と参照領域の所定のルマサンプルとの間の少なくとも１つのオフセット距離に基づき決定されてよい。

実施形態では、少なくとも１つのオフセット距離は、ピクチャパラメータセットの中でシグナリングされてよい。

実施形態では、少なくとも１つのオフセット距離は、以下：現在ピクチャの左端と参照領域の左上のルマサンプルとの間の水平オフセット距離、現在ピクチャの上端と参照領域の左上のルマサンプルとの間の垂直オフセット距離、現在ピクチャの右端と参照領域の右下のルマサンプルとの間の水平オフセット距離、現在ピクチャの下端と参照領域の右下のルマサンプルとの間の垂直オフセット距離、の中からの少なくとも１つを含む。

図９は処理９００の例示的なブロックを示すが、処理９００は、幾つかの実装では、図９に示されたブロックより多数のブロック、少数のブロック、又は異なる配置のブロックを含んでよい。追加又は代替として、処理９００のブロックのうちの２つ以上は、並列に実行されてよい。

さらに、提案した方法は、処理回路（例えば、１つ以上のプロセッサ又は１つ以上の集積回路）により実施されてよい。一例では、１つ以上のプロセッサは、提案した方法のうちの１つ以上を実行するための、非一時的コンピュータ可読媒体に格納されたプログラムを実行する。

上述の技術は、コンピュータ可読命令を用いてコンピュータソフトウェアとして実装でき１つ以上のコンピュータ可読媒体に物理的に格納でる。例えば、図１０は、本開示の主題の特定の実施形態を実装するのに適するコンピュータシステム１０００を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク等のメカニズムにより処理されて、コンピュータ中央処理ユニット（CPU）、グラフィック処理ユニット（GPU）、等により直接又はインタープリット、マイクロコード実行、等を通じて実行可能な命令を含むコードを生成し得る、任意の適切な機械コード又はコンピュータ言語を用いてコーディングできる。

命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム装置、モノのインターネット装置、等を含む種々のコンピュータ又はそのコンポーネントで実行できる。

コンピュータシステム１０００の図１０に示すコンポーネントは、本来例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に対するようないかなる限定も示唆しない。さらに、コンポーネントの構成も、コンピュータシステム１０００の例示的な実施形態に示されたコンポーネントのうちのいずれか又は組み合わせに関連する任意の依存性又は要件を有すると解釈されるべきではない。

コンピュータシステム１０００は、特定のヒューマンインタフェース入力装置を含んでよい。このようなヒューマンインタフェース入力装置は、例えば感覚入力（例えば、キーストローク、スワイプ、データグラブ動作）、音声入力（例えば、音声、クラッピング）、視覚的入力（例えば、ジェスチャ）、嗅覚入力（示されない）を通じた１人以上の人間のユーザによる入力に応答してよい。ヒューマンインタフェース装置は、必ずしも人間による意識的入力に直接関連する必要のない特定の媒体、例えば音声（例えば、会話、音楽、環境音）、画像（例えば、スキャンされた画像、デジタルカメラから取得された写真画像）、ビデオ（例えば、２次元ビデオ、３次元ビデオ、立体ビデオを含む）をキャプチャするためにも使用できる。

入力ヒューマンインタフェース装置は、キーボード１００１、マウス１００２、トラックパッド１００３、タッチスクリーン１０１０及び関連するグラフィックアダプタ１０５０、データグラブ、ジョイスティック１００５、マイクロフォン１００６、スキャナ１００７、カメラ１００８、のうちの１つ以上を含んでよい（そのうちの１つのみが示される）。

コンピュータシステム１０００は、特定のヒューマンインタフェース出力装置も含んでよい。このようなヒューマンインタフェース出力装置は、例えば感覚出力、音声、光、及び匂い／味を通じて１人以上の人間のユーザの感覚を刺激してよい。このようなヒューマンインタフェース出力装置は、感覚出力装置を含んでよい（例えば、タッチスクリーン１０１０、データグラブ、又はジョイスティック１００５による感覚フィードバック、しかし入力装置として機能しない感覚フィードバック装置も存在し得る）、音声出力装置（例えば、スピーカ１００９、ヘッドフォン（図示しない）、視覚的出力装置（例えば、スクリーン１０１０、陰極線管（CRT）スクリーン、液晶ディスプレイ（LCD）スクリーン、プラズマスクリーン、有機発光ダイオード（OLED）スクリーンを含み、それぞれタッチスクリーン入力能力を有し又は有さず、それぞれ感覚フィードバック能力を有し又は有さず、これらのうちの幾つかは例えば立体出力、仮想現実眼鏡（図示しない）、ホログラフィックディスプレイ、及び発煙剤タンク（図示しない）、及びプリンタ（図示しないより多くの出力を出力可能であってよい））。

コンピュータシステム１０００は、人間のアクセス可能な記憶装置、及び、例えばCD/DVD等の媒体１０２１を備えるCD/DVDROM/RW１０２０のような光学媒体、サムドライブ１０２２、取り外し可能ハードドライブ又は個体状態ドライブ１０２３、テープ及びフロッピディスク（図示しない）のようなレガシー磁気媒体、セキュリティドングル（図示しない）等のような専用ROM/ASIC/PLDに基づく装置のような関連する媒体も含み得る。

当業者は、本開示の主題と関連して使用される用語「コンピュータ可読媒体」が伝送媒体、搬送波、又は他の一時的信号を包含しないことも理解すべきである。

コンピュータシステム１０００は、１つ以上の通信ネットワークへのインタフェース(１１５５)も含み得る。ネットワークは、例えば無線、有線、光であり得る。ネットワークへは、更に、ローカル、広域、都市域、車両及び産業、リアルタイム、耐遅延性、等であり得る。ネットワークの例は、イーサネットのようなローカルエリアネットワーク、無線LAN、GSM（global systems for mobile communications）、第３世代（３G）、第４世代（４G）、第５世代（５G）、LTE（Long－Term Evolution）等を含むセルラネットワーク、ケーブルTV、衛星TV、地上波放送TVを含むTV有線又は無線広域デジタルネットワーク、CANBusを含む車両及び産業、等を含む。特定のネットワークは、一般に、特定の汎用データポート又は周辺機器バス（１１４９）（例えば、コンピュータシステム１０００のユニバーサルシリアルバス（USB）ポート））に取り付けられる外部ネットワークインタフェースアダプタ（１１５４）を必要とする。他のものは、一般に、後述するようなシステムバスへの取り付けによりコンピュータシステム１０００のコアに統合される（例えば、イーサネットインタフェースをＰＣコンピュータシステムへ、又はセルラネットワークインタフェースをスマートフォンコンピュータシステムへ）。例として、ネットワーク１０５５は、ネットワークインタフェース１０５４を用いて周辺機器バス１０４９に接続されてよい。これらのネットワークを用いて、コンピュータシステム１０００は、他のエンティティと通信できる。このような通信は、単方向受信のみ（例えば、放送ＴＶ）、単方向送信のみ（例えば、特定のＣＡＮｂｕｓ装置へのＣＡＮｂｕｓ）、又は例えばローカル又は広域デジタルネットワークを用いて他のコンピュータシステムへの双方向であり得る。特定のプロトコル及びプロトコルスタックが、それらのネットワーク及びネットワークインタフェース（１１５４）の各々で使用され得る。

前述のヒューマンインタフェース装置、人間のアクセス可能な記憶装置、及びネットワークインタフェースは、コンピュータシステム１０００のコア１０４０に取り付け可能である。

コア１０４０は、１つ以上の中央処理ユニット（CPU）１０４１、グラフィック処理ユニット（GPU）１０４２、ＦPGAの形式の専用プログラマブル処理ユニット１０４３、特定タスクのためのハードウェアアクセラレータ１０４４、等を含み得る。これらの装置は、読み出し専用メモリ（ROM）１０４５、ランダムアクセスメモリ（RAM）１０４６、内部のユーザアクセス不可能なハードドライブ、SSD、等のような内蔵大容量記憶装置１０４７と共に、システムバス１０４８を通じて接続されてよい。幾つかのコンピュータシステムでは、追加CPU、GPU、等による拡張を可能にするために、システムバス１０４８は、１つ以上の物理プラグの形式でアクセス可能である。周辺機器は、コアのシステムバス１０４８に直接に、又は周辺機器バス１０４９を通じて、取り付け可能である。周辺機器バスのアーキテクチャは、周辺機器相互接続（peripheral component interconnect (PCI)）、USB、等を含む。

CPU１０４１、GPU１０４２、FPGA１０４３、及びアクセラレータ１０４４は、結合されて前述のコンピュータコードを生成可能な特定の命令を実行できる。該コンピュータコードは、ROM１０４５又はRAM１０４６に格納できる。一時的データもRAM１０４６に格納でき、一方で、永久的データは例えば内蔵大容量記憶装置１０４７に格納できる。メモリ装置のうちのいずれかへの高速記憶及び読み出しはCPU１０４１、GPU１０４２、大容量記憶装置１０４７、ROM１０４５、RAM１０４６等のうちの１つ以上に密接に関連付けられ得るキャッシュメモリの使用を通じて可能にできる。

コンピュータ可読媒体は、種々のコンピュータにより実施される動作を実行するためのコンピュータコードを有し得る。媒体及びコンピュータコードは、本開示の目的のために特別に設計され構成されたものであり得、又は、コンピュータソフトウェア分野の当業者によく知られ利用可能な種類のものであり得る。

例として及び限定ではなく、アーキテクチャを有するコンピュータシステム１０００、及び具体的にはコア１０４０は、プロセッサ（CPU、GPU、FPGA、アクセラレータ、等を含む）が１つ以上の有形コンピュータ可読媒体内に具現化されたソフトウェアを実行した結果として、機能を提供できる。このようなコンピュータ可読媒体は、コア内蔵大容量記憶装置１０４７又はROM１０４５のような非一時的特性のコア１０４０の特定の記憶装置、及び上述のようなユーザアクセス可能な大容量記憶装置と関連付けられた媒体であり得る。本開示の種々の実施形態を実装するソフトウェアは、このような装置に格納されコア１０４０により実行できる。コンピュータ可読媒体は、特定の必要に従い、１つ以上のメモリ装置又はチップを含み得る。ソフトウェアは、コア１０４０及び具体的にはその中のプロセッサ（CPU、GPU、FPGA、等を含む）に、ソフトウェアにより定義された処理に従うRAM１０４６に格納されたデータ構造の定義及び該データ構造の変更を含む、ここに記載した特定の処理又は特定の処理の特定の部分を実行させることができる。追加又は代替として、コンピュータシステムは、ここに記載の特定の処理又は特定の処理の特定の部分を実行するためにソフトウェアと一緒に又はそれに代わって動作可能な論理ハードワイヤド又は他の回路内の実装（例えば、アクセラレータ１０４４）の結果として機能を提供できる。ソフトウェアへの言及は、ロジックを含み、適切な場合にはその逆も同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のためにソフトウェアを格納する（集積回路（IC）のような）回路、実行のためにロジックを実装する回路、又はそれらの両方を含み得る。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを含む。

本開示は、幾つかの例示的な実施形態を記載したが、代替、置換、及び種々の代用の均等物が存在し、それらは本開示の範囲に包含される。当業者に明らかなことに、ここに明示的に示され又は説明されないが、本開示の原理を実施し、したがって、本開示の精神及び範囲に含まれる多数のシステム及び方法を考案可能である。

１００システム
１１０、１２０、１３０、１４０端末
１５０ネットワーク

Claims

少なくとも１つのプロセッサを用いてビデオビットストリームを符号化する方法であって、前記方法は、
適合ウィンドウが参照ピクチャ再サンプリングに使用されないと決定するステップと、
前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないと決定することに基づき、参照ピクチャ再サンプリングパラメータがシグナリングされるかどうかを決定するステップと、
前記参照ピクチャ再サンプリングパラメータがシグナリングされると決定することに基づき、前記参照ピクチャ再サンプリングのためのスケーリングを計算するために使用されるべき複数の参照領域パラメータを決定するステップであって、前記複数の参照領域パラメータは、少なくとも参照領域左オフセットと参照領域上オフセットとを含む、ステップと、
前記複数の参照領域パラメータを含む前記参照ピクチャ再サンプリングパラメータを用いて現在ピクチャを符号化するステップと、
符号化現在ピクチャに基づき符号化ビデオビットストリームを生成するステップであって、前記符号化ビデオビットストリームは、前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないことを示すフラグと、前記参照ピクチャ再サンプリングパラメータとを含む、ステップと、
を含む方法。
前記フラグは、ピクチャパラメータセットの中でシグナリングされる、請求項１に記載の方法。
再サンプリングピクチャサイズがシグナリングされると決定することに基づき、前記再サンプリングピクチャサイズに基づき、再サンプリング比を決定するステップ、を更に含み、
前記再サンプリングピクチャサイズは、前記再サンプリングピクチャサイズの幅、及び前記再サンプリングピクチャサイズの高さ、のうちの少なくとも１つとして、前記符号化ビデオビットストリームの中でシグナリングされる、請求項１に記載の方法。
前記幅及び前記高さのうちの少なくとも１つは、ピクチャパラメータセットの中でシグナリングされる、請求項３に記載の方法。
前記幅及び前記高さのうちの少なくとも１つは、前記幅及び前記高さのうちの少なくとも１つに含まれるルマサンプルの数として表現される、請求項３に記載の方法。
前記幅及び前記高さのうちの少なくとも１つは、前記現在ピクチャの端と参照領域の所定のルマサンプルとの間の少なくとも１つのオフセット距離に基づき決定される、請求項３に記載の方法。
前記少なくとも１つのオフセット距離は、ピクチャパラメータセットの中でシグナリングされる、請求項６に記載の方法。
前記少なくとも１つのオフセット距離は、以下：
前記現在ピクチャの左端と前記参照領域の左上のルマサンプルとの間の水平オフセット距離、
前記現在ピクチャの上端と前記参照領域の前記左上のルマサンプルとの間の垂直オフセット距離、
前記現在ピクチャの右端と前記参照領域の右下のルマサンプルとの間の水平オフセット距離、
前記現在ピクチャの下端と前記参照領域の右下のルマサンプルとの間の垂直オフセット距離、
の中からの少なくとも１つを含む、請求項６に記載の方法。
ビデオビットストリームを符号化する装置であって、前記装置は、
プログラムコードを格納するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、前記プログラムコードにより命令されたように動作するよう構成される少なくとも１つのプロセッサと、
を含み、
プログラムコードは、
前記少なくとも１つのプロセッサに、適合ウィンドウが参照ピクチャ再サンプリングに使用されないと決定させるよう構成される第１決定コードと、
前記少なくとも１つのプロセッサに、前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないという決定に基づき、参照ピクチャ再サンプリングパラメータがシグナリングされるかどうかを決定させるよう構成される第２決定コードと、
前記少なくとも１つのプロセッサに、前記参照ピクチャ再サンプリングパラメータがシグナリングされると決定することに基づき、前記参照ピクチャ再サンプリングのためのスケーリングを計算するために使用されるべき複数の参照領域パラメータを決定させるよう構成される第３決定コードであって、前記複数の参照領域パラメータは、少なくとも参照領域左オフセットと参照領域上オフセットとを含む、第３決定コードと、
前記少なくとも１つのプロセッサに、前記複数の参照領域パラメータを含む前記参照ピクチャ再サンプリングパラメータを用いて現在ピクチャを符号化させるよう構成される符号化コードと、
前記少なくとも１つのプロセッサに、符号化現在ピクチャに基づき符号化ビデオビットストリームを生成させるよう構成される生成コードであって、前記符号化ビデオビットストリームは、前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないことを示すフラグと、前記参照ピクチャ再サンプリングパラメータとを含む、生成コードと、
を含む、装置。
前記フラグは、ピクチャパラメータセットの中でシグナリングされる、請求項９に記載の装置。
前記プログラムコードは、
前記少なくとも１つのプロセッサに、再サンプリングピクチャサイズがシグナリングされると決定することに基づき、前記再サンプリングピクチャサイズに基づき、再サンプリング比を決定させるよう構成される第４決定コード、を更に含み、
前記再サンプリングピクチャサイズは、前記再サンプリングピクチャサイズの幅、及び前記再サンプリングピクチャサイズの高さ、のうちの少なくとも１つとして、前記符号化ビデオビットストリームの中でシグナリングされる、請求項９に記載の装置。
前記幅及び前記高さのうちの少なくとも１つは、ピクチャパラメータセットの中でシグナリングされる、請求項１１に記載の装置。
前記幅及び前記高さのうちの少なくとも１つは、前記幅及び前記高さのうちの少なくとも１つに含まれるルマサンプルの数として表現される、請求項１１に記載の装置。
前記幅及び前記高さのうちの少なくとも１つは、前記現在ピクチャの端と参照領域の所定のルマサンプルとの間の少なくとも１つのオフセット距離に基づき決定される、請求項１１に記載の装置。
前記少なくとも１つのオフセット距離は、ピクチャパラメータセットの中でシグナリングされる、請求項１４に記載の装置。
前記少なくとも１つのオフセット距離は、以下：
前記現在ピクチャの左端と前記参照領域の左上のルマサンプルとの間の水平オフセット距離、
前記現在ピクチャの上端と前記参照領域の前記左上のルマサンプルとの間の垂直オフセット距離、
前記現在ピクチャの右端と前記参照領域の右下のルマサンプルとの間の水平オフセット距離、
前記現在ピクチャの下端と前記参照領域の右下のルマサンプルとの間の垂直オフセット距離、
の中からの少なくとも１つを含む、請求項１４に記載の装置。
命令を格納している非一時的コンピュータ可読媒体であって、前記命令は１つ以上の命令を含み、前記１つ以上の命令は、ビデオビットストリームを符号化する装置の１つ以上のプロセッサにより実行されると、前記１つ以上のプロセッサに、
適合ウィンドウが参照ピクチャ再サンプリングに使用されないと決定させ、
前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないと決定することに基づき、参照ピクチャ再サンプリングパラメータがシグナリングされるかどうかを決定させ、
前記参照ピクチャ再サンプリングパラメータがシグナリングされると決定することに基づき、前記参照ピクチャ再サンプリングのためのスケーリングを計算するために使用されるべき複数の参照領域パラメータを決定させ、前記複数の参照領域パラメータは、少なくとも参照領域左オフセットと参照領域上オフセットとを含み、
前記複数の参照領域パラメータを含む前記参照ピクチャ再サンプリングパラメータを用いて現在ピクチャを符号化させ、
符号化現在ピクチャに基づき符号化ビデオビットストリームを生成させ、前記符号化ビデオビットストリームは、前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないことを示すフラグと、前記参照ピクチャ再サンプリングパラメータとを含む、
非一時的コンピュータ可読媒体。
前記１つ以上の命令は、更に、
前記１つ以上のプロセッサに、再サンプリングピクチャサイズがシグナリングされると決定することに基づき、前記再サンプリングピクチャサイズに基づき、再サンプリング比を決定させ、
前記再サンプリングピクチャサイズは、前記再サンプリングピクチャサイズの幅、及び前記再サンプリングピクチャサイズの高さ、のうちの少なくとも１つとして、前記符号化ビデオビットストリームの中でシグナリングされる、請求項１７に記載の非一時的コンピュータ可読媒体。
前記幅及び前記高さのうちの少なくとも１つは、前記幅及び前記高さのうちの少なくとも１つに含まれるルマサンプルの数として表現される、請求項１８に記載の非一時的コンピュータ可読媒体。
前記幅及び前記高さのうちの少なくとも１つは、前記現在ピクチャの端と参照領域の所定のルマサンプルとの間の少なくとも１つのオフセット距離に基づき決定される、請求項１８に記載の非一時的コンピュータ可読媒体。
少なくとも１つのプロセッサを用いてビデオビットストリームを復号する方法であって、前記方法は、
適合ウィンドウが参照ピクチャ再サンプリングに使用されないと決定するステップと、
前記適合ウィンドウが前記参照ピクチャ再サンプリングに使用されないと決定することに基づき、参照ピクチャ再サンプリングパラメータがシグナリングされるかどうかを決定するステップと、
前記参照ピクチャ再サンプリングパラメータがシグナリングされると決定することに基づき、前記参照ピクチャ再サンプリングのためのスケーリングを計算するために使用されるべき複数の参照領域パラメータを決定するステップであって、前記複数の参照領域パラメータは、少なくとも参照領域左オフセットと参照領域上オフセットとを含む、ステップと、
前記複数の参照領域パラメータを含む前記参照ピクチャ再サンプリングパラメータを用いて現在ピクチャに対して前記参照ピクチャ再サンプリングを実行するステップと、
を含む方法。