JP2023524944A - 圧縮されたピクチャインピクチャシグナリング - Google Patents

圧縮されたピクチャインピクチャシグナリング Download PDF

Info

Publication number
JP2023524944A
JP2023524944A JP2022564214A JP2022564214A JP2023524944A JP 2023524944 A JP2023524944 A JP 2023524944A JP 2022564214 A JP2022564214 A JP 2022564214A JP 2022564214 A JP2022564214 A JP 2022564214A JP 2023524944 A JP2023524944 A JP 2023524944A
Authority
JP
Japan
Prior art keywords
picture
value
sub
position value
deriving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022564214A
Other languages
English (en)
Inventor
リキャルド ショバーリ,
マルティン ペッテション,
ミトラ ダムガニアン,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2023524944A publication Critical patent/JP2023524944A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2023524944000001
ビットストリームからピクチャ中のサブピクチャ(SP)についての位置およびサイズを復号するための方法が提供される。本方法は、ビットストリーム中の第1のシンタックスエレメントS1からコーディングツリーユニット(CTU)サイズを復号することを含む。本方法は、スケールファクタ値Fを取得することであって、Fが1よりも大きい、スケールファクタ値Fを取得することを含む。本方法は、サブピクチャSPについてのスケーリングされた位置値を導出することであって、スケーリングされた位置値を導出することが、i)ビットストリーム中の情報に基づいて位置値を取得することと、ii)スケーリングされた位置値を位置値とFとの積に等しくセットすることとを含む、スケーリングされた位置値を導出することをさらに含む。本方法は、スケーリングされた位置値に基づいてサブピクチャのサイズを導出することを含む。
【選択図】図5

Description

ピクチャインピクチャシグナリングに関係する実施形態が開示される。
1.HEVCおよびVVC
高効率ビデオコーディング(HEVC)は、時間予測と空間予測の両方を利用する、ITU-TおよびMPEGによって規格化されたブロックベースビデオコーデックである。空間予測は、現在ピクチャ内からのイントラ(I)予測を使用して達成される。時間予測は、前に復号された参照ピクチャから、ブロックレベルでの単方向(P)予測または双方向インター(B)予測を使用して達成される。エンコーダでは、残差と呼ばれる、元のピクセルデータと予測されたピクセルデータとの間の差は、周波数ドメインに変換され、量子化され、次いで、同じくエントロピーコーディングされる、予測モードおよび動きベクトルなど、必要な予測パラメータとともに送信される前に、エントロピーコーディングされる。デコーダは、エントロピー復号と、逆量子化と、逆方向変換とを実施して残差を取得し、次いで、その残差をイントラ予測またはインター予測に追加してピクチャを再構築する。
MPEGおよびITU-Tは、ジョイントビデオエキスプロラトリチーム(JVET:Joint Video Exploratory Team)内でHEVCの後継に取り組んでいる。開発中のこのビデオコーデックの名前は、多用途ビデオコーディング(VVC)である。本文を書いているときのVVCドラフト仕様の現在のバージョンは、JVET-Q2001-vDである。
2.成分
ビデオ(別名、ビデオシーケンス)は、各ピクチャ(別名、画像)が1つまたは複数の成分からなる一連のピクチャからなる。各成分は、サンプル値の2次元矩形アレイとして説明され得る。ビデオシーケンス中のピクチャは、3つの成分、すなわち、サンプル値がルーマ値である1つのルーマ成分Yと、サンプル値がクロマ値である2つのクロマ成分CbおよびCrとからなることが一般的である。また、クロマ成分の次元は、各次元においてルーマ成分よりも1/2だけ小さいことが一般的である。たとえば、HDピクチャのルーマ成分のサイズは1920×1080となり、クロマ成分は、各々、960×540の次元を有するであろう。成分は色成分と呼ばれることがある。
3.ブロックおよびユニット
ブロックは、サンプルの1つの2次元アレイである。ビデオコーディングでは、各成分がブロックにスプリットされ、コード化ビデオビットストリームは一連のコード化ブロックからなる。ビデオコーディングでは、画像は、画像の特定のエリアをカバーするユニットにスプリットされることが一般的である。各ユニットは、その特定のエリアをなす、すべての成分からのすべてのブロックからなり、各ブロックは、1つのユニットに完全に属する。H.264におけるマクロブロック、およびHEVCにおけるコーディングユニット(CU)が、ユニットの例である。
VVCでは、ピクチャがコーディングツリーユニット(CTU)に区分され、ビットストリーム中のコード化ピクチャは、ピクチャ中のすべてのCTUがコーディングされるような、一連のコード化CTUからなる。CTUの走査順序は、ピクチャが、以下で説明されるスライスおよびタイルなど、より高いレベルの区分ツールによってどのように区分されるかに依存する。VVC CTUが、1つのルーマブロックと、随意に(ただし、通常)2つの空間的にコロケート(co-located)されたクロマブロックとからなる。CTUのルーマブロックのサイズは、正方形であり、サイズは、設定可能であり、ビットストリーム中のシンタックスエレメントによって伝達される。デコーダがビットストリームを復号しているとき、デコーダは、復号のために使用すべきCTUサイズのルーマブロックのサイズを導出するためにシンタックスエレメントを復号する。このサイズは、通常、CTUサイズと呼ばれる。
4.パラメータセット
HEVCおよびVVCは、3つのタイプのパラメータセット、すなわち、ピクチャパラメータセット(PPS)と、シーケンスパラメータセット(SPS)と、ビデオパラメータセット(VPS)とを指定する。PPSは、ピクチャ全体について共通であるデータを含んでおり、SPSは、コード化ビデオシーケンス(CVS)について共通であるデータを含んでおり、VPSは、複数のCVSについて共通であるデータ、たとえば、ビットストリーム中の複数のレイヤについてのデータを含んでいる。
5.復号能力情報(DCI)
DCIは、復号セッション中に変化しないことがあり、デコーダが知るのに良好であり得る、情報、たとえば許容されるサブレイヤの最大数を指定する。DCI中の情報は、復号プロセスの動作のために必要でない。VVC仕様の前のドラフトでは、DCIは、復号パラメータセット(DPS)と呼ばれた。
復号能力情報は、コーディングツール、NALユニットのタイプなどに関してビットストリームから何を予想すべきかのデコーダ情報を与えるビットストリームについての一般的な制約のセットをも含んでいる。VVCの現在のバージョンでは、一般的な制約情報はまた、VPSまたはSPS中でシグナリングされ得る。
6.ピクチャヘッダ
VVCの現在のバージョンでは、コード化ピクチャは、ピクチャヘッダを含んでいる。ピクチャヘッダは、関連するピクチャのすべてのスライスについて共通であるシンタックスエレメントを含んでいる。
7.スライス
スライスが、ピクチャを独立してコーディングされたスライスに分割し、ここで、ピクチャ中の1つのスライスの復号は、同じピクチャの他のスライスから独立している。スライスの1つの目的は、データ損失の場合に再同期を可能にすることである。
VVCの現在のバージョンでは、ピクチャが、ラスタ走査スライスまたは矩形スライスのいずれかに区分され得る。ラスタ走査スライスは、ラスタ走査順序におけるいくつかの完全なタイルからなる。矩形スライスは、ピクチャ中の矩形領域、または1つのタイルの内部の連続する数のCTU行を一緒に占有する、タイルのグループからなる。各スライスは、シンタックスエレメントを備えるスライスヘッダを有する。これらのシンタックスエレメントからの復号されたスライスヘッダ値が、スライスを復号するときに使用される。VVCでは、スライスは、CTUのセットである。
8.タイル
ドラフトVVCビデオコーディング規格は、ピクチャを矩形の空間的に独立した領域に分割する、タイルと呼ばれるツールを含む。ドラフトVVCコーディング規格におけるタイルは、HEVCにおいて使用されるタイルと同様である。タイルを使用して、VVCにおけるピクチャがCTUの行および列に区分され得、ここで、タイルは行と列との交差部である。図1Aは、ピクチャのための合計20個のタイルを生じる、4つのタイル行と5つのタイル列とを使用するタイル区分の一例を示す。
タイル構造は、行の厚さと列の幅とを指定することによって、ピクチャパラメータセット(PPS)中でシグナリングされる。個々の行および列は、異なるサイズを有することができるが、区分は、常に、それぞれ左から右に、および上から下に、ピクチャ全体にわたってスパンする。
同じピクチャのタイル間に復号依存性はない。これは、イントラ予測と、エントロピーコーディングのためのコンテキスト選択と、動きベクトル予測とを含む。1つの例外は、ループ内フィルタ処理依存性が概してタイル間で許容されることである。
VVCにおける矩形スライスモードでは、タイルは、さらに、各スライスが、1つのタイルの内部の連続する数のCTU行からなる、複数のスライスにスプリットされ得る。図1Bは、VVCにおけるタイル区分およびタイル区分を使用した矩形スライス区分の一例を示す。
9.サブピクチャ
サブピクチャは、VVCの現在のバージョンにおいてサポートされる。サブピクチャは、サブピクチャが、ピクチャの矩形領域をまとめてカバーする1つまたは複数のスライスを含んでいるような、ピクチャ内の1つまたは複数の矩形スライスの矩形領域として規定される。VVC仕様の現在のバージョンでは、サブピクチャロケーションおよびサイズは、SPS中でシグナリングされる。表1は、VVCの現在のバージョンにおけるSPS中のサブピクチャシンタックスを示す。
Figure 2023524944000002
以下の表2は、VVCドラフトテキストにおける対応するセマンティクスを含んでいる。
Figure 2023524944000003
要約すると、矩形スライスは、整数個のCTUからなる。サブピクチャは、整数個のCTUからなり、したがって、サブピクチャはまた、整数個のCTUからなる。
VVC規格化への提案、JVET-R0135-v4では、表1に示されている情報のより効率的なシグナリングのための方法が提案された。方法は、サブピクチャユニットの幅および高さをシグナリングすることからなり、それは、次いで、subpic_ctu_top_left_x[i]、subpic_ctu_top_left_y[i]、subpic_width_minus1[i]、およびsubpic_height_minus1[i]シンタックスエレメントをシグナリングするためのグラニュラリティとして使用される。
現在、いくつかの課題が存在する。たとえば、JVET-R0135-v4のソリューションに関する1つの問題は、方法が、ピクチャ幅および高さがサブピクチャユニットの倍数であるときに機能するにすぎないことである。これは、方法が多くのピクチャサイズおよびサブピクチャレイアウトに適用され得ないので、方法の有用性を著しく低減する。
したがって、本開示は、JVET-R0135-v4において説明されるサブピクチャユニットと同様の1つまたは複数のスケールファクタを導入する。サブピクチャの左上コーナーの位置も、JVET-R0135-v4方法と同様に計算される。
しかしながら、JVET-R0135方法とは対照的に、本明細書で開示される提案される方法は、最初に、復号されたスケールファクタ値と復号されたサブピクチャ幅値とを乗算することによって、サブピクチャについての初期幅値を算出する。次いで、サブピクチャについての初期幅値+サブピクチャの左上コーナー位置の水平位置がCTUの数におけるピクチャ幅よりも大きい場合、サブピクチャの幅は、ピクチャ幅-左上コーナーの水平位置に等しくセットされる。他の場合、サブピクチャの幅は、サブピクチャについての初期幅値に等しくセットされる。提案される方法はまた、画像の高さを使用して、および同じ復号されたスケールファクタ値または別の復号されたスケールファクタ値のいずれかを使用して、サブピクチャの高さを導出するために使用され得る。利点は、この方法が、ピクチャ幅または高さがサブピクチャユニットまたはスケールファクタの倍数でないサブピクチャレイアウトに適用され得ることである。
本開示の第1の態様によれば、ビットストリームからピクチャ中のサブピクチャ(SP)についての位置を復号するための方法が提供される。本方法は、ビットストリーム中の第1のシンタックスエレメントS1からCTUサイズを復号することを含む。本方法は、スケールファクタ値Fを取得することであって、Fが1よりも大きい、スケールファクタ値Fを取得することを含む。本方法は、サブピクチャSPについてのスケーリングされた位置値を導出することであって、スケーリングされた位置値を導出することが、i)ビットストリーム中の情報に基づいて位置値を取得することと、ii)スケーリングされた位置値を位置値とFとの積に等しくセットすることとを含む、スケーリングされた位置値を導出することを含む。
本開示の第2の態様によれば、処理回路によって実行されたとき、処理回路に、第1の態様による方法を実施させる命令を備えるコンピュータプログラムが提供される。
本開示の第3の態様によれば、第2の態様によるコンピュータプログラムを含んでいるキャリアが提供され、キャリアは、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体のうちの1つである。
本開示の第4の態様によれば、装置が提供され、装置は、第1の態様による方法を実施するように適応される。
本明細書に組み込まれ、明細書の一部をなす添付の図面は、様々な実施形態を示している。
4つのタイル行と5つのタイル列とを使用するタイル区分の一例を示す図である。 VVCにおけるタイル区分およびタイル区分を使用した矩形スライス区分の一例を示す図である。 例示的な一実施形態による、システムを示す図である。 一実施形態による、エンコーダの概略ブロック図である。 一実施形態による、デコーダの概略ブロック図である。 一実施形態による、プロセスを示すフローチャートである。 一実施形態による、装置のブロック図である。
図2は、例示的な一実施形態による、システム200を示す。システム200は、ネットワーク210(たとえば、インターネットまたは他のネットワーク)を介してデコーダ204と通信しているエンコーダ202を含む。
図3は、一実施形態による、ビデオシーケンスのビデオフレーム(ピクチャ)中のピクセル値のブロック(以下「ブロック」)を符号化するためのエンコーダ202の概略ブロック図である。同じフレーム中のまたは前のフレーム中のすでに提供されたブロックから、動き推定器350によって動き推定を実施することによって、現在ブロックが予測される。動き推定の結果は、インター予測の場合、参照ブロックに関連する動きベクトルまたは変位ベクトルである。動きベクトルは、ブロックのインター予測を出力するために動き補償器350によって利用される。イントラ予測器349が、現在ブロックのイントラ予測を算出する。動き推定器/補償器350からの出力と、イントラ予測器349からの出力とは、現在ブロックについてイントラ予測またはインター予測のいずれかを選択するセレクタ351中に入力される。セレクタ351からの出力は、加算器341の形態の誤差計算器に入力され、加算器341は、現在ブロックのピクセル値をも受信する。加算器341は、ブロックとそのブロックの予測との間のピクセル値の差として残差誤差を計算および出力する。誤差は、離散コサイン変換などによって、変換器342中で変換され、量子化器343によって量子化され、その後、エントロピーエンコーダなどによるエンコーダ344におけるコーディングが続く。インターコーディングでは、推定された動きベクトルも、現在ブロックのコード化表現を生成するためにエンコーダ344にもたらされる。また、現在ブロックのための変換および量子化された残差誤差は、元の残差誤差を取り出すために、逆量子化器345と逆方向変換器346とに提供される。この誤差は、次のブロックの予測およびコーディングにおいて使用され得る参照ブロックを作成するために、動き補償器350またはイントラ予測器349から出力されたブロック予測に加算器347によって加算される。この新しい参照ブロックは、任意のブロッキングアーティファクトをなくすためにデブロッキングフィルタ処理を実施するために、実施形態に従って、デブロッキングフィルタユニット330によって最初に処理される。次いで、処理された新しい参照ブロックは、フレームバッファ348に一時的に記憶され、ここで、処理された新しい参照ブロックは、イントラ予測器349および動き推定器/補償器350にとって利用可能である。
図4は、いくつかの実施形態による、デコーダ204の対応する概略ブロック図である。デコーダ204は、量子化および変換された残差誤差のセットを得るためにブロックの符号化表現を復号するための、エントロピーデコーダなどのデコーダ461を備える。これらの残差誤差は、逆量子化器462において量子化解除され、逆方向変換器463によって逆方向変換されて、残差誤差のセットを得る。これらの残差誤差は、加算器464において参照ブロックのピクセル値に加算される。参照ブロックは、インター予測が実施されるのかイントラ予測が実施されるのかに応じて、動き推定器/補償器467またはイントラ予測器466によって決定される。それにより、セレクタ468が加算器464と動き推定器/補償器467とイントラ予測器466とに相互接続される。加算器464から出力された得られた復号されたブロックは、任意のブロッキングアーティファクトをデブロッキングフィルタ処理するために、実施形態によるデブロッキングフィルタユニット330に入力される。フィルタ処理されたブロックは、デコーダ504から出力され、さらに、好ましくは、フレームバッファ465に一時的に提供され、復号されるべき後続のブロックのための参照ブロックとして使用され得る。フレームバッファ465は、それにより、動き推定器/補償器467に接続されて、ピクセルの記憶されたブロックを動き推定器/補償器467にとって利用可能にする。加算器464からの出力はまた、好ましくは、イントラ予測器466に入力されて、フィルタ処理されていない参照ブロックとして使用される。
実施形態
以下の説明では、上記で説明された問題のうちの1つまたは複数を解決する様々な実施形態が説明される。2つまたはそれ以上の実施形態、または実施形態の一部が組み合わせられて、依然として本開示によってカバーされる新しいソリューションを形成し得ることが、当業者によって理解されるべきである。
以下で説明される実施形態では、本方法は、ピクチャのレイアウトまたはサブピクチャへのピクチャの区分のシグナリングに適用される。この場合、サブピクチャは、複数の矩形スライスのセットからなり得る。矩形スライスはCTUからなり得る。矩形スライスはタイルからなり得、タイルはCTUからなり得る。
実施形態における方法は、スライス、矩形スライスまたはタイルあるいはセグメントへのピクチャの任意の他のセグメンテーションなど、任意のタイプのピクチャ区分をシグナリングするために使用され得る。すなわち、任意の区分が、区分のリストまたはセットを使用してシグナリングされ得、ここで、各区分が、その区分の左上コーナーといった、1のコーナー位置の空間位置と、その区分の高さおよび幅と、によってシグナリングされる。
CTUは、より小さいかまたはサブピクチャに等しい任意のタイプの矩形ピクチャユニットであり得る。CTU以外の他のピクチャユニットの例は、コーディングユニット(CU)、予測ユニットおよびマクロブロック(MB)を含む。
代替形態1
第1の実施形態では、ピクチャは、少なくとも2つのサブピクチャ、すなわち、第1のサブピクチャと第2のサブピクチャとからなる。各サブピクチャについて、サブピクチャの空間レイアウトが、サブピクチャの左上コーナーの位置+サブピクチャの幅および高さを指定する情報によって、ビットストリーム中でデコーダ204に伝達される。
ビットストリームからコード化ピクチャを復号するデコーダ204は、最初に、ビットストリーム中の1つまたは複数のシンタックスエレメントからピクチャを復号するために使用すべきCTUサイズを復号する。CTUは、正方形であると見なされ、したがって、CTUサイズは、ここでは、CTUのルーマ平面の一方の側の長さを表す1つの数である。これは、本開示では、1次元CTUサイズと呼ばれる。
デコーダは、さらに、ビットストリームから1つまたは複数のスケールファクタ値を復号する。スケールファクタは、好ましくは、1よりも大きい正の整数値である。同じCTUサイズ値およびスケールファクタが、ピクチャのすべてのサブピクチャについての空間ロケーションを復号するために使用される。この第1の実施形態では、単一のスケールファクタが使用される。
デコーダ204は、各サブピクチャについて、以下にリストされるステップを実施することによって、少なくとも2つのサブピクチャについての空間ロケーションを復号する。
ステップ1:サブピクチャについてのスケーリングされた水平位置値(H)を、ビットストリーム中のあるシンタックスエレメントを復号し、それにより、水平位置値を取得し、その水平位置値にスケールファクタを乗算して、スケーリングされた水平位置値(H)を作り出すことによって、導出する。
ステップ2:サブピクチャのスケーリングされた垂直位置値(V)を、ビットストリーム中の別のシンタックスエレメントを復号し、それにより、垂直位置値を取得し、垂直位置値にスケールファクタを乗算し、それにより、スケーリングされた垂直位置値(V)を作り出すことによって、導出する。
ステップ3:サブピクチャについての第1の幅値を、特定のシンタックスエレメントを復号することによって、導出し、取得された第1の幅値にスケールファクタを乗算することによって初期幅値を算出する。次いで、初期幅値+スケーリングされた水平位置値(H)に等しい値が、ピクチャ幅と比較される。この値(すなわち、初期幅+スケーリングされた水平位置)がピクチャ幅よりも大きい場合、サブピクチャの幅は、最右サブピクチャ境界が右ピクチャ境界と整合するように、ピクチャ幅-スケーリングされた水平位置(H)に等しくセットされ、他の場合、サブピクチャの幅は、初期幅に等しくセットされる。
サブピクチャ高さを導出するために同様のステップが行われる。
最初に、シンタックスエレメントを復号することによって、サブピクチャについての第1の高さ値が導出される。次いで、第1の高さ値にスケールファクタを乗算することによって、初期高さ値が算出される。次いで、初期高さ値+スケーリングされた垂直位置値(V)に等しい値が、ピクチャ高さと比較される。この値(すなわち、初期高さ+スケーリングされた垂直位置(V))がピクチャ高さよりも大きい場合、サブピクチャの高さは、下部サブピクチャ境界が下部ピクチャ境界と整合するように、ピクチャ高さ-スケーリングされた垂直位置(V)に等しくセットされ、他の場合、サブピクチャの高さは、初期高さに等しくセットされる。
したがって、以下のステップが、ビットストリームからピクチャ中のサブピクチャSPについての位置およびサイズを復号するためにデコーダ204によって実施され得る。
・ ビットストリーム中のシンタックスエレメントS1から1次元CTUサイズを復号すること、
・ ビットストリーム中の1つまたは複数のシンタックスエレメントS3から1つまたは複数のスケールファクタ値Fを復号することであって、スケールファクタ値Fが1よりも大きい値である、1つまたは複数のスケールファクタ値Fを復号すること、
・ 以下によって、CTUサイズの単位でサブピクチャSPの水平位置Hを導出すること、
○ ビットストリーム中のシンタックスエレメントS4を復号することであって、シンタックスエレメントS4の値が、ユニットサイズの数における水平位置を表し、ユニットサイズが、スケールファクタ値FにCTUサイズを乗算したものに等しい、シンタックスエレメントS4を復号すること、および
○ 水平位置Hを、シンタックスエレメントS4の値にスケールファクタ値Fを乗算したものにセットすること、
・ 以下によって、CTUサイズの単位でサブピクチャSPの垂直位置Vを導出すること、
○ ビットストリーム中のシンタックスエレメントS5を復号することであって、シンタックスエレメントS5の値が、ユニットサイズの数における垂直位置を表す、シンタックスエレメントS5を復号すること、および
○ 垂直位置Vを、シンタックスエレメントS5の値にスケールファクタ値Fを乗算したものにセットすること、
・ 以下によって、CTUサイズの単位でサブピクチャSPの幅を導出すること、
○ ビットストリーム中のシンタックスエレメントS6を復号することであって、シンタックスエレメントS6の値が、ユニットサイズの数における幅値を表す、シンタックスエレメントS6を復号すること、
○ サブピクチャSPの初期幅Iwを、シンタックスエレメントS6の値にスケールファクタ値Fを乗算したものとして算出すること、および
○ サブピクチャSPの初期幅Iw+水平位置HがCTUサイズの単位でのピクチャ幅よりも大きい場合、サブピクチャSPの幅を、CTUサイズの単位でのピクチャ幅-CTUサイズの単位での水平位置Hに等しくセットすること。他の場合、サブピクチャSPの幅を初期幅Iwに等しくセットする、
・ 以下によって、CTUサイズの単位でサブピクチャSPの高さを導出すること、
○ ビットストリーム中のシンタックスエレメントS7を復号することであって、シンタックスエレメントS7の値が、ユニットサイズの数における高さ値を表す、ビットストリーム中のシンタックスエレメントS7を復号すること、
○ サブピクチャSPの初期高さIhを、シンタックスエレメントS7の値にスケールファクタ値Fを乗算したものとして算出すること、および
○ サブピクチャSPの初期高さIh+垂直位置Vが、CTUサイズの単位でのピクチャ高さよりも大きい場合、サブピクチャSPの高さを、CTUサイズの単位でのピクチャ高さ-CTUサイズの単位での垂直位置Vに等しくセットすること。他の場合、サブピクチャSPの高さを初期高さIhに等しくセットする。
サブピクチャは、ここでは、整数個の1つまたは複数の完全なスライスからなり、それにより、サブピクチャは、ピクチャの矩形領域をカバーするコード化データを備え、ここで、その領域はピクチャ全体とは限らない。
実施形態の好ましいバージョンでは、シンタックスエレメントS1、S3、S4、S5、S6およびS7がSPSから復号される。この実施形態の他のバージョンでは、シンタックスエレメントS1、S3、S4、S5、S6およびS7のうちの1つまたは複数が、PPS、ピクチャヘッダ、スライスヘッダから、または復号能力情報(DCI)から復号され得る。
値を導出するためにシンタックスエレメントを復号することは、ビットストリーム中で表される値が、その値が復号されるときに1の値だけ増加されるような、「プラス1」動作を含み得る。これは、VVCにおいて通常使用され、シンタックスエレメントの名前で使用される「minus1」サフィックスによって指示される。本明細書では、シンタックスエレメントが+1動作を受けることも受けないこともある。
代替形態2
別の実施形態では、1つではなく2つのスケールファクタが使用される。これは、ビットストリームから、2つの異なるスケールファクタ、すなわち、サブピクチャの水平位置および幅など、水平値を導出するための1つと、サブピクチャの垂直位置および高さなど、垂直値を導出するための1つと、が復号されることを意味する。
図6は、いくつかの実施形態による、デコーダ204および/またはエンコーダ202を実装するための装置600のブロック図である。装置600がデコーダを実装するとき、装置600は「復号装置600」と呼ばれることがあり、装置600がエンコーダを実装するとき、装置600は「符号化装置600」と呼ばれることがある。図6に示されているように、装置600は、1つまたは複数のプロセッサ(P)655(たとえば、汎用マイクロプロセッサ、および/または、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など、1つまたは複数の他のプロセッサなど)を含み得る処理回路(PC)602であって、そのプロセッサが、単一のハウジングにおいてまたは単一のデータセンタにおいて共同サイト式であり得るかあるいは地理的に分散され得る(すなわち、装置600が分散コンピューティング装置であり得る)、処理回路(PC)1202と、少なくとも1つのネットワークインターフェース648であって、装置600が、ネットワークインターフェース648が(直接または間接的に)接続されるネットワーク110(たとえば、インターネットプロトコル(IP)ネットワーク)に接続された他のノードにデータを送信し、他のノードからデータを受信することを可能にするための送信機(Tx)645および受信機(Rx)647を備える(たとえば、ネットワークインターフェース648はネットワーク110に無線で接続され得、その場合、ネットワークインターフェース648はアンテナ構成に接続される)、少なくとも1つのネットワークインターフェース648と、1つまたは複数の不揮発性記憶デバイスおよび/または1つまたは複数の揮発性記憶デバイスを含み得る記憶ユニット(別名「データ記憶システム」)608とを備え得る。PC602がプログラマブルプロセッサを含む実施形態では、コンピュータプログラム製品(CPP)641が提供され得る。CPP641はコンピュータ可読媒体(CRM)642を含み、CRM642は、コンピュータ可読命令(CRI)644を備えるコンピュータプログラム(CP)643を記憶する。CRM642は、磁気媒体(たとえば、ハードディスク)、光媒体、メモリデバイス(たとえば、ランダムアクセスメモリ、フラッシュメモリ)など、非一時的コンピュータ可読媒体であり得る。いくつかの実施形態では、コンピュータプログラム643のCRI644は、PC602によって実行されたとき、CRIが、装置600に、本明細書で説明されるステップ(たとえば、フローチャートを参照しながら本明細書で説明されるステップ)を実施させるように設定される。他の実施形態では、装置600は、コードの必要なしに本明細書で説明されるステップを実施するように設定され得る。すなわち、たとえば、PC602は、単に1つまたは複数のASICからなり得る。したがって、本明細書で説明される実施形態の特徴は、ハードウェアおよび/またはソフトウェアで実装され得る。
様々な実施形態が本明細書で説明されたが、それらの実施形態は、限定ではなく、例として提示されたにすぎないことを理解されたい。したがって、本開示の広さおよび範囲は、上記で説明された例示的な実施形態のいずれによっても限定されるべきでない。その上、本明細書で別段に指示されていない限り、またはコンテキストによって明確に否定されていない限り、上記で説明されたエレメントのそれらのすべての考えられる変形形態における任意の組合せが、本開示によって包含される。
さらに、上記で説明され、図面に示されたプロセスは、ステップのシーケンスとして示されたが、これは、説明のためにのみ行われた。したがって、いくつかのステップが追加され得、いくつかのステップが省略され得、ステップの順序が並べ替えられ得、いくつかのステップが並行して実施され得ることが企図される。

Claims (13)

  1. ビットストリームからピクチャ中のサブピクチャ(SP)についての位置およびサイズを復号するための方法(500)であって、前記方法は、
    前記ビットストリーム中の第1のシンタックスエレメントS1からコーディングツリーユニット(CTU)サイズを復号することと、
    スケールファクタ値Fを取得することであって、Fが1よりも大きい、スケールファクタ値Fを取得することと、
    前記サブピクチャSPについてのスケーリングされた位置値を導出することであって、前記スケーリングされた位置値を導出することが、i)前記ビットストリーム中の情報に基づいて位置値を取得することと、ii)前記スケーリングされた位置値を前記位置値とFとの積に等しくセットすることとを含む、スケーリングされた位置値を導出することと、
    前記スケーリングされた位置値に基づいて前記サブピクチャのサイズを導出することと
    を含む、方法(500)。
  2. i)前記位置値が、水平位置値hであり、前記スケーリングされた位置値が、スケーリングされた水平位置値H=h×Fであり、前記サブピクチャの前記サイズが、前記サブピクチャの幅Wspである、および
    ii)前記位置値が、垂直位置値vであり、前記スケーリングされた位置値が、スケーリングされた垂直位置値V=v×Fであり、前記サブピクチャの前記サイズが、前記サブピクチャの高さHspである、
    のうちの少なくとも1つである、請求項1に記載の方法。
  3. 前記サブピクチャの前記サイズを導出することが、Hに基づいて前記サブピクチャの幅Wspを導出することを含み、Hに基づいてWspを導出することは、
    i)前記ビットストリーム中の情報に基づいて第1の幅値w1を取得することと、
    ii)初期幅値Iwを、Iw=(w1)×(F)を算出することによって取得することと、
    iii)(Iw+H)をPwと比較することであって、Pwが、前記ピクチャの幅を指定する、(Iw+H)をPwと比較することと、
    iv)(Iw+H>Pw)である場合、Wspを(Pw-H)に等しくセットし、他の場合、WspをIwに等しくセットすることと
    を含む、請求項2に記載の方法。
  4. 前記サブピクチャの前記サイズを導出することが、Vに基づいて前記サブピクチャの高さHspを導出することを含み、Vに基づいてHspを導出することは、
    i)前記ビットストリーム中の情報に基づいて第1の高さ値h1を取得することと、
    ii)初期高さ値Ihを、Ih=(h1)×(F)を算出することによって取得することと、
    iii)(Ih+V)をPhと比較することであって、Phが、前記ピクチャの高さを指定する、(Ih+V)をPhと比較することと、
    iv)(Ih+V>Ph)である場合、Hspを(Ph-V)に等しくセットし、他の場合、HspをIhに等しくセットすることと
    を含む、請求項2に記載の方法。
  5. 前記ビットストリーム中の情報に基づいて前記水平位置値hを取得することは、
    hを取得するために前記ビットストリーム中のシンタックスエレメントS4を復号することであって、前記シンタックスエレメントS4の値が、ユニットサイズの数における水平位置を表し、前記ユニットサイズが、前記スケールファクタ値Fに前記CTUサイズを乗算したものに等しい、シンタックスエレメントS4を復号すること
    を含む、請求項1から4のいずれか一項に記載の方法。
  6. 前記ビットストリーム中の情報に基づいて前記垂直位置値vを取得することは、
    vを取得するために前記ビットストリーム中のシンタックスエレメントS5を復号することであって、前記シンタックスエレメントS5の値が、ユニットサイズの数における垂直位置を表す、シンタックスエレメントS5を復号すること
    を含む、請求項1から5のいずれか一項に記載の方法。
  7. 異なる値を有する2つの別個のスケールファクタ値F1およびF2が取得され、
    一方のスケールファクタ値F1が、前記サブピクチャの前記水平位置および前記サブピクチャの前記幅のうちの少なくとも1つを導出するためのスケールファクタ値Fとして使用され、
    他方のスケールファクタ値F2が、前記サブピクチャの前記垂直位置および前記サブピクチャの前記高さのうちの少なくとも1つを導出するためのスケールファクタ値Fとして使用される、
    請求項1から6のいずれか一項に記載の方法。
  8. 前記シンタックスエレメントS1、S4およびS5のうちの1つまたは複数が、シーケンスパラメータセット(SPS)から復号される、請求項1から7のいずれか一項に記載の方法。
  9. 前記シンタックスエレメントS1、S4およびS5のうちの1つまたは複数が、ピクチャパラメータセット(PPS)、ピクチャヘッダ、スライスヘッダから、または復号能力情報(DCI)から復号され得る、請求項1から8のいずれか一項に記載の方法。
  10. 処理回路(602)によって実行されたとき、前記処理回路(602)に、請求項1から9のいずれか一項に記載の方法を実施させる命令(644)を備える、コンピュータプログラム(643)。
  11. 請求項10に記載のコンピュータプログラムを含んでいるキャリアであって、前記キャリアが、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体(642)のうちの1つである、キャリア。
  12. 請求項1から9のいずれか一項に記載の方法を実施するように適合された、装置(600)。
  13. 装置(600)であって、前記装置が、
    処理回路(602)と、
    メモリ(642)と
    を備え、前記メモリが、前記処理回路によって実行可能な命令(644)を含んでおり、それにより、前記装置が、請求項1から9のいずれか一項に記載の方法を実施するように動作可能である、装置(600)。
JP2022564214A 2020-04-22 2021-03-24 圧縮されたピクチャインピクチャシグナリング Pending JP2023524944A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063013923P 2020-04-22 2020-04-22
US63/013,923 2020-04-22
PCT/SE2021/050257 WO2021215978A1 (en) 2020-04-22 2021-03-24 Compresssed picture-in-picture signaling

Publications (1)

Publication Number Publication Date
JP2023524944A true JP2023524944A (ja) 2023-06-14

Family

ID=78269785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022564214A Pending JP2023524944A (ja) 2020-04-22 2021-03-24 圧縮されたピクチャインピクチャシグナリング

Country Status (5)

Country Link
US (1) US20240040130A1 (ja)
EP (1) EP4140130A4 (ja)
JP (1) JP2023524944A (ja)
CN (1) CN115462074A (ja)
WO (1) WO2021215978A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI262725B (en) * 2005-06-30 2006-09-21 Cheertek Inc Video decoding apparatus and digital audio and video display system capable of controlling presentation of subtitles and method thereof
KR20230106707A9 (ko) * 2018-07-09 2024-03-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩된 화상의 다양한 공간 분할을 위한 인코더 및 디코더, 인코딩 방법 및 디코딩 방법

Also Published As

Publication number Publication date
CN115462074A (zh) 2022-12-09
WO2021215978A1 (en) 2021-10-28
EP4140130A4 (en) 2023-10-25
US20240040130A1 (en) 2024-02-01
EP4140130A1 (en) 2023-03-01

Similar Documents

Publication Publication Date Title
US20240146960A1 (en) Intra-prediction method, and encoder and decoder using same
EP3417615B1 (en) Merging filters for multiple classes of blocks for video coding
EP3295672B1 (en) Search region determination for inter coding within a particular picture of video data
US9609326B2 (en) Image encoding device, image decoding device, image encoding method, and image decoding method for generating a prediction image
EP3202150B1 (en) Rules for intra-picture prediction modes when wavefront parallel processing is enabled
KR102369117B1 (ko) 비대칭 구획을 갖는 인트라 블록 카피 예측 및 인코더측 검색 패턴, 검색 범위 및 구획화 접근법
JP7403555B2 (ja) イントラコーディングモードにおけるマトリクスの導出
JP2022526991A (ja) ビデオ処理方法、装置、記憶媒体、及び記録媒体
KR102653005B1 (ko) 휘도 샘플을 이용한 색차 블록의 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
US20230109828A1 (en) Image encoding/decoding methods and apparatuses
RU2654129C2 (ru) Функциональные возможности режима внутреннего предсказания с блочным копированием для кодирования и декодирования видео и изображений
JP2022534320A (ja) マトリクスベースイントラ予測のためのコンテキスト決定
CN113873241A (zh) 用于对视频进行解码的方法和用于对视频进行编码的方法
US20160080753A1 (en) Method and apparatus for processing video signal
JP2022533190A (ja) アップサンプリングを使用した行列ベースのイントラ予測
KR20190052097A (ko) 영상 처리 방법 및 이를 위한 장치
JP2022553789A (ja) カラーコンポーネントに基づくシンタックスシグナリング及び構文解析
KR20220006055A (ko) 다중 인트라 코딩 방법 사이의 상호 작용
CN113347429A (zh) 图像信号编码/解码方法及其设备
US11736712B2 (en) Method and apparatus for encoding or decoding video signal
CN113507603A (zh) 图像信号编码/解码方法及其设备
JP2024020420A (ja) 適応ループフィルタリングのための境界位置
JPWO2020211807A5 (ja)
WO2022037700A1 (en) Coding mode dependent selection of transform skip mode
US20240040130A1 (en) Compresssed picture-in-picture signaling

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230104

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240604