JP2022552436A - 参照ピクチャを再サンプリングするための方法、計算デバイス、コンピュータ可読記憶媒体、コンピュータプログラム - Google Patents

参照ピクチャを再サンプリングするための方法、計算デバイス、コンピュータ可読記憶媒体、コンピュータプログラム Download PDF

Info

Publication number
JP2022552436A
JP2022552436A JP2022539074A JP2022539074A JP2022552436A JP 2022552436 A JP2022552436 A JP 2022552436A JP 2022539074 A JP2022539074 A JP 2022539074A JP 2022539074 A JP2022539074 A JP 2022539074A JP 2022552436 A JP2022552436 A JP 2022552436A
Authority
JP
Japan
Prior art keywords
filter
downsampling
inter
decoder
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022539074A
Other languages
English (en)
Other versions
JP7239786B2 (ja
Inventor
シュウ,シャオユウ
チェン,イ-ウェン
マ,ツン-チュアン
ジュ,ホン-ジェン
ワン,シャンリン
ユ,ビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of JP2022552436A publication Critical patent/JP2022552436A/ja
Priority to JP2023032279A priority Critical patent/JP2023065601A/ja
Application granted granted Critical
Publication of JP7239786B2 publication Critical patent/JP7239786B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • H04N19/428Recompression, e.g. by spatial or temporal decimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本発明は映像信号をデコードするための方法、装置及び非一時的なコンピュータ可読記憶媒体を提供する。デコーダは映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得する。デコーダは更に参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得できる。それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように、デコーダは更に第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得できる。映像ブロックがアフィンモードで符号化される場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように、デコーダは更に第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得できる。デコーダは更に第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることにより映像ブロックのインター予測サンプルを取得できる。

Description

関連出願の相互参照
本願は、2019年12月24日に提出した仮出願No.62/953,471に基づくものであり、且つ該仮出願の優先権を主張し、全ての目的のために、該仮出願の全ての内容が援用により本願に取り込まれる。
本開示は映像の符号化及び圧縮に関する。より具体的に、本開示は映像符号化のための参照ピクチャ再サンプリング技術についての方法及び装置に関する。
様々な映像符号化技術は映像データを圧縮するために用いられることができる。映像符号化は1つ又は複数の映像符号化標準に従って行われる。例えば、映像符号化標準は汎用映像符号化(VVC)、共同探索テストモデル(JEM)、高効率映像符号化(H.265/HEVC)、高度映像符号化(H.264/AVC)、動画専門家集団(MPEG)符号化等を含む。映像符号化は一般的に映像画像又はシーケンスに存在する冗長を利用する予測方法(例えば、インター予測、イントラ予測等)を用いる。映像符号化技術の1つの重要な目標は映像データを、比較的に低いビットレートを用いる形式に圧縮するとともに、映像品質の低下を回避又は最小化することである。
本開示の例は参照ピクチャを再サンプリングするための方法及び装置を提供する。
本開示の第1態様に従って、映像信号をデコードするための方法を提供する。該方法は、デコーダが映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得することを含んでもよい。デコーダはまた参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得してもよい。iとjが映像ブロック内の1つのサンプルの座標を表現してもよい。映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、デコーダは、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを更に取得してもよい。映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、デコーダはまた、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得してもよい。デコーダは第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることに基づいて、映像ブロックのインター予測サンプルを更に取得してもよい。
本開示の第2態様に従って、計算デバイスを提供する。該計算デバイスは1つ又は複数のプロセッサと、前記1つ又は複数のプロセッサにより実行され得る命令が記憶される非一時的なコンピュータ可読メモリと、を備えてもよい。前記1つ又は複数のプロセッサは映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得するように配置されてもよい。前記1つ又は複数のプロセッサはまた、参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得するように配置されてもよい。iとjが映像ブロック内の1つのサンプルの座標を表現してもよい。前記1つ又は複数のプロセッサは更に、映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得するように配置されてもよい。前記1つ又は複数のプロセッサはまた、映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得するように配置されてもよい。前記1つ又は複数のプロセッサは更に、第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることに基づいて映像ブロックのインター予測サンプルを取得するように配置されてもよい。
本開示の第3態様に従って、命令が記憶される非一時的なコンピュータ可読記憶媒体を提供する。これらの命令が前記装置の1つ又は複数のプロセッサにより実行される時、これらの命令は該装置に映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得させることができる。これらの命令はまた、該装置に参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得させることができる。iとjが映像ブロック内の1つのサンプルの座標を表現してもよい。これらの命令は更に、該装置に、映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得させることができる。これらの命令はまた、該装置に、映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得させることができる。これらの命令は更に、該装置に、第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることに基づいて映像ブロックのインター予測サンプルを取得させることができる。
理解されるように、以上の一般的な説明及び以下の詳細な説明の両方は例示的なものであって、本開示を制限するものではない。
本明細書に結合され且つ本明細書の一部を構成する添付図面は本開示に一致する例を示し、且つ説明とともに本開示の原理を解釈するためのものである。
図1は本開示の一例に係るエンコーダのブロック図である。 図2は本開示の一例に係るデコーダのブロック図である。 図3Aは本開示の一例に係るマルチタイプ木構造のブロック分割を示す図である。 図3Bは本開示の一例に係るマルチタイプ木構造のブロック分割を示す図である。 図3Cは本開示の一例に係るマルチタイプ木構造のブロック分割を示す図である。 図3Dは本開示の一例に係るマルチタイプ木構造のブロック分割を示す図である。 図3Eは本開示の一例に係るマルチタイプ木構造のブロック分割を示す図である。 図4Aは本開示の一例に係る4パラメータアフィンモデルの図示である。 図4Bは本開示の一例に係る4パラメータアフィンモデルの図示である。 図5は本開示の一例に係る6パラメータアフィンモデルの図示である。 図6は本開示の一例に係る適応ビット深度切替の図示である。 図7は本開示の一例に係る映像信号をデコードするための方法である。 図8は本開示の一例に係る映像信号をデコードするための方法である。 図9は本開示の一例に係るユーザーインターフェースに結合される計算環境を示す図である。
以下、例示的な実施例を詳しく参照し、その例を添付図面に示す。以下の説明は、添付図面について言及するが、異なる図面内の同じ番号は、表されていない場合を除き、同じまたは類似の要素を表す。例示的な実施例の以下の説明に記述されている実現は、本開示と整合する全ての実現を表しているわけではない。それよりもむしろ、それら実現は、単に添付の特許請求の範囲で説明されるような本開示に関連する態様と整合する装置および方法の例である。
本開示で使用される用語は、特定の実施形態を説明することのみを目的としており、本開示を限定することを意図していない。本開示および添付の特許請求の範囲で使用される場合、文脈上特に明記されていない限り、単数形「a」、「an」および「the」は、同様に複数形を含むことも意図する。本明細書で使用される「および/または」という用語は、1つまたは複数の関連する列挙されたアイテムの任意または全ての可能な組み合わせを表すことを意図し、かつそれらを包含することも理解されたい。
種々の情報を説明するために、用語「第1」、「第2」、「第3」などが本明細書で使用される場合があるが、これらの情報は、これらの用語によって制限されるべきではないこともさらに理解される。これらの用語は、情報のあるカテゴリーを別のものと区別するためのみに使用される。例えば、本開示の範囲から逸脱することなく、第1情報は第2情報と称される場合があり、また同様に、第2情報は、第1情報と称される場合もある。本明細書で使用される場合、用語「~する場合」は、「~するとき」、「~の際」、あるいは文脈によって「判断に応じて」を意味すると理解される場合がある。
HEVC標準の第1版は2013年10月に完成され、前世代映像符号化標準H.264/MPEG AVCに比べて、約50%のビットレートの節約又は同等の感知品質を提供する。HEVC標準はその前にあったものに比べて符号化の顕著な改善を提供するが、追加の符号化ツールを利用してHEVCよりも優れた符号化効率を実現できるという証拠がある。これに基づいて、VCEG及びMPEGはいずれも将来の映像符号化を標準化するための新たな符号化技術についての探索作業を開始した。符号化効率の大幅な向上を達成できる先進的な技術についての大きな研究を始めるよう、共同映像探索チーム(JVET)は2015年10月にITU-T VECG及びISO/IEC MPEGにより成立された。共同探索モデル(JEM)と称される1つの参照ソフトウェアは、JVETによってHEVCテストモデル(HM)にいくつかの追加の符号化ツールを統合することで支持されている。
2017年10月に、ITU-T及びISO/IECはHEVCを超える能力を有する映像圧縮についての共同提案募集(CfP)を発表した。2018年4月に、第10回JVET会議において、23部のCfP応答が受信されそして評価され、それはHEVCよりも約40%高い圧縮効率ゲインを展示した。このような評価結果に基づいて、JVETは新たなプロジェクトを開始して汎用映像符号化(VVC)と命名される新世代の映像符号化標準を開発する。同月に、VVC標準の参照実現を展示するためにVVCテストモデル(VTM)と称される1つの参照ソフトウェアコードベースが設立された。
HEVCのように、VVCはブロックベースのハイブリッド映像符号化フレームワークの上に確立されたものである。
図1はVVCのためのブロックベースの映像エンコーダの全体図を示す。具体的に、図1は代表的なエンコーダ100を示す。エンコーダ100は映像入力110、動き補償112、動き推定114、イントラ/インターモード決定116、ブロック予測器140、加算器128、変換130、量子化132、予測関連情報142、イントラ予測118、ピクチャバッファ120、逆量子化134、逆変換136、加算器126、メモリ124、ループ内フィルタ122、エントロピー符号化ユニット138及びビットストリーム144を有する。
エンコーダ100において、映像フレームは処理のために複数の映像ブロックに分割される。与えられた各映像ブロックに対して、インター予測方法又はイントラ予測方法に基づいて予測が形成される。
映像入力110の一部である現在映像ブロックとその予測器(ブロック予測器140の一部)との間の相違を表現する予測残差は、加算器128から変換130に送信される。次に、変換係数がエントロピー減少のために変換130から量子化132に送信される。次に、量子化された係数は、圧縮された映像ビットストリームを生成するためにエントロピー符号化ユニット138にフィードされる。図1に示されるように、映像ブロック分割情報、動きベクトル(MV)、参照ピクチャインデックス及びイントラ予測モード等のイントラ/インターモード決定116からの予測関連情報142もエントロピー符号化ユニット138を介してフィードされ、圧縮されたビットストリーム144に保存される。圧縮されたビットストリーム144は映像ビットストリームを含む。
エンコーダ100において、予測のために、画素を再構築するためのデコーダ関連回路も必要である。まず、逆量子化134及び逆変換136により予測残差を再構築する。該再構築された予測残差は、現在映像ブロックのためのフィルタリングされていない再構築画素を生成するためにブロック予測器140と組み合わされる。
空間予測(又は、「イントラ予測」)は現在映像ブロックと同じ映像フレームにおける符号化済みの隣接ブロックのサンプル(参照サンプルと称される)からの画素を使用して現在映像ブロックを予測する。
時間予測(「インター予測」とも称される)は符号化済みの映像ピクチャからの再構築画素を使用して現在映像ブロックを予測する。時間予測は映像信号における固有の時間冗長を低減する。与えられた符号化ユニット(CU)又は符号化ブロックのための時間予測信号は一般的に1つ又は複数のMVによりシグナリングされ、前記MVが現在CUとその時間参照との間の動きの量及び方向を指示する。更に、複数の参照ピクチャがサポートされると、時間予測信号が参照ピクチャ記憶におけるどの参照ピクチャからのものであるかを識別するために用いられる1つの参照ピクチャインデックスを追加して送信する。
動き推定114は映像入力110及びピクチャバッファ120からの信号を取り込み、動き推定信号を動き補償112に出力する。動き補償112は映像入力110、ピクチャバッファ120からの信号及び動き推定114からの動き推定信号を取り込み、動き補償信号をイントラ/インターモード決定116に出力する。
空間及び/又は時間予測が行われた後で、エンコーダ100におけるイントラ/インターモード決定116は例えばレート歪み適正化方法に基づいて最適な予測モードを選択する。次に、現在映像ブロックからブロック予測器140を差し引き、且つ変換130及び量子化132を使用して、得られた予測残差を脱相関する。得られた量子化残差係数は、再構築残差を形成するために逆量子化134により逆量子化され且つ逆変換136により逆変換され、再構築残差が次に予測ブロックに加算されてCUの再構築信号を形成する。更に、再構築CUがピクチャバッファ120の参照ピクチャ記憶に置かれ且つ将来の映像ブロックを符号化するために用いられる前に、デプロッキングフィルタ、サンプル適応オフセット(SAO)及び/又は適応ループ内フィルタ(ALF)等のループ内フィルタ122を再構築CUに応用してもよい。出力映像ビットストリーム144を形成するために、符号化モード(インター又はイントラ)、予測モード情報、動き情報及び量子化残差係数は全てエントロピー符号化ユニット138に送信されて更に圧縮され及びパックされ、ビットストリームが形成される。
図1は一般的なブロックベースのハイブリッド映像エンコーディングシステムのブロック図を与える。入力映像信号はブロック(CUと称される)ずつ処理される。VVCにおいて、CUは128x128画素にも達することができる。しかし、4分木のみに基づいてブロックを分割するHEVCと異なり、VVCにおいて、1つの符号化木ユニット(CTU)は4分/2分/3分木に基づいて若干のCUに分割されて、変化する局所特性に適応する。また、HEVCにおけるマルチ分割ユニットタイプの概念は取り除かれ、即ち、VVCにおいてCU、予測ユニット(PU)及び変換ユニット(TU)の分離はもはや存在せず、その代わりに、各CUは常に予測及び変換の両方の基本ユニットとして使用され、更なる分割がない。マルチタイプ木構造において、1つのCTUはまず4分木構造で分割される。次に、各4分木の葉ノードは2分及び3分木構造で更に分割されてもよい。
図3A、図3B、図3C、図3D及び図3Eに示されるように、5種類の分割タイプ、即ち四元分割、水平二元分割、垂直二元分割、水平三元分割及び垂直三元分割がある。
図3Aには本開示に係るマルチタイプ木構造におけるブロックの四元分割を示す図が示される。
図3Bには本開示に係るマルチタイプ木構造におけるブロックの垂直二元分割を示す図が示される。
図3Cには本開示に係るマルチタイプ木構造におけるブロックの水平二元分割を示す図が示される。
図3Dには本開示に係るマルチタイプ木構造におけるブロックの垂直三元分割を示す図が示される。
図3Eには本開示に係るマルチタイプ木構造におけるブロックの水平三元分割を示す図が示される。
図1では、空間予測及び/又は時間予測を行うことができる。空間予測(又は、「イントラ予測」)は同じ映像ピクチャ/スライスにおける符号化済みの隣接ブロックのサンプル(参照サンプルと称される)からの画素を使用して現在映像ブロックを予測する。空間予測は映像信号における固有の空間冗長を低減する。時間予測(「インター予測」又は「動き補償された予測」とも称される)は符号化済みの映像ピクチャからの再構築画素を使用して現在映像ブロックを予測する。時間予測は映像信号における固有の時間冗長を低減する。与えられたCUのための時間予測信号は一般的に1つ又は複数のMVによりシグナリングされ、前記MVが現在CUとその時間参照との間の動きの量及び方向を指示する。また、複数の参照ピクチャがサポートされると、時間予測信号が参照ピクチャ記憶におけるどの参照ピクチャからのものであるかを識別するために用いられる1つの参照ピクチャインデックスを追加して送信する。空間及び/又は時間予測の後で、エンコーダにおけるモード決定ブロックは例えばレート歪み適正化方法に基づいて最適な予測モードを選択する。次に、現在映像ブロックから予測ブロックを差し引き、変換及び量子化を使用して予測残差を脱相関する。量子化残差係数は逆量子化され且つ逆変換されて、再構築残差が形成され、再構築残差は次に予測ブロックに加算されてCUの再構築信号を形成する。更に、再構築CUが参照ピクチャ記憶に置かれ且つ将来の映像ブロックを符号化するために用いられる前に、デプロッキングフィルタ、SAO及びALF等のループ内フィルタリングを再構築CUに応用してもよい。出力映像ビットストリームを形成するために、符号化モード(インター又はイントラ)、予測モード情報、動き情報及び量子化残差係数は全てエントロピー符号化ユニットに送信されて更に圧縮され及びパックされ、ビットストリームが形成される。
図2はVVCのための映像デコーダの全体ブロック図を示す。具体的に、図2は代表的なデコーダ200のブロック図を示す。デコーダ200はビットストリーム210、エントロピーデコーディング212、逆量子化214、逆変換216、加算器218、イントラ/インターモード選択器220、イントラ予測222、メモリ230、ループ内フィルタ228、動き補償224、ピクチャバッファ226、予測関連情報234及び映像出力232を有する。
デコーダ200は図1におけるエンコーダ100に駐在する再構築関連部分に類似する。デコーダ200において、まず、エントロピーデコーディング212によって入って来る映像ビットストリーム210をデコードして、量子化係数レベル及び予測関連情報を得る。次に、逆量子化214及び逆変換216によって量子化係数レベルを処理して、再構築予測残差を取得する。イントラ/インターモード選択器220において実現されるブロック予測器メカニズムは、デコードされた予測情報に基づいてイントラ予測222又は動き補償224を行うように配置される。フィルタリングされていない再構築画素のセットは、加算器218を使用して逆変換216からの再構築予測残差とブロック予測器メカニズムにより生成された予測出力との和を求めることにより取得される。
再構築ブロックはピクチャバッファ226に記憶される前に更にループ内フィルタ228を通過することができ、前記ピクチャバッファ226が参照ピクチャの記憶として作用する。ピクチャバッファ226における再構築映像は、表示デバイスを駆動すること、そして将来の映像ブロックを予測するのに用いることのために送信されることができる。ループ内フィルタ228が起動される状況では、これらの再構築画素に対してフィルタリング操作を行って最終の再構築映像出力232を得る。
図2はブロックベースの映像デコーダの全体ブロック図を与える。まず、エントロピーデコーディングユニットにおいて映像ビットストリームをエントロピーデコードする。符号化モード及び予測情報は、予測ブロックを形成するために空間予測ユニット(イントラ符号化を行った場合)又は時間予測ユニット(インター符号化を行った場合)に送信される。残差変換係数は、残差ブロックを再構築するために逆量子化ユニット及び逆変換ユニットに送信される。次に予測ブロックと残差ブロックとを加算する。再構築ブロックは参照ピクチャ記憶に記憶される前に更にループ内フィルタリングを通過することができる。参照ピクチャ記憶における再構築映像は次に、表示デバイスを駆動すること、そして将来の映像ブロックを予測するのに用いることのために送信される。
本開示の着眼点はVVCでサポートされる既存の参照ピクチャ再サンプリング設計を向上させる及びそれを簡素化することにある。以下に、本開示に提出した技術に緊密に関連するVVCにおける現在符号化ツールを簡単に回顧する。
アフィンモード
HEVCにおいて、並進動きモデルのみが動き補償予測に応用される。しかし、現実の世界には、多くの動き種類例えば拡大/縮小、回転、透視動き及び他の不規則な動きが存在する。VVCにおいて、アフィン動き補償予測は、並進動きそれともアフィン動きモデルがインター予測に応用されるかを指示するために、各インター符号化ブロックに対して1つのフラグをシグナリングすることで応用される。現在のVVC設計において、1つのアフィン符号化ブロックについて、4パラメータアフィンモードと6パラメータアフィンモードとを含む2つのアフィンモードがサポートされている。
4パラメータアフィンモデルは以下のパラメータを有する:それぞれ水平方向及び垂直方向の並進運動に用いられる2つのパラメータ、この2つの方向に対して拡大縮小動きに用いられる1つのパラメータ及び回転動きに用いられる1つのパラメータ。水平拡大縮小パラメータは垂直拡大縮小パラメータに等しい。水平回転パラメータは垂直回転パラメータに等しい。より効率的なアフィンパラメータシグナリングを実現するために、VVCにおいて、現在ブロックの左上隅及び右上隅に位置付けられる2つのMV(制御点動きベクトル(CPMV)とも称される)によってこれらのアフィンパラメータが得られる。
図4A及び図4Bに示されるように、ブロックのアフィン動きフィールドは2つの制御点MV(V,V)で説明される。
図4Aは4パラメータアフィンモデルの図を示す。図4Bは4パラメータアフィンモデルの図を示す。制御点動きに基づいて、1つのアフィン符号化ブロックの動きフィールド(v,v)は以下のように説明される:
Figure 2022552436000002
6パラメータアフィンモードは以下のパラメータを有する:それぞれ水平方向及び垂直方向の並進運動に用いられる2つのパラメータ、水平方向において拡大縮小動きに用いられる1つのパラメータ及び回転動きに用いられる1つのパラメータ、垂直方向において拡大縮小動きに用いられる1つのパラメータ及び回転動きに用いられる1つのパラメータ。該6パラメータアフィン動きモデルは3つのCPMVを利用して符号化される。
図5は6パラメータアフィンモデルの図を示す。図5に示されるように、1つの6パラメータアフィンブロックの3つの制御点は該ブロックの左上隅、右上隅及び左下隅に位置付けられる。左上の制御点での動きは並進動きに関連し、右上の制御点での動きは水平方向の回転及び拡大縮小動きに関連し、且つ左下の制御点での動きは垂直方向の回転及び拡大縮小動きに関連する。4パラメータアフィン動きモデルに比べて、6パラメータの水平方向の回転及び拡大縮小動きは垂直方向のそれらの動きと同じでなくてもよい。(V,V,V)が図5における現在ブロックの左上隅、右上隅及び左下隅のMVであると仮定し、制御点での3つのMVを使用して各サブブロックの動きベクトル(v,v)が以下のように得られる:
Figure 2022552436000003
VVCにおいて、アフィン符号化ブロックのCPMVが分離したバッファに記憶される。記憶されるCPMVはアフィンマージモード(即ち、隣接のアフィンブロックからアフィンCPMVを受け継ぐ)及びアフィン明示モード(即ち、予測に基づくスキームに基づいてアフィンCPMVをシグナリングする)のアフィンCPMV予測器の生成のみに用いられる。CPMVから得られるサブブロックMVは動き補償、並進MVのMV予測及びデプロッキングに用いられる。
通常のインターブロックの動き補償と同様に、各アフィンサブブロックのMVは分数のサンプル位置での参照サンプルを指してもよい。このような場合、分数の画素位置の参照サンプルを生成するために補間フィルタリング処理が必要である。最悪な状況におけるメモリ帯域幅要求及び最悪な状況における補間の計算複雑度を制御するために、6タップ補間フィルタのセットをアフィンサブブロックの動き補償に用いる。表1及び表2はそれぞれ通常のインターブロック及びアフィンブロックの動き補償に用いられる補間フィルタについて説明した。見えるように、アフィンモードのための6タップ補間フィルタは、通常のインターブロックのための8タップフィルタの各側の2つの最外側のフィルタ係数を6タップフィルタのための1つの単一のフィルタ係数に直接に加算することにより、8タップフィルタから直接に得られ、即ち、表2におけるフィルタ係数P0及びP5はそれぞれ表1におけるフィルタ係数P0及びP1の和並びにフィルタ係数P6及びP7の和に等しい。
Figure 2022552436000004
Figure 2022552436000005
また、彩度サンプルの動き補償について、通常のインターブロックのための同じ4タップ補間フィルタ(表3に説明されるように)はアフィンブロックに使用される。
Figure 2022552436000006
参照ピクチャ再サンプリング
HEVCと異なり、新興のVVC標準は1つの同じ内容のビットストリーム内の迅速な空間解像度切替をサポートする。このような能力は参照ピクチャ再サンプリング(RPR)又は適応解像度切替(ARC)と称される。リアルタイム映像アプリケーションにおいて、ランダムアクセスをサポートするピクチャ又はイントラランダムアクセスポイント(IRAP)ピクチャ(例えば、IDRピクチャ又はCRAピクチャ等)を挿入するという要求がないで1つの符号化された映像シーケンスにおいて解像度の変化を許容するのは、圧縮された映像データを動的な通信チャネル条件に適応させることができるだけでなく、IDR又はCRAピクチャの比較的に大きな寸法による帯域幅の消費の急増を回避することもできる。具体的に、以下の代表的なユーザー状況はRPR特徴から利益を受けることができる。
映像電話及び会議におけるレート適応
符号化された映像を変化のネットワーク条件に適応させるために、ネットワーク条件が更に悪化して利用可能な帯域幅がより低くなる場合、エンコーダはより小さな解像度のピクチャをエンコードすることでこれに適応することができる。現在、ピクチャの解像度を変化することはIRAPピクチャの後でしか行われず、このため、いくつかの問題がある。合理的な品質のIRAPピクチャはインター符号化されたピクチャよりも大幅に大きく、且つそれに対応してデコーディングがより複雑になり、このため、時間及びリソースを消費してしまう。これは、ローディングのためにデコーダが解像度の変化を要求する場合に問題となる。それは、低遅延バッファ条件を打破して、音声を強制的に改めて同期させることもでき、且つストリームのエンドツーエンド遅延が少なくとも一時的に増加してしまう。これは、悪化されたユーザーエクスペリエンスをもたらしてしまう。
多方面の映像会議における活発な発言者の変化
多方面の映像会議の場合、よく見られるのは活発な発言者が残りの会議参加者の映像よりも大きな映像寸法で示される。活発な発言者が変化するとき、各参加者に用いられるピクチャ解像度も調節される必要がある。このような活発な発言者の変化が頻繁に発生する場合、ARC特徴を有する需要が更に重要となる。
ストリーミングにおける迅速な開始
ストリーミングアプリケーションの場合、よく見られるのは該アプリケーションが表示を開始する前に一定長さまでのデコードされたピクチャをバッファリングすることとなる。比較的に小さな解像度を有するビットストリームを開始するのは、表示をより速く開始するために、該アプリケーションがバッファにおいて十分に多いピクチャを有することを許容する。
ストリーミングにおける適応ストリーム切替
HTTPにおいて動的な適応型ストリーミング(DASH)規範は@mediaStreamStructureIdと称される特徴を含む。これは、デコード不可能な先頭のピクチャを有するオープンGOPランダムアクセスポイントでの異なる表示間の切替を実現できるようにし、前記ピクチャが例えばHEVCにおいて関連付けられるRASLピクチャを有するCRAピクチャである。同じ映像の2つの異なる表示は異なるビットレートを有するが、同じ空間解像度を有するとともに、それらは同じ@mediaStreamStructureId値を有する場合、関連付けられるRASLピクチャを有するCRAピクチャでのこの2つの表示の間の切替を行うことができ、且つ受け入れられる品質でCRAピクチャでの切替に関連付けられるRASLピクチャをデコードすることができ、それによりシームレス切替を実現できるようにする。ARCを利用して、@mediaStreamStructureId特徴は更に異なる空間解像度を有するDASH表示の間の切替に使用され得る。
第15回のJVET会議では、RPR特徴はVVC標準により正式にサポートされる。VVCにおいて既存のRPR設計の主な態様は以下のようにまとめられる。
RPR上級シグナリング
現在のRPR設計に従って、シーケンスパラメータセット(SPS)において、SPSを参照する符号化ピクチャの最大の幅及び高さを指定するために2つのシンタックス要素pic_width_max_in_luma_samples及びpic_height_max_in_luma_samplesはシグナリングされる。次に、ピクチャの解像度が変化する場合、PPSを参照するピクチャの異なるピクチャ解像度を指定するために関連するシンタックス要素pic_width_in_luma_samples及びpic_height_in_luma_samplesがシグナリングされるとき、1つの新たなピクチャパラメータセット(PPS)を設定する必要がある。ビットストリーム適合性が存在し、即ちpic_width_in_luma_samples及びpic_height_in_luma_samplesの値はpic_width_max_in_luma_samples及びpic_height_max_in_luma_samplesの値を超えるべきではない。表4はSPS及びPPSにおけるRPR関連シグナリングについて説明した。
Figure 2022552436000007
参照ピクチャ再サンプリング処理
1つのビットストリーム内に解像度が変化する場合、現在ピクチャは異なる寸法の1つ又は複数の参照ピクチャを有する可能性がある。現在のRPR設計に従って、ピクチャの解像度が変化する場合、現在ピクチャの全てのMVは参照ピクチャのサンプルグリッドではなく現在ピクチャのサンプルグリッドに規格化される。これは、ピクチャの解像度の変化がMV予測処理にとって透明になるようにすることができる。
ピクチャの解像度が変化する場合、MV以外に、現在ブロックの動き補償期間に更に必ず1つの参照ブロックにおけるサンプルをアンサンプリング/ダウンサンプリングしなければならない。VVCにおいて、拡大縮小比率即ちrefPicWidthInLumaSample/picWidthInLuma及びrefPicHeightInLumaSample/picHeightInLumaSampleは範囲[1/8,2]に制限される。
現在のRPR設計において、現在ピクチャ及びその参照ピクチャが異なる解像度である場合、異なる補間フィルタを応用して参照サンプルを補間する。具体的に、参照ピクチャの解像度が現在ピクチャの解像度以下である場合、デフォルトの8タップ及び4タップ補間フィルタを使用してそれぞれ輝度サンプル及び彩度サンプルのインター予測サンプルを生成する。しかし、デフォルトの動き補間フィルタは強いローパス特性を呈しない。参照ピクチャの解像度が現在ピクチャの解像度よりも高い場合、デフォルトの動き補間フィルタを使用すると無視できないエイリアシングを引き起こしてしまい、これはダウンサンプリング比率が増加する場合によりひどくなってしまう。従って、RPRのインター予測効率を向上させるために、参照ピクチャが現在ピクチャよりも高い解像度を有する場合、2つの異なるダウンサンプリングフィルタのセットを応用する。詳しくは、ダウンサンプリング比率が1.5:1以上である場合、以下の表5及び表6に示される8タップ及び4タップのLanczosフィルタを使用する。
Figure 2022552436000008
Figure 2022552436000009
ダウンサンプリング比率が2:1以上である場合、余弦窓関数を12タップSHMダウンサンプリングフィルタに応用することにより得られる以下の8タップ及び4タップのダウンサンプリングフィルタ(表7及び表8に示される)を使用する。
Figure 2022552436000010
Figure 2022552436000011
最後に、以上のダウンサンプリングフィルタは非アフィンインターブロックの輝度予測サンプル及び彩度予測サンプルを生成することだけに応用される。アフィンモードの場合、依然としてデフォルトの8タップ及び4タップの動き補間フィルタをダウンサンプリングに応用する。
既存のRPR設計における問題
本開示の目標はRPRを応用する際のアフィンモードの符号化効率を向上させることである。具体的に、VVCにおける既存のRPR設計の下記問題が識別される。
まず、以前に検討されるように、参照ピクチャの解像度が現在ピクチャの解像度よりも高い場合、追加のダウンサンプリングフィルタが非アフィンモードの動き補償のみに応用される。アフィンモードの場合、6タップ及び4タップの動き補間フィルタが応用される。それらのフィルタがデフォルトの動き補間フィルタから得られると仮定すれば、それらは強いローパス特性を示さない。従って、非アフィンモードに比べて、有名なNyquist-Shannonサンプリング定理に起因して、アフィンモードの予測サンプルはよりひどいエイリアシングアーティファクトを呈する。このように、より優れた符号化性能を実現するために、ダウンサンプリングする必要がある場合に適切なローパスフィルタもアフィンモードの動き補償に応用するように望まれている。
第2としては、既存のRPR設計に基づいて、現在サンプルの位置、MV及び参照ピクチャと現在ピクチャとの間の解像度の拡大縮小比率に基づいて参照サンプルの分数の画素位置を決定する。従って、参照ブロックのダウンサンプリングを応用する場合、より高いメモリ帯域幅消費及び計算複雑度で現在ブロックの参照サンプルを補間してしまう。現在ブロックの寸法がM(幅)×N(高さ)であると仮定する。参照ピクチャの寸法が現在ピクチャの寸方と同じである場合、参照ピクチャにおいて寸法が(M+7)×(N+7)である整数サンプルにアクセスする必要があり、且つ現在ブロックの動き補償のために8×(M×(N+7))+8×M×N回の乗算が必要である。ダウンサンプリング拡大縮小比率がsであれば、対応のメモリ帯域幅及び乗算は(s×M+7)×(s×N+7)及び8×(M×(s×N+7))+8×M×Nまで増加される。表9及び表10では、RPRダウンサンプリング拡大縮小比率がそれぞれ1.5X及び2Xである場合にいろいろなブロック寸法の動き補償に用いられる整数サンプル数及びサンプル毎の乗算回数が比較される。表9及び表10では、名称「RPR 1X」の列は参照ピクチャ及び現在ピクチャの解像度が同じであり、即ちRPRが応用されない場合の状況に対応する。列「RPR 1Xとの比率」はRPRダウンサンプリング比率が1よりも大きい場合のメモリ帯域幅/乗算と、RPRがない場合の通常のインターモードにおける対応の最悪な状況における数(即ち、16×4双方向予測)との対応比率を描いている。見えるように、通常のインター予測の最悪な状況における複雑度に比べて、参照ピクチャが現在ピクチャよりも高い解像度を有する場合、メモリ帯域幅及び計算複雑度は著しく増加する。ピーク値の増加は16×4双方向予測によるものであり、メモリ帯域幅及び乗算回数は最悪な状況における双方向予測のメモリ帯域幅及び乗算回数の231%及び127%である。
Figure 2022552436000012
Figure 2022552436000013
第3としては、既存のRPR設計において、VVCは1つの同じビットストリーム内のピクチャの解像度の適応切替のみをサポートするが、映像シーケンスを符号化するためのビット深度が同じであるように維持する。しかし、VVC標準のCfPを発表するための「将来の映像符号化標準の要求」には、「本標準は、同じ内容の複数の表示(各表示が異なる属性(例えば、空間解像度又はサンプルビット深度)を有する)を提供する適応ストリーミングサービスの場合の迅速な表示切替をサポートすべきである」ということが明確に説明される。実際の映像アプリケーションにおいて、シングルインストラクション・マルチプルデータ(SIMD)操作に起因して、符号化された映像シーケンス内の符号化ビット深度を変化させることを許容するのは、映像エンコーダ/デコーダ特にソフトウェアこーデック実現に対してよりフレキシブルな性能/複雑度の折衷を提供できる。
RPR符号化への改善
本開示では、VVCにおけるRPR符号化の効率を向上させ、そしてそのメモリ帯域幅及び計算複雑度を低減する解決案が提案された。より具体的に、本開示に提案された技術は以下のようにまとめられることができる。
まず、アフィンモードのRPR符号化効率を向上させるために、新たなローパス補間フィルタは、現在ピクチャに比べて参照ピクチャがより高い解像度を有する場合即ちダウンサンプリングする必要がある場合にアフィンのための既存の8タップ輝度補間フィルタ及び4タップ彩度補間フィルタを代替するために提案される。
第2としては、RPRを簡素化するために、RPRを応用しない通常のインターモードに比べてメモリ帯域幅及び計算複雑度の顕著な増加をもたらしてしまうあるCU寸法に対してRPRに基づくインター予測を使用禁止することが提案される。
第3としては、1つの映像シーケンスを符号化するための内部ビット深度の動的な変化を許容する方法が提案される。
アフィンモードのためのダウンサンプリングフィルタ
以上に言及したように、現在ピクチャ及びその参照ピクチャの解像度が同じであるか否かにかかわらず、デフォルトの6タップの動き補間フィルタ及び4タップの動き補間フィルタが常にアフィンモードに応用される。HEVCに使用される補間フィルタと同様に、VVCにおけるデフォルトの動き補間フィルタは強いローパス特性を呈しない。空間拡大縮小比率が1に近い場合、デフォルトの動き補間フィルタは予測サンプルの受け入れられる品質を提供できる。しかし、参照ピクチャから現在ピクチャまでの解像度のダウンサンプリング比率がより大きくなる場合、Nyquist-Shannonサンプリング定理に基づいて、同じデフォルトの動き補間フィルタを使用すればエイリアシングアーティファクトがひどくなる。特に、応用されるMVが整数サンプル位置での参照サンプルを指す場合、デフォルトの動き補間は完全にフィルタリング操作を応用しない。これでアフィンブロックにとって予測サンプルの品質の顕著な低下をもたらしてしまう恐れがある。
ダウンサンプリングによるエイリアシングアーティファクトを軽減するために、本開示に従って、アフィンモードの動き補償に対してより強いローパス特性を有する異なる補間フィルタを利用して既存のデフォルトの6タップ/4タップ補間フィルタを代替することが提案される。また、メモリ帯域幅及び計算複雑度が通常の動き補償処理と同じであるように維持するために、提案されたダウンサンプリングフィルタはアフィンモードのための既存の補間フィルタとは同じ長さであり、即ち6タップは輝度成分に用いられ、4タップは彩度成分に用いられる。
図7は映像信号をデコードするための方法を示す。該方法は例えばデコーダに応用されてもよい。
ステップ710において、デコーダは映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得できる。
ステップ712において、デコーダは参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得できる。iとjが例えば映像ブロック内の1つのサンプルの座標を表現してもよい。
ステップ714において、映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、デコーダは、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得できる。
ステップ716において、映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、デコーダは、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するために第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得できる。
ステップ718において、デコーダは第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることに基づいて映像ブロックのインター予測サンプルを取得できる。
アフィン輝度ダウンサンプリングフィルタ
アフィンモードのための輝度ダウンサンプリングフィルタを得る方式が複数ある。
方法1
本開示の1つ又は複数の実施例では、通常のインターモード(即ち、非アフィンモード)の既存の輝度ダウンサンプリングフィルタからアフィンモードの輝度ダウンサンプリングフィルタを直接に得ることが提案される。具体的に、当該方法によって、8タップフィルタの2つの最左側/最右側のフィルタ係数をそれぞれ加算して6タップフィルタのための1つの単一のフィルタ係数となるようにすることで、表5(拡大縮小比率1.5Xの場合に使用される)及び表7(拡大縮小比率2Xの場合に使用される)における8タップの輝度ダウンサンプリングフィルタから新たな6タップの輝度ダウンサンプリングフィルタを得る。表11及び表12はそれぞれ空間拡大縮小比率が1.5:1及び2:1である場合に提案された6タップの輝度ダウンサンプリングフィルタについて説明した。
Figure 2022552436000014
Figure 2022552436000015
方法2
本開示の1つ又は複数の実施例では、余弦窓掛けsinc関数に基づいて得られるSHMフィルタから6タップのアフィンダウンサンプリングフィルタを直接に得ることが提案される。具体的に、該方法において、以下の式に基づいてアフィンダウンサンプリングフィルタを得る。
Figure 2022552436000016
ここで、Lがフィルタ長さであり、h(n)が理想的なローパス周波数応答であり、その計算は、以下の式(4)の通りである。
Figure 2022552436000017
がカットオフ周波数であり、sが拡大縮小比率である。w(n)が余弦窓関数であり、その定義は、以下の式(5)の通りである。
Figure 2022552436000018
一例では、fが0.9であり、L=6であると仮定し、表13及び表14は空間拡大縮小比率が1.5X(即ち、s=1.5)及び2X(即ち、s=2)である場合に得られた6タップの輝度ダウンサンプリングについて説明した。
Figure 2022552436000019
Figure 2022552436000020
指摘すべきことは、表13及び表14において、フィルタ係数が7ビットサイン変数の精度で得られ、該精度がRPR設計に使用されるダウンサンプリングフィルタと同じであるように維持される。
図8は映像信号をデコードするための方法を示す。該方法は例えばデコーダに応用されてもよい。
ステップ810において、デコーダはカットオフ周波数及び拡大縮小比率に基づいて理想的なローパスフィルタの周波数応答を取得できる。
ステップ812において、デコーダはフィルタ長さに基づいて余弦窓関数を取得できる。
ステップ814において、デコーダは周波数応答及び余弦窓関数に基づいて第3ダウンサンプリングフィルタを取得できる。
アフィン彩度ダウンサンプリングフィルタ
以下に、参照ピクチャの解像度が現在ピクチャの解像度よりも高い場合に彩度参照ブロックをダウンサンプリングする方法が3つ提案される。
方法1
第1方法において、RPRにおいて非アフィンモードに用いるように設計される既存の1.5X(表6)及び2X(表8)の4タップ彩度ダウンサンプリングフィルタを改めてアフィンモードの参照サンプルのダウンサンプリングに用いることが提案される。
方法2
第2方法において、デフォルトの4タップ彩度補間フィルタ(表3)を、改めてアフィンモードの参照サンプルをダウンサンプリングするのに用いることが提案される。
方法3
第3方法において、(3)~(5)に描かれる余弦窓掛けsinc関数に基づいて彩度ダウンサンプリングフィルタを得ることが提案される。表15及び表16は余弦窓sinc関数のカットオフ周波数が0.9であると仮定する場合にそれぞれ1.5X及び2Xの拡大縮小比率について得られた4タップ彩度ダウンサンプリングフィルタを描いている。
Figure 2022552436000021
Figure 2022552436000022
RPRモードのための制約のブロック寸法
「問題声明」の節に分析したように、ダウンサンプリングが発生する場合、既存のRPRは複雑度の顕著な増加(例えば、動き補償に対してアクセスされる整数サンプルの数及び必要な乗算回数)をもたらしてしまう。具体的に、参照ブロックをダウンサンプリングする必要がある場合のメモリ帯域幅及び乗算回数は最悪な状況の双方向予測の231%及び127%である。
1つ又は複数の実施例では、参照ピクチャの解像度が現在ピクチャの解像度よりも高い場合、あるブロック形状(例えば4×N、N×4及び/又は8×8)のためのインター予測期間に双方向予測を使用禁止する(しかしながら、依然として単方向予測を許容する)ことが提案される。表17及び表18はRPRを利用してインター予測を行う期間に4×N、N×4及び8×8ブロック寸法に対して双方向予測を使用禁止する場合の対応のサンプル毎のメモリ帯域幅及び乗算回数を示す。見えるように、提案された制約を利用して、メモリ帯域幅及び乗算回数が1.5Xダウンサンプリングの最悪な状況の双方向予測の130%及び107%並びに2Xダウンサンプリングの最悪な状況の双方向予測の116%及び113%まで低減される。
Figure 2022552436000023
Figure 2022552436000024
以上の例では、4×N、N×4及び8×8ブロック寸法のみに対してRPRモードの双方向予測を使用禁止するが、最も先進的な現代映像技術を把握している技術者にとって、提案された制約は依然として他のブロック寸法及びインター符号化モード(例えば、単方向/双方向予測、マージ/非マージモード等)に適用される。
適応ビット深度切替
既存のRPR設計において、VVCは1つの同じビットストリーム内のピクチャ解像度の適応切替のみをサポートするが、映像シーケンスを符号化するためのビット深度が同じであるように維持される。しかし、以前に分析したように、1つの同じビットストリーム内の符号化ビット深度の切替を許容するのは、実際のエンコーダ/デコーダデバイスに対してより高いフレキシビリティを提供し且つ符号化性能と計算複雑度との間で異なる折衷を提供することができる。
本節において、即時デコードリフレッシュ(IDR)ピクチャ等の1つのIRAPピクチャを導入する要求がないで内部符号化ビット深度を変化させることを許容するために適応ビット深度切替(ABS)方法が提案される。
図6には1つの仮定例が描かれ、当該仮定例では現在ピクチャ620並びにその参照ピクチャ610及び630が異なる内部ビット深度で符号化される。図6は、8ビット符号化を利用する参照ピクチャ610 Ref0、10ビット符号化を利用する現在ピクチャ620、及び12ビット符号化を利用する参照ピクチャ630 Ref1を示す。具体的に、以下に、提案されたABS能力をサポートするために、現在VVCフレームワークに対して動き補償処理への上級シンタックスシグナリング及び修正が提案される。
上級ABSシグナリング
提案されたABSシグナリングについては、SPSにおいて、SPSを参照する符号化ピクチャのための最大内部符号化ビット深度を指定する既存のビット深度シンタックス要素bit_depth_minus8を代替するために、1つの新たなシンタックス要素sps_max_bit_depth_minus8が提案される。次に、符号化ビット深度を変化させる場合、PPSを参照するピクチャの異なる符号化ビット深度を指定するために1つの新たなPPSシンタックスpps_bit_depth_minus8が送信される。
ビットストリーム適合性が存在し、即ちpps_bit_depth_minus8の値はsps_max_bit_depth_minus8の値を超えるべきではない。表19はSPS及びPPSにおける提案されたABSシグナリングについて説明した。
Figure 2022552436000025
予測サンプルビット深度の調節
1つの符号化された映像シーケンス内に1つの符号化ビット深度が変化する場合、1つの現在ピクチャは他の参照ピクチャから予測されることができ、該他の参照ピクチャの再構築サンプルは異なるビット深度精度で表現される。このような状況が発生する場合、参照ピクチャの動き補償から生成された予測サンプルは現在ピクチャの符号化ビット深度に調節されるべきである。
他の符号化ツールとの相互作用
ABSが参照ピクチャに応用され且つ現在ピクチャが異なる精度で表現され得ると仮定すれば、VVCにおける、参照サンプルを利用してある符号化パラメータを得るいくつかの既存の符号化ツールは正常に動作できない恐れがある。例えば、現在のVVCにおいて、双方向オプティカルフロー(BDOF)及びデコーダ側動きベクトル改良(DMVR)は時間予測サンプルを使用してインター符号化効率を向上させる2種類のデコーダ側技術である。具体的に、BDOFツールは、予測サンプル品質を向上させるためにL0及びL1予測サンプルを利用してサンプルずつ改良を計算するが、DMVRはL0及びL1予測サンプルに依存してサブブロックレベルで動きベクトル精度を改良する。以上の考慮に基づいて、2つの予測信号のうちの任一の信号が現在ピクチャのビット深度と異なるビット深度で符号化される場合に常に1つのインターブロックに対してBDOF及びDMVR処理を避けることが提案される。
図9はユーザーインターフェース960に結合される計算環境910を示す。計算環境910はデータ処理サーバの部分であってもよい。計算環境910はプロセッサ920、メモリ940及びI/Oインターフェース950を備える。
プロセッサ920は計算環境910の全体操作、例えば表示、データ収集、データ通信及び画像処理に関連付けられる操作を典型的に制御する。プロセッサ920は、命令を実行して上記方法における全て又はいくつかのステップを行うための1つ又は複数のプロセッサを備えてもよい。更に、プロセッサ920はプロセッサ920と他の構成要素との間の相互作用を促進する1つ又は複数のモジュールを備えてもよい。該プロセッサは中央処理ユニット(CPU)、マイクロプロセッサ、単一チップマシン、GPU等であってもよい。
メモリ940は、様々なタイプのデータを記憶して計算環境910の操作をサポートするように配置される。メモリ940は予定のソフトウェア942を備えてもよい。このようなデータの例は、計算環境910において実行されるいかなるアプリケーション又は方法のための命令、映像データセット、画像データ等を含む。メモリ940はいかなるタイプの揮発性又は不揮発性メモリデバイス又はそれらの組合せを使用することにより実現されてもよく、前記メモリデバイスは例えばスタティックランダムアクセスメモリ(SRAM)、電気的に消去可能プログラム可能読み出し専用メモリ(EEPROM)、消去可能プログラム可能読み出し専用メモリ(EPROM)、プログラム可能読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクである。
I/Oインターフェース950はプロセッサ920と、キーボード、クリックホイール、ボタン等の周辺インターフェースモジュールとの間のインターフェースを提供する。ボタンはホームボタン、走査開始ボタン及び走査終了ボタンを含んでもよいが、それらに限らない。I/Oインターフェース950はエンコーダ及びデコーダに結合されてもよい。
実施例では、複数のプログラムを含む非一時的なコンピュータ可読記憶媒体も提供され、当該複数のプログラムは例えばメモリ940に含まれ、上記方法を行うために計算環境910におけるプロセッサ920により実行され得る。例えば、該非一時的なコンピュータ可読記憶媒体はROM、RAM、CD-ROM、磁気テープ、フロッピーディスク(登録商標)、光学データ記憶デバイス等であってもよい。
該非一時的なコンピュータ可読記憶媒体には1つ又は複数のプロセッサを有する計算デバイスが実行するための複数のプログラムが記憶され、前記複数のプログラムが前記1つ又は複数のプロセッサにより実行されるとき、前記計算デバイスに動き予測のための上記方法を行わせる。
実施例では、計算環境910は上記方法を行うための1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィックス処理ユニット(GPU)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の電子構成要素を利用して実現されてもよい。
例示のために本開示の説明を提供したが、本開示が尽きるようにすることまたは本開示に限定されることが期待されていない。多くの修正、変形及び代替の実現方式は上記説明及び関連図面において与えられる指導から利益を受ける当業者にとって明らかである。
本開示の原理を解釈するために例が選択及び説明され、且つ当業者は様々な異なる実現方式によって本開示を理解し、且つ潜在的な原理及び仮定に適合する特定用途の異なる修正を有する異なる実現方式を最適に利用することができるようにする。従って、理解されるように、本開示の範囲は開示される実現方式の具体例に限定されるべきではなく、且つ修正及び他の実現方式は本開示の範囲内に含まれるように期待されている。
100…エンコーダ、110…映像入力、112…動き補償、114…動き推定、116…イントラ/インターモード決定、118…イントラ予測、120…ピクチャバッファ、122…ループ内フィルタ、124…メモリ、126…加算器、128…加算器、130…変換、132…量子化、134…逆量子化、136…逆変換、138…エントロピー符号化ユニット、140…ブロック予測器、142…予測関連情報、144…ビットストリーム、200…デコーダ、210…ビットストリーム、212…エントロピーデコーディング、214…逆量子化、216…逆変換、218…加算器、220…イントラ/インターモード選択器、222…イントラ予測、224…動き補償、226…ピクチャバッファ、228…ループ内フィルタ、230…メモリ、232…映像出力、234予測関連情報、910…計算環境、920…プロセッサ、940…メモリ、950I/Oインターフェース

Claims (36)

  1. 映像信号をデコードするための方法であって、
    デコーダにおいて、映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得することと、
    デコーダにおいて、参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得し、ここで、iとjが映像ブロック内の1つのサンプルの座標を表現することと、
    デコーダにおいて、映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得することと、
    デコーダにおいて、映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得することと、
    デコーダにおいて、第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることにより映像ブロックのインター予測サンプルを取得することと、を含む前記映像信号をデコードするための方法。
  2. デコーダにおいて第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得することは、
    デコーダにおいて、第3ダウンサンプリングフィルタを得ることが第1ダウンサンプリングフィルタから得られるのであり、第3ダウンサンプリングフィルタがアフィンモードの輝度インター予測サンプルを生成するためのものであり、且つ第1ダウンサンプリングフィルタが非アフィンインターモードの輝度インター予測サンプルを生成するためのものであることを含む請求項1に記載の方法。
  3. デコーダにおいて第3ダウンサンプリングフィルタを得ることは、
    デコーダにおいて、第1及び第2ダウンサンプリングフィルタの最前の2つのフィルタ係数及び最後の2つのフィルタ係数を2つの単一のフィルタ係数にマージすることにより、第3及び第4ダウンサンプリングフィルタの1番目及び最後のフィルタ係数を取得することを含む請求項2に記載の方法。
  4. デコーダにおいて第3ダウンサンプリングフィルタを取得することは、
    デコーダにおいて、スケーラブルHEVCテストモデル(SHM)フィルタに余弦窓掛けsinc関数を応用することにより第3ダウンサンプリングフィルタを取得することを含む請求項1に記載の方法。
  5. デコーダにおいて第3ダウンサンプリングフィルタを取得することは、
    デコーダにおいて、カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得することと、
    デコーダにおいて、フィルタ長さに基づいて余弦窓関数を取得することと、
    デコーダにおいて、周波数応答及び余弦窓関数に基づいて第3ダウンサンプリングフィルタを取得することと、を含む請求項4に記載の方法。
  6. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が1.5に等しい請求項5に記載の方法。
  7. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が2に等しい請求項5に記載の方法。
  8. 第4ダウンサンプリングフィルタは第2ダウンサンプリングフィルタに相当し、第4ダウンサンプリングフィルタがアフィンモードの彩度インター予測サンプルを生成するためのものであり、且つ第2ダウンサンプリングフィルタが非アフィンモードの彩度インター予測サンプルを生成するためのものである請求項1に記載の方法。
  9. 参照ピクチャIの解像度が現在ピクチャの解像度に等しい場合、第4ダウンサンプリングフィルタは通常のインターブロックの彩度インター予測サンプルを生成するための補間フィルタに相当する請求項8に記載の方法。
  10. デコーダにおいて第4ダウンサンプリングフィルタを取得することは、
    デコーダにおいて、カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得することと、
    デコーダにおいて、フィルタ長さに基づいて余弦窓関数を取得することと、
    デコーダにおいて、周波数応答及び余弦窓関数に基づいて第4ダウンサンプリングフィルタを取得することと、を含む請求項8に記載の方法。
  11. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が1.5に等しい請求項10に記載の方法。
  12. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が2に等しい請求項10に記載の方法。
  13. 計算デバイスであって、
    1つ又は複数のプロセッサと、
    前記1つ又は複数のプロセッサにより実行され得る命令が記憶される非一時的なコンピュータ可読記憶媒体と、を備え、前記1つ又は複数のプロセッサは、
    映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得し、
    参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得し、ここで、iとjが映像ブロック内の1つのサンプルの座標を表現し、
    映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得し、
    映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得し、
    第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることにより映像ブロックのインター予測サンプルを取得するように配置される、
    前記計算デバイス。
  14. 第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得するように配置される前記1つ又は複数のプロセッサは更に、
    第3ダウンサンプリングフィルタを得ることが第1ダウンサンプリングフィルタから得られるのであり、第3ダウンサンプリングフィルタがアフィンモードの輝度インター予測サンプルを生成するためのものであり、且つ第1ダウンサンプリングフィルタが非アフィンインターモードの輝度インター予測サンプルを生成するためのものであるように配置される、
    請求項13に記載の計算デバイス。
  15. 第3ダウンサンプリングフィルタを得るように配置される前記1つ又は複数のプロセッサは更に、
    第1及び第2ダウンサンプリングフィルタの最前の2つのフィルタ係数及び最後の2つのフィルタ係数を2つの単一のフィルタ係数にマージすることにより、第3及び第4ダウンサンプリングフィルタの1番目及び最後のフィルタ係数を取得するように配置される、
    請求項14に記載の計算デバイス。
  16. 第3ダウンサンプリングフィルタを取得するように配置される前記1つ又は複数のプロセッサは更に、
    スケーラブルHEVCテストモデル(SHM)フィルタに余弦窓掛けsinc関数を応用することにより第3ダウンサンプリングフィルタを取得するように配置される、
    請求項13に記載の計算デバイス。
  17. 第3ダウンサンプリングフィルタを取得するように配置される前記1つ又は複数のプロセッサは更に、
    カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得し、
    フィルタ長さに基づいて余弦窓関数を取得し、
    周波数応答及び余弦窓関数に基づいて第3ダウンサンプリングフィルタを取得するように配置される、
    請求項16に記載の計算デバイス。
  18. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が1.5に等しい請求項17に記載の計算デバイス。
  19. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が2に等しい請求項17に記載の計算デバイス。
  20. 第4ダウンサンプリングフィルタは第2ダウンサンプリングフィルタに相当し、第4ダウンサンプリングフィルタがアフィンモードの彩度インター予測サンプルを生成するためのものであり、且つ第2ダウンサンプリングフィルタが非アフィンモードの彩度インター予測サンプルを生成するためのものである請求項13に記載の計算デバイス。
  21. 参照ピクチャIの解像度が現在ピクチャの解像度に等しい場合、第4ダウンサンプリングフィルタは通常のインターブロックの彩度インター予測サンプルを生成するための補間フィルタに相当する請求項20に記載の計算デバイス。
  22. 第4ダウンサンプリングフィルタを取得するように配置される前記1つ又は複数のプロセッサは更に、
    カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得し、
    フィルタ長さに基づいて余弦窓関数を取得し、
    周波数応答及び余弦窓関数に基づいて第4ダウンサンプリングフィルタを取得するように配置される、
    請求項20に記載の計算デバイス。
  23. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が1.5に等しい請求項22に記載の計算デバイス。
  24. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が2に等しい請求項22に記載の計算デバイス。
  25. 1つ又は複数のプロセッサを有する計算デバイスが実行するための複数のプログラムが記憶される非一時的なコンピュータ可読記憶媒体であって、
    前記複数のプログラムが前記1つ又は複数のプロセッサにより実行される際に該計算デバイスに動作を実行させ、当該動作は、
    デコーダにおいて、映像信号内の映像ブロックに関連付けられる参照ピクチャIを取得することと、
    デコーダにおいて、参照ピクチャIにおける参照ブロックから映像ブロックの参照サンプルI(i,j)を取得し、ここで、iとjが映像ブロック内の1つのサンプルの座標を表現することと、
    デコーダにおいて、映像ブロックが非アフィンインターモードで符号化され且つ参照ピクチャIの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第1ダウンサンプリングフィルタ及び第2ダウンサンプリングフィルタを取得することと、
    デコーダにおいて、映像ブロックがアフィンモードで符号化され且つ参照ピクチャの解像度が現在ピクチャの解像度よりも大きい場合、それぞれ映像ブロックの輝度インター予測サンプル及び彩度インター予測サンプルを生成するように第3ダウンサンプリングフィルタ及び第4ダウンサンプリングフィルタを取得することと、
    デコーダにおいて、第3及び第4ダウンサンプリングフィルタが参照サンプルI(i,j)に応用されることにより映像ブロックのインター予測サンプルを取得することと、を含む前記非一時的なコンピュータ可読記憶媒体。
  26. 前記複数のプログラムは、更に計算デバイスに、
    デコーダにおいて、第3ダウンサンプリングフィルタを得ることが第1ダウンサンプリングフィルタから得られるのであり、第3ダウンサンプリングフィルタがアフィンモードの輝度インター予測サンプルを生成するためのものであり、且つ第1ダウンサンプリングフィルタが非アフィンインターモードの輝度インター予測サンプルを生成するためのものであることを実行させる、
    請求項25に記載の非一時的なコンピュータ可読記憶媒体。
  27. 前記複数のプログラムは、更に計算デバイスに、
    デコーダにおいて、第1及び第2ダウンサンプリングフィルタの最前の2つのフィルタ係数及び最後の2つのフィルタ係数を2つの単一のフィルタ係数にマージすることにより、第3及び第4ダウンサンプリングフィルタの1番目及び最後のフィルタ係数を取得することを実行させる、
    請求項26に記載の非一時的なコンピュータ可読記憶媒体。
  28. 前記複数のプログラムは、更に計算デバイスに、
    デコーダにおいて、スケーラブルHEVCテストモデル(SHM)フィルタに余弦窓掛けsinc関数を応用することにより第3ダウンサンプリングフィルタを取得することを実行させる、
    請求項25に記載の非一時的なコンピュータ可読記憶媒体。
  29. 前記複数のプログラムは、更に計算デバイスに、
    デコーダにおいて、カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得することと、
    デコーダにおいて、フィルタ長さに基づいて余弦窓関数を取得することと、
    デコーダにおいて、周波数応答及び余弦窓関数に基づいて第3ダウンサンプリングフィルタを取得することと、を実行させる、
    請求項28に記載の非一時的なコンピュータ可読記憶媒体。
  30. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が1.5に等しい請求項29に記載の非一時的なコンピュータ可読記憶媒体。
  31. カットオフ周波数が0.9に等しく、フィルタ長さが6に等しく、且つ拡大縮小比率が2に等しい請求項29に記載の非一時的なコンピュータ可読記憶媒体。
  32. 第4ダウンサンプリングフィルタは第2ダウンサンプリングフィルタに相当し、第4ダウンサンプリングフィルタがアフィンモードの彩度インター予測サンプルを生成するためのものであり、且つ第2ダウンサンプリングフィルタが非アフィンモードの彩度インター予測サンプルを生成するためのものである請求項25に記載の非一時的なコンピュータ可読記憶媒体。
  33. 参照ピクチャIの解像度が現在ピクチャの解像度に等しい場合、第4ダウンサンプリングフィルタは通常のインターブロックの彩度インター予測サンプルを生成するための補間フィルタに相当する請求項32に記載の非一時的なコンピュータ可読記憶媒体。
  34. 前記複数のプログラムは、更に計算デバイスに、
    デコーダにおいて、カットオフ周波数及び拡大縮小比率に基づいて理想ローパスフィルタの周波数応答を取得することと、
    デコーダにおいて、フィルタ長さに基づいて余弦窓関数を取得することと、
    デコーダにおいて、周波数応答及び余弦窓関数に基づいて第4ダウンサンプリングフィルタを取得することと、を実行させる、
    請求項32に記載の非一時的なコンピュータ可読記憶媒体。
  35. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が1.5に等しい請求項34に記載の非一時的なコンピュータ可読記憶媒体。
  36. カットオフ周波数が0.9に等しく、且つ拡大縮小比率が2に等しい請求項34に記載の非一時的なコンピュータ可読記憶媒体。
JP2022539074A 2019-12-24 2020-12-24 参照ピクチャを再サンプリングするための方法、計算デバイス、コンピュータ可読記憶媒体、コンピュータプログラム Active JP7239786B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023032279A JP2023065601A (ja) 2019-12-24 2023-03-02 映像信号をエンコーディングするための方法、計算デバイス、非一時的なコンピュータ可読記憶媒体、及びコンピュータプログラム。

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962953471P 2019-12-24 2019-12-24
US62/953,471 2019-12-24
PCT/US2020/067017 WO2021134017A1 (en) 2019-12-24 2020-12-24 Methods and apparatuses for reference picture resampling

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023032279A Division JP2023065601A (ja) 2019-12-24 2023-03-02 映像信号をエンコーディングするための方法、計算デバイス、非一時的なコンピュータ可読記憶媒体、及びコンピュータプログラム。

Publications (2)

Publication Number Publication Date
JP2022552436A true JP2022552436A (ja) 2022-12-15
JP7239786B2 JP7239786B2 (ja) 2023-03-14

Family

ID=76575160

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022539074A Active JP7239786B2 (ja) 2019-12-24 2020-12-24 参照ピクチャを再サンプリングするための方法、計算デバイス、コンピュータ可読記憶媒体、コンピュータプログラム
JP2023032279A Pending JP2023065601A (ja) 2019-12-24 2023-03-02 映像信号をエンコーディングするための方法、計算デバイス、非一時的なコンピュータ可読記憶媒体、及びコンピュータプログラム。

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023032279A Pending JP2023065601A (ja) 2019-12-24 2023-03-02 映像信号をエンコーディングするための方法、計算デバイス、非一時的なコンピュータ可読記憶媒体、及びコンピュータプログラム。

Country Status (7)

Country Link
US (1) US20230025503A1 (ja)
EP (1) EP4082195A4 (ja)
JP (2) JP7239786B2 (ja)
KR (3) KR20230175350A (ja)
CN (2) CN115176464A (ja)
MX (1) MX2022008006A (ja)
WO (1) WO2021134017A1 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102438135B (zh) * 2011-01-14 2013-12-04 展讯通信(上海)有限公司 高分辨率视频在小尺寸显示设备上的降采样解码方法及装置
PL3448025T3 (pl) 2011-06-28 2020-04-30 Samsung Electronics Co., Ltd. Interpolacja obrazu z wykorzystaniem asymetrycznego filtru interpolacyjnego
GB2512829B (en) * 2013-04-05 2015-05-27 Canon Kk Method and apparatus for encoding or decoding an image with inter layer motion information prediction according to motion information compression scheme
EP3149943B1 (en) * 2014-05-28 2022-08-31 ARRIS Enterprises LLC Content aware scheduling in a hevc decoder operating on a multi-core processor platform
MX2018003768A (es) * 2015-09-25 2018-09-12 Huawei Tech Co Ltd Aparato y metodo para compensacion de movimiento de video con filtro de interpolacion seleccionable.
CN108781291B (zh) * 2016-01-25 2022-03-22 皇家Kpn公司 空间可缩放视频编码
US11025903B2 (en) * 2017-01-13 2021-06-01 Qualcomm Incorporated Coding video data using derived chroma mode
WO2019194647A1 (ko) * 2018-04-06 2019-10-10 가온미디어 주식회사 필터 정보 기반의 적응적 루프 필터링 방법, 그를 이용한 영상 부호화 및 복호화 방법
CN114097222A (zh) * 2019-06-23 2022-02-25 夏普株式会社 用于在视频编码中执行自适应分辨率变化的系统和方法
CN114667734A (zh) * 2019-09-23 2022-06-24 阿里巴巴集团控股有限公司 通过重采样执行运动补偿插值的滤波器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
J. SAMUELSSON, S. DESHPANDE, AND A. SEGALL: "AHG 8: Adaptive Resolution Change (ARC) with downsampling", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-O0240-v1, JPN6022048955, July 2019 (2019-07-01), pages 1 - 10, ISSN: 0004926892 *
JIANCONG LUO, YAN YE, AND MOHAMMED GOLAM SARWER: "CE1-related: Reference picture resampling filters", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-P0353-v5, JPN6022048954, October 2019 (2019-10-01), pages 1 - 8, ISSN: 0004926894 *
JONATAN SAMUELSSON, SACHIN DESHPANDE, AND ANDREW SEGALL: "CE1-1: RPR downsampling filter", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-P0088, JPN6022048953, October 2019 (2019-10-01), pages 1 - 5, ISSN: 0004926893 *
XIAOYU XIU, ET AL.: "On RPR down-sampling filters for affine mode", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-Q0517_r1, JPN6022048956, January 2020 (2020-01-01), pages 1 - 11, ISSN: 0004926895 *

Also Published As

Publication number Publication date
KR20220110331A (ko) 2022-08-05
CN116506610B (zh) 2024-06-18
JP2023065601A (ja) 2023-05-12
KR102617470B1 (ko) 2023-12-21
JP7239786B2 (ja) 2023-03-14
CN116506610A (zh) 2023-07-28
KR20230175350A (ko) 2023-12-29
MX2022008006A (es) 2022-09-26
EP4082195A4 (en) 2023-06-28
CN115176464A (zh) 2022-10-11
KR20240005131A (ko) 2024-01-11
US20230025503A1 (en) 2023-01-26
EP4082195A1 (en) 2022-11-02
WO2021134017A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
US11632558B2 (en) Unified intra block copy and inter prediction modes
KR102627834B1 (ko) 비디오 프로세싱에서의 코딩 툴들의 선택적 사용
JP7513796B2 (ja) 参照ピクチャ再サンプリングのための信号通知
CN114556916B (zh) 视频编解码工具的高级语法
JP7391203B2 (ja) ビデオコーディングツールを洗練する使用およびシグナリング
CN113841395B (zh) 视频编解码中的自适应分辨率改变
JP7395727B2 (ja) ビデオ・データを処理する方法、装置及び記憶方法
CN114641992B (zh) 参考图片重采样的信令
JP2022549796A (ja) ビデオコーディングにおける参照サンプル位置の導出
JP7269371B2 (ja) オプティカルフローを用いる予測改善のための方法および装置
JP7239786B2 (ja) 参照ピクチャを再サンプリングするための方法、計算デバイス、コンピュータ可読記憶媒体、コンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220823

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230302

R150 Certificate of patent or registration of utility model

Ref document number: 7239786

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150