JP7697641B2 - ビデオ・コーディングのための方法及び装置 - Google Patents
ビデオ・コーディングのための方法及び装置 Download PDFInfo
- Publication number
- JP7697641B2 JP7697641B2 JP2024049106A JP2024049106A JP7697641B2 JP 7697641 B2 JP7697641 B2 JP 7697641B2 JP 2024049106 A JP2024049106 A JP 2024049106A JP 2024049106 A JP2024049106 A JP 2024049106A JP 7697641 B2 JP7697641 B2 JP 7697641B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- motion vector
- current block
- video
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/521—Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本願は、2021年9月28日付で出願された米国特許出願第17/488,027号「ビデオ・コーディングのための方法及び装置」に対する優先権を主張しており、同出願は、2021年1月14日付で出願された米国仮出願第63/137,350号「CUベースの超解像度コーディングのための混合解像度予測」に対する優先権を主張している。先の出願の開示は、それら全体で参照により本願に組み込まれる。
本開示は概してビデオ・コーディングに関連する実施形態を説明している。
[0064] 図2は、本開示の実施形態による通信システム(200)の簡略化されたブロック図を示す。通信システム(200)は、例えばネットワーク(250)を介して互いに通信することが可能な複数の端末デバイスを含む。例えば、通信システム(200)は、ネットワーク(250)を介して相互接続された第1ペアの端末デバイス(210)及び(220)を含む。図2の例では、第1ペアの端末デバイス(210)及び(220)は、データの一方向送信を行う。例えば、端末デバイス(210)は、ネットワーク(250)を介する他の端末デバイス(220)への伝送のために、ビデオ・データ(例えば、端末デバイス(210)によって捕捉されたビデオ・ピクチャのストリーム)をコーディングすることができる。符号化されたビデオ・データは、1つ以上のコーディングされたビデオ・ビットストリームの形態で送信することができる。端末デバイス(220)は、コーディングされたビデオ・データをネットワーク(250)から受信し、コーディングされたビデオ・データを復号化して、ビデオ・ピクチャを復元し、復元されたビデオ・データに従ってビデオ・ピクチャを表示することができる。一方向性データ伝送は、メディア・サービング・アプリケーション等において一般的なものであってもよい。
[0080] ループ・フィルタ・ユニット(456)の出力は、レンダリング・デバイス(412)に出力できるだけでなく、将来のインター・ピクチャ予測に使用するために参照ピクチャ・メモリ(457)に格納することも可能なサンプル・ストリームであるとすることが可能である。
[0082] ビデオ・デコーダ(410)は、ITU-T Rec.H.265のような規格における所定のビデオ圧縮技術に従って復号化動作を実行することが可能である。コーディングされたビデオ・シーケンスは、コーディングされたビデオ・シーケンスが、ビデオ圧縮技術又は規格のシンタックス、及びビデオ圧縮技術又は規格で文書化されているようなプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術又は規格によって指定されたシンタックスに準拠することが可能である。具体的には、プロファイルは、特定のツールを、そのプロファイルの下で使用できる唯一のツールとして、ビデオ圧縮技術又は規格で使用可能なすべてのツールから選択することが可能である。また、コンプライアンスのために必要なことは、コーディングされたビデオ・シーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルによって定義される範囲内に収まることである。場合によっては、そのレベルは、最大ピクチャ・サイズ、最大フレーム・レート、最大再構成サンプル・レート(例えば、毎秒当たりのメガサンプルで測定される)、最大参照ピクチャ・サイズ等を制限する。レベルによって設定される限界は、場合によっては、コーディングされたビデオ・シーケンスでシグナリングされるHRDバッファ管理のための仮想リファレンス・デコーダ(HRD)仕様及びメタデータによって更に制限される可能性がある。
[0123] ビデオ・エンコーダ(303)、(503)、及び(603)、並びにビデオ・デコーダ(310)、(410)、及び(710)は、任意の適切な技術を用いて実現することが可能であることに留意されたい。実施形態では、ビデオ・エンコーダ(303)、(503)、及び(603)、並びにビデオ・デコーダ(310)、(410)、及び(710)は、1つ以上の集積回路を使用して実現することが可能である。別の実施形態では、ビデオ・エンコーダ(303)、(503)、及び(603)、並びにビデオ・デコーダ(310)、(410)、及び(710)は、ソフトウェア命令を実行する1つ以上のプロセッサを使用して実現することが可能である。
[0125] 図8は、本開示の幾つかの実施形態による例示的なブロック・パーティションを示す。
[0137] VP9のような幾つかの関連する事例では、45度から207度までの角度に対応する8つの方向モードがサポートされている。AV1のような幾つかの関連する事例では、より多様な方向性テクスチャの空間冗長性を利用するために、方向性イントラ・モードは、より細かい粒度を有する角度セットに拡張される。オリジナルの8つの角度は、僅かに変更されて公称角度と言及され、これら8つの角度は、V_PRED, H_PRED, D45_PRED, D135_PRED, D113_PRED, D157_PRED, D203_PRED, 及びD67_PREDと命名される。
[0156] 図18は、AV1におけるフレーム・レベルの超解像度を含む全体的なループ・フィルタリング・パイプラインを示す。エンコーダ側において、ソース・フレームは、先ず、非規範的な方法(non-normative way)でダウン・スケーリングされ、より低い解像度でエンコードされることが可能である。デコーダ側では、デブロッキング・フィルタと制限付き方向強調フィルタ(constrained directional enhancement filter, CDEF)を適用して、コーディング・アーチファクトを除去する一方、エッジを低い解像度で保存することができる。次いで、線形アップ・サンプリング・フィルタを水平方向のみに沿って適用して、フル解像度の再構成を得ることができる。ダウン・サンプリング及び量子化の際に失われた高周波の詳細を回復させるために、オプションとして、ループ復元フィルタがその後にフル解像度で適用されることが可能である。
[0160] AV1のような幾つかの関連する事例では、超解像はフレーム・レベルで実行される。即ち、一定のスケーリング比を有するピクチャの全てのエリアに超解像が適用される。しかしながら、ピクチャ内の異なるエリアにおける信号の統計値は、大きく異なる可能性がある。従って、ダウン・サンプリング及び/又はアップ・サンプリングを全てのエリアに適用することは、必ずしも良いレート歪トレード・オフではない可能性がある。
[0169] 一実施形態において、ブロック・レベル・フラグは、CU、スーパーブロック、予測ブロック、変換ブロック、タイル、コーディングされたセグメント、フレーム、又はシーケンス・ベース毎に、適応的にシグナリングされたり又は推定されたりすることが可能である。
[0196]図23は、本開示の実施形態による例示的なプロセス(2300)の概要を示すフローチャートを示す。様々な実施形態では、プロセス(2300)は、端末デバイス(210),(220),(230),(240)の処理回路、ビデオ・エンコーダ(303)の機能を実行する処理回路、ビデオ・デコーダ(310)の機能を実行する処理回路、ビデオ・デコーダ(410)の機能を実行する処理回路、イントラ予測モジュール(452)の機能を実行する処理回路、ビデオ・エンコーダ(503)の機能を実行する処理回路、予測器(535)の機能を実行する処理回路、イントラ・エンコーダ(622)の機能を実行する処理回路、イントラ・デコーダ(772)の機能を実行する処理回路のような処理回路によって実行される。幾つかの実施形態では、プロセス(2300)はソフトウェア命令で実装され、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(2300)を実行する。
[0214] 上述した技術は、コンピュータ読み取り可能な命令を用いてコンピュータ・ソフトウェアとして実装することが可能であり、1つ以上のコンピュータ読み取り可能な媒体に物理的に記憶することが可能である。例えば、図24は、開示される対象事項の特定の実施形態を実現するのに適したコンピュータ・システム(2400)を示す。
(付記1)
デコーダにおけるビデオ復号化方法であって:
ビデオ・ビットストリームを復号化して、現在のブロックに対する減少解像度の残差ブロックを取得するステップ;
ブロック・レベル・フラグは事前に定義された値に設定されていると判断するステップであって、前記事前に定義された値は、前記現在のブロックが減少解像度コーディングでコーディングされていることを示す、ステップ;
前記ブロック・レベル・フラグに基づいて、前記現在のブロックのフル解像度の参照ブロックをダウン・サンプリングすることによって、前記現在のブロックに対する減少解像度の予測ブロックを生成するステップ;
前記減少解像度の予測ブロックと前記減少解像度の残差ブロックとに基づいて、前記現在のブロックに対する減少解像度の再構成ブロックを生成するステップ;及び
前記減少解像度の再構成ブロックをアップ・サンプリングすることによって、前記現在のブロックに対するフル解像度の再構成ブロックを生成するステップ;
を含む方法。
付記1に記載の方法において、前記減少解像度の予測ブロックを生成するステップは:
前記フル解像度の参照ブロックのサイズと前記現在のブロックのダウン・サンプリング率とに基づいて、前記減少解像度の予測ブロックのサイズを決定するステップ;
を含む、方法。
付記1に記載の方法において、前記判断するステップは:
前記現在のブロックに対する前記ブロック・レベル・フラグを、前記ビデオ・ビットストリームから復号化するステップを含み、前記ブロック・レベル・フラグは、前記現在のブロックが前記減少解像度コーディングでコーディングされていることを示す、方法。
付記1に記載の方法において、前記判断するステップは:
フィルタ係数又は前記フィルタ係数のインデックスのうちの1つを、前記ビデオ・ビットストリームから復号化するステップを更に含み、前記フィルタ係数は、前記減少解像度の再構成ブロックをアップ・サンプリングする際に使用される、方法。
付記1に記載の方法において:
前記現在のブロックの第1隣接ブロックの動きベクトルを、前記現在のブロックと前記第1隣接ブロックのダウン・サンプリング率の比率であるスケーリング係数に基づいてスケーリングするステップ;及び
前記現在のブロックに対する第1動きベクトル候補リストを構築するステップであって、前記第1動きベクトル候補リストは前記第1隣接ブロックのスケーリングされた動きベクトルを含む、ステップ;
を更に含む、方法。
付記5に記載の方法において、前記スケーリングするステップは:
前記スケーリング係数が2の冪乗であることに応じて、前記スケーリングされた動きベクトルを、シフト演算に基づいて決定するステップ;及び
前記スケーリング係数が2の冪乗でないことに応じて、前記スケーリングされた動きベクトルを、ルック・アップ・テーブルに基づいて決定するステップ;
を含む、方法。
付記5に記載の方法において、前記第1動きベクトル候補リスト内での前記スケーリングされた動きベクトルの優先度を、前記現在のブロックと前記第1隣接ブロックのダウン・サンプリング率に基づいて決定するステップ;
を更に含む、方法。
付記1に記載の方法において:
前記現在のブロックの1つ以上の第2隣接ブロックに基づいて、前記現在のブロックに対する第2動きベクトル候補リストを構築するステップであって、前記1つ以上の第2隣接ブロックの各々は、前記現在のブロックと同じダウン・サンプリング率を有する、ステップ;及び
前記現在のブロックの1つ以上の第3隣接ブロックに基づいて、前記現在のブロックに対する第3動きベクトル候補リストを構築するステップであって、前記1つ以上の第3隣接ブロックの各々は、前記現在のブロックとは異なるダウン・サンプリング率を有する、ステップ;
を更に含む方法。
付記8に記載の方法において:
指定された数より少ない、前記第2動きベクトル候補リスト内の動きベクトル候補の数に基づいて、前記第3動きベクトル候補リストをスキャニングするステップ;
を更に含む、方法。
付記8に記載の方法において:
前記第2動きベクトル候補リストと前記第3動きベクトル候補リストとをインターリーブ方式でマージすることによって、前記現在のブロックに対する第4動きベクトル候補リストを決定するステップ;
を更に含む、方法。
付記1に記載の方法において:
前記現在のブロックのダウン・サンプリング率に基づいて、前記現在のブロックのアフィン・パラメータを決定するステップ;
を更に含む方法。
処理回路を含む装置であって、前記処理回路は:
ビデオ・ビットストリームを復号化して、現在のブロックに対する減少解像度の残差ブロックを取得するステップ;
ブロック・レベル・フラグは事前に定義された値に設定されていると判断するステップであって、前記事前に定義された値は、前記現在のブロックが減少解像度コーディングでコーディングされていることを示す、ステップ;
前記ブロック・レベル・フラグに基づいて、前記現在のブロックのフル解像度の参照ブロックをダウン・サンプリングすることによって、前記現在のブロックに対する減少解像度の予測ブロックを生成するステップ;
前記減少解像度の予測ブロックと前記減少解像度の残差ブロックとに基づいて、前記現在のブロックに対する減少解像度の再構成ブロックを生成するステップ;及び
前記減少解像度の再構成ブロックをアップ・サンプリングすることによって、前記現在のブロックに対するフル解像度の再構成ブロックを生成するステップ;
を行うように構成されている、装置。
付記12に記載の装置において、前記処理回路は:
前記フル解像度の参照ブロックのサイズと前記現在のブロックのダウン・サンプリング率とに基づいて、前記減少解像度の予測ブロックのサイズを決定するステップ;
を行うように更に構成されている、装置。
付記12に記載の装置において、前記処理回路は:
前記現在のブロックに対する前記ブロック・レベル・フラグを、前記ビデオ・ビットストリームから復号化するように更に構成されており、前記ブロック・レベル・フラグは、前記現在のブロックが前記減少解像度コーディングでコーディングされていることを示す、装置。
付記12に記載の装置において、前記処理回路は:
フィルタ係数又は前記フィルタ係数のインデックスのうちの1つを、前記ビデオ・ビットストリームから復号化するように更に構成されており、前記フィルタ係数は、前記減少解像度の再構成ブロックをアップ・サンプリングする際に使用される、装置。
付記12に記載の装置において、前記処理回路は:
前記現在のブロックの第1隣接ブロックの動きベクトルを、前記現在のブロックと前記第1隣接ブロックのダウン・サンプリング率の比率であるスケーリング係数に基づいてスケーリングするステップ;及び
前記現在のブロックに対する第1動きベクトル候補リストを構築するステップであって、前記第1動きベクトル候補リストは前記第1隣接ブロックのスケーリングされた動きベクトルを含む、ステップ;
を行うように更に構成されている、装置。
付記16に記載の装置において、前記処理回路は:
前記スケーリング係数が2の冪乗であることに応じて、前記スケーリングされた動きベクトルを、シフト演算に基づいて決定するステップ;及び
前記スケーリング係数が2の冪乗でないことに応じて、前記スケーリングされた動きベクトルを、ルック・アップ・テーブルに基づいて決定するステップ;
を行うように更に構成されている、装置。
付記16に記載の装置において、前記処理回路は:
前記第1動きベクトル候補リスト内での前記スケーリングされた動きベクトルの優先度を、前記現在のブロックと前記第1隣接ブロックのダウン・サンプリング率に基づいて決定するように更に構成されている、装置。
付記12に記載の装置において、前記処理回路は:
前記現在のブロックの1つ以上の第2隣接ブロックに基づいて、前記現在のブロックに対する第2動きベクトル候補リストを構築するステップであって、前記1つ以上の第2隣接ブロックの各々は、前記現在のブロックと同じダウン・サンプリング率を有する、ステップ;及び
前記現在のブロックの1つ以上の第3隣接ブロックに基づいて、前記現在のブロックに対する第3動きベクトル候補リストを構築するステップであって、前記1つ以上の第3隣接ブロックの各々は、前記現在のブロックとは異なるダウン・サンプリング率を有する、ステップ;
を行うように更に構成されている、装置。
命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体であって、前記命令は少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに:
ビデオ・ビットストリームを復号化して、現在のブロックに対する減少解像度の残差ブロックを取得するステップ;
ブロック・レベル・フラグは事前に定義された値に設定されていると判断するステップであって、前記事前に定義された値は、前記現在のブロックが減少解像度コーディングでコーディングされていることを示す、ステップ;
前記ブロック・レベル・フラグに基づいて、前記現在のブロックのフル解像度の参照ブロックをダウン・サンプリングすることによって、前記現在のブロックに対する減少解像度の予測ブロックを生成するステップ;
前記減少解像度の予測ブロックと前記減少解像度の残差ブロックとに基づいて、前記現在のブロックに対する減少解像度の再構成ブロックを生成するステップ;及び
前記減少解像度の再構成ブロックをアップ・サンプリングすることによって、前記現在のブロックに対するフル解像度の再構成ブロックを生成するステップ;
を実行させる、記憶媒体。
ALF: Adaptive Loop Filter(適応複数変換)
AMVP: Advanced Motion Vector Prediction(アドバンスト動きベクトル予測)
APS: Adaptation Parameter Set(適応パラメータ・セット)
ASIC: Application-Specific Integrated Circuit(特定用途向け集積回路)
ATMVP: Alternative/Advanced Temporal Motion Vector Prediction(代替的/アドバンスト時間的動きベクトル予測)
AV1: AOMedia Video 1(AOMediaビデオ1)
AV2: AOMedia Video 2(AOMediaビデオ2)
BMS: Benchmark Set(ベンチマーク・セット)
BV:Block Vector(ブロック・ベクトル)
CANBus: Controller Area Network Bus(コントローラ・エリア・ネットワーク・バス)
CB: Coding Block(コーディング・ブロック)
CC-ALF: Cross-Component Adaptive Loop Filter(クロス・コンポーネント適応ループ・フィルタ)
CD: Compact Disc(コンパクト・ディスク)
CDEF: Constrained Directional Enhancement Filter(制限付き方向強調フィルタ)
CPR: Current Picture Referencing(カレント・ピクチャ参照)
CPU: Central Processing Unit(中央処理ユニット)
CRT: Cathode Ray Tube(陰極線管)
CTB: Coding Tree Block(コーディング・ツリー・ブロック)
CTU: Coding Tree Unit(コーディング・ツリー・ユニット)
CU:Coding Unit(コーディング・ユニット)
DPB:Decoder Picture Buffer(デコーダ・ピクチャ・バッファ)
DPCM: Differential Pulse-Code Modulation(差分パルス・コード変調)
DPS: Decoding Parameter Set(復号化パラメータ・セット)
DVD: Digital Video Disc(デジタル・ビデオ・ディスク)
FPGA: Field Programmable Gate Area(フィールド・プログラマブル・ゲート・エリア)
JCCR: Joint CbCr Residual Coding(ジョイントCbCr残差コーディング)
JVET:Joint Video Exploration Team(共同ビデオ探索チーム)
GOP: Groups of Pictures(ピクチャ・グループ)
GPU: Graphics Processing Unit(グラフィックス処理ユニット)
GSM: Global System for Mobile communications(移動通信用グローバル・システム)
HDR:High Dynamic Range(ハイ・ダイナミック・レンジ)
HEVC: High Efficiency Video Coding(高効率ビデオ・コーディング)
HRD: Hypothetical Reference Decoder(仮説参照デコーダ)
IBC: Intra Block Copy(イントラ・ブロック・コピー)
IC: Integrated Circuit(集積回路)
ISP: Intra Sub-Partitions(イントラ・サブ・パーティション)
JEM: Joint Exploration Model(共同ビデオ探索チーム)
LAN: Local Area Network(ローカル・エリア・ネットワーク)
LCD: Liquid-Crystal Display(液晶ディスプレイ)
LR: Loop Restoration Filter(ループ復元フィルタ)
LRU: Loop Restoration Unit(ループ復元ユニット)
LTE: Long-Term Evolution(ロング・ターム・エボリューション)
MPM:Most Probable Mode(最確モード)
MV:Motion Vector(動きベクトル)
OLED: Organic Light-Emitting Diode(有機発光第オード)
PBs: Prediction Blocks(予測ブロック)
PCI: Peripheral Component Interconnect(周辺コンポーネント相互接続)
PDPC: Position Dependent Prediction Combination(位置依存性予測コンビネーション)
PLD: Programmable Logic Device(プログラマブル論理デバイス)
PPS: Picture Parameter Set(ピクチャ・パラメータ・セット)
PU: Prediction Unit(予測ユニット)
RAM: Random Access Memory(ランダム・アクセス・メモリ)
ROM: Read-Only Memory(リード・オンリ・メモリ)
SAO: Sample Adaptive Offset(サンプル適応オフセット)
SCC:Screen Content Coding(スクリーン・コンテンツ・コーディング)
SDR:Standard Dynamic Range(標準ダイナミック・レンジ)
SEI: Supplementary Enhancement Information(補足エンハンスメント情報)
SNR: Signal Noise Ratio(信号雑音比)
SPS: Sequence Parameter Set(シーケンス・パラメータ・セット)
SSD: Solid-state Drive(ソリッド・ステート・ドライブ)
TU: Transform Unit(変換ユニット)
USB: Universal Serial Bus(ユニバーサル・シリアル・バス)
VPS: Video Parameter Set(ビデオ・パラメータ・セット)
VUI: Video Usability Information(ビデオ・ユーザビリティ情報)
VVC: Versatile Video Coding(汎用ビデオ・コーディング)
WAIP:Wide-Angle Intra Prediction(広角イントラ予測)
Claims (12)
- デコーダにおけるビデオ復号化方法であって:
ビデオ・ビットストリームを復号化して、現在のブロックに対する減少解像度の残差ブロックを取得するステップ;
前記現在のブロックのフル解像度の参照ブロックをダウン・サンプリングすることによって、前記現在のブロックに対する減少解像度の予測ブロックを生成するステップ;
前記減少解像度の予測ブロックと前記減少解像度の残差ブロックとに基づいて、前記現在のブロックに対する減少解像度の再構成ブロックを生成するステップ;及び
前記減少解像度の再構成ブロックをアップ・サンプリングすることによって、前記現在のブロックに対するフル解像度の再構成ブロックを生成するステップ;
を含む方法であって、前記方法は、
前記現在のブロックの周辺ブロックの動きベクトルを、前記現在のブロックと前記周辺ブロックのダウン・サンプリング率の比率であるスケーリング係数に基づいてスケーリングし、前記周辺ブロックのスケーリングされた動きベクトルを含む動きベクトル候補リストを構築するステップ;
を更に含み、前記現在のブロックの再構成のために前記動きベクトル候補リストの中から動きベクトルが選択される場合に、前記周辺ブロックからの動きベクトル候補であって前記現在のブロックと同じダウン・サンプリング率を有するものが、より高い優先度を有するように、前記動きベクトル候補リスト内での前記スケーリングされた動きベクトルの優先度が決定される、方法。 - 請求項1に記載の方法において、前記動きベクトル候補は、複数のカテゴリに分類されており、前記現在のブロックの上、左、又は右上の直近のブロックからの動きベクトル候補は、他のブロックからの動きベクトル候補より高い優先度を有する、方法。
- 請求項1に記載の方法において、前記減少解像度の予測ブロックを生成するステップは:
前記フル解像度の参照ブロックのサイズと前記現在のブロックのダウン・サンプリング率とに基づいて、前記減少解像度の予測ブロックのサイズを決定するステップ;
を含む、方法。 - 請求項1に記載の方法において、
前記現在のブロックに対するブロック・レベル・フラグを、前記ビデオ・ビットストリームから復号化するステップを含み、前記ブロック・レベル・フラグは、前記現在のブロックが前記減少解像度でコーディングされていることを示す、方法。 - 請求項1に記載の方法において、
フィルタ係数又は前記フィルタ係数のインデックスのうちの1つを、前記ビデオ・ビットストリームから復号化するステップを更に含み、前記フィルタ係数は、前記減少解像度の再構成ブロックをアップ・サンプリングする際に使用される、方法。 - 請求項1に記載の方法において、前記スケーリングするステップは:
前記スケーリング係数が2の冪乗であることに応じて、前記スケーリングされた動きベクトルを、シフト演算に基づいて決定するステップ;及び
前記スケーリング係数が2の冪乗でないことに応じて、前記スケーリングされた動きベクトルを、ルック・アップ・テーブルに基づいて決定するステップ;
を含む、方法。 - 請求項1に記載の方法において:
前記現在のブロックの1つ以上の第2隣接ブロックに基づいて、前記現在のブロックに対する第2動きベクトル候補リストを構築するステップであって、前記1つ以上の第2隣接ブロックの各々は、前記現在のブロックと同じダウン・サンプリング率を有する、ステップ;及び
前記現在のブロックの1つ以上の第3隣接ブロックに基づいて、前記現在のブロックに対する第3動きベクトル候補リストを構築するステップであって、前記1つ以上の第3隣接ブロックの各々は、前記現在のブロックとは異なるダウン・サンプリング率を有する、ステップ;
を更に含む方法。 - 請求項7に記載の方法において:
指定された数より少ない、前記第2動きベクトル候補リスト内の動きベクトル候補の数に基づいて、前記第3動きベクトル候補リストをスキャニングするステップ;
を更に含む、方法。 - 請求項7に記載の方法において:
前記第2動きベクトル候補リストと前記第3動きベクトル候補リストとをインターリーブ方式でマージすることによって、前記現在のブロックに対する第4動きベクトル候補リストを決定するステップ;
を更に含む、方法。 - 請求項1に記載の方法において:
前記現在のブロックのダウン・サンプリング率に基づいて、前記現在のブロックのアフィン・パラメータを決定するステップ;
を更に含む方法。 - 請求項1ないし10のうちの何れか一項に記載の方法を実行するように構成された処理回路を含む装置。
- 請求項1ないし10のうちの何れか一項に記載の方法をコンピュータのプロセッサに実行させるコンピュータ・プログラム。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202163137350P | 2021-01-14 | 2021-01-14 | |
| US63/137,350 | 2021-01-14 | ||
| US17/488,027 US11924408B2 (en) | 2021-01-14 | 2021-09-28 | Method and apparatus for video coding |
| US17/488,027 | 2021-09-28 | ||
| JP2022560925A JP7462792B2 (ja) | 2021-01-14 | 2021-09-30 | ビデオ・コーディングのための方法及び装置 |
| PCT/US2021/052967 WO2022154835A1 (en) | 2021-01-14 | 2021-09-30 | Method and apparatus for video coding |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022560925A Division JP7462792B2 (ja) | 2021-01-14 | 2021-09-30 | ビデオ・コーディングのための方法及び装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2024079781A JP2024079781A (ja) | 2024-06-11 |
| JP2024079781A5 JP2024079781A5 (ja) | 2025-05-01 |
| JP7697641B2 true JP7697641B2 (ja) | 2025-06-24 |
Family
ID=82322348
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022560925A Active JP7462792B2 (ja) | 2021-01-14 | 2021-09-30 | ビデオ・コーディングのための方法及び装置 |
| JP2024049106A Active JP7697641B2 (ja) | 2021-01-14 | 2024-03-26 | ビデオ・コーディングのための方法及び装置 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022560925A Active JP7462792B2 (ja) | 2021-01-14 | 2021-09-30 | ビデオ・コーディングのための方法及び装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US11924408B2 (ja) |
| EP (1) | EP4088474A4 (ja) |
| JP (2) | JP7462792B2 (ja) |
| KR (1) | KR20220104041A (ja) |
| CN (1) | CN115398918A (ja) |
| WO (1) | WO2022154835A1 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11924408B2 (en) * | 2021-01-14 | 2024-03-05 | Tencent America LLC | Method and apparatus for video coding |
| WO2022206928A1 (en) * | 2021-04-01 | 2022-10-06 | Beijing Bytedance Network Technology Co., Ltd. | Method, device, and medium for video processing |
| US12425616B2 (en) * | 2022-11-15 | 2025-09-23 | Tencent America LLC | Scaled intra reference picture |
| CN120419179A (zh) * | 2022-12-19 | 2025-08-01 | 交互数字Ce专利控股有限公司 | 增强型残差数据编码 |
| WO2024215074A1 (ko) * | 2023-04-10 | 2024-10-17 | 주식회사 케이티 | 영상 부호화/복호화 방법 및 비트스트림을 저장하는 기록 매체 |
| US20250106407A1 (en) * | 2023-09-22 | 2025-03-27 | Tencent America LLC | Block level adaptive weighted prediction with multiple scaling factors |
| US20250211754A1 (en) * | 2023-12-20 | 2025-06-26 | Tencent America Llc. | Systems and methods for decoder-side motion vector refinement subsampling |
| CN120378615A (zh) * | 2024-01-24 | 2025-07-25 | 华为技术有限公司 | 一种编解码方法及装置 |
| CN118803254A (zh) * | 2024-02-01 | 2024-10-18 | 中移(杭州)信息技术有限公司 | 一种帧内降采样解码方法、设备及存储介质 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013518463A (ja) | 2010-01-22 | 2013-05-20 | トムソン ライセンシング | サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置 |
| WO2019197674A1 (en) | 2018-04-13 | 2019-10-17 | Koninklijke Kpn N.V. | Block-level super-resolution based video coding |
| US20200186825A1 (en) | 2018-12-06 | 2020-06-11 | Qualcomm Incorporated | Spatio-temporal motion vector prediction patterns for video coding |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9154808B2 (en) * | 2005-01-14 | 2015-10-06 | Thomson Licensing | Method and apparatus for INTRA prediction for RRU |
| RU2387094C1 (ru) * | 2006-11-09 | 2010-04-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для кодирования/декодирования видеосигнала |
| US8514942B2 (en) | 2008-12-31 | 2013-08-20 | Entropic Communications, Inc. | Low-resolution video coding content extraction |
| CN104702960B (zh) * | 2009-01-26 | 2018-01-02 | 汤姆森特许公司 | 用于视频解码的装置 |
| KR20240038134A (ko) * | 2014-10-31 | 2024-03-22 | 삼성전자주식회사 | 움직임 벡터 부복호화 방법 및 장치 |
| US10560718B2 (en) * | 2016-05-13 | 2020-02-11 | Qualcomm Incorporated | Merge candidates for motion vector prediction for video coding |
| US11197025B2 (en) * | 2019-06-21 | 2021-12-07 | Qualcomm Incorporated | Signaling of matrix intra prediction parameters in video coding |
| US12206855B2 (en) * | 2020-12-23 | 2025-01-21 | Tencent America LLC | Superresolution-based coding |
| US11924408B2 (en) * | 2021-01-14 | 2024-03-05 | Tencent America LLC | Method and apparatus for video coding |
-
2021
- 2021-09-28 US US17/488,027 patent/US11924408B2/en active Active
- 2021-09-30 CN CN202180027161.8A patent/CN115398918A/zh active Pending
- 2021-09-30 JP JP2022560925A patent/JP7462792B2/ja active Active
- 2021-09-30 KR KR1020227021511A patent/KR20220104041A/ko active Pending
- 2021-09-30 EP EP21920039.1A patent/EP4088474A4/en active Pending
- 2021-09-30 WO PCT/US2021/052967 patent/WO2022154835A1/en not_active Ceased
-
2024
- 2024-01-19 US US18/418,094 patent/US12309359B2/en active Active
- 2024-03-26 JP JP2024049106A patent/JP7697641B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013518463A (ja) | 2010-01-22 | 2013-05-20 | トムソン ライセンシング | サンプリングベースの超解像度ビデオ符号化および復号化方法並びに装置 |
| WO2019197674A1 (en) | 2018-04-13 | 2019-10-17 | Koninklijke Kpn N.V. | Block-level super-resolution based video coding |
| US20200186825A1 (en) | 2018-12-06 | 2020-06-11 | Qualcomm Incorporated | Spatio-temporal motion vector prediction patterns for video coding |
Non-Patent Citations (1)
| Title |
|---|
| Jianping Lin et al.,Convolutional Neural Network-Based Block Up-Sampling for HEVC [online],Published in: IEEE Transactions on Circuits and Systems for Video Technology (Volume: 29, Issue: 12,,2018年11月30日,pp.3701-3715,インターネット <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8554306> [2023年10月10日検索] ,DOI: 10.1109/TCSVT.2018.2884203 |
Also Published As
| Publication number | Publication date |
|---|---|
| US12309359B2 (en) | 2025-05-20 |
| CN115398918A (zh) | 2022-11-25 |
| KR20220104041A (ko) | 2022-07-25 |
| JP2023520594A (ja) | 2023-05-17 |
| EP4088474A4 (en) | 2023-07-12 |
| EP4088474A1 (en) | 2022-11-16 |
| US20240155113A1 (en) | 2024-05-09 |
| US11924408B2 (en) | 2024-03-05 |
| US20220224883A1 (en) | 2022-07-14 |
| JP7462792B2 (ja) | 2024-04-05 |
| WO2022154835A1 (en) | 2022-07-21 |
| JP2024079781A (ja) | 2024-06-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7223018B2 (ja) | ビデオ符号化/復号化の方法及び装置 | |
| JP7152512B2 (ja) | 動画の符号化及び復号方法、装置、並びにコンピュータプログラム | |
| JP7697641B2 (ja) | ビデオ・コーディングのための方法及び装置 | |
| JP7524347B2 (ja) | ビデオコーディングのための方法および装置、およびコンピュータプログラム | |
| JP2024133061A (ja) | ビデオコーディングのための方法および装置 | |
| CN116830581B (zh) | 对当前视频块解码的方法、装置、电子设备和存储介质 | |
| JP7767510B2 (ja) | ビデオコーディングのための方法および装置 | |
| JP7514325B2 (ja) | ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびコンピュータプログラム | |
| JP2024539787A (ja) | 動きベクトル差分のジョイント・シグナリング方法 | |
| KR20230135641A (ko) | 적응형 모션 벡터 차이 해상도를 위한 공동 코딩 | |
| JP2024539785A (ja) | ジョイントmvdコーディングのためのmvdスケーリング | |
| CN116584092B (zh) | 视频块解码方法、装置和存储介质 | |
| JP7540082B2 (ja) | オフセット・ベースのリファインメント及び複数参照ライン選択の調和的設計 | |
| JP2023508303A (ja) | ビデオコーディングのための方法、装置およびコンピュータプログラム | |
| KR20230135670A (ko) | 조인트 모션 벡터 차이 코딩 | |
| JP2025011211A (ja) | イントラモードコーディングの改善 | |
| JP2024174009A (ja) | 参照フレームの適応的な並べ替えのための方法および装置 | |
| JP2024123248A (ja) | 多重参照ライン・イントラ予測のための方法、装置及びコンピュータ・プログラム | |
| KR20230136646A (ko) | 모션 벡터 후보들을 리파인하기 위한 방법들 및 디바이스들 | |
| JP2025501805A (ja) | ビデオ復号化方法及び装置、並びにビデオ符号化方法 | |
| JP7758420B2 (ja) | 単一参照動きベクトル差分のための適応解像度 | |
| JP2025513662A (ja) | 近辺のルマ・サンプルを用いるクロマ・フロム・ルマ予測 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240927 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250422 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250513 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250604 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7697641 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |







