JP2022521893A - ビデオの符号化および復号における動きベクトルの導出 - Google Patents

ビデオの符号化および復号における動きベクトルの導出 Download PDF

Info

Publication number
JP2022521893A
JP2022521893A JP2021547331A JP2021547331A JP2022521893A JP 2022521893 A JP2022521893 A JP 2022521893A JP 2021547331 A JP2021547331 A JP 2021547331A JP 2021547331 A JP2021547331 A JP 2021547331A JP 2022521893 A JP2022521893 A JP 2022521893A
Authority
JP
Japan
Prior art keywords
motion vector
vector refinement
refinement
dmvr
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021547331A
Other languages
English (en)
Other versions
JPWO2020183243A5 (ja
Inventor
アーバン,ファブリス
ギャルピン,フランク
ボルデ,フィリップ
Original Assignee
インターデジタル ブイシー ホールディングス フランス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターデジタル ブイシー ホールディングス フランス filed Critical インターデジタル ブイシー ホールディングス フランス
Publication of JP2022521893A publication Critical patent/JP2022521893A/ja
Publication of JPWO2020183243A5 publication Critical patent/JPWO2020183243A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオ処理は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することに基づいてピクチャを符号化および/または復号することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、その変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを符号化および/または復号することと、を伴うことができる。【選択図】図16

Description

本開示は、ビデオの符号化および復号に関する。
高い圧縮効率を達成するために、画像およびビデオのコード化スキームは、通常、ビデオコンテンツの空間的および時間的冗長性を活用する予測および変換を用いる。一般に、イントラ予測またはインター予測は、イントラ相関またはインターフレーム相関を利用するために使用され、次いで、予測誤差または予測残差と表記されることが多い、元のピクチャブロックと予測されたピクチャブロックとの差分が変換され、量子化され、エントロピーコード化される。ビデオを再構築するために、圧縮されたデータは、予測、変換、量子化、およびエントロピーコード化に対応する逆プロセスによって復号される。
ピクチャ情報を符号化する方法を伴う実施形態の少なくとも一実施例が提供され、その方法は、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することと、を含む。
ピクチャ情報を復号する方法を伴う実施形態の少なくとも一実施例が提供され、この方法は、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を復号することと、を含む。
ピクチャ情報を符号化する装置を伴う実施形態の少なくとも一実施例が提供され、この装置は、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することと、を行うように構成された1つ以上のプロセッサを含む。
ピクチャ情報を復号する装置を伴う実施形態の少なくとも一実施例が提供され、この装置は、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することと、を行うように構成された1つ以上のプロセッサを含む。
ピクチャ情報を符号化する方法を伴う実施形態の少なくとも一実施例が提供され、この方法は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメント関数を伴う処理モードのアクティブ化を決定することと、動きベクトルリファインメント関数に基づいて動きベクトルリファインメントプロセスを変更することと、処理モードおよび変更された動きベクトルリファインメントプロセスに基づいてピクチャ情報の少なくとも一部を符号化することと、を含む。
ピクチャ情報を復号する方法を伴う実施形態の少なくとも一実施例が提供され、この方法は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメント関数を伴う処理モードのアクティブ化を決定することと、動きベクトルリファインメント関数に基づいて動きベクトルリファインメントプロセスを変更することと、処理モードおよび変更された動きベクトルリファインメントプロセスに基づいてピクチャ情報の少なくとも一部を復号することと、を含む。
ピクチャ情報を符号化する装置を伴う実施形態の少なくとも一実施例が提供され、この装置は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメント関数を伴う処理モードのアクティブ化を決定することと、動きベクトルリファインメント関数に基づいて動きベクトルリファインメントプロセスを変更することと、処理モードおよび変更された動きベクトルリファインメントプロセスに基づいてピクチャ情報の少なくとも一部を符号化することと、を行うように構成された1つ以上のプロセッサを含む。
ピクチャ情報を復号する装置を伴う実施形態の少なくとも一実施例が提供され、この装置は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメント関数を伴う処理モードのアクティブ化を決定することと、動きベクトルリファインメント関数に基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスに基づいてピクチャを復号することと、を行うように構成された1つ以上のプロセッサを含む。
ピクチャを符号化する方法を伴う実施形態の少なくとも一実施例が提供され、この方法は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを符号化することと、を含む。
ピクチャを復号する方法を伴う実施形態の少なくとも1つの他の実施例が提供され、この方法は、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを復号することと、を含む。
ピクチャを符号化する装置を伴う実施形態の少なくとも1つの他の実施例が提供され、この装置は1つ以上のプロセッサを含み、この1つ以上のプロセッサは、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを符号化することと、を行うように構成されている。
ピクチャを復号する装置を伴う実施形態の少なくとも1つの他の実施例が提供され、この装置は1つ以上のプロセッサを含み、この1つ以上のプロセッサは、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを復号することと、を行うように構成されている。
ピクチャを符号化する方法を伴う実施形態の少なくとも1つの他の実施例が提供され、この方法は、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを符号化することと、を含む。
ピクチャを復号する方法を伴う実施形態の少なくとも1つの他の実施例が提供され、この方法は、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを復号することと、を含む。
ピクチャを符号化する装置を伴う実施形態の少なくとも1つの他の実施例が提供され、この装置は1つ以上のプロセッサを含み、この1つ以上のプロセッサは、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを符号化することと、を行うように構成されている。
ピクチャを復号する装置を伴う実施形態の少なくとも1つの他の実施例が提供され、この装置は1つ以上のプロセッサを含み、この1つ以上のプロセッサは、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを復号することと、を行うように構成されている。
上記は、本開示のいくつかの態様の基本的な理解を提供するために、主題の簡略化された概要を提示している。この概要は主題の広範な大要ではない。実施形態の主要な/重要な要素を特定すること、または主題の範囲を線引きすることは意図されていない。その唯一の目的は、以下に提供されるより詳細な説明の前置きとして、主題のいくつかの概念を簡略化した形態で提示することである。
本開示は、添付の図と併せて以下の詳細な説明を検討することによって、よりよく理解され得る。
ビデオエンコーダの実施形態の実施例を示すブロック図を提供する。 ビデオデコーダの実施形態の実施例を示すブロック図を提供する。 コード化ツリーユニット(CTU)を伴う本開示の態様を示す。 CTUおよびコード化ユニット(CU)を伴う本開示の態様を示す。 復号側動きベクトルリファインメント(DMVR)の実施例を示す。 DMVR検索手順の実施例を示すフロー図を提供する。 DMVR整数輝度サンプル検索パターンの実施例を示す。 正方形CU(上の図)と長方形CU(下の図)の両方の動きベクトル(MV)で変換された隣接する再構築サンプルおよび対応する参照サンプルから導出された照度補償パラメータ、例えば、局所照度補償(LIC)パラメータの実施例を示す。 LICパラメータの導出、および予測L0と予測L1それぞれへの適用の実施例を示すフロー図を提供する。 LICパラメータの導出および組み合わされたL0とL1からの予測への適用の実施例を示すフロー図を提供する。 長方形CUの左側参照サンプルおよび上部参照サンプルの位置決めの実施例を示す。 DMVRおよびLICによる双予測の実施例を示すフロー図を提供する。 DMVRリファインメント前の復号された双予測動きベクトルに基づくLICパラメータの導出の実施例を示すフロー図を提供する。 本明細書に記載の様々な態様による装置の実施形態の実施例を示すブロック図を提供する。 DMVRや重み付き予測(WP)などの動きベクトルリファインメント付き双予測を伴う実施形態の実施例を示すフロー図を提供する。 本開示による実施形態の様々な実施例を示すフロー図を提供する。
図面は、本開示による様々な態様、特徴、および実施形態の実施例を示すことを目的としており、必ずしも唯一の可能な構成ではないことを理解されたい。様々な図を通して、同様の参照指定子は、同一または類似の特徴を指す。
ここで図に目を向けると、図1は、HEVCエンコーダなどのビデオエンコーダ100の実施例を示している。HEVCは、Joint Collaborative Team on Video Coding(JCT-VC)によって開発された圧縮規格である(例えば、「ITU-T H.265 TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(10/2014)、SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS,Infrastructure of audiovisual services-Coding of moving video,High efficiency video coding,Recommendation ITU-T H.265」を参照のこと)。図1は、HEVC規格に対して改善が行われたエンコーダ、または、Joint Video Experts Team(JVET)が開発中のJEM(Joint Exploration Model)に基づくかもしくは改善されたエンコーダ、例えば、Versatile Video Coding(VVC)と呼ばれる開発作業に関連したエンコーダなどの、HEVCと同様の技術を採用したエンコーダも示し得る。
本出願では、「再構築された」および「復号された」という用語は互換的に使用され得、「ピクセル」および「サンプル」という用語は互換的に使用され得、「ピクチャ」、および「フレーム」という用語は互換的に使用され得る。必須ではないが、通常は、「再構築された」という用語は、エンコーダ側において使用される一方で「復号された」は、デコーダ側において使用される。
HEVC仕様は、「ブロック」と「ユニット」とを区別し、ここで「ブロック」は、サンプルアレイの特定の領域(例えば、輝度、Y)をアドレス指定し、「ユニット」は、すべての符号化された色成分(Y、Cb、Cr、またはモノクロ)、構文要素、およびブロックに関連付けられている予測データ(例えば、動きベクトル)の併置されたブロックを含む。
コード化の場合、ピクチャは、構成可能なサイズを有する正方形のコード化ツリーブロック(CTB)に分割され、一連のコード化ツリーブロックがスライスにグループ化される。コード化ツリーユニット(CTU)は、符号化された色成分のCTBを包含する。CTBは、コード化ブロック(CB)への四分木分割のルートであり、コード化ブロックは、1つ以上の予測ブロック(PB)に分割することができ、変換ブロック(TB)への四分木分割のルートを形成する。コード化ブロック、予測ブロック、および変換ブロックに対応して、コード化ユニット(CU)は、予測ユニット(PU)と、変換ユニット(TU)のツリー構造セットと、を含み、PUは、すべての色成分についての予測情報を含み、TUは、各色成分の残差コード化構文構造を含む。輝度成分のCB、PB、およびTBのサイズは、対応するCU、PU、およびTUに適用される。本出願では、「ブロック」という用語は、CTU、CU、PU、TU、CB、PB、およびTBのいずれかを指すために使用され得る。加えて、「ブロック」は、H.264/AVCまたは他のビデオコード化規格で指定されているマクロブロックおよびパーティションを指すためにも使用することができ、より一般的には、様々なサイズのデータのアレイを指すために使用することができる。
図1のエンコーダ100では、以下で説明されるように、ピクチャがエンコーダ要素によって符号化される。符号化するピクチャは、CU単位で処理される。各CUは、イントラモードまたはインターモードのいずれかを使用して符号化される。CUがイントラモードで符号化されるとき、イントラ予測を実行する(160)。インターモードにおいて、動き推定(175)および動き補償(170)が実行される。エンコーダは、イントラモードまたはインターモードのどちらをCUの符号化に使用するかを判断し(105)、予測モードフラグによってイントラ/インター判断を示す。予測残差は、元の画像ブロックから予測されたブロックを減算することにより計算される(110)。
次いで、予測残差が変換され(125)、量子化される(130)。量子化された変換係数に加えて、動きベクトルおよび他の構文要素は、ビットストリームを出力するためにエントロピーコード化される(145)。また、エンコーダは、変換をスキップし、4x4TUベースで非変換残差信号に直接量子化を適用し得る。また、エンコーダは、変換および量子化の両方をバイパスすることもでき、すなわち、残差は、変換または量子化プロセスを適用せずに直接コード化される。直接PCMコード化では、予測は適用されず、コード化ユニットサンプルは、ビットストリームに直接コード化される。
エンコーダは、符号化されたブロックを復号して、さらに予測するための参照を提供する。量子化された変換係数は逆量子化され(140)、逆変換され(150)、予測残差を復号する。復号された予測残差と予測されたブロックとを組み合わせて(155)、画像ブロックが再構築される。ループ内フィルタ(165)は、再構築されたピクチャに適用され、例えば、デブロッキング/SAO(サンプル適合オフセット)フィルタリングを実行し、符号化アーティファクトを低減する。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
図2は、HEVCデコーダなどのビデオデコーダ200の実施例のブロック図を示す。デコーダ200の実施例では、ビットストリームは、後述するデコーダ要素によって復号される。ビデオデコーダ200は、概して、図1で説明されたような符号化パスの逆の復号パスを実行し、これは、ビデオデータの符号化の一部として、ビデオ復号を実行する。図2はまた、HEVC規格に対して改善が行われたデコーダ、またはJEMもしくは改善されたJEMに基づくデコーダなどのHEVCと同様の技術を採用したデコーダも示し得る。
特に、デコーダの入力は、図1のビデオエンコーダ100などのビデオエンコーダによって生成され得るビデオ信号またはビットストリームを含む。まず、信号またはビットストリームがエントロピー復号され(230)、変換係数、動きベクトル、および他のコード化情報を取得する。変換係数は、予測残差を復号するために、逆量子化され(240)、かつ逆変換される(250)。復号された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構築される。予測されたブロックは、イントラ予測(260)または動き補償予測(すなわち、インター予測)(275)から取得され得る(270)。高度動きベクトル予測(AMVP)およびマージモード技法を使用して、動き補償のための動きベクトルを導出し得、これは、補間フィルタを使用して、参照ブロックのサブ整数サンプルの補間値を計算し得る。ループ内フィルタ(265)は、再構築された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
HEVCビデオ圧縮規格では、動き補償された時間予測を用いて、ビデオの連続するピクチャ間に存在する冗長性を活用する。それを行うために、動きベクトルが各予測単位(PU)に関連付けられる。各コード化ツリーユニット(CTU)は、圧縮ドメイン内のコード化ツリー(CT)によって表される。これは、図3に示すように、CTUの四分木分割であり、各葉は、コード化ユニット(CU)と呼ばれる。
次に、各CUには、イントラまたはインター予測パラメータ(予測情報)がいくつか与えられる。それを行うために、それは、1つ以上の予測単位(PU)に空間的に分割され、各PUには、いくつかの予測情報が割り当てられる。イントラコード化モードまたはインターコード化モードは、コード化ツリーユニットをコード化ユニット、予測ユニット、および変換ユニットに分割する実施例を示す図4に示すように、CUレベルで割り当てられる。CUをコード化するために、予測ブロックまたは予測ユニット(PU)は、隣接する再構築されたサンプル(イントラ予測)、または復号ピクチャバッファ(DPB)に記憶された以前に再構築されたピクチャ(インター予測)から構築される。次に、元のサンプルとPUサンプルの差分として計算された残差サンプルが変換され、量子化される。
インター予測では、動き補償時間予測が用いられ、ビデオの連続するピクチャ間に存在する冗長性を活用する。そうするために、動きベクトルは、PUと、LIST_0で指定されたリスト中にリストされた複数の参照ピクチャのうちのどれを使用するかを示す参照インデックス0(refIdx0)と、に関連付けられる。
HEVCでは、2つのモードを用いて、動きデータを符号化する。これらはそれぞれ、適合動きベクトル予測(AMVP)およびマージと呼ばれる。AMVPは、現在のPUを予測するために使用される参照ピクチャ(複数可)と、動きベクトル予測子インデックス(2つの予測子のリストから取得される)と、動きベクトル差分とを信号伝達することを伴う。マージモードは、動きデータ予測子のリスト中に収集された、いくつかの動きデータのインデックスを信号伝達し、復号することを含む。リストは5つの候補からなり、デコーダ側およびエンコード側で同じ方法で作成される。したがって、マージモードは、マージリストから取り出された動き情報を導出することを目的としている。マージリストは、通常、現在のPUが処理されているときに、それらの復号された状態で利用可能な、いくつかの空間的および時間的周囲ブロックに関連する動き情報を含む。
例えば、Joint Exploration Model(JEM)と呼ばれ、VVC Test Model(VTM)として知られるVersatile Video Coding(VVC)リファレンスソフトウェアのJVET(Joint Exploration Team)グループによって開発されたコーデックなどの他のコーデックでは、インター予測で使用されるいくつかのモード(例えば、双方向インター予測またはBモード)は、送信されたパラメータを用いて照度変化を補償することができる。Bモードでは、現在のブロックが2つの動きベクトルに関連付けられ、2つの異なる画像中の2つの参照ブロックを指定する。現在のブロックについての残差ブロックを計算することを可能にする予測子ブロックは、2つの参照ブロックの平均である。各参照ブロックに関連付けられた重みが異なる、双方向インター予測のいくつかの一般化が提案され、重み付き予測(WP)は、いくつかの態様における双方向インター予測の一般化と見なされ得る。WPでは、残差ブロックは、現在のブロックと、単方向インター予測の場合は参照ブロックの重み付きバージョンまたは双方向インター予測の場合は2つの参照ブロックの重み付き平均のいずれかとの差分として計算される。WPは、シーケンスヘッダ内のシーケンスレベル(VVCではシーケンスパラメータセット(SPS)と呼ばれる)または画像ヘッダの画像レベル(VVCではピクチャパラメータセット(PPS)と呼ばれる)で有効にすることができる。WPは、参照画像の各リスト(L0およびL1)の各参照ピクチャの各成分に関連付けられたCTUのグループごとの(例えば、概して、スライスヘッダレベルにおける)重みおよびオフセットを定義する。
WPがシーケンスヘッダ(SPS)および画像ヘッダ(PPS)において有効にされ、関連する重みおよびオフセットがスライスヘッダにおいて指定されている間は、CUレベル重み付き双予測(BCW)と呼ばれる新しいモードは、ブロックレベルにおける重みを信号伝達することを可能にする。
デコーダ側で決定された関連パラメータを有するいくつかの追加の時間予測ツールは、動きベクトルリファインメントおよび照度変動などの問題の補償といった機能を提供する。かかる追加のツールは、例えば、デコーダ側動きベクトルリファインメント(DMVR)などの動きベクトルリファインメントと、局所照度補償(LIC)などの照度補償とを含むことができる。DMVRの1つの目的は、バイラテラルマッチング予測などの予測するアプローチを使用することによって動きベクトルをさらにリファインすることであり得る。LICの1つの目的は、動き補償された時間的予測を通じて使用される予測ブロックとその参照ブロックとの間で生じ得る照度変化を補償することであり得る。これらのツールは両方とも、少なくとも部分的にデコーダ側のプロセスを伴い、予測に使用されるパラメータを導出することができる。
より詳細には、マージモードのMVの精度を高めるためのアプローチは、バイラテラルマッチング(BM)ベースのデコーダ側動きベクトルリファインメントを適用することを伴うことができる。双予測動作では、参照ピクチャリストL0および参照ピクチャリストL1内の初期MVの周囲でリファインされたMVが検索される。BM法は、絶対差分和(SAD)などのアプローチに基づいて、参照ピクチャリストL0および参照ピクチャリストL1内の2つの候補輝度ブロック間の歪みを計算する。図5の実施例に示されているように、ブロック500とブロック501(赤色ブロック)との間のSADは、初期MV周囲の各MV候補に基づいて計算される。最も低いSADを有するMV候補がリファインされたMVになり、双予測信号を生成するために使用される。
DMVRを適用するためのアプローチは、以下のモードでコード化されたCUに対してDMVRが適用され得ることを含む。
・双予測MVによるCUレベルマージモード。
・現在のピクチャについて、1つが過去の参照ピクチャであり、もう1つが将来の参照ピクチャであるモード。
・両方の参照ピクチャから現在のピクチャまでの距離(例えば、ピクチャ順序カウント(POC)の差分)が同じであるモード。
・CUが64以上の輝度サンプルを有し、CU高さが8以上の輝度サンプルであるモード。
DMVRプロセスによって導出されたリファインされたMVは、インター予測サンプルを生成するために使用され得、将来のピクチャコード化のための時間的動きベクトル予測にも使用され得るが、元のMVは、例えば、非ブロック化プロセスに使用でき、将来のCUコード化のための空間的動きベクトル予測においても使用することができる。DMVRへの1つ以上のアプローチの追加機能を以下に説明する。
図5に示された実施例に示されるように、検索ポイントは初期MVを囲んでおり、MVオフセットはMV差分ミラーリングルールに従う。すなわち、図5の候補MV対(MV0,MV1)によって示される、DMVRによってチェックされるあらゆるポイントが、以下の2つの式に従う。
MV0’=MV0+MVoffset(1)
MV1’=MV1-MVoffset(2)
ここで、MVoffsetは、参照ピクチャのうちの1つにおける初期MVとリファインされたMVとの間のリファインメントオフセットを表す。リファインメント検索範囲は、例えば、初期MVからの2つの整数輝度サンプルであり得る。
図6は、図5に示されるようなDMVRの検索プロセスの実施例を示すフロー図である。図6の実施例に示されるように、検索は、整数サンプルオフセット検索ステージおよび分数サンプルリファインメントステージを含む。
検索の複雑さを低減するために、早期終了機構を有する高速検索方法が、整数サンプルオフセット検索ステージに適用され得る。全検索、例えば、25のポイントの代わりに、2反復検索スキームを適用してSADチェックポイントを低減することができる。図7に示されるように、最初の反復で最大6つのSADがチェックされる。まず、5つのポイント(中央およびP1~P4)のSADが比較される。中央位置のSADが最小であれば、DMVRの整数サンプルステージは終了する。そうでなければ、もう1つの位置P5(P1~P4のSAD分布によって決定される)がチェックされる。次いで、最小のSADを有する位置(P1~P5の中の)が、2回目の反復検索の中央位置として選択される。2回目の反復検索のプロセスは、最初の反復検索のプロセスと同じである。最初の反復で計算されたSADは、2回目の反復で再利用され得、したがって、3つの追加ポイントのSADのみがさらに計算される必要がある。
整数サンプル検索の後に、分数サンプルリファインメントを行うことができる。計算の複雑さを低減するために、SAD比較による追加の検索の代わりに、パラメトリック誤差面(error surface)方程式を使用することによって、分数サンプルリファインメントを導出することができる。分数サンプルリファインメントは、整数サンプル検索ステージの出力に基づいて条件付きで呼び出すことができる。整数サンプル検索ステージが、最初の反復検索または2回目の反復検索のいずれかにおいて、中央が最小のSADを有する状態で終了すると、分数サンプルリファインメントがさらに適用される。
パラメトリック誤差面ベースのサブピクセルオフセット推定では、中央位置コストおよび中央から4つの隣接する位置におけるコストを使用して、以下の形式の2D放物線誤差面方程式を当てはめる。
E(x,y)=A(x-xmin+B(y-ymin+C (3)
ここで、(x_min,y_min)は最小コストを有する分数位置に対応し、Cは最小コスト値に対応する。5つの検索ポイントのコスト値を使用して上記の方程式を解くことによって、(x_min,y_min)は以下のように計算される。
Figure 2022521893000002

y_min=(E(0,-1)-E(0,1)/(2((E(0,-1)+E(0,1)-2E(0,0)))(5)
mindymineの値は、すべてのコスト値が正であり、最小値がE(0,0)であるため、自動的に-8~8に制約される。これは、例えば、1/16ペルMV精度を有するハーフペルオフセットに対応する。計算された分数(x_min,y_min)は、整数距離リファインメントMVに加算されて、サブピクセルの正確なリファインメントデルタMVを得る。
コーデックは、例えば、MVの解像度が1/16輝度サンプルになり得ることを提供し得る。分数位置におけるサンプルは、8タップ補間フィルタを使用して補間される。DMVRでは、検索ポイントは整数サンプルオフセットで最初の分数ペルMVを囲んでおり、したがってこれらの分数位置のサンプルはDMVR検索プロセスのために補間される必要がある。計算の複雑さを低減するために、双線形補間フィルタを使用して、DMVRにおける検索プロセスのための分数サンプルを生成する。別の重要な効果は、双線形フィルタを使用することによって、2サンプル検索範囲では、DVMRが通常の動き補償プロセスと比較してより多くの参照サンプルにアクセスしないことである。リファインされたMVがDMVR検索プロセスによって得られた後に、通常の8タップ補間フィルタが適用されて最終予測が生成される。通常のMCプロセスに対してより多くの参照サンプルにアクセスしないようにするために、元のMVに基づく補間プロセスには必要ないが、リファインされたMVに基づく補間プロセスには必要なサンプルが、これらの使用可能なサンプルからパディングされる。
DMVR検索プロセスの最大ユニットサイズは、例えば、16x16に制限することができる。CUの幅および/または高さが最大サイズよりも大きい、例えば、16個の輝度サンプルよりも大きい場合は、CUは、例えば、16個の輝度サンプルなどの最大サイズに等しい幅および/または高さを有するサブブロックにさらに分割することができる。
インター予測(またはBモード)で使用されるいくつかのモードは、送信されたパラメータを用いて照度変化を補償することができる。Bモードでは、現在のブロックが2つの動きベクトルに関連付けられ、2つの異なる画像中の2つの参照ブロックを指定する。現在のブロックについての残差ブロックを計算することを可能にする予測子ブロックは、2つの参照ブロックの平均である。現在のブロックの予測子biPredは、以下のように計算される。
Figure 2022521893000003

ここで、predは、概して復号ピクチャバッファ(DPB)と呼ばれる復号画像のバッファに記憶された参照画像のリストL0で取得された動き補償ブロック予測子であり、predは、DPBに記憶された参照画像のリストL1で取得された動き補償ブロック予測子であり、wおよびwは、古典的な双方向インター予測の場合の重みに等しい重みである。
重みwおよびwが異なる双方向インター予測のいくつかの一般化が提案され、重み付き予測(WP)は、いくつかの態様における双方向インター予測の一般化と見なされ得る。WPでは、残差ブロックは、現在のブロックと、単方向インター予測の場合の参照ブロックの重み付きバージョンまたは双方向インター予測の場合の2つの参照ブロックの重み付き平均のいずれかとの差分として計算される。WPは、シーケンスヘッダ内のシーケンスレベル(VVCではシーケンスパラメータセット(SPS)と呼ばれる)または画像ヘッダの画像レベル(VVCではピクチャパラメータセット(PPS)と呼ばれる)で有効にすることができる。WPは、DPBに記憶された参照画像の各リスト(L0およびL1)の各参照ピクチャiの各成分に関連付けられた(例えば、概して、スライスヘッダレベルにおいて)CTUのグループごとに重みwおよびオフセットOffを定義する。現在のブロックが双方向WPにおいてコード化されている場合は、現在のブロックについての位置(x,y)における予測サンプルpred(x,y)は以下のように計算される。
pred(x,y)=((w.pred0(x,y)+w.pred(x,y)+Off01)≫(shift+1))
Off01=(Off0+Off+1)≪shiftの場合。
ここで、pred(x,y)は、DPBに記憶され、空間的にpred(x,y)に対応する参照画像のリストLで取得された動き補償予測子サンプルであり、wは重みであり、Offはオフセット値である。
サンプルを重み付けするときに向上した数値精度を維持するために、向上したビット深度精度を有する中間サンプル値を記憶および演算することができる。この場合、最終的な(所望の)ビット深度サンプル予測精度(bitDepth)は、予測計算プロセスの終了時に最後の右ビットシフトによって取得される。例えば、DPBの参照ピクチャは精度bitDepthで記憶されるが、中間動き補償サンプルは中間バッファに向上した精度(bitDepth+sp)で記憶される。2つの上述の式におけるシフト値シフトの1つの目的は、この中間の向上したビット深度精度を保証することである。同様の中間ビット深度精度向上プロセスが、概して、サンプル重み付きプロセスを使用するすべての予測ツールに使用されることに留意されたい。
WPがシーケンスヘッダ(SPS)および画像ヘッダ(PPS)において有効にされ、関連する重みおよびオフセットがスライスヘッダにおいて指定されている間は、CUレベル重み(BCW)を有する双予測と呼ばれる新しいモードは、ブロックレベルにおける重みを信号伝達することを可能にする。BCWモードが現在のブロックに適用されると、現在のブロックの予測子サンプルpred(x,y)は以下のように計算される。
pred(x,y)=((8-w).pred(x,y)+w.pred1(x,y)+4)≫3
ここで、pred_0(x,y)は、DPBに記憶された参照画像のリストL0で取得され、pred(x,y)に空間的に対応する動き補償予測子サンプルであり、pred(x,y)は、DPBに記憶された参照画像のリストL1で取得され、pred(x,y)に空間的に対応する動き補償予測子サンプルであり、wは5つの重みのセットで取得された重みである(w∈{-2、3、4、5、10})。重みwは、1)非マージCUの場合は、重みインデックスbcw_idxは動きベクトル差分の後に信号伝達される方法、および2)マージCUの場合は、重みインデックスbcw_idxはマージ候補インデックスに基づいて隣接ブロックから推測される方法、のいずれかの方法で決定される。
照度補償、例えば、局所照度補償(LIC)などのツールの使用は、インターモードでコード化された各コード化ユニット(CU)に関連付けられたフラグ(LICフラグ)を通じてなど、CUレベルで信号伝達され得る。このツールがアクティブ化されると、デコーダは、図8に示された実施例によって示されるように、予測される現在のブロックの左側および/または上部に局在するいくつかの再構築されたピクチャサンプルと、動き補償ブロックの左側および/または上部に局在する参照ピクチャサンプルとに基づいて、いくつかの予測パラメータを計算する。以下では、現在のブロックの上部の行に位置するサンプルと現在のブロックの左側の列に位置するサンプルとの両方からなるサンプルのセットは、現在のブロックに関連付けられた「L形状」と呼ばれる。例えば、図8における、L形状の一実施例は、現在のブロックの上部および左側にある小さな正方形を含んでいる。
LICは、例えば、重みおよびオフセットに対応し、(a,b)で指定されるパラメータを有する線形モデルに基づくことができる。パラメータ(a,b)は、例えば、現在のサンプルと線形に変更された参照サンプルとの間の誤差、または局所歪み、距離「dist」の最小化に基づいて決定することができ、これは以下のように定義することができる(式6)。
Figure 2022521893000004

ここで、rec_cur(r)は、現在のピクチャ内の隣接する再構築されたサンプルである(図8の右側の実施例によって示されている)。
rec_ref(s)は、s=r+mvの場合、参照ピクチャ(図8の左側の実施例によって示されている)からの動き補償(MC)で構築された参照サンプルである。
rec_cur(r)およびrec_ref(s)は、それぞれ再構築されたL形状と参照L形状の同じ場所に配置されたサンプルである。
いくつかの実装形態では、L形状で使用される再構築されたサンプルおよび参照サンプルの選択において、追加の制限が課され得る。例えば、隣接するブロックに属する再構築されたサンプルがイントラモードでコード化されていない、またはイントラモードで構築された予測(egCIIP)でコード化されていないことが課され得る。
(a,b)の値は、以下のように最小二乗最小化を使用して取得することができる(式7)。
Figure 2022521893000005

Nの値は、式7の合計項が許容される最大整数記憶数値未満に留まるように(例えば、N<216)、さらに調整(増分的に低減)され得ることに留意されたい。また、上部サンプルのセットおよび左側サンプルのセットのサブサンプリングは、大きなブロックに対して増分され得る。
LICパラメータが現在のCUのエンコーダまたはデコーダによって取得されると、現在のCUの予測pred(current_block)は、例えば、以下の単方向予測などのケースを含む。
pred(current_block)=axref_block+b(8)
ここで、current_blockは予測する現在のブロックであり、pred(current_block)は現在のブロックの予測であり、ref_blockは通常の動き補償(MC)プロセスによって構築され、現在のブロックの時間的予測に使用される参照ブロックである。
隣接する再構築されたサンプルのセットおよび参照サンプルのセット(図8の小さな正方形のブロックで示されるサンプル)が、同じ数および同じパターンを有することに留意されたい。以下では、「左側サンプル」は、現在のブロックのすぐ左側に位置する隣接再構築サンプルのセット(または参照サンプルのセット)を示し、「上部サンプル」は、現在のブロックの上部のすぐ上方(または隣接)に位置する隣接再構築サンプルのセット(または、参照サンプルのセット)を示す。「サンプルセット」は、「左側サンプル」のセットおよび「上部サンプル」のセットのそれぞれの1つの組み合わせを示す。
双予測の場合は、LICプロセスは、図9に示された実施例に示されるように、2回適用され得る。図9では、LICプロセスは、図9の300~340によって示されるように、参照0予測(LIST-0)と参照1予測(LIST_1)の両方に適用される。次に、図9の350において、例えば、初期値の重み付き(P=(P0+P1+1)>>1)または双予測重み付き平均(BPWA):P=(g0.P0+g1.P1+(1<<(s-1)))>>s)を使用して、2つの予測が組み合わされる。この方法を「方法a」と呼ぶことにする。
本明細書で「方法b」と呼ばれ、図10に示される別の実施形態の実施例では、双予測の場合、2つの予測、すなわち、参照0および参照1の予測は300において決定され、次いで、図10の320、330、340、および370で単一のLICプロセスを適用する前に360において組み合わされる。
本明細書で「方法c」(方法bに基づく方法c)と呼ばれる別の実施形態の実施例では、双予測の場合、LIC-0パラメータおよびLIC-1パラメータは、例えば、以下のように直接導出される。
Figure 2022521893000006

LICパラメータを導出するために使用される、図8に示される左側サンプルおよび上部サンプルの選択において、いくつかの制限を適用することができる。例えば、制限は以下のうちの1つ以上であり得る。
1)右シフトを使用して除算が実装されるように、左側サンプル数と上部サンプル数の合計は2の累乗である必要がある。
2)左側(N)および上部(N)のサンプルの数は同じであり、Ns(N=2.Ns)に等しい。
n=min(cuHeight,cuWidth)
x=log2(n)
Ns=2 (10)
3)左側(stepV)または上部(stepH)のサンプル間のステップは次の値に等しい。
stepV=cuHeight>>log2(Ns)(11)
stepH=cuWidth>>log2(Ns)
概して、上記のLIC、WP、BCW、およびDMVRは別個のツールである。ただし、これらのツールは様々な方法で組み合わされてもよい。本開示の態様によれば、これらのツールを組み合わせることは、改善された、または最適な性能を得るために、これらのツールの少なくとも1つを適合させることを伴い得る。例えば、図16に示される実施形態は、1610において、DMVRツールによって提供されるような動きベクトルリファインメントをアクティブ化するかどうかを決定することを伴うことができる。そうでない(1610において否定または「いいえ」の結果)場合、ビデオまたはピクチャデータの符号化または復号などの処理は1640において継続する。1610において肯定の結果(1610において「はい」の結果)である場合は、1620において、2番目のプロセス(例えば、LIC、WP、またはBCW)をアクティブ化するかどうかの決定が行われる。そうでない(1620において「いいえ」の結果)場合は、処理は1640において継続する。1620における結果が肯定である(例えば、「はい」)場合は、処理は1630において継続し、ツールの組み合わせがアクティブ化された結果として、動きベクトルリファインメントプロセスが以下で説明されるように変更または適合される。
図17は、図16に示される実施形態の変形である実施形態の別の実施例を示す。図17では、1710においてDMVRのアクティブ化が決定され、続いて1720においてLICのアクティブ化が決定される。その他の点では、図17に示される実施形態の特徴は、図16の実施形態に関して上で説明したものと同様であり、再度説明されない。
上述のように、本開示の態様は、本明細書に記載されるようなツールを組み合わせるときに改善されたまたは最適な性能を得るために、記載されたツールの少なくとも1つを適合させることを伴い得る。例えば、DMVR予測子を導出するために使用される絶対差分和(SAD)アプローチは、LIC、WP、またはBCWなどのツールをDMVRとの組み合わせに適用するには適さない場合がある。例えば、LIC、WP、またはBCWは、DMVRプロセスがSAD関数を用いてすでに低減し得るかまたは最小化を試み得るいくつかの初期値を補正することができる。エンコーダは、コスト決定アプローチ、またはSADなどの関数以外の、それとは異なる、もしくはそれに関して変更された関数を使用して、動きベクトル検索アルゴリズムを適用し得る。例えば、LIC、WP、またはBCWが補正、つまり、動き+(LICまたはWPまたはBCW)の組み合わせの結果を最適化することができないものについて、動き検索を最適化する取組みとして、LIC、WP、またはBCWがアクティブ化されたときに平均除去SAD(MRSAD)などのSADの変更された形式の関数が適用され得る。ただし、MRSADを使用した動き検索の後にSADとともにDMVRを使用することは、非最適であり、場合によっては逆効果でさえあり得る。かかる問題に対処するための1つのアプローチは、これらのツールの組み合わせを防止または禁止することであり得、例えば、LIC、WP、またはBCWがオンであるとき、DMVRは許可されない。しかし、そうすることは、DMVRの利点が提供されないため、望ましくないか、または最適ではない可能性が高い。
概して、本開示の一態様は、LICまたはWPまたはBCWなどの照度補償がアクティブ化される場合、DMVRなどの動きベクトルリファインメントを改善することを伴うことができる。少なくとも1つの実施形態は、DMVR導出プロセスにおいて絶対値和(SAD)を使用する代わりに、LICまたはWPまたはBCWがDMVRと組み合わせてアクティブ化されるときに平均除去絶対値和(MRSAD)を使用することを伴うことができる。DMVR予測が利用可能になると、LICプロセスが計算される。
本開示の態様によれば、概して、少なくとも1つの実施形態は、LICまたはWPまたはBCWがアクティブ化されたときにDMVR導出プロセスにおいてMRSADを使用することを伴うことができる。例えば、双予測プロセスの実施形態が図12に示される。図12では、1210において、プロセスへの入力は、L0参照リストおよびL1参照リストに対する動きベクトルの対である。1220においてDMVRが適用されないと決定された場合、1250において「通常の」双予測プロセスが適用され、その後、LICが有効化またはアクティブ化されている場合、1260においてLICプロセスが適用される。1220においてDMVRが適用されると決定された場合は、1230においてその適用はLIC条件に依存する。LICの代わりに、WP値またはBCW値を条件として使用することもできる。LICが適用されない場合は、1240において、上記のようにDMVRがSADを使用して導出され、その後、1250において、リファインされた動きベクトルを用いて双予測が行われる。1230において決定されたようにLICが適用される場合は、1245においてコスト関数としてMRSADを使用してDMVRが適用され、その後、1250において動き補償が行われる。
図7に示すように、MRSADの適用が生じることがある。すなわち、まず、5つのポイント(中央およびP1~P4)のMRSADが比較される。中央位置のMRSADが最小であれば、DMVRの整数サンプルステージは終了する。そうでなければ、もう1つの位置P5がチェックされる。次いで、最小のMRSADの位置が、2回目の反復検索の中央位置として選択される。2回目の反復検索のプロセスは、最初の反復検索のプロセスと同じである。最初の反復で計算されたMRSADは、2回目の反復で再利用され得、したがって、3つの追加ポイントのMRSADのみがさらに計算される必要がある。前と同様に、整数サンプル検索の後に、MRSAD値のパラメトリック誤差面方程式を使用した分数サンプルリファインメントが続く。
同じサイズの2つのブロック間のMRSADは、最初に2つのブロック間の一定のオフセットを除去してから、これら2つのブロック間の差分を計算する。これは、2つのブロック間の一定の変化が差分に大きな影響を与え得る絶対差分和(SAD)とは異なる。MRSADの目的は、照度変化に対してより堅牢であることである。今回の場合、これは、LICまたはWPまたはBCWプロセスが照度変化を補正するため、この手段を使用することが妥当である。2つのブロックB1とB2との間の平均差分Dは、最初に以下のように計算される。
Figure 2022521893000007

ここで、iはBに属するブロックピクセル座標であり、Nはブロック内のピクセル数である。
次いで、ブロックピクセルの絶対差分から平均差分を引いたものを累積することによって、MRSADが計算される。
Figure 2022521893000008

概して、少なくとも1つの実施形態の実施例は、図13に示された例によって示されるように、DMVRプロセスの前にまたはそれと並行して計算されるLICパラメータを伴うことができる。図13では、1310において2つの動きベクトルの入力を取得した後、LICパラメータが1325、1350、および1360において決定され、DMVRプロセスが1320、1330、1340、1345、1370、および1380に進む。1360において生成されたLICパラメータは1390に提供され、ここで、アクティブ化または有効化された場合にLICが適用される。図13の実施例などの実施形態は、DMVRプロセスと並行してLICパラメータを計算することを可能にする。そうすることは、動作の効率を向上させ、および/または性能を向上させ、コストを低減するなどを行い得る。
概して、少なくとも1つの実施形態の別の実施例は、ブロック平均差分Dが、DMVRプロセスの最初の反復における最初の位置についてのみ計算され、隣接する位置に再利用されることを伴うことができる。そうすることは、各テストされた位置についての平均ブロック差分の計算を回避することを可能にし得、それによって、場合によっては、動作の効率を向上させ、および/または性能を向上させ、コストを低減するなどを可能にし得る。
実施形態の別の実施例が図15に示される。図15の実施例は、上記のようなWPなどのツールを使用したDMVRなどの動きベクトルリファインメントを伴う。図15では、1510において、プロセスへの入力は、L0参照リストおよびL1参照リストに対する動きベクトルの対である。1520において、動きベクトルリファインメント、例えば、DMVRが適用されないと決定された場合(1520において「いいえ」)は、1550において、参照が重み付けされているかどうかに関する判定が行われる。そうである(1550において「はい」)場合、1565において双方向重み付き動き補償が生じ、予測CUが出力される。参照が重み付けされていない(1550において「いいえ」)場合、1560で「通常の」双予測動き補償が適用され、その後、結果として生じる予測CUが出力される。1520において、動きベクトルリファインメント、例えば、DMVRが適用されると決定された(1520において「はい」)場合、1530において、その適用は、参照がWPなどで重み付けされるかどうかに依存する。重み付けされる(1530において「はい」)場合、1545において、上記のようにMRSADを使用することに基づいて動きベクトルのリファインメントが導出され、その後、1550において、上記のように動作が継続する。1530において、参照が重み付けされないと決定された(1530で「いいえ」)場合、1540において、上記のようにSADを使用して動きベクトルリファインメントが導出され、その後、1550において、上記のように動作が継続する。
より一般的には、実施形態の少なくとも1つの他の実施例は、インジケータ、例えば、情報、またはフラグ、またはインデックスに基づいて変更または適合され、ビットストリームで符号化/復号されるか、または推論される(例えば、前の実施形態のように、LICがフラグ上にある場合、真であると推論される)動きベクトルリファインメント、例えば、DMVRプロセスを伴うことができる。かかる実施形態の実施例が図18に示される。図18では、1810において、デコーダ側動きベクトルリファインメントDMVRのアクティブ化の決定が行われる。DMVRプロセスは、上記のようなSADなどのリファインメント関数を含み得る。1810において、DMVRプロセスがアクティブ化されると決定された場合、1820において、インジケータ、例えば、情報、またはフラグ、またはインデックスに基づいてリファインメント関数が変更され得る。例えば、インジケータは、上記のようにLICツールがアクティブ化された場合など、リファインメント関数をSADではなくMRSADに変更することを示し得る。代替的に、インジケータは、LIC、WP、およびBCWなどの1つ以上のツールのうちのどれがDMVRとともにアクティブ化されるかを示すことが可能であり、ここで、ツールの組み合わせは、上記のようにリファインメント関数の変更をもたらし、例えば、リファインメント関数としてSADではなくMRSADを選択する。1820の後に、ピクチャ情報は、変更されたリファインメント関数を含むDMVRプロセスに基づいて符号化/復号される。
図19は、図18に示される実施形態の変形である実施形態の別の実施例を示す。図19では、1910における動作は、DMVRツールによって提供されるようなDMVRプロセスをアクティブ化するかどうかを決定する。DMVRがアクティブ化されない(1910において否定または「いいえ」の結果)場合は、1970において、ビデオまたはピクチャデータの符号化または復号などの処理に続く。1910において肯定の結果(1910において「はい」の結果)である場合は、DMVRプロセスがアクティブ化される。上記のように、DMVRプロセスは、SADなどのリファインメント関数を含み得る。1920において、図18に関して上で説明されたようなインジケータが決定され(ビットストリームから推測または読み出される/エンコーダによって決定される)、ここで、インジケータは、リファインメント関数、例えば、SADが変更または適合されるかどうかを示す。1930において、インジケータ値が検証される。結果が否定の(1930で「いいえ」の結果)場合は、1940において処理が継続し、SADなどのリファインメント関数を含むDMVRプロセスに進む。1930における結果が肯定(例えば、「はい」)の場合は、1950において処理が継続し、ここで、リファインメント関数がインジケータに基づいて変更され、例えば、選択されてMRSADになる。変形例では、インジケータは、対応する複数の関数にマッピングされた複数の値を有する関数インデックスであり得、これらの関数は、選択されて、DMVRプロセスに含まれるリファインメント関数を変更または適合させることができる。図19の実施例では、0に等しいインデックスは、SADのリファインメント関数の選択を示すか、またはそれに対応することができ、一方、1に等しいインデックスは、MRSADのリファインメント関数の選択を示すか、またはそれに対応することができる。インジケータまたはインデックスに基づくリファインメント関数の選択により、リファインメント関数を変更する。次いで、1960において、変更されたリファインメント関数を含むDMVRプロセスが生じる。1970において、ピクチャ情報は、変更されたリファインメント関数を含むDMVRプロセスに基づいて符号化/復号される。
本文献では、実施形態、特徴、モデル、アプローチなどの様々な実施例について説明する。かかる実施例の多くは、具体的に説明され、少なくとも個々の特性を示すために、限定的であると思われる方法で説明されることが多い。しかし、これは説明を明確にするためのものであり、用途または範囲を限定するものではない。実際、本明細書に説明される実施形態、特徴などの様々な実施例は、実施形態のさらなる実施例を提供するために、様々な方法で組み合わされ、交換され得る。
概して、本文献に説明され、企図される実施形態の実施例は、多くの異なる形態で実装することができる。上記の図1および図2、ならびに以下で説明される図14は、いくつかの実施形態を提供するが、他の実施形態が企図され、図1、図2、および図14の考察は、実装形態の幅を制限しない。少なくとも1つの実施形態は、概して、ビデオ符号化および/またはビデオ復号に関連する実施例を提供し、少なくとも1つの他の実施形態は、概して、生成または符号化されたビットストリームまたは信号を送信することに関する。これらおよび他の実施形態は、方法、装置、説明された方法のいずれかに従ってビデオデータを符号化または復号するための命令を記憶するコンピュータ可読記憶媒体、および/または説明された方法のいずれかに従って生成されるビットストリームまたは信号を記憶するコンピュータ可読記憶媒体として実装することができる。
本出願では、「再構築された」および「復号された」という用語は互換的に使用され得、「ピクセル」および「サンプル」という用語は互換的に使用され得、「画像」、「ピクチャ」、および「フレーム」という用語は互換的に使用され得る。必須ではないが、通常は、「再構築された」という用語は、エンコーダ側において使用される一方で「復号された」は、デコーダ側において使用される。
本開示では、HDR(高ダイナミックレンジ)およびSDR(標準ダイナミックレンジ)という用語が使用される。これらの用語は、多くの場合、ダイナミックレンジの特定の値を当業者に伝える。ただし、HDRへの言及が「より高いダイナミックレンジ」を意味すると理解され、SDRへの言及が「より低いダイナミックレンジ」を意味すると理解される追加の実施形態も意図される。かかる追加の実施形態は、「高ダイナミックレンジ」および「標準ダイナミックレンジ」という用語に関連付けられ得ることが多いダイナミックレンジの特定の値によって制約されない。
様々な方法が、本明細書に記載されており、それらの方法のそれぞれは、説明された方法を達成するための1つ以上のステップまたは行為を含む。本方法の正しい動作のために特定の順序のステップまたは行為が必要でない限り、特定のステップおよび/または行為の順序および/または使用は、変更されてもよく、または組み合わせられてもよい。
本文献に説明される様々な方法および他の態様を使用して、図1に示すエンコーダ100の動き補償および/または動き推定モジュール170および175、ならびに図2に示すデコーダ200の動き補償モジュール275など、ビデオエンコーダおよび/またはビデオデコーダのモジュールを変更することができる。さらに、本態様は、VVCまたはHEVCに限定されず、例えば、既存かまたは将来開発されるかどうかに関わらず、他の標準規格および推奨事項、ならびに任意のそのような標準規格および推奨事項(VVCおよびHEVCを含む)の拡張版に適用することができる。特に指示されていない限り、または技術的に除外されていない限り、本文献で説明されている態様は、個別に、または組み合わせて使用できる。
本文献では、例えば、様々な数値が使用される。特定の値は、例示的な目的のためであり、記載された態様は、これらの特定の値に限定されるものではない。
図14は、様々な態様および実施形態を実装することができるシステムの実施例のブロック図を示す。システム1000は、以下で説明される様々な構成要素を含むデバイスとして具現化することができ、本文献で説明される態様の1つ以上を実行するように構成されている。このようなデバイスの例には、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続された家電製品、およびサーバなどの様々な電子デバイスが含まれる。システム1000の要素は、単独でも組み合わせでも、単一の集積回路、複数のIC、および/または個別の構成要素に具現化され得る。例えば、少なくとも1つの実施形態において、システム1000の処理およびエンコーダ/デコーダ要素は、複数のICおよび/または個別の構成要素にわたって分散している。様々な実施形態において、システム1000は、他の同様のシステムに、または他の電子デバイスに、例えば、通信バスを介して、または専用の入力および/もしくは出力ポートを通じて、通信可能に結合される。様々な実施形態において、システム1000は、本文献に記載の態様のうちの1つ以上を実装するように構成される。
システム1000は、例えば、本文献に記載の様々な態様を実装するために、読み込まれた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、当技術分野で周知であるように、埋め込みメモリ、入出力インターフェース、および他の様々な回路を含み得る。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス、および/または不揮発性メモリデバイス)を含む。システム1000は、ストレージデバイス1040を含み、これには、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブが含まれるがこれらに限定されない、不揮発性メモリおよび/または揮発性メモリが含まれ得る。ストレージデバイス1040は、非限定的な例として、内部ストレージデバイス、付属のストレージデバイス、および/またはネットワークアクセス可能なストレージデバイスを含み得る。
システム1000は、例えば、符号化されたビデオまたは復号されたビデオを提供するようにデータを処理するように構成されたエンコーダ/デコーダモジュール1030を含み、エンコーダ/デコーダモジュール1030は、独自のプロセッサおよびメモリを含み得る。エンコーダ/デコーダモジュール1030は、符号化機能および/または復号機能を実行するデバイスに含まれ得るモジュール(複数可)を表す。周知のように、デバイスは、符号化および復号モジュールの一方または両方を含み得る。さらに、エンコーダ/デコーダモジュール1030は、システム1000の別個の要素として実装されてもよく、または、当業者には周知であるように、ハードウェアとソフトウェアとの組み合わせとして、プロセッサ1010内に組み込まれてもよい。
本文献に記載の様々な態様を実行するようにプロセッサ1010またはエンコーダ/デコーダ1030に読み込まれるプログラムコードは、ストレージデバイス1040に格納され、続いて、プロセッサ1010による実行のためにメモリ1020に読み込まれ得る。様々な実施形態によれば、プロセッサ1010、メモリ1020、ストレージデバイス1040、およびエンコーダ/デコーダモジュール1030のうちの1つ以上は、本文献に記載のプロセスの実行中、様々な項目のうちの1つ以上を記憶することができる。かかる記憶される項目は、入力ビデオ、復号されたビデオまたは復号されたビデオの一部、ビットストリームまたは信号、行列、変数、ならびに方程式、式、演算、および演算ロジックの処理からの中間結果または最終結果を含むことができるが、これらに限定されない。
いくつかの実施形態において、プロセッサ1010および/またはエンコーダ/デコーダモジュール1030の内部のメモリを使用して、命令を格納し、符号化または復号中に必要とされる処理のために、ワーキングメモリを提供する。しかしながら、他の実施形態において、処理デバイス(例えば、処理デバイスは、プロセッサ1010またはエンコーダ/デコーダモジュール1030のいずれかであり得る)の外部のメモリは、これらの機能のうちの1つ以上に使用される。外部メモリは、メモリ1020および/またはストレージデバイス1040であり得、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリであり得る。いくつかの実施形態において、テレビのオペレーティングシステムを記憶するのに外部不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態において、RAMなどの高速外部ダイナミック揮発性メモリが、MPEG-2、HEVC、またはVVC(Versatile Video Coding)など、ビデオコード化および復号動作に、ワーキングメモリとして使用される。
システム1000の要素への入力は、ブロック1130に示されるような様々な入力デバイスを通して提供され得る。かかる入力デバイスは、これらに限定されないが、(i)例えば、放送局によって無線を介して送信されたRF信号を受信するRF部、(ii)複合入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子を含む。
様々な実施形態において、ブロック1130の入力デバイスは、当技術分野で周知であるような関連するそれぞれの入力処理要素を有する。例えば、RF部は、(i)所望の周波数を選択する(信号を選択する、またはある周波数帯域に信号を帯域制限する、とも称される)、(ii)選択された信号をダウンコンバートする、(iii)(例えば)ある特定の実施形態ではチャネルと称される場合がある信号周波数帯域を選択するために、より狭い周波数帯域に再び帯域制限する、(iv)ダウンコンバートされ、帯域制限された信号を復調する、(v)誤り訂正を実行する、および(vi)逆多重化して、所望のデータパケットストリームを選択する要素に関連付けられ得る。様々な実施形態のRF部には、これらの機能、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびデマルチプレクサを実行する1つ以上の要素が含まれる。RF部には、例えば、受信された信号をより低い周波数に(例えば、中間周波数またはベースバンドに近い周波数)、またはベースバンドにダウンコンバートすることを含む、様々なこれらの機能を実行するチューナが含まれ得る。1つのセットトップボックスの実施形態において、RF部およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体経由で送信されたRF信号を受信し、フィルタリングし、ダウンコンバートし、所望の周波数帯域に再びフィルタリングすることによって、周波数選択を実行する。様々な実施形態では、上記(および他の)要素の順序が並べ替えられ、これらの要素のうちのいくつかが取り除かれ、かつ/または同様もしくは異なる機能を実行する他の要素が加えられる。要素を加えることには、既存の要素間に要素を挿入すること、例えば、増幅器およびアナログ-デジタル変換器を挿入することが含まれ得る。様々な実施形態において、RF部には、アンテナが含まれる。
また、USBおよび/またはHDMI端子は、USBおよび/またはHDMI接続を介して他の電子デバイスにシステム1000を接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リード・ソロモン誤り訂正が、例えば、別個の入力処理IC内またはプロセッサ1010内で実装され得ることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様が、別個のインターフェースIC内またはプロセッサ1010内で実装され得る。例えば、出力デバイス上での表示のために、データストリームを処理するように、メモリおよびストレージ要素と組み合わされて動作するプロセッサ1010、およびエンコーダ/デコーダ1030を含む、様々な処理要素に、復調され、誤り訂正され、かつ逆多重化されたストリームが提供される。
システム1000の様々な要素は、一体型ハウジング内に提供され得、一体型ハウジング内では、様々な要素は、相互接続されて、好適な接続配置1140、例えば、I2Cバス、配線、およびプリント回路基板を含む、当技術分野で周知であるような内部バスを使用して、それらの間でデータを送信することができる。
システム1000は、通信チャネル1060を介して他のデバイスとの通信を可能にする通信インターフェース1050を含む。通信インターフェース1050には、通信チャネル1060経由でデータを送受信するように構成されたトランシーバが含まれ得るが、これに限定されない。通信インターフェース1050には、モデムまたはネットワークカードが含まれ得るが、これらに限定されるわけではなく、通信チャネル1060は、例えば、有線および/または無線媒体内に実装され得る。
様々な実施形態において、データは、IEEE802.11などのWi-Fiネットワークを使用して、システム1000にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル1060および通信インターフェース1050を介して受信される。これらの実施形態の通信チャネル1060は、通常、アクセスポイントまたはルータに接続され、アクセスポイントまたはルータは、アプリケーションをストリーミングすることおよび他のオーバー・ザ・トップ通信を可能にするインターネットを含む外部ネットワークへのアクセスを提供する。他の実施形態は、入力ブロック1130のHDMI接続経由でデータを配信するセットトップボックスを使用して、ストリーミングされたデータをシステム1000に提供する。さらに他の実施形態は、入力ブロック1130のRF接続を使用して、ストリーミングされたデータをシステム1000に提供する。
システム1000は、ディスプレイ1100、スピーカ1110、および他の周辺デバイス1120を含む、様々な出力デバイスに出力信号を提供することができる。他の周辺デバイス1120には、様々な実施形態の実施例において、スタンドアローンDVR、ディスクプレーヤ、ステレオシステム、照明システム、およびシステム1000の出力に基づき、機能を提供する他のデバイスのうちの1つ以上が含まれる。様々な実施形態において、システム1000と、ディスプレイ1100、スピーカ1110、または他の周辺デバイス1120との間で、AVリンク、CEC、またはユーザの介入の有無に関わらず、デバイス・ツー・デバイス制御を可能にする他の通信プロトコルなどの信号伝達を使用して、制御信号が伝送される。出力デバイスは、それぞれのインターフェース1070、1080、および1090を通して専用接続を介してシステム1000に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース1050を介して、通信チャネル1060を使用してシステム1000に接続され得る。ディスプレイ1100およびスピーカ1110は、電子デバイス、例えば、テレビ内のシステム1000の他の構成要素と共に、単一ユニット内に統合され得る。様々な実施形態において、ディスプレイインターフェース1070には、ディスプレイドライバ、例えば、タイミングコントローラ(T Con)チップが含まれる。
代替的に、ディスプレイ1100およびスピーカ1110は、例えば、入力1130のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上とは別個であってもよい。ディスプレイ1100およびスピーカ1110が外部構成要素である様々な実施形態において、例えば、HDMIポート、USBポート、またはCOMP出力部を含む専用出力接続を介して出力信号が提供され得る。
実施形態は、プロセッサ1010によってもしくはハードウェアによって実装されるコンピュータソフトウェアによって、またはハードウェアとソフトウェアとの組み合わせによって、実行されてもよい。非限定的な例として、実施形態は、1つ以上の集積回路によって実装され得る。メモリ1020は、技術的環境に適切な任意のタイプのものであり得、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、および取り外し可能なメモリなどの任意の適切なデータストレージ技術を使用して実装され得る。プロセッサ1010は、技術的環境に適切な任意のタイプのものであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含し得る。
様々な一般化され、ならびに特定化された実施形態もまた、本開示全体を通して支持され、企図される。本開示による実施形態の実施例は、以下を含むが、これらに限定されない。
概して、実施形態の少なくとも一実施例は、ピクチャ情報を符号化する方法であって、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することとを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャ情報を復号する方法であって、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を復号することとを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャ情報を符号化する装置であって、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することと、を行うように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャ情報を復号する装置であって、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、インジケータに基づいてリファインメント関数を変更することと、デコーダ側動きベクトルリファインメントプロセスおよび変更されたリファインメント関数に基づいてピクチャ情報の少なくとも一部を符号化することと、を行うように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される方法であって、リファインメント関数を変更することが、デコーダ側動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される装置であって、リファインメント関数を変更するように構成された1つ以上のプロセッサが、デコーダ側動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される方法であって、コスト関数を変更することが、デコーダ側動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される装置であって、コスト関数を変更するように構成された1つ以上のプロセッサが、デコーダ側動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される方法であって、リファインメント関数がコスト関数を含み、リファインメント関数を変更することが、絶対差分和(SAD)コスト関数および平均除去絶対差分和(MRSAD)コスト関数を含むグループからコスト関数を選択することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される装置であって、リファインメント関数がコスト関数を含み、リファインメント関数を変更するように構成された1つ以上のプロセッサが、絶対差分和(SAD)コスト関数および平均除去絶対差分和(MRSAD)コスト関数を含むグループからコスト関数を選択するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書に記載の方法または装置であって、インジケータが、デコーダ側動きベクトルリファインメントプロセスのアクティブ化中に、局所照度補償(LIC)プロセス、または重み付き予測プロセス(WP)、またはコード化ユニット(CU)レベル重み付き双予測(BCW)プロセスのうちの少なくとも1つのアクティブ化を示す情報またはインデックスまたはフラグのうちの1つ以上を含む、方法または装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを符号化する方法であって、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを符号化することとを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを復号する方法であって、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを復号することとを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、1つ以上のプロセッサを含むピクチャを符号化する装置であって、1つ以上のプロセッサが、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを符号化することと、を行うように構成されている、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを復号する装置であって、1つ以上のプロセッサを含み、その1つ以上のプロセッサが、動きベクトルリファインメントプロセスおよび動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化および第2のプロセスに基づいて動きベクトルリファインメントプロセスを変更することと、変更された動きベクトルリファインメントプロセスおよび第2のプロセスに基づいてピクチャを復号することと、を行うように構成されている、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される動きベクトルリファインメントプロセスを含む方法または装置であって、動きベクトルリファインメントプロセスが、復号側の動きベクトルリファインメントプロセス(DMVR)を含む、方法または装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される第2のプロセスを含む方法または装置であって、第2のプロセスが、局所照度補償(LIC)プロセス、または重み付き予測プロセス(WP)、またはコード化ユニット(CU)レベル重み付き双予測(BCW)のうちの少なくとも1つを含む、方法または装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される動きベクトルリファインメントプロセスを変更することを含む方法であって、動きベクトルリファインメントプロセスを変更することが、動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される動きベクトルリファインメントプロセスを変更するように構成された1つ以上のプロセッサを含む装置であって、動きベクトルリファインメントプロセスを変更するように構成された1つ以上のプロセッサが、動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含む方法であって、コスト関数を変更することが、動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明される動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサを含む装置であって、コスト関数を変更するように構成された1つ以上のプロセッサが、動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを符号化する方法であって、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを符号化することと含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを復号する方法であって、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを復号することとを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを符号化する装置であって、1つ以上のプロセッサを含み、この1つ以上のプロセッサが、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスおよびLICプロセスに基づいてピクチャを符号化することと、を行うように構成されている、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、ピクチャを復号する装置であって、1つ以上のプロセッサを含み、その1つ以上のプロセッサが、デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、アクティブ化およびLICプロセスに基づいてDMVRプロセスを変更することと、変更されたDMVRプロセスとLICプロセスに基づいてピクチャを復号することと、を行うように構成されている、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明されるDMVRプロセスを変更することを含む方法であって、DMVRプロセスを変更することが、DMVRプロセスに関連付けられたコスト関数を変更することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明されるDMVRプロセスを変更するように構成された1つ以上のプロセッサを含む装置であって、DMVRプロセスを変更するように構成された1つ以上のプロセッサが、動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明されるDMVRプロセスに関連付けられたコスト関数を変更することを含む方法であって、コスト関数を変更することが、DMVR中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、方法を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書で説明されるDMVRプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサを含む装置であって、DMVRプロセスに関連付けられたコスト関数を変更するように構成された1つ以上のプロセッサが、DMVRプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用するように構成された1つ以上のプロセッサを含む、装置を伴うことができる。
概して、実施形態の少なくとも一実施例は、命令を含むコンピュータプログラム製品であって、その命令が、コンピュータによって実行されると、コンピュータに、本明細書で説明される方法のいずれか1つ以上を実行させる、コンピュータプログラム製品を伴うことができる。
概して、実施形態の少なくとも一実施例は、実行可能プログラム命令を記憶する、非一時的なコンピュータ可読媒体を伴うことができ、命令は、命令を実行するコンピュータに本明細書に記載の方法のいずれか1つ以上を実行させるためのものである。
概して、実施形態の少なくとも一実施例は、本明細書に記載の方法のいずれか1つ以上に従って生成されたデータを含む信号を伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書に記載の方法のいずれか1つ以上に従って、構文要素および符号化された画像情報を含むようにフォーマットされた、ビットストリームを伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書に記載の装置の任意の実施形態による装置、および(i)信号を受信するように構成されたアンテナであって、その信号が画像情報を表すデータを含む、アンテナと、(ii)受信信号を、画像情報を表すデータを含む周波数帯域に制限するように構成された帯域リミッタと、(iii)画像情報から画像を表示するように構成されたディスプレイとのうちの少なくとも1つを含む、デバイスを伴うことができる。
概して、実施形態の少なくとも一実施例は、本明細書に記載のデバイスであって、デバイスが、テレビ、テレビ信号受信機、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、携帯電話、タブレット、またはその他の電子デバイスのうちの1つを含む、デバイスを伴うことができる。
この開示を通して、様々な実装形態が復号を伴う。本出願で使用される「復号」は、例えば、受信した符号化されたシーケンスに対して実行されるプロセスのすべてまたは一部を包含して、表示に適した最終出力を生成することができる。様々な実施形態では、そのようなプロセスは、デコーダによって通常実行されるプロセスのうちの1つ以上、例えば、エントロピー復号、逆量子化、逆変換、および差分復号を含む。様々な実施形態では、かかるプロセスはまた、または代替的に、本出願に記載の様々な実装形態のデコーダによって実行されるプロセス、例えば、タイル化された(パックされた)ピクチャからピクチャを抽出することと、使用するアップサンプルフィルタを決定することと、次いでピクチャをアップサンプリングすることと、ピクチャを意図した向きにフリップバックすることと、を含む。
さらなる例として、一実施形態では、「復号」は、エントロピー復号のみを指し、別の実施形態では、「復号」は、差分復号のみを指し、別の実施形態では、「復号」は、エントロピー復号および差分復号の組み合わせを指す。「復号プロセス」という語句が、具体的に動作のサブセットを指すことを意図しているか、または概してより広い復号プロセスを指すことを意図しているかは、特定の説明の文脈に基づいて明確になり、当業者によって十分に理解されると考えられる。
また、様々な実装形態が、符号化を伴う。「復号」に関する上記の考察と同様に、本出願で使用される「符号化」は、符号化されたビットストリームまたは信号を生成するために、例えば、入力ビデオシーケンスに対して実行されるプロセスのすべてまたは一部を包含することができる。様々な実施形態では、そのようなプロセスは、典型的には、エンコーダによって実行される1つ以上のプロセス、例えば、分割、差分符号化、変換、量子化、およびエントロピー符号化を含む。様々な実施形態では、このようなプロセスはまた、または代替的に、本出願に記載の様々な実装形態のエンコーダによって実行されるプロセスを含む。
さらなる例として、一実施形態では、「符号化」は、エントロピー符号化のみを指し、別の実施形態では、「符号化」は、差分符号化のみを指し、別の実施形態では、「符号化」は、差分符号化およびエントロピー符号化の組み合わせを指す。「符号化プロセス」という語句が、具体的に動作のサブセットを指すことを意図しているか、または概してより広い符号化プロセスを指すことを意図しているかは、特定の説明の文脈に基づいて明確になり、当業者によって十分に理解されると考えられる。
本明細書で使用される構文要素は、記述的な用語であることに留意されたい。したがって、それらは、他の構文要素名の使用を排除するものではない。
図がフロー図として提示されている場合、それは、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示されている場合、それは、対応する方法/プロセスのフロー図も提供することを理解されたい。
様々な実施形態は、レート歪み最適化について言及する。特に、符号化プロセスの間、多くの場合に計算の複雑さの制約を考えて、レートと歪みとの間のバランスまたはトレードオフが、通常、考慮される。レート歪みの最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪みの最適化問題を解決するには、様々なアプローチがある。例えば、アプローチは、コード化および復号後の再構築された信号のコード化コストおよび関連する歪みを完全に評価することを含み、すべての考慮されるモードまたはコード化パラメータ値を含むすべての符号化オプションの広範なテストに基づき得る。符号化の複雑さを軽減するために、より高速なアプローチを使用して、特に、再構築された信号ではなく、予測または予測残差信号に基づいて近似歪みを計算することもできる。可能な符号化オプションの一部にのみ近似歪みを使用し、他の符号化オプションに完全な歪みを使用するなどによって、これら2つのアプローチを組み合わせて使用することもできる。他のアプローチでは、可能な符号化オプションのサブセットのみを評価する。より一般的には、多くのアプローチが、最適化を実行するための様々な技術のうちのいずれかを採用するが、最適化は、必ずしもコード化コストおよび関連する歪みの両方の完全な評価ではない。
本明細書で説明された実装形態および態様は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号に実装され得る。単一の実装形態の文脈でのみ考察された(例えば、方法としてのみ考察された)としても、考察された特徴の実装形態はまた、他の形態(例えば、装置またはプログラム)で実装することもできる。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。それらの方法は、例えば、プロセッサ内に実装することができ、このプロセッサは、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む処理デバイス全般を指す。プロセッサは、通信デバイス、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタンス(「PDA」)、およびエンドユーザ間の情報の通信を容易にする他のデバイスなども含む。
「1つの実施形態」もしくは「一実施形態」、または「1つの実装形態」もしくは「一実装形態」、ならびにそれらの他の変形への言及は、実施形態に関連して説明された特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本文献全体にわたって様々な箇所においてみられる、「1つの実施形態では」もしくは「一実施形態では」または「1つの実装形態では」もしくは「一実装形態では」という句、ならびに任意の他の変形の出現は、必ずしもすべてが同じ実施形態を指しているわけではない。
さらに、本明細書は、情報の様々な部分を「取得すること」に言及する場合がある。情報を取得することは、例えば、情報の判断、情報の評価、情報の計算、情報の予測、またはメモリからの情報の検索のうちの1つ以上を含むことができる。
さらに、本文献は、情報の様々な部分に「アクセスすること」に言及する場合がある。情報のアクセスには、例えば、情報の受信、(例えば、メモリからの)情報の検索、情報の記憶、情報の移動、情報のコピー、情報の計算、情報の判断、情報の予測、または情報の評価のうちの1つ以上が含まれ得る。
さらに、本文献は、情報の様々な部分を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報の受信には、例えば、情報へのアクセス、または(例えば、メモリからの)情報の検索のうちの1つ以上が含まれ得る。さらに、「受信する」ことは、典型的には、何らかの方法で、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の消去、情報の計算、情報の判断、情報の予測、または情報の評価などの動作中に含まれる。
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」の場合、次の「/」、「および/または」、ならびに「のうちの少なくとも1つ」のいずれかの使用は、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または双方の選択肢(AおよびB)の選択を網羅することを意図していることが分かるはずである。さらなる例として、「A、B、および/またはC」ならびに「A、B、およびCのうちの少なくとも1つ」の場合、そのような言い回しは、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または3番目に挙げた選択肢(C)のみの選択、または最初および2番目に挙げた選択肢(AおよびB)のみの選択、または最初および3番目に挙げた選択肢(AおよびC)のみの選択、または2番目および3番目に挙げた選択肢(BおよびC)のみの選択、または3つすべての選択肢(AおよびBおよびC)の選択、を網羅することを意図している。これは、当業者にとって明らかなように、挙げられる項目の数だけ拡張され得る。
また、本明細書で使用される場合、「信号伝達する」という単語は、とりわけ、対応するデコーダに何かを指示することを指す。例えば、特定の実施形態では、エンコーダは、リファインメントのための複数のパラメータのうちの特定の1つを信号伝達する。このようにして、実施形態では、同じパラメータが、エンコーダ側およびデコーダ側の両方で使用される。したがって、例えば、エンコーダは、特定のパラメータをデコーダに送信することができ(明示的な信号伝達)、その結果、デコーダは、同じ特定のパラメータを使用することができる。逆に、デコーダが既に特定のパラメータならびに他のパラメータを有する場合、信号伝達は、送信(暗黙的な信号伝達)を行わずに使用されて、デコーダが簡単に特定のパラメータを認識して選択するのを可能にすることができる。任意の実際の機能の送信を回避することによって、ビットの節約が、様々な実施形態で実現される。信号伝達は、様々な方法で達成できることが分かるはずである。例えば、1つ以上の構文要素、フラグなどが、様々な実施形態で、対応するデコーダに情報を信号伝達するために使用される。上記は、「信号伝達する」という単語の動詞形に関するものであるが、「信号伝達」という単語はまた、本明細書では、名詞として使用することもできる。
当業者には明らかであるように、実装形態は、例えば、記憶または送信され得る情報を搬送するようにフォーマットされる様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明される実装形態のうちの1つにより生成されたデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームまたは信号を搬送するようにフォーマットされ得る。このような信号は、例えば、(例えば、スペクトルの無線周波数部分を使用する)、電磁波として、またはベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化することと、搬送波を符号化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログまたはデジタル情報とすることができる。信号は、周知のように、様々な異なる有線または無線リンクを介して送信することができる。信号は、プロセッサ可読媒体上に記憶することができる。
様々な実施形態を説明してきた。実施形態は、様々な異なる請求項のカテゴリおよびタイプにわたって、以下の特徴またはエンティティのいずれかを、単独で、または任意の組み合わせで含むことができる。
・エンコーダおよび/またはデコーダにおいて、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することに基づいて、符号化/復号するピクチャ情報を提供することであって、リファインメント関数がインジケータに基づいて変更される、提供すること。
・エンコーダおよび/またはデコーダにおいて、リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することに基づいて、符号化/復号するピクチャ情報を提供することであって、リファインメント関数がインジケータに基づいて変更され、
〇リファインメント関数が、コスト関数を含むか、または、
〇リファインメント関数を変更することが、デコーダ側動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含むか、または、
〇コスト関数を変更することが、デコーダ側動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含むか、または、
〇リファインメント関数を変更することが、絶対差分和(SAD)コスト関数および平均除去絶対差分和(MRSAD)コスト関数を含むグループからコスト関数を選択することを含むか、または、
〇インジケータが、デコーダ側動きベクトルリファインメントプロセスのアクティブ化中に、局所照度補償(LIC)プロセス、または重み付き予測プロセス(WP)、またはコード化ユニット(CU)レベル重み付き双予測(BCW)プロセスのうちの少なくとも1つのアクティブ化を示す情報またはインデックスまたはフラグのうちの1つ以上を含むか、のうちの1つ以上を含む、提供すること。
・エンコーダおよび/またはデコーダにおいて、照度補償がアクティブ化されたときに、動きベクトルリファインメントを適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、局所照度補償(LIC)がアクティブ化されたときに、デコーダ側動きベクトルリファインメント(DMVR)を適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、照度補償がアクティブ化されたときに、変更されたコスト関数に基づいて動きベクトルリファインメントを適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、重み付き予測(WP)がアクティブ化されたときに、デコーダ側動きベクトルリファインメント(DMVR)を適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、WPがアクティブ化されたときに、変更されたコスト関数に基づいて動きベクトルリファインメントを適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、CUレベル重み付き双予測(BCW)がアクティブ化されたときに、デコーダ側動きベクトルリファインメント(DMVR)を適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、BCWがアクティブ化されたときに、変更されたコスト関数に基づいて動きベクトルリファインメントを適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、局所照度補償(LIC)またはWPまたはBCWがアクティブ化されたときに、変更されたコスト関数に基づいてデコーダ側動きベクトルリファインメント(DMVR)を適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、照度補償(例えば、LICまたはWPまたはBCW)がアクティブ化されたときに、変更された絶対差分和(SAD)コスト関数に基づいて動きベクトルリファインメントを適用することを提供すること。
・エンコーダおよび/またはデコーダにおいて、照度補償がアクティブ化されたときに、変更された絶対差分和(SAD)コスト関数に基づいて動きベクトルリファインメントを適用することを提供することであって、動きベクトルリファインメントがデコーダ側動きベクトルリファインメント(DMVR)を含み、変更された絶対差分和コスト関数が平均除去SAD(MRSAD)を含み、照度補償が局所照度補償(LIC)またはWPまたはBCWを含む、提供すること。
・エンコーダおよび/またはデコーダにおいて、局所照度補償(LIC)がアクティブ化されたときに、デコーダ側動きベクトルリファインメント(DMVR)を適用することを提供することであって、DMVR予測が利用可能になるとLICプロセスが計算される、提供すること。
・エンコーダおよび/またはデコーダにおいて、局所照度補償(LIC)またはWPまたはBCWがアクティブ化されているかどうかに基づいて、デコーダ側動きベクトルリファインメント(DMVR)を適用することを提供することであって、LICまたはWPまたはBCWがアクティブ化されたときに、適用されるDMVRが変更されたコスト関数を適用することを含む、提供すること。
・エンコーダおよび/またはデコーダにおいて、局所照度補償(LIC)またはWPまたはBCWがアクティブ化されているかどうかに基づいてデコーダ側動きベクトルリファインメント(DMVR)を適用することを提供することであって、LICまたはWPまたはBCWがアクティブ化され、変更されたコスト関数が平均除去絶対差分和コスト関数を含むときに、適用されるDMVRが変更されたコスト関数を適用することを含む、提供すること。
・エンコーダおよび/またはデコーダにおいて、CU、スライス、SPS、PPSレベルでビットストリーム内にコード化されたフラグ/インデックスの値に基づいてデコーダ側動きベクトルリファインメント(DMVR)を適用することを提供することであって、適用されるDMVRがコード化された情報の値に応じて変更されたコスト関数を適用することを含み、変更されたコスト関数が平均除去絶対差分和コスト関数を含む、提供すること。
・エンコーダおよび/またはデコーダにおいて、改善された圧縮効率を提供することに基づいて照度補償がアクティブ化されたときに、動きベクトルリファインメントを適用することを提供すること。
・本明細書に記載されるように、照度補償がアクティブ化されたときに、エンコーダおよび/またはデコーダが動きベクトルリファインメントを適用することを提供することを可能にする構文要素を信号伝達に挿入すること。
・これらの構文要素に基づいて、デコーダにおいて適用する動きベクトルリファインメントと照度補償との組み合わせを選択すること。
・記載された構文要素、またはその変形のうちの1つ以上を含むビットストリームまたは信号。
・デコーダが、動きベクトルリファインメントおよび照度補償を、エンコーダで使用される方法に対応する方法で提供することを可能にする構文要素を信号伝達に挿入すること。
・記載された構文要素、またはその変形のうちの1つ以上を含むビットストリームまたは信号を、作成および/または送信および/または受信および/または復号すること。
・説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を適用することを提供する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を実行し、結果として得られた画像を(例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して)表示する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・符号化された画像を含む信号を受信するためにチャネルを(例えば、チューナを使用して)同調させ、説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を実行する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・符号化された画像を含む信号を無線で(例えば、アンテナを使用して)受信し、説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を実行する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・コンピュータによって実行されたときに、説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を履行するプログラムコードを記憶する、コンピュータプログラム製品。
・命令を実行するコンピュータに、説明される実施形態のいずれかに従って動きベクトルリファインメントおよび照度補償を履行させる実行可能プログラム命令を含む、非一時的コンピュータ可読媒体。
様々な他の一般化、および特定化された実施形態もまた、本開示全体を通して支持され、企図される。

Claims (35)

  1. ピクチャ情報を符号化する方法であって、
    リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、
    インジケータに基づいて前記リファインメント関数を変更することと、
    前記デコーダ側動きベクトルリファインメントプロセスおよび前記変更されたリファインメント関数に基づいて、前記ピクチャ情報の少なくとも一部を符号化することと、を含む方法。
  2. ピクチャ情報を復号する方法であって、
    リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、
    インジケータに基づいて前記リファインメント関数を変更することと、
    前記デコーダ側動きベクトルリファインメントプロセスおよび前記変更されたリファインメント関数に基づいて、前記ピクチャ情報の少なくとも一部を復号することと、を含む方法。
  3. ピクチャ情報を符号化する装置であって、
    1つ以上のプロセッサを含み、前記1つ以上のプロセッサは、
    リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、
    インジケータに基づいて前記リファインメント関数を変更することと、
    前記デコーダ側動きベクトルリファインメントプロセスおよび前記変更されたリファインメント関数に基づいて、前記ピクチャ情報の少なくとも一部を符号化することと、を行うように構成されている、装置。
  4. ピクチャ情報を復号する装置であって、
    1つ以上のプロセッサを含み、前記1つ以上のプロセッサは、
    リファインメント関数を含むデコーダ側動きベクトルリファインメントプロセスのアクティブ化を決定することと、
    インジケータに基づいて前記リファインメント関数を変更することと、
    前記デコーダ側動きベクトルリファインメントプロセスおよび前記変更されたリファインメント関数に基づいて、前記ピクチャ情報の少なくとも一部を符号化することと、を行うように構成されている、装置。
  5. 前記リファインメント関数を変更することが、前記デコーダ側動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含む、請求項1または2に記載の方法。
  6. 前記リファインメント関数を変更するように構成された前記1つ以上のプロセッサが、前記デコーダ側動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された前記1つ以上のプロセッサを含む、請求項3または4に記載の装置。
  7. 前記コスト関数を変更することが、前記デコーダ側動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、請求項5に記載の方法。
  8. 前記コスト関数を変更するように構成された前記1つ以上のプロセッサが、前記デコーダ側動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用するように構成された前記1つ以上のプロセッサを含む、請求項6に記載の装置。
  9. 前記リファインメント関数がコスト関数を含み、
    前記リファインメント関数を変更することが、絶対差分和(SAD)コスト関数および平均除去絶対差分和(MRSAD)コスト関数を含むグループから前記コスト関数を選択することを含む、請求項1、2、または5のいずれか一項に記載の方法。
  10. 前記リファインメント関数がコスト関数を含み、
    前記リファインメント関数を変更するように構成された前記1つ以上のプロセッサが、絶対差分和(SAD)コスト関数および平均除去絶対差分和(MRSAD)コスト関数を含むグループから前記コスト関数を選択するように構成された前記1つ以上のプロセッサを含む、請求項3、4、または6のいずれか一項に記載の装置。
  11. 前記インジケータが、前記デコーダ側動きベクトルリファインメントプロセスのアクティブ化中の、局所照度補償(LIC)プロセス、または重み付き予測プロセス(WP)、またはコード化ユニット(CU)レベル重み付き双予測(BCW)プロセスのうちの少なくとも1つのアクティブ化を示す、情報、またはインデックス、またはフラグのうちの1つ以上を含む、請求項1~10のいずれか一項に記載の方法または装置。
  12. ピクチャを符号化する方法であって、
    動きベクトルリファインメントプロセスおよび前記動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記動きベクトルリファインメントプロセスを変更することと、
    前記変更された動きベクトルリファインメントプロセスに基づいて前記ピクチャを符号化することと、を含む方法。
  13. ピクチャを復号する方法であって、
    動きベクトルリファインメントプロセスおよび前記動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記動きベクトルリファインメントプロセスを変更することと、
    前記変更された動きベクトルリファインメントプロセスに基づいて前記ピクチャを復号することと、を含む方法。
  14. ピクチャを符号化する装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、
    動きベクトルリファインメントプロセスおよび前記動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記動きベクトルリファインメントプロセスを変更することと、
    前記変更された動きベクトルリファインメントプロセスに基づいて前記ピクチャを符号化することと、を行うように構成されている、装置。
  15. ピクチャを復号する装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、
    動きベクトルリファインメントプロセスおよび前記動きベクトルリファインメントプロセス以外の第2のプロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記動きベクトルリファインメントプロセスを変更することと、
    前記変更された動きベクトルリファインメントプロセスに基づいて前記ピクチャを復号することと、を行うように構成されている、装置。
  16. 前記動きベクトルリファインメントプロセスが、復号側動きベクトルリファインメントプロセス(DMVR)を含む、請求項12もしくは3に記載の方法または請求項14もしくは15に記載の装置。
  17. 前記第2のプロセスが、局所照度補償(LIC)プロセス、または重み付き予測プロセス(WP)、またはコード化ユニット(CU)レベル重み付き双予測(BCW)プロセスのうちの少なくとも1つを含む、請求項12~16のいずれか一項に記載の方法または装置。
  18. 前記動きベクトルリファインメントプロセスを変更することが、前記動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更することを含む、請求項12、13、16または17のいずれか一項に記載の方法。
  19. 前記動きベクトルリファインメントプロセスを変更するように構成された前記1つ以上のプロセッサが、前記動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された前記1つ以上のプロセッサを含む、請求項14~17のいずれか一項に記載の装置。
  20. 前記コスト関数を変更することが、前記動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、請求項18に記載の方法。
  21. 前記動きベクトルリファインメントプロセスに関連付けられた前記コスト関数を変更するように構成された前記1つ以上のプロセッサが、前記動きベクトルリファインメントプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用するように構成された前記1つ以上のプロセッサを含む、請求項19に記載の装置。
  22. ピクチャを符号化する方法であって、
    デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記DMVRプロセスを変更することと、
    前記変更されたDMVRプロセスに基づいて前記ピクチャを符号化することと、を含む方法。
  23. ピクチャを復号する方法であって、
    デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化に基づいて前記DMVRプロセスを変更することと、
    前記変更されたDMVRプロセスに基づいて前記ピクチャを復号することと、を含む方法。
  24. ピクチャを符号化する装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、
    デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化および前記LICプロセスに基づいて前記DMVRプロセスを変更することと、
    前記変更されたDMVRプロセスおよび前記LICプロセスに基づいて前記ピクチャを符号化することと、を行うように構成されている、装置。
  25. ピクチャを復号する装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、
    デコーダ側動きベクトルリファインメント(DMVR)プロセスおよび局所照度補償(LIC)プロセスを伴う処理モードのアクティブ化を決定することと、
    前記アクティブ化および前記LICプロセスに基づいて前記DMVRプロセスを変更することと、
    前記変更されたDMVRプロセスおよび前記LICプロセスに基づいて前記ピクチャを復号することと、を行うように構成されている、装置。
  26. 前記DMVRプロセスを変更することが、前記DMVRプロセスに関連付けられたコスト関数を変更することを含む、請求項22または23に記載の方法。
  27. 前記DMVRプロセスを変更するように構成された前記1つ以上のプロセッサが、前記動きベクトルリファインメントプロセスに関連付けられたコスト関数を変更するように構成された前記1つ以上のプロセッサを含む、請求項24または25に記載の装置。
  28. 前記コスト関数を変更することが、前記DMVRプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用することを含む、請求項26に記載の方法。
  29. 前記DMVRプロセスに関連付けられた前記コスト関数を変更するように構成された前記1つ以上のプロセッサが、前記DMVRプロセス中に平均除去絶対差分和(MRSAD)コスト関数を使用するように構成された前記1つ以上のプロセッサを含む、請求項27に記載の装置。
  30. コンピュータによって実行されると、前記コンピュータに請求項1、2、5~7、9、11、12、15または17のいずれか一項に記載の方法を実行させる命令を含むコンピュータプログラム製品。
  31. 実行可能プログラム命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、前記命令を実行するコンピュータに、請求項1、2、5~7、9、11、12、15または17のいずれか一項に記載の方法を実行させるためのものである、非一時的コンピュータ可読媒体。
  32. 請求項1、5~7、9、11、15または17のいずれか一項に記載の方法に従って生成されたデータを含む信号。
  33. 請求項1、5~7、9、11、15または17のいずれか一項に記載の方法に従って、構文要素および符号化された画像情報を含むようにフォーマットされたビットストリーム。
  34. デバイスであって、
    請求項3~6、8、10、13、14、16、18のいずれか一項に記載の装置と、
    (i)信号を受信するように構成されたアンテナであって、前記信号が画像情報を表すデータを含む、アンテナ、(ii)前記受信した信号を、前記画像情報を表す前記データを含む周波数帯域に制限するように構成された帯域リミッタ、および(iii)前記画像情報からの画像を表示するように構成されたディスプレイのうちの少なくとも1つと、を含むデバイス。
  35. 前記デバイスが、テレビ、テレビ信号受信機、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、携帯電話、タブレット、または他の電子デバイスのうちの1つを含む、請求項23に記載のデバイス。
JP2021547331A 2019-03-08 2020-03-06 ビデオの符号化および復号における動きベクトルの導出 Pending JP2022521893A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305272 2019-03-08
EP19305272.7 2019-03-08
PCT/IB2020/000290 WO2020183243A1 (en) 2019-03-08 2020-03-06 Motion vector derivation in video encoding and decoding

Publications (2)

Publication Number Publication Date
JP2022521893A true JP2022521893A (ja) 2022-04-13
JPWO2020183243A5 JPWO2020183243A5 (ja) 2023-03-10

Family

ID=67437147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021547331A Pending JP2022521893A (ja) 2019-03-08 2020-03-06 ビデオの符号化および復号における動きベクトルの導出

Country Status (6)

Country Link
US (2) US11930184B2 (ja)
EP (1) EP3935852A1 (ja)
JP (1) JP2022521893A (ja)
CN (1) CN113615196A (ja)
MX (1) MX2021010779A (ja)
WO (1) WO2020183243A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11985324B2 (en) * 2019-03-14 2024-05-14 Hfi Innovation Inc. Methods and apparatuses of video processing with motion refinement and sub-partition base padding
US11438623B2 (en) * 2019-07-08 2022-09-06 Hyundai Motor Company Method and device for encoding and decoding video using inter-prediction
WO2021249949A1 (en) * 2020-06-09 2021-12-16 Interdigital Vc Holdings France, Sas Local light field flow as an alternative to plane-sweep volumes
US20240007615A1 (en) * 2022-07-04 2024-01-04 Alibaba (China) Co., Ltd. Deriving bi-prediction with coding unit-level weight indices for merge candidates

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10333547B2 (en) * 2012-08-13 2019-06-25 Gurologic Microsystems Oy Encoder and method for encoding input data using a plurality of different transformations or combinations of transformations
MX2018002477A (es) * 2015-09-02 2018-06-15 Mediatek Inc Metodo y aparato de derivacion de movimiento de lado de decodificador para codificacion de video.
EP3264769A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing Method and apparatus for video coding with automatic motion information refinement
CN110140355B (zh) 2016-12-27 2022-03-08 联发科技股份有限公司 用于视频编解码的双向模板运动向量微调的方法及装置
US10701366B2 (en) * 2017-02-21 2020-06-30 Qualcomm Incorporated Deriving motion vector information at a video decoder
US10477237B2 (en) 2017-06-28 2019-11-12 Futurewei Technologies, Inc. Decoder side motion vector refinement in video coding
WO2020084475A1 (en) * 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Utilization of refined motion vector
CN112868240B (zh) * 2018-10-23 2023-06-30 北京字节跳动网络技术有限公司 并置的局部照明补偿和修改的帧间预测编解码

Also Published As

Publication number Publication date
US20220116621A1 (en) 2022-04-14
EP3935852A1 (en) 2022-01-12
MX2021010779A (es) 2021-09-30
CN113615196A (zh) 2021-11-05
WO2020183243A1 (en) 2020-09-17
US11930184B2 (en) 2024-03-12
US20240171750A1 (en) 2024-05-23

Similar Documents

Publication Publication Date Title
US20210377553A1 (en) Virtual pipeline for video encoding and decoding
JP2022521893A (ja) ビデオの符号化および復号における動きベクトルの導出
US20220060688A1 (en) Syntax for motion information signaling in video coding
WO2020060808A1 (en) Local illumination compensation for video encoding and decoding using stored parameters
US20210400276A1 (en) Quantization for video encoding and decoding
EP3878178A1 (en) Video encoding or decoding using block extension for overlapped block motion compensation
CN112753222A (zh) 视频编码和解码中的运动矢量预测
CN114270844A (zh) 用于视频编码和解码的运动向量处理
JP7506063B2 (ja) ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ
EP3706423A1 (en) Local illumination compensation for video encoding or decoding
US20220345693A1 (en) Coding mode information propagation for video coding
US20230018401A1 (en) Motion vector prediction in video encoding and decoding
US20230024223A1 (en) Intra sub partitions for video encoding and decoding combined with multiple transform selection, matrix weighted intra prediction or multi-reference-line intra prediction
KR20220052991A (ko) 스위칭가능한 보간 필터들

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230302

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230302

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20231110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20231110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240418

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240701