JP2022521542A - Dmvr基盤のインター予測方法及び装置 - Google Patents

Dmvr基盤のインター予測方法及び装置 Download PDF

Info

Publication number
JP2022521542A
JP2022521542A JP2021549543A JP2021549543A JP2022521542A JP 2022521542 A JP2022521542 A JP 2022521542A JP 2021549543 A JP2021549543 A JP 2021549543A JP 2021549543 A JP2021549543 A JP 2021549543A JP 2022521542 A JP2022521542 A JP 2022521542A
Authority
JP
Japan
Prior art keywords
prediction
current block
motion vector
dmvr
satisfied
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021549543A
Other languages
English (en)
Other versions
JP7425079B2 (ja
Inventor
ネリ パク
チョンハク ナム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2022521542A publication Critical patent/JP2022521542A/ja
Priority to JP2023167521A priority Critical patent/JP2023165935A/ja
Application granted granted Critical
Publication of JP7425079B2 publication Critical patent/JP7425079B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像コーディング効率を上げる方法及び装置を提供する。【解決手段】現在ブロックに対して動きベクトルリファインメントを適用するためのDMVRの適用条件を満たすかどうかを判断するステップ、DMVRの適用条件を満たす場合、現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SADを導出するステップ、最小SADに基づいて現在ブロックに対するリファインされたL0動きベクトル及びL1動きベクトルを導出するステップ、リファインされたL0動きベクトル及びリファインされたL1動きベクトルに基づいて現在ブロックに対する予測サンプルを導出するステップ、予測サンプルに基づいて現在ブロックに対する復元サンプルを生成するステップを含み、DMVRの適用条件を満たすかどうかは、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、DMVRの適用条件を満たすと判断される。【選択図】図10

Description

本文書は、映像コーディング技術に関し、より詳しくは、DMVR(Decoder-side Motion Vector Refinement)に基づいてインター予測を実行する方法及び装置に関する。
最近、4Kまたは8K以上のUHD(Ultra High Definition)映像/ビデオのような高解像度、高品質の映像/ビデオに対する需要が多様な分野で増加している。映像/ビデオデータが高解像度、高品質になるほど、既存の映像/ビデオデータに比べて相対的に送信される情報量またはビット量が増加するため、既存の有無線広帯域回線のような媒体を利用して映像データを送信し、または既存の格納媒体を利用して映像/ビデオデータを格納する場合、送信費用と格納費用が増加される。
また、最近、VR(Virtual Reality)、AR(Artificial Realtiy)コンテンツやホログラムなどの実感メディア(Immersive Media)に対する関心及び需要が増加しており、ゲーム映像のように、現実映像と異なる映像特性を有する映像/ビデオに対する放送が増加している。
これにより、前記のような多様な特性を有する高解像度、高品質の映像/ビデオの情報を効果的に圧縮して送信または格納し、再生するために、高効率の映像/ビデオ圧縮技術が要求される。
本文書の技術的課題は、映像コーディング効率を上げる方法及び装置を提供することにある。
本文書の他の技術的課題は、効率的なインター予測方法及び装置を提供することにある。
本文書の他の技術的課題は、DMVR(Decoder-side Motion Vector Refinement)に基づいてインター予測を実行する方法及び装置を提供することにある。
本文書の他の技術的課題は、BDOF(Bi-directional optical flow)に基づいてインター予測を実行する方法及び装置を提供することにある。
本文書の他の技術的課題は、映像コーディング効率を向上させるためのDMVRの適用可否を決定するための条件及び/またはBDOFの適用可否を決定するための条件を提供することによって予測性能を向上させる方法及び装置を提供することにある。
本文書の一実施例によると、デコーディング装置により実行される映像デコーディング方法が提供される。前記方法は、現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVR(Decoder-side Motion Vector Refinement)の適用条件を満たすかどうかを判断するステップ、前記DMVRの適用条件を満たす場合、前記現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出するステップ、前記最小SADに基づいて前記現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出するステップ、前記リファインされたL0動きベクトル及び前記リファインされたL1動きベクトルに基づいて前記現在ブロックに対する予測サンプルを導出するステップ、及び前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成するステップを含み、前記DMVRの適用条件を満たすかどうかは、前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、前記DMVRの適用条件を満たすと判断されることを特徴とする。
本文書の他の一実施例によると、エンコーディング装置により実行される映像エンコーディング方法が提供される。前記方法は、現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVR(Decoder-side Motion Vector Refinement)の適用条件を満たすかどうかを判断するステップ、前記DMVRの適用条件を満たす場合、前記現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出するステップ、前記最小SADに基づいて前記現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出するステップ、前記リファインされたL0動きベクトル及び前記リファインされたL1動きベクトルに基づいて前記現在ブロックに対する予測サンプルを導出するステップ、前記予測サンプルに基づいてレジデュアルサンプルを導出するステップ、及び前記レジデュアルサンプルに関する情報を含む映像情報をエンコーディングするステップを含み、前記DMVRの適用条件を満たすかどうかは、前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、前記DMVRの適用条件を満たすと判断されることを特徴とする。
本文書によると、全般的な映像/ビデオ圧縮効率を上げることができる。
本文書によると、効率的なインター予測を介して計算複雑度を減らすことができ、全般的なコーディング効率を向上させることができる。
本文書によると、動き補償過程で動き情報をリファインメントするDMVR及び/またはBDOFを適用するにあたって、多様な適用条件を提案することによって、複雑度及び性能面での効率性を向上させることができる。
本文書の実施例に適用されることができるビデオ/映像コーディングシステムの例を概略的に示す。 本文書の実施例に適用されることができるビデオ/映像エンコーディング装置の構成を概略的に説明する図である。 本文書の実施例に適用されることができるビデオ/映像デコーディング装置の構成を概略的に説明する図である。 true双予測でDMVR(Decoder-side Motion Vector Refinement)を実行する過程の一実施例を説明するための図である。 SAD(sum of absolute differences)を使用してDMVR(Decoder-side Motion Vector Refinement)を実行する過程の一実施例を説明するための図である。 DMVR及びBDOFの適用条件をチェックしてデコーディング過程を実行する方法を示す一例である。 DMVR及びBDOFの適用条件をチェックしてデコーディング過程を実行する方法を示す他の例である。 DMVR及びBDOFの適用条件をチェックしてデコーディング過程を実行する方法を示す他の例である。 本文書の一実施例によるエンコーディング装置により実行されることができるエンコーディング方法を概略的に示す流れ図である。 文書の一実施例によってデコーディング装置により実行されることができるデコーディング方法を概略的に示す流れ図である。 本文書で開示された実施例が適用されることができるコンテンツストリーミングシステムの例を示す。
本文書は、多様な変更を加えることができ、種々な実施例を有することができ、特定実施例を図面に例示し、詳細に説明しようとする。しかしながら、これは、本文書を特定実施例に限定しようとするものではない。本明細書で常用する用語は、単に特定の実施例を説明するために使用されたものであって、本文書の技術的思想を限定しようとする意図で使用されるものではない。単数の表現は、文脈上明白に異なるように意味しない限り、複数の表現を含む。本明細書において「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定しようとするものであり、一つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加可能性を予め排除しないことと理解されるべきである。
一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の都合上、独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されるということを意味するものではない。例えば、各構成のうち、二つ以上の構成が結合されて一つの構成をなすこともでき、一つの構成を複数の構成に分けることもできる。各構成が統合及び/または分離された実施例も本文書の本質から外れない限り、本文書の権利範囲に含まれる。
以下、添付図面を参照して、本文書の好ましい実施例をより詳細に説明する。以下、図面上の同じ構成要素に対しては、同じ参照符号を使用し、同じ構成要素に対して重複した説明は省略されることができる。
この文書は、ビデオ/映像コーディングに関する。例えば、この文書に開示された方法/実施例は、VVC(versatile video coding)標準、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)、または、次世代ビデオ/映像コーディング標準(例えば、H.267またはH.268等)に開示される方法に適用されることができる。
この文書では、ビデオ/映像コーディングに関する多様な実施例を提示し、他の言及がない限り、前記実施例は、互いに組み合わせられて実行されることもできる。
この文書において、ビデオ(video)は、時間の流れによる一連の映像(image)の集合を意味することができる。ピクチャ(picture)は、一般的に特定時間帯の一つの映像を示す単位を意味し、スライス(slice)/タイル(tile)は、コーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、一つ以上のCTU(coding tree unit)を含むことができる。一つのピクチャは、一つ以上のスライス/タイルで構成されることができる。一つのピクチャは、一つ以上のタイルグループで構成されることができる。一つのタイルグループは、一つ以上のタイルを含むことができる。ブリックは、ピクチャ内のタイル以内のCTU行の四角領域を示すことができる(a brick may represent a rectangular region of CTU rows within a tile in a picture)。タイルは、複数のブリックにパーティショニングされることができ、各ブリックは、前記タイル内の一つ以上のCTU行で構成されることができる(A tile may be partitioned into multiple bricks,each of which consisting of one or more CTU rows within the tile)。また、複数のブリックにパーティショニングされないタイルはブリックと呼ばれることもできる(A tile that is not partitioned into multiple bricks may be also referred to as a brick)。ブリックスキャンは、ピクチャをパーティショニングするCTUの特定の順次的オーダリングを示すことができ、前記CTUは、ブリック内でCTUラスタースキャンで整列されることができ、タイル内のブリックは、前記タイルの前記ブリックのラスタースキャンで連続的に整列されることができ、そして、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタースキャンで連続的に整列されることができる(A brick scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a brick, bricks within a tile are ordered consecutively in a raster scan of the bricks of the tile, and tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。タイルは、特定タイル列及び特定タイル列以内のCTUの四角領域である(A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture)。前記タイル列は、CTUの四角領域であり、前記四角領域は、前記ピクチャの高さと同じ高さを有し、幅は、ピクチャパラメータセット内のシンタックス要素により明示されることができる(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set)。前記タイル行は、CTUの四角領域であり、前記四角領域は、ピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは、前記ピクチャの高さと同じである(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture)。タイルスキャンは、ピクチャをパーティショニングするCTUの特定の順次的オーダリングを示すことができ、前記CTUは、タイル内のCTUラスタースキャンで連続的に整列されることができ、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタースキャンで連続的に整列されることができる(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。スライスは、ピクチャの整数個のブリックを含むことができ、前記整数個のブリックは、一つのNALユニットに含まれることができる(A slice includes an integer number of bricks of a picture that may be exclusively contained in a single NAL unit)。スライスは、複数の完全なタイルで構成されることができ、または、一つのタイルの完全なブリックの連続的なシーケンスである(A slice may consists of either a number of complete tiles or only a consecutive sequence of complete bricks of one tile)。この文書において、タイルグループとスライスとは混用されることができる。例えば、本文書において、tile group/tile group headerは、slice/slice headerと呼ばれることができる。
ピクセル(pixel)またはペル(pel)は、一つのピクチャ(または、映像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用されることができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。または、サンプルは、空間ドメインでのピクセル値を意味することもでき、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもできる。
ユニット(unit)は、映像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関連した情報のうち少なくとも一つを含むことができる。一つのユニットは、一つのルマブロック及び二つのクロマ(例えば、cb、cr)ブロックを含むことができる。ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(または、サンプルアレイ)、または変換係数(transform coefficient)の集合(または、アレイ)を含むことができる。
この文書において「/」と「、」とは、「及び/または」と解釈される。例えば、「A/B」は、「A及び/またはB」と解釈され、「A、B」は、「A及び/またはB」と解釈される。追加的に、「A/B/C」は、「A、B及び/またはCのうち少なくとも一つ」を意味する。また、「A、B、C」も「A、B及び/またはCのうち少なくとも一つ」を意味する。(In this document,the term “/”and “,”should be interpreted to indicate “and/or.”For instance,the expression “A/B” may mean “A and/or B.”Further,“A,B” may mean “A and/or B.”Further,“A/B/C” may mean “at least one of A,B,and/or C.”Also,“A/B/C” may mean “at least one of A,B,and/or C.”)
追加的に、本文書において「または」は、「及び/または」と解釈される。例えば、「AまたはB」は、1)「A」のみを意味し、または2)「B」のみを意味し、または3)「A及びB」を意味することができる。その他の表現として、本文書の「または」は、「追加的にまたは代替的に(additionally or alternatively)」を意味することができる。(Further,in the document,the term “or” should be interpreted to indicate “and/or.”For instance,the expression “A or B” may comprise 1)only A,2)only B,and/or 3)both A and B.In other words,the term “or” in this document should be interpreted to indicate “additionally or alternatively.”)
図1は、本文書の実施例に適用されることができるビデオ/映像コーディングシステムの例を概略的に示す。
図1を参照すると、ビデオ/映像コーディングシステムは、第1の装置(ソースデバイス)及び第2の装置(受信デバイス)を含むことができる。ソースデバイスは、エンコーディングされたビデオ(video)/映像(image)情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達できる。
前記ソースデバイスは、ビデオソース、エンコーディング装置、送信部を含むことができる。前記受信デバイスは、受信部、デコーディング装置、及びレンダラを含むことができる。前記エンコーディング装置は、ビデオ/映像エンコーディング装置と呼ばれることができ、前記デコーディング装置は、ビデオ/映像デコーディング装置と呼ばれることができる。送信機は、エンコーディング装置に含まれることができる。受信機は、デコーディング装置に含まれることができる。レンダラは、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。
ビデオソースは、ビデオ/映像のキャプチャ、合成または生成過程などを介してビデオ/映像を取得することができる。ビデオソースは、ビデオ/映像キャプチャデバイス及び/またはビデオ/映像生成デバイスを含むことができる。ビデオ/映像キャプチャデバイスは、例えば、一つ以上のカメラ、以前にキャプチャされたビデオ/映像を含むビデオ/映像アーカイブなどを含むことができる。ビデオ/映像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、(電子的に)ビデオ/映像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ/映像が生成されることができ、この場合、関連データが生成される過程にビデオ/映像キャプチャ過程が代替されることができる。
エンコーディング装置は、入力ビデオ/映像をエンコーディングすることができる。エンコーディング装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を実行することができる。エンコーディングされたデータ(エンコーディングされたビデオ/映像情報)は、ビットストリーム(bitstream)形態で出力されることができる。
送信部は、ビットストリーム形態で出力されたエンコーディングされたビデオ/映像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達できる。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。送信部は、あらかじめ決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介した送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信/抽出してデコーディング装置に伝達できる。
デコーディング装置は、エンコーディング装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を実行してビデオ/映像をデコーディングすることができる。
レンダラは、デコーディングされたビデオ/映像をレンダリングすることができる。レンダリングされたビデオ/映像は、ディスプレイ部を介してディスプレイされることができる。
図2は、本文書の実施例に適用されることができるビデオ/映像エンコーディング装置の構成を概略的に説明する図である。以下、ビデオエンコーディング装置とは、映像エンコーディング装置を含むことができる。
図2を参照すると、エンコーディング装置200は、映像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコーディング部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260、及びメモリ(memory)270を含んで構成されることができる。予測部220は、インター予測部221及びイントラ予測部222を含むことができる。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を含むことができる。レジデュアル処理部230は、減算部(subtractor)231をさらに含むことができる。加算部250は、復元部(reconstructor)または復元ブロック生成部(recontructged block generator)と呼ばれることができる。前述した映像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコーディング部240、加算部250、及びフィルタリング部260は、実施例によって一つ以上のハードウェアコンポーネント(例えば、エンコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ270は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ270を内/外部コンポーネントとしてさらに含むこともできる。
映像分割部210は、エンコーディング装置200に入力された入力映像(または、ピクチャ、フレーム)を一つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)または最大コーディングユニット(largest coding unit、LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造によって再帰的に(recursively)分割されることができる。例えば、一つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/またはターナリ構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/またはターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本文書によるコーディング手順が実行されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)をさらに含むことができる。この場合、前記予測ユニット及び前記変換ユニットは、各々前述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であり、前記変換ユニットは、変換係数を誘導する単位及び/または変換係数からレジデュアル信号(residual signal)を誘導する単位である。
ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプルまたは変換係数(transform coefficient)の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すこともでき、輝度(luma)成分のピクセル/ピクセル値のみを示すこともでき、彩度(chroma)成分のピクセル/ピクセル値のみを示すこともできる。サンプルは、一つのピクチャ(または、映像)をピクセル(pixel)またはペル(pel)に対応する用語として使用することができる。
エンコーディング装置200は、入力映像信号(原本ブロック、原本サンプルアレイ)からインター予測部221またはイントラ予測部222から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算してレジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができ、生成されたレジデュアル信号は、変換部232に送信される。この場合、図示されたように、エンコーダ200内において入力映像信号(原本ブロック、原本サンプルアレイ)から予測信号(予測ブロック、予測サンプルアレイ)を減算するユニットは、減算部231と呼ばれることができる。予測部は、処理対象ブロック(以下、現在ブロックという)に対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロックまたはCU単位でイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する多様な情報を生成してエントロピーエンコーディング部240に伝達することができる。予測に関する情報は、エントロピーエンコーディング部240でエンコーディングされてビットストリーム形態で出力されることができる。
イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することもでき、または、離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、DCモード及びプラナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、33個の方向性予測モードまたは65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用されることができる。イントラ予測部222は、隣接ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。
インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは、同じであってもよく、異なってもよい。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、インター予測部221は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、インター予測部221は、隣接ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは違ってレジデュアル信号が送信されない場合がある。動き情報予測(motion vector prediction、MVP)モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)をシグナリングすることによって、現在ブロックの動きベクトルを指示することができる。
予測部220は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することもできる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)予測モードに基づくこともでき、または、パレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ映像/動映像コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と類似するように実行されることができる。即ち、IBCは、本文書において説明されるインター予測技法のうち少なくとも一つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。
前記予測部(インター予測部221及び/または前記イントラ予測部222を含む)を介して生成された予測信号は、復元信号を生成するために用いられ、またはレジデュアル信号を生成するために用いられることができる。変換部232は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、またはCNT(Conditionally Non-linear Transform)のうち少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとき、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を利用して予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じ大きさを有するピクセルブロックに適用されることもでき、正方形でない可変大きさのブロックに適用されることもできる。
量子化部233は、変換係数を量子化してエントロピーエンコーディング部240に送信し、エントロピーエンコーディング部240は、量子化された信号(量子化された変換係数に関する情報)をエンコーディングしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトル形態で再整列することができ、前記1次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコーディング部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などのような多様なエンコーディング方法を実行することができる。エントロピーエンコーディング部240は、量子化された変換係数外に、ビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値等)を共にまたは別にエンコーディングすることもできる。エンコーディングされた情報(例えば、エンコーディングされたビデオ/映像情報)は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信または格納されることができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)等、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/映像情報は、一般制限情報(general constraint information)をさらに含むことができる。本文書において、エンコーディング装置からデコーディング装置に伝達/シグナリングされる情報及び/またはシンタックス要素は、ビデオ/映像情報に含まれることができる。前記ビデオ/映像情報は、前述したエンコーディング手順を介してエンコーディングされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、または、デジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び/または通信網などを含むことができ、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。エントロピーエンコーディング部240から出力された信号は、送信する送信部(図示せず)及び/または格納する格納部(図示せず)がエンコーディング装置200の内/外部エレメントとして構成されることができ、または、送信部は、エントロピーエンコーディング部240に含まれることもできる。
量子化部233から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することによって、レジデュアル信号(レジデュアルブロックまたはレジデュアルサンプル)を復元することができる。加算部155は、復元されたレジデュアル信号をインター予測部221またはイントラ予測部222から出力された予測信号に加えることによって、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)が生成されることができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部250は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
一方、ピクチャエンコーディング及び/または復元過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ270、具体的に、メモリ270のDPBに格納することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部260は、各フィルタリング方法に対する説明で後述するように、フィルタリングに関する多様な情報を生成してエントロピーエンコーディング部240に伝達することができる。フィルタリングに関する情報は、エントロピーエンコーディング部240でエンコーディングされてビットストリーム形態で出力されることができる。
メモリ270に送信された修正された復元ピクチャは、インター予測部221で参照ピクチャとして使用されることができる。エンコーディング装置は、これを介してインター予測が適用される場合、エンコーディング装置100とデコーディング装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。
メモリ270のDPBは、修正された復元ピクチャをインター予測部221における参照ピクチャとして使用するために格納することができる。メモリ270は、現在ピクチャ内の動き情報が導出された(または、エンコーディングされた)ブロックの動き情報及び/または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部221に伝達することができる。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部222に伝達することができる。
図3は、本文書の実施例に適用されることができるビデオ/映像デコーディング装置の構成を概略的に説明する図である。
図3を参照すると、デコーディング装置300は、エントロピーデコーディング部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350、及びメモリ(memoery)360を含んで構成されることができる。予測部330は、インター予測部331及びイントラ予測部332を含むことができる。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を含むことができる。前述したエントロピーデコーディング部310、レジデュアル処理部320、予測部330、加算部340、及びフィルタリング部350は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ360は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ360を内/外部コンポーネントとしてさらに含むこともできる。
ビデオ/映像情報を含むビットストリームが入力されると、デコーディング装置300は、図2のエンコーディング装置でビデオ/映像情報が処理されたプロセスに対応して映像を復元することができる。例えば、デコーディング装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出することができる。デコーディング装置300は、エンコーディング装置で適用された処理ユニットを利用してデコーディングを実行することができる。したがって、デコーディングの処理ユニットは、例えば、コーディングユニットであり、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び/またはターナリツリー構造にしたがって分割されることができる。コーディングユニットから一つ以上の変換ユニットが導出されることができる。そして、デコーディング装置300を介してデコーディング及び出力された復元映像信号は、再生装置を介して再生されることができる。
デコーディング装置300は、図2のエンコーディング装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコーディング部310を介してデコーディングされることができる。例えば、エントロピーデコーディング部310は、前記ビットストリームをパーシングして映像復元(または、ピクチャ復元)に必要な情報(例えば、ビデオ/映像情報)を導出することができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)など、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/映像情報は、一般制限情報(general constraint information)をさらに含むことができる。デコーディング装置は、前記パラメータセットに関する情報及び/または前記一般制限情報にも基づいてピクチャをデコーディングすることができる。本文書で後述されるシグナリング/受信される情報及び/またはシンタックス要素は、前記デコーディング手順を介してデコーディングされ、前記ビットストリームから取得されることができる。例えば、エントロピーデコーディング部310は、指数ゴロム符号化、CAVLC、またはCABACなどのコーディング方法を基づいてビットストリーム内の情報をデコーディングし、映像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳しく、CABACエントロピーデコーディング方法は、ビットストリームで各シンタックス要素に該当するbinを受信し、デコーディング対象のシンタックス要素情報と隣接及びデコーディング対象ブロックのデコーディング情報または以前ステップでデコーディングされたシンボル/binの情報を利用して文脈(context)モデルを決定し、決定された文脈モデルによってbinの発生確率を予測してbinの算術デコーディング(arithmetic decoding)を実行することで、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピーデコーディング方法は、文脈モデル決定後、次のシンボル/binの文脈モデルのためにデコーディングされたシンボル/binの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコーディング部310でデコーディングされた情報のうち、予測に関する情報は、予測部(インター予測部332及びイントラ予測部331)に提供され、エントロピーデコーディング部310でエントロピーデコーディングが実行されたレジデュアル値、即ち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部320に入力されることができる。レジデュアル処理部320は、レジデュアル信号(レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ)を導出することができる。また、エントロピーデコーディング部310でデコーディングされた情報のうち、フィルタリングに関する情報は、フィルタリング部350に提供されることができる。一方、エンコーディング装置から出力された信号を受信する受信部(図示せず)がデコーディング装置300の内/外部エレメントとしてさらに構成されることができ、または、受信部は、エントロピーデコーディング部310の構成要素であることもある。一方、本文書によるデコーディング装置は、ビデオ/映像/ピクチャデコーディング装置と呼ばれることができ、前記デコーディング装置は、情報デコーダ(ビデオ/映像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/映像/ピクチャサンプルデコーダ)に区分することもできる。前記情報デコーダは、前記エントロピーデコーディング部310を含むことができ、前記サンプルデコーダは、前記逆量子化部321、逆変換部322、加算部340、フィルタリング部350、メモリ360、インター予測部332、及びイントラ予測部331のうち少なくとも一つを含むことができる。
逆量子化部321では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部321は、量子化された変換係数を2次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコーディング装置で実行された係数スキャン順序に基づいて再整列を実行することができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を利用して量子化された変換係数に対する逆量子化を実行し、変換係数(transform coefficient)を取得することができる。
逆変換部322では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得するようになる。
予測部は、現在ブロックに対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピーデコーディング部310から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モードを決定することができる。
予測部320は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)予測モードに基づくこともでき、または、パレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ映像/動映像コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点でインター予測と類似するように実行されることができる。即ち、IBCは、本文書で説明されるインター予測技法のうち少なくとも一つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ/映像情報に含まれてシグナリングされることができる。
イントラ予測部331は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することもでき、または離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部331は、隣接ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。
インター予測部332は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。例えば、インター予測部332は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出することができる。多様な予測モードに基づいてインター予測が実行されることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。
加算部340は、取得されたレジデュアル信号を予測部(インター予測部332及び/またはイントラ予測部331を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。
加算部340は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることもでき、または、次のピクチャのインター予測のために使用されることもできる。
一方、ピクチャデコーディング過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ360、具体的に、メモリ360のDPBに送信することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。
メモリ360のDPBに格納された(修正された)復元ピクチャは、インター予測部332で参照ピクチャとして使用されることができる。メモリ360は、現在ピクチャ内の動き情報が導出された(または、デコーディングされた)ブロックの動き情報及び/または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ360は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部331に伝達することができる。
本明細書において、エンコーディング装置200のフィルタリング部260、インター予測部221、及びイントラ予測部222で説明された実施例は、各々、デコーディング装置300のフィルタリング部350、インター予測部332、及びイントラ予測部331にも同一または対応するように適用されることができる。
前述したように、ビデオコーディングを実行するにあたって圧縮効率を上げるために予測を実行する。それによって、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン(または、ピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコーディング装置及びデコーディング装置で同様に導出され、前記エンコーディング装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに関する情報(レジデュアル情報)をデコーディング装置にシグナリングすることで映像コーディング効率を上げることができる。デコーディング装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックを加算して復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。
前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコーディング装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を(ビットストリームを介して)デコーディング装置にシグナリングすることができる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコーディング装置は、前記レジデュアル情報に基づいて逆量子化/逆変換手順を実行してレジデュアルサンプル(または、レジデュアルブロック)を導出することができる。デコーディング装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコーディング装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。
一方、前述したように、現在ブロックに対する予測を実行するにあたってイントラ予測またはインター予測を適用することができる。以下では現在ブロックにインター予測を適用する場合に関して説明する。
エンコーディング/デコーディング装置の予測部(より具体的に、インター予測部)は、ブロック単位でインター予測を実行して予測サンプルを導出することができる。インター予測は、現在ピクチャ以外のピクチャ(ら)のデータ要素(例:サンプル値、または動き情報等)に依存した方法で導出される予測を示すことができる。現在ブロックにインター予測が適用される場合、参照ピクチャインデックスが指す参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロック(予測サンプルアレイ)を誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、現在ブロックの動き情報をブロック、サブブロック、またはサンプル単位で予測できる。動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測が適用される場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは、同じであってもよく、異なってもよい。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、現在ブロックの隣接ブロックに基づいて動き情報候補リストが構成されることができ、現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出するために、どの候補が選択(使用)されるかを指示するフラグまたはインデックス情報がシグナリングされることができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、現在ブロックの動き情報は、選択された隣接ブロックの動き情報と同じである。スキップモードの場合、マージモードとは違ってレジデュアル信号が送信されない場合がある。動き情報予測(motion vector prediction、MVP)モードの場合、選択された隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)はシグナリングされることができる。この場合、前記動きベクトル予測子及び動きベクトル差分の和を利用して現在ブロックの動きベクトルを導出することができる。
前記動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)によってL0動き情報及び/またはL1動き情報を含むことができる。L0方向の動きベクトルは、L0動きベクトルまたはMVL0と呼ばれることができ、L1方向の動きベクトルは、L1動きベクトルまたはMVL1と呼ばれることができる。L0動きベクトルに基づく予測はL0予測と呼ばれることができ、L1動きベクトルに基づく予測はL1予測と呼ばれることができ、L0動きベクトル及びL1動きベクトルの両方共に基づく予測は双(Bi)予測と呼ばれることができる。ここで、L0動きベクトルは、参照ピクチャリストL0(L0)に関連した動きベクトルを示すことができ、L1動きベクトルは、参照ピクチャリストL1(L1)に関連した動きベクトルを示すことができる。参照ピクチャリストL0は、現在ピクチャより出力順序上以前ピクチャを参照ピクチャとして含むことができ、参照ピクチャリストL1は、現在ピクチャより出力順序上以後ピクチャを含むことができる。以前ピクチャは、順方向(参照)ピクチャと呼ばれることができ、以後ピクチャは、逆方向(参照)ピクチャと呼ばれることができる。参照ピクチャリストL0は、現在ピクチャより出力順序上以後ピクチャを参照ピクチャとしてさらに含むことができる。この場合、参照ピクチャリストL0内で以前ピクチャが先にインデクシングされ、以後ピクチャはその次にインデクシングされることができる。参照ピクチャリストL1は、現在ピクチャより出力順序上以前ピクチャを参照ピクチャとしてさらに含むことができる。この場合、参照ピクチャリスト1内で以後ピクチャが先にインデクシングされ、以前ピクチャはその次にインデクシングされることができる。ここで、出力順序は、POC(picture order count)順序(order)に対応されることができる。
また、現在ブロックにインター予測を適用するにあたって、多様なインター予測モードが使われることができる。例えば、マージモード、スキップモード、MVP(motion vector prediction)モード、アフィン(Affine)モード、HMVP(historical motino vector prediction)モードなど、多様なモードが使われることができる。DMVR(Decoder side motion vector refinement)モード、AMVR(adaptive motion vector resolution)モード、Bi-directional optical flow(BDOF)などが付随的なモードとしてさらに使用されることができる。アフィンモードは、アフィン動き予測(affine motion prediction)モードと呼ばれることもできる。MVPモードは、AMVP(advanced motion vector prediction)モードと呼ばれることもできる。本文書において、一部モード及び/または一部モードにより導出された動き情報候補は、他のモードの動き情報関連候補のうち一つとして含まれることもできる。
現在ブロックのインター予測モードを指す予測モード情報がエンコーディング装置からデコーディング装置にシグナリングされることができる。このとき、予測モード情報は、ビットストリームに含まれてデコーディング装置に受信されることができる。予測モード情報は、多数の候補モードのうち一つを指示するインデックス情報を含むことができる。または、フラグ情報の階層的シグナリングを介してインター予測モードを指示することもできる。この場合、予測モード情報は、一つ以上のフラグを含むことができる。例えば、スキップフラグをシグナリングしてスキップモード適用可否を指示し、スキップモードが適用されない場合にマージフラグをシグナリングしてマージモード適用可否を指示し、マージモードが適用されない場合にMVPモードが適用されることと指示し、または追加的な区分のためのフラグをさらにシグナリングすることもできる。アフィンモードは、独立的なモードでシグナリングされることもでき、またはマージモードまたはMVPモードなどに従属的なモードでシグナリングされることもできる。例えば、アフィンモードは、アフィンマージモード及びアフィンMVPモードを含むことができる。
また、現在ブロックにインター予測を適用するにあたって、現在ブロックの動き情報を利用することができる。エンコーディング装置は、動き推定(motion estimation)手順を介して現在ブロックに対する最適の動き情報を導出することができる。例えば、エンコーディング装置は、現在ブロックに対する原本ピクチャ内の原本ブロックを利用して相関性が高い類似した参照ブロックを参照ピクチャ内の決められた探索範囲内で分数ピクセル単位で探索でき、これを介して動き情報を導出することができる。ブロックの類似性は、位相(phase)基盤のサンプル値の差に基づいて導出することができる。例えば、ブロックの類似性は、現在ブロック(または、現在ブロックのテンプレート)と参照ブロック(または、参照ブロックのテンプレート)との間のSAD(sum of absolute differences)に基づいて計算されることができる。この場合、探索領域内のSADが最も小さい参照ブロックに基づいて動き情報を導出することができる。導出された動き情報は、インター予測モードに基づいて多様な方法によってデコーディング装置にシグナリングされることができる。
前記のようにインター予測モードによって導出された動き情報に基づいて現在ブロックに対する予測されたブロックを導出することができる。予測されたブロックは、現在ブロックの予測サンプル(予測サンプルアレイ)を含むことができる。現在ブロックの動きベクトル(MV)が分数サンプル単位を指す場合、補間(interpolation)手順が実行されることができ、これを介して参照ピクチャ内で分数サンプル単位の参照サンプルに基づいて現在ブロックの予測サンプルが導出されることができる。現在ブロックにアフィン(Affine)インター予測が適用される場合、サンプル/サブブロック単位MVに基づいて予測サンプルを生成することができる。双予測が適用される場合、L0予測(即ち、参照ピクチャリストL0内の参照ピクチャとMVL0を利用した予測)に基づいて導出された予測サンプルと、L1予測(即ち、参照ピクチャリストL1内の参照ピクチャとMVL1を利用した予測)に基づいて導出された予測サンプルと、の(位相による)加重和または加重平均を介して導出された予測サンプルが、現在ブロックの予測サンプルとして利用されることができる。双予測が適用される場合、L0予測に利用された参照ピクチャとL1予測に利用された参照ピクチャが、現在ピクチャを基準にして互いに異なる時間的方向に位置する場合、(即ち、双予測かつ両方向予測に該当する場合)これをtrue双予測と呼ぶことができる。
導出された予測サンプルに基づいて復元サンプル及び復元ピクチャが生成されることができ、以後インループフィルタリングなどの手順が実行されることができることは、前述した通りである。
一方、スキップモード及び/またはマージモードは、MVD(Motion Vector Difference)無しで隣接ブロックの動きベクトルに基づいて現在ブロックの動きを予測するため、動き予測において限界を示す。スキップモード及び/またはマージモードの限界を改善するために、DMVR(Decoder-side Motion Vector Refinement)、BDOF(Bi-directional optical flow)モードなどを適用して動きベクトルをリファイン(refine)することができる。DMVR、BDOFモードは、現在ブロックにtrue双予測が適用される場合に使われることができる。
図4は、true双予測でDMVR(Decoder-side Motion Vector Refinement)を実行する過程の一実施例を説明するための図である。
DMVRは、デコーダ側で隣接ブロックの動き情報をリファイン(refinement)して動き予測を実行する方法である。DMVRが適用される場合、デコーダは、マージ(merge)/スキップ(skip)モードで隣接ブロックの動き情報を利用して生成されたテンプレート(template)に基づいてcost比較を介してリファインされた動き情報を誘導することができる。この場合、付加的なシグナリング情報無しで動き予測の精密度を高め、圧縮性能を向上させることができる。
本文書において、説明の便宜のためにデコーディング装置を中心に説明するが、本文書の実施例に係るDMVRは、エンコーディング装置でも同じ方法で実行されることができる。
図4を参照すると、デコーディング装置は、list0及びlist1方向の初期動きベクトル(または、動き情報)(例:MV0及びMV1)により識別される予測ブロック(即ち、参照ブロック)を導出し、導出された予測ブロックを加重和(例えば、平均)してテンプレート(または、bilateral template)を生成することができる(step1)。ここで、初期動きベクトル(MV0及びMV1)は、マージ/スキップモードで隣接ブロックの動き情報を利用して誘導された動きベクトルを示すことができる。
そして、デコーディング装置は、テンプレートマッチング(template matching)動作を介してテンプレートと参照ピクチャのサンプル領域間の差分値を最小化する動きベクトル(例:MV0′及びMV1′)を誘導することができる(step2)。ここで、サンプル領域は、参照ピクチャ内で初期予測ブロックの隣接領域を示し、サンプル領域は、隣接領域、参照領域、探索領域、探索範囲、探索空間などで呼ばれることができる。テンプレートマッチング動作は、テンプレートと参照ピクチャのサンプル領域間のcost測定値を計算する動作を含むことができる。例えば、cost測定にはSAD(sum of absolute differences)が利用されることができる。一例として、cost関数として正規化されたSADが使われることができる。このとき、matching costは、SAD(T-mean(T)、2*P[x]-2*mean(P[x]))として与えられることができる。ここで、Tは、テンプレートを示し、P[x]は、探索領域内のブロックを示す。そして、2個の参照ピクチャの各々に対して最小テンプレートcostを算出する動きベクトルは、更新された動きベクトル(初期動きベクトルを代替する)として考慮されることができる。図4に示すように、デコーディング装置は、更新された動きベクトルMV0′及びMV1′を利用して最終両方向予測結果(即ち、最終両方向予測ブロック)を生成することができる。一実施例として、更新された(または、新しい)動きベクトル誘導のためのmulti-iterationが最終両方向予測結果取得に使われることができる。
一実施例において、デコーディング装置は、初期動き補償予測(即ち、従来のマージ/スキップモードを介した動き補償予測)の正確度を向上させるためにDMVRプロセスを呼び出しすることができる。例えば、デコーディング装置は、現在ブロックの予測モードがマージモードまたはスキップモードであり、現在ブロックにディスプレイ順序上現在ピクチャを基準にして両方向の参照ピクチャが反対方向にある両方向双予測が適用される場合、DMVRプロセスを実行することができる。
図5は、SAD(sum of absolute differences)を使用してDMVR(Decoder-side Motion Vector Refinement)を実行する過程の一実施例を説明するための図である。
前述したように、デコーディング装置は、DMVRを実行するにあたって、SADを利用してmatching costを測定することができる。一実施例として、図5ではテンプレートを生成せずに、二つの参照ピクチャ内の予測サンプル間のMRSAD(Mean Sum of Absolute Difference)を計算して動きベクトルをリファインする方法を説明する。即ち、図5の方法は、MRSADを利用する両方向マッチング(bilateral matching)の一実施例を示す。
図5を参照すると、デコーディング装置は、list0(L0)方向の動きベクトル(MV0)により指示される画素(サンプル)の隣接画素をL0参照ピクチャ上で導出し、list1(L1)方向の動きベクトル(MV1)により指示される画素(サンプル)の隣接画素をL1参照ピクチャ上で導出することができる。そして、デコーディング装置は、L0参照ピクチャ上で導出された隣接画素を指示する動きベクトルにより識別されるL0予測ブロック(即ち、L0参照ブロック)と、L1参照ピクチャ上で導出された隣接画素を指示する動きベクトルにより識別されるL1予測ブロック(即ち、L1参照ブロック)と、の間のMRSADを計算してmatching costを測定することができる。このとき、デコーディング装置は、最小costを有する探索地点(即ち、L0予測ブロックとL1予測ブロックとの間の最小SADを有する探索領域)をリファインされた動きベクトル対として選択できる。即ち、リファインされた動きベクトル対は、L0参照ピクチャで最小costを有する画素位置(L0予測ブロック)を指すリファインされたL0動きベクトルと、L1参照ピクチャで最小costを有する画素位置(L1予測ブロック)を指すリファインされたL1動きベクトルと、を含むことができる。
実施例として、matching costを計算するにあたって、参照ピクチャの探索領域が設定された後、単方向予測は、regular 8 tap DCTIF interpolation filterを使用して実行されることができる。また、一例として、MRSAD計算は、16ビット精密度が使われ、内部バッファを考慮してMRSAD計算以前にクリッピング及び/または丸め演算が適用されない。
前述したように、現在ブロックにtrue双予測が適用される場合、双予測信号をリファインするためにBDOFが使われることができる。BDOF(Bi-directional optical flow)は、現在ブロックに双予測が適用される場合、改善された動き情報を計算し、これに基づいて予測サンプルを生成するために使われることができる。例えば、BDOFは、4×4サブブロック(sub-block)レベルで適用されることができる。即ち、BDOFは、現在ブロック内の4×4サブブロック単位で実行されることができる。または、BDOFは、ルマ成分に対してのみ適用されることができる。または、BDOFは、クロマ成分に対してのみ適用されることもでき、ルマ成分及びクロマ成分に対して適用されることもできる。
BDOFモードは、その名称で示すように、オブジェクトの動きがsmoothと仮定するオプティカルフロー(optical flow)概念を基盤とする。4×4サブブロックの各々に対して、L0及びL1予測サンプル間の差値を最小化することによって、動きリファインメント(v、v)が計算されることができる。そして、動きリファインメントは、4×4サブブロックで双予測サンプル値を調整するために使われることができる。
前述したDMVR及びBDOFは、true双予測を適用する場合(このとき、true双予測は、現在ブロックのピクチャを基準にして異なる方向の参照ピクチャで動き予測/補償する場合を示す)、動き情報をリファインして予測を実行する技術であって、ピクチャ内のオブジェクトの動きが一定速度、一定の方向に行われる場合を仮定しているという点で類似した概念のリファインメント技術であることを知ることができる。ただし、true双予測が実行される場合、DMVRを適用するための条件とBDOFを適用するための条件が異なるため、各技術別に繰り返して数回の条件チェックを実行する過程を経なければならない。したがって、本文書では現在ブロックに適用される予測モードを決定するにあたって、条件チェックを実行する過程を改善することによって、デコーダ複雑度及び性能面で効率を向上させることができる方法を提案する。
以下の表1は、既存のtrue双予測時にDMVRを適用するための条件を示す。以下に羅列した条件を全て満たす時、DMVRを適用することができる。
Figure 2022521542000002
前記表1を参照すると、1)SPS(Sequence Parameter Set)シンタックスでシグナリングされるフラグ情報(例:sps_dmvr_enabled_flag)に基づいてDMVR適用可否を決定することができる。ここで、フラグ情報(例:sps_dmvr_enabled_flag)は、true双予測基盤のDMVRが可用(enable)であるかどうかを示すことができる。例えば、sps_dmvr_enabled_flagが1である場合(即ち、true双予測基盤のDMVRが可用な場合)、DMVR可用可否条件を満たすと判断できる。
2)マージモード/スキップモードを使用してインター予測を実行するかを示すフラグ情報(例:merge_flag)に基づいてDMVR適用可否を決定することができる。例えば、merge_flagが1である場合(即ち、マージモード/スキップモードを使用してインター予測を実行する場合)、マージモード/スキップモード適用可否条件を満たすと判断できる。
3)MMVD(merge mode with motion vector difference)モードを使用してインター予測を実行するかどうかを示すフラグ情報(例:mmvd_flag)に基づいてDMVR適用可否を決定することができる。例えば、mmvd_flagが0である場合(即ち、MMVDモードを使用しない場合)、MMVDモード適用可否条件を満たすと判断できる。
4)両方向予測(双予測)を使用するかどうかに基づいてDMVR適用可否を決定することができる。ここで、両方向予測は、現在ピクチャを基準にして互いに異なる方向に存在する参照ピクチャに基づいて実行されるインター予測を示すことができる。例えば、predFlagL0[0][0]=1であり、predFlagL0[1][1]=1である場合、両方向予測が適用されると判断でき、両方向予測可否条件を満たすと判断できる。
5)true双予測であり、現在ピクチャと両方向の参照ピクチャとの間の距離が相互同じかどうかに基づいてDMVR適用可否を決定することができる。即ち、現在ピクチャとLO参照ピクチャ(即ち、参照ピクチャリストL0内の参照ピクチャ)との間の距離と、現在ピクチャとL1参照ピクチャ(即ち、参照ピクチャリストL1内の参照ピクチャ)との間の距離と、が相互同じかどうかを判断することができる。例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])=0である場合、true双予測であり、現在ピクチャと両方向の参照ピクチャとの間の距離が相互同じであると判断し、両方向の参照ピクチャ距離が同じかどうかの条件を満たすと判断できる。
6)現在ブロックの長さ(Height)が閾値(threshold)より大きいかどうかに基づいてDMVR適用可否を決定することができる。例えば、現在ブロックの長さが8以上である場合、現在ブロック大きさ(長さ)条件を満たすと判断できる。
7)現在ブロックの大きさが閾値(threshold)より大きいかどうかに基づいてDMVR適用可否を決定することができる。例えば、現在ブロックの大きさ、即ち、長さ(Height)*幅(Width)が64以上である場合、現在ブロック大きさ(長さ*幅)条件を満たすと判断できる。
デコーディング装置は、前記表1の条件1)乃至7)を満たすかどうかによってDMVR適用可否を決定することができる。即ち、デコーディング装置は、前記表1の条件1)乃至7)が全て満たされる場合にDMVRを適用してtrue双予測を実行することができ、前記表1の条件のうち一つでも満たされない場合にDMVRを適用しない。
以下の表2は、既存のtrue双予測時にBDOFを適用するための条件を示す。以下に羅列した条件を全て満たす時、BDOFを適用することができる。
Figure 2022521542000003
前記表2を参照すると、1)SPS(Sequence Parameter Set)シンタックスでシグナリングされるフラグ情報(例:sps_bdof_enabled_flag)に基づいてBDOF適用可否を決定することができる。ここで、フラグ情報(例:sps_bdof_enabled_flag)は、true双予測基盤のBDOFが可用(enable)であるかどうかを示すことができる。例えば、sps_bdof_enabled_flagが1である場合(即ち、true双予測基盤のBDOFが可用な場合)、BDOF可用可否条件を満たすと判断できる。
2)両方向予測を使用するかどうかに基づいてBDOF適用可否を決定することができる。ここで、両方向予測は、現在ピクチャを基準にして互いに異なる方向に存在する参照ピクチャに基づいて実行されるインター予測を示すことができる。例えば、predFlagL0及びpredFlagL1が全て1である場合、両方向予測が適用されると判断でき、両方向予測可否条件を満たすと判断できる。
3)true双予測であるかどうかに基づいてBDOF適用可否を決定することができる。即ち、現在ピクチャを基準にして、LO参照ピクチャ(即ち、参照ピクチャリストL0内の参照ピクチャ)とL1参照ピクチャ(即ち、参照ピクチャリストL1内の参照ピクチャ)とが時間的に互いに異なる方向に位置するかどうかを判断することができる。例えば、DiffPicOrderCnt(currPic、refPicList0[refIdxL0])*DiffPicOrderCnt(currPic、refPicList1[refIdxL1])が0より小さい場合、現在ピクチャを基準にして両方向の参照ピクチャが互いに異なる方向に位置すると判断し、true双予測可否条件を満たすと判断できる。
4)アフィンモードが使われるかどうかに基づいてBDOF適用可否を決定することができる。ここで、アフィンモードが使われるかどうかは、MotionModelIdcを誘導することによって判断できる。例えば、誘導されたMotionModelIdcが0である場合、アフィンモードが使われないと判断でき、この場合、アフィンモード適用可否条件を満たすと判断できる。
5)マージモードでのインター予測がサブブロック単位で実行されるかどうかを示すフラグ情報(例:merge_subblock_flag)に基づいてBDOF適用可否を決定することができる。例えば、merge_subblock_flagが0である場合(即ち、サブブロック単位でマージモードが適用されない場合)、サブブロック基盤のマージモード可否条件を満たすと判断できる。
6)GBiが存在するかどうかに基づいてBDOF適用可否を決定することができる。ここで、GBiが存在するかどうかは、GBiインデックス情報(例:GbiIdx)に基づいて判断できる。例えば、GbiIdxが0である場合(即ち、GbiIdxがデフォルトである場合)、GBi可否条件を満たすと判断できる。
7)現在ブロックがルマ(Luma)成分を含むルマブロックであるかどうかに基づいてBDOF適用可否を決定することができる。例えば、ルマブロックであるかを示すインデックス(例:cIdx)が0である場合(即ち、ルマブロックである場合)、ルマブロック可否条件を満たすと判断できる。
デコーディング装置は、前記表2の条件1)乃至7)を満たすかどうかによってBDOF適用可否を決定することができる。即ち、デコーディング装置は、前記表2の条件1)乃至7)が全て満たされる場合にBDOFを適用してtrue双予測を実行することができ、前記表2の条件のうち一つでも満たされない場合にBDOFを適用しない。
前述したように、DMVRとBDOFの適用条件が、一部は同じであり、一部は類似または異なる。既存の方式では条件が同じ場合にも各技術別に条件チェックを実行するようになるため、双予測実行のための複雑度が増加するようになる。したがって、本文書では双予測時にDMVRとBDOFを適用するための効率的な条件を提案する。
マージ/スキップモードは、AMVPモードと比較する時、相対的に動き正確度が低いため、DMVR方法を利用して動き情報をリファインするのが性能面で効果的である。しかし、BDOFモードは、DMVRとは違ってマージ/スキップモードだけでなく、AMVPモードである時も適用しているため、このようにAMVPモードでBDOFを適用する場合、性能対比BDOF実行のための複雑度が増加できる。したがって、本実施例ではDMVRと同様にBDOFの場合もマージ/スキップモードで適用する方案を提案する。
この場合、本文書で提案する一実施例として、BDOFの適用条件は、以下の表3に提示された条件を含むことができる。
Figure 2022521542000004
前記表3を参照すると、マージモード/スキップモードを使用してインター予測を実行するかを示すフラグ情報(例:merge_flag)に基づいてBDOF適用可否を決定することができる。例えば、merge_flagが1である場合(即ち、マージモード/スキップモードを使用してインター予測を実行する場合)、マージモード/スキップモード適用可否条件を満たすと判断できる。したがって、DMVRと同様にBDOFの場合もマージ/スキップモードである時に適用されることができる。

即ち、本実施例では前記マージ/スキップモードである場合に適用する条件と共に、BDOFが可用な場合に適用する条件、両方向予測である場合に適用する条件、true双予測である場合に適用する条件、アフィン予測でない場合に適用する条件、サブブロック基盤のマージモードでない場合に適用する条件、GBiインデックスがデフォルトである場合に適用する条件、ルマブロックである場合に適用する条件に基づいてBDOF適用可否を判断することができる。
したがって、デコーディング装置は、前記表3に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表3に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表3の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表3で羅列された条件に基づいてtrue双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、本実施例で羅列した条件のうち前記表1及び表2で説明した条件と同じ場合には具体的な動作や意味が同じく適用されるため、各条件に対する具体的な説明は省略する。また、後述する実施例でも重複する内容は省略する。
エンコーディング/デコーディング装置の場合、多様なハードウェアを使用して構成されることができ、性能対比複雑度比率の選好が異なることがある。したがって、本実施例ではマージ/スキップモードだけでなく、AMVPモードでもDMVRを適用して動き情報をリファインすることができる方案を提案する。
この場合、本文書で提案する一実施例として、DMVRの適用条件は、以下の表4に提示された条件を含むことができる。
Figure 2022521542000005
前記表4を参照すると、マージモード/スキップモードを使用してインター予測を実行するかを示すフラグ情報(例:merge_flag)に基づいてDMVR適用可否を決定する過程が省略されることができる。このように、マージモード/スキップモードの適用可否条件を省略することによって、マージモード/スキップモードである場合だけでなく、AMVPモードでもDMVRを適用することができる。
前記表4によると、DMVRが可用な場合に適用する条件、MMVDモードが使われない場合に適用する条件、両方向予測である場合に適用する条件、現在ピクチャと両方向参照ピクチャとの距離が相互同じなtrue双予測である場合に適用する条件、現在ブロックの長さが8以上である場合に適用する条件、現在ブロックの大きさ(長さ*幅)が64以上である場合に適用する条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表4に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表4に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表4の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表4で羅列された条件に基づいて、true双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、本文書の一実施例として、DMVR及びBDOFは、全て一般的なマージ(normal merge)モードに適用されることができる。即ち、ATMVP(advanced temporal motion vector prediction)モードでない、アフィンモードでない、CPRでない場合、DMVR及びBDOFを適用することができる。この場合、DMVRの適用条件は、以下の表5に提示された条件を含むことができる。
Figure 2022521542000006
前記表5を参照すると、アフィンモードが使われない場合に適用する条件(例:MotionModelIdcが0である場合)、サブブロック基盤のマージモードでない場合に適用する条件(例:merge_subblock_flagが0である場合)を満たすかどうかを判断することによって、一般的なマージモードである場合に限りDMVRを適用することができる。
また、本実施例では前記アフィンモード可否条件、サブブロック基盤のマージモード可否条件と共に、DMVRが可用な場合に適用する条件、マージモード/スキップモードである場合に適用する条件、MMVDモードが使われない場合に適用する条件、両方向予測である場合に適用する条件、現在ピクチャと両方向参照ピクチャとの距離が相互同じなtrue双予測である場合に適用する条件、現在ブロックの長さが8以上である場合に適用する条件、現在ブロックの大きさ(長さ*幅)が64以上である場合に適用する条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表5に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表5に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表5の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表5の適用条件のうちサブブロック基盤のマージモード適用可否条件(例:merge_subblock_flag)は、既存のDMVR適用条件のうち重複する条件を含んでいる。したがって、本文書の一実施例として、サブブロック基盤のマージモード適用可否条件(例:merge_subblock_flag)と重複する条件を除去することができる。この場合、以下の表6に提案されたように該当条件が除去されることができる。
Figure 2022521542000007
前記表6を参照すると、サブブロック基盤のマージモードは、現在ブロックの大きさが8×8以上である場合に適用されることができる。したがって、サブブロック基盤のマージモード適用可否条件(例:merge_subblock_flag=0)は、現在ブロックの大きさと関連した条件を含んでいるため、既存のDMVRの適用条件の中から現在ブロックの大きさと関連した条件(例:CbHeight、CbHeight*CbWidth)を除外させることができる。例えば、現在ブロックの長さが8以上であるかどうかの条件、現在ブロックの長さ*幅が64以上であるかどうかの条件は省略し、前記表6に羅列されたその他の条件を利用してDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表6に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表6に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表6の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表5または前記表6で羅列された条件に基づいて、true双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
本文書の一実施例として、低複雑度で動きベクトルの正確度を高めるために、ブロックの大きさが小さい場合には、DMVR及びBDOFのようなリファイン技術を適用しない。既存の方式では現在ブロックが8×8より大きいまたは同じブロックである場合にリファイン技術を適用しており、このうち、DMVRの場合、現在ブロックの大きさが大きい時、16×16単位で分けてリファインを適用するため、16×16より小さいブロックに対してはDMVRを適用しない。この場合、DMVRの適用条件は、以下の表7に提示された条件を含むことができる。
Figure 2022521542000008
前記表7を参照すると、現在ブロックの大きさと関連した条件(例:CbHeight、CbWidth)を変更することによって、16×16より小さいブロックに対してDMVRを適用しないようにすることができる。例えば、現在ブロックの長さ(例:CbHeight)が16以上である場合に適用する条件と、現在ブロックの幅(例:CbWidth)が16以上である場合に適用する条件と、を使用することができる。このような現在ブロックの大きさと関連した適用条件を満たす場合(即ち、現在ブロックの大きさが16×16以上である場合)にDMVRを適用し、前記のような現在ブロックの大きさと関連した適用条件を満たさない場合(即ち、現在ブロックの大きさが16×16より小さい場合)にDMVRを適用しない。
また、本実施例では現在ブロックの大きさと関連した条件(例:CbHeight、CbWidth)と共に、前記表7で羅列された残りの適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表7に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表7に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表7の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
本文書の一実施例として、現在ブロックが16×16より小さいブロックである場合、DMVRだけでなく、BDOFを適用しない。この場合、BDOFの適用条件は、以下の表8に提示された条件を含むことができる。
Figure 2022521542000009
前記表8を参照すると、現在ブロックの大きさと関連した条件(例:CbHeight、CbWidth)を変更することによって、16×16より小さいブロックに対してBDOFを適用しないようにすることができる。例えば、現在ブロックの長さ(例:CbHeight)が16以上である場合に適用する条件と、現在ブロックの幅(例:CbWidth)が16以上である場合に適用する条件と、を使用することができる。このような現在ブロックの大きさと関連した適用条件を満たす場合(即ち、現在ブロックの大きさが16×16以上である場合)にBDOFを適用し、前記のような現在ブロックの大きさと関連した適用条件を満たさない場合(即ち、現在ブロックの大きさが16×16より小さい場合)にBDOFを適用しない。

また、本実施例では現在ブロックの大きさと関連した条件(例:CbHeight、CbWidth)と共に、前記表8で羅列された残りの適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表8に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表8に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表8の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表7または前記表8で羅列された条件に基づいて、true双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
前述したように、DMVRは、現在ピクチャと両方向の参照ピクチャとの間の距離が相互同じな場合に適用し、それに対して、BDOFは、現在ピクチャと両方向の参照ピクチャとの間の距離が異なってもtrue双予測である場合に常に適用される。したがって、本文書ではコーディング効率を上げるために、前記両方向の参照ピクチャ距離と関連した条件をDMVR及びBDOFに統一して適用できる方案を提案する。
本文書の一実施例として、BDOFの適用条件は、以下の表9に提示された条件を含むことができる。
Figure 2022521542000010
前記表9を参照すると、BDOFの適用条件のうち参照ピクチャ距離と関連した条件(例:DiffPicOrderCnt)を変更することによって、DMVRとBDOFに該当条件を同じく適用できる。例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])が0であるかどうかを判断することによって、現在ピクチャとLO参照ピクチャ(即ち、参照ピクチャリストL0内の参照ピクチャ)との間の距離と、現在ピクチャとL1参照ピクチャ(即ち、参照ピクチャリストL1内の参照ピクチャ)との間の距離と、が相互同じかどうかを決定することができる。即ち、現在ピクチャと両方向の参照ピクチャとの間の距離が相互同じな場合に限りBDOFを適用することができる。このように、true双予測であり、かつ両方向の参照ピクチャ距離が同じな条件が追加されるに応じて、BDOF適用範囲が制限されるため、デコーディング複雑度を節減することができる。
また、本実施例では参照ピクチャ距離と関連した条件(例:DiffPicOrderCnt)と共に、前記表9で羅列された残りの適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表9に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表9に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表9の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
本文書の一実施例として、DMVRの適用条件は、以下の表10に提示された条件を含むことができる。
Figure 2022521542000011
前記表10を参照すると、DMVRの適用条件のうち参照ピクチャ距離と関連した条件(例:DiffPicOrderCnt)を変更することによって、DMVRとBDOFに該当条件を同じく適用できる。例えば、DiffPicOrderCnt(currPic、refPicList0[refIdxL0])*DiffPicOrderCnt(currPic、refPicList1[refIdxL1])が0より小さいかどうかを判断することによって、現在ピクチャを基準にして両方向の参照ピクチャ(即ち、LO参照ピクチャ及びL1参照ピクチャ)が互いに異なる方向に位置するtrue双予測であるかを決定することができる。即ち、現在ピクチャと両方向の参照ピクチャとの間の距離が同じでなくても、true双予測である場合には常にDMVRを適用することができる。このように、true双予測可否条件が適用されるに応じて両方向の参照ピクチャ距離が異なる場合にもデコーディング複雑度を考慮して誘導された動きベクトルは、スケーリング(scaling)せずに使用することができる。
また、本実施例では参照ピクチャ距離と関連した条件(例:DiffPicOrderCnt)と共に、前記表10で羅列された残りの適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表10に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表10に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表10の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表9または前記表10で羅列された条件に基づいてtrue双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、各参照ブロックは、光の変化などにより加重和(weighted sum)で動き補償をする場合が発生できる。このとき、GBiやLIC(local illumination compensation)でその現象を把握することができるため、GBiやLIC条件を考慮してDMVRとBDOFの適用条件を定めることができる。
本文書の一実施例として、GBi及びLIC条件を考慮してDMVRの適用可否を決定する方案を提案する。この場合、DMVRの適用条件は、以下の表11に提示された条件を含むことができる。
Figure 2022521542000012
前記表11を参照すると、GBi条件(例:GbiIdx)及びLIC条件(例:LICFlag)を追加してDMVRの適用可否を決定することができる。ここで、GBiは、L0予測及びL1予測に異なる加重値(weight)を適用することができる一般的な双予測(generalized bi-prediction)を示すことができ、例えば、GbiIdxを使用して示すことができる。GbiIdxは、双予測である場合に存在でき、双予測加重値インデックス(bi-prediction weight index)を示すことができる。例えば、GbiIdxは、マージモードの場合、隣接ブロックから導出されることができ、または、MVPモードの場合、GbiIdxシンタックス要素(例:gbi_idx)を介してエンコーディング装置からデコーディング装置にシグナリングされることができる。一例として、GbiIdxは、L1予測に適用される加重値wを指示することができ、この場合、L0予測には(1-w)の加重値が適用されることができる。他の例として、GbiIdxは、L0予測に適用される加重値wを指示することができ、この場合、L1予測には(1-w)の加重値が適用されることができる。
前記表11によると、GbiIdxが0である場合(即ち、GbiIdxがデフォルトである場合)、GBi可否条件を満たすと定め、LICFlagが0である場合(即ち、LICが存在する場合)、LIC可否条件を満たすと定めることができる。
また、本実施例ではGBi条件(例:GbiIdx)及びLIC条件(例:LICFlag)と共に、前記表11に羅列された残りの適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表11に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表11に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表11の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
本文書の一実施例として、GBi及びLIC条件を考慮してBDOFの適用可否を決定する方案を提案する。この場合、BDOFの適用条件は、以下の表12に提示された条件を含むことができる。
Figure 2022521542000013
前記表12によると、既存のGBi条件(例:GbiIdx)と共にLIC条件(例:LICFlag)を追加してBDOFの適用可否を決定することができる。例えば、GbiIdxが0である場合(即ち、GbiIdxがデフォルトである場合)、GBi可否条件を満たすと定め、LICFlagが0である場合(即ち、LICが存在する場合)、LIC可否条件を満たすと定めることができる。
したがって、本実施例ではGBi条件(例:GbiIdx)及びLIC条件(例:LICFlag)と共に、前記表12に羅列された残りの適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表12に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表12に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表12の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表11または前記表12で羅列された条件に基づいてtrue双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、DMVRとBDOFは、デコーディング装置でリファインメント過程を介して動き情報を誘導するため、デコーディング複雑度の問題が発生する。したがって、本文書ではマージインデックスを使用してDMVR及びBDOFの適用可否を決定することができるようにすることで、デコーディング複雑度を減らすことができる方法を提案する。このとき、DMVRとBDOFは、全て制限的な範囲内で動きベクトルのリファインを実行するため、動きベクトルが不正確な場合、ラファインの効果が減ることができる。したがって、本文書ではリファインの効率を考慮してマージインデックスが示す値が小さい場合にのみ、制限的に適用できる方案を提案する。
ここで、マージインデックスは、エンコーディング装置からデコーディング装置にシグナリングされるシンタックス要素である。例えば、エンコーディング/デコーディング装置は、現在ブロックにマージモード/スキップモードが適用される場合、現在ブロックの隣接ブロックに基づいてマージ候補リストを構成することができる。このとき、エンコーディング装置は、RD(rate-distortion)costに基づいて、マージ候補リストに含まれているマージ候補の中から最適のマージ候補を選択し、選択されたマージ候補を指すマージインデックス情報をデコーディング装置にシグナリングできる。デコーディング装置は、マージ候補リスト及びマージインデックス情報に基づいて現在ブロックに適用されるマージ候補を選択することができる。
本文書の一実施例として、マージインデックスを使用してDMVRの適用可否を決定する方法は、以下の表13に提示された条件を含むことができる。
Figure 2022521542000014
前記表13を参照すると、マージインデックス条件(例:merge_idx)を追加してDMVRの適用可否を決定することができる。例えば、マージインデックス(例:merge_idx)が2より小さい場合、マージインデックス条件を満たすと定めることができる。ここで、マージインデックスの値(threshold)を2に設定したが、これは一つの例示に過ぎず、コーディング効率によって該当値は変更されることができる。
したがって、本実施例ではマージインデックス条件(例:merge_idx)と共に、前記表13に羅列された残りの適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表13に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表13に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表13の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
本文書の一実施例として、マージインデックスを使用してBDOFの適用可否を決定する方法は、以下の表14に提示された条件を含むことができる。
Figure 2022521542000015
前記表14を参照すると、マージモード/スキップモード可否条件(例:merge_flag)とマージインデックス条件(例:merge_idx)を追加してBDOFの適用可否を決定することができる。例えば、merge_flagが1であり(即ち、マージモード/スキップモードを使用してインター予測を実行する場合)、merge_idxが2以上である場合に該当しない場合、マージインデックスの値が小さい場合にのみ、制限的にBDOFを適用する条件を満たすと定めることができる。即ち、merge_flagが1であり(即ち、マージモード/スキップモードを使用してインター予測を実行する場合)、merge_idxが2より小さい場合、マージインデックス条件を満たすと判断してBDOFを適用することができる。ここで、マージインデックスの値(threshold)を2に設定したが、これは一つの例示に過ぎず、コーディング効率によって該当値は変更されることができる。
即ち、本実施例ではマージモード/スキップモード可否条件(例:merge_flag)、マージインデックス条件(例:merge_idx)と共に、前記表14に羅列された残りの適用条件に基づいてBDOFの適用可否を判断することができる。
即ち、デコーディング装置は、前記表14に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表14に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表14の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表13または前記表14で羅列された条件に基づいて、true双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、マージ/スキップモードでMMVDを介して動き情報をリファインすることができ、この場合、デコーダ複雑度が増加するため、MMVDが適用される時、DMVRを実行しないようにしている。しかし、MMVDを考慮せずに適用される場合、性能向上を考慮してMMVD条件がなくてもDMVRを適用することができる。この場合、本文書の一実施例によると、DMVRの適用条件は、以下の表15に提示された条件を含むことができる。
Figure 2022521542000016
前記表15を参照すると、既存のDMVRの適用条件の中からMMVDモード適用可否条件(例:mmvd_flag)を除外させることができる。即ち、mmvd_flagが0である場合(即ち、MMVDモードを使用しない場合)であるかどうかを判断する過程を省略し、前記表15に羅列された条件に基づいてDMVRの適用可否を判断することができる。
即ち、デコーディング装置は、(MMVDモード適用可否条件(例:mmvd_flag)を除外した)前記表15に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表15に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表15の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
また、前述した表15の実施例と逆に、マージ/スキップモードでMMVDを介して動き情報をリファインする時、デコーダ複雑度を考慮してBDOFの実行可否を決定することができる。したがって、本文書ではMMVD条件を考慮してBDOFの適用可否を決定する方法を提案する。この場合、本文書の一実施例によると、BDOFの適用条件は、以下の表16に提示された条件を含むことができる。
Figure 2022521542000017
前記表16を参照すると、MMVDモード適用可否条件(例:mmvd_flag)を追加することによって、MMVDを介して動き情報をリファインする場合にBDOFを適用しない。例えば、mmvd_flagが0である場合(即ち、MMVDモードを使用しない場合)、MMVDモード適用可否条件を満たすと判断できる。
したがって、本実施例ではMMVDモード適用可否条件(例:mmvd_flag)と共に、前記表16に羅列された残りの適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表16に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表16に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表16の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表15または前記表16で羅列された条件に基づいてtrue双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることもでき、または、DMVR及びBDOFのための同一条件に適用されることもできる。
一方、AMVPモードである時、AMVR(Adaptive Motion Vector Resolution)技術が適用されることができる。このとき、動きベクトルの解像度(resolution)が大きい場合、即ち、整数サンプル単位ラウンディング(integer-pel rounding)、4サンプル単位ラウンディング(4 integer-pel rounding)を有する場合、制限された領域内でリファインを実行するBDOFの場合、このような技術を適用するのが適合しない。したがって、本文書ではAMVR条件によってBDOFの実行を決定することができる方案を提案する。この場合、本文書の一実施例によると、BDOFの適用条件は、以下の表17に提示された条件を含むことができる。
Figure 2022521542000018
前記表17を参照すると、AMVR条件(例:amvr_flag)を追加してBDOFの適用可否を決定することができる。ここで、amvr_flagは、動きベクトル差(MVD)の解像度を示す情報である。例えば、amvr_flagが0である場合、MVDの解像度が1/4サンプル(quarter-luma-sample)単位で誘導されることを示し、amvr_flagが0でない場合、整数サンプル(integer-luma-sample)単位または4サンプル(four-luma-sample)単位で誘導されることを示すことができる。または、その反対の場合に定められることもできる。実施例によって、前記表17に提示されたように、amvr_flagが0でない場合、BDOFが適用されることと条件を設定することができる。即ち、amvr_flagが0である場合、BDOFが適用されないように制限できる。
したがって、本実施例ではAMVR条件(例:amvr_flag)と共に、前記表17に羅列されたその他の条件に基づいてBDOFの適用可否を判断することができる。
即ち、デコーディング装置は、前記表17に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表17に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表17の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
一方、前述したようなDMVRとBDOFは、SPS(Sequence Parameter Set)シンタックスで各々シグナリングされることができる。以下の表18は、SPSシンタックスを介してシグナリングされるDMVRが可用であるかどうかとBDOFが可用であるかどうかを示すシンタックス要素の一例を示す。
Figure 2022521542000019
前記表18を参照すると、SPSシンタックスでsps_dmvr_enabled_flagをシグナリングすることができ、このシンタックス要素に基づいてtrue双予測基盤のDMVRが可用(enable)であるかどうかを示すことができる。例えば、sps_dmvr_enabled_flagが1である場合、true双予測基盤のDMVRが可用であることを示し、sps_dmvr_enabled_flagが0である場合、true双予測基盤のDMVRが可用でないことを示すことができる。
また、SPSシンタックスでsps_bdof_enabled_flagをシグナリングすることができ、このシンタックス要素に基づいてtrue双予測基盤のBDOFが可用(enable)であるかどうかを示すことができる。例えば、sps_bdof_enabled_flagが1である場合、true双予測基盤のBDOFが可用であることを示し、sps_bdof_enabled_flagが0である場合、true双予測基盤のBDOFが可用でないことを示すことができる。
前記表18のように、DMVRの可用可否を示すシンタックス要素(例:sps_dmvr_enabled_flag)と、BDOFの可用可否を示すシンタックス要素(例:sps_bdof_enabled_flag)と、を利用してDMVR及びBDOFの適用条件をチェックすることができる。
図6は、DMVR及びBDOFの適用条件をチェックしてデコーディング過程を実行する方法を示す一例である。
図6の方法は、前記表18のように、DMVRの可用可否を示すシンタックス要素(例:sps_dmvr_enabled_flag)と、BDOFの可用可否を示すシンタックス要素(例:sps_bdof_enabled_flag)と、を利用する場合に適用されることができる。
図6を参照すると、デコーディング装置は、現在ブロックに対する動き情報(例:動きベクトル、参照ピクチャインデックス等)を誘導することができる(S600)。
デコーディング装置は、DMVRの適用条件をチェックすることができる(S610)。このとき、DMVRの可用可否を示すシンタックス要素(例:sps_dmvr_enabled_flag)に基づいてDMVRの適用条件をチェックすることができる。例えば、DMVRが可用な場合(例えば、sps_dmvr_enabled_flagが1である場合)にDMVRの適用条件をチェックすることができる。
デコーディング装置は、DMVRの適用条件を満たすかどうかによってDMVR過程を適用するかどうかを判断することができる(S620)。
DMVRの適用条件を全て満たす場合、デコーディング装置は、DMVR過程を適用してリファインされた動き情報を導出することができる(S630)。DMVRの適用条件のうち一つ以上満たさない場合、デコーディング装置は、DMVR過程を適用しない。
デコーディング装置は、DMVRを適用した場合に導出されたリファインされた動き情報またはDMVRを適用しない場合に導出された(リファインされない)動き情報に基づいて現在ブロックの予測サンプルを誘導することができる(S640)。
そして、デコーディング装置は、BDOFの適用条件をチェックすることができる(S650)。このとき、BDOFの可用可否を示すシンタックス要素(例:sps_bdof_enabled_flag)に基づいてBDOFの適用条件をチェックすることができる。例えば、BDOFが可用な場合(例えば、sps_bdof_enabled_flagが1である場合)にBDOFの適用条件をチェックすることができる。
BDOFの適用条件を全て満たす場合、デコーディング装置は、BDOF過程を適用して予測サンプルに対してリファインを実行することができる(S670)。BDOFの適用条件のうち一つ以上満たさない場合、デコーディング装置は、BDOF過程を適用しない。
デコーディング装置は、現在ブロックに対するレジデュアルサンプルを誘導し(S680)、前記レジデュアルサンプルと前記BDOFを適用した場合に導出されたリファインされた予測サンプルまたはBDOFを適用しない場合に導出された(リファインされない)予測サンプルに基づいて復元されたサンプルを誘導することができる(S690)。
本文書では前述したようにDMVRとBDOFを適用するにあたって、相互間の適用条件を一致(harmonization)させてコーディング効率を向上させて複雑度を減少させることができる多様な実施例を提案した。このような本文書の実施例によるDMVRとBDOFの適用条件をチェックしてデコーディング過程に適用するにあたって、各々の条件を別にチェックして適用することもできるが、コーディング効率を向上させるために一度に適用条件をチェックすることもできる。即ち、本文書ではDMVRとBDOFの適用条件を一度に統合してチェックできる方案を提案する。
本文書の一実施例として、SPS(Sequence Parameter Set)シンタックスでデコーディング装置でのリファイン適用可否を示す情報(例:sps_refinement_enabled_flag)をシグナリングすることで、DMVR/BDOFの適用条件チェック過程を実行することができる。以下の表19は、SPSシンタックスを介してシグナリングされるデコーディング装置でのリファイン適用可否を示すシンタックス要素(例:sps_refinement_enabled_flag)の一例を示す。
Figure 2022521542000020
前記表19を参照すると、SPSシンタックスでsps_refinement_enabled_flagをシグナリングすることができ、このシンタックス要素に基づいてデコーディング装置でのリファイン適用が可能かどうかを示すことができる。例えば、sps_refinement_enabled_flagが存在する時(即ち、sps_refinement_enabled_flagがtrueである場合)、デコーディング装置でのリファイン適用が可能であると判断されることができる。この場合、デコーディング装置は、DMVRが可用(enable)であるかどうかを示すsps_dmvr_enabled_flagシンタックス要素及びBDOFが可用(enable)であるかどうかを示すsps_bdof_enabled_flagシンタックス要素を取得し、DMVRとBDOFの適用条件を判断することができる。
図7及び図8は、DMVR及びBDOFの適用条件をチェックしてデコーディング過程を実行する方法を示す他の例である。
図7の方法及び図8の方法は、前記表19のようにデコーディング装置でのリファイン適用が可能かどうかを示すシンタックス要素(例:sps_refinement_enabled_flag)を利用する場合に適用されることができる。また、図7及び図8は、前述した図6と重複する内容に関しては説明を省略する。
図7を参照すると、前記図6の過程と比較してDMVR及びBDOFの適用条件を各々チェックせずに、以前ステップで一度にチェックすることを知ることができる。一実施例として、図7のステップS710において、デコーディング装置は、リファイン適用条件をチェックすることができる。このとき、リファイン適用条件チェックは、前記表19のようなsps_refinement_enabled_flagに基づいて実行されることができる。例えば、sps_refinement_enabled_flagが1である場合、DMVRが可用(enable)であるかどうかを示すsps_dmvr_enabled_flagシンタックス要素またはBDOFが可用(enable)であるかどうかを示すsps_bdof_enabled_flagシンタックス要素を取得し、これに基づいてDMVR及びBDOFの適用条件をチェックすることができる。
また、図8を参照すると、前記図6の過程と比較してDMVR及びBDOFの適用条件を各々チェックせずに、以前ステップで一度にチェックし、他の条件に対しては簡単なチェック過程(BDOFの適用条件)を実行することができる。一実施例として、図8のステップS810において、デコーディング装置は、リファイン適用条件をチェックすることができる。以後、図8のステップS850において、デコーディング装置は、前記リファイン適用条件と異なる条件を有するBDOFの適用条件に対して追加的に簡単にチェックを実行することができる。
一方、現在ブロックの長さ(Height)または大きさ(Height*Width)が特定長さまたは特定大きさより小さい場合、動き補償(Motion Compensation)のためのmultiplication/additionの計算比率が増加するようになる。したがって、本文書の一実施例ではworst caseを減らすためにDMVRの適用条件のように、小さい長さまたは小さい大きさのブロックに対してBDOFの適用を制限することができる。この場合、BDOFの適用条件は、以下の表20に提示された条件を含むことができる。
Figure 2022521542000021
前記表20を参照すると、現在ブロックの大きさと関連した条件(例:CbHeight、CbWidth)を追加することによって、特定大きさより小さいブロックに対してBDOFを適用しないようにすることができる。例えば、現在ブロックの長さ(例:CbHeight)が8以上である場合に適用する条件と、現在ブロックの大きさ(例:CbHeight*CbWidth)が64以上である場合に適用する条件と、を使用することができる。このような現在ブロックの大きさと関連した適用条件を満たす場合(即ち、現在ブロックの長さが8以上であり、現在ブロックの長さ*幅が64以上である場合)にBDOFを適用し、前記のような現在ブロックの大きさと関連した適用条件を満たさない場合にBDOFを適用しない。
また、本実施例では現在ブロックの大きさと関連した条件(例:CbHeight、CbHeight*CbWidth)と共に、前記表20で羅列されたその他の適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表20に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表20に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表20の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
一方、現在ブロックにMMVDが適用される場合、MMVDに対する情報(例:mmvd index)に基づいて動き情報を誘導することができる。ここで、MMVDに対する情報は、ベース(base)MVのインデックス、距離インデックス(distance index)、方向インデックス(direction index)などを含むことができる。特に、距離インデックス(より具体的に、mmvd_distance_index[xCb][yCb])は、ベースMVとの距離を示すために使われ、例えば、距離インデックス0乃至7は、各々、{1/4、1/2、1、2、4、8、16、32}などで表すことができる。DMVR及びBDOFで動き情報のリファインメントを決定するにあたって、隣接ピクセル(隣接サンプル)を考慮してリファインメント可否を決定し、このとき、隣接ピクセルとベースMVとの距離が遠い場合、距離インデックスの値も大きくなる。このような場合、隣接ピクセルを考慮することがDMVR及びBDOFの性能向上を容易にしない。したがって、本文書では距離インデックス(より具体的に、mmvd_distance_index[xCb][yCb])値によって、DMVR及びBDOFの適用可否を決定することができる方案を提案する。
本文書の一実施例として、距離インデックスを考慮してDMVRの適用可否を決定することができ、この場合、DMVRの適用条件は、以下の表21に提示された条件を含むことができる。
Figure 2022521542000022
前記表21を参照すると、DMVRの適用条件のうちMMVDと関連した条件(例:mmvd_flag)を変更することによって、MMVDモード時に制限的にDMVRを適用することができる。例えば、mmvd_flagが1であり、mmvd_distance_indexが4より大きい場合、MMVDの距離インデックス条件を満たすと定めることができる。したがって、MMVDモードが適用される時、距離インデックス(例:mmvd_distance_index[xCb][yCb])値によってDMVRの適用可否を決定することができる。
ここで、mmvd_distance_indexのための閾値(threshold)を4に設定したが、これは一つの例示に過ぎず、性能及びコーディング効率によって多様な数値に変更されることができる。
したがって、本実施例ではMMVD適用可否条件(例:mmvd_flag)、MMVDの距離インデックス条件(例:mmvd_distance_index)と共に、前記表21に羅列されたその他の適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表21に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表21に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表21の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
また、本文書の一実施例として、距離インデックスを考慮してBDOFの適用可否を決定することができ、この場合、BDOFの適用条件は、以下の表22に提示された条件を含むことができる。
Figure 2022521542000023
前記表22を参照すると、マージモード/スキップモード可否条件(例:merge_flag)、MMVDと関連した条件(例:mmvd_flag、mmvd_distance_index)を追加することによって、MMVDモード時に制限的にBDOFを適用することができる。例えば、merge_flagが存在しない(即ち、merge_flagが1でない場合)、または、merge_flagが1であり、mmvd_flagが1であり、mmvd_distance_indexが4より大きい場合、MMVDモード時に制限的にBDOFを適用する条件を満たすと定めることができる。したがって、MMVDモードが適用される時、距離インデックス(例:mmvd_distance_index[xCb][yCb])値によってBDOFの適用可否を決定することができる。
ここで、mmvd_distance_indexのための閾値(threshold)を4に設定したが、これは一つの例示に過ぎず、性能及びコーディング効率によって多様な数値に変更されることができる。
したがって、本実施例ではマージモード/スキップモード可否条件(例:merge_flag)、MMVDと関連した条件(例:mmvd_flag、mmvd_distance_index)と共に、前記表22に羅列されたその他の適用条件に基づいてBDOFの適用可否を判断することができる。
即ち、デコーディング装置は、前記表22に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表22に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、BDOFを適用しない。このような前記表22の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表21または前記表22で羅列された条件に基づいて、true双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることができ、またはDMVR及びBDOFのための同一条件に適用されることができる。
一方、前述したように、現在ブロックにイントラ予測とインター予測を同時に実行するCIIP(Combined intra-inter prediction)モードが適用されることができる。この場合、インター予測が実行された予測ブロック(インターブロック)は、イントラ予測方法と結合(combine)されて最終的に予測サンプル値が生成されるため、予測正確度が向上することができる。しかし、DMVR及びBDOFは、インターブロックに対してリファインメントする技術であるため、複雑度対比性能面でCIIPモードの適用が必要でない。したがって、本文書ではCIIPを考慮してDMVR及びBDOFの適用可否を決定することができる方案を提案する。
本文書の一実施例として、CIIPを考慮してDMVRの適用可否を決定することができ、この場合、DMVRの適用条件は、以下の表23に提示された条件を含むことができる。
Figure 2022521542000024
前記表23を参照すると、CIIPモード適用可否条件(例:ciip_flag)を追加することによって、CIIP適用可否によってDMVRを制限的に適用できる。例えば、ciip_flagが0である場合(即ち、CIIPモードが適用されない場合)、CIIPモード適用可否条件を満たすと判断してDMVRを適用することができる。
したがって、本実施例ではCIIPモード適用可否条件(例:ciip_flag)と共に、前記表23に羅列されたその他の適用条件に基づいてDMVR適用可否を判断することができる。
即ち、デコーディング装置は、前記表23に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にDMVRを適用してtrue双予測を実行することができる。もし、前記表23に羅列された条件のうち一つでも満たされない場合、デコーディング装置は、DMVRを適用しない。このような前記表23の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
また、本文書の一実施例として、CIIPを考慮してBDOFの適用可否を決定することができ、この場合、BDOFの適用条件は、以下の表24に提示された条件を含むことができる。
Figure 2022521542000025
前記表24を参照すると、CIIPモード適用可否条件(例:ciip_flag)を追加することによって、CIIP適用可否によってBDOFを制限的に適用できる。例えば、ciip_flagが0である場合(即ち、CIIPモードが適用されない場合)、CIIPモード適用可否条件を満たすと判断してBDOFを適用することができる。
したがって、本実施例ではCIIPモード適用可否条件(例:ciip_flag)と共に、前記表24に羅列されたその他の適用条件に基づいてBDOF適用可否を判断することができる。
即ち、デコーディング装置は、前記表24に羅列された全ての条件が満たされるかどうかを決定し、全ての条件が満たされる場合にBDOFを適用してtrue双予測を実行することができる。もし、前記表24に羅列された条件のうち一つでも満たされない場合、デコーディング装置はBDOFを適用しない。このような前記表24の条件は、エンコーディング装置でも適用されることができ、エンコーディング装置ではデコーディング装置と対応される方法で実行されることができる。
前記表23または前記表24で羅列された条件に基づいてtrue双予測を実行する方法は、DMVR及びBDOFに独立的に適用されることができ、またはDMVR及びBDOFのための同一条件に適用されることができる。
前述した本文書の実施例による表3乃至表24で羅列された方法は、組み合わせて適用されることができる。即ち、リファイン適用条件をチェックすることによってDMVR及びBDOFの適用可否を判断することができ、以下の表25のような条件を適用することができる。
Figure 2022521542000026
前記表25を参照すると、DMVRまたはBDOFが適用される時、両方向予測である場合に適用する条件、現在ピクチャと両方向参照ピクチャとの距離が相互同じなtrue双予測である場合に適用する条件、MMVDモードが使われない場合に適用する条件、アフィン予測でない場合に適用する条件、サブブロック基盤のマージモードでない場合に適用する条件、GBiインデックスがデフォルトである場合に適用する条件を利用することができる。即ち、前記条件を満たすかどうかによってDMVRまたはBDOFの適用可否を判断することができる。
また、前述したように、DMVRのためにマージモードかどうかを判断し、またはBDOFのためにルマブロックかどうかを判断する等の条件が追加されることもできる。
前記表25で羅列された適用条件は、一つの例示に過ぎず、前述した実施例(前記表3乃至表24の実施例)で羅列した多様な条件を組み合わせて使われることができることは自明である。
図9は、本文書の一実施例によるエンコーディング装置により実行されることができるエンコーディング方法を概略的に示す流れ図である。
図9に開示された方法は、図2で開示されたエンコーディング装置200により実行されることができる。具体的に、図9のステップS900~S930は、図2に開示された予測部220及びインター予測部221により実行されることができ、図9のステップS940は、図2に開示されたレジデュアル処理部230により実行されることができ、図9のステップS950は、図2に開示されたエントロピーエンコーディング部240により実行されることができる。また、図9で開示された方法は、本文書で詳述した実施例を含むことができる。したがって、図9では前述した実施例と重複する内容に関して具体的な説明を省略または簡単にする。
図9を参照すると、エンコーディング装置は、現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVRの適用条件を満たすかどうかを判断することができる(S900)。
即ち、エンコーディング装置は、コーディング効率、複雑度、予測性能などを考慮して動きベクトルリファインメントを適用するかどうかを判断することができる。このとき、エンコーディング装置は、前記表1乃至表25で説明した多様な適用条件を利用して現在ブロックに対してリファインメントを適用するかどうかを判断することができる。
一実施例として、エンコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかをDMVRの適用条件として使用することができる。即ち、エンコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、DMVRの適用条件を満たすと判断できる。
ここで、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかは、CIIP(combined inter and intra prediction)フラグ情報(例:ciip_flag)を介して示すことができる。例えば、ciip_flagが0である場合、現在ブロックにCIIPモード(即ち、インター予測とイントラ予測が結合された予測モード)が適用されないことを示すことができ、ciip_flagが1である場合、現在ブロックにCIIPモードが適用されたことを示すことができる。または、その反対の場合に定められることもできる。
エンコーディング装置は、このように現在ブロックにCIIPモードが適用されたかどうかによってciip_flagの値を決定し、この情報をエンコーディングしてデコーディング装置にシグナリングできる。
また、実施例によって、エンコーディング装置は、DMVRの適用条件として下記の条件をさらに含むことができる。
1)DMVR基盤のインター双予測(inter bi-prediction)が可用な(enable)場合、例えば、sps_dmvr_enabled_flagが1である場合
2)現在ブロックにマージモードが適用される場合、例えば、merge_flagが1である場合
3)現在ブロックにMMVD(merge mode with motion vector difference)モードが適用されない場合、例えば、mmvd_flagが0である場合
4)現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、例えば、predFlagL0[0][0]=1であり、predFlagL0[1][1]=1である場合
5)現在ピクチャを基準にして、L0参照ピクチャとの距離と、L1参照ピクチャとの距離と、が互いに同じ場合、例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])が0である場合
6)現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、例えば、GbiIdxが0である場合
7)現在ブロックの長さ(Height)が8以上である場合、例えば、CbHeightが8以上である場合
8)現在ブロックの幅(Width)が8以上である場合、例えば、CbWidthが8以上である場合
9)現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合、例えば、CbHeight*CbWidthが64より大きい場合
エンコーディング装置は、前記1)乃至前記9)のうち少なくとも一つ以上または全て満たす場合、DMVRの適用条件を満たすと判断できる。
ここで、DMVRの適用条件を満たすかどうかを判断するにあたって、前記羅列されたDMVRの適用条件は、一つの例示に過ぎず、前述した表1乃至表25の条件を多様に組み合わせて使われることができる。
エンコーディング装置は、前記CIIPモード適用条件、または、これと共に前記1)乃至9)のDMVR適用条件を満たすと判断した場合、現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出することができる(S910)。エンコーディング装置は、最小SADに基づいて現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出することができる(S920)。
ここで、L0動きベクトル及びL1動きベクトルは、現在ブロックに対してマージモード/スキップモードを適用して導出されたL0予測方向の動きベクトル及びL1予測方向の動きベクトルである。例えば、エンコーディング装置は、現在ブロックにスキップモードまたはマージモードが適用されるかどうかを判断することができる。現在ブロックにスキップモードまたはマージモードが適用される場合、エンコーディング装置は、現在ブロックの隣接ブロックに基づいてマージ候補リストを構成することができる。このとき、マージ候補リストに含まれているマージ候補が指す参照ブロックのうち現在ブロックとの差が最小または一定基準以下である参照ブロックを導出することができる。この場合、導出された参照ブロックと関連したマージ候補が選択され、選択されたマージ候補を指すマージインデックス情報が生成されてデコーディング装置にシグナリングされることができる。このとき、選択されたマージ候補の動き情報(動きベクトル、参照ピクチャインデックス等)を利用して現在ブロックの動き情報(動きベクトル、参照ピクチャインデックス等)が導出されることができる。即ち、現在ブロックのL0動きベクトル及びL1動きベクトルは、現在ブロックの隣接ブロックのうちマージインデックスにより指示される隣接ブロックの動きベクトルに基づいて導出されることができる。
また、例えば、エンコーディング装置は、現在ブロックにマージモードが適用される場合、マージインデックスにより指示されるマージ候補(即ち、隣接ブロック)に双予測(bi-prediction)が適用されるかどうかを判断することができる。マージインデックスにより指示される隣接ブロックに双予測が適用される場合、エンコーディング装置は、マージインデックスにより指示される隣接ブロックのL0予測方向の動きベクトル及びL1予測方向の動きベクトルを含む動き情報を導出することができる。
一実施例として、エンコーディング装置は、L0動きベクトルに基づいて導出されるL0参照ピクチャでの予測サンプル(即ち、L0予測サンプル)と、L1動きベクトルに基づいて導出されるL1参照ピクチャでの予測サンプル(即ち、L1予測サンプル)と、の間の最小SADを有するサンプル領域を計算することができる。そして、最小SADを有するサンプル領域に基づいて、L0動きベクトル及びL1動きベクトルに対してDMVR基盤のリファインを実行することができる。最小SADを計算してリファインメントを実行する過程は、図4及び図5を参照して説明したため、ここでは具体的な説明を省略する。
このとき、DMVR基盤のリファインを実行するにあたって、エンコーディング装置は、L0参照ピクチャと現在ピクチャとの間の距離と、L1参照ピクチャと現在ピクチャとの間の距離と、が同じ場合、リファインを実行することで、リファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出することができる。
エンコーディング装置は、リファインされたL0動きベクトル及びリファインされたL1動きベクトルに基づいて現在ブロックに対する予測サンプルを導出することができる(S930)。
実施例によって、エンコーディング装置は、現在ブロックの予測サンプルに対してリファインメントを適用するためのBDOFの適用条件を満たすかどうかを判断することができる。即ち、エンコーディング装置は、コーディング効率、複雑度、予測性能などを考慮して予測信号にリファインメントを適用することができる。このとき、エンコーディング装置は、前記表1乃至表25で説明した多様な適用条件を利用して現在ブロックの予測サンプルに対してリファインメントを適用するかどうかを判断することができる。
例えば、エンコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかをBDOFの適用条件として使用することができる。前述したように、CIIPフラグ情報(例:ciip_flag)の値が0である場合、エンコーディング装置は、BDOFの適用条件を満たすと判断できる。
また、実施例によって、エンコーディング装置は、BDOFの適用条件として下記の条件をさらに含むことができる。
1)BDOF基盤のインター予測が可用な(enable)場合、例えば、sps_bdof_enabled_flagが1である場合
2)現在ブロックにサブブロック基盤のマージモードが適用されない場合、例えば、merge_subblock_flagが0である場合
3)現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、例えば、predFlagL0=1であり、predFlagL1=1である場合
4)現在ピクチャを基準にして、L0参照ピクチャとの距離と、L1参照ピクチャとの距離と、が互いに同じ場合、例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])が0である場合
5)現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、例えば、GbiIdxが0である場合
6)現在ブロックにアフィンモードが適用されない場合、例えば、MotionModelIdcが0である場合
7)現在ブロックの長さ(Height)が8以上である場合、例えば、CbHeightが8以上である場合
8)現在ブロックの幅(Width)が8以上である場合、例えば、CbWidthが8以上である場合
9)現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合、例えば、CbHeight*CbWidthが64より大きい場合
エンコーディング装置は、前記1)乃至前記9)のうち少なくとも一つ以上または全て満たす場合、BDOFの適用条件を満たすと判断できる。
ここで、BDOFの適用条件を満たすかどうかを判断するにあたって、前記羅列されたBDOFの適用条件は、一つの例示に過ぎず、前述した表1乃至表25の条件を多様に組み合わせて使われることができる。
エンコーディング装置は、前記CIIPモード適用条件、または、これと共に前記1)乃至9)のBDOF適用条件を満たすと判断した場合、現在ブロックの予測サンプルに対してBDOFサンプル予測過程を適用することができる。これにより、リファインされた予測サンプルを導出することによって、予測性能を向上させることができる。
エンコーディング装置は、予測サンプルに基づいてレジデュアルサンプルを導出し(S940)、レジデュアルサンプルに関する情報を含む映像情報をエンコーディングすることができる(S950)。
即ち、エンコーディング装置は、現在ブロックに対する原本サンプルと現在ブロックの予測サンプルとに基づいてレジデュアルサンプルを導出することができる。そして、エンコーディング装置は、レジデュアルサンプルに対する情報を生成することができる。ここで、レジデュアルサンプルに対する情報は、レジデュアルサンプルに変換及び量子化を実行して導出された量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。
エンコーディング装置は、レジデュアルサンプルに関する情報をエンコーディングしてビットストリームに出力し、これをネットワークまたは格納媒体を介してデコーディング装置に送信できる。
また、エンコーディング装置は、前述したステップS900乃至S930で導出された情報をエンコーディングしてビットストリームに出力できる。例えば、CIIPフラグ情報、DMVR可用フラグ情報、マージフラグ情報、MMVDフラグ情報、BDOF可用フラグ情報、サブブロック基盤のマージフラグ情報などが映像情報に含まれてエンコーディングされることができ、このようなエンコーディングされた映像情報は、デコーディング装置にシグナリングされることができる。
図10は、文書の一実施例によってデコーディング装置により実行されることができるデコーディング方法を概略的に示す流れ図である。
図10に開示された方法は、図3で開示されたデコーディング装置300により実行されることができる。具体的に、図10のステップS1000~S1030は、図3に開示された予測部330及びインター予測部332により実行されることができ、図10のステップS1040は、図3に開示された加算部340により実行されることができる。また、図10で開示された方法は、本文書で詳述した実施例を含むことができる。したがって、図10では前述した実施例と重複する内容に関して具体的な説明を省略または簡単にする。
図10を参照すると、デコーディング装置は、現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVRの適用条件を満たすかどうかを判断することができる(S1000)。
このとき、デコーディング装置は、前記表1乃至表25で説明した多様な適用条件を利用して現在ブロックに対してリファインメントを適用するかどうかを判断することができる。
一実施例として、デコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかをDMVRの適用条件として使用することができる。即ち、デコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、DMVRの適用条件を満たすと判断できる。
ここで、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかは、CIIP(combined inter and intra prediction)フラグ情報(例:ciip_flag)を介して示すことができる。例えば、ciip_flagが0である場合、現在ブロックにCIIPモード(即ち、インター予測とイントラ予測が結合された予測モード)が適用されないことを示すことができ、ciip_flagが1である場合、現在ブロックにCIIPモードが適用されたことを示すことができる。または、その反対の場合に定められることもできる。
例えば、デコーディング装置は、エンコーディング装置からビットストリームを取得し、ビットストリームに含まれているCIIPフラグ情報をデコーディングすることができる。そして、デコーディング装置は、CIIPフラグ情報の値が0である場合にDMVRの適用条件を満たすと判断できる。
また、実施例によって、DMVRの適用条件は、下記の条件をさらに含むことができる。
1)DMVR基盤のインター双予測(inter bi-prediction)が可用な(enable)場合、例えば、sps_dmvr_enabled_flagが1である場合
2)現在ブロックにマージモードが適用される場合、例えば、merge_flagが1である場合
3)現在ブロックにMMVD(merge mode with motion vector difference)モードが適用されない場合、例えば、mmvd_flagが0である場合
4)現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、例えば、predFlagL0[0][0]=1であり、predFlagL0[1][1]=1である場合
5)現在ピクチャを基準にして、L0参照ピクチャとの距離と、L1参照ピクチャとの距離と、が互いに同じ場合、例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])が0である場合
6)現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、例えば、GbiIdxが0である場合
7)現在ブロックの長さ(Height)が8以上である場合、例えば、CbHeightが8以上である場合
8)現在ブロックの幅(Width)が8以上である場合、例えば、CbWidthが8以上である場合
9)現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合、例えば、CbHeight*CbWidthが64より大きい場合
デコーディング装置は、前記1)乃至前記9)のうち少なくとも一つ以上または全て満たす場合、DMVRの適用条件を満たすと判断できる。
ここで、DMVRの適用条件を満たすかどうかを判断するにあたって、前記羅列されたDMVRの適用条件は、一つの例示に過ぎず、前述した表1乃至表25の条件を多様に組み合わせて使われることができる。
デコーディング装置は、前記CIIPモード適用条件、または、これと共に前記1)乃至9)のDMVR適用条件を満たすと判断した場合、現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出することができる(S1010)。デコーディング装置は、最小SADに基づいて現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出することができる(S1020)。
ここで、L0動きベクトル及びL1動きベクトルは、現在ブロックに対してマージモード/スキップモードを適用して導出されたL0予測方向の動きベクトル及びL1予測方向の動きベクトルである。例えば、デコーディング装置は、現在ブロックにスキップモードまたはマージモードが適用されるかどうかを判断することができる。現在ブロックにスキップモードまたはマージモードが適用される場合、デコーディング装置は、現在ブロックの隣接ブロックに基づいてマージ候補リストを構成することができる。このとき、エンコーディング装置からシグナリングされるマージインデックス情報(merge index)に基づいてマージ候補リストから一つのマージ候補が選択されることができる。デコーディング装置は、選択されたマージ候補の動き情報(動きベクトル、参照ピクチャインデックス等)を利用して現在ブロックの動き情報(動きベクトル、参照ピクチャインデックス等)を導出することができる。即ち、マージ候補リストに含まれているマージ候補のうちマージインデックスにより選択されたマージ候補の動き情報が現在ブロックの動き情報として利用されることができる。即ち、現在ブロックのL0動きベクトル及びL1動きベクトルは、現在ブロックの隣接ブロックのうちマージインデックスにより指示される隣接ブロックの動きベクトルに基づいて導出されることができる。
また、例えば、デコーディング装置は、現在ブロックにマージモードが適用される場合、マージインデックスにより指示されるマージ候補(即ち、隣接ブロック)に双予測(bi-prediction)が適用されるかどうかを判断することができる。マージインデックスにより指示される隣接ブロックに双予測が適用される場合、デコーディング装置は、マージインデックスにより指示される隣接ブロックのL0予測方向の動きベクトル及びL1予測方向の動きベクトルを含む動き情報を導出することができる。
一実施例として、デコーディング装置は、L0動きベクトルに基づいて導出されるL0参照ピクチャでの予測サンプル(即ち、L0予測サンプル)と、L1動きベクトルに基づいて導出されるL1参照ピクチャでの予測サンプル(即ち、L1予測サンプル)と、の間の最小SADを有するサンプル領域を計算することができる。そして、最小SADを有するサンプル領域に基づいて、L0動きベクトル及びL1動きベクトルに対してDMVR基盤のリファインを実行することができる。最小SADを計算してリファインメントを実行する過程は、図4及び図5を参照して説明したため、ここでは具体的な説明を省略する。
このとき、DMVR基盤のリファインを実行するにあたって、デコーディング装置は、L0参照ピクチャと現在ピクチャとの間の距離と、L1参照ピクチャと現在ピクチャとの間の距離と、が同じ場合、リファインを実行することで、リファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出することができる。
デコーディング装置は、リファインされたL0動きベクトル及びリファインされたL1動きベクトルに基づいて現在ブロックに対する予測サンプルを導出することができる(S1030)。
実施例によって、デコーディング装置は、現在ブロックの予測サンプルに対してリファインメントを適用するためのBDOFの適用条件を満たすかどうかを判断することができる。
このとき、デコーディング装置は、前記表1乃至表25で説明した多様な適用条件を利用して現在ブロックの予測サンプルに対してリファインメントを適用するかどうかを判断することができる。
例えば、デコーディング装置は、現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されたかどうかをBDOFの適用条件として使用することができる。前述したように、ビットストリームから取得されるCIIPフラグ情報(例:ciip_flag)の値が0である場合、デコーディング装置は、BDOFの適用条件を満たすと判断できる。
また、実施例によって、BDOFの適用条件は、下記の条件をさらに含むことができる。
1)BDOF基盤のインター予測が可用な(enable)場合、例えば、sps_bdof_enabled_flagが1である場合
2)現在ブロックにサブブロック基盤のマージモードが適用されない場合、例えば、merge_subblock_flagが0である場合
3)現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、例えば、predFlagL0=1であり、predFlagL1=1である場合
4)現在ピクチャを基準にして、L0参照ピクチャとの距離と、L1参照ピクチャとの距離と、が互いに同じ場合、例えば、DiffPicOrderCnt(currPic、RefPicList0[refIdxL0])-DiffPicOrderCnt(currPic、RefPicList1[refIdxL1])が0である場合
5)現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、例えば、GbiIdxが0である場合
6)現在ブロックにアフィンモードが適用されない場合、例えば、MotionModelIdcが0である場合
7)現在ブロックの長さ(Height)が8以上である場合、例えば、CbHeightが8以上である場合
8)現在ブロックの幅(Width)が8以上である場合、例えば、CbWidthが8以上である場合
9)現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合、例えば、CbHeight*CbWidthが64より大きい場合
デコーディング装置は、前記1)乃至前記9)のうち少なくとも一つ以上または全て満たす場合、BDOFの適用条件を満たすと判断できる。
ここで、BDOFの適用条件を満たすかどうかを判断するにあたって、前記羅列されたBDOFの適用条件は、一つの例示に過ぎず、前述した表1乃至表25の条件を多様に組み合わせて使われることができる。
デコーディング装置は、前記CIIPモード適用条件、または、これと共に前記1)乃至9)のBDOF適用条件を満たすと判断した場合、現在ブロックの予測サンプルに対してBDOFサンプル予測過程を適用することができる。これにより、リファインされた予測サンプルを導出することによって、予測性能を向上させることができる。
デコーディング装置は、予測サンプルに基づいて現在ブロックに対する復元サンプルを生成することができる(S1040)。
一実施例として、デコーディング装置は、予測モードによって予測サンプルを復元サンプルとして利用することもでき、または前記予測サンプルにレジデュアルサンプルを加えて復元サンプルを生成することもできる。
デコーディング装置は、現在ブロックに対するレジデュアルサンプルが存在する場合、現在ブロックに対するレジデュアルに関する情報を受信することができる。レジデュアルに関する情報は、レジデュアルサンプルに関する変換係数を含むことができる。デコーディング装置は、レジデュアル情報に基づいて現在ブロックに対するレジデュアルサンプル(または、レジデュアルサンプルアレイ)を導出することができる。デコーディング装置は、予測サンプルとレジデュアルサンプルに基づいて復元サンプルを生成することができ、前記復元サンプルに基づいて復元ブロックまたは復元ピクチャを導出することができる。
前述した実施例において、方法は、一連のステップまたはブロックで流れ図に基づいて説明されているが、本文書の実施例は、ステップの順序に限定されるものではなく、あるステップは、前述と異なるステップと、異なる順序にまたは同時に発生できる。また、当業者であれば、流れ図に示すステップが排他的でなく、他のステップが含まれ、または流れ図の一つまたはそれ以上のステップが本文書の範囲に影響を及ぼさずに削除可能であることを理解することができる。
前述した本文書による方法は、ソフトウェア形態で具現されることができ、本文書によるエンコーディング装置及び/またはデコーディング装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの映像処理を実行する装置に含まれることができる。
本文書で実施例がソフトウェアで具現される時、前述した方法は、前述した機能を遂行するモジュール(過程、機能など)で具現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあり、よく知られた多様な手段でプロセッサと連結されることができる。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。即ち、本文書で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて実行されることができる。例えば、各図面で示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて実行されることができる。この場合、具現のための情報(例えば、information on instructions)またはアルゴリズムがデジタル格納媒体に格納されることができる。
また、本文書が適用されるデコーディング装置及びエンコーディング装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、VR(virtual reality)装置、AR(argumente reality)装置、画像電話ビデオ装置、運送手段端末(例えば、車両(自律走行車両を含む)、飛行機端末、船舶端末等)、及び医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使われることができる。例えば、OTTビデオ(Over the top video)装置ではゲームコンソール、ブルーレイプレーヤ、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などを含むことができる。
また、本文書が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取り可能な記録媒体に格納されることができる。また、本文書によるデータ構造を有するマルチメディアデータもコンピュータが読み取り可能な記録媒体に格納されることができる。前記コンピュータが読み取り可能な記録媒体は、コンピュータで読み込むことができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取り可能な記録媒体は、例えば、ブルーレイディスク(BD)、汎用直列バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、及び光学的データ格納装置を含むことができる。また、前記コンピュータが読み取り可能な記録媒体は、搬送波(例えば、インターネットを介した送信)の形態で具現されたメディアを含む。また、エンコーディング方法で生成されたビットストリームが、コンピュータが読み取り可能な記録媒体に格納され、または有無線通信ネットワークを介して送信されることができる。
また、本文書の実施例は、プログラムコードによるコンピュータプログラム製品で具現されることができ、前記プログラムコードは、本文書の実施例によりコンピュータで実行されることができる。前記プログラムコードは、コンピュータにより読み取り可能なキャリア上に格納されることができる。
図11は、本文書で開示された実施例が適用されることができるコンテンツストリーミングシステムの例を示す。
図11を参照すると、本文書の実施例に適用されるコンテンツストリーミングシステムは、大別して、エンコーディングサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置及びマルチメディア入力装置を含むことができる。
前記エンコーディングサーバは、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置から入力されたコンテンツをデジタルデータで圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。他の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコーディングサーバは省略されることができる。
前記ビットストリームは、本文書の実施例に適用されるエンコーディング方法またはビットストリーム生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信または受信する過程で一時的に前記ビットストリームを格納することができる。
前記ストリーミングサーバは、ウェブサーバを介したユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割をする。
前記ストリーミングサーバは、メディア格納所及び/またはエンコーディングサーバからコンテンツを受信することができる。例えば、前記エンコーディングサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間格納することができる。
前記ユーザ装置の例として、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末(smartwatch)、グラス型端末(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイニジがある。
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

Claims (14)

  1. デコーディング装置により実行される映像デコーディング方法において、
    現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVR(Decoder-side Motion Vector Refinement)の適用条件を満たすかどうかを判断するステップ;
    前記DMVRの適用条件を満たす場合、前記現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出するステップ;
    前記最小SADに基づいて前記現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出するステップ;
    前記リファインされたL0動きベクトル及び前記リファインされたL1動きベクトルに基づいて前記現在ブロックに対する予測サンプルを導出するステップ;及び、
    前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成するステップ;を含み、
    前記DMVRの適用条件を満たすかどうかは、
    前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、前記DMVRの適用条件を満たすと判断されることを特徴とする映像デコーディング方法。
  2. ビットストリームから前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されるかどうかを示すCIIP(combined inter and intra prediction)フラグ情報を取得するステップをさらに含み、
    前記DMVRの適用条件を満たすかどうかは、
    前記CIIPフラグ情報の値が0である場合に前記DMVRの適用条件を満たすと判断されることを特徴とする請求項1に記載の映像デコーディング方法。
  3. 前記DMVRの適用条件を満たすかどうかは、
    1)前記DMVR基盤のインター双予測(inter bi-prediction)が可用な(enable)場合、2)前記現在ブロックにマージモードが適用される場合、3)前記現在ブロックにMMVD(merge mode with motion vector difference)モードが適用されない場合、4)前記現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、5)現在ピクチャを基準にして、前記L0参照ピクチャとの距離と、前記L1参照ピクチャとの距離と、が互いに同じ場合、6)前記現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、7)前記現在ブロックの長さ(Height)が8以上である場合、または8)前記現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合であるかを判断し、
    前記1)乃至前記8)を全て満たす場合に前記DMVRの適用条件を満たすと判断されることを特徴とする請求項1に記載の映像デコーディング方法。
  4. 前記予測サンプルに対してリファインメントを適用するためのBDOF(Bi-directional optical flow)の適用条件を満たすかどうかを判断するステップ;及び、
    前記BDOFの適用条件を満たす場合、前記予測サンプルに対して前記BDOFサンプル予測過程を適用するステップ;をさらに含むことを特徴とする請求項1に記載の映像デコーディング方法。
  5. 前記BDOFの適用条件を満たすかどうかは、
    ビットストリームから取得されるCIIPフラグ情報の値が0である場合に前記BDOFの適用条件を満たすと判断されることを特徴とする請求項4に記載の映像デコーディング方法。
  6. 前記BDOFの適用条件を満たすかどうかは、
    1)前記BDOF基盤のインター予測が可用な(enable)場合、2)前記現在ブロックにサブブロック基盤のマージモードが適用されない場合、3)前記現在ブロックにL0参照ピクチャ及びL1参照ピクチャに基づいて実行される双予測(bi-prediction)が適用される場合、4)現在ピクチャを基準にして、前記L0参照ピクチャとの距離と、前記L1参照ピクチャとの距離と、が互いに同じ場合、5)前記現在ブロックの双予測加重値インデックス(bi-prediction weight index)情報の値が0である場合、6)前記現在ブロックにアフィンモードが適用されない場合、7)前記現在ブロックの長さ(Height)が8以上である場合、または8)前記現在ブロックの長さ(Height)×幅(Width)が8×8より大きい場合であるかを判断し、
    前記1)乃至前記8)を全て満たす場合に前記BDOFの適用条件を満たすと判断されることを特徴とする請求項4に記載の映像デコーディング方法。
  7. 前記最小SADを導出するステップは、
    前記L0動きベクトルに基づいて導出されるL0参照ピクチャでの予測サンプルと、前記L1動きベクトルに基づいて導出されるL1参照ピクチャでの予測サンプルと、の間の前記最小SADを有するサンプル領域を計算するステップ;及び、
    前記最小SADを有する前記サンプル領域に基づいて前記L0動きベクトル及び前記L1動きベクトルに対してリファインを実行するステップ;を含むことを特徴とする請求項1に記載の映像デコーディング方法。
  8. 前記現在ブロックにマージモードが適用されるかどうかを判断するステップをさらに含み、
    前記現在ブロックにマージモードが適用される場合、前記L0動きベクトル及び前記L1動きベクトルは、前記現在ブロックの隣接ブロックのうちマージインデックスにより指示される隣接ブロックの動きベクトルに基づいて導出されて、
    前記リファインされたL0動きベクトル及び前記リファインされたL1動きベクトルは、前記L0参照ピクチャと現在ピクチャとの間の距離と、前記L1参照ピクチャと前記現在ピクチャとの間の距離と、が同じ場合に導出されることを特徴とする請求項7に記載の映像デコーディング方法。
  9. 前記現在ブロックにマージモードが適用される場合、前記マージインデックスにより指示される隣接ブロックに双予測(bi-prediction)が適用されるかどうかを判断するステップをさらに含み、
    前記マージインデックスにより指示される隣接ブロックに双予測が適用される場合、前記マージインデックスにより指示される隣接ブロックの動きベクトルは、L0予測方向の動きベクトル及びL1予測方向の動きベクトルを含むことを特徴とする請求項8に記載の映像デコーディング方法。
  10. エンコーディング装置により実行される映像エンコーディング方法において、
    現在ブロックに対して動きベクトルリファインメント(Refinement)を適用するためのDMVR(Decoder-side Motion Vector Refinement)の適用条件を満たすかどうかを判断するステップ;
    前記DMVRの適用条件を満たす場合、前記現在ブロックのL0動きベクトル及びL1動きベクトルに基づいて最小SAD(Sum of Absolute Differences)を導出するステップ;
    前記最小SADに基づいて前記現在ブロックに対するリファインされたL0動きベクトル及びリファインされたL1動きベクトルを導出するステップ;
    前記リファインされたL0動きベクトル及び前記リファインされたL1動きベクトルに基づいて前記現在ブロックに対する予測サンプルを導出するステップ;
    前記予測サンプルに基づいてレジデュアルサンプルを導出するステップ;及び、
    前記レジデュアルサンプルに関する情報を含む映像情報をエンコーディングするステップ;を含み、
    前記DMVRの適用条件を満たすかどうかは、
    前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されない場合、前記DMVRの適用条件を満たすと判断されることを特徴とする映像エンコーディング方法。
  11. 前記映像情報は、
    前記現在ブロックにインター予測とイントラ予測が結合された予測モードが適用されるかどうかを示すCIIP(combined inter and intra prediction)フラグ情報を含んでエンコーディングされることを特徴とする請求項10に記載の映像エンコーディング方法。
  12. 前記DMVRの適用条件を満たすかどうかは、
    前記CIIPフラグ情報の値が0である場合に前記DMVRの適用条件を満たすと判断されることを特徴とする請求項11に記載の映像エンコーディング方法。
  13. 前記予測サンプルに対してリファインメントを適用するためのBDOF(Bi-directional optical flow)の適用条件を満たすかどうかを判断するステップ;及び、
    前記BDOFの適用条件を満たす場合、前記予測サンプルに対して前記BDOFサンプル予測過程を適用するステップ;をさらに含むことを特徴とする請求項10に記載の映像エンコーディング方法。
  14. 前記BDOFの適用条件を満たすかどうかは、
    前記映像情報に含まれるCIIPフラグ情報の値が0である場合に前記BDOFの適用条件を満たすと判断されることを特徴とする請求項13に記載の映像エンコーディング方法。
JP2021549543A 2019-02-24 2020-02-07 Dmvr基盤のインター予測方法及び装置 Active JP7425079B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023167521A JP2023165935A (ja) 2019-02-24 2023-09-28 Dmvr基盤のインター予測方法及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962809722P 2019-02-24 2019-02-24
US62/809,722 2019-02-24
PCT/KR2020/001785 WO2020171444A1 (ko) 2019-02-24 2020-02-07 Dmvr 기반의 인터 예측 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023167521A Division JP2023165935A (ja) 2019-02-24 2023-09-28 Dmvr基盤のインター予測方法及び装置

Publications (2)

Publication Number Publication Date
JP2022521542A true JP2022521542A (ja) 2022-04-08
JP7425079B2 JP7425079B2 (ja) 2024-01-30

Family

ID=72144372

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021549543A Active JP7425079B2 (ja) 2019-02-24 2020-02-07 Dmvr基盤のインター予測方法及び装置
JP2023167521A Pending JP2023165935A (ja) 2019-02-24 2023-09-28 Dmvr基盤のインター予測方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023167521A Pending JP2023165935A (ja) 2019-02-24 2023-09-28 Dmvr基盤のインター予測方法及び装置

Country Status (7)

Country Link
US (1) US11627323B2 (ja)
EP (1) EP3913921A4 (ja)
JP (2) JP7425079B2 (ja)
KR (1) KR20210111859A (ja)
CN (1) CN113574891B (ja)
MX (1) MX2021010158A (ja)
WO (1) WO2020171444A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7410191B2 (ja) 2019-06-24 2024-01-09 華為技術有限公司 ビデオエンコーダ、ビデオデコーダ、及び対応する方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3922028A4 (en) * 2019-03-08 2022-08-10 Beijing Dajia Internet Information Technology Co., Ltd. BIDIRECTIONAL OPTICAL FLOW AND DECODER-SIDE MOTION VECTOR REFINEMENT FOR VIDEO ENCODING
ES2957801T3 (es) * 2019-03-12 2024-01-25 Lg Electronics Inc Método y dispositivo de inter predicción basándose en DMVR y BDOF
WO2020186119A1 (en) * 2019-03-12 2020-09-17 Beijing Dajia Internet Information Technology Co., Ltd. Constrained and adjusted applications of combined inter- and intra-prediction mode
KR20240010536A (ko) * 2019-03-22 2024-01-23 엘지전자 주식회사 Dmvr 기반의 인터 예측 방법 및 장치
US11223840B2 (en) * 2019-08-19 2022-01-11 Tencent America LLC Method and apparatus for video coding
US11805245B2 (en) * 2021-08-16 2023-10-31 Mediatek Inc. Latency reduction for reordering prediction candidates
US11917165B2 (en) * 2021-08-16 2024-02-27 Tencent America LLC MMVD signaling improvement
WO2023055176A1 (ko) * 2021-10-01 2023-04-06 엘지전자 주식회사 디코더 사이드 움직임 벡터 리파인먼트 기반 영상 코딩 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020098643A1 (en) * 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011129672A2 (ko) * 2010-04-16 2011-10-20 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US11638027B2 (en) * 2016-08-08 2023-04-25 Hfi Innovation, Inc. Pattern-based motion vector derivation for video coding
WO2018174618A1 (ko) * 2017-03-22 2018-09-27 한국전자통신연구원 참조 블록을 사용하는 예측 방법 및 장치
US10477237B2 (en) * 2017-06-28 2019-11-12 Futurewei Technologies, Inc. Decoder side motion vector refinement in video coding
KR20210089149A (ko) * 2018-11-16 2021-07-15 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인터 및 인트라 통합 예측 모드 가중치
WO2020141816A1 (ko) * 2018-12-31 2020-07-09 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3909247B1 (en) * 2019-02-08 2024-04-10 Beijing Dajia Internet Information Technology Co., Ltd. Method and device for selectively applying decoder-side motion vector refinement for video coding
WO2020177756A1 (en) * 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020098643A1 (en) * 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BROSS, BENJAMIN ET AL.: "Versatile Video Coding (Draft 4)", JVET-M1001 (VERSION 3), JPN6023021284, 19 February 2019 (2019-02-19), pages 170 - 173, ISSN: 0005071436 *
JIANLE CHEN, ET AL.: "Algorithm description for Versatile Video Coding and Test Model 4 (VTM 4)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-M1002-v1, JPN6022045256, 16 February 2019 (2019-02-16), pages 34 - 38, ISSN: 0004911078 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7410191B2 (ja) 2019-06-24 2024-01-09 華為技術有限公司 ビデオエンコーダ、ビデオデコーダ、及び対応する方法

Also Published As

Publication number Publication date
US20230262229A1 (en) 2023-08-17
MX2021010158A (es) 2021-11-12
EP3913921A1 (en) 2021-11-24
JP7425079B2 (ja) 2024-01-30
WO2020171444A1 (ko) 2020-08-27
CN113574891B (zh) 2024-03-22
KR20210111859A (ko) 2021-09-13
EP3913921A4 (en) 2022-03-30
US20220224911A1 (en) 2022-07-14
JP2023165935A (ja) 2023-11-17
CN113574891A (zh) 2021-10-29
US11627323B2 (en) 2023-04-11

Similar Documents

Publication Publication Date Title
JP7293369B2 (ja) Dmvr基盤のインター予測方法及び装置
JP7425079B2 (ja) Dmvr基盤のインター予測方法及び装置
CN113692743B (zh) 基于dmvr的帧间预测方法和设备
EP3941061A1 (en) Bdof-based inter prediction method and device
KR20210114061A (ko) Dmvr 및 bdof 기반의 인터 예측 방법 및 장치
JP7462094B2 (ja) ビデオ/映像コーディングシステムにおける重複シグナリング除去方法及び装置
AU2020290306B2 (en) Image decoding method and device therefor
CN114175646A (zh) 图像解码方法及其装置
CN114051728A (zh) 基于块大小执行bdpcm的图像解码方法及其设备
KR20220110834A (ko) 영상 디코딩 방법 및 그 장치
CN114145022A (zh) 推导双向预测的权重索引信息的图像解码方法及其装置
CN114208171A (zh) 用于推导用于生成预测样本的权重索引信息的图像解码方法和装置
CN114270835A (zh) 基于默认合并模式推导预测样本的图像解码方法及其装置
JP7469335B2 (ja) 動きベクトル予測基盤映像/ビデオコーディング方法及び装置
JP2023076630A (ja) サブブロック単位の時間動きベクトル予測子候補に基づく映像またはビデオコーディング
US20220256165A1 (en) Image/video coding method and device based on bi-prediction
CN115152233A (zh) 包括dpb管理处理的图像解码方法及其设备
CN114375573A (zh) 使用合并候选推导预测样本的图像解码方法及其装置
CN114270824A (zh) 用于基于帧间预测编译图像的方法和装置
US20240187603A1 (en) Dmvr-based inter-prediction method and device
JP2024074931A (ja) 動きベクトル予測基盤映像/ビデオコーディング方法及び装置
CN118118655A (zh) 基于dmvr的帧间预测方法和设备
CN118118657A (zh) 基于dmvr的帧间预测方法和设备
CN118118656A (zh) 基于dmvr的帧间预测方法和设备
CN118118654A (zh) 基于dmvr的帧间预测方法和设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211007

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230928

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20231006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240118

R150 Certificate of patent or registration of utility model

Ref document number: 7425079

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150