JP2023005871A - 画像復号装置、画像復号方法及びプログラム - Google Patents

画像復号装置、画像復号方法及びプログラム Download PDF

Info

Publication number
JP2023005871A
JP2023005871A JP2021108102A JP2021108102A JP2023005871A JP 2023005871 A JP2023005871 A JP 2023005871A JP 2021108102 A JP2021108102 A JP 2021108102A JP 2021108102 A JP2021108102 A JP 2021108102A JP 2023005871 A JP2023005871 A JP 2023005871A
Authority
JP
Japan
Prior art keywords
merge
mmvd
merge candidates
candidates
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021108102A
Other languages
English (en)
Inventor
佳隆 木谷
Yoshitaka Kitani
圭 河村
Kei Kawamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2021108102A priority Critical patent/JP2023005871A/ja
Priority to CN202280046236.1A priority patent/CN117643057A/zh
Priority to PCT/JP2022/026106 priority patent/WO2023277107A1/ja
Publication of JP2023005871A publication Critical patent/JP2023005871A/ja
Priority to US18/393,949 priority patent/US20240179321A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2023005871000001
【課題】より符号化性能を向上させること。
【解決手段】本発明に係る画像復号装置200において、通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、復号部210は、画像符号化装置100から伝送されるシンタックス(mmvd_cand_idx)に基づいて、マージリスト内の0番目から4番目の中からマージ候補を特定するように構成されている。
【選択図】図4

Description

本発明は、画像復号装置、画像復号方法及びプログラムに関する。
非特許文献1では、マージ動きベクトル差分(MMVD:Merge with Motion Vector Difference)が開示されている。MMVDは、通常マージモードの動きベクトル(MV:Motion Vector)に対して限定的なパターンの動きベクトル差分(MVD:Motion Vector Difference)を伝送して、対象MVに加算する。
ここで、非特許文献1では、通常マージモードのマージ候補最大数は、6個であり、そのうち、MMVDが適用可能なマージ候補は、マージリスト内の0番目及び1番目の2つのマージ候補に制限されている。
非特許文献2では、通常マージモードのマージ候補として、非近接空間マージ候補(Non-adjacent Spatial Merge Candidate)が開示されている。
ここで、非近接空間マージ候補は、非特許文献1で開示されている空間マージ候補及び時間マージ候補の後の位置で且つヒストリーマージ候補の前の位置で、マージリスト内に格納される。また、非特許文献2では、非特許文献1に対して、通常マージモードのマージ候補最大数が10個に拡張されている。
非特許文献3では、テンプレートマッチングを用いたマージ候補の適応並び替え(ARMC:Adaptive Reordering Merge Candidate)が開示されている。
ここで、ARMCは、対象ブロック及び参照ブロックのそれぞれに隣接する再構成画素(テンプレート)のSAD(Sum of Absolute Difference)値を比較するテンプレートマッチングにより、マージリスト内のマージ候補の格納順序をSAD値が小さい順に並び替える。
ITU-T H.266/VVC JVET-U0100、Compression efficiency methods beyond VVC JVET-V0099、AHG12:Adaptive Reordering of Merge Candidates with Template Matching
しかしながら、非特許文献1では、MMVDが適用可能なマージ候補が、マージリスト内の0番目及び1番目のマージ候補に制限されているため、符号化性能の改善余地がある。 そこで、本発明は、上述の課題に鑑みてなされたものであり、より符号化性能を向上させることができる画像復号装置、画像復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、画像復号装置であって、画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定するように構成されている復号部と、前記復号部によって特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させるように構成されているMMVD部と、を備え、前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、前記復号部は、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定するように構成されていることを要旨とする。
本発明の第2の特徴は、画像復号方法であって、画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定する工程Aと、前記工程Aにおいて特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させる工程Bと、を備え、前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、前記工程Aにおいて、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定することを要旨とする。
本発明の第3の特徴は、コンピュータを、画像復号装置として機能させるプログラムであって、前記画像復号装置は、画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定するように構成されている復号部と、前記復号部によって特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させるように構成されているMMVD部と、を備え、前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、前記復号部は、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定するように構成されていることを要旨とする。
本発明によれば、より符号化性能を向上させることができる画像復号装置、画像復号方法及びプログラムを提供することができる。
図1は、一実施形態に係る画像処理システム1の構成の一例を示す図である。 図2は、一実施形態に係る画像符号化装置100の機能ブロックの一例を示す図である。 図3は、一実施形態に係る画像復号装置200の機能ブロックの一例を示す図である。 図4は、非特許文献1で開示されている復号部210で受信する符号化データ(ビットストリーム)の構成の一例を示す図である。 図5は、非特許文献1で開示されているmmvd_distance_idxの値に対応するMMVDにおけるMVDの大きさ(距離)の対応テーブルの一例を示す図である。 図6は、非特許文献1で開示されているmmvd_direction_idxの値に対応するMMVDにおけるMVDの方向の対応テーブルの一例を示す図である。 図7は、一実施形態に係るインター予測部241の機能ブロックの一例について示す図である。 図8は、一実施形態に係るインター予測部241の動きベクトル復号部241AのTM部241A4の動作の一例について説明するための図である。 図9は、一実施形態に係るMMVD及びTMのハーモナイゼーションについて説明するための図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
以下、図1~図7を参照して、本発明の第1実施形態に係る画像処理システム10について説明する。図1は、本実施形態に係る画像処理システム10について示す図である。
(画像処理システム10)
図1に示すように、本実施形態に係る画像処理システム10は、画像符号化装置100及び画像復号装置200を有する。
画像符号化装置100は、入力画像信号(ピクチャ)を符号化することによって符号化データを生成するように構成されている。画像復号装置200は、符号化データを復号することによって出力画像信号を生成するように構成されている。
ここで、かかる符号化データは、画像符号化装置100から画像復号装置200に対して伝送路を介して送信されてもよい。また、符号化データは、記憶媒体に格納された上で、画像符号化装置100から画像復号装置200に提供されてもよい。
(画像符号化装置100)
以下、図2を参照して、本実施形態に係る画像符号化装置100について説明する。図2は、本実施形態に係る画像符号化装置100の機能ブロックの一例について示す図である。
図2に示すように、画像符号化装置100は、インター予測部111と、イントラ予測部112と、減算器121と、加算器122と、変換・量子化部131と、逆変換・逆量子化部132と、符号化部140と、インループフィルタ処理部150と、フレームバッファ160とを有する。
インター予測部111は、インター予測(フレーム間予測)によって予測信号を生成するように構成されている。
具体的には、インター予測部111は、符号化対象のフレーム(対象フレーム)とフレームバッファ160に格納される参照フレームとの比較によって、参照フレームに含まれる参照ブロックを特定し、特定された参照ブロックに対する動きベクトルを決定するように構成されている。
また、インター予測部111は、参照ブロック及び動きベクトルに基づいて符号化対象ブロック(以下、対象ブロック)に含まれる予測信号を対象ブロック毎に生成するように構成されている。インター予測部111は、予測信号を減算器121及び加算器122に出力するように構成されている。ここで、参照フレームは、対象フレームとは異なるフレームである。
イントラ予測部112は、イントラ予測(フレーム内予測)によって予測信号を生成するように構成されている。
具体的には、イントラ予測部112は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいて予測信号を対象ブロック毎に生成するように構成されている。また、イントラ予測部112は、予測信号を減算器121及び加算器122に出力するように構成されている。
ここで、参照ブロックは、対象ブロックについて参照されるブロックである。例えば、参照ブロックは、対象ブロックに隣接するブロックである。
減算器121は、入力画像信号から予測信号を減算し、予測残差信号を変換・量子化部131に出力するように構成されている。ここで、減算器121は、イントラ予測又はインター予測によって生成される予測信号と入力画像信号との差分である予測残差信号を生成するように構成されている。
加算器122は、逆変換・逆量子化部132から出力される予測残差信号に予測信号を加算してフィルタ処理前復号信号を生成し、かかるフィルタ処理前復号信号をイントラ予測部112及びインループフィルタ処理部150に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部112で用いる参照ブロックを構成する。
変換・量子化部131は、予測残差信号の変換処理を行うとともに、係数レベル値を取得するように構成されている。さらに、変換・量子化部131は、係数レベル値の量子化を行うように構成されていてもよい。
ここで、変換処理は、予測残差信号を周波数成分信号に変換する処理である。かかる変換処理としては、離散コサイン変換(Discrete Cosine Transform、以下、DCTと記す)に対応する基底パタン(変換行列)が用いられてもよく、離散サイン変換(Discrete Sine Transform、以下、DSTと記す)に対応する基底パタン(変換行列)が用いられてもよい。
逆変換・逆量子化部132は、変換・量子化部131から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部132は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
符号化部140は、変換・量子化部131から出力された係数レベル値を符号化し、符号化データを出力するように構成されている。
ここで、例えば、符号化は、係数レベル値の発生確率に基づいて異なる長さの符号を割り当てるエントロピー符号化である。
また、符号化部140は、係数レベル値に加えて、復号処理で用いる制御データを符号化するように構成されている。
ここで、制御データは、符号化ブロックサイズ、予測ブロックサイズ、変換ブロックサイズ等のサイズデータを含んでもよい。
また、制御データは、後述するシーケンス・パラメータ・セット(SPS:Sequence Parameter Set)、ピクチャ・パラメータ・セット(PPS:Picutre Parameter Set)、ピクチャヘッダ(PH:Picture Header)、スライスヘッダ(SH:Slice Header)などのヘッダ情報を含んでもよい。
インループフィルタ処理部150は、加算器122から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ160に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック又は変換ブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報、画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ160は、インター予測部111で用いる参照フレームを蓄積するように構成されている。
ここで、フィルタ処理後復号信号は、インター予測部111で用いる参照フレームを構成する。
(画像復号装置200)
以下、図3を参照して、本実施形態に係る画像復号装置200について説明する。図3は、本実施形態に係る画像復号装置200の機能ブロックの一例について示す図である。
図3に示すように、画像復号装置200は、復号部210と、逆変換・逆量子化部220と、加算器230と、インター予測部241と、イントラ予測部242と、インループフィルタ処理部250と、フレームバッファ260とを有する。
復号部210は、画像符号化装置100によって生成される符号化データを復号し、係数レベル値を復号するように構成されている。
ここで、復号は、例えば、符号化部140で行われるエントロピー符号化とは逆の手順のエントロピー復号である。
また、復号部210は、符号化データの復号処理によって制御データを取得するように構成されていてもよい。なお、上述したように、制御データは、サイズデータやヘッダ情報等を含んでもよい。
逆変換・逆量子化部220は、復号部210から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部220は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
加算器230は、逆変換・逆量子化部220から出力される予測残差信号に予測信号を加算してフィルタ処理前復号信号を生成し、フィルタ処理前復号信号をイントラ予測部242及びインループフィルタ処理部250に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部242で用いる参照ブロックを構成する。
インター予測部241は、インター予測部111と同様に、インター予測(フレーム間予測)によって予測信号を生成するように構成されている。
具体的には、インター予測部241は、符号化データから復号した動きベクトル及び参照フレームに含まれる参照信号に基づいて予測信号を生成するように構成されている。インター予測部241は、予測信号を加算器230に出力するように構成されている。
イントラ予測部242は、イントラ予測部112と同様に、イントラ予測(フレーム内予測)によって予測信号を生成するように構成されている。
具体的には、イントラ予測部242は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいて予測信号を予測ブロック毎に生成するように構成されている。イントラ予測部242は、予測信号を加算器230に出力するように構成されている。
インループフィルタ処理部250は、インループフィルタ処理部150と同様に、加算器230から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ260に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック、変換ブロック或いはそれらを分割したサブブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や、画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報や画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ260は、フレームバッファ160と同様に、インター予測部241で用いる参照フレームを蓄積するように構成されている。
ここで、フィルタ処理後復号信号は、インター予測部241で用いる参照フレームを構成する。
(復号部210)
以下、図4~図7を参照して、復号部210で復号される制御データについて説明する。
図4は、非特許文献1で開示されている復号部210で受信する符号化データ(ビットストリーム)の構成の一例である。
復号部210は、mmvd_merge_flagが1である場合で、且つ、MaxNumMergeCandが1よりも大きい場合に、mmvd_cand_flagを復号するように構成されている。
ここで、mmvd_merge_flagは、対象ブロックに対するMMVDの適用の有無を特定するフラグであり、MaxNumMergeCandは、対象ブロックのマージリスト内の最大マージ候補数であり、mmvd_cand_flagは、MMVDが適用されるマージ候補番号を示すフラグである。
非特許文献1では、MMVDが適用可能なマージ候補を、マージリスト内の0番及び1番のマージ候補に制限しているため、対象ブロックのマージリスト内の最大マージ候補数であるMaxNumMergeCandが1より大きい場合は、mmvd_cand_flagを復号し、その値を特定する。
また、非特許文献1では、それ以外の場合(すなわち、MaxNumMergeCandが1である場合)は、MMVDの適用対象がマージリスト内の0番目のマージ候補であることが自明なため、mmvd_cand_flagについて復号せず、0と推定する。
復号部210は、さらに、mmvd_merge_flagが1である場合、mmvd_distance_idx及びmmvd_direction_idxを復号するように構成されている。
ここで、mmvd_distance_idx及びmmvd_direction_idxは、それぞれ、非特許文献1で開示されているマージ動きベクトル差分における動きベクトル差分の大きさ(距離)と方向を特定するためのシンタックスである。
図5は、非特許文献1で開示されているmmvd_distance_idxの値に対応するMMVDにおけるMVDの大きさ(距離)の対応テーブルの一例を示す。
図5に示すように、かかるMVDの大きさ(距離)については、mmvd_distance_idx及び非特許文献1に開示されているピクチャ単位で伝送されるph_mmvd_fullpel_only_flagの値で特定できる。
ここで、かかるMVDの距離は、マージモードのMVを起点として、図5に示すMmvdDistanceにある離散値で規定されている。
図6は、非特許文献1で開示されているmmvd_direction_idxの値に対応するMMVDにおけるMVDの方向の対応テーブルの一例を示す。
図6に示すように、かかるMVDの方向については、mmvd_direction_idxの値で特定できる。
ここで、かかるMVDの方向は、マージモードのMVを起点とした上下左右の4方向が規定されている。また、上下左右方向は、それぞれマージモードのMVを中心座標とした(x,y)方向の符号で示される。
かかる(x,y)方向の符号は、図6に示すMmvdSign[x0][y0][0]及びMmvdSign[x0][y0][1]に対応し、左方向(すなわち、0°方向)が(+1,0)であり、右方向(すなわち、180°方向)が(-1,0)であり、上方向(すなわち、90°方向)が(0,+1)であり、下方向(すなわち、270°方向)が(0,-1)である。
復号部210は、上述のように特定できるMMVDの適用対象マージ候補、MVDの大きさ(距離)及びMVDの方向を、後述するインター予測部241のMMVD部241A3に伝達するように構成されている。
(インター予測部241)
以下、図7~図9を参照して、本実施形態に係るインター予測部241について説明する。図7は、本実施形態に係るインター予測部241の機能ブロックの一例について示す図である。
図7に示すように、インター予測部241は、動きベクトル復号部241Aと、予測信号生成部241Bとを有する。
インター予測部241は、動きベクトルに基づいて予測ブロックに含まれる予測信号を生成するように構成されている予測部の一例である。
動きベクトル復号部241Aは、フレームバッファ260から入力される対象フレーム及び参照フレームと、画像符号化装置100から受信する制御データとによって、動きベクトルを取得するように構成されている。
動きベクトル復号部241Aは、AMVP部241A1と、マージ部241A2と、MMVD部241A3とを有する。
AMVP部241A1は、動きベクトル予測(MVP:Motion VectorPrediciton)及び動きベクトル差分を示すインデックスと、参照フレームのリスト及びインデックスとを用いて、動きベクトルを復号する適応動きベクトル予測復号(AMVP:Adaptive Motion Vector Prediction)を行うように構成されている。
ここで、AMVPは、既知の手法を採用すること可能であるため、その詳細については省略する。
マージ部241A2は、画像符号化装置100から、マージインデックス(merge_idx)を受信し、動きベクトルを復号するように構成されている。
具体的には、マージ部241A2は、画像符号化装置100と同じ方法で、マージリストを構築して、受信したマージインデックスに対応する動きベクトルを、構築したマージリストから取得するように構成されている。
ここで、マージリストの構築方法として、非特許文献1又は非特許文献2で開示されている既知の手法を本実施形態で採用することが可能である。具体的には、以下の通りである。
まず、非特許文献1及び非特許文献2におけるマージリストに格納されるマージ候補最大数は、それぞれ6個及び10個である。
次に、非特許文献1では、空間マージ候補、時間マージ候補、ヒストリーマージ候補、ペアワイズマージ候補、ゼロマージ候補の順で、マージリストにマージ候補が格納される。
ここで、空間マージ候補とは、図8の1番~5番に示される対象ブロックの隣接位置から動き情報を取得する技術である。
非特許文献2では、非特許文献1に対して非近接空間マージ候補が追加されている。具体的に、非近接空間マージ候補とは、図8に示される6番以降に示される対象ブロックの非隣接位置から動き情報を取得する技術である。
これらに対して、非特許文献1又は非特許文献2で開示されているヒストリーマージ候補は、対象ブロックより前に復号(符号化)されたブロックの動き情報を、図9に示すFIFO式のヒストリーテーブルに格納・更新し、このヒストリーテーブルの番号の小さい順からマージ候補を、マージリスト内に格納する技術である。
マージリストへのマージ候補格納時或いはヒストリーテーブルへのマージ候補格納時には、各マージ候補の動きベクトルの有無と、既にマージリストに格納済みのマージ候補と動きベクトルと参照フレームとが比較され、マージリストに新たに格納するかが判定される構成となっている。かかる比較処理は、Pruning処理と呼ばれ、マージリスト内に同じ動きベクトルと参照フレームを持つマージ候補が格納されないように設計されている。
MMVD部241A3は、復号部210から送られる対象ブロックに対するMMVDの適用の可不可を示す情報、MMVDを適用するマージ候補番号、MMVDにおけるMVDの大きさ(距離)及び方向に関する情報に基づいて、上述したマージ部241A2が構築したマージリスト内のマージ候補を選択し、かかるマージ候補に対する動きベクトルを復号して、かかる動きベクトルに対してMVDを加算することによって、かかる動きベクトルを洗練化するように構成されている。
本実施形態では、MMVDの適用可能なマージ候補をマージリスト内の0番目及び1番目だけではなく、0番目から4番目まで拡張してもよい。すなわち、上述したmmvd_cand_flag(0及び1の値を持つ)をmmvd_cand_idx(0から3の値を持つ)に置換して、復号部210が、mmvd_cand_idxを復号して、MMVD部241A3に伝達することで実現できる。
換言すると、復号部210は、画像符号化装置100から伝送されるシンタックス(mmvd_cand_idx)に基づいて、マージリスト内の0番目から4番目の中からマージ候補を特定するように構成されていてもよい。
MMVDが適用可能なマージ候補数が拡張されることで、MMVDによってMVDが加算されるベースとなるMVの精度が向上するため、結果として予測性能が改善する。
ここで、mmvd_cand_idxは、マージリストの最大候補数、マージ候補の種別及びその生成順を考慮して、変更されてもよい。
具体的に、MMVDは、背景が比較的ゆっくり動く映像で適用されやすい性質を持つことが知られている。そのため、空間マージ候補や非近接空間マージ候補やヒストリーマージ候補等、当該ブロックと同じフレームに位置する復号(符号化)済のブロックから動き情報を取得して、その動きベクトルに対して、MVDが加算されやすい。
そのため、マージリストの最大候補数に対して、これらの空間マージ候補、非近接空間マージ候補又はヒストリーマージ候補により、マージ候補が格納されやすい番号に設計者の意図で変更すれば、MMVDの有効性を向上できる。例えば、非特許文献1及び非特許文献2では、上述のように、マージ候補の最大数が6及び10であり、かつ、上述したようなマージ候補の格納順であるため、例えば、MMVDが適用可能なマージ候補の最大数を4番目と8番目と設定してもよい。
(変更例1)
非特許文献1又は非特許文献2では、マージリストに各マージ候補が格納された段階で、いずれのマージ候補種別から格納されているかが判別不可になるが、いずれのマージ候補種別から格納されたかを判別可能な内部パラメータをマージ候補とともに有することで、MMVDが適用可能なマージ候補を、上述の空間マージ候補、非近接空間マージ候補又はヒストリーマージ候補に限定してもよい。
すなわち、復号部210は、画像符号化装置100から伝送されるシンタックス(mmvd_cand_idx)に基づいて、空間マージ候補、非近接空間マージ候補又はヒストリーマージ候補の中からマージ候補を特定するように構成されていてもよい。
これにより、MMVDの有効性が高いマージ候補に対して、MMVDの適用対象を限定できるため、MMVDの有効性を向上できる。
(変更例2)
更なる変更例として、非特許文献1又は非特許文献2におけるPruning処理を強化してもよい。
具体的に、非特許文献1又は非特許文献2では、既に格納済みのマージ候補が示す動きベクトルと参照フレームとが同じ場合にのみ、新たなマージ候補のマージリストへの格納が禁止されていたが、動きベクトルのみが同じである場合に、禁止してもよい。
これにより、MMVDでMVDを加算するMVのバリエーションを増やすことができ、予測性能が向上することが期待できる。また、本変更例2を、上述の第1実施形態及び変更例1と組み合わせてもよい。
予測信号生成部241Bは、動きベクトル復号部241Aから出力された動きベクトルに基づいて予測信号を生成するように構成されている。動きベクトルから予測信号を生成する方法は、既知の方法を採用することが可能であるため、その詳細は省略する。
(テンプレートマッチング)
以下、図8を参照して、上述の第1実施形態、変更例1及び変更例2に係るテンプレートマッチング(TM:Template Matching)について説明する。
図7におけるマージ部241Aに含まれるTM部は、図8に示す当該ブロック及びマージ候補の動きベクトルが示す参照ブロックにそれぞれ隣接する再構成画素のSAD(Sum of Absolute Difference)値が比較されるとともに、限定的な範囲(図8の例では、±8画素の範囲)でマージ候補の動きベクトルを起点に動きベクトルが再探索するTMを行うように構成されている。
すなわち、かかるTM部は、マージ候補のMVを再探索してマージ候補のMVを修正するように構成されている。
非特許文献3では、このTM部のSAD値の比較を用いたマージリスト内のマージ候補の並び替えに関する技術が開示されている。具体的に、マージリスト内の10個のマージ候補を、5個ずつのマージ候補(サブグループ)に分類し、後半(最後)の5個のマージ候補の順序を並び替える。
並び替え方法は、TMによりSAD値が小さい順にマージリストの若い番号順を割り当てる。これにより、当該ブロックと類似するテンプレートを持つ参照ブロックの動き情報に対して、符号長の短いマージインデックスの割り当てが可能になるため、マージインデックスの伝送符号量が削減され、結果として符号化性能が改善する。
本変更例2では、MMVDの適用対象候補となるマージリスト内の前半部に対して、このTMを用いたマージ候補の並び替えを適用してもよい。これにより、SAD値の小さい、すなわち、類似するテンプレートを持つ参照ブロックの動きベクトルに対してMMVDが優先的に適用されるようになるため、mmvd_cand_flag又はmmvd_cand_idxの伝送符号量が削減され、結果として符号化性能が改善する。
このTMを用いたマージ候補の並び替えは、上述したMMVDが適用可能なマージ候補数・種別の拡張技術に対して、組み合わせてもよい。
すなわち、MMVD部241A3は、TMを用いて、マージリスト内のマージ候補の順序を並び替えた後、復号部210によって特定されたマージ候補に対してMVDを加算するように構成されていてもよい。
また、MMVD部241A3は、TMに基づくマージリスト内のマージ候補の並び替え対象を、マージリスト内の空間マージ候補に限定するように構成されていてもよい。
或いは、MMVD部241A3は、TMに基づくマージリスト内のマージ候補の並び替え対象を、マージリスト内の空間マージ候補及びヒストリーマージ候補に限定するように構成されていてもよい。
或いは、MMVD部241A3は、TMに基づくマージリスト内のマージ候補の並び替え対象を、マージリスト内の空間マージ候補及び非近接空間マージ候補に限定するように構成されていてもよい。
或いは、MMVD部241A3は、TMに基づくマージリスト内のマージ候補の並び替え対象を、マージリスト内の空間マージ候補と非近接空間マージ候補とヒストリーマージ候補とに限定するように構成されていてもよい。
上述のように、MMVD部241A3は、TMによって、マージ候補を特定するように構成されていてもよい。
さらに、MMVD部241A3は、上述のマージ候補を、TMによって特定されるSAD値が最小となるマージ候補に決定するように構成されていてもよい。
(MMVD及びTMのハーモナイゼーション)
以下、図10を参照して、上述の第1実施形態、変更例1及び変更例2に係るMMVD及びTMのハーモナイゼーションについて説明する。
非特許文献2では、TMは、有効なブロックに対してMMVDは無効となる(排他制御)となるように構成されている。
具体的には、対象ブロック単位で画像符号化装置100からTMの適用有無を示すフラグ(tm_enable_flag)が伝送され、復号部210が、かかるフラグを復号して、かかるフラグの値を特定してMMVD部241A3に伝達し、MMVD部241A3が、tm_enable_flagが有効である場合、MMVDを適用しないと判定することで実現できる。
ここで、tm_enable_flagは、TMの適用有無をブロック単位で制御するフラグである。
上述のように、MMVD部241A3は、tm_enable_flagに基づいて、MMVDの適用有無を制御するように構成されていてもよい。具体的には、MMVD部241A3は、tm_enable_flagが有効である場合に、MMVDを適用しないと判定するように構成されていてもよい。
これに対して、本変更例2では、MMVDのMVDの距離が予め定めた閾値よりも大きい(或いは、MMVDのMVDの距離が予め定めた閾値以上である)場合には、MMVDで修正された動きベクトルに対して、TMを有効にしてもよい。MVDの距離が、かかる閾値以下(或いは、かかる閾値未満)である場合は、上述のように、MMVDを無効にしてもよい。
例えば、MVDの距離が8画素より大きい場合は、TMを有効にしてもよい。これは、非特許文献2で開示されている、TMによる動きベクトルの再探索範囲が±8画素の範囲であるため、この探索範囲を超えるMVの修正が必要なブロックに対しては、予めMMVDによりMVを修正したほうが、TMとのハーモナイズ(相加効果)が期待できるためである。
かかる閾値は、TMのMV再探索範囲の上限とMMVDの距離のバリエーションによって変更してもよい。例えば、TMのMV再探索範囲が±2や±4であり、且つ、MMVDの距離のバリエーションにこれらの絶対値が含まれる場合、かかる閾値は、2や4に変更されるように構成してもよい。
すなわち、MMVD部241A3は、MMVDのMVDの距離が予め定めた閾値よりも大きい(或いは、MMVDのMVDの距離が予め定めた閾値以上である)場合に、tm_enable_flagが有効である場合でも、MMVDを適用すると判定するように構成されていてもよい。
(テンプレートマッチングを用いたMMVDのシンタックス削減)
以下、本実施形態に係るテンプレートマッチングを用いたMMVDのシンタックス削減について説明する。
上述の例では、MMVDを適用するマージ候補をmmvd_cand_flag又はmmvd_cand_idxで特定したが、TMを用いて、これらを削減する。
具体的に、復号部210が、テンプレートマッチング(当該ブロックと参照ブロックに隣接する再構成画素との間のSAD値の比較処理)を実施し、MMVDの適用対象をSADが最小となるマージ候補に決定してもよい。
ここで、マージ候補が双予測である(2つの動きベクトルを持つ場合)、各参照ブロックのSAD値を平均して、当該ブロックと比較してもよい。
或いは、当該ブロックのフレーム番号と参照フレームの番号との間(POC:Picture of Count)の差が大きい参照ブロックのSAD値のみを比較しても良い。
ここで、SAD値の比較は、対象ブロックのサイズ(アスペクト比)に応じて、対象ブロックの左側のテンプレート及び上側のテンプレートの画素値を正規化してもよい。
これにより、テンプレートが類似する参照ブロックの動きベクトルをMMVDの適用対象として選択できるため、MMVDのベースとなるMVの予測精度は劣化しにくい。
さらに、復号部210は、MMVDの適用対象となるマージ候補をmmvd_cand_flag又はmmvd_cand_idxを復号せずに、TMを用いて特定できるため、結果としてこれらシンタックスの符号量が削減しつつ、符号化性能の改善が期待できる。
上述の画像符号化装置100及び画像復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、上述の各実施形態では、本発明を画像符号化装置100及び画像復号装置200への適用を例にして説明したが、本発明は、これのみに限定されるものではなく、画像符号化装置100及び画像復号装置200の各機能を備えた画像符号化システム及び画像復号システムにも同様に適用できる。
10…画像処理システム
100…画像符号化装置
111、241…インター予測部
112、242…イントラ予測部
121…減算器
122、230…加算器
131…変換・量子化部
132、220…逆変換・逆量子化部
140…符号化部
150、250…インループフィルタ処理部
160、260…フレームバッファ
200…画像復号装置
210…復号部
241A…動きベクトル復号部
241A1…AMVP部
241A2…マージ部
241A3…MMVD部
241A4…TM部
241B…予測信号生成部

Claims (10)

  1. 画像復号装置であって、
    画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定するように構成されている復号部と、
    前記復号部によって特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させるように構成されているMMVD部と、を備え、
    前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、
    前記復号部は、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定するように構成されていることを特徴とする画像復号装置。
  2. 前記復号部は、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の空間マージ候補、非近接空間マージ候補又はヒストリーマージ候補の中から前記マージ候補を特定するように構成されていることを特徴とする画像復号装置。
  3. 前記MMVD部は、対象ブロック及び参照ブロックそれぞれに隣接する再構成画素を比較するテンプレートマッチングを用いて、前記マージリスト内のマージ候補の順序を並び替えた後、前記復号部によって特定された前記マージ候補に対して前記MVDを加算するように構成されていることを特徴とする請求項1に記載の画像復号装置。
  4. 前記MMVD部は、前記テンプレートマッチングに基づく前記マージリスト内のマージ候補の並び替え対象を、前記マージリスト内の空間マージ候補、非近接空間マージ候補又はヒストリーマージ候補に限定するように構成されていることを特徴とする請求項1に記載の画像復号装置。
  5. 前記マージ候補のMVを再探索して前記マージ候補のMVを修正するように構成されているテンプレートマッチング部を備え、
    前記復号部は、前記テンプレートマッチングの適用有無をブロック単位で制御するフラグを復号するように構成されており、
    前記MMVD部は、前記フラグに基づいて、前記MMVDの適用有無を制御するように構成されており、
    前記MMVD部は、前記フラグが有効である場合に、前記MMVDを適用しないと判定するように構成されていることを特徴とする請求項1に記載の画像復号装置。
  6. 前記MMVD部は、前記MMVDのMVDの距離が予め定めた閾値よりも大きい場合に、前記フラグが有効である場合でも、前記MMVDを適用すると判定するように構成されていることを特徴とする請求項5に記載の画像復号装置。
  7. 前記MMVD部は、対象ブロック及び参照ブロックにそれぞれ隣接する再構成画素を比較するテンプレートマッチングによって、前記マージ候補を特定するように構成されていることを特徴とする請求項1~6のいずれか一項に記載の画像復号装置。
  8. 前記MMVD部は、前記マージ候補を、対象ブロック及び参照ブロックそれぞれに隣接する再構成画素を比較するテンプレートマッチングによって特定されるSAD値が最小となるマージ候補に決定するように構成されていることを特徴とする請求項1~7のいずれか一項に記載の画像復号装置。
  9. 画像復号方法であって、
    画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定する工程Aと、
    前記工程Aにおいて特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させる工程Bと、を備え、
    前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、
    前記工程Aにおいて、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定することを特徴とする画像復号方法。
  10. コンピュータを、画像復号装置として機能させるプログラムであって、
    前記画像復号装置は、
    画像符号化装置から伝送されるシンタックスに基づいて、MMVDにおける方向、距離及びMVDを加算する通常マージモードのマージリスト内のマージ候補を特定するように構成されている復号部と、
    前記復号部によって特定された前記マージ候補が示すMVに対して、前記MVDを加算して、前記MVを洗練化させるように構成されているMMVD部と、を備え、
    前記通常マージモードのマージリスト内のマージ候補は、空間マージ候補、時間マージ候補、非近接マージ候補、ヒストリーマージ候補、ペアワイズマージ候補又はゼロマージ候補によって生成されて格納されるように構成されており、
    前記復号部は、前記画像符号化装置から伝送されるシンタックスに基づいて、前記マージリスト内の0番目から4番目の中から前記マージ候補を特定するように構成されていることを特徴とするプログラム。
JP2021108102A 2021-06-29 2021-06-29 画像復号装置、画像復号方法及びプログラム Pending JP2023005871A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021108102A JP2023005871A (ja) 2021-06-29 2021-06-29 画像復号装置、画像復号方法及びプログラム
CN202280046236.1A CN117643057A (zh) 2021-06-29 2022-06-29 图像解码装置、图像解码方法及程序
PCT/JP2022/026106 WO2023277107A1 (ja) 2021-06-29 2022-06-29 画像復号装置、画像復号方法及びプログラム
US18/393,949 US20240179321A1 (en) 2021-06-29 2023-12-22 Image decoding device, image decoding method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021108102A JP2023005871A (ja) 2021-06-29 2021-06-29 画像復号装置、画像復号方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2023005871A true JP2023005871A (ja) 2023-01-18

Family

ID=84691845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021108102A Pending JP2023005871A (ja) 2021-06-29 2021-06-29 画像復号装置、画像復号方法及びプログラム

Country Status (4)

Country Link
US (1) US20240179321A1 (ja)
JP (1) JP2023005871A (ja)
CN (1) CN117643057A (ja)
WO (1) WO2023277107A1 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021057621A (ja) * 2018-01-09 2021-04-08 シャープ株式会社 動画像符号化装置、動画像復号装置および予測画像生成装置
WO2020017367A1 (ja) * 2018-07-18 2020-01-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11336914B2 (en) * 2018-08-16 2022-05-17 Qualcomm Incorporated History-based candidate list with classification
KR20240025062A (ko) * 2018-11-22 2024-02-26 후아웨이 테크놀러지 컴퍼니 리미티드 인터 예측을 위한 인코더, 디코더 및 대응 방법
US10869050B2 (en) * 2019-02-09 2020-12-15 Tencent America LLC Method and apparatus for video coding
US20220264142A1 (en) * 2019-07-24 2022-08-18 Sharp Kabushiki Kaisha Image decoding apparatus, image coding apparatus, and image decoding method
JP7409802B2 (ja) * 2019-08-22 2024-01-09 シャープ株式会社 動画像復号装置および動画像符号化装置

Also Published As

Publication number Publication date
CN117643057A (zh) 2024-03-01
WO2023277107A1 (ja) 2023-01-05
US20240179321A1 (en) 2024-05-30

Similar Documents

Publication Publication Date Title
US11218723B2 (en) Motion vector prediction
JP6242979B2 (ja) 動画復号化装置
CN114928744B (zh) 用于在视频编解码中信令发送运动合并模式的系统和方法
CN110809887A (zh) 用于多参考预测的运动矢量修正
WO2023277107A1 (ja) 画像復号装置、画像復号方法及びプログラム
CN114079783B (zh) 一种编解码方法、装置及其设备
JP7387806B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP2017028372A (ja) 符号化方式変換装置、方法及びプログラム
JP6931038B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP2020025308A (ja) 画像符号化方法及び画像復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230724