JP7075963B2 - 画像復号装置、画像復号方法及びプログラム - Google Patents

画像復号装置、画像復号方法及びプログラム Download PDF

Info

Publication number
JP7075963B2
JP7075963B2 JP2020099716A JP2020099716A JP7075963B2 JP 7075963 B2 JP7075963 B2 JP 7075963B2 JP 2020099716 A JP2020099716 A JP 2020099716A JP 2020099716 A JP2020099716 A JP 2020099716A JP 7075963 B2 JP7075963 B2 JP 7075963B2
Authority
JP
Japan
Prior art keywords
mmvd
motion vector
unit
syntax
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020099716A
Other languages
English (en)
Other versions
JP2021193782A (ja
Inventor
佳隆 木谷
恭平 海野
圭 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2020099716A priority Critical patent/JP7075963B2/ja
Priority to CN202180041300.2A priority patent/CN115918086A/zh
Priority to PCT/JP2021/021276 priority patent/WO2021251278A1/ja
Priority to EP21822640.5A priority patent/EP4149112A4/en
Publication of JP2021193782A publication Critical patent/JP2021193782A/ja
Priority to JP2022080426A priority patent/JP7387806B2/ja
Application granted granted Critical
Publication of JP7075963B2 publication Critical patent/JP7075963B2/ja
Priority to US18/062,993 priority patent/US20230103543A1/en
Priority to JP2023194119A priority patent/JP2024003175A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像復号装置、画像復号方法及びプログラムに関する。
非特許文献1では、マージ動きベクトル差分(MMVD:Merge with MVD)の伝送精度を整数精度とするか否かについて制御することができるシンタックスが、シーケンス・パラメータ・セット(SPS:Sequence Parameter Set)のシンタックス(sps_mmvd_fullpel_only_flag)及びピクチャヘッダ(PH:Picture Header)のシンタックス(ph_mmvd_fullpel_only_flag)としてそれぞれ備えられている。
Versatile Video Coding(Draft 9)、JVET-R2001
しかしながら、非特許文献1では、sps_mmvd_fullpel_only_flagが有効であるである場合(すなわち、シーケンス単位でMMVDの伝送精度が整数精度であると特定される場合)であっても、ph_mmvd_fullpel_only_flagが復号されるように規定されているという問題点があった。
すなわち、非特許文献1では、sps_mmvd_fullpel_only_flagでMMVDの伝送精度が整数精度と特定されるにも関わらず、不要にph_mmvd_fullpel_only_flagが復号されるという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、シーケンス単位でMMVDの伝送精度を制御するシンタックスを復号し、かかるMMVDの伝送精度が不定である場合(すなわち、かかるMMVDの伝送精度として小数精度或いは整数精度のいずれを使用してもよい場合)にのみ、ピクチャ単位でMMVDの伝送精度を制御するシンタックスを復号することで、不要なシンタックスの復号処理量及びビット量を削減することができる画像復号装置、画像復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、画像復号装置であって、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスを復号し、前記第1シンタックスの値によって、復号対象のピクチャにおけるマージ動きベクトル差分の伝送精度を制御する第2シンタックスを復号するように構成されている復号部を備えることを要旨とする。
本発明の第2の特徴は、画像復号方法であって、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスを復号し、前記第1シンタックスの値によって、復号対象のピクチャにおけるマージ動きベクトル差分の伝送精度を制御する第2シンタックスを復号する工程を有することを要旨とする。
本発明の第3の特徴は、コンピュータを、画像復号装置として機能させるプログラムで
あって、前記画像復号装置は、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスを復号し、前記第1シンタックスの値によって、復号対象のピクチャにおけるマージ動きベクトル差分の伝送精度を制御する第2シンタックスを復号するように構成されている復号部を備えることを要旨とする。
本発明によれば、シーケンス単位でMMVDの伝送精度を制御するシンタックスを復号し、かかるMMVDの伝送精度が不定である場合(すなわち、かかるMMVDの伝送精度として小数精度或いは整数精度のいずれを使用してもよい場合)にのみ、ピクチャ単位でMMVDの伝送精度を制御するシンタックスを復号することで、不要なシンタックスの復号処理量及びビット量を削減することができる画像復号装置、画像復号方法及びプログラムを提供することができる。
一実施形態に係る画像処理システム1の構成の一例を示す図である。 一実施形態に係る画像符号化装置100の機能ブロックの一例を示す図である。 一実施形態に係る画像復号装置200の機能ブロックの一例を示す図である。 一実施形態に係る画像復号装置200の復号部210で受信する符号化データ(ビットストリーム)の構成の一例である SPS211内に含まれる制御データの一例である。 PPS212に含まれる制御データの一例である。 ピクチャヘッダ213に含まれる制御データの一例である。 スライスヘッダ214A/214Bに含まれる制御データの一例である。 一実施形態の一変更例について説明するための図である。 一実施形態の一変更例について説明するための図である。 一実施形態の一変更例について説明するための図である。 一実施形態に係るインター予測部241の機能ブロックの一例について示す図である。 一実施形態に係るMMVD部241A3による動きベクトルの修正方法を示す図である。 一実施形態に係るMMVD部241A3による動きベクトルの修正方法を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
以下、図1~図14を参照して、本発明の第1実施形態に係る画像処理システム10について説明する。図1は、本実施形態に係る画像処理システム10について示す図である。
図1に示すように、本実施形態に係る画像処理システム10は、画像符号化装置100及び画像復号装置200を有する。
画像符号化装置100は、入力画像信号(ピクチャ)を符号化することによって符号化データを生成するように構成されている。画像復号装置200は、符号化データを復号することによって出力画像信号を生成するように構成されている。
符号化データは、画像符号化装置100から画像復号装置200に対して伝送路を介して送信されてもよい。符号化データは、記憶媒体に格納された上で、画像符号化装置100から画像復号装置200に提供されてもよい。
(画像符号化装置100)
以下、図2を参照して、本実施形態に係る画像符号化装置100について説明する。図2は、本実施形態に係る画像符号化装置100の機能ブロックの一例について示す図である。
図2に示すように、画像符号化装置100は、インター予測部111と、イントラ予測部112と、減算器121と、加算器122と、変換・量子化部131と、逆変換・逆量子化部132と、符号化部140と、インループフィルタ処理部150と、フレームバッファ160とを有する。
インター予測部111は、インター予測(フレーム間予測)によって予測信号を生成するように構成されている。
具体的には、インター予測部111は、対象フレームとフレームバッファ160に格納される参照フレームとの比較によって、参照フレームに含まれる参照ブロックを特定し、特定された参照ブロックに対する動きベクトル(mv)を決定するように構成されている。
また、インター予測部111は、参照ブロック及び動きベクトルに基づいて符号化対象ブロック(以下、対象ブロック)に含まれる予測信号を対象ブロック毎に生成するように構成されている。インター予測部111は、予測信号を減算器121及び加算器122に出力するように構成されている。ここで、参照フレームは、対象フレームとは異なるフレームである。
イントラ予測部112は、イントラ予測(フレーム内予測)によって予測信号を生成するように構成されている。
具体的には、イントラ予測部112は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいて予測信号を対象ブロック毎に生成するように構成されている。また、イントラ予測部112は、予測信号を減算器121及び加算器122に出力するように構成されている。
ここで、参照ブロックは、対象ブロックについて参照されるブロックである。例えば、参照ブロックは、対象ブロックに隣接するブロックである。
減算器121は、入力画像信号から予測信号を減算し、予測残差信号を変換・量子化部131に出力するように構成されている。ここで、減算器121は、イントラ予測又はインター予測によって生成される予測信号と入力画像信号との差分である予測残差信号を生成するように構成されている。
加算器122は、逆変換・逆量子化部132から出力される予測残差信号に予測信号を加算してフィルタ処理前復号信号を生成し、かかるフィルタ処理前復号信号をイントラ予
測部112及びインループフィルタ処理部150に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部112で用いる参照ブロックを構成する。
変換・量子化部131は、予測残差信号の変換処理を行うとともに、係数レベル値を取得するように構成されている。さらに、変換・量子化部131は、係数レベル値の量子化を行うように構成されていてもよい。
ここで、変換処理は、予測残差信号を周波数成分信号に変換する処理である。かかる変換処理としては、離散コサイン変換(Discrete Cosine Transform、以下、DCTと記す)に対応する基底パタン(変換行列)が用いられてもよく、離散サイン変換(Discrete Sine Transform、以下、DSTと記す)に対応する基底パタン(変換行列)が用いられてもよい。
逆変換・逆量子化部132は、変換・量子化部131から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部132は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
符号化部140は、変換・量子化部131から出力された係数レベル値を符号化し、符号化データを出力するように構成されている。
ここで、例えば、符号化は、係数レベル値の発生確率に基づいて異なる長さの符号を割り当てるエントロピー符号化である。
また、符号化部140は、係数レベル値に加えて、復号処理で用いる制御データを符号化するように構成されている。
ここで、制御データは、符号化ブロックサイズ、予測ブロックサイズ、変換ブロックサイズ等のサイズデータを含んでもよい。
また、制御データは、後述するシーケンス・パラメータ・セット(SPS:Sequence Parameter Set)、ピクチャ・パラメータ・セット(PPS:Picutre Parameter Set)、ピクチャヘッダ(PH:Picture Header)、スライスヘッダ(SH:Slice Header)等のヘッダ情報を含んでもよい。
インループフィルタ処理部150は、加算器122から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ160に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック又は変換ブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報、画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ160は、インター予測部111で用いる参照フレームを蓄積するよ
うに構成されている。
ここで、フィルタ処理後復号信号は、インター予測部111で用いる参照フレームを構成する。
(画像復号装置200)
以下、図3を参照して、本実施形態に係る画像復号装置200について説明する。図3は、本実施形態に係る画像復号装置200の機能ブロックの一例について示す図である。
図3に示すように、画像復号装置200は、復号部210と、逆変換・逆量子化部220と、加算器230と、インター予測部241と、イントラ予測部242と、インループフィルタ処理部250と、フレームバッファ260とを有する。
復号部210は、画像符号化装置100によって生成される符号化データを復号し、係数レベル値を復号するように構成されている。
ここで、復号は、例えば、符号化部140で行われるエントロピー符号化とは逆の手順のエントロピー復号である。
また、復号部210は、符号化データの復号処理によって制御データを取得するように構成されていてもよい。なお、上述したように、制御データは、サイズデータやヘッダ情報等を含んでもよい。
逆変換・逆量子化部220は、復号部210から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部220は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
加算器230は、逆変換・逆量子化部220から出力される予測残差信号に予測信号を加算してフィルタ処理前復号信号を生成し、フィルタ処理前復号信号をイントラ予測部242及びインループフィルタ処理部250に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部242で用いる参照ブロックを構成する。
インター予測部241は、インター予測部111と同様に、インター予測(フレーム間予測)によって予測信号を生成するように構成されている。
具体的には、インター予測部241は、符号化データから復号した動きベクトル及び参照フレームに含まれる参照信号に基づいて予測信号を生成するように構成されている。インター予測部241は、予測信号を加算器230に出力するように構成されている。
イントラ予測部242は、イントラ予測部112と同様に、イントラ予測(フレーム内予測)によって予測信号を生成するように構成されている。
具体的には、イントラ予測部242は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいて予測信号を予測ブロック毎に生成するように構成されている。イントラ予測部242は、予測信号を加算器230に出力するように構成され
ている。
インループフィルタ処理部250は、インループフィルタ処理部150と同様に、加算器230から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ260に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック、変換ブロック或いはそれらを分割したサブブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や、画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報や画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ260は、フレームバッファ160と同様に、インター予測部241で用いる参照フレームを蓄積するように構成されている。
ここで、フィルタ処理後復号信号は、インター予測部241で用いる参照フレームを構成する。
(復号部210)
以下、図4~図8を用いて、符号化部140で符号化され復号部210で復号される制御データについて説明する。
図4は、復号部210で受信する符号化データ(以下、ビットストリーム)の構成の一例である。
ビットストリームは、先頭にSPS211を含んでもよい。SPSは、シーケンス(ピクチャの集合)単位での制御データの集合である。具体例については後述する。各SPS211は、複数のSPS211が存在する場合に個々を識別するためのSPS id情報を少なくとも含む。
また、ビットストリームは、SPS211の次に、PPS212を含んでもよい。PPS212は、ピクチャ(スライスの集合)単位での制御データの集合である。各PPS212は、複数のPPS212が存在する場合に個々を識別するためのPPS id情報を少なくとも含む。また、各PPS212は、各PPS212に対応するSPS211を指定するためのSPS id情報を少なくとも含む。
また、ビットストリームは、PPS212の次に、ピクチャヘッダ213を含んでもよい。ピクチャヘッダ213も、ピクチャ(スライスの集合)単位での制御データの集合である。PPS212は、複数のピクチャに対して単一のPPS212を共有することができる。一方、ピクチャヘッダ213は、ピクチャ毎に必ず伝送される。ピクチャヘッダ213には、各ピクチャに対応するPPS212を指定するためのPPS id情報を少なくとも含む。
また、ビットストリームは、ピクチャヘッダ213の次に、スライスヘッダ214Aを含んでもよい。スライスヘッダ214Aは、スライス単位での制御データの集合である。具体例については後述する。スライスヘッダ214Aは、スライスヘッダ214Aの一部として、上述のピクチャヘッダ213の情報を含むこともできる。
また、ビットストリームは、スライスヘッダ214Aの次に、スライスデータ215Aを含んでもよい。スライスデータ214Aは、上述の係数レベル値やサイズデータ等を含
んでもよい。
以上のように、ビットストリームは、各スライスデータ215A/215Bに対して、
1つずつスライスヘッダ214A/2154、ピクチャヘッダ213、PPS212、S
PS211が対応する構成となる。
上述のように、ピクチャヘッダ213にてどのPPS212を参照するかをPPS idで指定し、さらに、PPS212がどのSPS211を参照するかをSPS idで指定するため、複数のスライスデータ215A/215Bに対して共通のSPS211、P
PS212を用いることができる。
言い換えると、SPS211及びPPS212は、ピクチャごと、スライスごとに、必ずしも伝送する必要がない。
例えば、図4に示すように、スライスヘッダ214B/215Bの直前では、SPS2
11及びPPS212を符号化しないようなビットストリームの構成とすることもできる。
なお、図4の構成は、あくまで一例である。例えば、ビットストリームが、各スライスデータ215A/215Bに対して、スライスヘッダ214B/215B、ピクチャヘッダ213、PPS212、SPS211で指定された制御データが対応する構成となっていれば、ビットストリームの構成要素として、上述以外の要素が追加されてもよい。また、同様に、伝送に際して図4と異なる構成に整形されてもよい。
図5は、SPS211内に含まれる制御データの一例である。
SPS211は、上述の通り、少なくとも各SPS211を識別するためのSPS id情報 (sps_seq_parameter_set_id)を含む。
SPS211は、復号対象のシーケンスの後述するマージ動きベクトル差分(MMVD:Merge with MVD)の使用可否について制御するシンタックス(sps_
mmvd_enabled_flag)を含んでもよい。
例えば、sps_mmvd_enabled_flagの値が「0」の場合は、かかるS
PS211に対応するシーケンス内でMMVDが使用不可であることを意味し、sps_
mmvd_enabled_flagの値が「1」の場合は、かかるSPS211に対応するシーケンス内でMMVDが使用可であることを意味するように定義することができる。
また、sps_mmvd_enabled_flagの値が「1」の場合、すなわち、M
MVDが使用可である場合は、追加で、かかるSPS211に対応するシーケンス内のMMVDの伝送精度を整数精度とするか否かについて制御するシンタックス(sps_mm
vd_fullpel_only_flag)を含んでもよい。
例えば、sps_mmvd_fullpel_only_flagの値が「0」の場合は、MMVDの伝送精度として小数精度を使用してもよい(すなわち、MMVDの伝送精度として小数精度及び整数精度どちらも使用可である)ことを意味し、sps_mmvd_fullpel_only_flagの値が「1」の場合は、MMVDの伝送精度として整数精度を使用することを意味すると定義することができる。
復号部210は、sps_mmvd_fullpel_only_flagが、かかるSP
S211に含まれていなかった場合、sps_mmvd_fullpel_only_flagの値を「0」とみなしてもよい。
図6は、PPS212に含まれる制御データの一例である。
PPS212は、上述の通り、少なくとも各PPS212を識別するためのPPS id情報 (pps_pic_parameter_set_id)を含む。また、PPS21
2は、上述の通り、少なくとも当該PPS212に対応するSPS211を指定するためのid情報(pps_seq_parameter_set_id)を含む。
図7は、ピクチャヘッダ213に含まれる制御データの一例である。
ピクチャヘッダ213は、上述の通り、少なくとも当該ピクチャヘッダ213に対応するPPS212を指定するためのid情報(ph_pic_parameter_set_id)を含む。
また、ph_pic_parameter_set_idで指定されたPPS212に関連するsps_mmvd_fullpel_only_flagの値が「0」の場合、ピクチャヘッダ213は、ph_mmvd_fullpel_only_flagを含んでもよい。
復号部210は、ph_mmvd_fullpel_only_flagが、ピクチャヘッダ213に含まれない場合、ph_mmvd_fullpel_only_flagの値を「0」とみなしてもよい。
ph_mmvd_fullpel_only_flagの値が「1」の場合は、かかるピクチャヘッダ213に対応するピクチャ内で、MMVDの伝送精度として整数精度を使用することを意味する。
一方、ph_mmvd_fullpel_only_flagの値が「0」の場合は、かかるピクチャヘッダ213に対応するピクチャ内で、MMVDの伝送精度として小数精度を使用してもよい(すなわち、MMVDの伝送精度として小数精度及び整数精度どちらも使用可である)ことを意味する。
ph_mmvd_fullpel_only_flagがピクチャヘッダ213内に含まれない場合、復号部210は、ph_mmvd_fullpel_only_flagの値は「0」であるとみなしてもよい。
或いは、ph_mmvd_fullpel_only_flagがピクチャヘッダ213内に含まれない場合、復号部210は、ph_mmvd_fullpel_only_flagの値がsps_mmvd_fullpel_only_flagの値と同じ値であるとみなしてもよい。
以上のように、sps_mmvd_fullpel_only_flagの値が「0」である場合、すなわち、シーケンス単位でMMVDの伝送精度として小数精度を使用してもよいことを示している場合にのみ、ピクチャ単位でMMVDの伝送精度として整数精度を使用するか否かを制御するシンタックス(ph_mmvd_fullpel_only_flag)をピクチャヘッダ213内に含めるようにすることで、例えば、sps_mmvd_fullpel_only_flagにより当該シーケンスでMMVDの伝送精度として整数精度を使用することが特定される場合に、不要にph_mmvd_fullpel_onl
y_flagをピクチャヘッダ213に含めることを防ぐことができる。これにより、無
駄な復号処理・符号化処理を削減することができ、また、ピクチャヘッダ213のビット量を削減することができる。
図8は、スライスヘッダ214A/214Bに含まれる制御データの一例である。
スライスヘッダ214A/214Bは、sh_picture_header_in_sl
ice_header_flagを含んでもよい。sh_picture_header_i
n_slice_header_flagの値が「1」の場合、図8におけるpictur
e_header_structure( )の位置に、図7で説明したピクチャヘッダ21
3のシンタックス構造(picture_header_structure( ))を含め
ることができる。
また、スライスヘッダ214A/214Bが対応するピクチャヘッダ213にてph_pic_parameter_set_idで指定されたPPS212に関連するsps_mmvd_fullpel_only_flagの値が「0」の場合、スライスヘッダ214A/214Bは、slice_mmvd_fullpel_only_flagを含んでもよい。
slice_mmvd_fullpel_only_flagが、スライスヘッダ214A/214Bに含まれない場合、復号部210は、slice_mmvd_fullpel_only_flagの値を「0」とみなしてもよい。
上述のsps_mmvd_fullpel_only_flagの値が「1」の場合、ピクチャヘッダ213は、slice_mmvd_fullpel_only_flagを含んでもよい。
slice_mmvd_fullpel_only_flagの値が「1」の場合は、かかるスライス内で、MMVDの伝送精度として整数精度を使用することを意味する。
slice_mmvd_fullpel_only_flagの値が「0」の場合は、かかるスライス内で、MMVDの伝送精度として小数精度を使用してもよい(すなわち、MMVDの伝送精度として小数精度及び整数精度のどちらも使用可である)ことを意味する。
slice_mmvd_fullpel_only_flagがスライスヘッダ214A/
214B内に含まれない場合、復号部210は、slice_mmvd_fullpel_
only_flagの値は「0」であるとみなしてもよい。
或いは、slice_mmvd_fullpel_only_flagがピクチャヘッダ213内に含まれない場合、復号部210は、slice_mmvd_fullpel_on
ly_flagの値がph_mmvd_fullpel_only_flagの値と同じ値で
あるとみなしてもよい。
以上のように、sps_mmvd_fullpel_only_flagの値が「0」である、すなわち、シーケンス単位でMMVDの伝送精度として小数精度を使用してもよいことを示しているときにのみ、スライス単位でMMVDの伝送精度として整数精度を使用するか否かを制御するシンタックス(slice_mmvd_fullpel_only_flag)をスライスヘッダ214A/214B内に含めるむようにすることで、例えば、s
ps_mmvd_fullpel_only_flagにより当該シーケンスでMMVDの伝送精度として整数精度を使用することが特定される場合に、不要にslice_mmvd_fullpel_only_flagをスライスヘッダ214A/214Bに含めることを
防ぐことができる。これにより、無駄な復号処理・符号化処理を削減することができ、また、スライスヘッダ214A/214Bのビット量を削減することができる。
以上で説明したフラグの値は、あくまでも一例である。フラグの値(「0」及び「1」)に与える意味を逆転させた場合、対応する処理もそれに応じて逆転させることで等価な処理を実現可能である。
また、各シンタックス間の参照関係が存在しないシンタックス同士については、復号する順番が入れ替わってもよい。更に、上記以外のシンタックスが、SPS211、PPS212、ピクチャヘッダ213、スライスヘッダ214A/214Bにそれぞれ含まれて
いてもよい。
<変更例>
上述の実施形態では、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御するシンタックスの名称をsps_mmvd_fullpell_only_flagと定義し、かかるシンタックスの値に応じた意味(セマンティクス)として、かかるシンタックスの値が「0」の場合は、MMVDの伝送精度として小数精度を使用してもよい(すなわち、MMVDの伝送精度として小数精度及び整数精度どちらも使用することができる)ことを意味し、かかるシンタックスの値が「1」の場合は、MMVDの伝送精度として整数精度を使用することを意味すると定義した。
一方で、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御するシンタックスの名称をsps_mmvd_fullpell_enabled_flagと定義し、かかるシンタックスの値に応じた意味(セマンティクス)として、かかるシンタックスの値が「0」の場合は、MMVDの伝送精度として小数精度を使用することを意味し、かかるシンタックスの値が「1」の場合は、MMVDの伝送精度として整数精度を使用してもよい(すなわち、MMVDの伝送精度として小数精度及び整数精度どちらも使用することができる)ことを意味すると定義してもよい。
ただし、このように、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御するシンタックスの名称及び意味(セマンティクス)を定義する場合、図5で示した当該シンタックスの復号条件、、図7で示したph_mmvd_fullpel_on
ly_flagの復号条件、及び、図8で示したslice_mmvd_fullpel_only_flagの復号条件が、それぞれ図9~図11のように構成される。
図7に対する図10と図8に対する図11との差異は、当該シンタックスの値が「1」の場合に、当該シンタックスの意味の変更に伴い、ph_mmvd_fullpel_on
ly_flag或いはslice_mmvd_fullpel_only_flagが復号さ
れるような構成となっている点にある。
(インター予測部241)
以下、図12を参照して、本実施形態に係るインター予測部241について説明する。図12は、本実施形態に係るインター予測部241の機能ブロックの一例について示す図である。
図12に示すように、インター予測部241は、動きベクトル復号部241Aと予測信号生成部241Bとを有する。
インター予測部241は、動きベクトルに基づいて予測ブロックに含まれる予測信号を生成するように構成されている予測部の一例である。
動きベクトル復号部241Aは、AMVP部241A1、マージ部241A2、MMV
D部241A3とを有する。ここで、動きベクトル復号部241Aは、フレームバッファ260から入力される対象フレーム及び参照フレーム、及び、画像符号化装置100から受信する制御データの復号によって、動きベクトルを取得するように構成されている。
AMVP部241A1は、動きベクトル予測(MVP:Motion VectorP
rediciton)及び動きベクトル差分(MVD:Motion VectorDifference)を示すインデックス、及び、参照フレームのリスト及びインデックスを用いて、動きベクトルを復号する適応動きベクトル予測復号(AMVP:Adaptive Motion Vector Prediction)を行うように構成されている。AMVPとしては、既知の手法を採用すること可能であるため、その詳細については省略する。
マージ部241A2は、画像符号化装置100から、マージインデックスを受信し、動きベクトルを復号するように構成されている。
具体的には、マージ部241A2は、画像符号化装置100と同じ方法でマージリストを構築して、受信したマージインデックスに対応する動きベクトルを、構築したマージリストから取得するように構成されている。マージリストの構築方法としては、既知の手法を採用することが可能であるため、その詳細については省略する。
MMVD部241A3は、画像符号化装置100から送られるMMVDに関するシンタックスに基づいて、マージ部241A2で構築されたマージリストから動きベクトルを選択し、さらに、かかる動きベクトルを修正する。詳細は、後述する。
予測信号生成部241Bは、動きベクトル復号部241Aから出力された動きベクトルに基づいて予測信号を生成するように構成されている。動きベクトルから予測信号を生成する方法としては、既知の方法を採用することが可能であるため、その詳細は省略する。
(MMVD部241A3)
以下、図13及び図14を参照して、本実施形態に係るMMVD部241A3について説明する。
図13及び図14は、本実施形態に係るMMVD部241A3による動きベクトルの修正方法を示す図である。
MMVD部241A3は、復号部210で復号されたMMVDに関連するシンタックス(mmvd_merge_flag、mmvd_cand_flag、mmvd_dista
nce_idx、mmvd_direction_idx、ph_mmvd_fullpel_only_flag)の値に基づいて、マージ部241A2で構築したマージリストから
動きベクトルを選定し、かかる動きベクトルを修正するように構成されている。
第1に、MMVD部241A3は、mmvd_merge_flagの値が「1」の場合、MMVDを実行し、mmvd_merge_flagの値が「0」の場合は、MMVDを実行しないように構成されている。
第2に、MMVD部241A3は、MMVDを実行した場合には、mmvd_cand_flagの値に基づいて、マージリストの中から動きベクトルを選定するように構成されている。
具体的には、MMVD部241A3は、mmvd_cand_flagの値が「0」であ
る場合は、マージリストの0番目の動きベクトルを修正する動きベクトルとして選定し、mmvd_cand_flagの値が「1」である場合は、マージリストの1番目の動きベクトルを修正する動きベクトルとして選定するように構成されている。
なお、マージリストに動きベクトルの候補が2つ以上ない場合は、MMVD部241A3は、mmvd_cand_flagの値を「0」としてみなすように構成されている。
また、本実施形態では、mmvd_cand_flagの値のバリエーションを「0」又は「1」として説明したが、設計者の意図で設計を変更することも可能である。
第3に、MMVD部241A3は、図10及び図14に示すmmvd_distance_idx、mmvd_direction_idx、ph_mmvd_fullpel_only_flagの値に基づいて、選定した動きベクトルを修正するように構成されている。
以下、図13を参照して、MMVD部2413A3により選定された動きベクトルに対して加算される動きベクトル差分の大きさ(距離)の導出方法について説明する。
具体的には、復号されたmmvd_distance_idx及びph_mmvd_fullpel_only_flagの値に基づいて、動きベクトル差分の大きさ(距離)が導出される。
例えば、図13に示すように、mmvd_distance_idxの値が「1」であり、ph_mmvd_fullpel_only_flagの値が「0」である場合、MmvdDistance[x0][y0]は、「2」に設定される。
ここで、MmvdDistance[x0][y0]は、MMVDによる動きベクトルの修正距離、すなわち、選定された動きベクトルに対して加算される動きベクトル差分の距離を示す内部パラメータである。
MmvdDistance[x0][y0]の値が「2」に設定される場合は、選定された動きベクトルに対して、後述するmmvd_direction_idxによって導出される方向に、動きベクトル差分の伝送精度の初期値である1/4精度に「2」が乗算さ
れて1/2の距離が加算される構成となっている。
ph_mmvd_fullpel_only_flagの値が「1」である場合は、上述の動きベクトル差分の伝送精度の初期値に乗算される値が「4」から開始されるため、加算される動きベクトル差分の伝送精度は、常に整数精度となる構成となっている。
なお、上記では、ph_mmvd_fullpel_only_flagによるMMVDの動きベクトルの修正距離の導出方法を説明したが、ph_mmvd_fullpel_on
ly_flagが、上述したslice_mmvd_fullpel_only_flagに
置換されてもよい。
次に、図14を参照して、MMVD部241A3により選定された動きベクトルに対して加算される動きベクトル差分の方向の導出方法を説明する。
具体的には、復号されたmmvd_direction_idxの値に基づいて、動きベクトル差分の方向が導出される。
例えば、図14に示すように、mmvd_direction_idxの値が「0」から
「3」の値によって、MmvdSign[x0][y0][0]の値及びMmvdSign[x0][y0][1]の値が導出される構成となっている。
MMVDによる動きベクトル差分は、以下のように、MmvdDistance[x0
][y0]、MmvdSign[x0][y0][0]及びMmvdSign[x0][y0][1]より導出されるMmvdOffset[x0][y0][0]及びMmvdOffset[x0][y0][1]として導出される。
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)×MmvdSign[x0][y0][0]
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)×MmvdSign[x0][y0][1]
以上のように、MMVD部241A3により導出された動きベクトル差分、すなわち、MmvdOffsetが、選定された動きベクトルに加算されて動きベクトルが修正され、これにより動きベクトルの精度が向上して予測性能が向上することで、符号化性能の改善が期待される。
上述の画像符号化装置100及び画像復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、上述の各実施形態では、本発明を画像符号化装置100及び画像復号装置200への適用を例にして説明したが、本発明は、これのみに限定されるものではなく、画像符号化装置100及び画像復号装置200の各機能を備えた画像符号化システム及び画像復号システムにも同様に適用できる。
10…画像処理システム
100…画像符号化装置
111、241…インター予測部
112、242…イントラ予測部
121…減算器
122、230…加算器
131…変換・量子化部
132、220…逆変換・逆量子化部
140…符号化部
150、250…インループフィルタ処理部
160、260…フレームバッファ
200…画像復号装置
210…復号部
241A…動きベクトル復号部
241A1…AMVP部
241A2…マージ部
241A3…MMVD部
241B…予測信号生成部

Claims (3)

  1. 画像復号装置であって、
    復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスを復号するように構成されている復号部を備え、
    前記第1シンタックスの値が「1」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度及び整数精度のどちらも使用できることを示し、
    前記第1シンタックスの値が「0」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度を使用することを示すことを特徴とする画像復号装置。
  2. 画像復号方法であって、
    復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスをする工程を有し、
    前記第1シンタックスの値が「1」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度及び整数精度のどちらも使用できることを示し、
    前記第1シンタックスの値が「0」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度を使用することを示すことを特徴とする画像復号方法。
  3. コンピュータを、画像復号装置として機能させるプログラムであって、
    前記画像復号装置は、復号対象のシーケンスにおけるマージ動きベクトル差分の伝送精度を制御する第1シンタックスを復号するように構成されている復号部を備え、
    前記第1シンタックスの値が「1」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度及び整数精度のどちらも使用できることを示し、
    前記第1シンタックスの値が「0」の場合には、前記第1シンタックスは、前記復号対象のシーケンスにおけるマージモード動きベクトル差分の伝送精度として小数精度を使用することを示すことを特徴とするプログラム。
JP2020099716A 2020-06-08 2020-06-08 画像復号装置、画像復号方法及びプログラム Active JP7075963B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2020099716A JP7075963B2 (ja) 2020-06-08 2020-06-08 画像復号装置、画像復号方法及びプログラム
PCT/JP2021/021276 WO2021251278A1 (ja) 2020-06-08 2021-06-03 画像復号装置、画像復号方法及びプログラム
EP21822640.5A EP4149112A4 (en) 2020-06-08 2021-06-03 IMAGE DECODING APPARATUS, IMAGE DECODING METHOD AND PROGRAM
CN202180041300.2A CN115918086A (zh) 2020-06-08 2021-06-03 图像解码装置、图像解码方法及程序
JP2022080426A JP7387806B2 (ja) 2020-06-08 2022-05-16 画像復号装置、画像復号方法及びプログラム
US18/062,993 US20230103543A1 (en) 2020-06-08 2022-12-07 Image decoding device, image decoding method, and program
JP2023194119A JP2024003175A (ja) 2020-06-08 2023-11-15 画像復号装置、画像復号方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020099716A JP7075963B2 (ja) 2020-06-08 2020-06-08 画像復号装置、画像復号方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022080426A Division JP7387806B2 (ja) 2020-06-08 2022-05-16 画像復号装置、画像復号方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021193782A JP2021193782A (ja) 2021-12-23
JP7075963B2 true JP7075963B2 (ja) 2022-05-26

Family

ID=78846146

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020099716A Active JP7075963B2 (ja) 2020-06-08 2020-06-08 画像復号装置、画像復号方法及びプログラム
JP2022080426A Active JP7387806B2 (ja) 2020-06-08 2022-05-16 画像復号装置、画像復号方法及びプログラム
JP2023194119A Pending JP2024003175A (ja) 2020-06-08 2023-11-15 画像復号装置、画像復号方法及びプログラム

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2022080426A Active JP7387806B2 (ja) 2020-06-08 2022-05-16 画像復号装置、画像復号方法及びプログラム
JP2023194119A Pending JP2024003175A (ja) 2020-06-08 2023-11-15 画像復号装置、画像復号方法及びプログラム

Country Status (5)

Country Link
US (1) US20230103543A1 (ja)
EP (1) EP4149112A4 (ja)
JP (3) JP7075963B2 (ja)
CN (1) CN115918086A (ja)
WO (1) WO2021251278A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113039796B (zh) 2018-11-17 2023-09-19 北京字节跳动网络技术有限公司 视频处理中的广义双向预测模式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Benjamin Bross, et al.,Versatile Video Coding (Draft 9),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-R2001-vA,2020年05月15日,pp.40-45, 48-52, 110, 128
Seungsoo Jeong, et al.,CE4 Ultimate motion vector expression (Test 4.5.4),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-L0054,2018年09月21日

Also Published As

Publication number Publication date
JP2022103285A (ja) 2022-07-07
US20230103543A1 (en) 2023-04-06
WO2021251278A1 (ja) 2021-12-16
JP2024003175A (ja) 2024-01-11
JP7387806B2 (ja) 2023-11-28
EP4149112A4 (en) 2023-11-01
JP2021193782A (ja) 2021-12-23
CN115918086A (zh) 2023-04-04
EP4149112A1 (en) 2023-03-15

Similar Documents

Publication Publication Date Title
JP6961115B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP7075963B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP7076660B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP7026276B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP6914462B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP7083971B1 (ja) 画像復号装置、画像復号方法及びプログラム
JP7061737B1 (ja) 画像復号装置、画像復号方法及びプログラム
JP7034363B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP7324899B2 (ja) 画像復号装置、画像復号方法及びプログラム
WO2023277107A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2020184262A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2020255846A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2021199780A1 (ja) 画像復号装置、画像復号方法及びプログラム
US20240129482A1 (en) Video encoding device, video decoding device, and video encoding method
CN117795962A (zh) 图像解码装置、图像解码方法及程序
CN117581546A (zh) 图像解码装置、图像解码方法及程序
CN117356094A (zh) 用于视频处理的方法、设备和介质
JP2020108033A (ja) 画像復号装置、画像符号化装置、プログラム及び画像処理システム
JP2016051922A (ja) 動画像符号化装置、動画像復号装置、動画像処理システム、動画像符号化方法、動画像復号方法、およびプログラム
JP2016146572A (ja) 動画像符号化装置、動画像復号装置、動画像処理システム、動画像符号化方法、動画像復号方法、およびプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211202

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220516

R150 Certificate of patent or registration of utility model

Ref document number: 7075963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150