JP7842718B2 - 画像復号装置、画像復号方法及びプログラム - Google Patents

画像復号装置、画像復号方法及びプログラム

Info

Publication number
JP7842718B2
JP7842718B2 JP2023137447A JP2023137447A JP7842718B2 JP 7842718 B2 JP7842718 B2 JP 7842718B2 JP 2023137447 A JP2023137447 A JP 2023137447A JP 2023137447 A JP2023137447 A JP 2023137447A JP 7842718 B2 JP7842718 B2 JP 7842718B2
Authority
JP
Japan
Prior art keywords
prediction unit
control information
image decoding
frame prediction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023137447A
Other languages
English (en)
Other versions
JP2025031308A (ja
Inventor
晴久 加藤
佳隆 木谷
圭 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2023137447A priority Critical patent/JP7842718B2/ja
Priority to CN202480052267.7A priority patent/CN121666755A/zh
Priority to PCT/JP2024/008390 priority patent/WO2025046946A1/ja
Publication of JP2025031308A publication Critical patent/JP2025031308A/ja
Application granted granted Critical
Publication of JP7842718B2 publication Critical patent/JP7842718B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像復号装置、画像復号方法及びプログラムに関する。
非特許文献1及び2では、イントラテンプレートマッチング予測(IntraTMP:Intra Template Matching Prediction)が開示されている。
IntraTMPは、復号対象フレームの復号済み画素領域からテンプレートマッチングで一致する画素を参照し、復号対象ブロックの予測画素とする。
具体的には、画像符号化装置は、復号済みの近傍画素をテンプレートとし、同一フレームからテンプレートマッチングのコストが小さい座標を探索し、かかる座標までの変位量をブロックベクトル(BV)とする。
画像符号化装置は、テンプレートマッチングのコストが小さい順にBVリスト(参照リスト)を構築し、かかるBVリストのインデックスを符号化する。
画像復号装置でも、同じ方法で探索すると共に、上述のBVリストを再構築することで、かかるBVリストのインデックスからBVを復号する。
図2に示すように、画像復号装置は、復号対象ブロックのBVが示す参照ブロックから画素をコピーすることで予測画素として利用する。
K. Naser, et al., "EE2: Intra Template Matching," Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29, JVET-V0130, 22nd meeting, Apr. 2021 M. Coban, et al., "Algorithm description of Enhanced Compression Model 9 (ECM 9)", JVET-AD2025, 2023
非特許文献1及び2では、テンプレートマッチングのコストとして、絶対値誤差和(SAD:Sum of Absolute Difference)が用いられている。
また、非特許文献2では、探索を高速化するために、2階層でBVの探索が実施されている。
ここで、1階層目のBVの探索では、粗くBVを探索し、SADが小さい座標を選択する。2階層目のBVの探索では、1階層目でSADが小さかった座標を中心として詳細にBVを探索する。
このとき、1階層目のBVの探索で局所最小に陥らないようにするため、SADが小さい上位N個のBV候補を保持する。
さらに、2階層目は、それぞれのBV候補を中心として周囲のSADを算出する際に、BV候補中で最大となるSADを基準としてBV候補を制限する。
しかしながら、上位N個のSADが全て同値の場合は、2階層目の探索対象のBVが失われるため、有効なBVを探索できないという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、符号化効率の高い画像復号装置、画像復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、画像復号装置であって、制御情報並びに量子化値を復号する復号部と、前記量子化値を逆量子化して変換係数とする逆量子化部と、前記変換係数を逆変換して予測残差とする逆変換部と、復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画像を生成する第2フレーム内予測部と、前記復号済み画素を蓄積する蓄積部と、前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルVを登録することを要旨とする。
本発明の第2の特徴は、画像復号方法であって、制御情報並びに量子化値を復号する工程Aと、前記量子化値を逆量子化して変換係数とする工程Bと、前記変換係数を逆変換して予測残差とする工程Cと、復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する工程Dと、前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画像を生成する工程Eと、前記復号済み画素を蓄積する工程Fと、前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成する工程Gと、前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る工程Hとを有し、前記工程Eにおいて、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルを登録することを要旨とする。
本発明の第3の特徴は、コンピュータを、画像復号装置として機能させるプログラムであって、前記画像復号装置は、制御情報並びに量子化値を復号する復号部と、前記量子化値を逆量子化して変換係数とする逆量子化部と、前記変換係数を逆変換して予測残差とする逆変換部と、復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画像を生成する第2フレーム内予測部と、前記復号済み画素を蓄積する蓄積部と、前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルを登録することを要旨とする。
本発明の第4の特徴は、画像復号装置であって、制御情報並びに量子化値を復号する復号部と、前記量子化値を逆量子化して変換係数とする逆量子化部と、前記変換係数を逆変換して予測残差とする逆変換部と、復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画像を生成する第2フレーム内予測部と、前記復号済み画素を蓄積する蓄積部と、前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において1階層目の参照リスト内の最大コストよりも小さいコストを持つブロックベクトルが存在しない場合、2階層目の参照リストに、前記1階層目の参照リスト内の任意のブロックベクトルを登録することを要旨とする。
本発明によれば、符号化効率の高い画像復号装置、画像復号方法及びプログラムを提供することができる。
図1は、一実施形態に係る画像復号装置200の機能ブロックの一例を示す図である。 図2は、IntraTMPの一例について説明するための図である。 図3は、シーケンス単位で補正の方法を設定する方法の一例を示すフローチャートである。 図4は、ブロック単位でIntraTMPのBVの探索を制御する方法の一例を示すフローチャートである。 図5は、テンプレートの一例を説明するための図である。 図6は、BVリストの一例を説明するための図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
以下、図1~図6を参照して、本実施形態に係る画像復号装置200について説明する。図1は、本実施形態に係る画像復号装置200の機能ブロックの一例について示す図である。
図1に示すように、画像復号装置200は、符号入力部210と、復号部201と、逆量子化部202と、逆変換部203と、第1フレーム内予測部204と、第2フレーム内予測部205と、フレーム間予測部206と、加算器207と、蓄積部208と、画像出力部220とを有する。
符号入力部210は、画像符号化装置によって符号化された符号情報を取得するように構成されている。
復号部201は、符号入力部210から入力された符号情報から、制御情報並びに量子化値を復号するように構成されている。例えば、復号部201は、かかる符号情報に対して可変長復号を行うことで制御情報及び量子化値を出力するように構成されている。
ここで、量子化値は、逆量子化部202に送られ、制御情報は、第1フレーム内予測部204、第2フレーム内予測部205及びフレーム間予測部206に送られる。なお、かかる制御情報は、第1フレーム内予測部204、第2フレーム内予測部205及びフレーム間予測部206等の制御に必要な情報を含み、シーケンスパラメータセットやピクチャパラメータセットやピクチャヘッダやスライスヘッダ等のヘッダ情報を含んでもよい。
逆量子化部202は、復号部201から送られた量子化値を逆量子化して変換係数とするように構成されている。かかる変換係数は、逆変換部203に送られる。
逆変換部203は、逆量子化部202から送られた変換係数を逆変換して予測残差とするように構成されている。かかる予測残差は、加算器207に送られる。
第1フレーム内予測部204は、加算器207を介して得られる復号済み画素及び復号部201で復号された制御情報に基づいて、加算器207で予測残差と加算するための第1予測画素を生成するように構成されている。かかる第1予測画素は、加算器207及び第2フレーム内予測部205に送られる。
フレーム間予測部206は、蓄積部208を参照して得られる復号済み画素及び復号部201で復号された制御情報に基づいて、加算器207で予測残差と加算するための第3予測画素を生成するように構成されている。かかる第3予測画素は、加算器207に送られる。
蓄積部208は、加算器207から送られた復号済み画素を累積的に蓄積するように構成されている。かかる復号済み画素は、蓄積部208を介してフレーム間予測部206からの参照を受ける。
加算器207は、逆変換部203から送られる予測残差と、第1フレーム内予測部204、第2フレーム内予測部205及びフレーム間予測部206から送られる第1乃至第3予測画素のいずれかとを加算して復号済み画素を得るように構成されている。かかる復号済み画素は、画像出力部220、蓄積部208、第1フレーム内予測部204及び第2フレーム内予測部205へ送られる。
(第2フレーム内予測部205)
以下、第2フレーム内予測部205による第2予測画素を導出する方法の一例について説明する。
第2フレーム内予測部205の役割は、後段の加算器207において復号対象ブロックを高精度に補償するために、かかる復号対象ブロックに対してブロックベクトル(以下、BVと表記)を導出して、BVが参照するブロックの画素を予測すること(第2フレーム内予測)にある。
第2フレーム内予測の例には、非特許文献2で開示されているイントラテンプレートマッチング予測(以下、IntraTMPと表記)がある。
第2フレーム内予測部205は、IntraTMPを行う場合、同一フレーム内の復号済み画素をテンプレートとして、同じく同一フレームで当該テンプレートが一致する座標を探索し、当該座標までの変位量をBVとし、復号対象ブロックからBVへ変位したブロックを復号対象ブロックの予測画素として参照する。
テンプレートは、復号対象ブロックの近傍画素を利用でき、任意のライン数を用いることができる。また、テンプレートは、図5に示すように、復号対象ブロックの上の近傍画素及び左の近傍画素の両方を用いることができるし、上の近傍画素だけ或いは左の近傍画素だけを用いることもできる。
ここで、第2フレーム内予測部205は、IntraTMPを行う場合、探索時間を短縮するため、階層的にBVを探索する。
階層数は、任意の値を設定できるが、以下では、第2フレーム内予測部205が、2階層でBVを探索する例を示す。また、BV探索のテンプレートマッチングのコストとしてSAD(Sum of Absolute Difference)を用いる場合を説明するが、SATD等の任意のコストを利用できる。
第2フレーム内予測部205は、1階層目で、粗くBVを探索してBV候補を選別した後に、2階層目で、詳細にBVを探索してBVを確定する。
ここで、第2フレーム内予測部205は、1階層目で粗くBVを探索する際に、BVの探索の粗密を設定する制御情報に基づいて、BVの探索の粗密を変更するように構成されていてもよい。
例えば、文書等のスクリーンコンテンツでは、完全に一致する座標が存在し得ることから、一画素でもずれるとSADが大きく変化するため、スクリーンコンテンツでは、密にBVを探索するよう設定することが望ましい。
一方、カメラ撮影コンテンツでは、SADの分布が比較的なだらかであるため、カメラ撮影コンテンツでは、疎にBVを探索するよう設定することが望ましい。
また、第2フレーム内予測部205は、明示的な制御情報を用いることなく、BVの探索方向に応じて、BVの探索の粗密を変更するように構成されていてもよい。
同じテクスチャが反復している場合を想定すると、完全一致する座標が真横或いは真上に存在することが多いため、真横方向或いは真上方向へは、密にBVを探索することが望ましい。一方、斜め方向には、疎にBVを探索することが望ましい。
或いは、第2フレーム内予測部205は、明示的な制御情報を用いることなく、ブロックサイズに応じて、BVの探索の粗密を変更するように構成されていてもよい。
ブロックサイズが小さいほど、完全一致する座標が探索されやすいため、ブロックサイズが小さいほど、密にBVを探索することが望ましい。
逆に、ブロックサイズが大きいほど、一致する座標を探索できた場合に符号化効率の改善幅が大きいため、ブロックサイズが大きいほど、密にBVを探索してもよい。
いずれの場合も、第2フレーム内予測部205は、1階層目のBVの探索で、上位N個のBV候補を選択し、2階層目のBVの探索に利用する。
第2フレーム内予測部205は、階層的にBVを探索する場合、各階層においてBVリストを構築する。
なお、BVリストは、テンプレートの種類ごとに用意することができる。例えば、図5に示すように、復号対象ブロックの上及び左の両方の近傍画素をテンプレートとする場合と、復号対象ブロックの上の近傍画素だけをテンプレートとする場合、復号対象ブロックの左の近傍画素だけをテンプレートにする場合のそれぞれに異なるBVリストを用意する。それぞれのBVリストの長さは、一致していてもよいし異なっていてもよい。
SAD算出は、復号対象ブロックの上の近傍画素だけのテンプレートによるSAD及び復号対象ブロックの左の近傍画素だけのテンプレートによるSADをそれぞれ算出し、両SADは、両SADの合計とすることで計算量を削減することができる。
或いは、復号対象ブロックの上の近傍画素だけのテンプレートによるSAD及び復号対象ブロックの左の近傍画素だけのテンプレートによるSADを算出した後、SAD算出は、復号対象ブロックの上の近傍画素だけのテンプレートによるSAD及び復号対象ブロックの左の近傍画素だけのテンプレートによるSADを、両SADからそれぞれのテンプレートに該当する分だけ差し引いて算出することで計算量を削減することができる。
第2フレーム内予測部205は、各階層において複数のBVを登録できるBVリストを用意しておき、各座標のSADを算出した際に、かかるBVリスト内の所定のSADより小さいBVのみ、BVリストに登録する。
所定のSADは、前階層のBVリストが全て埋まっている場合は、当該BVリストのSADの最大値とし、そうでない場合は、予め設定した値とする。
予め設定する値は、復号対象ブロックの画素数やビット深度に応じて変更することもできる。
BVリストが全て埋まっている場合、所定のSADより小さなSADを持つBVを追加するともにSADが最大となるBVを削除する。
BVを登録する際は、BVリストをSADの昇順に並べ替えておくことが望ましい。
また、テンプレートの種類ごとのBVリストを保持している場合は、それぞれのBVリストごとに所定のSADを設定することができる。或いは、複数のBVリストのそれぞれの最大SADの中から最小値を選択し所定のSADとして共通に設定してもよい。
また、第2フレーム内予測部205は、テンプレートの種類ごとにBVリストを保持している場合は、全階層のBV探索が終了した時点でBVリストのSADの昇順でBVリストに収まる数だけ選択しBVリストを1つに統合した上でBVリストのインデックスを決定する。
或いは、第2フレーム内予測部205は、階層を跨ぐごとにBVリストを1つに統合してもよい。このとき、第2フレーム内予測部205は、BVが重複している場合は、SADが小さいBVを残し、SADが大きいBVはリストから削除する。
テンプレートの種類ごとにBVリストを保持している場合で且つBVリストが埋まっている場合は、第2フレーム内予測部205は、図6に示すように、それぞれのBVリストからBVリストに収まる数のBVの中で最小のSADを選択し、次階層の所定のSADに設定してもよい。
また、第2フレーム内予測部205は、SADの算出の途中であっても、BVリスト内の所定のSAD以上になった時点で、SADの算出処理を中断することで、無駄な探索を早期に打ち切ることができ、探索処理を高速化することができる。
さらに、第2フレーム内予測部205は、BVリストが全て埋まった状態でBVが追加される場合、所定のSADをBVリストの最大SADに更新することが望ましい。
ただし、BVの探索が、階層を跨いで行われる場合、第2フレーム内予測部205は、先にBVを探索した階層のBVリスト内の最大SAD+M(M>0)より小さいSADを持つBVを、現在BVを探索している階層のBVリストに登録する。
第2フレーム内予測部205は、2階層目のBVリストが空の状態で、1階層目のBVリスト内のBV候補を中心として近傍を詳細に探索することで2階層目の探索を始める。例えば、M=1とした場合、第2フレーム内予測部205は、2階層目のBV探索では、1階層目のBVリスト内の最大SAD+1より小さいSADのBVのみ2階層目のBVリストに登録する。
すなわち、2階層目のSAD及び1階層目のBVリスト内の最大SADが全て同値である場合であっても、BVリストに1つもBVが登録されないという不具合を回避できる効果が得られる。
また、1階層目のBVリスト内の最大SAD+1を超える場合は、それ以上の当該座標における探索を打ち切ることで処理時間の短縮を図ることができるという効果が得られる。
BVリストは、複数の異なるBVをIntraTMPの加重平均予測(IntraTMP Fusion)や整数画素精度に加えて小数画素精度のBVを許容するIntraTMP(Fractional IntraTMP)、複数のBV候補から1つ或いはBVリストの最大以下の任意の数のBVを選択するIntraTMP(Multi-candidate IntraTMP)においても利用できる。
別の実施例では、第2フレーム内予測部205は、2階層目のリストが空にならないよう、1階層目のBVリスト内の任意のBV候補を2階層目のBVリストに登録してもよい。
かかる場合、1階層目のBVリスト内のSADが最小となるBV候補を、2階層目のBVリストに登録することが望ましい。
BVリスト内のSADが最小となるBVが複数存在する場合は、第2フレーム内予測部205は、SAD以外の基準で選択する。
例えば、かかる基準としては、BVの長さやx軸或いはy軸からの距離を利用することができ、いずれも小さいBVを選択することが望ましい。
また、複数のBV候補におけるブロック同士が完全一致する(BVが違ってもBVリストに実質的な重複が存在する)場合、インデックスに無駄が生じるので、第2フレーム内予測部205は、BVリストに登録されている2つ以上のBVが参照するブロック間の差異が所定閾値より小さい場合は、かかる2つ以上のBVのうち1つを除いてBVリストから除外する。
以下、図3及び図4を参照して、第2フレーム内予測を行う際に復号部201によって復号される制御情報について説明する。
復号部201に入力される符号は、シーケンス単位の制御情報をまとめたシーケンスパラメータセット(SPS)を含むことができる。
また、かかる符号は、ピクチャ単位の制御情報をまとめたピクチャパラメータセット(PPS)或いはピクチャヘッダ(PH)を含むことができる。かかる符号は、スライス単位の制御情報をまとめたスライスヘッダ(SH)を含んでもよい。
図3を参照して、シーケンス単位で補正の方法を設定する方法について述べる。
図3に示すように、ステップS101において、復号部201は、シーケンスパラメータセットで、sps_itmp_enabled_flagが1であるか否かについて判定する。
sps_itmp_enabled_flagは、IntraTMPの有無を制御するシンタックスであり、sps_itmp_enabled_flagが1である場合は、IntraTMPが有効であることを示し、sps_itmp_enabled_flagが0である場合は、IntraTMPが無効であることを示す。
sps_itmp_enabled_flagが1である場合は、本動作は、ステップS102に進み、sps_itmp_enabled_flagが0である場合は、本動作は、終了する。
ステップS102において、復号部201は、sps_itmp_modeを復号する。
sps_itmp_modeは、IntraTMPの方法を制御するシンタックスである。
sps_itmp_modeを用いることで、シーケンス単位で画像特性に応じたIntraTMPの方法を変更できるため、符号化効率を最大化する効果が期待できる。
例えば、CGで構成されるシーケンスに対しては画素分布が同値で構成されることが多いので、IntraTMPのBVの探索を密にするように設定でき、自然画像で構成されるシーケンスに対しては画素分布が多様であるため、IntraTMPのBVの探索を疎にするように設定でき、符号化効率の最大化が図れる。
ピクチャ単位で補正の方法を設定する場合は、復号部201は、ピクチャパラメータセット或いはピクチャヘッダで、pps_itmp_enabled_flag及びpps_itmp_modeを同様に復号する。
pps_itmp_modeを用いることで、ピクチャ単位で画像特性に応じた補正の方法が設定変更できるため、符号化効率を最大化する効果が期待できる。
例えば、CGで構成されるピクチャに対しては画素分布が同値で構成されることが多いので、IntraTMPのBVの探索を密にするように設定でき、自然画像で構成されるピクチャに対しては画素分布が多様であるため、IntraTMPのBVの探索を疎にするように設定でき、符号化効率の最大化が図れる。
スライス単位で補正の方法を設定する場合は、復号部201は、スライスヘッダで、sh_itmp_enabled_flag及びsh_itmp_modeを同様に復号する。
sh_itmp_modeを用いることで、スライス単位で画像特性に応じた補正の方法が設定変更できるため、符号化効率を最大化する効果が期待できる。
例えば、CGで構成されるスライス領域に対しては画素分布が同値で構成されることが多いので、IntraTMPのBVの探索を密にするように設定でき、自然画像で構成されるスライス領域に対しては画素分布が多様であるため、IntraTMPのBVの探索を疎にするように設定でき、符号化効率の最大化が図れる。
上位層でのみ設定することで符号量の増大を抑制することもできるし、下位層でも設定した上で下位層での設定を優先することで適応的な制御ができる。
或いは、上述の補正の方法が事前に設定されている場合は、かかる補正の方法の復号自体を省略することができる。
なお、上述の例では、シーケンス単位、ピクチャ単位或いはスライス単位でIntraTMPの方法の設定方法を述べたが、これらを設定せずに、後述のブロック単位で直接方法を選択してもよい。この場合、上述のヘッダ情報の増加を回避できる。
以下、図4を参照して、ブロック単位でIntraTMPのBVの探索を制御する方法について述べる。
図4に示すように、ステップS201において、復号部201は、sps_itmp_enabled_flag、pps_itmp_enabled_flag又はsh_itmp_enabled_flagのいずれかが1であるか否かについて判定する。
いずれも1でない場合は、本動作は、終了し、いずれかが1である場合、本動作は、ステップS202に進む。
ステップS202において、復号部201は、IntraTMPの制御信号であるcu_itmp_modeを復号する。
ステップS203において、復号部201は、インデックスを表す制御信号であるcu_itmp_indexを復号する。
本実施形態によれば、IntraTMPのBVの復号において適応的にBVリストを設定することで比較的少ない符号量から復号するので、符号化効率を向上させることができる。
上述の画像復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
200…画像復号装置
201…復号部
202…逆量子化部
203…逆変換部
204…第1フレーム内予測部
205…第2フレーム内予測部
206…フレーム間予測部
207…加算器
208…蓄積部
210…符号入力部
220…画像出力部

Claims (14)

  1. 画像復号装置であって、
    制御情報並びに量子化値を復号する復号部と、
    前記量子化値を逆量子化して変換係数とする逆量子化部と、
    前記変換係数を逆変換して予測残差とする逆変換部と、
    復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、
    前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画を生成する第2フレーム内予測部と、
    前記復号済み画素を蓄積する蓄積部と、
    前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、
    前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、
    前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルを登録することを特徴とする画像復号装置。
  2. 画像復号装置であって、
    制御情報並びに量子化値を復号する復号部と、
    前記量子化値を逆量子化して変換係数とする逆量子化部と、
    前記変換係数を逆変換して予測残差とする逆変換部と、
    復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、
    前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画を生成する第2フレーム内予測部と、
    前記復号済み画素を蓄積する蓄積部と、
    前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、
    前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、
    前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において1階層目の参照リスト内の最大コストよりも小さいコストを持つブロックベクトルが存在しない場合、2階層目の参照リストに、前記1階層目の参照リスト内の任意のブロックベクトルを登録することを特徴とする画像復号装置。
  3. 前記コストは、差分絶対値和であることを特徴とする請求項1又は2に記載の画像復号装置。
  4. 前記Mは、1であることを特徴とする請求項1に記載の画像復号装置。
  5. 前記制御情報は、ブロックベクトルの探索の粗密を設定する情報であり、
    前記第2フレーム内予測部は、前記制御情報に基づいて、前記ブロックベクトルの探索の粗密を変更することを特徴とする請求項1に記載の画像復号装置。
  6. 前記第2フレーム内予測部は、ブロックベクトル探索方向に応じて、ブロックベクトルの探索の粗密を変更することを特徴とする請求項1に記載の画像復号装置。
  7. 前記第2フレーム内予測部は、真横方向或いは真上方向へは密にブロックベクトルを探索することを特徴とする請求項6に記載の画像復号装置。
  8. 前記第2フレーム内予測部は、斜め方向には疎にブロックベクトルを探索することを特徴とする請求項6に記載の画像復号装置。
  9. 前記第2フレーム内予測部は、ブロックサイズに応じてブロックベクトルの探索の粗密を変更することを特徴とする請求項1に記載の画像復号装置。
  10. 前記第2フレーム内予測部は、ブロックサイズが小さいほど密にブロックベクトルを探索することを特徴とする請求項9に記載の画像復号装置。
  11. 前記第2フレーム内予測部は、ブロックサイズが大きいほど密にブロックベクトルを探索することを特徴とする請求項9に記載の画像復号装置。
  12. 前記第2フレーム内予測部は、2つ以上のブロックベクトルが参照するブロック間の差異が所定閾値より小さい場合は、前記2つ以上のブロックベクトルのうち1つを除いて前記参照リストから除外することを特徴とする請求項に記載の画像復号装置。
  13. 画像復号方法であって、
    制御情報並びに量子化値を復号する工程Aと、
    前記量子化値を逆量子化して変換係数とする工程Bと、
    前記変換係数を逆変換して予測残差とする工程Cと、
    復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する工程Dと、
    前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画を生成する工程Eと、
    前記復号済み画素を蓄積する工程Fと、
    前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成する工程Gと、
    前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る工程Hとを有し、
    前記工程Eにおいて、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルを登録することを特徴とする画像復号方法。
  14. コンピュータを、画像復号装置として機能させるプログラムであって、
    前記画像復号装置は、
    制御情報並びに量子化値を復号する復号部と、
    前記量子化値を逆量子化して変換係数とする逆量子化部と、
    前記変換係数を逆変換して予測残差とする逆変換部と、
    復号済み画素と前記制御情報とに基づいて、第1予測画素を生成する第1フレーム内予測部と、
    前記復号済み画素と前記制御情報とに基づいて参照リストを構築し、前記参照リストを用いて第2予測画を生成する第2フレーム内予測部と、
    前記復号済み画素を蓄積する蓄積部と、
    前記蓄積された復号済み画素と前記制御情報とに基づいて、第3予測画素を生成するフレーム間予測部と、
    前記予測残差と前記第1乃至第3予測画素とを加算して前記復号済み画素を得る加算器とを具備し、
    前記第2フレーム内予測部は、イントラテンプレートマッチング予測を行う場合、2階層目のブロックベクトルの探索において、1階層目の参照リスト内の最大コスト+M(M>0)よりも小さいコストを持つブロックベクトルを登録することを特徴とするプログラム。
JP2023137447A 2023-08-25 2023-08-25 画像復号装置、画像復号方法及びプログラム Active JP7842718B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2023137447A JP7842718B2 (ja) 2023-08-25 2023-08-25 画像復号装置、画像復号方法及びプログラム
CN202480052267.7A CN121666755A (zh) 2023-08-25 2024-03-05 图像解码装置、图像解码方法以及程序
PCT/JP2024/008390 WO2025046946A1 (ja) 2023-08-25 2024-03-05 画像復号装置、画像復号方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023137447A JP7842718B2 (ja) 2023-08-25 2023-08-25 画像復号装置、画像復号方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2025031308A JP2025031308A (ja) 2025-03-07
JP7842718B2 true JP7842718B2 (ja) 2026-04-08

Family

ID=94818589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023137447A Active JP7842718B2 (ja) 2023-08-25 2023-08-25 画像復号装置、画像復号方法及びプログラム

Country Status (3)

Country Link
JP (1) JP7842718B2 (ja)
CN (1) CN121666755A (ja)
WO (1) WO2025046946A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023034782A1 (en) 2021-09-01 2023-03-09 Tencent America LLC Template matching on ibc merge candidates

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112840654B (zh) * 2018-10-12 2024-04-16 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023034782A1 (en) 2021-09-01 2023-03-09 Tencent America LLC Template matching on ibc merge candidates

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XU, Xiaozhong et al.,Overview of Screen Content Coding in Recently Developed Video Coding Standards,IEEE Transactions on Circuits and Systems for Video Technology,米国,IEEE,2021年03月08日,Vol.32, No.2,pp.839-852,[online], [retrieved on 2024-05-15], Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/9371731>,https://doi.org/10.1109/TCSVT.2021.3064210

Also Published As

Publication number Publication date
WO2025046946A1 (ja) 2025-03-06
CN121666755A (zh) 2026-03-13
JP2025031308A (ja) 2025-03-07

Similar Documents

Publication Publication Date Title
AU2022228201B2 (en) Image encoding/decoding method and device
JP4662636B2 (ja) 動き推定とブロックマッチング・パターンの改良
TWI666918B (zh) 決定在視訊寫碼中之調色板寫碼區塊的調色板大小、調色板單元及過濾
US8204327B2 (en) Context adaptive hybrid variable length coding
US8340448B2 (en) Locally variable quantization and hybrid variable length coding for image and video compression
KR101083379B1 (ko) 움직임 벡터 탐색 방법 및 장치 그리고 프로그램을 기록한 기록매체
KR20110083365A (ko) 움직임 벡터를 부호화, 복호화하는 방법 및 장치
US12114006B2 (en) Method and apparatus for constructing motion information list in video encoding and decoding and device
JP2007166039A (ja) 画像符号化装置
CN114390289B (zh) 参考像素候选列表构建方法、装置、设备及存储介质
CN119183659A (zh) 图像编码/解码方法、设备及存储比特流的记录介质
KR20240127495A (ko) 디코딩 방법, 인코딩 방법, 장치, 기기 및 저장매체
KR20210011452A (ko) 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램, 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
GB2640040A (en) Image coding and decoding
JP7842718B2 (ja) 画像復号装置、画像復号方法及びプログラム
KR20210013200A (ko) 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램, 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
US11087500B2 (en) Image encoding/decoding method and apparatus
JP2012134757A (ja) コンテクスト適応エントロピー符号化方法,コンテクスト適応エントロピー復号方法,コンテクスト適応エントロピー符号化装置,コンテクスト適応エントロピー復号装置およびそれらのプログラム
KR20210015901A (ko) 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
US20060278725A1 (en) Image encoding and decoding method and apparatus, and computer-readable recording medium storing program for executing the method
JP2025086972A (ja) 画像復号装置、画像復号方法及びプログラム
JP2016195326A (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化用コンピュータプログラム
JP5194082B2 (ja) 画像符号化装置
CN120826907A (zh) 视频编解码方法、装置、设备、系统、及存储介质
JP2006128759A (ja) 映像符号化装置、映像復号化装置、映像符号化方法及び映像復号化方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20250501

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20260210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20260226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260327

R150 Certificate of patent or registration of utility model

Ref document number: 7842718

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150