JP2023047920A - 画像復号装置、画像復号方法及びプログラム - Google Patents

画像復号装置、画像復号方法及びプログラム Download PDF

Info

Publication number
JP2023047920A
JP2023047920A JP2021157115A JP2021157115A JP2023047920A JP 2023047920 A JP2023047920 A JP 2023047920A JP 2021157115 A JP2021157115 A JP 2021157115A JP 2021157115 A JP2021157115 A JP 2021157115A JP 2023047920 A JP2023047920 A JP 2023047920A
Authority
JP
Japan
Prior art keywords
intra prediction
prediction mode
mode
intra
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021157115A
Other languages
English (en)
Inventor
佳隆 木谷
Yoshitaka Kitani
圭 河村
Kei Kawamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2021157115A priority Critical patent/JP2023047920A/ja
Priority to CN202280060287.XA priority patent/CN117941345A/zh
Priority to PCT/JP2022/030194 priority patent/WO2023047821A1/ja
Publication of JP2023047920A publication Critical patent/JP2023047920A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】GPMにおいてイントラ予測モードを追加する場合に、インター予測性能が改善させ、符号化性能を向上させること。【解決手段】本発明に係る画像復号装置200は、GPMに対する動き情報を導出して動き補償画素を生成するインター予測部241と、GPMに対するイントラ予測モードを導出してイントラ予測画素を生成するイントラ予測部242と、GPMが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力する予測情報バッファ244とを備え、イントラ予測部242は、復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいてイントラ予測モードを導出し、導出したイントラ予測モードを用いてイントラ予測画素を生成する。【選択図】図3

Description

本発明は、画像復号装置、画像復号方法及びプログラムに関する。
非特許文献1では、GPM(Geometric Partitioning Mode)が開示されている。
GPMは、矩形ブロックを斜めに2分割しそれぞれを動き補償する。具体的には、GPMにおいて、分割された2領域は、それぞれマージモードの動きベクトルにより動き補償され、重み付き平均により合成される。斜めの分割パターンとしては、角度と位置とによって64パターンが用意されている。
ITU-T H.266/VVC JVET-U0100、「Compression efficiency methods beyond VVC」 JVET-W0024、「EE2:Summary Report on Enhanced Compression beyond VVC capability」
しかしながら、非特許文献1で開示されているGPMは、インター予測に限定されているため、符号化性能の改善余地があるという問題点があった。 そこで、本発明は、上述の課題に鑑みてなされたものであり、GPMにおいてイントラ予測モードを追加する場合に、インター予測性能が改善させ、符号化性能を向上させることができる画像復号装置、画像復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、前記イントラ予測部は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成するように構成されていることを要旨とする。
本発明の第2の特徴は、画像復号装置であって、幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、前記イントラ予測部は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいて複数のイントラ予測モードを導出し、所定のインデックスを用いて、導出した前記複数のイントラ予測モードで構成されるイントラ予測モード候補リストの中から1つ又は複数のイントラ予測モードを選択して前記イントラ予測画素を生成するか否かについて制御するように構成されていることを要旨とする。
本発明の第3の特徴は、画像復号装置であって、幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、前記イントラ予測部は、前記幾何学分割モードの分割形状又は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいて複数のイントラ予測モードを導出し、所定のインデックスを用いて、導出した前記複数のイントラ予測モードで構成されるイントラ予測モード候補リストの中から1つ又は複数のイントラ予測モードを選択して前記イントラ予測画素を生成するか否かについて制御し、前記複数のイントラ予測モードを導出する際に、前記幾何学分割モードの分割形状に対して平行方向のイントラ予測モードを前記イントラ予測モード候補リストの最初に登録するように構成されていることを要旨とする。
本発明の第4の特徴は、画像復号装置であって、復号対象スライス又は復号対象ブロックの制御データを復号するように構成されている復号部を備え、前記復号部は、前記復号対象スライス又は前記復号対象ブロックの制御データを復号することにより、前記復号対象ブロックがIスライスに含まれており且つDual Treeであると特定される場合は、前記復号対象ブロックの輝度成分に対して幾何学分割モードが適用されると判定されていても、前記復号対象ブロックの輝度成分に対応する色差成分ブロックに対する幾何学分割モードを適用不可と判定し、それ以外の場合は、前記色差成分ブロックに対する幾何学分割モードを適用不可と判定しないように構成されていることを要旨とする画像復号装置。
本発明の第5の特徴は、画像復号装置であって、前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、前記幾何学分割モードが適用された復号対象ブロックのイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、前記イントラ予測部は、前記復号対象ブロックがDual Treeではなく且つ前記復号対象ブロックの輝度成分に対して幾何学分割モードが適用される場合において、前記復号対象ブロックの色差成分に対して幾何学分割モードを適用し、さらに、復号対象ブロックの色差成分に対応する輝度成分の幾何学分割モードによる各分割領域に対して使用されるイントラ予測モードを、前記色差成分の幾何学分割モードによって分割された各分割領域に対するイントラ予測モードとして導出するように構成されていることを要旨とする。
本発明の第6の特徴は、画像復号方法であって、幾何学分割モードに対する動き情報を導出して動き補償画素を生成する工程Aと、前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成する工程Bと、前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力する工程Cと、を備え、前記工程Aにおいて、前記復号対象ブロックに隣接する隣接参照画素隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成することを要旨とする。
本発明の第7の特徴は、コンピュータを、画像復号装置として機能させるプログラムであって、前記画像復号装置は、幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、 前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、前記イントラ予測部は、前記復号対象ブロックに隣接する隣接参照画素隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成するように構成されていることを要旨とする。
本発明によれば、GPMにおいてイントラ予測モードを追加する場合に、インター予測性能が改善させ、符号化性能を向上させることができる画像復号装置、画像復号方法及びプログラムを提供することができる。
図1は、一実施形態に係る画像処理システム1の構成の一例を示す図である。 図2は、一実施形態に係る画像符号化装置100の機能ブロックの一例を示す図である。 図3は、一実施形態に係る画像復号装置200の機能ブロックの一例を示す図である。 図4は、非特許文献1に開示されている幾何学分割モードにより、矩形の復号対象ブロックが幾何学分割モードの分割線によって、幾何学形状の分割領域Aと分割領域Bに2分割されるケースの一例を示す図である。 図5は、本実施形態に係るGPMに対するイントラ予測モードの適用の一例を示す。 図6は、本実施形態に係るGPMに対するイントラ予測モードの適用の一例を示す。 図7は、本実施形態に係るイントラ予測モード候補リストの一例を示す図である。 図8は、非特許文献2に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法1の一例を示す図である。 図9は、非特許文献2で開示されているGPM向けのテンプレートマッチングという技術において、GPMの分割線に基づいて参照するテンプレート(隣接参照画素)のエリアを制限するためのテーブルを示す図である。 図10は、非特許文献3に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法2の一例を示す図である。 図11は、非特許文献1及び非特許文献2に係る通常イントラ予測に対する隣接参照ブロックに基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照ブロックに基づくイントラ予測モードの導出方法の一例を示す図である。 図12は、非特許文献1で開示されているマージ候補リストの構築方法を示す図である。 図13は、非特許文献1及び本実施形態に係るGPMの各分割領域A/Bの予測画素に対する重み係数wの値の一例を示す図である。 図14は、GPMの分割線の角度を規定するangleIdxの一例を示す図である。 図15は、disLutの一例を示す図である。 図16は、非特許文献1で開示されている被保存予測情報種別及び本実施形態に係る被保存予測情報種別が4×4画素サブブロックごとに特定される例を示す図である。 図17は、GPM適用ブロックを構成するサブブロックのsTypeの値に応じて保存される非特許文献1で開示されている動き情報及び本実施形態に係る予測情報の一覧を示す図である。 図18は、図4のような異なる2つのインター予測から構成されるGPMに対して保存される予測情報の一例を示す図である。 図19は、図5のようなイントラ予測とインター予測から構成されるGPMに対して保存される予測情報の一例を示す図である。 図20は、図6のような異なる2つのイントラ予測から構成されるGPMに対して保存される予測情報の一例を示す図である。 図21は、図7のような異なる2つのイントラ予測から構成されるGPMに対して保存される予測情報の一例を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
以下、図1~図21を参照して、本発明の第1実施形態に係る画像処理システム10について説明する。図1は、本実施形態に係る画像処理システム10について示す図である。
(画像処理システム10)
図1に示すように、本実施形態に係る画像処理システム10は、画像符号化装置100及び画像復号装置200を有する。
画像符号化装置100は、入力画像信号(ピクチャ)を符号化することによって符号化データを生成するように構成されている。画像復号装置200は、符号化データを復号することによって出力画像信号を生成するように構成されている。
ここで、かかる符号化データは、画像符号化装置100から画像復号装置200に対して伝送路を介して送信されてもよい。また、符号化データは、記憶媒体に格納された上で、画像符号化装置100から画像復号装置200に提供されてもよい。
(画像符号化装置100)
以下、図2を参照して、本実施形態に係る画像符号化装置100について説明する。図2は、本実施形態に係る画像符号化装置100の機能ブロックの一例について示す図である。
図2に示すように、画像符号化装置100は、インター予測部111と、イントラ予測部112と、合成部113と、予測情報バッファ114と、減算器121と、加算器122と、変換・量子化部131と、逆変換・逆量子化部132と、符号化部140と、インループフィルタ処理部150と、フレームバッファ160とを有する。
インター予測部111は、インター予測(フレーム間予測)によってインター予測信号を生成するように構成されている。
具体的には、インター予測部111は、符号化対象フレーム(対象フレーム)とフレームバッファ160に格納される参照フレームとの比較によって、参照フレームに含まれる参照ブロックを特定し、特定された参照ブロックに対する動きベクトル(MV:Motion Vector)を決定するように構成されている。ここで、参照フレームは、対象フレームとは異なるフレームである。
また、インター予測部111は、参照ブロック及び動きベクトルに基づいて符号化対象ブロック(以下、対象ブロック)に含まれるインター予測信号を対象ブロック毎に生成するように構成されている。
また、インター予測部111は、インター予測信号を合成部113に出力するように構成されている。
また、インター予測部111は、図2には図示していないが、インター予測の制御に関する情報(具体的には、インター予測モードや動きベクトルや参照フレームリストや参照フレーム番号等の情報)を符号化部140に出力するように構成されている。
イントラ予測部112は、イントラ予測(フレーム内予測)によってイントラ予測信号を生成するように構成されている。
具体的には、イントラ予測部112は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいてイントラ予測信号を対象ブロック毎に生成するように構成されている。ここで、参照ブロックは、対象ブロックについて参照されるブロックである。例えば、参照ブロックは、対象ブロックに隣接するブロックである。
また、イントラ予測部112は、イントラ予測信号を合成部113に出力するように構成されている。
また、イントラ予測部112は、図2には図示していないが、イントラ予測の制御に関する情報(具体的には、イントラ予測モード等の情報)を符号化部140に出力するように構成されている。
合成部113は、インター予測部111から入力されたインター予測信号又は/且つイントラ予測部112から入力されたイントラ予測信号を、予め設定された重み係数を用いて合成し、合成された予測信号(以下、まとめて予測信号と記載)を減算器121及び加算器122に出力するように構成されている。
予測情報バッファ114は、インター予測部111又はイントラ予測部112から入力される予測情報を保存する、或いは、保存された予測情報をインター予測部111又はイントラ予測部112又は合成部113又はインループフィルタ処理部150に出力するように構成されている。ここで、予測情報の詳細については後述する。
ここで、合成部113のインター予測信号又は/且つイントラ予測信号の合成処理に関しては、非特許文献1と同様の構成を本実施形態でも採ること可能であるため、説明は省略する。
減算器121は、入力画像信号から予測信号を減算し、予測残差信号を変換・量子化部131に出力するように構成されている。ここで、減算器121は、イントラ予測又はインター予測によって生成される予測信号と入力画像信号との差分である予測残差信号を生成するように構成されている。
加算器122は、逆変換・逆量子化部132から出力される予測残差信号に合成部113から出力される予測信号を加算してフィルタ処理前復号信号を生成し、かかるフィルタ処理前復号信号をイントラ予測部112及びインループフィルタ処理部150に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部112で用いる参照ブロックを構成する。
変換・量子化部131は、予測残差信号の変換処理を行うとともに、係数レベル値を取得するように構成されている。さらに、変換・量子化部131は、係数レベル値の量子化を行うように構成されていてもよい。
ここで、変換処理は、予測残差信号を周波数成分信号に変換する処理である。かかる変換処理としては、離散コサイン変換(Discrete Cosine Transform、以下、DCTと記す)に対応する基底パタン(変換行列)が用いられてもよく、離散サイン変換(Discrete Sine Transform、以下、DSTと記す)に対応する基底パタン(変換行列)が用いられてもよい。
また、変換処理としては、非特許文献1で開示されている複数の変換基底から予測残差信号の係数の偏りに適したものを水平・垂直方向毎に選択可能とするMTS(Multiple Transform Selection)や、1次変換後の変換係数をさらに低周波数領域に集中させることで符号化性能を改善するLFNST(Low Frequecny Non-Separable Transform)が用いられてもよい。
逆変換・逆量子化部132は、変換・量子化部131から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部132は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
符号化部140は、変換・量子化部131から出力された係数レベル値を符号化し、符号化データを出力するように構成されている。
ここで、例えば、符号化は、係数レベル値の発生確率に基づいて異なる長さの符号を割り当てるエントロピー符号化である。
また、符号化部140は、係数レベル値に加えて、復号処理で用いる制御データを符号化するように構成されている。
ここで、制御データは、符号化ブロックサイズ、予測ブロックサイズ、変換ブロックサイズ等のブロックサイズに関する情報(フラグやインデックス)を含んでもよい。
また、制御データは、後述する画像復号装置200における逆変換・逆量子化部220の逆変換・逆量子化処理やインター予測部241のインター予測信号生成処理やイントラ予測部242のイントラ予測信号生成処理や合成部243のインター予測信号又は/且つイントラ予測信号の合成処理やインループフィルタ処理部250のフィルタ処理等の制御に必要な情報(フラグやインデックス)を含んでもよい。
なお、非特許文献1では、これらの制御データは、シンタックスと呼称され、その定義は、セマンティクスと呼称されている。
また、制御データは、後述するシーケンス・パラメータ・セット(SPS:Sequence Parameter Set)やピクチャ・パラメータ・セット(PPS:Picutre Parameter Set)やピクチャヘッダ(PH:Picture Header)やスライスヘッダ(SH:Slice Header)等のヘッダ情報を含んでもよい。
インループフィルタ処理部150は、加算器122から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ160に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック又は変換ブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報、画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ160は、インター予測部111で用いる参照フレームを蓄積するように構成されている。
ここで、フィルタ処理後復号信号は、インター予測部111で用いる参照フレームを構成する。
(画像復号装置200)
以下、図3を参照して、本実施形態に係る画像復号装置200について説明する。図3は、本実施形態に係る画像復号装置200の機能ブロックの一例について示す図である。
図3に示すように、画像復号装置200は、復号部210と、逆変換・逆量子化部220と、加算器230と、インター予測部241と、イントラ予測部242と、合成部243と、予測情報バッファ224と、インループフィルタ処理部250と、フレームバッファ260とを有する。
復号部210は、画像符号化装置100によって生成される符号化データを復号し、係数レベル値を復号するように構成されている。
ここで、復号は、例えば、符号化部140で行われるエントロピー符号化とは逆の手順のエントロピー復号である。
また、復号部210は、符号化データの復号処理によって制御データを取得するように構成されていてもよい。
ここで、制御データは、上述した復号ブロック(上述の画像符号化装置100における符号化対象ブロックと同義。以下、まとめて対象ブロックと記載)のブロックサイズに関する情報を含んでもよい。
また、制御データは、逆変換・逆量子化部220の逆変換・逆量子化処理やインター予測部241やイントラ予測部242の予測画素生成処理やインループフィルタ処理部250のフィルタ処理等の制御に必要な情報(フラグやインデックス)が含んでもよい。
また、制御データは、上述したシーケンス・パラメータ・セット(SPS:Sequence Parameter Set)やピクチャ・パラメータ・セット(PPS:Picutre Parameter Set)やピクチャヘッダ(PH:Picture Header)やスライスヘッダ(SH:Slice Header)等のヘッダ情報を含んでもよい。
逆変換・逆量子化部220は、復号部210から出力される係数レベル値の逆変換処理を行うように構成されている。ここで、逆変換・逆量子化部220は、逆変換処理に先立って、係数レベル値の逆量子化を行うように構成されていてもよい。
ここで、逆変換処理及び逆量子化は、変換・量子化部131で行われる変換処理及び量子化とは逆の手順で行われる。
インター予測部241は、インター予測部111と同様に、インター予測(フレーム間予測)によってインター予測信号を生成するように構成されている。
具体的には、インター予測部241は、符号化データから復号した動きベクトル及び参照フレームに含まれる参照信号に基づいてインター予測信号を生成するように構成されている。インター予測部241は、インター予測信号を合成部243に出力するように構成されている。
イントラ予測部242は、イントラ予測部112と同様に、イントラ予測(フレーム内予測)によってイントラ予測信号を生成するように構成されている。
具体的には、イントラ予測部242は、対象フレームに含まれる参照ブロックを特定し、特定された参照ブロックに基づいてイントラ予測信号を予測ブロック毎に生成するように構成されている。イントラ予測部242は、イントラ予測信号を合成部243に出力するように構成されている。
合成部243は、合成部113と同様に、インター予測部241から入力されたインター予測信号又は/且つイントラ予測部242から入力されたイントラ予測信号を、予め設定された重み係数を用いて合成し、合成された予測信号(以下、まとめて予測信号と記載)を加算器230に出力するように構成されている。
予測情報バッファ244は、予測情報バッファ114と同様に、インター予測部221又はイントラ予測部222から入力される予測情報を保存する、或いは、保存された予測情報をインター予測部241又はイントラ予測部242又は合成部243又はインループフィルタ処理部250に出力するように構成されている。ここで、予測情報の詳細については後述する。
加算器230は、逆変換・逆量子化部220から出力される予測残差信号に合成部243から出力される予測信号を加算してフィルタ処理前復号信号を生成し、かかるフィルタ処理前復号信号をインループフィルタ処理部250に出力するように構成されている。
ここで、フィルタ処理前復号信号は、イントラ予測部242で用いる参照ブロックを構成する。
インループフィルタ処理部250は、インループフィルタ処理部150と同様に、加算器230から出力されるフィルタ処理前復号信号に対してフィルタ処理を行うとともに、フィルタ処理後復号信号をフレームバッファ260に出力するように構成されている。
ここで、例えば、フィルタ処理は、ブロック(符号化ブロック、予測ブロック、変換ブロック或いはそれらを分割したサブブロック)の境界部分で生じる歪みを減少するデブロッキングフィルタ処理や、画像符号化装置100から伝送されるフィルタ係数やフィルタ選択情報や画像の絵柄の局所的な性質等に基づいてフィルタを切り替える適応ループフィルタ処理である。
フレームバッファ260は、フレームバッファ160と同様に、インター予測部241で用いる参照フレームを蓄積するように構成されている。
ここで、フィルタ処理後復号信号は、インター予測部241で用いる参照フレームを構成する。
(幾何学分割モード)
以下、図4を用いて、復号部210とインター予測部241とイントラ予測部242に係る非特許文献1で開示されている幾何学分割モード(GPM:Geometric Partitioning Mode)について説明する。
図4は、非特許文献1に開示されている幾何学分割モードにより、矩形の復号対象ブロックが幾何学分割モードの分割線Lによって、幾何学形状の分割領域Aと分割領域Bに2分割されるケースの一例を示す。
ここで、非特許文献1で開示されている幾何学分割モードの分割線Lは、角度と位置とによって64パターンが用意されている。
また、非特許文献1に係るGPMは、分割領域A及び分割領域Bのそれぞれに対して、インター予測を適用し、インター予測(動き補償)画素を生成する。
具体的には、かかるGPMでは、非特許文献1で開示されているマージ候補リストを構築し、かかるマージ候補リスト及び画像符号化装置100から伝送される各分割領域A/Bに対する2つのマージインデックス(merge_gpm_idx0、merge_gpm_idx1)に基づいて、各分割領域A/Bの動きベクトル(mvA、mvB)及び参照フレームを導出して、参照ブロック、すなわち、インター予測(又は、動き補償)ブロックを生成し、最終的に各分割領域A/Bのインター予測画素が、予め設定された重みによって加重平均されて合成される。
(GPMへのイントラ予測の適用)
以下、図5及び図6を用いて、復号部210とインター予測部241とイントラ予測部242に係る非特許文献1で開示されている幾何学分割モード(GPM:Geometric Partitioning Mode)及び本実施形態に係る第1の幾何学分割モード(GPM)へのイントラ予測モードへの適用について説明する。
図5及び図6は、本実施形態に係るGPMに対するイントラ予測モードの適用の一例を示す。
具体的に、図5は、各分割領域A/Bに対してイントラ予測(modeX)及びインター予測が適用される場合の本実施形態に係るGPMの構成例を示す。図6は、各分割領域にA/B対して、異なる2つのイントラ予測(modeX、modeY)が適用される場合の本実施形態に係るGPMの構成例を示す。
ここで、本実施形態に係る第1のGPMでは、各分割領域A/Bに対しては、インター予測或いはイントラ予測モードのいずれも適用することができる。さらに、イントラ予測で適用するイントラ予測モードの種別は、対象ブロックに適用されるGPMの分割形状(分割線)に基づいて限定する。すなわち、対象ブロックに適用されるGPMの分割形状(分割線)に基づいて適用可能なイントラ予測モードが導出される。
また、本実施形態に係る第2のGPMでは、復号対象ブロックにおけるイントラ予測モードを追加適用したGPMの適用の可不可及びGPM適用時の各分割領域A/Bにおける予測モード種別の特定方法に関して規定している。
これにより、イントラ予測モードを追加適用したGPMが適切に復号対象ブロックに適用されると共に、最適な予測モードが特定されることで、結果として符号化性能のさらなる改善余地を実現することができる。
なお、以降では、図4に示すような異なる2つのインター予測で構成されるGPM、図5に示すようなイントラ予測及びインター予測で構成されるGPM、図6に示すような2つのイントラ予測で構成されるGPMを、それぞれ、Inter/Inter-GPM、とIntra/Inter-GPM、Intra/Intra-GPM呼称する。
さらに、本実施形態では、GPMに追加適用されるイントラ予測に対して、上述の復号対象ブロックに適用されるGPMの分割形状(分割線)に基づくイントラ予測モードの導出方法に加えて、復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づくイントラ予測モードの導出方法に関して規定している。
ここで、復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックは、復号対象ブロックに隣接し且つ復号対象ブロックの復号処理の開始時点で復号処理が完了している参照画素又は参照ブロックのことである。
GPMのイントラ予測に適用するイントラ予測モードが隣接参照画素又は隣接参照ブロックに基づいて導出できることにより、GPMにおけるイントラ予測性能が向上し、結果として符号化性能のさらなる改善余地を実現することができる。
[イントラ予測部242におけるイントラ予測モード導出方法及び選択方法]
以降では、イントラ予測部242における本実施形態で提案するGPMへのイントラ予測の適用パターンのうち、Intra/Inter-GPM及びIntra/Intra-GPMに対するイントラ予測モードの導出方法及び選択方法について説明する。
(イントラ予測モード候補リスト)
以下、図7を用いて、本実施形態に係るイントラ予測部242におけるGPM向けのイントラ予測モード候補リスト(以降、イントラ予測モード候補リスト)の構築方法について説明する。図7は、本実施形態に係るイントラ予測モード候補リストの一例を示す図である。
本実施形態では、かかるイントラ予測モード候補リストのリストサイズは、固定値でもよい。例えば、リストサイズは、「3」、「4」及び「5」や非特許文献1で開示されているGPMが非適用のイントラ予測ブロック向けのイントラ予測モード候補リストの最大サイズである「6」や非特許文献3で開示されいているGPMが非適用のイントラ予測ブロック向けのイントラ予測モード候補リストの最大サイズである「22」であってもよい。或いは、リストサイズは、「7」から「21」の間に正数であってもよい。
或いは、かかるイントラ予測モード候補リストのリストサイズは、可変値でもよい。例えば、リストサイズの最大値を規定するインデックスをシーケンス或いはピクチャ或いはスライス単位の制御データに内包させ、これを復号部210によって復号することで、シーケンス或いはピクチャ或いはスライス単位のリストサイズの最大値を特定することができる。
かかるイントラ予測モード候補リストには、後述するGPMの分割形状又は復号対象ブロックに隣接する隣接参照画素隣接参照ブロックに基づいて導出される複数のイントラ予測モードが登録される。これらイントラ予測モードの導出方法の詳細については後述する。
イントラ予測部は、上記イントラ予測モードの導出(イントラ予測モード候補リストの構築)完了後、復号部210で復号或いは推定された分割領域A/Bのそれぞれに対する2つのイントラ予測モードインデックス(intra_gpm_idx0とintra_gpm_idx1)の値に基づいて、分割領域A/Bのそれぞれに対してイントラ予測モード候補リスト内のいずれか1つのイントラ予測モードをイントラ予測画素生成に使用するかを選択してもよい。
なお、Intra/Intra-GPMに対して、かかる2つのイントラ予測モードインデックスが同じ値になる場合は、GPMが非適用のイントラ予測と同一になるため、かかる2つのイントラ予測モードインデックスは、必ず異なる値になるように構成される。
また、変更例として、Intra/Intra-GPMの分割領域A/Bに対するイントラ予測モードの導出において、上述した分割領域A/Bに対して共通利用されるイントラ予測モード候補リストの代わりに、分割領域A/Bに対して異なるイントラ予測モード候補リストを構築して、分割領域A/Bに対するそれぞれの当該イントラ予測モード候補リストとそれぞれのイントラ予測モードインデックスにより分割領域A/Bに対するそれぞれのイントラ予測モードを導出してもよい。
かかる異なる2つのイントラ予測モード候補リストの構築方法は、GPMの分割形状によって制御してもよい。
例えば、後述するGPMの分割形状に基づくイントラ予測モードの導出方法において、復号対象ブロックの最左上に位置する画素を含む分割領域及び最左上に位置する画素を含まない分割領域がある場合、前者の分割領域に対するイントラ予測モード候補リストには、GPMの分割線に対してAngular予測又は垂直方向に近いAngular予測又はPlnar予測を登録可能とするが、後者の分割領域に対するイントラ予測モード候補リストには、GPMの分割線に対して垂直方向のAngular予測又は垂直方向に近いAngular予測又はPlnar予測又はDC予測を登録不可と構成してもよい。
このとき、前者の分割領域に対するイントラ予測モード候補リストに登録されるGPMの分割線に対してAngular予測又は垂直方向に近いAngular予測又はPlnar予測は、当該イントラ予測モード候補リストの最小リスト番号又はその次点のリスト番号に登録してもよい。
或いは、前者の分割領域に対するイントラ予測モード候補リストには、GPMの分割線に対して平行方向のAngular予測を登録不可とし、後者の分割領域に対するイントラ予測モード候補リストには、GPMの分割線に対して平行方向のAngular予測を登録するように構成してもよい。
このとき、後者の分割領域に対するイントラ予測モード候補リストに登録されるGPMの分割線に対して平行方向のAngular予測は、当該イントラ予測モード候補リストの最小リスト番号に登録してもよい。
以上の構成により、後者の分割領域が、復号対象ブロックに隣接する隣接参照画素を、前者の分割領域を跨いだ上で予測する、すなわち、GPMの分割線に対してGPMの分割線に対して垂直方向のAngular予測又は垂直方向に近いAngular予測又はPlnar予測又はDC予測することを回避でき、且つ、後者の分割領域は復号対象ブロックに隣接する隣接参照画素を前者の分割領域を跨がずに予測する、すなわち、GPMの分割線に対して平行方向のAngular予測することができるため、予測性能の向上効果が期待できる。
また、この異なる2つのイントラ予測モード候補リストに対して、後述する復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づくイントラ予測モードの導出方法を一部変更してもよい。
例えば、GPMの分割形状によって、各分割領域に近接する隣接参照画素又は隣接参照ブロックのみを用いて、それぞれのイントラ予測モード候補リストに導出されたイントラ予測モード候補を登録してもよい。
なお、復号部210は、GPMを構成するイントラ予測の合計適用数に応じて、かかるイントラ予測モード候補リスト内からイントラ予測画素生成に使用するイントラ予測モードを選択するためのイントラ予測モードインデックスについての復号要否を判定してもよい。
ここで、上述の変更例として、イントラ予測部242は、上述のイントラ予測モードインデックスの値に応じて、イントラ予測モード候補リスト内の複数のイントラ予測モードを選択して、イントラ予測画素を生成してもよい。
かかる構成によれば、ハードウェア実装された画像復号装置200では、イントラ予測画素の生成に必要な回路規模が増大するが、複数のイントラ予測モードによりイントラ予測画素を生成できるため、イントラ予測性能が向上し、結果として符号化性能の改善が期待できる。
なお、複数のイントラ予測モードを使用してイントラ予測画素を生成(合成)する場合、平均してイントラ予測画素を合成してもよい。
或いは、所定の重み値で加重平均してイントラ予測画素を合成してもよい。例えば、かかる所定の重み値の設定方法として、イントラ予測モード候補リストの登録順が早い(リスト番号が小さい)イントラ予測モードほど、重み値を大きく設定してもよい。逆に、イントラ予測モード候補リストの登録順が遅い(リスト番号が大きい)イントラ予測モードほど、重み値を小さく設定してもよい。
イントラ予測モード候補リスト番号の小さいイントラ予測モードの方が、GPMに適用されるイントラ予測性能の向上率が高いため、このように設定すれば、結果として符号化性能の改善効果が期待できる。
(分割形状に基づくイントラ予測モード導出方法)
本実施形態では、イントラ予測部242は、GPMの分割形状(分割線)に基づいて、イントラ予測モードを導出し、上述のイントラ予測モード候補リストに登録する。
ここで、導出されるイントラ予測モードは、例えば、非特許文献1で開示されているGPMが非適用のイントラ予測(以降、通常イントラ予測)向けに用意された67種のAngular予測の中から、GPMの分割形状(分割線)に対して平行となるAngular予測とするように構成してもよい。
或いは、変更例として導出されるイントラ予測モードは、非特許文献1で開示されている通常イントラ予測向けに用意された67種のAngular予測の中から、GPMの分割形状(分割線)に対して、垂直となるAngular予測とするように構成してもよい。
イントラ予測部242は、導出されたAngular予測を、後述する他のイントラ予測モードの導出完了後であっても、上述のイントラ予測モード候補リストの最初に登録してもよい。
GPMの分割形状に基づいて導出されたイントラ予測モードは、GPMの分割形状に応じたエッジ等のテクスチャを反映した上でイントラ予測画素を生成できるため、イントラ予測性能の高い向上効果が期待できる。それゆえ、GPMのイントラ予測領域に対する当該イントラ予測モードの選択率は高いことが期待できるため、イントラ予測モード候補リスト内で最小リスト番号に紐づければ、必要なイントラ予測モードインデックスの総符号長も短くでき、結果として符号化性能の改善効果が期待できる。
(隣接参照画素に基づくイントラ予測モード導出方法1)
以下、図8及び図9を用いて、非特許文献2に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法1を説明する。
図8は、非特許文献2に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法1の一例を示す図である。以降では、これらの導出方法を総じて「DIMD(Decoder-side Intra Mode Derivation)」と呼称する。
非特許文献2では、かかるDIMDにおいて、図8に示すように、復号対象ブロックに隣接する隣接参照画素に対して、3×3画素のウインドウサイズの横及び縦方向のSobelフィルタを適用して、通常イントラ予測向けの全Angular予測モードに対する画素値のヒストグラムを計算する。ここで、Sobelフィルタを適用して各Angular予測モードに対応付けるための隣接参照画素の角度及び画素値の計算方法については、非特許文献2と同じ構成を本実施形態でも採ることができるため、詳細な説明は省略する。
非特許文献2では、また、復号対象ブロックのブロックサイズに応じて、ヒストグラムの計算に使用する隣接参照画素領域が、図8に示すように制御されている。具体的には、4×4画素ブロックでは、復号対象ブロックの最上左端の画素の上及び左のそれぞれの3×3画素領域のみを使用して、ヒストグラムが計算される。
非特許文献2では、計算されたヒストグラムの中で最高及び次点の画素値であるイントラ予測モード及びPlanarモードを用いてイントラ予測画素が生成され、さらに、生成されたイントラ予測画素が所定の重み値を用いて加重平均されて、最終的なイントラ予測画素が生成される。
本実施形態では、イントラ予測部242は、上述の非特許文献2で開示されているDIMDをGPMのイントラ予測モードの導出のみに適用してもよい。すなわち、導出された複数のイントラ予測モードを用いたイントラ予測画素の合成/生成処理は行わない。
これにより、GPMのイントラ予測領域(Intra/Intra-GPMの場合は、2つのイントラ予測領域)に対して、1つのイントラ予測モードでイントラ予測画素生成できるため、ハードウェア実装された画像復号装置200におけるGPMのイントラ予測画素の生成に必要な回路規模の増大を回避しつつ、復号対象ブロックの隣接参照画素のヒストグラムの解析によって、GPMの分割形状に適したエッジ等のテクスチャを反映したイントラ予測を適用できるようになるため、イントラ予測性能が向上し、結果として符号化性能の改善が期待できる。
なお、本実施形態において、非特許文献2と同様に、復号部210は、DIMDの適用可不可を判定するフラグを復号或いはは推定することで、イントラ予測モードを導出するかしないかについて判定するように構成してもよい。
また、本実施形態に係るイントラ予測部242は、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれない場合は、かかるDIMDにより導出したイントラ予測モードを登録し、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれる場合は、かかるDIMDにより導出したイントラ予測モードを登録しないように構成されていてもよい。
かかる構成によれば、イントラ予測モード候補リスト内に同じイントラ予測モードが重複して登録されることを回避できる。
ここで、かかるイントラ予測モード候補リストに対する新規のイントラ予測モードを登録する際に、既存のイントラ予測モードとの一致性を比較して、両者が一致する場合は、剪定する処理を、以降では、「イントラ予測モード候補選定処理」と呼称する。
また、本実施形態に係るイントラ予測部242は、かかるDIMDにより導出したイントラ予測モードのうち、イントラ予測モード候補リストに登録するイントラ予測モード数を1つに限定してもよい。その場合、イントラ予測部242は、ヒストグラムの中から最高画素値(輝度値)であるAngular予測モードを導出する。
なお、上述のイントラ予測モード候補選定処理で、最高画素値(輝度値)であるAngular予測モード(以下、1st Angular予測モード)が剪定される場合は、順次ヒストグラムの高い方から既存のイントラ予測モードと比較して、両者が一致しないものを登録してもよい。
或いは、上述のイントラ予測モード候補選定処理で、1st Angular予測モードが剪定される場合は、DIMDによるイントラ予測モードの導出処理を終了してもよい。
変更例として、DIMDにより導出したイントラ予測モードのうち、イントラ予測モード候補リストに登録するイントラ予測モード数を2つに限定してもよい。かかる場合、イントラ予測部242は、ヒストグラムの中から1st Angular予測モード及び最高画素値(輝度値)の次点である2nd Angular予測モードを導出する。
なお、1st Angular予測モード又は2nd Angular予測モードが剪定される場合は、上述の場合と同様に、これらの次にヒストグラムの高い方から既存のイントラ予測モードと比較して、両者が一致しないものを登録してもよいし、そのままDIMDによるイントラ予測モードの導出処理を終了してもよい。
また、本実施形態にかかるイントラ予測部242は、GPMの分割形状(すなわち、GPM分割線の角度)に基づいて、上述のDIMDのヒストグラム計算に用いる隣接参照画素を所定領域に制限してもよい。
図9は、非特許文献2で開示されているGPM向けのテンプレートマッチングという技術において、GPMの分割線の角度(具体的には、角度を示すインデックス、angleIdx)に基づいて参照するテンプレート(隣接参照画素)のエリアを制限するためのテーブルを示す図である。
具体的には、図9に示すA及びLは、それぞれ復号対象ブロックの上部及び左部を示す。
本実施形態では、この非特許文献2で開示されているGPMの分割線に基づいて規定された(制限された)隣接参照画素のテーブルを、DIMDのヒストグラムの計算に適用してもよい。例えば、幾何学分割モードの分割形状(angleIdx)が「0」の場合は、分割領域Aは復号対象ブロックの上部のみに隣接する隣接参照画素を使用してヒストグラムを計算する一方で、分割領域Bは復号対象ブロックの上部及び左部に隣接する隣接参照画素を使用してヒストグラムを計算する。この幾何学分割モードの分割形状に基づく、DIMDのヒストグラムの計算における隣接参照画素の参照位置の制限により、復号対象ブロックに隣接する全ての隣接参照画素を計算に使用することを回避しつつ、GPMの分割線の方向にのみ存在する隣接参照画素を用いてAngular予測を導出できるため、GPMのインター予測に対するDIMDによるイントラ予測モードの導出処理負荷を軽減できる。
(隣接参照画素に基づくイントラ予測モード導出方法2)
以下、図9及び図10を用いて、非特許文献3に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法2を説明する。
図10は、非特許文献3に係る通常イントラ予測に対する隣接参照画素に基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照画素に基づくイントラ予測モードの導出方法2の一例を示す図である。以降では、これらの導出方法を総じて「TIMD(Template-based Intra Mode Derivation)」と呼称する。
非特許文献3では、TIMDにおいて、図10に示すように、復号対象ブロックに隣接する所定ラインの隣接参照画素(以下、テンプレート)、及び、かかるテンプレート向けの隣接参照画素及び所定のイントラ予測モードを用いて生成したテンプレート向けイントラ予測画素(以下、テンプレート向けイントラ予測画素)のSATD(Sum of Absolute Transformed Difference)を計算し、所定のイントラ予測モードの中でSATDが最小及びその次点であるイントラ予測モードを、TIMDのイントラ予測モードとして導出して、イントラ予測画素を生成する。
ここで、上述のTIMDのSATDの計算において使用されるイントラ予測モードは、通常イントラ予測向けのイントラ予測モード候補リストに含まれるイントラ予測モードである。
非特許文献3におけるTIMDでは、通常イントラ予測向けイントラ予測モード候補リストに、垂直予測モード、水平予測モード及びDC予測モードが含まれていない場合は、これらを含んだ状態で、SATDを計算して、イントラ予測モードを導出する。
本実施形態では、かかる非特許文献3で開示されているTIMDを応用して、イントラ予測部242は、イントラ予測モードを導出してもよい。すなわち、イントラ予測部242は、導出した複数のイントラ予測モードを用いたイントラ予測画素の合成/生成処理について行わない。
かかる構成によれば、GPMのイントラ予測領域(Intra/Intra-GPMの場合は、2つのイントラ予測領域)に対して、1つのイントラ予測モードでイントラ予測画素を生成できるため、ハードウェア実装された画像復号装置200におけるGPMのイントラ予測画素の生成に必要な回路規模の増大を回避しつつ、復号対象ブロックの隣接参照画素のヒストグラムの解析によって、GPMの分割形状に適したエッジ等のテクスチャを反映したイントラ予測を適用できるようになるため、イントラ予測性能が向上し、結果として符号化性能の改善が期待できる。
なお、本実施形態において、非特許文献2と同様に、復号部210は、TIMDの適用可不可を判定するフラグを復号又は推定することで、イントラ予測モードを導出するかしないかについて判定するように構成されていてもよい。
また、本実施形態に係るイントラ予測部242は、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれない場合、TIMDにより導出したイントラ予測モードを登録し、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれている場合、TIMDにより導出したイントラ予測モードを登録しないように構成されていてもよい。
かかる構成によれば、イントラ予測モード候補リスト内に同じイントラ予測モードが重複して登録されることを回避できる。
ここで、かかるイントラ予測モード候補リストに対する新規のイントラ予測モードを登録する際に、既存のイントラ予測モードとの一致性を比較して、両者が一致する場合に剪定する処理を、以降では、「イントラ予測モード候補選定処理」と呼称する。
また、本実施形態に係るイントラ予測部242は、TIMDにより導出したイントラ予測モードのうち、イントラ予測モード候補リストに登録するイントラ予測モード数を1つに限定してもよい。かかる場合、イントラ予測部242は、SATDの計算の中から最小のSATDコストであるイントラ予測モード(Angular予測)を導出する。
ただし、本実施形態では、かかるTIMD処理におけるSATDの計算において、非特許文献3とは異なり、DC予測モードをSATDの計算の中から除外してもよい。
なぜなら、復号対象ブロックに隣接する隣接参照画素の全てを用いてイントラ予測画素を生成するDC予測は、GPMの分割形状に応じたエッジ等のテクスチャを適切に反映できずに、イントラ予測画素を生成してしまう可能性があるため、DC予測をTIMD処理におけるのSATDの計算から除外することで、TIMDでDC予測モードが導出されることを回避できる。
なお、上述のイントラ予測モード候補選定処理において、最小のSATDコストであるAngular予測モード(以下、1st Angular予測モード)が剪定される場合は、順次SATDコストの低い方から既存のイントラ予測モードと比較して、両者が一致しないものを登録してもよい。或いは、1st Angular予測モードが剪定される場合は、TIMDによるイントラ予測モードの導出処理を終了してもよい。
変更例として、TIMDにより導出したイントラ予測モードのうち、イントラ予測モード候補リストに登録するイントラ予測モード数を2つに限定してもよい。かかる場合、イントラ予測部242は、SATDコストの中から1st Angular予測モード及び最小のSATDコストの次点である2nd Angular予測モードを導出する。
なお、1st Angular予測モード又は2nd Angular予測モードが剪定される場合は、上述の場合と同様に、これらの次にSATDコストの低い方から既存のイントラ予測モードと比較して、両者が一致しないものを登録してもよいし、そのままTIMDによるイントラ予測モードの導出処理を終了してもよい。
また、本実施形態に係るイントラ予測部242は、GPMの分割形状(すなわち、GPM分割線の角度)に基づいて、上述のTIMDのSATDコストの計算に用いる隣接参照画素を所定領域に制限してもよい。
本実施形態では、図9に示す非特許文献2で開示されいてるGPMの分割線に基づいて規定された隣接参照画素領域のテーブルを、TIMD処理におけるSATDコストの計算に適用してもよい。例えば、幾何学分割モードの分割形状(angleIdx)が「0」の場合は、分割領域Aは復号対象ブロックの上部のみに隣接する隣接参照画素及び当該隣接参照画素のさらに上部に隣接する隣接参照画素のみを使用してSATDコストを計算する一方で、分割領域Bは復号対象ブロックの上部及び左部に隣接する隣接参照画素及びこれらに隣接する隣接参照画素を使用してSATDコストを計算する。この幾何学分割モードの分割形状に基づく、TIMD処理におけるSATDコストの計算における隣接参照画素の参照位置の制限により、復号対象ブロックに隣接する全ての隣接参照画素を計算に使用することを回避しつつ、GPMの分割線の方向にのみ存在する隣接参照画素を用いてAngular予測を導出できるため、GPMのインター予測に対するTIMDによるイントラ予測モードの導出処理の負荷を軽減できる。
さらに、本実施形態に係るイントラ予測部242は、TIMD処理におけるSATDの計算に使用するイントラ予測モードと同一のイントラ予測モードが既にイントラ予測モード候補リストに登録されている場合は、かかるイントラ予測モードのSATDの計算以降を処理しないように構成してもよい。
かかる構成によれば、イントラ予測モードに既に登録されたイントラ予測モードに対して、重複してTIMD処理を経て同一のイントラ予測モードが登録されることを回避できるため、GPMのインター予測に対するTIMD処理の負荷を軽減できる。
(隣接参照ブロックに基づくイントラ予測モード導出方法)
以下、図9及び図11を用いて、非特許文献1及び非特許文献2に係る通常イントラ予測に対する隣接参照ブロックに基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照ブロックに基づくイントラ予測モードの導出方法について説明する。
図11は、非特許文献1及び非特許文献2に係る通常イントラ予測に対する隣接参照ブロックに基づくイントラ予測モードの導出方法、及び、かかる導出方法を応用した本実施形態に係る幾何学分割モードに対する隣接参照ブロックに基づくイントラ予測モードの導出方法の一例を示す図である。以降では、これらの導出方法を総じて「BIMD(Block-based Intra Mode Derivation)」と呼称する。
非特許文献3では、BIMDにおいて、図11に示すように、復号対象ブロックに隣接する所定位置の隣接参照ブロックが有するイントラ予測モードを、BIMDのイントラ予測モードとして導出して、イントラ予測画素を生成する。
なお、ここで導出される隣接参照ブロックのイントラ予測モードは、隣接参照ブロックがイントラ予測ブロックである場合は、当該隣接参照ブロックが有するイントラ予測モードがそのまま参照されるが、隣接参照ブロックがインター予測ブロックであるか或いはインター予測ブロック且つイントラ予測が適用されたGPM適用ブロックである場合には、後述する4×4サブブロック画素単位で保存されるイントラ予測モードが参照される。
ここで、非特許文献1及び非特許文献2では、上述のBIMDにおいて参照される隣接参照ブロックは、図11に示すように、復号対象ブロックの左(A0)、左下(A1)、上(B0)、右上(B1)及び左上(B2)に設定されている。
本実施形態では、非特許文献1及び非特許文献2で開示されているBIMDを応用して、イントラ予測部242は、イントラ予測モードを導出してもよい。すなわち、イントラ予測部242は、導出した複数のイントラ予測モードを用いたイントラ予測画素の合成/生成処理は行わない。
かかる構成によれば、GPMのイントラ予測領域(Intra/Intra-GPMの場合は、2つのイントラ予測領域)に対して、復号対象ブロックの隣接参照ブロックが有するイントラ予測モードが含まれ得るイントラ予測モード候補リストからイントラ予測モードを選択してイントラ予測画素を生成できるため、GPMの分割形状に適したエッジ等のテクスチャを反映したイントラ予測を適用できるようになり、イントラ予測性能が向上し、結果として符号化性能の改善が期待できる。
また、本実施形態に係るイントラ予測部242は、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれない場合は、BIMDにより導出したイントラ予測モードを登録し、GPM向けのイントラ予測モード候補リストに既に同一のイントラ予測モードが含まれる場合は、BIMDにより導出したイントラ予測モードを登録しないように構成されていてもよい。
かかる構成によれば、イントラ予測モード候補リスト内に同じイントラ予測モードが重複して登録されることを回避できる。
ここで、イントラ予測モード候補リストに対する新規のイントラ予測モードを登録する際に、既存のイントラ予測モードとの一致性を比較して、両者が一致する場合に剪定する処理を、以降では、「イントラ予測モード候補選定処理」と呼称する。
また、本実施形態に係るイントラ予測部242は、非特許文献1及び非特許文献2とは異なり、BIMDにより導出したイントラ予測モードがDC予測モードである場合は、イントラ予測モード候補リストに登録しないように構成されていてもよい。
なぜなら、復号対象ブロックに隣接する隣接参照画素の全てを用いてイントラ予測画素を生成するDC予測は、GPMの分割形状に応じたエッジ等のテクスチャを適切に反映できずに、イントラ予測画素を生成してしまう可能性があるため、DC予測をBIMDのイントラ予測モードから除外して、DC予測モードがイントラ予測画素の生成に使用されることを回避できる。
また、本実施形態に係るイントラ予測部242は、BIMDによるイントラ予測モードの導出において、参照する図11に示す最大5つの隣接参照ブロックの順序を、非特許文献1及び非特許文献2と同様に構成してもよい。なお、その参照順については、非特許文献1及び非特許文献2で開示されているため、本実施形態では詳細な説明は省略する。
変更例として、本実施形態では、図9に示す非特許文献2で開示されているGPMの分割線に基づいて規定された(制限された)隣接参照画素領域のテーブルを、BIMDの隣接参照ブロックの参照に適用してもよい。例えば、幾何学分割モードの分割形状(angleIdx)が「0」の場合は、分割領域Aは復号対象ブロックの上部のみに隣接する隣接参照ブロック(図11のB0、B1、B2)のみのイントラ予測モードを参照する一方で、分割領域Bは復号対象ブロックの上部及び左部に隣接する隣接参照ブロック(左部はA0、A1、上部はB0、B1、B2)のイントラ予測モードを参照する。この幾何学分割モードの分割形状に基づく、BIMDのイントラ予測モードの導出における隣接参照ブロックの参照位置の制限により、復号対象ブロックに隣接する全ての隣接参照ブロックのイントラ予測モードを参照することを回避しつつ、GPMの分割線の方向にのみ存在する隣接参照ブロックが有するイントラ予測モード(Angular予測)のみを参照してイントラ予測モードを導出できるため、GPMのインター予測に対するBIMDによるイントラ予測モードの導出処理の負荷を軽減できる。
(各イントラ予測モード導出順序)
本実施形形態に係るイントラ予測部242は、上述したGPM分割形状に基づくイントラ予測モード(以下、GIMD:GPM-angle-based Intra Mode Derivation)、及び、隣接参照画素又は隣接参照ブロックに基づく3種類のイントラ予測モードの導出方法(DIMD、TIMD、BIMD)を組み合わせて、イントラ予測モードを導出するように構成されていてもよい。以下に、効果的と考えられる構成例を示す。
構成例1. GIMD→DIMD
構成例2. GIMD→TIMD
構成例3. GIMD→BIMD
構成例4. GIMD→DIMD→TIMD
構成例5. GIMD→DIMD→BIMD
構成例6. GIMD→TIMD→BIMD
7. GIMD→DIMD→TIMD→BIMD
まず、構成例1~3は、GIMDにそれぞれDIMD、TIMD及びBIMDのみを組み合わせた方法である。GIMDで導出されるイントラ予測モードは、DIMD、TIMD及びBIMDで導出されるイントラ予測モードよりも、より直接的にGPMの分割線に基づくエッジ等のテクスチャを反映したイントラ予測モードを導出できる可能性があるため、DIMD、TIMD及びBIMDよりも前に導出するように構成している。
次に、構成例4及び5は、DIMDをTIMD又はBIMDよりも前に配置する構成例である。
DIMDをTIMDより前に配置した理由は、DIMDによるイントラ予測モードの導出処理がSATDの計算等の比較的重い計算処理が含まれるTIMDによるイントラ予測モードの導出よりも軽量であるためである。
一方で、DIMDをBIMDより前に配置した理由は、ヒストグラムの計算が含まれるDIMDによるイントラ予測モードの導出処理がBIMDによるイントラ予測モードの導出よりも軽量でないが、DIMDで導出されたイントラ予測モードの方がBIMDで導出されたイントラ予測―ドよりも、ヒストグラムの計算により、よりGPMの分割線に基づくエッジ等のテクスチャを反映したイントラ予測モードを導出できる可能性があるため、イントラ予測性能の向上効果が高いと考えられるためである。
構成例6では、TIMDをBIMDより前に配置している。配置理由は、上述のDIMDをBIMDより前に配置する理由と同じである。
構成例7は、GIMD、DIMD、TIMD及びBIMDの全てを組み合わせた構成例であり、上述の理由により、この順序でイントラ予測モードを導出すると、より効率的に予測性能の高いイントラ予測モードを導出できることが期待できる。
(各イントラ予測モード導出方法の開始制限)
本実施形態に係るイントラ予測部242は、上述した幾何学ブロック分割モードに対するイントラ予測モードの各導出処理の開始時点で、イントラ予測モード候補リストに含まれるイントラ予測モードの候補数がイントラ予測モード候補リストサイズの最大値に達していない場合は、各導出処理を開始し、かかる候補数がイントラ予測モード候補リストサイズの最大値に達している場合は、各導出処理を開始しない。
かかる構成によれば、不要なイントラ予測モードの導出処理の実行を回避でき、イントラ予測部242の全体の処理負荷の軽減が期待できる。
(イントラ予測モード導出完了後のイントラ予測モード候補リストの登録方法)
本実施形態に係るイントラ予測部242は、上述した幾何学ブロック分割モードに対するイントラ予測モードの導出処理の完了時点で、イントラ予測モード候補リストに含まれるイントラ予測モードの候補数がイントラ予測モード候補リストサイズの最大値に達していない場合には、イントラ予測モード候補リストに既に同一の予測モードが含まれる場合、所定のイントラ予測モードを登録しないように構成されていてもよい。
例えば、イントラ予測部242は、GPM分割線に対して平行方向のAngular予測モードが登録されている場合は、所定のイントラ予測モードとして、GPM分割線に対して垂直方向のAngular予測モードを登録してもよい。
変更例として、例えば、イントラ予測部242は、GPM分割線に対して垂直方向のAngular予測モードが登録されている場合は、GPM分割線に対して平行方向のAngular予測モードを登録してもよい。
また、変更例として、イントラ予測部242は、上述のAngular予測モードの後に、Planarモード、次点でイントラ予測モード候補リストに最初に登録されているイントラ予測モードの近傍のイントラ予測モードを登録してもよい。
[インター予測部241における動き情報導出方法及び選択方法]
以降では、インター予測部242における本実施形態で提案するGPMへのイントラ予測の適用パターンのうち、Intra/Inter-GPM及びInter/Inter-GPMに対する動き情報の導出方法及び選択方法について説明する。
(色差信号成分ブロックに対するGPMの適用可不可の制御方法とイントラ予測モードの導出方法)
以下、本実施形態におけるイントラ予測部242の色差信号成分ブロックに対するGPMの適用可不可の制御方法とイントラ予測モードの導出方法を説明する。
非特許文献1では、Iスライス(イントラ予測ブロックのみを含むスライス)に限り、輝度信号成分及び色差信号成分が独立したブロック分割(Dual Tree)を可能としている。復号対象ブロックのDual Treeの適用有無は、スライス単位で復号部210が復号する制御データで特定される。
本実施形態では、復号対象ブロックがDual Treeである場合、復号部210は、復号対象ブロックの色差成分に対してGPM(Intra/Intra-GPM)を適用不可と判定する。
なお、同一スライスにおける色差成分に対応する輝度成分の同じ位置(領域)に対してGPM(Intra/Intra-GPM)が適用されている場合、イントラ予測部241は、対応する輝度成分の同じ位置(領域)に4×4画素ブロック単位で保存されたイントラ予測モードを色差成分向けのイントラ予測モードとして導出する。それ以外の場合は、輝度成分のイントラ予測ブロックが有するイントラ予測モードを色差成分向けのイントラ予測モードとして導出する。
一方、復号対象ブロックがDual Treeではない場合、復号部210は、復号対象ブロックの色差成分に対してGPM(Intra/Intra-GPM)を適用不可とは判定しない。
ここで、復号部210は、輝度成分および色差成分に対するGPM(Intra/Intra-GPM)の適用有無は、それぞれ共通した復号対象ブロック単位の制御データ、例えば、gpm_intra_enabled_flagの値を復号するか推定するかで判定してもよい。
復号対象ブロックの輝度成分及び色差成分に対してGPM(Intra/Intra-GPM)を適用すると判定される場合は、イントラ予測部242は、色差成分ブロックに対応する輝度成分ブロックのGPM各分割領域で使用されるイントラ予測モードを、同色差成分ブロックのGPM各分割領域に使用するイントラ予測モードとして導出してもよい。
(マージ候補リスト)
本実施形態では、インター予測部241は、非特許文献1で開示されているGPM向けのマージ候補リストから動き情報を導出してもよい。
ここで、マージ候補リストの構築方法については、非特許文献1で開示されている構成を本実施形態にも適用できるため、詳細な説明は省略する。
インター予測部241は、上述の動き情報の導出(マージ候補リストの構築)の完了後、復号部210で復号或いは推定された分割領域A/Bのそれぞれに対する2つのマージインデックス(merge_gpm_idx0/merge_gpm_idx1)の値に基づいて、マージ候補リスト内のいずれの動き情報をインター予測画素の生成に使用するかについて選択してもよい。
なお、復号部210は、GPMを構成するインター予測の合計適用数に応じて、マージ候補リスト内からインター予測画素の生成に使用する動き情報を選択するためのマージインデックスの復号要否を判定してもよい。
非特許文献1では、分割領域A/Bに対するインター予測の動き情報は、復号部210で復号或いは推定された2つのマージインデックス(merge_gpm_idx0/merge_gpm_idx1)の値と、図12に示すGPM向けのマージ候補リスト(MergeCandList[m,n])とによって導出される。
ここで、merge_gpm_idx0及びmerge_gpm_idx1に基づいて導出される動き情報が極力重複しないように、merge_gpm_idx0及びmerge_gpm_idx1で選択される動き情報の導出対象となるリスト番号は、図12のXに示すようにMergeCandListの偶数番号と奇数番号とで入れ子構造になっている。
具体的には、merge_gpm_idx0及びmerge_gpm_idx1に基づき、以下のm及びnを計算する。
m=merge_gpm_idx0[xCb][yCb]
n=merge_gpm_idx1[xCb][yCb]+((merge_gpm_idx1[xCb][yCb]>=m)?1:0)
このように算出されたmの値に基づき、分割領域Aの動き情報を構成する動きベクトル、参照画像インデックス及び予測リストフラグが、以下のように導出される。
まず、Xの値をm&0x01(mの値が偶数であるか否かの判定)及びn&0x01(nの値が偶数であるか否かの判定)から算出する。ここで、算出されたXが0の場合は、Xの値を(1-X)とする。
最後に、分割領域Aの動きベクトルmvA、参照画像インデックスrefIdxA、予測リストフラグpreListFlagA、分割領域Bの動きベクトルmvB、参照画像インデックスrefIdxB、予測リストフラグpreListFlagBを、それぞれ以下のように導出する。
mvA=mvLXM
refIdxA=refIdxLXM
preListFlagA=X
mvB=mvLXN
refIdxB=refIdxLXN
preListFlagB=X
ここで、M及びNは、それぞれマージ候補リストにおけるm及びnが示すマージ候補の番号、すなわち、
M=MergeCandList[m]
N=MergeCandList[n]
である。
変更例として、本実施形態では、非特許文献1で開示されているGPM向けのマージ候補リストの代替として、非特許文献2で開示されているGPM向けのマージ候補リストを用いてもよい。
具体的には、非特許文献1で開示されている上述の通常マージモード向けのマージ候補リストに導入されている剪定処理(以下、通常マージモード向けマージ候補剪定処理)よりも強力な剪定処理(以下、GPM向けマージ候補剪定処理)が導入されている。
また、具体的には、非特許文献1で開示されている通常マージモード向け剪定処理とは異なり、動き情報を剪定対象とするかどうかの判定を、動き情報が有する参照フレームが非特許文献1と同じく完全一致するかどうかを判定するが、動き情報が有する動きベクトルについては完全一致ではなく、復号対象ブロックのブロックサイズに基づく閾値により判定している。
具体的に、復号対象ブロックサイズが64画素未満である場合、かかる閾値は1/4画素に設定されており、復号対象ブロックサイズが64画素以上且つ256画素未満である場合、かかる閾値は、1/2画素に設定されており、復号対象ブロックサイズが256画素以上である場合、かかる閾値は、1画素に設定されている。
GPM向けマージ候補剪定処理の具体的なフローは、通常マージモード向け剪定処理と同様に、まず、参照フレームが完全一致するかが比較され、完全一致する場合は、次に、動きベクトルが完全一致するかどうかが判定される。
参照フレームが完全一致しない場合は、たとえ動きベクトルが閾値未満であっても、剪定対象とみなされない。かかる場合、比較対象のうちマージ候補リストにはない動き情報は、新規のマージ候補としてマージ候補リストに追加される構成となっている。
次に、参照フレームが完全一致し且つ動きベクトルが閾値未満である場合は、剪定対象とみなされる。それ以外の場合は、比較対象のうちマージ候補リストにはない動き情報は、新規のマージ候補としてマージ候補リストに追加される構成となっている。
かかる構成によれば、通常マージモード向け剪定処理では剪定対象ではなかった動きベクトルが類似する場合の動き情報も剪定対象に含まれることになるため、GPMの2つのマージインデックスによって導出される動き情報の類似性を排除でき、符号化性能の改善が期待できる。
なお、この非特許文献2で開示されているGPM向けマージ候補剪定処理において、動き情報が双予測である場合(すなわち、動きベクトル及び参照フレームをL0及びL1のそれぞれ1つずつ持つ場合)は、比較対象のマージ候補のL0及びL1の参照フレームのそれぞれと完全一致する場合に剪定対象とみなされる。
本実施形態では、インター予測部241は、GPM向けマージ候補剪定処理が追加されたGPMのマージ候補リストを通常マージモード向けの代替として用いて動き情報を導出してもよい。
かかる構成によれば、より類似度が低い動き情報から構成されたマージ候補リスト内から動き情報を導出できるため、結果として符号化性能の改善が期待できる。
更なる変更例として、インター予測部241は、動きベクトルの導出に使用するマージ候補リストとして、通常マージモード向けのマージ候補リスト及びGPM向けのマージ候補リストのいずれを使用するかをフラグによって切り替えてもよい。
具体的には、復号部210が復号する、例えば、1ビットのフラグを制御データに含まれるように構成することで、復号部210が当該フラグの値を復号或いは推定して、インター予測部241に伝達することで、この切り替えが実現できる。
かかる構成によれば、インター予測部241は、より多様なバリエーションから動き情報が導出することができるため、予測性能が向上し、結果として符号化性能の改善が期待できる。
(GPMの重み係数)
以下、図13~図15を用いて、復号部210、インター予測部241、イントラ予測部242及び合成部243に係る非特許文献1及び本実施形態に係るGPMの重み係数wについて説明する。
図13は、非特許文献1及び本実施形態に係るGPMの各分割領域A/Bの予測画素に対する重み係数wの値の一例を示す図である。
インター予測部241又はイントラ予測部242によって生成された各分割領域A/Bの予測画素が、合成部243で重み係数wによって合成(加重平均)される。
非特許文献1において、重み係数wの値は、0~8の値が用いられており、本実施形態でも、かかる重み係数wの値を用いてもよい。ここで、重み係数wの値0、8は、非ブレンディング領域(非Blending領域)を示し、重み係数wの値1~7は、ブレンディング領域(Blending)を示す。
なお、本実施形態において、重み係数wの計算方法は、非特許文献1と同様の方法で、画素位置(xL、yL)及び対象ブロックサイズから算出されるオフセット値(offsetX、offsetY)、図14に示す幾何学分割モード(GPM)の分割線の角度を規定するangleIdxから算出される変位(diplacementX、diplacementY)及び図15に示すdiplacementX、diplacementYから算出されるテーブル値disLutから、以下のように算出するように構成することができる。
weightIdx=(((xL+offsetX)<<1)+1)×disLut[diplacementX]+(((yL+offsetY)<<1)+1)×disLut[diplacementY]
weightIdxL=partFlip?32+weightIdx:32-weightIdx
w=Clip3(0,8,(weightIdxL+4)>>3)
[インター予測部241、イントラ予測部242、予測情報バッファ244における予測情報保存方法]
(被保存動き情報種別および被保存予測情報種別)
以下、図16用いて、復号部210、インター予測部241、イントラ予測部242及び予測情報バッファ244に非特許文献1で開示されている被保存動き情報種別及び本実施形態に係る被保存予測情報種別について説明する。
図16は、非特許文献1で開示されている被保存予測情報種別及び本実施形態に係る被保存予測情報種別が4×4画素サブブロックごとに特定される例を示す図である。
両者の計算方法は、以下に示すように同じであるが、図16に示すように、保存される情報が、非特許文献1では動き情報であるのに対して、本実施形態では予測情報である点が異なる。
第1に、被保存動き情報種別の値及び被保存予測情報種別の値(計算方法が同じであるため、以降では、便宜的に、いずれの値もsTypeとして定義する)は、非特許文献1と同様に、4×4画素サブブロック単位のインデックス(xSbIdx、ySbIdx)、上述の重み係数wと同様に算出されるオフセット値(offsetX、offsetY)、変位(diplacementX、diplacementY)及びテーブル(disLut)から、以下のように計算される。
motionIdx=(((4×xSbIdx+offsetX)<<1)+5)×disLut[diplacementX]+(((4×ySbIdx+offsetY)<<1)+5)×disLut[diplacementY]
sType=Abs(motionIdx)<32?2:(motionIdx<=0?(1-isFlip):isFlip)
ここで、sTypeの値は、図16に示すように、0,1,2の3種類の値から構成され、それぞれの値に応じて、予測情報バッファ244に保存される動き情報及び予測情報が、以下のように、インター予測部241及びイントラ予測部242によって制御される。
sTypeの値が0の場合は、非特許文献1では分割領域Aの動き情報を保存し、本実施形態では分割領域Aの予測情報を保存する。
sTypeの値が1の場合は、非特許文献1では分割領域Bの動き情報を保存し、本実施形態では分割領域Bの予測情報を保存する。
sTypeの値が2の場合は、非特許文献1では分割領域A及び分割領域Bの動き情報又は分割領域Bのみの動き情報を保存し、本実施形態では分割領域A及び分割領域Bの予測情報又は分割領域Bのみの予測情報を保存する。
ここで、保存される動き情報及び予測情報については後述する。
なお、上述のsTypeの算出単位及び後述する動き情報又は予測情報の保存単位を、上述の4×4画素サブブロック単位から、設計者の意図で変更してもよい。
具体的には、保存する情報量を削減するために、上述のsTypeの算出単位及び後述する動き情報又は予測情報の保存単位を8×8画素や16×16画素等と大きくしてもよい。
或いは、保存する情報量が増えるが、他のブロックやフレームから参照される際の動き情報又は予測情報の精度を向上させるために、上述のsTypeの算出単位及び後述する動き情報又は予測情報の保存単位を2×2画素等と小さくしてもよい。
(予測情報バッファ244に保存される動き情報及び予測情報)
以下、図17を用いて、インター予測部241から予測情報バッファ244に保存される非特許文献1で開示されている動き情報及び本実施形態にかかる予測情報についてそれぞれ説明する。
図17は、GPM適用ブロックを構成するサブブロックのsTypeの値に応じて保存される非特許文献1で開示されている動き情報及び本実施形態に係る予測情報の一覧を示す図である。
第1に、非特許文献1で開示されているGPMで最終的に保存される動き情報は、以下のパラメータから構成される。
・予測方向(predFlagL0、predFlagL1)
・L0及びL1の動きベクトル(mvL0、mvL1)
・L0及びL1の参照画像インデックス(refIdxL0、refIdxL1)
・BcwIdx
なお、予測方向(predFlagL0、predFlagL1)は、後述するsTypeに応じて保存されるサブブロックの予測方向を示すパラメータであり、predFlagL0の値及びpredFlagL1の値に基づいて、L0片予測、L1片予測、L0/L1双予測の3種類に分類される。
ここで、L0片予測とは、L0リストから導出した1つの動きベクトルによるインター予測であり、predFlagL0が1であり且つpredFlagL1が0であるケースが、この条件を示す値としてそれぞれ保存される。
また、L1片予測とは、L1リストから導出した1つの動きベクトルによるインター予測であり、predFlagL0が0であり且つpredFlagL1が1であるケースが、この条件を示す値としてそれぞれ保存される。
また、L0/L1双予測とは、L0リスト及びL1リストのそれぞれから導出した2つの動きベクトルによるインター予測であり、predFlagL0が1であり且つpredFlagL1が1であるケースが、この条件を示す値としてそれぞれ保存される。
また、L0及びL1の動きベクトル(mvL0、mvL1)は、上述のリスト番号L0及びL1に対する動きベクトルである。
また、L0及びL1の参照画像インデックス(refIdxL0、refIdxL1)は、それぞれmvL0及びmvL1が参照する参照フレームを示すインデックスである。
また、BcwIdxは、非特許文献1で開示されているBCW(Bi-prediction with CU-level weights)の重み係数の値を特定するインデックスである。
これらの非特許文献1で開示されている予測情報バッファ244に保存される動き情報に対して、本実施形態において予測情報バッファ244に保存される予測情報として、図17に示すように、予測種別及びイントラ予測モードが保存されるパラメータとして追加される。
ここで、予測種別は、図17に示すようにインター予測(Inter)及びイントラ予測(Intra)のいずれかを示す内部パラメータである。
また、本実施形態に係る予測情報として、図17に示すように、hpeIfIdxやIBC FlagやLIC Flagが追加されてもよい。
ここで、hpeIfIdx及びIBC Flagは、それぞれ非特許文献1で開示されているSIF(Switchable Interpolation Filter)及びIBC(Intra Block Copy)、及び、非特許文献2で開示されているLIC(Local Illumination Compensation)の適用有無を特定するフラグである。
(被保存予測情報種別に応じて保存される予測情報の詳細)
以下、図18~図21を用いて、本実施形態に係るインター予測部241又はイントラ予測部242が被保存予測情報種別sTypeに応じて、予測情報バッファ244に保存する予測情報の詳細を説明する。
図18は、図4のような異なる2つのインター予測から構成されるGPMに対して保存される予測情報の一例を示す図である。以下に、sTypeの値に応じて保存さされる各予測情報の詳細を説明する。
第1に、予測種別は、全てのsType領域でインター予測(Inter)であることが保存される。
第2に、predFlagL0、predFlagL1、mvL0、mvL1、refIdxL0及びrefIdxL1は、sTypeの値と、上述の分割領域A/Bの動きベクトルの導出先を示すマージ候補リストのリスト番号を示すpredListFlagA及びpredListFlagBの値とに応じて、非特許文献1に開示されている方法と同様に、以下のように保存される。
まず、sType=0の場合は、以下のように計算される。
predFlagL0=(predListFlagA==0)?1:0
predFlagL1=(predListFlagA==0)?0:1
refIdxL0=(predListFlagA==0)?refIdxA:-1
refIdxL1=(predListFlagA==0)?-1:refIdxA
mvL0=(predListFlagA==0)?mvA:0
mvL1=(predListFlagA==0)?0:mvA
次に、sType=1の場合、又は、sType=2且つpredListFlagA+predListFlagB≠1の場合は、以下のように計算される。
predFlagL0=(predListFlagB==0)?1:0
predFlagL1=(predListFlagB==0)?0:1
refIdxL0=(predListFlagB==0)?refIdxB:-1
refIdxL1=(predListFlagB==0)?-1:refIdxB
mvL0=(predListFlagB==0)?mvB:0
mvL1=(predListFlagB==0)?0:mvB
ここで、predListFlagA+predListFlagB≠1は、分割領域A/Bのリスト番号が一致する場合を示す。このとき、動きベクトルの重複を避けるため、sType=2の場合であっても分割領域Bの動きベクトルのみを保存する構成としている。
次に、sType=2且つpredListFlagA+predListFlagB=1の場合 は、以下のように計算される。
predFlagL0=1
predFlagL1=1
refIdxL0=(predListFlagA==0)?refIdxA:refIdxB
refIdxL1=(predListFlagA==0)?refIdxB:refIdxA
mvL0=(predListFlagA==0)?mvA:mvB
mvL1=(predListFlagA==0)?mvB:mvA
ここで、predListFlagA+predListFlagB=1は、分割領域A/Bのリスト番号が一致しない場合を示す。このとき、分割領域A/Bの2つ動きベクトルをそのまま保存する構成としている。
なお、図18では図示していないが、上述のmvL0及びmvL1は、非特許文献2で開示されているGPMに対するMMVD(Merge with Motion Vector Difference)やInter TM(Template Matching)により修正される前の動きベクトルを保存してもよい。
或いは、上述のmvL0及びmvL1は、非特許文献2で開示されているGPMに対するMMVDやInter TMにより修正された後の動きベクトルであってもよい。
修正後の動きベクトルを保存する場合は、当該GPM適用ブロックから動きベクトルを取得して予測画素を生成する予測ブロックの予測精度が向上する。
一方、修正前の動きベクトルを保存する場合は、当該GPMから動きベクトルを参照する予測ブロックの予測精度の向上は期待できないが、当該GPMブロックに対するMMVD及びInter TMの処理完了を待たずに、当該GPM適用ブロックの参照元ブロックの動きベクトルの導出処理を開始できるようになるため、復号処理時間の削減が期待できる。
なお、修正前後のいずれの動きベクトルを保存するかは、後述する図18~図15に対しても同様に選択可能である。
次に、イントラ予測モードは、全てのsType領域で保存しないとしてもよい。或いは、全てのsType領域でイントラ予測が無効であることを示す値が保存されてもよい。なぜなら、図18に示す構成では、全ての領域がインター予測であるため、対象ブロックに適用されたイントラ予測モードが存在しえないためである。
一方で、各sType領域に保存されるイントラ予測モードとして、各sType領域に保存される動き情報の参照先がイントラ予測ブロックである場合は、その参照ブロックのイントラ予測モードを、当該対象ブロックのイントラ予測モードとして保存してもよい。また、各sType領域に保存される動き情報の参照先がインター予測ブロックである場合は、当該対象ブロックのイントラ予測モードをPlanarモードとして保存してもよいし、或いは、その参照先のインター予測ブロックに保存された動き情報の参照先を用いてさらにイントラ予測モードを再帰的に追跡してもよい。ただし、追跡範囲には限度があるため、追跡上限に達した場合にイントラ予測モードの参照先が見つからなければ、Planarモードを当該対象ブロックのイントラ予測モードとして保存してもよい。これにより、当該対象ブロックの所定領域の予測種別がインター予測であっても、当該対象ブロックからフレーム内の別のブロック(たとえば隣接ブロック)から参照された場合に、イントラ予測を参照することができる。
次に、BcwIdx、hpeIfIdx、IBC Flag、LIC Flagは、全てのsType領域で無効である値ことを示す値が保存されてもよい。なぜなら、BCW、SIF、IBC及びLICは、いずれもGPMと排他の符号化ツールであるため、GPMが適用された対象ブロックでは、これらの符号化ツールが無効であることが自明であるためである。
関連して、図18から図20には図示していないが、IBCで使用される動きベクトルは保存しなくてもよいし、ゼロベクトルが保存されてもよい。これらのパラメータは、後述する図19と図20においても、同様の構成を採ることができるため、図19及び図20におけるこれらパラメータの詳細の説明は、以降では省略する。
図19及び図20は、図6のようなイントラ予測とインター予測から構成されるGPMに対して保存される予測情報の一例を示す図である。以下に、sTypeの値に応じて保存される各予測情報の詳細を説明する。
第1に、sTyper=1の場合にインター予測が適用されている分割領域(Interの分割領域)で保存される予測情報は、本実施形態においては、対象ブロックがBスライスに含まれない場合(Pスライスに含まれる場合)には片予測が適用されるが、対象ブロックがBスライスに含まれる場合には前述の通りマージインデックスに対応するマージ候補の動き情報次第では、双予測が適用される。以下にこの2つのケースにおけるsTyper=1の場合にインター予測が適用されている分割領域(Interの分割領域)で保存される予測情報を示す。
まず、図19は、対象ブロックがBスライスに含まれない場合(Pスライスに含まれる場合)には片予測が適用されるケースで保存される予測情報の一例である。保存される予測情報は、図19に示すように、図18のsTyper=1の場合にインター予測が適用されている分割領域(Interの分割領域)で保存される予測情報の構成例と同じ構成を採れる。
図19に対して、図20は、対象ブロックがBスライスに含まれる場合にかつ双予測が適用されるケースで保存される予測情報の一例である。保存される予測情報は、図20に示すように、図18のsTyper=1の場合にインター予測が適用されている分割領域(Interの分割領域)で保存される予測情報の構成例とは異なる。具体的に、当該領域に対する1つのマージインデックスに対応するマージ候補が有する動き情報から、L0及びL1のそれぞれの動きベクトルMVL0及びMVL1、及び、L0及びL1のそれぞれの参照フレームを示すインデックスRefIdxL0及びRefIdxL1が保存される。
なお、図20のケースにおいても、保存される予測情報のうちイントラ予測モードについては、図18のsTyper=1の場合にインター予測が適用されている分割領域(Interの分割領域)で保存される予測情報の構成例と同じ構成を採ってもよい。
第2に、sTyper=0の場合にイントラ予測が適用されている分割領域(Intraの分割領域)で保存される予測情報は、図19と図20に示すように以下のように保存される。
予測種別=Intra
predFlag0=0
predFlag1=0
mvL0=0
mvL1=0
refIdxL0=-1
refIdxL1=-1
イントラ予測モード=modeX
ここで、かかる分割領域では、イントラ予測が適用されているため、上述のように、予測種別としてIntraが保存され、イントラ予測モードとしてmodeXが保存される。
なお、変更例として、例えば、非特許文献1のように、隣接からサブブロック単位でイントラ予測種別のみを参照し、イントラ予測モードを参照しない符号化ツールしか含まれていない場合は、予測種別としてIntraを保存しつつ、イントラ予測モードを保存しない構成を採ってもよい。
さらなる変更例として、GPMに対してイントラ予測モードが適用される場合であっても、この適用されたイントラ予測モードをいずれも保存しないと構成してもよい。
一方で、動き情報を持たないため、上述のようにpredFlag0及びpredFlagL1として0を保存し、mvL0及びmvL1として0(ゼロベクトルを意味する)を保存し、refIdxL0及びrefIdxL1として‐1(参照フレームが存在しないことを意味する)を保存してもよい。
或いは、変更例として、予測情報バッファ244のバッファ領域の容量の逼迫を回避するために、これらの動き情報を保存しない構成をとってもよい。
第3に、sTyper=2の場合にイントラ予測及びインター予測が適用されている分割領域(Intra+Interの分割領域)で保存される予測情報は、前述のsTyper=1に保存される予測情報の構成次第で、図19と図20に示すように異なる。
図19に示すケースでは、以下のように保存される。
予測種別=Inter
predFlag0=(predListFlagB==0)?1:0
predFlag1=(predListFlagB==0)?0:1
refIdxL0=(predListFlagB==0)?refIdxB:-1
refIdxL1=(predListFlagB==0)?-1:refIdxB
mvL0=(predListFlagB==0)?mvB:0
mvL1=(predListFlagB==0)?0:mvB
イントラ予測モード=modeX
一方で、図19に示すケースでは、以下のように保存される。
予測種別=Inter
predFlag0=1
predFlag1=1
refIdxL0=RefIdxL0
refIdxL1=RefIdxL1
mvL0=MVL0
mvL1=MVL1
イントラ予測モード=modeX
ここで、かかる分割領域では、sType=1のイントラ予測が適用されているため、予測情報のうち、予測種別及びイントラ予測モードとしては、上述の通り、sType=1で保存されるものと同じパラメータが保存される。将来的に保存できるイントラ予測モードが2種類になった場合は、かかる分割領域では、sType=0のイントラ予測モードを追加で保存してもよい。
また、かかる分割領域では、sType=2のインター予測が適用されているため、予測情報のうち、動き場情報に係るパラメータとしては、上述の通り、sType=2で保存されるものと同じパラメータが保存される。
図21は、図7のような異なる2つのイントラ予測から構成されるGPMに対して保存される予測情報の一例を示す図である。以下に、sTypeの値に応じて保存される各予測情報の詳細を説明する。
第1に、全てのsType領域で保存される予測情報のうち、イントラ予測モード以外のパラメータは、図19で説明したsType=0の場合にIntraの分割領域で保存されるパラメータと同一の構成を採ることができるため、説明を省略する。
第2に、sType=0の領域及びsType=1の領域のイントラ予測モードとしては、図20に示すように、各領域で適用された異なる2つのイントラ予測モードmodeX及びmodeYがそれぞれ保存される。
第3に、sType=2の領域では、図20に示すように、sType=0の領域及びsType=1の領域のイントラ予測モードの双方を保存してもよいし、いずれか1つのイントラ予測モードを保存してもよい。
前者については、例えば、2つのイントラ予測モードが画像符号化装置100及び画像復号装置200で使用可能か場合は、2つのイントラ予測モードを保存する構成をとってもよい。
後者については、例えば、決め打ちでsType=0のイントラ予測モードをsType=2のイントラ予測モードとして選択してもよい。
或いは、例えば、4×4画素サブブロックがいずれのイントラ予測モードから支配的に生成されたかを、例えば、4×4画素サブブロックをさらに細分割した2×2画素サブブロック単位で計算して、支配的なイントラ予測モードをsType=2の領域のイントラ予測モードとして選択してもよい。
或いは、当該サブブロックが有する2つのイントラ予測モードが示す方向に存在する隣接する参照画素と当該サブブロックとの距離が小さい方をsType=2のイントラ予測モードとして選択してもよい。
さらなる変更例として、図21に示すように、2つのGPMに対して2つのイントラ予測モードが適用される場合であっても、この適用された2つのイントラ予測モードをいずれも保存しないと構成してもよい。
以上に説明した予測情報及び予測情報の保存方法を用いることで、GPMにイントラ予測を追加する場合の予測情報を、フレーム内或いはフレーム外から適切に参照することができるため、結果的に符号化性能の向上が期待できる。
なお、以上で説明した予測情報バッファ244に保存される予測情報のうち、イントラ予測モード以外のパラメータについては、フレーム内或いはフレーム外から参照されなくなった場合に、予測情報バッファ244から削除してもよい。
また、当該パラメータ分の保存領域を、予測情報バッファ244に確保している場合は、初期化してもよい。ここで、フレーム外から参照されなくなるタイミングは、フレームバッファ260(フレームバッファ160)から当該GPM適用ブロックが含まれるフレームが削除されるタイミングと同じである。
さらに、予測情報バッファ244に保存される予測情報のうち、イントラ予測モードについては、フレーム内から参照されなくなった場合に、予測情報バッファ244から削除してもよい。また、当該イントラ予測モード分だけの保存領域を、予測情報バッファ244に確保している場合は、初期化してもよい。
なお、上述では、GPMにより、矩形ブロックが幾何学形状に2分割される事例を参照して、その場合のGPMへのイントラ予測モードの適用時のシグナリング方法について説明したが、GPMにより矩形ブロックが幾何学形状に3分割以上に分割される事例においても、同様の概念で、本実施形態で説明したシグナリング方法は適用できる。
上述の画像符号化装置100及び画像復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、上述の各実施形態では、本発明を画像符号化装置100及び画像復号装置200への適用を例にして説明したが、本発明は、これのみに限定されるものではなく、画像符号化装置100及び画像復号装置200の各機能を備えた画像符号化システム及び画像復号システムにも同様に適用できる。
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
10…画像処理システム
100…画像符号化装置
111、241…インター予測部
112、242…イントラ予測部
113、243…合成部
114、224…予測情報バッファ
121…減算器
122、230…加算器
131…変換・量子化部
132、220…逆変換・逆量子化部
140…符号化部
150、250…インループフィルタ処理部
160、260…フレームバッファ
200…画像復号装置
210…復号部

Claims (20)

  1. 画像復号装置であって、
    幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、
    前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、
    前記イントラ予測部は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成するように構成されていることを特徴とする画像復号装置。
  2. 画像復号装置であって、
    幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、
    前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、
    前記イントラ予測部は、
    前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいて複数のイントラ予測モードを導出し、
    所定のインデックスを用いて、導出した前記複数のイントラ予測モードで構成されるイントラ予測モード候補リストの中から1つ又は複数のイントラ予測モードを選択して前記イントラ予測画素を生成するか否かについて制御するように構成されていることを特徴とする画像復号装置。
  3. 前記イントラ予測部は、さらに前記幾何学分割モードの分割形状に基づいて前記複数のイントラ予測モードを導出するように構成されていることを特徴とする請求項2に記載の画像復号装置。
  4. 画像復号装置であって、
    幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、
    前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、
    前記イントラ予測部は、
    前記幾何学分割モードの分割形状、又は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいて複数のイントラ予測モードを導出し、
    所定のインデックスを用いて、導出した前記複数のイントラ予測モードで構成されるイントラ予測モード候補リストの中から1つ又は複数のイントラ予測モードを選択して前記イントラ予測画素を生成するか否かについて制御し、
    前記複数のイントラ予測モードを導出する際に、前記幾何学分割モードの分割形状に対して平行方向のイントラ予測モードを前記イントラ予測モード候補リストの最初に登録するように構成されていることを特徴とする画像復号装置。
  5. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    所定のAngular予測モードに対する隣接参照画素のヒストグラムを計算し、
    イントラ予測モード候補リストに既に同一のAngular予測モードが含まれない場合は、前記ヒストグラムで最高画素値から所定数のAngular予測モードを登録し、
    前記イントラ予測モード候補リストに既に同一のAngular予測モードが含まれている場合は、前記所定数のAngular予測モードを登録しないように構成されていることを特徴とする請求項1又は2に記載の画像復号装置。
  6. 前記イントラ予測部は、前記ヒストグラムを計算する際に、前記幾何学分割モードの分割形状に基づいて前記隣接参照画素を所定領域に制限するように構成されていることを特徴とする請求項5に記載の画像復号装置。
  7. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記復号対象ブロックに隣接する第1テンプレートと、前記第1テンプレートに対して隣接する隣接参照画素及び前記幾何学分割モードが適用されない通常のイントラ予測向けに構築されたイントラ予測モード候補リストに登録されたイントラ予測モードを使用して生成されたイントラ予測画素とを比較してコストを計算し、
    前記幾何学分割モード向けのイントラ予測モード候補リストに既に同一の予測モードが含まれない場合、前記コストのうち最小コストとなるイントラ予測モードを登録し、
    前記幾何学分割モード向けのイントラ予測モード候補リストに既に同一の予測モードが含まれない場合、前記最小コストとなるイントラ予測モードを登録しないように構成されていることを特徴とする請求項1~3のいずれか一項に記載の画像復号装置。
  8. 前記イントラ予測部は、前記コストを計算する際に、前記第1テンプレート又は前記第1テンプレートに対して隣接する隣接参照画素を所定位置に制限するように構成されていることを特徴とする請求項7に記載の画像復号装置。
  9. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記復号対象ブロックの所定位置に隣接する参照ブロックのイントラ予測モードを導出し、
    前記イントラ予測モード候補リストに既に同一の予測モードが含まれない場合、導出した前記イントラ予測モードを登録し、
    前記イントラ予測モード候補リストに既に同一の予測モードが含まれる場合、導出した前記イントラ予測モードを登録しないように構成されていることを特徴とする請求項1~3のいずれか一項に記載の画像復号装置。
  10. 前記イントラ予測部は、前記幾何学分割モードの分割形状に基づいて、前記復号対象ブロックの第1位置に隣接する隣接参照ブロックのイントラ予測モードを導出する際に、前記隣接参照ブロックを第2位置に制限することを特徴とする請求項9に記載の画像復号装置。
  11. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記隣接参照画素を用いて前記ヒストグラムを計算し、
    計算した前記ヒストグラムに基づいてイントラ予測モードを導出した後に、前記隣接参照画素を用いたコスト計算に基づいて前記イントラ予測モードを導出するように構成されていることを特徴とする請求項5又は6に記載の画像復号装置。
  12. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記隣接参照画素を用いて前記ヒストグラムを計算し、
    計算した前記ヒストグラムに基づいてイントラ予測モードを導出した後に、前記復号対象ブロックの隣接参照ブロックに基づいて前記イントラ予測モードを導出するように構成されていることを特徴とする請求項5又は6に記載の画像復号装置。
  13. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記隣接参照画素を用いたコスト計算に基づいてイントラ予測モードを導出した後に、前記復号対象ブロックの隣接参照ブロックに基づいて前記イントラ予測モードを導出するように構成されていることを特徴とする請求項1又は2に記載の画像復号装置。
  14. 前記イントラ予測部は、
    前記イントラ予測モードを導出する際に、
    前記隣接参照画素を用いて前記ヒストグラムを計算し、
    計算した前記ヒストグラムに基づいてイントラ予測モードを導出した後に、前記隣接参照画素を用いたコスト計算に基づいて前記イントラ予測モードを導出し、
    前記隣接参照画素を用いたコスト計算に基づいてイントラ予測モードを導出した後に、前記復号対象ブロックの隣接参照ブロックに基づいて前記イントラ予測モードを導出するように構成されていることを特徴とする請求項5又は6に記載の画像復号装置。
  15. 前記イントラ予測部は、
    イントラ予測モード候補リストに含まれるイントラ予測モードの候補数が前記イントラ予測モード候補リストのサイズの最大値に達していない場合、前記イントラ予測モードの導出処理を開始し、
    前記候補数が前記最大値に達している場合、前記イントラ予測モードの導出処理を開始しないように構成されていることを特徴とする請求項1~14のいずれか一項に記載の画像復号装置。
  16. 前記イントラ予測部は、
    全ての前記イントラ予測モードを導出した後に、
    イントラ予測モード候補リストに含まれるイントラ予測モードの候補数が前記イントラ予測モード候補リストのサイズの最大値に達していない場合で、且つ、前記イントラ予測モード候補リストに既に同一の予測モードが含まれない場合、前記イントラ予測モード候補リストに所定のイントラ予測モードを登録し、
    前記候補数が前記最大値に達していない場合で、且つ、前記イントラ予測モード候補リストに既に同一の予測モードが含まれている場合、前記イントラ予測モード候補リストに所定のイントラ予測モードを登録しないように構成されていることを特徴とする請求項1~14のいずれか一項に記載の画像復号装置。
  17. 画像復号装置であって、
    復号対象スライス又は復号対象ブロックの制御データを復号するように構成されている復号部を備え、
    前記復号部は、前記復号対象スライス又は前記復号対象ブロックの制御データを復号することにより、
    前記復号対象ブロックがIスライスに含まれており且つDual Treeであると特定される場合は、前記復号対象ブロックの輝度成分に対して幾何学分割モードが適用されると判定されていても、前記復号対象ブロックの輝度成分に対応する色差成分ブロックに対する幾何学分割モードを適用不可と判定し、
    それ以外の場合は、前記色差成分ブロックに対する幾何学分割モードを適用不可と判定しないように構成されていることを特徴とする記載の画像復号装置。
  18. 画像復号装置であって、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、
    前記幾何学分割モードが適用された復号対象ブロックのイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、
    前記イントラ予測部は、
    前記復号対象ブロックがDual Treeではなく且つ前記復号対象ブロックの輝度成分に対して幾何学分割モードが適用される場合において、前記復号対象ブロックの色差成分に対して幾何学分割モードを適用し、さらに、復号対象ブロックの色差成分に対応する輝度成分の幾何学分割モードによる各分割領域に対して使用されるイントラ予測モードを、前記色差成分の幾何学分割モードによって分割された各分割領域に対するイントラ予測モードとして導出するように構成されていることを特徴とする画像復号装置。
  19. 画像復号方法であって、
    幾何学分割モードに対する動き情報を導出して動き補償画素を生成する工程Aと、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成する工程Bと、
    前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力する工程Cと、を備え、
    前記工程Aにおいて、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成することを特徴とする画像復号方法。
  20. コンピュータを、画像復号装置として機能させるプログラムであって、
    前記画像復号装置は、
    幾何学分割モードに対する動き情報を導出して動き補償画素を生成するように構成されているインター予測部と、
    前記幾何学分割モードに対するイントラ予測モードを導出してイントラ予測画素を生成するように構成されているイントラ予測部と、
    前記幾何学分割モードが適用された復号対象ブロックの動き情報又はイントラ予測モードと、インター予測及びイントラ予測のいずれかが適用されたかを判定可能な予測種別とを含む予測情報を保存又は出力するように構成されている予測情報バッファと、を備え、
    前記イントラ予測部は、前記復号対象ブロックに隣接する隣接参照画素又は隣接参照ブロックに基づいてイントラ予測モードを導出し、導出した前記イントラ予測モードを用いてイントラ予測画素を生成するように構成されていることを特徴とするプログラム。
JP2021157115A 2021-09-27 2021-09-27 画像復号装置、画像復号方法及びプログラム Pending JP2023047920A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021157115A JP2023047920A (ja) 2021-09-27 2021-09-27 画像復号装置、画像復号方法及びプログラム
CN202280060287.XA CN117941345A (zh) 2021-09-27 2022-08-05 图像解码装置、图像解码方法及程序
PCT/JP2022/030194 WO2023047821A1 (ja) 2021-09-27 2022-08-05 画像復号装置、画像復号方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021157115A JP2023047920A (ja) 2021-09-27 2021-09-27 画像復号装置、画像復号方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2023047920A true JP2023047920A (ja) 2023-04-06

Family

ID=85719444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021157115A Pending JP2023047920A (ja) 2021-09-27 2021-09-27 画像復号装置、画像復号方法及びプログラム

Country Status (3)

Country Link
JP (1) JP2023047920A (ja)
CN (1) CN117941345A (ja)
WO (1) WO2023047821A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113170142A (zh) * 2018-11-22 2021-07-23 华为技术有限公司 编码器、解码器及对应帧间预测方法

Also Published As

Publication number Publication date
CN117941345A (zh) 2024-04-26
WO2023047821A1 (ja) 2023-03-30

Similar Documents

Publication Publication Date Title
US11792409B2 (en) Method and apparatus for encoding/decoding an image
JP6545838B2 (ja) マージ候補ブロック誘導方法及びこのような方法を用いる装置
KR101789478B1 (ko) 휘도 샘플을 이용한 색차 블록의 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
EP4221202A1 (en) Image encoding and decoding method and image decoding device
JP5875989B2 (ja) ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置
KR20120027145A (ko) 화상 처리 장치 및 방법
KR20130069757A (ko) 영상 부호화 방법, 영상 복호 방법, 영상 부호화 장치, 영상 복호 장치 및 그 프로그램
JP2023120392A (ja) 映像符号化/復号化方法及び装置
CN111010578A (zh) 一种帧内帧间联合预测的方法、装置以及存储介质
US11785242B2 (en) Video processing methods and apparatuses of determining motion vectors for storage in video coding systems
WO2023047821A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2023047820A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2023090309A1 (ja) 画像復号装置、画像復号方法及びプログラム
JP7495909B2 (ja) 画像復号装置、画像復号方法及びプログラム
WO2023013667A1 (ja) 画像復号装置、画像復号方法及びプログラム
CN112075078A (zh) 合成式预测及限制性合并
WO2023021989A1 (ja) 画像復号装置、画像復号方法及びプログラム
KR20190081488A (ko) 영상 부호화/복호화 방법 및 장치
WO2023277129A1 (ja) 画像復号装置、画像復号方法及びプログラム
WO2024007825A1 (en) Method and apparatus of explicit mode blending in video coding systems
WO2023116716A1 (en) Method and apparatus for cross component linear model for inter prediction in video coding system
US20240187625A1 (en) Image decoding device, image decoding method, and program
WO2023143325A1 (en) Method and apparatus for video coding using merge with mvd mode
TW202341738A (zh) 視訊編碼解碼方法和裝置
TW202345594A (zh) 視訊編解碼方法和裝置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240402