JP2021180495A - 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム - Google Patents

予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム Download PDF

Info

Publication number
JP2021180495A
JP2021180495A JP2021112273A JP2021112273A JP2021180495A JP 2021180495 A JP2021180495 A JP 2021180495A JP 2021112273 A JP2021112273 A JP 2021112273A JP 2021112273 A JP2021112273 A JP 2021112273A JP 2021180495 A JP2021180495 A JP 2021180495A
Authority
JP
Japan
Prior art keywords
prediction
image
unit
block
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021112273A
Other languages
English (en)
Other versions
JP7340569B2 (ja
Inventor
俊輔 岩村
Shunsuke Iwamura
敦郎 市ヶ谷
Atsuro Ichigaya
慎平 根本
Shimpei Nemoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Publication of JP2021180495A publication Critical patent/JP2021180495A/ja
Priority to JP2023116701A priority Critical patent/JP2023126531A/ja
Application granted granted Critical
Publication of JP7340569B2 publication Critical patent/JP7340569B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Abstract

【課題】予測画像を適切に補正可能とする。【解決手段】予測画像補正装置は、フレーム単位の現画像を分割して得られた対象画像ブロックを複数の参照画像を用いて予測することにより、前記対象画像ブロックに対応する予測画像を生成する予測部(108)と、前記予測画像の生成に用いる前記複数の参照画像間の類似度に基づいて、前記予測画像の予測精度を評価する予測精度評価部(109)と、前記予測画像に対して補正処理を行う補正部(110)と、を備え、前記補正部は、少なくとも前記予測精度評価部による評価結果に基づいて前記補正処理を制御する。【選択図】図1

Description

本発明は、予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムに関する。
映像符号化技術では、フレーム(ピクチャ)単位の現画像を分割して得られたブロック単位で変換や予測などを行うことにより効率的な符号化(圧縮)を実現している。予測としてはイントラ予測及びインター予測の2種類の方法がある。
イントラ予測は、符号化対象又は復号対象のブロック(以下、「対象画像ブロック」という)に隣接する復号済み隣接ブロックを参照して予測画像を生成する方法である。インター予測は、対象画像ブロックが属する現フレームとは異なる復号済みフレームを参照して予測画像を生成する方法である。
特許文献1には、対象画像ブロックをインター予測により予測してインター予測画像を生成するとともに、対象画像ブロックをイントラ予測により予測してイントラ予測画像を生成し、インター予測画像及びイントラ予測画像を重み付け平均する予測画像補正装置が記載されている。
具体的には、特許文献1に記載の予測画像補正装置は、対象画像ブロックに対応するインター予測画像と、対象画像ブロックに隣接する復号済み隣接ブロックとの連続性を評価し、不連続であると評価した場合には、復号済み隣接ブロックを用いてインター予測画像の端部領域をフィルタ処理により補正する。
米国特許出願公開第2013/051467号明細書
特許文献1に記載の予測画像補正装置は、インター予測の予測精度にかかわらず、インター予測画像と復号済み隣接ブロックとの連続性の評価に応じてフィルタ処理を適用する。
このため、インター予測画像と復号済み隣接ブロックとの境界にオブジェクト境界があるような場合、インター予測画像の端部領域の予測精度が高い場合であっても、この端部領域にフィルタ処理を適用してしまうため、フィルタ処理により予測画像の精度が低下し得るという問題がある。
そこで、本発明は、予測画像を適切に補正可能な予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。
本発明に係る予測画像補正装置は、フレーム単位の画像を分割して得られた対象画像ブロックをインター予測により予測し、前記対象画像ブロックに対応するインター予測ブロックを生成するインター予測部と、前記対象画像ブロックをイントラ予測により予測し、前記対象画像ブロックに対応するイントラ予測ブロックを生成するイントラ予測部と、前記インター予測ブロックと前記イントラ予測ブロックとの重み付け平均処理を補正処理として実行する予測画像補正部と、を備え、前記予測画像補正部は、前記対象画像ブロックに隣接する復号済み隣接ブロックに対するイントラ予測処理を制御する予測モードに応じて、前記重み付け平均処理における重みを調整することを要旨とする。また、第1の特徴に係る予測画像補正装置は、フレーム単位の現画像を分割して得られた対象画像ブロックを複数の参照画像を用いて予測することにより、前記対象画像ブロックに対応する予測画像を生成する予測部と、前記予測画像の生成に用いる前記複数の参照画像間の類似度に基づいて、前記予測画像の予測精度を評価する予測精度評価部と、前記対象画像ブロックに隣接する復号済み隣接ブロックを用いて前記予測画像に対して補正処理を行う補正部と、を備え、前記補正部は、少なくとも前記予測精度評価部による評価結果に基づいて前記補正処理を制御することを要旨とする。
なお、複数の参照画像を用いて行う予測とはインター予測における双予測が代表的なものであるがそれに限定されるものではなく、例えば、HEVC符号化方式で用いられている画像のIntraBCモード(イントラブロックコピーモード)などのように複数参照して予測画像を生成する場合においても同様の手法が適用可能である。
第2の特徴に係る画像符号化装置は、第1の特徴に係る予測画像補正装置を備えることを要旨とする。
第3の特徴に係る画像復号装置は、第1の特徴に係る予測画像補正装置を備えることを要旨とする。
第4の特徴に係るプログラムは、コンピュータを第1の特徴に係る予測画像補正装置として機能させることを要旨とする。
本発明によれば、予測画像を適切に補正可能な予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムを提供できる。
実施形態に係る画像符号化装置の構成を示す図である。 実施形態に係る画像復号装置の構成を示す図である。 インター予測の一例を示す図である。 インター予測により生成される予測画像の一例を示す図である。 実施形態に係る予測精度評価部の構成の一例を示す図である。 実施形態に係る予測画像補正部の構成の一例を示す図である。 実施形態に係る連続性評価部の動作例を示す図である。 実施形態に係る予測画像補正動作の一例を示す図である。 実施形態の変更例に係る予測画像補正部の構成を示す図である。 実施形態の変更例に係る連続性評価部及びフィルタ処理部の動作例を示す図である。
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号を行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
(1.画像符号化装置の構成)
図1は、本実施形態に係る画像符号化装置1の構成を示す図である。図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部101と、変換部102aと、量子化部102bと、エントロピー符号化部103と、逆量子化部104aと、逆変換部104bと、合成部105と、メモリ106と、イントラ予測部107と、インター予測部108と、予測精度評価部109と、予測画像補正部(補正部)110とを備える。本実施形態において、イントラ予測部107、インター予測部108、予測精度評価部109、及び予測画像補正部110は、予測画像補正装置を構成する。
ブロック分割部100は、フレーム(或いはピクチャ)単位の入力画像をブロック状の小領域に分割し、画像ブロックを減算部101(及びインター予測部108)に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックは、画像符号化装置1が符号化を行う単位及び画像復号装置2が復号を行う単位であり、かかる画像ブロックを対象画像ブロックと称する。なお、画像ブロックの形状は正方形に限定されるものではなく、長方形の形状であってもよい。
減算部101は、ブロック分割部100から入力された対象画像ブロックと対象画像ブロックに対応する予測画像(予測画像ブロック)との間の画素単位での差分を示す予測残差を算出する。具体的には、減算部101は、符号化対象ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換部102aに出力する。本実施形態において、予測画像は、後述する予測画像補正部110により補正されたものであって、予測画像補正部110から減算部101に入力される。
変換部102a及び量子化部102bは、ブロック単位で直交変換処理及び量子化処理を行う変換・量子化部102を構成する。
変換部102aは、減算部101から入力された予測残差に対して直交変換を行って変換係数を算出し、算出した変換係数を量子化部102bに出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: KarhunenLoeve Transform)等をいう。
量子化部102bは、変換部102aから入力された変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化変換係数を生成する。量子化パラメータ(Qp)は、ブロック内の各変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各変換係数を量子化する際の量子化値を要素として有する行列である。量子化部102bは、量子化制御情報、生成した量子化変換係数情報などをエントロピー符号化部103及び逆量子化部104aに出力する。
エントロピー符号化部103は、量子化部102bから入力された量子化変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context−based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部103には、イントラ予測部107及びインター予測部108から予測に関する情報が入力される。エントロピー符号化部103は、これらの情報のエントロピー符号化も行う。
逆量子化部104a及び逆変換部104bは、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部104を構成する。
逆量子化部104aは、量子化部102bが行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部104aは、量子化部102bから入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部104bに出力する。
逆変換部104bは、変換部102aが行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部102aが離散コサイン変換を行った場合には、逆変換部104bは逆離散コサイン変換を行う。逆変換部104bは、逆量子化部104aから入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部105に出力する。
合成部105は、逆変換部104bから入力された復元予測残差を予測画像補正部110から入力された予測画像と画素単位で合成する。合成部105は、復元予測残差の各画素値と予測画像の各画素値を加算して対象画像ブロックを再構成(復号)し、再構成した対象画像ブロックである再構成画像ブロックをメモリ106に出力する。なお、かかる再構成画像ブロックは、復号済みブロックと称されることがある。
メモリ106は、合成部105から入力された再構成画像ブロックを記憶する。メモリ106は、再構成画像ブロックをフレーム単位で記憶する。
イントラ予測部107は、メモリ106に記憶された再構成画像ブロック(復号済みブロック)のうち、対象画像ブロックに隣接する復号済み隣接ブロックを参照してイントラ予測画像を生成する。イントラ予測部107は、最適なイントラ予測モードを選択し、選択したイントラ予測モードを用いてイントラ予測を行う。複数のイントラ予測方向に対応する複数のイントラ予測モードが予め規定されている。イントラ予測方向とは、対象画像ブロックに隣接する隣接画素を参照して対象画像ブロック中の対象画素を予測する際に、対象画素を基準とした隣接参照画素の方向をいう。すなわち、イントラ予測モード(イントラ予測方向)により、対象画像ブロック中の各画素の予測に用いるべき隣接参照画素が定められる。イントラ予測部107は、イントラ予測画像(及び/又は隣接参照画素)を予測画像補正部110に出力するとともに、選択したイントラ予測モードの情報をエントロピー符号化部103に出力する。
インター予測部108は、メモリ106に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて対象画像ブロックを予測するインター予測を行う。具体的には、インター予測部108は、ブロックマッチングなどの手法により動きベクトルを算出し、動きベクトルに基づいてインター予測画像を生成する。インター予測部108は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。本実施形態において、インター予測部108が双予測を用いる場合を主として説明し、インター予測部108は複数の参照画像を用いて予測を行う予測部に相当する。インター予測部108は、生成したインター予測画像を予測画像補正部110に出力するとともに、選択したインター予測方法及び動きベクトルに関する情報をエントロピー符号化部103に出力する。また、インター予測部108は、インター予測に用いる複数の参照画像を予測精度評価部109に出力する。
予測精度評価部109は、インター予測画像の生成に用いる複数の参照画像間の類似度に基づいて、インター予測画像の端部領域における予測精度を評価する。具体的には、インター予測部108が複数の参照画像を用いてインター予測を行う場合において、インター予測に用いる複数の参照画像間の類似度を1又は複数の画素からなる画像部分ごとに算出し、かかる類似度によりインター予測画像の予測精度を画像部分ごとに評価し、評価結果の情報を予測画像補正部110に出力する。本実施形態において、予測精度評価部109が、予測に用いる複数の参照画像間の類似度を1画素単位で算出し、インター予測画像の予測精度を1画素単位で評価する一例を主として説明する。予測精度評価部109の詳細については後述する。
予測画像補正部110は、インター予測部108から入力されるインター予測画像とイントラ予測部107から入力されるイントラ予測画像とを重み付け平均することで補正する。具体的には、予測画像補正部110は、イントラ予測画像に対応する復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。また、予測画像補正部110は、予測精度評価部109による評価結果に少なくとも基づいてフィルタ処理を制御する。「フィルタ処理を制御する」とは、フィルタ処理を行うか否かの制御やフィルタ強度の制御を含む。本実施形態において、予測画像補正部110が、予測精度評価部109による評価結果に少なくとも基づいてフィルタ処理を行うか否かを制御する一例を主として説明する。例えば、予測画像補正部110は、予測精度評価部109により評価された予測精度が第1閾値以下である場合にはフィルタ処理を行い、予測精度評価部109により評価された予測精度が第1閾値を超える場合にはフィルタ処理を行わない。予測画像補正部110は、フィルタ処理を行う場合にはフィルタ処理後のインター予測画像を予測画像として減算部101及び合成部105に出力し、フィルタ処理を行わない場合にはインター予測画像をそのまま予測画像として減算部101及び合成部105に出力する。なお、「予測精度」を「予測の当たらなさ」で表してもよい。「予測の当たらなさ」について、例えば、予測精度が第1閾値以下であることは、予測の当たらなさが高いことを意味してもよい。予測精度が第1閾値を超えることは、予測の当たらなさが低いことを意味してもよい。予測画像補正部110の詳細については後述する。
(2.画像復号装置の構成)
図2は、本実施形態に係る画像復号装置2の構成を示す図である。図2に示すように、画像復号装置2は、エントロピー復号部200と、逆量子化部201aと、逆変換部201bと、合成部202と、メモリ203と、イントラ予測部204と、インター予測部205と、予測精度評価部206と、予測画像補正部207とを備える。本実施形態において、イントラ予測部204、インター予測部205、予測精度評価部206、及び予測画像補正部207は、予測画像補正装置を構成する。
エントロピー復号部200は、符号化装置1により生成された符号化データを復号し、量子化変換係数を逆量子化部201aに出力する。また、エントロピー復号部200は、符号化データを復号し、予測(イントラ予測及びインター予測)に関する情報を取得し、予測に関する情報をイントラ予測部204及びインター予測部205に出力する。
逆量子化部201a及び逆変換部201bは、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部201を構成する。
逆量子化部201aは、画像符号化装置1の量子化部102bが行う量子化処理に対応する逆量子化処理を行う。逆量子化部201aは、エントロピー復号部200から入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部201bに出力する。
逆変換部201bは、画像符号化装置1の変換部102aが行う直交変換処理に対応する逆直交変換処理を行う。逆変換部201bは、逆量子化部201aから入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部202に出力する。
合成部202は、逆変換部201bから入力された予測残差と、予測画像補正部207から入力された予測画像とを画素単位で合成することにより、元の対象画像ブロックを再構成(復号)し、再構成画像ブロックをメモリ203に出力する。
メモリ203は、合成部202から入力された再構成画像ブロックを記憶する。メモリ203は、再構成画像ブロックをフレーム単位で記憶する。メモリ203は、フレーム単位の再構成画像(復号画像)を表示順に画像復号装置2の外部に出力する。
イントラ予測部204は、メモリ203に記憶された再構成画像ブロックを参照し、エントロピー復号部200から入力されたイントラ予測情報(イントラ予測モード)に従ってイントラ予測を行うことによりイントラ予測画像を生成する。具体的には、イントラ予測部204は、メモリ203に記憶された再構成画像ブロック(復号済みブロック)のうち、イントラ予測モードに応じて定められる隣接参照画素を参照してイントラ予測画像を生成する。イントラ予測部204は、イントラ予測画像(及び/又は隣接参照画素)を予測画像補正部207に出力する。
インター予測部205は、メモリ106に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて対象画像ブロックを予測するインター予測を行う。インター予測部205は、エントロピー復号部200から入力されたインター予測情報(動きベクトル情報等)に従ってインター予測を行うことによりインター予測画像を生成し、インター予測画像を予測画像補正部207に出力する。また、インター予測部205は、インター予測に用いる複数の参照画像を予測精度評価部206に出力する。
予測精度評価部206は、画像符号化装置1の予測精度評価部109と同様な動作を行う。予測精度評価部206は、インター予測部205が複数の参照画像を用いてインター予測を行う場合において、複数の参照画像間の類似度を画素単位で算出することにより、予測画像の予測精度を画素単位で評価し、評価結果の情報を予測画像補正部207に出力する。
予測画像補正部207は、画像符号化装置1の予測画像補正部110と同様な動作を行う。予測画像補正部207は、イントラ予測画像に対応する復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。予測画像補正部207は、予測精度評価部206により評価された予測精度が第1閾値以下である場合にはフィルタ処理を行い、予測精度評価部206により評価された予測精度が第1閾値を超える場合にはフィルタ処理を行わない。予測画像補正部207は、フィルタ処理を行う場合にはフィルタ処理後のインター予測画像を予測画像として合成部202に出力し、フィルタ処理を行わない場合にはインター予測画像をそのまま予測画像として合成部202に出力する。予測画像補正部207の詳細については後述する。
(3.インター予測)
図3は、インター予測の一例を示す図である。図4は、インター予測により生成される予測画像の一例を示す図である。インター予測のシンプルな例として、HEVCで用いられている双予測、特に前方向及び後方向予測(両方向予測)を用いる場合について説明する。
図3に示すように、双予測は、対象フレーム(現フレーム)に対して時間的に前及び後のフレームを参照する。図3の例では、tフレーム目の画像中のブロックの予測を、t−1フレーム目とt+1フレーム目とを参照して行う。動き検出では、t−1及びt+1フレーム目の参照フレーム内から、対象画像ブロックと類似する箇所(ブロック)をシステムで設定された探索範囲の中から検出する。
検出された箇所が参照画像である。対象画像ブロックに対する参照画像の相対位置を示す情報が図中に示す矢印であり、動きベクトルと呼ばれる。動きベクトルの情報は、画像符号化装置1において、参照画像のフレーム情報とともにエントロピー符号化によって符号化される。一方、画像復号装置2は、画像符号化装置1により生成された動きベクトルの情報に基づいて参照画像を検出する。
図3及び図4に示すように、動き検出によって検出された参照画像1及び2は、対象画像ブロックに対し、参照するフレーム内で位置合わせされた類似する部分画像であるため、対象画像ブロック(符号化対象画像)に類似した画像となる。図4の例では、対象画像ブロックは、星の絵柄と部分的な円の絵柄とを含んでいる。参照画像1は、星の絵柄と全体的な円の絵柄とを含んでいる。参照画像2は、星の絵柄を含むが、円の絵柄を含んでいない。
かかる参照画像1及び2から予測画像を生成する。なお、予測処理は、一般的に、特徴は異なるが部分的に類似する参照画像1及び2を平均化することによって、それぞれの参照画像の特徴を備えた予測画像を生成する。但し、より高度な処理、例えば、ローパスフィルタやハイパスフィルタ等による信号強調処理を併用して予測画像を生成してもよい。ここで、参照画像1は円の絵柄を含み、参照画像2は円の絵柄を含まないため、参照画像1及び2を平均化して予測画像を生成すると、予測画像における円の絵柄は、参照画像1に比べて信号が半減する。
参照画像1及び2から得られた予測画像と対象画像ブロック(符号化対象画像)との差分が予測残差である。図4に示す予測残差において、星の絵柄のエッジのずれ部分と丸の絵柄のずれた部分(斜線部)とにのみ大きな差分が生じているが、それ以外の部分については、精度よく予測が行えており、差分が少なくなる(図4の例では差分が生じていない)。
差分が生じていない部分(星の絵柄の非エッジ部分及び背景部分)は、参照画像1と参照画像2との間の類似度が高い部分であって、高精度な予測が行われた部分である。一方、大きな差分が生じている部分は、各参照画像に特有な部分、すなわち、参照画像1と参照画像2との間の類似度が著しく低い部分である。よって、参照画像1と参照画像2との間の類似度が著しく低い部分は、予測の精度が低く、大きな差分(残差)を生じさせることが分かる。
このように差分が大きい部分と差分が無い部分とが混在した予測残差を直交変換し、量子化による変換係数の劣化が生じると、かかる変換係数の劣化が逆量子化及び逆直交変換を経て画像(ブロック)内に全体的に伝搬する。そして、逆量子化及び逆直交変換によって復元された予測残差(復元予測残差)を予測画像に合成して対象画像ブロックを再構成すると、図4に示す星の絵柄の非エッジ部分及び背景部分のように高精度な予測が行われた部分にも画質の劣化が伝搬してしまう。
(4.予測精度評価部)
図5は、画像符号化装置1における予測精度評価部109の構成の一例を示す図である。予測精度評価部109は、インター予測に用いる複数の参照画像間の類似度を画素単位で算出することにより、予測画像の予測精度を画素単位で評価する。ここでは、予測精度評価部109が予測画像の全画素について予測精度を評価する一例を説明するが、予測精度評価部109は、必ずしも予測画像の全画素について予測精度を評価しなくてもよい。予測精度評価部109は、少なくとも予測画像の端部領域における画素について予測精度を評価すればよい。
図5に示すように、予測精度評価部109は、差分算出部(減算部)109aと、正規化部109bと、調整部109cとを備える。
差分算出部109aは、参照画像1と参照画像2との間の差分値の絶対値を画素単位で算出し、算出した差分値の絶対値を正規化部109bに出力する。差分値の絶対値は、類似度を示す値の一例である。差分値の絶対値が小さいほど類似度が高く、差分値の絶対値が大きいほど類似度が低いといえる。差分算出部109aは、各参照画像に対してフィルタ処理を行ったうえで差分値の絶対値を算出してもよい。差分算出部109aは、二乗誤差等の統計量を算出し、かかる統計量を類似度として用いてもよい。
正規化部109bは、差分算出部109aから入力された各画素の差分値を、ブロック内で差分値の絶対値が最大となる画素の差分値の絶対値(すなわち、ブロック内の差分値の絶対値の最大値)で正規化し、正規化した差分値の絶対値である正規化差分値を調整部109cに出力する。本実施形態において、正規化差分値は、合成部105において予測画像と合成する復元予測残差を画素単位で重み付けするための重みとして用いられる。
調整部109cは、量子化の粗さを定める量子化パラメータ(Qp)に基づいて、正規化部109bから入力された正規化差分値(重み)を調整し、この重みを出力する。量子化の粗さが大きいほど復元予測残差の劣化度が高いため、調整部109cは、量子化パラメータ(Qp)に基づいて正規化差分値(重み)を調整することにより、劣化度を考慮して復元予測残差の重み付けを行うことができる。
予測精度評価部109が出力する各画素(ij)の推定予測精度Rijは、例えば下記の式(1)のように表現することができる。
Rij = 1 − (abs(Xij−Yij)/maxD × Scale(Qp)) ・・・(1)
式(1)において、Xijは参照画像1の画素ijの画素値であり、Yijは参照画像2の画素ijの画素値であり、absは絶対値を得る関数である。
また、式(1)において、maxDは、ブロック内の差分値abs(Xij−Yij)の最大値である。maxDを求めるために、ブロック内のすべての画素について差分値を求める必要があるが、この処理を省略するためにすでに処理済みの隣接するブロックの最大値などで代用してもよく、例えば、その値以上が存在する場合は、使用した最大値でクリップすることで、maxDの正規化を行ってもよい。或いは、量子化パラメータ(Qp)とmaxDとの対応関係を定めるテーブルを用いて、量子化パラメータ(Qp)からmaxDを求めてもよい。或いは、予め仕様で規定された固定値をmaxDとして用いてもよい。
また、式(1)において、Scale(Qp)は、量子化パラメータ(Qp)に応じて乗じられる係数である。Scale(Qp)は、Qpが大きい場合に1.0に近づき、小さい場合に0に近づくように設計され、その度合いはシステムによって調整するものとする。或いは、予め仕様で規定された固定値をScale(Qp)として用いてもよい。さらに、処理を簡略化するため、Scale(QP)を1.0などシステムに応じて設計された固定値としてもよい。
調整部109cは、推定予測精度Rijを出力する。また、このRijは、システムに応じて設計される感度関数によって調整された重み付けを出力しても良い。例えば、abs(Xij−Yij)/maxD×Scale(Qp)=Rijとし、Rij=Clip(rij,1.0,0.0)だけではなく、Rij=Clip(rij+offset,1.0,0.0)と例えばQPなどの制御情報に応じたオフセットをつけて感度を調整してもよい。なお、Clip(x,max,min)は、xがmaxを超える場合はmaxで、xがminを下回る場合はminでクリップする処理を示す。
このようにして算出された推定予測精度Rijは、0から1.0までの範囲内の値となる。基本的には、推定予測精度Rijは、参照画像間の画素ijの差分値の絶対値が大きい(すなわち、予測精度が低い)場合に0に近づき、参照画像間の画素ijの差分値の絶対値が小さい(すなわち、予測精度が高い)場合に1に近づく。予測精度評価部109は、ブロック内の各画素ijの推定予測精度Rijからなるマップ情報をブロック単位で予測画像補正部110に出力する。
なお、予測精度評価部109は、複数の参照画像を用いるインター予測を適用する場合にのみ評価(推定予測精度Rijの算出)を行い、それ以外のモード、例えば単方向予測や複数参照画像を用いないイントラ予測処理においては、評価を行わなくてもよい。
また、画像符号化装置1における予測精度評価部109について説明したが、画像復号装置2における予測精度評価部206は、画像符号化装置1における予測精度評価部109と同様に構成される。具体的には、画像復号装置2における予測精度評価部206は、差分算出部206aと、正規化部206bと、調整部206cとを備える。
(5.予測画像補正部)
図6は、画像符号化装置1における予測画像補正部110の構成の一例を示す図である。図6に示すように、予測画像補正部110は、連続性評価部110aと、フィルタ判定部110bと、フィルタ処理部110cとを備える。
連続性評価部110aは、インター予測部108から入力されるインター予測画像と、イントラ予測部107から入力される復号済み隣接ブロックとの連続性を評価する。復号済み隣接ブロックは、対象画像ブロックに隣接する復号済みブロックである。連続性評価部110aは、インター予測画像と復号済み隣接ブロックとの連続性の評価結果をフィルタ判定部110bに出力する。
図7は、連続性評価部110aの動作例を示す図である。図7の例では、符号化の対象画像ブロックの左側及び上側に復号済みブロックが存在しているものとする。連続性評価部110aは、インター予測画像(対象画像ブロック)と復号済みブロックとのブロック境界について画素単位で上から下(又は、下から上)の順に連続性を評価する。連続性評価部110aは、例えば、図7における画素p0及びq0に跨るブロック境界の連続性Contを下記の式(2)により算出する。
Cont=|p−2×p+p|+|q−2×q+q| ・・・(2)
なお、連続性を評価する際の単位や評価指標は、式(2)に示すものに限らず、システムで予め規定していれば他の単位や評価指標に変更可能である。例えば、連続性の評価の単位をブロック境界の辺単位(左側境界の連続性評価、上側境界の連続性評価で行う)としてもよいし、処理の簡略化のために連続性の評価指標として境界を跨ぐ画素値差分(abs(p0−q0))としてもよい。
フィルタ判定部110bは、予測精度評価部109から入力される予測精度評価結果と連続性評価部110aから入力される連続性評価結果とに基づいて、フィルタ処理を行うか否かを判定する。フィルタ判定部110bは、インター予測画像と復号済みブロックとのブロック境界の画素単位で判定を行ってもよいし、ブロック境界の辺単位で判定を行ってもよい。フィルタ判定部110bは、予測精度評価結果及び連続性評価結果に基づいて、フィルタの強度(例えば、フィルタのタップ数や周波数応答)を変更すると判定してもよい。なお、予測精度評価部109が画素単位で予測精度を評価する場合、フィルタ判定部110bは、インター予測画像の端部領域(フィルタ処理の対象領域)の各画素の推定予測精度Rの平均値を予測精度評価結果として用いてもよい。
フィルタ判定部110bは、予測精度評価部109により評価された予測精度が第1閾値α以下であって、且つ、連続性評価部110aにより評価された連続性が第2閾値β以下である場合には、フィルタ処理を行うと判定する。一方、予測精度評価部109により評価された予測精度が第1閾値αを超える、及び/又は、連続性評価部110aにより評価された連続性が第2閾値βを超える場合には、フィルタ判定部110bは、フィルタ処理を行わないと判定する。ここで、閾値α及びβとしては、システム固定の値を設定してもよいし、量子化パラメータ(Qp)を用いる関数により可変な値を算出及び設定してもよい。また、閾値αは、推定予測精度Rが正規化されていない場合には、対象画像ブロック内の推定予測精度の最大値を用いる関数により可変な値を算出及び設定してもよい。
フィルタ処理部110cは、フィルタ判定部110bにより、フィルタ処理を行うと判定された場合に、インター予測画像の端部領域に対してフィルタ処理を行う。図7に示すように、フィルタ処理部110cは、インター予測画像(符号化対象ブロック)の端部領域に含まれる予測画素q0、q1、q2およびイントラ予測部107より入力される隣接する復号済み参照画素p0、p1、p2を用いて下記の式(3)により補正し、補正後の予測画素q'0、q'1、q'2を出力する。
Figure 2021180495
ここで、clip(x,max,min)は、xがmaxを超える場合はmaxで、xがminを下回る場合はminでクリップする処理を示す。また、式(3)におけるtcは、クリッピングに用いる処理の調整オフセットであり、量子化パラメータ(Qp)を用いる関数により可変な値を算出及び設定可能である。
なお、画像符号化装置1における予測画像補正部110について説明したが、画像復号装置2における予測画像補正部207は、画像符号化装置1における予測画像補正部110と同様に構成される。具体的には、画像復号装置2における予測画像補正部207は、連続性評価部207aと、フィルタ判定部207bと、フィルタ処理部207cとを備える。
(6.予測画像補正動作)
図8は、予測画像補正動作の一例を示す図である。ここでは、画像符号化装置1における予測画像補正動作について説明するが、画像復号装置2においても同様な予測画像補正動作を行う。図8の動作フローは、インター予測画像と復号済みブロックとのブロック境界の画素単位で行われてもよい。
図8に示すように、ステップS1において、予測精度評価部109は、インター予測部108がインター予測画像の生成に用いる複数の参照画像間の類似度に基づいて、インター予測画像の端部領域における予測精度を評価する。
ステップS2において、連続性評価部110aは、インター予測部108が出力するインター予測画像と、インター予測画像に隣接する復号済み隣接ブロックとの連続性を評価する。
ステップS3において、フィルタ判定部110bは、予測精度評価部109により評価された予測精度を第1閾値αと比較し、連続性評価部110aにより評価された連続性を第2閾値βと比較する。
予測精度が第1閾値α以下であって、且つ連続性が第2閾値β以下である場合(ステップS3:YES)、フィルタ判定部110bは、フィルタ処理を行うと判定する。かかる場合、ステップS4において、フィルタ処理部110cは、復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。
一方、予測精度が第1閾値αを超える、及び/又は、連続性が第2閾値βを超える場合(ステップS3:NO)、フィルタ判定部110bは、フィルタ処理を行わないと判定する。かかる場合、フィルタ処理部110cは、フィルタ処理を行わない。
(7.実施形態のまとめ)
本実施形態に係る画像符号化装置1及び画像復号装置2は、インター予測の予測精度の評価結果に基づいてフィルタ処理を制御する。これにより、インター予測画像の端部領域の予測精度が高い場合には、この端部領域にフィルタ処理を適用しないよう制御できるため、フィルタ処理による予測画像の精度低下を防止できる。言い換えると、インター予測画像の端部領域の予測精度が低い場合にのみ、この端部領域にフィルタ処理を適用可能とすることができるため、フィルタ処理を適切に行うことができる。
また、本実施形態において、画像符号化装置1及び画像復号装置2で共通の動作によりフィルタ処理の適用有無を判定する。具体的には、インター予測の予測精度の評価を画像符号化装置1及び画像復号装置2のそれぞれで行い、かかる評価結果に基づいてフィルタ処理の適用有無を判定する。これにより、フィルタ処理の適用有無を示すフラグを画像符号化装置1から画像復号装置2に伝送する必要がないため、フラグによる符号量の増加を防止できる。
(8.実施形態の変更例1)
上述した実施形態に係る連続性評価及びフィルタ処理において、復号済み隣接ブロックに適用されたイントラ予測モード(イントラ予測方向)を考慮してもよい。これにより、連続性評価及びフィルタ処理の精度を向上させることができる。図9は、本変更例に係る予測画像補正部110の構成を示す図である。図9に示すように、連続性評価部110a及びフィルタ処理部110cには、イントラ予測部107から、復号済み隣接ブロックに適用されたイントラ予測モードが入力される。連続性評価部110aは、復号済み隣接ブロックに適用したイントラ予測モードに応じて連続性を評価する。また、フィルタ処理部110cは、復号済み隣接ブロックに適用したイントラ予測モードに応じてフィルタ処理を行う。
図10は、本変更例に係る連続性評価部110a及びフィルタ処理部110cの動作例を示す図である。図10に示すように、連続性評価部110a及びフィルタ処理部110cは、符号化対象ブロックに対応するインター予測画像の端部画素q0について連続性の評価及びフィルタ処理を行う際に、復号済み隣接ブロックに適用したイントラ予測モード(イントラ予測方向)に沿って、q0を通る直線上のp1、p0、q1、q2を加重平均により算出する。具体的には、復号済み隣接ブロック中の画素値を用いて、q0を通る直線上のp1、p0を算出し、インター予測画像中の画素値を用いて、q0を通る直線上のq1、q2を算出する。連続性評価部110aは、このようにして算出されたp1、p0、q1、q2を用いて、上記の式(2)により連続性Contを評価する。フィルタ処理部110cは、このようにして算出されたp1、p0、q1、q2を用いて、上記の式(3)によりq'0を算出する。
(9.実施形態の変更例2)
上述した実施形態において、予測画像補正部110が、インター予測画像に対する補正処理として、復号済み隣接ブロックを用いてインター予測画像の端部領域に対してフィルタ処理を行う一例について説明した。
さらに、補正処理は、かかるフィルタ処理に限定されるものではなく、インター予測画像及びイントラ予測画像の重み付け平均処理を補正処理として用いてもよい。
本変更例において、図1に示す画像符号化装置1のイントラ予測部107及び予測画像補正部110は、対象画像ブロックに隣接する復号済み隣接ブロックを用いてインター予測画像に対して補正処理を行う補正部を構成する。
イントラ予測部107は、復号済み隣接ブロックを用いて対象画像ブロックに対応するイントラ予測画像を生成する。例えば、イントラ予測部107は、予め定められたイントラ予測モードにより復号済み隣接ブロックからイントラ予測画像を生成する。予測画像補正部110は、補正処理として、インター予測部108から入力されたインター予測画像及びイントラ予測部107から入力されたイントラ予測画像の重み付け平均処理を行う。なお、送信側で複数のイントラ予測モード候補の中から1つの予測モードを選択し、イントラ予測画像を生成するように構成してもよい。その際には、送信側でいずれのイントラ予測モードを用いてイントラ予測画像をしたかを示すイントラ予測モードフラグをエントロピー符号化部103はエントロピー符号化する。
同様に、図2に示す画像復号装置2のイントラ予測部204及び予測画像補正部207は、対象画像ブロックに隣接する復号済み隣接ブロックを用いてインター予測画像に対して補正処理を行う補正部を構成する。イントラ予測部204は、復号済み隣接ブロックを用いて対象画像ブロックに対応するイントラ予測画像を生成する。
例えば、イントラ予測部204は、予め定められたイントラ予測モードにより復号済み隣接ブロックからイントラ予測画像を生成する。予測画像補正部207は、補正処理として、インター予測部205から入力されたインター予測画像及びイントラ予測部204から入力されたイントラ予測画像の重み付け平均処理を行う。なお、送信側から送られてきたイントラ予測モードフラグに基づいて、イントラ予測画像生成に用いるイントラ予測モードを決定するよう構成してもよい。
本変更例の構成を適用する場合には、上述した実施形態における「フィルタ処理」を「重み付け平均処理」と読み替えればよい。また、かかる重み付け平均処理を行うか否かの判定だけではなく、予測精度の評価結果や連続性の評価結果に基づいて、重み付け平均処理における重みを調整してもよい。
(10.その他の実施形態)
上述した実施形態において、複数の参照画像を用いる予測として双予測を主として説明した。しかしながら、複数の参照画像を用いる予測としてイントラブロックコピーと呼ばれる技術も適用することが可能である。イントラブロックコピーにおいては、現フレームと同じフレーム内の参照画像が現フレームの対象画像ブロックの予測に用いられる。
画像符号化装置1が行う各処理をコンピュータに実行させるプログラム及び画像復号装置2が行う各処理をコンピュータに実行させるプログラムにより提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMやDVD−ROM等の記録媒体であってもよい。また、画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)として構成してもよい。同様に、画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)として構成してもよい。
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
なお、日本国特許出願第2018−72451号(2018年4月4日出願)の全内容が、参照により、本願明細書に組み込まれている。

Claims (6)

  1. フレーム単位の画像を分割して得られた対象画像のブロックをインター予測により予測してインター予測ブロックを生成するインター予測部と、
    前記インター予測ブロックに対する補正処理を行う補正部と、を備える
    予測画像補正装置。
  2. 算出部をさらに備え、
    前記インター予測部は、複数の参照画像のブロックを用いて前記インター予測を行い、
    前記算出部は、前記複数の参照画像のブロック間の類似度を示す値を、前記ブロックの一部分であって複数の画素からなる画像部分ごとに算出し、
    前記補正部は、前記予測画像のブロックのうち、前記類似度を示す値が所定の閾値条件を満たす前記画像部分のみに対して補正処理を行う
    請求項1に記載の予測画像補正装置。
  3. 前記対象画像のブロックをイントラ予測により予測してイントラ予測ブロックを生成するイントラ予測部と、
    前記対象画像のブロックに隣接する復号済み隣接ブロックに対するイントラ予測処理を制御する予測モードに基づく評価を行う評価部と、をさらに備え、
    前記補正部は、前記インター予測ブロックと前記イントラ予測ブロックとの重み付け平均処理を前記補正処理として実行し、
    前記補正部は、前記評価の結果に応じて、前記重み付け平均処理における重みを調整する
    請求項1又は2に記載の予測画像補正装置。
  4. 請求項1乃至3のいずれか1項に記載の予測画像補正装置を備える
    画像符号化装置。
  5. 請求項1乃至3のいずれか1項に記載の予測画像補正装置を備える
    画像復号装置。
  6. コンピュータを請求項1乃至3のいずれか1項に記載の予測画像補正装置として機能させる
    プログラム。
JP2021112273A 2018-04-04 2021-07-06 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム Active JP7340569B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023116701A JP2023126531A (ja) 2018-04-04 2023-07-18 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018072451 2018-04-04
JP2018072451 2018-04-04
JP2021038767A JP6910575B2 (ja) 2018-04-04 2021-03-10 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021038767A Division JP6910575B2 (ja) 2018-04-04 2021-03-10 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023116701A Division JP2023126531A (ja) 2018-04-04 2023-07-18 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021180495A true JP2021180495A (ja) 2021-11-18
JP7340569B2 JP7340569B2 (ja) 2023-09-07

Family

ID=68100765

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2020512227A Active JP6895586B2 (ja) 2018-04-04 2019-03-29 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP2021038767A Active JP6910575B2 (ja) 2018-04-04 2021-03-10 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP2021112273A Active JP7340569B2 (ja) 2018-04-04 2021-07-06 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP2023116701A Pending JP2023126531A (ja) 2018-04-04 2023-07-18 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2020512227A Active JP6895586B2 (ja) 2018-04-04 2019-03-29 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP2021038767A Active JP6910575B2 (ja) 2018-04-04 2021-03-10 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023116701A Pending JP2023126531A (ja) 2018-04-04 2023-07-18 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Country Status (6)

Country Link
US (5) US11622127B2 (ja)
EP (1) EP3780600A4 (ja)
JP (4) JP6895586B2 (ja)
KR (2) KR102413038B1 (ja)
CN (2) CN116320402A (ja)
WO (1) WO2019194109A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6895586B2 (ja) 2018-04-04 2021-06-30 日本放送協会 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059785A (ja) * 1998-08-06 2000-02-25 Hitachi Ltd 予測復号装置
WO2008048489A2 (en) * 2006-10-18 2008-04-24 Thomson Licensing Method and apparatus for video coding using prediction data refinement
WO2010010942A1 (ja) * 2008-07-25 2010-01-28 ソニー株式会社 画像処理装置および方法
WO2010095558A1 (ja) * 2009-02-19 2010-08-26 ソニー株式会社 画像処理装置および方法
WO2011080807A1 (ja) * 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
US20130051467A1 (en) * 2011-08-31 2013-02-28 Apple Inc. Hybrid inter/intra prediction in video coding systems
US20170251213A1 (en) * 2016-02-25 2017-08-31 Mediatek Inc. Method and apparatus of video coding
JP6895586B2 (ja) * 2018-04-04 2021-06-30 日本放送協会 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA05007384A (es) * 2003-01-07 2005-09-12 Thomson Licensing Sa Intra/inter codificacion mezclada de video de divisiones de macrobloque.
MXPA06002210A (es) * 2003-08-26 2006-05-19 Thomson Licensing Metodo y aparato para la decodificacion de bloques intra-inter codificados hibridos.
US20050094003A1 (en) * 2003-11-05 2005-05-05 Per Thorell Methods of processing digital image and/or video data including luminance filtering based on chrominance data and related systems and computer program products
JP5488612B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 動画像符号化装置および動画像復号装置
US9681145B2 (en) * 2013-10-14 2017-06-13 Qualcomm Incorporated Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency
KR102445242B1 (ko) * 2014-03-19 2022-09-21 삼성전자주식회사 경계 필터링을 수반한 비디오 부호화 및 비디오 복호화 방법 및 장치
AU2014202921B2 (en) * 2014-05-29 2017-02-02 Canon Kabushiki Kaisha Method, apparatus and system for de-blocking a block of video samples
US10958927B2 (en) 2015-03-27 2021-03-23 Qualcomm Incorporated Motion information derivation mode determination in video coding
CN108028927A (zh) 2015-08-20 2018-05-11 日本放送协会 图像编码装置、图像解码装置、和其程序
US10666936B2 (en) * 2015-12-17 2020-05-26 Samsung Electronics Co., Ltd. Video decoding method and video decoding apparatus using merge candidate list
US10567793B2 (en) * 2016-06-06 2020-02-18 Google Llc Adaptive overlapped block prediction in variable block size video coding
JP6883403B2 (ja) 2016-10-26 2021-06-09 株式会社ジャパンディスプレイ 表示装置
US11750832B2 (en) * 2017-11-02 2023-09-05 Hfi Innovation Inc. Method and apparatus for video coding
CN107995489A (zh) * 2017-12-20 2018-05-04 北京大学深圳研究生院 一种用于p帧或b帧的帧内帧间组合预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059785A (ja) * 1998-08-06 2000-02-25 Hitachi Ltd 予測復号装置
WO2008048489A2 (en) * 2006-10-18 2008-04-24 Thomson Licensing Method and apparatus for video coding using prediction data refinement
WO2010010942A1 (ja) * 2008-07-25 2010-01-28 ソニー株式会社 画像処理装置および方法
WO2010095558A1 (ja) * 2009-02-19 2010-08-26 ソニー株式会社 画像処理装置および方法
WO2011080807A1 (ja) * 2009-12-28 2011-07-07 富士通株式会社 動画像符号化装置および動画像復号装置
US20130051467A1 (en) * 2011-08-31 2013-02-28 Apple Inc. Hybrid inter/intra prediction in video coding systems
US20170251213A1 (en) * 2016-02-25 2017-08-31 Mediatek Inc. Method and apparatus of video coding
JP6895586B2 (ja) * 2018-04-04 2021-06-30 日本放送協会 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP6910575B2 (ja) * 2018-04-04 2021-07-28 日本放送協会 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム

Also Published As

Publication number Publication date
US11622127B2 (en) 2023-04-04
KR20210157419A (ko) 2021-12-28
JP6910575B2 (ja) 2021-07-28
US20240073443A1 (en) 2024-02-29
CN112055965A (zh) 2020-12-08
US20220224936A1 (en) 2022-07-14
EP3780600A1 (en) 2021-02-17
US20240121428A1 (en) 2024-04-11
US20230199215A1 (en) 2023-06-22
EP3780600A4 (en) 2022-02-09
US20210021862A1 (en) 2021-01-21
JPWO2019194109A1 (ja) 2021-02-12
KR20200138760A (ko) 2020-12-10
KR102413038B1 (ko) 2022-06-23
JP7340569B2 (ja) 2023-09-07
JP6895586B2 (ja) 2021-06-30
JP2021100273A (ja) 2021-07-01
US11849141B2 (en) 2023-12-19
WO2019194109A1 (ja) 2019-10-10
JP2023126531A (ja) 2023-09-07
CN116320402A (zh) 2023-06-23
US11877003B2 (en) 2024-01-16

Similar Documents

Publication Publication Date Title
US10110905B2 (en) TSM rate-distortion optimizing method, encoding method and device using the same, and apparatus for processing picture
US20240121428A1 (en) Prediction image correcting device, image encoding device, image decoding device, and program
US20240040128A1 (en) Image encoding device, image decoding device and program
JP7059410B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP7080424B2 (ja) デブロッキングフィルタ制御装置及びプログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
WO2021045059A1 (ja) 符号化装置、復号装置、及びプログラム
WO2021040036A1 (ja) 符号化装置、復号装置、及びプログラム
WO2023217235A1 (en) Prediction refinement with convolution model
US9948956B2 (en) Method for encoding and decoding image block, encoder and decoder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230718

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230828

R150 Certificate of patent or registration of utility model

Ref document number: 7340569

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150