JP7340569B2 - Predicted image correction device, image encoding device, image decoding device, and program - Google Patents
Predicted image correction device, image encoding device, image decoding device, and program Download PDFInfo
- Publication number
- JP7340569B2 JP7340569B2 JP2021112273A JP2021112273A JP7340569B2 JP 7340569 B2 JP7340569 B2 JP 7340569B2 JP 2021112273 A JP2021112273 A JP 2021112273A JP 2021112273 A JP2021112273 A JP 2021112273A JP 7340569 B2 JP7340569 B2 JP 7340569B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- prediction
- predicted image
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/521—Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムに関する。 The present invention relates to a predictive image correction device, an image encoding device, an image decoding device, and a program.
映像符号化技術では、フレーム(ピクチャ)単位の現画像を分割して得られたブロック単位で変換や予測などを行うことにより効率的な符号化(圧縮)を実現している。予測としてはイントラ予測及びインター予測の2種類の方法がある。 In video encoding technology, efficient encoding (compression) is achieved by dividing a current image in units of frames (pictures) and performing conversion, prediction, etc. in units of blocks obtained. There are two types of prediction methods: intra prediction and inter prediction.
イントラ予測は、符号化対象又は復号対象のブロック(以下、「対象画像ブロック」という)に隣接する復号済み隣接ブロックを参照して予測画像を生成する方法である。インター予測は、対象画像ブロックが属する現フレームとは異なる復号済みフレームを参照して予測画像を生成する方法である。 Intra prediction is a method of generating a predicted image by referring to decoded adjacent blocks adjacent to a block to be encoded or decoded (hereinafter referred to as "target image block"). Inter prediction is a method of generating a predicted image by referring to a decoded frame different from the current frame to which the target image block belongs.
特許文献1には、対象画像ブロックをインター予測により予測してインター予測画像を生成するとともに、対象画像ブロックをイントラ予測により予測してイントラ予測画像を生成し、インター予測画像及びイントラ予測画像を重み付け平均する予測画像補正装置が記載されている。
具体的には、特許文献1に記載の予測画像補正装置は、対象画像ブロックに対応するインター予測画像と、対象画像ブロックに隣接する復号済み隣接ブロックとの連続性を評価し、不連続であると評価した場合には、復号済み隣接ブロックを用いてインター予測画像の端部領域をフィルタ処理により補正する。
Specifically, the predicted image correction device described in
特許文献1に記載の予測画像補正装置は、インター予測の予測精度にかかわらず、インター予測画像と復号済み隣接ブロックとの連続性の評価に応じてフィルタ処理を適用する。
The predicted image correction device described in
このため、インター予測画像と復号済み隣接ブロックとの境界にオブジェクト境界があるような場合、インター予測画像の端部領域の予測精度が高い場合であっても、この端部領域にフィルタ処理を適用してしまうため、フィルタ処理により予測画像の精度が低下し得るという問題がある。 Therefore, if there is an object boundary between the inter-predicted image and the decoded adjacent block, filter processing is applied to the edge area even if the prediction accuracy of the edge area of the inter-predicted image is high. Therefore, there is a problem that the accuracy of the predicted image may decrease due to the filtering process.
そこで、本発明は、予測画像を適切に補正可能な予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。 Therefore, an object of the present invention is to provide a predicted image correction device, an image encoding device, an image decoding device, and a program that can appropriately correct a predicted image.
本発明に係る予測画像補正装置は、フレーム単位の画像を分割して得られた対象画像ブロックをインター予測により予測し、前記対象画像ブロックに対応するインター予測ブロックを生成するインター予測部と、前記対象画像ブロックをイントラ予測により予測し、前記対象画像ブロックに対応するイントラ予測ブロックを生成するイントラ予測部と、前記インター予測ブロックと前記イントラ予測ブロックとの重み付け平均処理を補正処理として実行する予測画像補正部と、を備え、前記予測画像補正部は、前記対象画像ブロックに隣接する復号済み隣接ブロックに対するイントラ予測処理を制御する予測モードに応じて、前記重み付け平均処理における重みを調整することを要旨とする。また、第1の特徴に係る予測画像補正装置は、フレーム単位の現画像を分割して得られた対象画像ブロックを複数の参照画像を用いて予測することにより、前記対象画像ブロックに対応する予測画像を生成する予測部と、前記予測画像の生成に用いる前記複数の参照画像間の類似度に基づいて、前記予測画像の予測精度を評価する予測精度評価部と、前記対象画像ブロックに隣接する復号済み隣接ブロックを用いて前記予測画像に対して補正処理を行う補正部と、を備え、前記補正部は、少なくとも前記予測精度評価部による評価結果に基づいて前記補正処理を制御することを要旨とする。 The predicted image correction device according to the present invention includes an inter prediction unit that predicts a target image block obtained by dividing an image in units of frames by inter prediction, and generates an inter prediction block corresponding to the target image block; an intra prediction unit that predicts a target image block by intra prediction and generates an intra prediction block corresponding to the target image block; and a predicted image that performs a weighted average process of the inter prediction block and the intra prediction block as a correction process. a correction unit, and the predicted image correction unit adjusts the weight in the weighted average processing according to a prediction mode that controls intra prediction processing for a decoded adjacent block adjacent to the target image block. shall be. Further, the predicted image correction device according to the first feature predicts the target image block obtained by dividing the current image in units of frames using a plurality of reference images, thereby predicting the target image block corresponding to the target image block. a prediction unit that generates an image; a prediction accuracy evaluation unit that evaluates the prediction accuracy of the predicted image based on the similarity between the plurality of reference images used to generate the predicted image; and a prediction accuracy evaluation unit that is adjacent to the target image block. a correction unit that performs correction processing on the predicted image using decoded adjacent blocks, and the correction unit controls the correction processing based on at least an evaluation result by the prediction accuracy evaluation unit. shall be.
なお、複数の参照画像を用いて行う予測とはインター予測における双予測が代表的なものであるがそれに限定されるものではなく、例えば、HEVC符号化方式で用いられている画像のIntraBCモード(イントラブロックコピーモード)などのように複数参照して予測画像を生成する場合においても同様の手法が適用可能である。 Note that prediction performed using a plurality of reference images is typically bi-prediction in inter prediction, but is not limited to this; for example, prediction performed using intraBC mode ( A similar method can be applied even when a predicted image is generated by making multiple references, such as in intra block copy mode).
第2の特徴に係る画像符号化装置は、第1の特徴に係る予測画像補正装置を備えることを要旨とする。 The gist of the image encoding device according to the second feature is that it includes the predicted image correction device according to the first feature.
第3の特徴に係る画像復号装置は、第1の特徴に係る予測画像補正装置を備えることを要旨とする。 The gist of the image decoding device according to the third feature is that it includes the predictive image correction device according to the first feature.
第4の特徴に係るプログラムは、コンピュータを第1の特徴に係る予測画像補正装置として機能させることを要旨とする。 The gist of the program according to the fourth feature is to cause a computer to function as the predicted image correction device according to the first feature.
本発明によれば、予測画像を適切に補正可能な予測画像補正装置、画像符号化装置、画像復号装置、及びプログラムを提供できる。 According to the present invention, it is possible to provide a predicted image correction device, an image encoding device, an image decoding device, and a program that can appropriately correct a predicted image.
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号を行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 An image encoding device and an image decoding device according to embodiments will be described with reference to the drawings. The image encoding device and the image decoding device according to the embodiment encode and decode moving images represented by MPEG. In the description of the drawings below, the same or similar parts are designated by the same or similar symbols.
(1.画像符号化装置の構成)
図1は、本実施形態に係る画像符号化装置1の構成を示す図である。図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部101と、変換部102aと、量子化部102bと、エントロピー符号化部103と、逆量子化部104aと、逆変換部104bと、合成部105と、メモリ106と、イントラ予測部107と、インター予測部108と、予測精度評価部109と、予測画像補正部(補正部)110とを備える。本実施形態において、イントラ予測部107、インター予測部108、予測精度評価部109、及び予測画像補正部110は、予測画像補正装置を構成する。
(1. Configuration of image encoding device)
FIG. 1 is a diagram showing the configuration of an
ブロック分割部100は、フレーム(或いはピクチャ)単位の入力画像をブロック状の小領域に分割し、画像ブロックを減算部101(及びインター予測部108)に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックは、画像符号化装置1が符号化を行う単位及び画像復号装置2が復号を行う単位であり、かかる画像ブロックを対象画像ブロックと称する。なお、画像ブロックの形状は正方形に限定されるものではなく、長方形の形状であってもよい。
The block dividing
減算部101は、ブロック分割部100から入力された対象画像ブロックと対象画像ブロックに対応する予測画像(予測画像ブロック)との間の画素単位での差分を示す予測残差を算出する。具体的には、減算部101は、符号化対象ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換部102aに出力する。本実施形態において、予測画像は、後述する予測画像補正部110により補正されたものであって、予測画像補正部110から減算部101に入力される。
The
変換部102a及び量子化部102bは、ブロック単位で直交変換処理及び量子化処理を行う変換・量子化部102を構成する。
The
変換部102aは、減算部101から入力された予測残差に対して直交変換を行って変換係数を算出し、算出した変換係数を量子化部102bに出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: KarhunenLoeve Transform)等をいう。
The
量子化部102bは、変換部102aから入力された変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化変換係数を生成する。量子化パラメータ(Qp)は、ブロック内の各変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各変換係数を量子化する際の量子化値を要素として有する行列である。量子化部102bは、量子化制御情報、生成した量子化変換係数情報などをエントロピー符号化部103及び逆量子化部104aに出力する。
The
エントロピー符号化部103は、量子化部102bから入力された量子化変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部103には、イントラ予測部107及びインター予測部108から予測に関する情報が入力される。エントロピー符号化部103は、これらの情報のエントロピー符号化も行う。
The
逆量子化部104a及び逆変換部104bは、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部104を構成する。
The
逆量子化部104aは、量子化部102bが行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部104aは、量子化部102bから入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部104bに出力する。
The
逆変換部104bは、変換部102aが行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部102aが離散コサイン変換を行った場合には、逆変換部104bは逆離散コサイン変換を行う。逆変換部104bは、逆量子化部104aから入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部105に出力する。
The inverse transform unit 104b performs an inverse orthogonal transform process corresponding to the orthogonal transform process performed by the
合成部105は、逆変換部104bから入力された復元予測残差を予測画像補正部110から入力された予測画像と画素単位で合成する。合成部105は、復元予測残差の各画素値と予測画像の各画素値を加算して対象画像ブロックを再構成(復号)し、再構成した対象画像ブロックである再構成画像ブロックをメモリ106に出力する。なお、かかる再構成画像ブロックは、復号済みブロックと称されることがある。
The combining
メモリ106は、合成部105から入力された再構成画像ブロックを記憶する。メモリ106は、再構成画像ブロックをフレーム単位で記憶する。
The
イントラ予測部107は、メモリ106に記憶された再構成画像ブロック(復号済みブロック)のうち、対象画像ブロックに隣接する復号済み隣接ブロックを参照してイントラ予測画像を生成する。イントラ予測部107は、最適なイントラ予測モードを選択し、選択したイントラ予測モードを用いてイントラ予測を行う。複数のイントラ予測方向に対応する複数のイントラ予測モードが予め規定されている。イントラ予測方向とは、対象画像ブロックに隣接する隣接画素を参照して対象画像ブロック中の対象画素を予測する際に、対象画素を基準とした隣接参照画素の方向をいう。すなわち、イントラ予測モード(イントラ予測方向)により、対象画像ブロック中の各画素の予測に用いるべき隣接参照画素が定められる。イントラ予測部107は、イントラ予測画像(及び/又は隣接参照画素)を予測画像補正部110に出力するとともに、選択したイントラ予測モードの情報をエントロピー符号化部103に出力する。
The
インター予測部108は、メモリ106に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて対象画像ブロックを予測するインター予測を行う。具体的には、インター予測部108は、ブロックマッチングなどの手法により動きベクトルを算出し、動きベクトルに基づいてインター予測画像を生成する。インター予測部108は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。本実施形態において、インター予測部108が双予測を用いる場合を主として説明し、インター予測部108は複数の参照画像を用いて予測を行う予測部に相当する。インター予測部108は、生成したインター予測画像を予測画像補正部110に出力するとともに、選択したインター予測方法及び動きベクトルに関する情報をエントロピー符号化部103に出力する。また、インター予測部108は、インター予測に用いる複数の参照画像を予測精度評価部109に出力する。
The
予測精度評価部109は、インター予測画像の生成に用いる複数の参照画像間の類似度に基づいて、インター予測画像の端部領域における予測精度を評価する。具体的には、インター予測部108が複数の参照画像を用いてインター予測を行う場合において、インター予測に用いる複数の参照画像間の類似度を1又は複数の画素からなる画像部分ごとに算出し、かかる類似度によりインター予測画像の予測精度を画像部分ごとに評価し、評価結果の情報を予測画像補正部110に出力する。本実施形態において、予測精度評価部109が、予測に用いる複数の参照画像間の類似度を1画素単位で算出し、インター予測画像の予測精度を1画素単位で評価する一例を主として説明する。予測精度評価部109の詳細については後述する。
The prediction
予測画像補正部110は、インター予測部108から入力されるインター予測画像とイントラ予測部107から入力されるイントラ予測画像とを重み付け平均することで補正する。具体的には、予測画像補正部110は、イントラ予測画像に対応する復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。また、予測画像補正部110は、予測精度評価部109による評価結果に少なくとも基づいてフィルタ処理を制御する。「フィルタ処理を制御する」とは、フィルタ処理を行うか否かの制御やフィルタ強度の制御を含む。本実施形態において、予測画像補正部110が、予測精度評価部109による評価結果に少なくとも基づいてフィルタ処理を行うか否かを制御する一例を主として説明する。例えば、予測画像補正部110は、予測精度評価部109により評価された予測精度が第1閾値以下である場合にはフィルタ処理を行い、予測精度評価部109により評価された予測精度が第1閾値を超える場合にはフィルタ処理を行わない。予測画像補正部110は、フィルタ処理を行う場合にはフィルタ処理後のインター予測画像を予測画像として減算部101及び合成部105に出力し、フィルタ処理を行わない場合にはインター予測画像をそのまま予測画像として減算部101及び合成部105に出力する。なお、「予測精度」を「予測の当たらなさ」で表してもよい。「予測の当たらなさ」について、例えば、予測精度が第1閾値以下であることは、予測の当たらなさが高いことを意味してもよい。予測精度が第1閾値を超えることは、予測の当たらなさが低いことを意味してもよい。予測画像補正部110の詳細については後述する。
The predicted
(2.画像復号装置の構成)
図2は、本実施形態に係る画像復号装置2の構成を示す図である。図2に示すように、画像復号装置2は、エントロピー復号部200と、逆量子化部201aと、逆変換部201bと、合成部202と、メモリ203と、イントラ予測部204と、インター予測部205と、予測精度評価部206と、予測画像補正部207とを備える。本実施形態において、イントラ予測部204、インター予測部205、予測精度評価部206、及び予測画像補正部207は、予測画像補正装置を構成する。
(2. Configuration of image decoding device)
FIG. 2 is a diagram showing the configuration of the
エントロピー復号部200は、符号化装置1により生成された符号化データを復号し、量子化変換係数を逆量子化部201aに出力する。また、エントロピー復号部200は、符号化データを復号し、予測(イントラ予測及びインター予測)に関する情報を取得し、予測に関する情報をイントラ予測部204及びインター予測部205に出力する。
逆量子化部201a及び逆変換部201bは、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部201を構成する。
The
逆量子化部201aは、画像符号化装置1の量子化部102bが行う量子化処理に対応する逆量子化処理を行う。逆量子化部201aは、エントロピー復号部200から入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部201bに出力する。
The
逆変換部201bは、画像符号化装置1の変換部102aが行う直交変換処理に対応する逆直交変換処理を行う。逆変換部201bは、逆量子化部201aから入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部202に出力する。
The
合成部202は、逆変換部201bから入力された予測残差と、予測画像補正部207から入力された予測画像とを画素単位で合成することにより、元の対象画像ブロックを再構成(復号)し、再構成画像ブロックをメモリ203に出力する。
The
メモリ203は、合成部202から入力された再構成画像ブロックを記憶する。メモリ203は、再構成画像ブロックをフレーム単位で記憶する。メモリ203は、フレーム単位の再構成画像(復号画像)を表示順に画像復号装置2の外部に出力する。
The
イントラ予測部204は、メモリ203に記憶された再構成画像ブロックを参照し、エントロピー復号部200から入力されたイントラ予測情報(イントラ予測モード)に従ってイントラ予測を行うことによりイントラ予測画像を生成する。具体的には、イントラ予測部204は、メモリ203に記憶された再構成画像ブロック(復号済みブロック)のうち、イントラ予測モードに応じて定められる隣接参照画素を参照してイントラ予測画像を生成する。イントラ予測部204は、イントラ予測画像(及び/又は隣接参照画素)を予測画像補正部207に出力する。
The
インター予測部205は、メモリ106に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて対象画像ブロックを予測するインター予測を行う。インター予測部205は、エントロピー復号部200から入力されたインター予測情報(動きベクトル情報等)に従ってインター予測を行うことによりインター予測画像を生成し、インター予測画像を予測画像補正部207に出力する。また、インター予測部205は、インター予測に用いる複数の参照画像を予測精度評価部206に出力する。
The
予測精度評価部206は、画像符号化装置1の予測精度評価部109と同様な動作を行う。予測精度評価部206は、インター予測部205が複数の参照画像を用いてインター予測を行う場合において、複数の参照画像間の類似度を画素単位で算出することにより、予測画像の予測精度を画素単位で評価し、評価結果の情報を予測画像補正部207に出力する。
The prediction
予測画像補正部207は、画像符号化装置1の予測画像補正部110と同様な動作を行う。予測画像補正部207は、イントラ予測画像に対応する復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。予測画像補正部207は、予測精度評価部206により評価された予測精度が第1閾値以下である場合にはフィルタ処理を行い、予測精度評価部206により評価された予測精度が第1閾値を超える場合にはフィルタ処理を行わない。予測画像補正部207は、フィルタ処理を行う場合にはフィルタ処理後のインター予測画像を予測画像として合成部202に出力し、フィルタ処理を行わない場合にはインター予測画像をそのまま予測画像として合成部202に出力する。予測画像補正部207の詳細については後述する。
The predicted
(3.インター予測)
図3は、インター予測の一例を示す図である。図4は、インター予測により生成される予測画像の一例を示す図である。インター予測のシンプルな例として、HEVCで用いられている双予測、特に前方向及び後方向予測(両方向予測)を用いる場合について説明する。
(3. Inter prediction)
FIG. 3 is a diagram illustrating an example of inter prediction. FIG. 4 is a diagram illustrating an example of a predicted image generated by inter prediction. As a simple example of inter prediction, a case will be described in which bi-prediction used in HEVC, particularly forward and backward prediction (bidirectional prediction) is used.
図3に示すように、双予測は、対象フレーム(現フレーム)に対して時間的に前及び後のフレームを参照する。図3の例では、tフレーム目の画像中のブロックの予測を、t-1フレーム目とt+1フレーム目とを参照して行う。動き検出では、t-1及びt+1フレーム目の参照フレーム内から、対象画像ブロックと類似する箇所(ブロック)をシステムで設定された探索範囲の中から検出する。 As shown in FIG. 3, bi-prediction refers to frames temporally before and after the target frame (current frame). In the example of FIG. 3, prediction of a block in the t-th frame image is performed with reference to the t-1-th frame and the t+1-th frame. In motion detection, locations (blocks) similar to the target image block are detected from within the t-1 and t+1-th reference frames within a search range set by the system.
検出された箇所が参照画像である。対象画像ブロックに対する参照画像の相対位置を示す情報が図中に示す矢印であり、動きベクトルと呼ばれる。動きベクトルの情報は、画像符号化装置1において、参照画像のフレーム情報とともにエントロピー符号化によって符号化される。一方、画像復号装置2は、画像符号化装置1により生成された動きベクトルの情報に基づいて参照画像を検出する。
The detected location is the reference image. Information indicating the relative position of the reference image with respect to the target image block is indicated by an arrow in the figure, and is called a motion vector. The motion vector information is encoded by entropy encoding together with the frame information of the reference image in the
図3及び図4に示すように、動き検出によって検出された参照画像1及び2は、対象画像ブロックに対し、参照するフレーム内で位置合わせされた類似する部分画像であるため、対象画像ブロック(符号化対象画像)に類似した画像となる。図4の例では、対象画像ブロックは、星の絵柄と部分的な円の絵柄とを含んでいる。参照画像1は、星の絵柄と全体的な円の絵柄とを含んでいる。参照画像2は、星の絵柄を含むが、円の絵柄を含んでいない。
As shown in FIGS. 3 and 4,
かかる参照画像1及び2から予測画像を生成する。なお、予測処理は、一般的に、特徴は異なるが部分的に類似する参照画像1及び2を平均化することによって、それぞれの参照画像の特徴を備えた予測画像を生成する。但し、より高度な処理、例えば、ローパスフィルタやハイパスフィルタ等による信号強調処理を併用して予測画像を生成してもよい。ここで、参照画像1は円の絵柄を含み、参照画像2は円の絵柄を含まないため、参照画像1及び2を平均化して予測画像を生成すると、予測画像における円の絵柄は、参照画像1に比べて信号が半減する。
A predicted image is generated from these
参照画像1及び2から得られた予測画像と対象画像ブロック(符号化対象画像)との差分が予測残差である。図4に示す予測残差において、星の絵柄のエッジのずれ部分と丸の絵柄のずれた部分(斜線部)とにのみ大きな差分が生じているが、それ以外の部分については、精度よく予測が行えており、差分が少なくなる(図4の例では差分が生じていない)。
The difference between the predicted images obtained from
差分が生じていない部分(星の絵柄の非エッジ部分及び背景部分)は、参照画像1と参照画像2との間の類似度が高い部分であって、高精度な予測が行われた部分である。一方、大きな差分が生じている部分は、各参照画像に特有な部分、すなわち、参照画像1と参照画像2との間の類似度が著しく低い部分である。よって、参照画像1と参照画像2との間の類似度が著しく低い部分は、予測の精度が低く、大きな差分(残差)を生じさせることが分かる。
The areas where no difference occurs (non-edge areas of the star pattern and background areas) are areas where the similarity between
このように差分が大きい部分と差分が無い部分とが混在した予測残差を直交変換し、量子化による変換係数の劣化が生じると、かかる変換係数の劣化が逆量子化及び逆直交変換を経て画像(ブロック)内に全体的に伝搬する。そして、逆量子化及び逆直交変換によって復元された予測残差(復元予測残差)を予測画像に合成して対象画像ブロックを再構成すると、図4に示す星の絵柄の非エッジ部分及び背景部分のように高精度な予測が行われた部分にも画質の劣化が伝搬してしまう。 In this way, when the prediction residuals containing a mixture of parts with large differences and parts with no differences are orthogonally transformed and deterioration of the transform coefficients occurs due to quantization, the deterioration of the transform coefficients is caused by inverse quantization and inverse orthogonal transform. Propagates entirely within the image (block). Then, when the target image block is reconstructed by combining the prediction residual restored by inverse quantization and inverse orthogonal transformation (restored prediction residual) with the prediction image, the non-edge part of the star pattern and the background shown in FIG. The deterioration in image quality also propagates to the parts for which highly accurate predictions have been made.
(4.予測精度評価部)
図5は、画像符号化装置1における予測精度評価部109の構成の一例を示す図である。予測精度評価部109は、インター予測に用いる複数の参照画像間の類似度を画素単位で算出することにより、予測画像の予測精度を画素単位で評価する。ここでは、予測精度評価部109が予測画像の全画素について予測精度を評価する一例を説明するが、予測精度評価部109は、必ずしも予測画像の全画素について予測精度を評価しなくてもよい。予測精度評価部109は、少なくとも予測画像の端部領域における画素について予測精度を評価すればよい。
(4. Prediction accuracy evaluation department)
FIG. 5 is a diagram showing an example of the configuration of the prediction
図5に示すように、予測精度評価部109は、差分算出部(減算部)109aと、正規化部109bと、調整部109cとを備える。
As shown in FIG. 5, the prediction
差分算出部109aは、参照画像1と参照画像2との間の差分値の絶対値を画素単位で算出し、算出した差分値の絶対値を正規化部109bに出力する。差分値の絶対値は、類似度を示す値の一例である。差分値の絶対値が小さいほど類似度が高く、差分値の絶対値が大きいほど類似度が低いといえる。差分算出部109aは、各参照画像に対してフィルタ処理を行ったうえで差分値の絶対値を算出してもよい。差分算出部109aは、二乗誤差等の統計量を算出し、かかる統計量を類似度として用いてもよい。
The
正規化部109bは、差分算出部109aから入力された各画素の差分値を、ブロック内で差分値の絶対値が最大となる画素の差分値の絶対値(すなわち、ブロック内の差分値の絶対値の最大値)で正規化し、正規化した差分値の絶対値である正規化差分値を調整部109cに出力する。本実施形態において、正規化差分値は、合成部105において予測画像と合成する復元予測残差を画素単位で重み付けするための重みとして用いられる。
The
調整部109cは、量子化の粗さを定める量子化パラメータ(Qp)に基づいて、正規化部109bから入力された正規化差分値(重み)を調整し、この重みを出力する。量子化の粗さが大きいほど復元予測残差の劣化度が高いため、調整部109cは、量子化パラメータ(Qp)に基づいて正規化差分値(重み)を調整することにより、劣化度を考慮して復元予測残差の重み付けを行うことができる。
The
予測精度評価部109が出力する各画素(ij)の推定予測精度Rijは、例えば下記の式(1)のように表現することができる。
The estimated prediction accuracy Rij of each pixel (ij) output by the prediction
Rij = 1 - (abs(Xij-Yij)/maxD × Scale(Qp)) ・・・(1) Rij = 1 - (abs(Xij-Yij)/maxD x Scale(Qp))...(1)
式(1)において、Xijは参照画像1の画素ijの画素値であり、Yijは参照画像2の画素ijの画素値であり、absは絶対値を得る関数である。
In equation (1), Xij is the pixel value of pixel ij of
また、式(1)において、maxDは、ブロック内の差分値abs(Xij-Yij)の最大値である。maxDを求めるために、ブロック内のすべての画素について差分値を求める必要があるが、この処理を省略するためにすでに処理済みの隣接するブロックの最大値などで代用してもよく、例えば、その値以上が存在する場合は、使用した最大値でクリップすることで、maxDの正規化を行ってもよい。或いは、量子化パラメータ(Qp)とmaxDとの対応関係を定めるテーブルを用いて、量子化パラメータ(Qp)からmaxDを求めてもよい。或いは、予め仕様で規定された固定値をmaxDとして用いてもよい。 Furthermore, in equation (1), maxD is the maximum value of the difference value abs(Xij−Yij) within the block. In order to calculate maxD, it is necessary to calculate the difference values for all pixels in the block, but in order to omit this process, the maximum value of adjacent blocks that have already been processed may be used instead. If there is a value greater than the value, maxD may be normalized by clipping at the maximum value used. Alternatively, maxD may be determined from the quantization parameter (Qp) using a table that defines the correspondence between the quantization parameter (Qp) and maxD. Alternatively, a fixed value predefined in the specifications may be used as maxD.
また、式(1)において、Scale(Qp)は、量子化パラメータ(Qp)に応じて乗じられる係数である。Scale(Qp)は、Qpが大きい場合に1.0に近づき、小さい場合に0に近づくように設計され、その度合いはシステムによって調整するものとする。或いは、予め仕様で規定された固定値をScale(Qp)として用いてもよい。さらに、処理を簡略化するため、Scale(QP)を1.0などシステムに応じて設計された固定値としてもよい。 Furthermore, in equation (1), Scale (Qp) is a coefficient multiplied according to the quantization parameter (Qp). Scale (Qp) is designed so that it approaches 1.0 when Qp is large and approaches 0 when it is small, and its degree is adjusted by the system. Alternatively, a fixed value predefined in the specifications may be used as Scale (Qp). Furthermore, in order to simplify the processing, Scale (QP) may be set to a fixed value such as 1.0 designed according to the system.
調整部109cは、推定予測精度Rijを出力する。また、このRijは、システムに応じて設計される感度関数によって調整された重み付けを出力しても良い。例えば、abs(Xij-Yij)/maxD×Scale(Qp)=Rijとし、Rij=Clip(rij,1.0,0.0)だけではなく、Rij=Clip(rij+offset,1.0,0.0)と例えばQPなどの制御情報に応じたオフセットをつけて感度を調整してもよい。なお、Clip(x,max,min)は、xがmaxを超える場合はmaxで、xがminを下回る場合はminでクリップする処理を示す。
The
このようにして算出された推定予測精度Rijは、0から1.0までの範囲内の値となる。基本的には、推定予測精度Rijは、参照画像間の画素ijの差分値の絶対値が大きい(すなわち、予測精度が低い)場合に0に近づき、参照画像間の画素ijの差分値の絶対値が小さい(すなわち、予測精度が高い)場合に1に近づく。予測精度評価部109は、ブロック内の各画素ijの推定予測精度Rijからなるマップ情報をブロック単位で予測画像補正部110に出力する。
The estimated prediction accuracy Rij calculated in this way has a value within the range of 0 to 1.0. Basically, estimated prediction accuracy Rij approaches 0 when the absolute value of the difference value of pixel ij between reference images is large (that is, the prediction accuracy is low), and when the absolute value of the difference value of pixel ij between reference images It approaches 1 when the value is small (that is, the prediction accuracy is high). The prediction
なお、予測精度評価部109は、複数の参照画像を用いるインター予測を適用する場合にのみ評価(推定予測精度Rijの算出)を行い、それ以外のモード、例えば単方向予測や複数参照画像を用いないイントラ予測処理においては、評価を行わなくてもよい。
Note that the prediction
また、画像符号化装置1における予測精度評価部109について説明したが、画像復号装置2における予測精度評価部206は、画像符号化装置1における予測精度評価部109と同様に構成される。具体的には、画像復号装置2における予測精度評価部206は、差分算出部206aと、正規化部206bと、調整部206cとを備える。
Furthermore, although the prediction
(5.予測画像補正部)
図6は、画像符号化装置1における予測画像補正部110の構成の一例を示す図である。図6に示すように、予測画像補正部110は、連続性評価部110aと、フィルタ判定部110bと、フィルタ処理部110cとを備える。
(5. Predicted image correction unit)
FIG. 6 is a diagram showing an example of the configuration of the predicted
連続性評価部110aは、インター予測部108から入力されるインター予測画像と、イントラ予測部107から入力される復号済み隣接ブロックとの連続性を評価する。復号済み隣接ブロックは、対象画像ブロックに隣接する復号済みブロックである。連続性評価部110aは、インター予測画像と復号済み隣接ブロックとの連続性の評価結果をフィルタ判定部110bに出力する。
The
図7は、連続性評価部110aの動作例を示す図である。図7の例では、符号化の対象画像ブロックの左側及び上側に復号済みブロックが存在しているものとする。連続性評価部110aは、インター予測画像(対象画像ブロック)と復号済みブロックとのブロック境界について画素単位で上から下(又は、下から上)の順に連続性を評価する。連続性評価部110aは、例えば、図7における画素p0及びq0に跨るブロック境界の連続性Contを下記の式(2)により算出する。
FIG. 7 is a diagram showing an example of the operation of the
Cont=|p2-2×p1+p0|+|q2-2×q1+q0| ・・・(2) Cont=|p 2 -2×p 1 +p 0 |+|q 2 -2×q 1 +q 0 | ...(2)
なお、連続性を評価する際の単位や評価指標は、式(2)に示すものに限らず、システムで予め規定していれば他の単位や評価指標に変更可能である。例えば、連続性の評価の単位をブロック境界の辺単位(左側境界の連続性評価、上側境界の連続性評価で行う)としてもよいし、処理の簡略化のために連続性の評価指標として境界を跨ぐ画素値差分(abs(p0-q0))としてもよい。 Note that the units and evaluation indexes for evaluating continuity are not limited to those shown in equation (2), and can be changed to other units and evaluation indexes as long as they are predefined in the system. For example, the unit of continuity evaluation may be the edge unit of the block boundary (continuity evaluation of the left boundary, continuity evaluation of the upper boundary), or the continuity evaluation index may be The pixel value difference (abs(p0-q0)) that straddles may be used.
フィルタ判定部110bは、予測精度評価部109から入力される予測精度評価結果と連続性評価部110aから入力される連続性評価結果とに基づいて、フィルタ処理を行うか否かを判定する。フィルタ判定部110bは、インター予測画像と復号済みブロックとのブロック境界の画素単位で判定を行ってもよいし、ブロック境界の辺単位で判定を行ってもよい。フィルタ判定部110bは、予測精度評価結果及び連続性評価結果に基づいて、フィルタの強度(例えば、フィルタのタップ数や周波数応答)を変更すると判定してもよい。なお、予測精度評価部109が画素単位で予測精度を評価する場合、フィルタ判定部110bは、インター予測画像の端部領域(フィルタ処理の対象領域)の各画素の推定予測精度Rの平均値を予測精度評価結果として用いてもよい。
The
フィルタ判定部110bは、予測精度評価部109により評価された予測精度が第1閾値α以下であって、且つ、連続性評価部110aにより評価された連続性が第2閾値β以下である場合には、フィルタ処理を行うと判定する。一方、予測精度評価部109により評価された予測精度が第1閾値αを超える、及び/又は、連続性評価部110aにより評価された連続性が第2閾値βを超える場合には、フィルタ判定部110bは、フィルタ処理を行わないと判定する。ここで、閾値α及びβとしては、システム固定の値を設定してもよいし、量子化パラメータ(Qp)を用いる関数により可変な値を算出及び設定してもよい。また、閾値αは、推定予測精度Rが正規化されていない場合には、対象画像ブロック内の推定予測精度の最大値を用いる関数により可変な値を算出及び設定してもよい。
The
フィルタ処理部110cは、フィルタ判定部110bにより、フィルタ処理を行うと判定された場合に、インター予測画像の端部領域に対してフィルタ処理を行う。図7に示すように、フィルタ処理部110cは、インター予測画像(符号化対象ブロック)の端部領域に含まれる予測画素q0、q1、q2およびイントラ予測部107より入力される隣接する復号済み参照画素p0、p1、p2を用いて下記の式(3)により補正し、補正後の予測画素q'0、q'1、q'2を出力する。
The
ここで、clip(x,max,min)は、xがmaxを超える場合はmaxで、xがminを下回る場合はminでクリップする処理を示す。また、式(3)におけるtcは、クリッピングに用いる処理の調整オフセットであり、量子化パラメータ(Qp)を用いる関数により可変な値を算出及び設定可能である。 Here, clip(x, max, min) indicates a process of clipping at max when x exceeds max and clipping at min when x is less than min. Further, tc in Equation (3) is an adjustment offset for processing used for clipping, and a variable value can be calculated and set by a function using a quantization parameter (Qp).
なお、画像符号化装置1における予測画像補正部110について説明したが、画像復号装置2における予測画像補正部207は、画像符号化装置1における予測画像補正部110と同様に構成される。具体的には、画像復号装置2における予測画像補正部207は、連続性評価部207aと、フィルタ判定部207bと、フィルタ処理部207cとを備える。
Although the predicted
(6.予測画像補正動作)
図8は、予測画像補正動作の一例を示す図である。ここでは、画像符号化装置1における予測画像補正動作について説明するが、画像復号装置2においても同様な予測画像補正動作を行う。図8の動作フローは、インター予測画像と復号済みブロックとのブロック境界の画素単位で行われてもよい。
(6. Predicted image correction operation)
FIG. 8 is a diagram illustrating an example of a predicted image correction operation. Here, a predicted image correction operation in the
図8に示すように、ステップS1において、予測精度評価部109は、インター予測部108がインター予測画像の生成に用いる複数の参照画像間の類似度に基づいて、インター予測画像の端部領域における予測精度を評価する。
As shown in FIG. 8, in step S1, the prediction
ステップS2において、連続性評価部110aは、インター予測部108が出力するインター予測画像と、インター予測画像に隣接する復号済み隣接ブロックとの連続性を評価する。
In step S2, the
ステップS3において、フィルタ判定部110bは、予測精度評価部109により評価された予測精度を第1閾値αと比較し、連続性評価部110aにより評価された連続性を第2閾値βと比較する。
In step S3, the
予測精度が第1閾値α以下であって、且つ連続性が第2閾値β以下である場合(ステップS3:YES)、フィルタ判定部110bは、フィルタ処理を行うと判定する。かかる場合、ステップS4において、フィルタ処理部110cは、復号済み隣接ブロック(隣接参照画素)を用いて、インター予測画像の端部領域をフィルタ処理により補正する。
If the prediction accuracy is less than or equal to the first threshold α and the continuity is less than or equal to the second threshold β (step S3: YES), the
一方、予測精度が第1閾値αを超える、及び/又は、連続性が第2閾値βを超える場合(ステップS3:NO)、フィルタ判定部110bは、フィルタ処理を行わないと判定する。かかる場合、フィルタ処理部110cは、フィルタ処理を行わない。
On the other hand, if the prediction accuracy exceeds the first threshold α and/or the continuity exceeds the second threshold β (step S3: NO), the
(7.実施形態のまとめ)
本実施形態に係る画像符号化装置1及び画像復号装置2は、インター予測の予測精度の評価結果に基づいてフィルタ処理を制御する。これにより、インター予測画像の端部領域の予測精度が高い場合には、この端部領域にフィルタ処理を適用しないよう制御できるため、フィルタ処理による予測画像の精度低下を防止できる。言い換えると、インター予測画像の端部領域の予測精度が低い場合にのみ、この端部領域にフィルタ処理を適用可能とすることができるため、フィルタ処理を適切に行うことができる。
(7. Summary of embodiments)
The
また、本実施形態において、画像符号化装置1及び画像復号装置2で共通の動作によりフィルタ処理の適用有無を判定する。具体的には、インター予測の予測精度の評価を画像符号化装置1及び画像復号装置2のそれぞれで行い、かかる評価結果に基づいてフィルタ処理の適用有無を判定する。これにより、フィルタ処理の適用有無を示すフラグを画像符号化装置1から画像復号装置2に伝送する必要がないため、フラグによる符号量の増加を防止できる。
Further, in this embodiment, the
(8.実施形態の変更例1)
上述した実施形態に係る連続性評価及びフィルタ処理において、復号済み隣接ブロックに適用されたイントラ予測モード(イントラ予測方向)を考慮してもよい。これにより、連続性評価及びフィルタ処理の精度を向上させることができる。図9は、本変更例に係る予測画像補正部110の構成を示す図である。図9に示すように、連続性評価部110a及びフィルタ処理部110cには、イントラ予測部107から、復号済み隣接ブロックに適用されたイントラ予測モードが入力される。連続性評価部110aは、復号済み隣接ブロックに適用したイントラ予測モードに応じて連続性を評価する。また、フィルタ処理部110cは、復号済み隣接ブロックに適用したイントラ予測モードに応じてフィルタ処理を行う。
(8. Modification example 1 of embodiment)
In the continuity evaluation and filter processing according to the embodiments described above, the intra prediction mode (intra prediction direction) applied to the decoded adjacent block may be considered. Thereby, the accuracy of continuity evaluation and filter processing can be improved. FIG. 9 is a diagram showing the configuration of the predicted
図10は、本変更例に係る連続性評価部110a及びフィルタ処理部110cの動作例を示す図である。図10に示すように、連続性評価部110a及びフィルタ処理部110cは、符号化対象ブロックに対応するインター予測画像の端部画素q0について連続性の評価及びフィルタ処理を行う際に、復号済み隣接ブロックに適用したイントラ予測モード(イントラ予測方向)に沿って、q0を通る直線上のp1、p0、q1、q2を加重平均により算出する。具体的には、復号済み隣接ブロック中の画素値を用いて、q0を通る直線上のp1、p0を算出し、インター予測画像中の画素値を用いて、q0を通る直線上のq1、q2を算出する。連続性評価部110aは、このようにして算出されたp1、p0、q1、q2を用いて、上記の式(2)により連続性Contを評価する。フィルタ処理部110cは、このようにして算出されたp1、p0、q1、q2を用いて、上記の式(3)によりq'0を算出する。
FIG. 10 is a diagram showing an example of the operation of the
(9.実施形態の変更例2)
上述した実施形態において、予測画像補正部110が、インター予測画像に対する補正処理として、復号済み隣接ブロックを用いてインター予測画像の端部領域に対してフィルタ処理を行う一例について説明した。
(9. Modification example 2 of embodiment)
In the embodiment described above, an example has been described in which the predicted
さらに、補正処理は、かかるフィルタ処理に限定されるものではなく、インター予測画像及びイントラ予測画像の重み付け平均処理を補正処理として用いてもよい。 Furthermore, the correction processing is not limited to such filter processing, and weighted averaging processing of inter-predicted images and intra-predicted images may be used as the correction processing.
本変更例において、図1に示す画像符号化装置1のイントラ予測部107及び予測画像補正部110は、対象画像ブロックに隣接する復号済み隣接ブロックを用いてインター予測画像に対して補正処理を行う補正部を構成する。
In this modification example, the
イントラ予測部107は、復号済み隣接ブロックを用いて対象画像ブロックに対応するイントラ予測画像を生成する。例えば、イントラ予測部107は、予め定められたイントラ予測モードにより復号済み隣接ブロックからイントラ予測画像を生成する。予測画像補正部110は、補正処理として、インター予測部108から入力されたインター予測画像及びイントラ予測部107から入力されたイントラ予測画像の重み付け平均処理を行う。なお、送信側で複数のイントラ予測モード候補の中から1つの予測モードを選択し、イントラ予測画像を生成するように構成してもよい。その際には、送信側でいずれのイントラ予測モードを用いてイントラ予測画像をしたかを示すイントラ予測モードフラグをエントロピー符号化部103はエントロピー符号化する。
The
同様に、図2に示す画像復号装置2のイントラ予測部204及び予測画像補正部207は、対象画像ブロックに隣接する復号済み隣接ブロックを用いてインター予測画像に対して補正処理を行う補正部を構成する。イントラ予測部204は、復号済み隣接ブロックを用いて対象画像ブロックに対応するイントラ予測画像を生成する。
Similarly, the
例えば、イントラ予測部204は、予め定められたイントラ予測モードにより復号済み隣接ブロックからイントラ予測画像を生成する。予測画像補正部207は、補正処理として、インター予測部205から入力されたインター予測画像及びイントラ予測部204から入力されたイントラ予測画像の重み付け平均処理を行う。なお、送信側から送られてきたイントラ予測モードフラグに基づいて、イントラ予測画像生成に用いるイントラ予測モードを決定するよう構成してもよい。
For example, the
本変更例の構成を適用する場合には、上述した実施形態における「フィルタ処理」を「重み付け平均処理」と読み替えればよい。また、かかる重み付け平均処理を行うか否かの判定だけではなく、予測精度の評価結果や連続性の評価結果に基づいて、重み付け平均処理における重みを調整してもよい。 When applying the configuration of this modified example, "filter processing" in the embodiment described above may be replaced with "weighted average processing." Furthermore, in addition to determining whether or not to perform such weighted averaging processing, the weight in weighted averaging processing may be adjusted based on the evaluation result of prediction accuracy and the evaluation result of continuity.
(10.その他の実施形態)
上述した実施形態において、複数の参照画像を用いる予測として双予測を主として説明した。しかしながら、複数の参照画像を用いる予測としてイントラブロックコピーと呼ばれる技術も適用することが可能である。イントラブロックコピーにおいては、現フレームと同じフレーム内の参照画像が現フレームの対象画像ブロックの予測に用いられる。
(10. Other embodiments)
In the embodiments described above, bi-prediction was mainly explained as prediction using a plurality of reference images. However, it is also possible to apply a technique called intra block copy as prediction using multiple reference images. In intra block copying, a reference image within the same frame as the current frame is used to predict the target image block of the current frame.
画像符号化装置1が行う各処理をコンピュータに実行させるプログラム及び画像復号装置2が行う各処理をコンピュータに実行させるプログラムにより提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。また、画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)として構成してもよい。同様に、画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)として構成してもよい。
It may be provided by a program that causes a computer to execute each process performed by the
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 Although the embodiments have been described above in detail with reference to the drawings, the specific configuration is not limited to that described above, and various design changes can be made without departing from the scope of the invention.
なお、日本国特許出願第2018-72451号(2018年4月4日出願)の全内容が、参照により、本願明細書に組み込まれている。
Note that the entire contents of Japanese Patent Application No. 2018-72451 (filed on April 4, 2018) are incorporated into the specification of the present application by reference.
Claims (4)
前記インター予測ブロックに対する補正処理を行う補正部と、
算出部と、を備え、
前記インター予測部が複数の参照画像のブロックを用いて前記インター予測を行う場合にのみ、前記算出部は、前記複数の参照画像のブロック間の誤差の統計量を、前記ブロックの一部分であって複数の画素からなる画像部分ごとに算出し、
前記補正部は、前記予測画像のブロックのうち、前記誤差の統計量が所定の閾値条件を満たす前記画像部分のみに対して補正処理を行う
予測画像補正装置。 an inter prediction unit that generates an inter prediction block by predicting a block of a target image obtained by dividing the image in units of frames by inter prediction;
a correction unit that performs correction processing on the inter prediction block;
comprising a calculation section ;
Only when the inter prediction unit performs the inter prediction using blocks of a plurality of reference images, the calculation unit calculates the statistics of errors between blocks of the plurality of reference images for a portion of the blocks. Calculate each image part consisting of multiple pixels using
The correction unit performs a correction process on only the image portion in which the error statistics satisfy a predetermined threshold condition among the blocks of the predicted image.
画像符号化装置。 An image encoding device comprising the predicted image correction device according to claim 1 .
画像復号装置。 An image decoding device comprising the predicted image correction device according to claim 1 .
プログラム。 A program that causes a computer to function as the predictive image correction device according to claim 1 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023116701A JP7568793B2 (en) | 2018-04-04 | 2023-07-18 | Predictive image correction device, image encoding device, image decoding device, and program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018072451 | 2018-04-04 | ||
JP2018072451 | 2018-04-04 | ||
JP2021038767A JP6910575B2 (en) | 2018-04-04 | 2021-03-10 | Predictive image correction device, image coding device, image decoding device, and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021038767A Division JP6910575B2 (en) | 2018-04-04 | 2021-03-10 | Predictive image correction device, image coding device, image decoding device, and program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023116701A Division JP7568793B2 (en) | 2018-04-04 | 2023-07-18 | Predictive image correction device, image encoding device, image decoding device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021180495A JP2021180495A (en) | 2021-11-18 |
JP7340569B2 true JP7340569B2 (en) | 2023-09-07 |
Family
ID=68100765
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020512227A Active JP6895586B2 (en) | 2018-04-04 | 2019-03-29 | Predictive image correction device, image coding device, image decoding device, and program |
JP2021038767A Active JP6910575B2 (en) | 2018-04-04 | 2021-03-10 | Predictive image correction device, image coding device, image decoding device, and program |
JP2021112273A Active JP7340569B2 (en) | 2018-04-04 | 2021-07-06 | Predicted image correction device, image encoding device, image decoding device, and program |
JP2023116701A Active JP7568793B2 (en) | 2018-04-04 | 2023-07-18 | Predictive image correction device, image encoding device, image decoding device, and program |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020512227A Active JP6895586B2 (en) | 2018-04-04 | 2019-03-29 | Predictive image correction device, image coding device, image decoding device, and program |
JP2021038767A Active JP6910575B2 (en) | 2018-04-04 | 2021-03-10 | Predictive image correction device, image coding device, image decoding device, and program |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023116701A Active JP7568793B2 (en) | 2018-04-04 | 2023-07-18 | Predictive image correction device, image encoding device, image decoding device, and program |
Country Status (6)
Country | Link |
---|---|
US (4) | US11622127B2 (en) |
EP (1) | EP3780600B1 (en) |
JP (4) | JP6895586B2 (en) |
KR (2) | KR20210157419A (en) |
CN (1) | CN116320402A (en) |
WO (1) | WO2019194109A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6895586B2 (en) | 2018-04-04 | 2021-06-30 | 日本放送協会 | Predictive image correction device, image coding device, image decoding device, and program |
CN114007082B (en) * | 2020-03-25 | 2022-12-23 | 杭州海康威视数字技术股份有限公司 | Decoding, encoding and decoding methods, devices and equipment |
CN114998118A (en) * | 2022-05-10 | 2022-09-02 | 浙江大华技术股份有限公司 | Filtering method, filtering device and computer readable storage medium |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000059785A (en) | 1998-08-06 | 2000-02-25 | Hitachi Ltd | Prediction decoder |
WO2008048489A2 (en) | 2006-10-18 | 2008-04-24 | Thomson Licensing | Method and apparatus for video coding using prediction data refinement |
WO2010010942A1 (en) | 2008-07-25 | 2010-01-28 | ソニー株式会社 | Image processing device and method |
WO2010095558A1 (en) | 2009-02-19 | 2010-08-26 | ソニー株式会社 | Image processing device and method |
WO2011080807A1 (en) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | Moving picture coding device and moving picture decoding device |
US20130051467A1 (en) | 2011-08-31 | 2013-02-28 | Apple Inc. | Hybrid inter/intra prediction in video coding systems |
US20170251213A1 (en) | 2016-02-25 | 2017-08-31 | Mediatek Inc. | Method and apparatus of video coding |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006517364A (en) * | 2003-01-07 | 2006-07-20 | トムソン ライセンシング | Inter / intra mixed video coding of macroblock partitions |
WO2005022919A1 (en) * | 2003-08-26 | 2005-03-10 | Thomson Licensing S.A. | Method and apparatus for decoding hybrid intra-inter coded blocks |
US20050094003A1 (en) * | 2003-11-05 | 2005-05-05 | Per Thorell | Methods of processing digital image and/or video data including luminance filtering based on chrominance data and related systems and computer program products |
US9681145B2 (en) * | 2013-10-14 | 2017-06-13 | Qualcomm Incorporated | Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency |
US10708589B2 (en) * | 2014-03-19 | 2020-07-07 | Samsung Electronics Co., Ltd. | Video encoding and decoding method and apparatus involving boundary filtering |
AU2014202921B2 (en) * | 2014-05-29 | 2017-02-02 | Canon Kabushiki Kaisha | Method, apparatus and system for de-blocking a block of video samples |
US10958927B2 (en) | 2015-03-27 | 2021-03-23 | Qualcomm Incorporated | Motion information derivation mode determination in video coding |
CN116760977A (en) | 2015-08-20 | 2023-09-15 | 日本放送协会 | Image encoding device, image decoding device, and program therefor |
WO2017105097A1 (en) * | 2015-12-17 | 2017-06-22 | 삼성전자 주식회사 | Video decoding method and video decoding apparatus using merge candidate list |
JP6883403B2 (en) | 2016-10-26 | 2021-06-09 | 株式会社ジャパンディスプレイ | Display device |
US11750832B2 (en) * | 2017-11-02 | 2023-09-05 | Hfi Innovation Inc. | Method and apparatus for video coding |
CN107995489A (en) * | 2017-12-20 | 2018-05-04 | 北京大学深圳研究生院 | A kind of combination forecasting method between being used for the intra frame of P frames or B frames |
JP6895586B2 (en) | 2018-04-04 | 2021-06-30 | 日本放送協会 | Predictive image correction device, image coding device, image decoding device, and program |
-
2019
- 2019-03-29 JP JP2020512227A patent/JP6895586B2/en active Active
- 2019-03-29 WO PCT/JP2019/014364 patent/WO2019194109A1/en unknown
- 2019-03-29 EP EP19780632.6A patent/EP3780600B1/en active Active
- 2019-03-29 CN CN202310331271.4A patent/CN116320402A/en active Pending
- 2019-03-29 KR KR1020217041485A patent/KR20210157419A/en not_active Application Discontinuation
- 2019-03-29 KR KR1020207030144A patent/KR102413038B1/en active IP Right Grant
-
2020
- 2020-10-02 US US17/062,306 patent/US11622127B2/en active Active
-
2021
- 2021-03-10 JP JP2021038767A patent/JP6910575B2/en active Active
- 2021-07-06 JP JP2021112273A patent/JP7340569B2/en active Active
-
2022
- 2022-03-30 US US17/657,280 patent/US11877003B2/en active Active
-
2023
- 2023-02-22 US US18/172,974 patent/US11849141B2/en active Active
- 2023-07-18 JP JP2023116701A patent/JP7568793B2/en active Active
- 2023-11-02 US US18/500,756 patent/US20240073443A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000059785A (en) | 1998-08-06 | 2000-02-25 | Hitachi Ltd | Prediction decoder |
WO2008048489A2 (en) | 2006-10-18 | 2008-04-24 | Thomson Licensing | Method and apparatus for video coding using prediction data refinement |
WO2010010942A1 (en) | 2008-07-25 | 2010-01-28 | ソニー株式会社 | Image processing device and method |
WO2010095558A1 (en) | 2009-02-19 | 2010-08-26 | ソニー株式会社 | Image processing device and method |
WO2011080807A1 (en) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | Moving picture coding device and moving picture decoding device |
US20130051467A1 (en) | 2011-08-31 | 2013-02-28 | Apple Inc. | Hybrid inter/intra prediction in video coding systems |
US20170251213A1 (en) | 2016-02-25 | 2017-08-31 | Mediatek Inc. | Method and apparatus of video coding |
Also Published As
Publication number | Publication date |
---|---|
KR20200138760A (en) | 2020-12-10 |
KR102413038B1 (en) | 2022-06-23 |
JP2021180495A (en) | 2021-11-18 |
US20220224936A1 (en) | 2022-07-14 |
US20210021862A1 (en) | 2021-01-21 |
CN116320402A (en) | 2023-06-23 |
JP2023126531A (en) | 2023-09-07 |
JP6910575B2 (en) | 2021-07-28 |
WO2019194109A1 (en) | 2019-10-10 |
JPWO2019194109A1 (en) | 2021-02-12 |
US11877003B2 (en) | 2024-01-16 |
JP6895586B2 (en) | 2021-06-30 |
KR20210157419A (en) | 2021-12-28 |
US11622127B2 (en) | 2023-04-04 |
JP7568793B2 (en) | 2024-10-16 |
EP3780600A4 (en) | 2022-02-09 |
JP2021100273A (en) | 2021-07-01 |
US11849141B2 (en) | 2023-12-19 |
US20230199215A1 (en) | 2023-06-22 |
CN112055965A (en) | 2020-12-08 |
US20240073443A1 (en) | 2024-02-29 |
EP3780600B1 (en) | 2024-07-03 |
EP3780600A1 (en) | 2021-02-17 |
US20240121428A1 (en) | 2024-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7340569B2 (en) | Predicted image correction device, image encoding device, image decoding device, and program | |
KR101323066B1 (en) | Quantization adjustment based on texture level | |
JP7483964B2 (en) | Image encoding device, image decoding device, and program | |
US11818360B2 (en) | Image encoding device, image decoding device and program | |
JP2024133699A (en) | Image decoding device and image decoding method | |
JP7228980B2 (en) | Predictive image correction device, image coding device, image decoding device, and program | |
US12132929B2 (en) | Prediction image correcting device, image encoding device, image decoding device, and program | |
CN112055965B (en) | Predictive image correction device, image encoding device, image decoding device, and program | |
JP7449690B2 (en) | Inter prediction device, image encoding device, image decoding device, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230330 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7340569 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |