JP7303661B2 - Image processing device and program - Google Patents

Image processing device and program Download PDF

Info

Publication number
JP7303661B2
JP7303661B2 JP2019088513A JP2019088513A JP7303661B2 JP 7303661 B2 JP7303661 B2 JP 7303661B2 JP 2019088513 A JP2019088513 A JP 2019088513A JP 2019088513 A JP2019088513 A JP 2019088513A JP 7303661 B2 JP7303661 B2 JP 7303661B2
Authority
JP
Japan
Prior art keywords
spatial
picture
processed
frequency band
phase position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019088513A
Other languages
Japanese (ja)
Other versions
JP2020184693A (en
Inventor
康孝 松尾
菊文 神田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2019088513A priority Critical patent/JP7303661B2/en
Publication of JP2020184693A publication Critical patent/JP2020184693A/en
Application granted granted Critical
Publication of JP7303661B2 publication Critical patent/JP7303661B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Picture Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置及びプログラムに関する。 The present invention relates to an image processing apparatus and program for inputting a moving image and performing image processing using wavelet degeneration based on wavelet packet decomposition.

従来、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて雑音除去を行う技法として、入力画像をウェーブレット変換した周波数分解係数のうち、所定の雑音レベル以下の成分をコアリングすることによりノイズ除去を行うことが知られている(例えば、非特許文献1参照)。 Conventionally, as a technique for removing noise by inputting a moving image and using wavelet degeneration based on wavelet packet decomposition, among the frequency decomposition coefficients obtained by wavelet transforming the input image, noise is generated by coring the components below a predetermined noise level. It is known to remove (see, for example, Non-Patent Document 1).

また、ウェーブレット縮退を用いた画像処理装置として、高周波ノイズ画像と低周波ノイズ画像を抽出し、これらの画像が輝度成分の画像であるか色差成分の画像であるかに応じて分けて統合することで雑音レベルの低減を行う技法が知られている(例えば、特許文献1参照)。 Also, as an image processing device using wavelet degeneration, a high-frequency noise image and a low-frequency noise image are extracted, and these images are divided and integrated according to whether they are images of luminance components or images of color difference components. A technique for reducing the noise level is known (see Patent Document 1, for example).

特許第5352942号明細書Patent No. 5352942 specification

David L. Donoho, Iain M. Johnstone, Gerard Kerkyacharian and Dominique Picard: “Wavelet Shrinkage: Asymptopia?”, Journal of the Royal Statistical Society. Series B (Methodological), Vol. 57, No. 2, pp. 301-369, 1995.David L. Donoho, Iain M. Johnstone, Gerard Kerkyacharian and Dominique Picard: “Wavelet Shrinkage: Asymptopia?”, Journal of the Royal Statistical Society. Series B (Methodological), Vol. 57, No. 2, pp. 301-369 , 1995.

上述したように、従来から、非特許文献1や特許文献1などのように、画像に対しウェーブレット縮退を用いて雑音除去する技法が知られている。また、ウェーブレット縮退を用いて帯域制限処理を行う技法もある。 As described above, techniques for removing noise from an image using wavelet degeneration are conventionally known, such as in Non-Patent Document 1 and Patent Document 1. There are also techniques for bandlimiting using wavelet shrinkage.

一方で、近年、例えば次世代地上波放送として、ハイビジョンを超える超高精細動画像として4Kや8KのSHV(Super Hi-Vision)などの大容量コンテンツサービスを伝送することが検討されている。このような超高精細動画像の伝送にあたって高圧縮符号化を行う際に、空間高周波数帯域成分のパワーが大きいなどの理由で高圧縮符号化が困難な動画像が入力されうることが想定される。この場合、伝送容量としてその入力動画像が持つ膨大な情報量に対する符号化ビットレートが十分ではない事態が生じうるため、圧縮又は伝送に係る符号化に起因する画像破綻が発生する場合がある。 On the other hand, in recent years, for example, as next-generation terrestrial broadcasting, transmission of large-capacity content services such as 4K and 8K SHV (Super Hi-Vision) as ultra-high-definition moving images exceeding high-definition has been considered. When performing high-compression encoding for the transmission of such ultra-high-definition video, it is assumed that video images that are difficult to high-compression-encode due to reasons such as the power of spatial high-frequency band components being large may be input. be. In this case, since the encoding bit rate may not be sufficient for the enormous amount of information that the input moving image has as transmission capacity, image corruption may occur due to encoding related to compression or transmission.

そこで、超高精細動画像に対する高圧縮符号化処理の前段で、非特許文献1や特許文献1などの従来の雑音除去処理や帯域制限処理を行うことで、入力動画像が持つ情報量を削減することができる。 Therefore, prior to high-compression encoding processing for ultra-high-definition video, conventional noise removal processing and band-limiting processing such as those described in Non-Patent Document 1 and Patent Document 1 are performed to reduce the amount of information contained in the input video. can do.

しかし、従来技術を用いて雑音除去処理と帯域制限処理を行う場合に、様々な線形フィルタ処理や非線形フバルタ処理が存在するが、従来技術では、超高精細動画像等の動画像に対し圧縮又は伝送に係る符号化に起因する画像破綻を抑制しつつ動画像品質を劣化させないように、その圧縮符号化処理の前処理として適応的に雑音除去処理と帯域制限処理を行うことができないという問題がある。 However, when performing noise removal processing and band-limiting processing using conventional technology, there are various linear filter processing and nonlinear Fvarta processing. There is a problem that it is not possible to adaptively perform noise reduction processing and band limiting processing as preprocessing of compression coding processing so as to suppress image corruption caused by coding related to transmission and prevent deterioration of moving image quality. be.

このため、超高精細動画像等の動画像に対し圧縮符号化処理の前段でウェーブレット縮退を用いて情報量を削減するにあたり、画像破綻を抑制しつつ動画像品質を劣化させないように雑音除去処理と帯域制限処理を行うフィルタ処理(ウェーブレット縮退に用いる縮退関数)が望まれる。 For this reason, when reducing the amount of information by using wavelet degeneracy in the preceding stage of compression encoding processing for moving images such as ultra-high-definition moving images, noise removal processing is performed so as not to deteriorate the quality of the moving image while suppressing image corruption. and filter processing (degeneration function used for wavelet degeneration) that performs band-limiting processing is desired.

従って、本発明の目的は、圧縮符号化処理の前処理として動画像を入力し、この入力動画像に対しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像破綻を抑制しつつ動画像品質を劣化させないように適応的に雑音除去処理と帯域制限処理を行う画像処理を施し、動画像の圧縮符号化処理に係る画質を向上させる画像処理装置及びプログラムを提供することにある。 Therefore, an object of the present invention is to input a moving image as preprocessing for compression encoding processing, and apply wavelet degeneration based on wavelet packet decomposition to this input moving image to suppress image corruption and prevent deterioration of moving image quality. It is an object of the present invention to provide an image processing apparatus and a program that perform image processing that adaptively performs noise removal processing and band limiting processing as described above, and that improve image quality related to compression encoding processing of moving images.

本発明による一態様の画像処理装置は、動画像の圧縮符号化処理の前段で、入力動画像の雑音除去及び帯域制限を行うにあたり、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行うように構成する。当該縮退関数は、当該空間位相位置毎の時間パワーの変動の大きさを基に、より好適には時間パワーの変動の大きさと、後段の圧縮符号化処理に係る参照ピクチャセットに対応する時間的なマッチング度合い(時間パワーマッチング量)とを基に、雑音除去及び帯域制限を行う。 An image processing apparatus according to one aspect of the present invention predicts the encoding difficulty of an input moving image by spatio-temporal analysis when noise removal and band limitation are performed on the input moving image before compression encoding processing of the moving image. Meanwhile, a degeneration function for performing noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of the input moving image is set, and spatial wavelet degeneration processing based on spatial wavelet packet decomposition is performed. The degeneracy function is based on the magnitude of temporal power fluctuation for each spatial phase position, and more preferably, the magnitude of temporal power fluctuation and the temporal power corresponding to the reference picture set related to the subsequent compression encoding process. Noise removal and band limitation are performed based on the degree of matching (time power matching amount).

即ち、本発明の画像処理装置は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置であって、当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、を備えることを特徴とする。 That is, the image processing apparatus of the present invention is an image processing apparatus that receives a moving image and performs image processing using wavelet degeneration based on wavelet packet decomposition. a spatial wavelet packet decomposition unit that performs spatial wavelet packet decomposition processing of (n≧2) and extracts frequency decomposition coefficients of each frequency band group in the spatial direction; The frequency resolution coefficient of the highest spatial diagonal frequency band is extracted, and the power exceeding a predetermined ratio in the power of all frequency resolution coefficients in the spatial diagonal highest frequency band is regarded as a noise component and detected as noise power. A power detection unit, based on each frequency band group in the spatial direction related to the picture to be processed, detects a picture at a corresponding spatial position in one frame image immediately adjacent to the frame image to which the picture to be processed belongs. a temporal power variation detection unit that performs first-order wavelet packet decomposition in the temporal direction using a temporal power variation detection unit that detects the temporal power variation for each spatial phase position of the picture to be processed; Based on the temporal power fluctuation amount for each spatial phase position, the noise power defines the input value range of the degeneracy function for noise removal, and the larger the temporal power fluctuation amount, the more the degeneracy corresponds to the band limit amount. A degeneracy function setting unit that sets a degeneracy function for each spatial phase position in all frequency band groups related to the picture to be processed, and a frequency decomposition of each frequency band group related to the picture to be processed, as a function that reduces the slope of the function. a spatial wavelet degeneration unit that performs spatial wavelet degeneration processing based on the spatial wavelet packet decomposition processing by applying the degeneration function to the coefficients and performing the spatial wavelet degeneration processing; and the spatial wavelet degeneration unit for the picture to be processed. Performing a spatial wavelet reconstruction process using the frequency resolution coefficients of each frequency band band-limited and noise-removed by the process to generate a band-limited and noise-removed output video for each picture in the video. and a reconstructing unit.

また、本発明の画像処理装置において、前記時間パワー変動量検出部は、各空間位相位置を中心とする所定ブロックサイズのブロックを基に、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出することを特徴とする。 Further, in the image processing apparatus of the present invention, the temporal power fluctuation amount detection unit detects the temporal power fluctuation for each spatial phase position regarding the picture to be processed based on a block of a predetermined block size centered at each spatial phase position. It is characterized by detecting quantity.

また、本発明の画像処理装置において、所定の圧縮符号化処理に係る参照ピクチャセットの情報を基に、当該処理対象のピクチャに対して符号化参照されることになる1枚以上の参照ピクチャを入力し、該参照ピクチャに対しn階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャを生成する第2の空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする。 Further, in the image processing apparatus of the present invention, one or more reference pictures to be encoded-referenced to the picture to be processed are selected based on the information of the reference picture set related to the predetermined compression encoding process. a second spatial wavelet packet for generating a reference picture represented by frequency resolution coefficients of each frequency band group in the spatial direction by performing n-th order (n≧2) spatial wavelet packet decomposition processing on the reference picture A decomposing unit, for each spatial phase position in each spatial direction frequency band group regarding the picture to be processed, for each block of a predetermined block size centered at each spatial phase position, for each spatial direction frequency band group. Perform block matching with respect to the reference picture represented by the frequency resolution coefficient, search for the matching amount showing the minimum similarity evaluation index, and perform temporal power matching for each spatial phase position on the picture to be processed for the minimum matching amount. a temporal power matching amount detection unit for detecting as a quantity, wherein the degeneracy function setting unit detects the noise power for the picture to be processed, the temporal power fluctuation amount for each spatial phase position, and each spatial phase position Based on the time power matching amount, the noise power defines the input value range of the degeneracy function for noise removal, and the larger the value of the time power fluctuation amount, the more the slope of the degeneracy function corresponding to the band limit amount. Assuming that the greater the value of the temporal power matching amount, the smaller the slope of the degeneracy function corresponding to the band limit amount, degeneracy is performed for each spatial phase position in all frequency band groups related to the picture to be processed. It is characterized by setting a function.

更に、本発明のプログラムは、コンピューターを、本発明の画像処理装置として機能させるためのプログラムとして構成する。 Furthermore, the program of the present invention constitutes a program for causing a computer to function as the image processing apparatus of the present invention.

本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。 According to the present invention, by using the image processing apparatus according to the present invention as pre-processing for compression encoding processing of a moving image, while predicting the encoding difficulty of the input moving image by spatio-temporal analysis, input moving image Since it is possible to adaptively set a degeneration function that performs noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of the image, it is possible to suppress image corruption in the subsequent compression encoding process, It is possible to improve the video coding quality.

本発明による一実施形態の画像処理装置の概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of an image processing apparatus according to one embodiment of the present invention; FIG. 本発明による一実施形態の画像処理装置における一実施例の画像処理に係る2階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図である。FIG. 4 is a diagram showing frequency bands obtained by second-order spatial wavelet packet decomposition related to image processing of one example in the image processing apparatus of one embodiment according to the present invention; 本発明による一実施形態の画像処理装置における一実施例の画像処理を示すフローチャートである。4 is a flow chart showing image processing of an example in the image processing apparatus of one embodiment according to the present invention; 本発明による一実施形態の画像処理装置における時間パワー変動量の検出を示す説明図である。FIG. 5 is an explanatory diagram showing detection of temporal power variation in the image processing apparatus according to one embodiment of the present invention; 本発明による一実施形態の画像処理装置における時間パワーマッチング量の検出を示す説明図である。FIG. 5 is an explanatory diagram showing detection of a temporal power matching amount in the image processing apparatus of one embodiment according to the present invention; (a)は参照ピクチャセットを例示する図であり、(b),(c)はそれぞれ本発明による一実施形態の画像処理装置における時間パワーマッチング量の検出に係るブロックマッチングを例示する説明図である。(a) is a diagram illustrating a reference picture set, and (b) and (c) are explanatory diagrams illustrating block matching related to temporal power matching amount detection in an image processing apparatus according to an embodiment of the present invention. be. (a),(b)は、それぞれ本発明による一実施形態の画像処理装置における一実施例及び変形例の画像処理に係る縮退関数の説明図である。4(a) and 4(b) are explanatory diagrams of degeneration functions related to image processing of an example and a modified example in the image processing apparatus of one embodiment according to the present invention, respectively. 本発明による一実施形態の画像処理装置における一実施例の画像処理に係る3階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図である。FIG. 4 is a diagram showing frequency bands obtained by third-order spatial wavelet packet decomposition related to image processing of one example in the image processing apparatus of one embodiment according to the present invention;

以下、本発明による一実施形態の画像処理装置1について、図面を参照して詳細に説明する。 An image processing apparatus 1 according to an embodiment of the present invention will be described in detail below with reference to the drawings.

〔装置構成〕
図1は本発明による一実施形態の画像処理装置1の概略構成を示すブロック図である。本実施形態の画像処理装置1は、圧縮符号化処理の前処理として、動画像を入力し空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて画像処理を行う装置として構成され、空間ウェーブレットパケット分解部11、雑音パワー検出部12、時間パワー変動量検出部13、空間ウェーブレットパケット分解部14、時間パワーマッチング量検出部15、縮退関数設定部16、空間ウェーブレット縮退部17、及び再構成部18を備える。尚、図1に示す例において、画像処理装置1に対しウェーブレットパケット分解階数(n階)を外部指定可能とし、画像処理装置1内の必要とされる各構成要素に対し個別に外部指定するように図示しているが、パラメータとして伝送しながら処理する構成とすることも可能である。
〔Device configuration〕
FIG. 1 is a block diagram showing a schematic configuration of an image processing apparatus 1 of one embodiment according to the present invention. The image processing apparatus 1 of this embodiment is configured as a device that performs image processing using spatial wavelet degeneracy based on spatial wavelet packet decomposition by inputting a moving image as preprocessing for compression encoding processing, and includes a spatial wavelet packet decomposition unit 11, a noise power detector 12, a temporal power variation detector 13, a spatial wavelet packet decomposing unit 14, a temporal power matching amount detector 15, a degeneration function setting unit 16, a spatial wavelet degeneracy unit 17, and a reconstruction unit 18. . In the example shown in FIG. 1, the wavelet packet decomposition order number (nth order) can be externally specified for the image processing apparatus 1, and each necessary component in the image processing apparatus 1 can be specified externally. , it is also possible to have a configuration in which processing is performed while being transmitted as parameters.

空間ウェーブレットパケット分解部11は、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)(t:処理対象とするフレーム画像の時刻)に対し空間ウェーブレットパケット分解処理を施し、これにより抽出される空間方向の各周波数帯域群の周波数分解係数を空間ウェーブレット縮退部17に出力する。尚、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域のうち空間対角最高周波数帯域内の周波数分解係数は雑音パワー検出部12にて抽出される。また、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域群の周波数分解係数は、時間パワー変動量検出部13、及び時間パワーマッチング量検出部15において、それぞれ詳細に後述する時間パワー変動量及び時間パワーマッチング量の検出に用いられる。 The spatial wavelet packet decomposition unit 11 receives a picture P(t) to be processed in the input moving image, and according to the set wavelet packet decomposition order (nth order) (n≧2), the picture to be processed in the input moving image is Spatial wavelet packet decomposition processing is performed on P(t) (t: time of frame image to be processed), and the frequency decomposition coefficients of each frequency band group in the spatial direction extracted by this are output to the spatial wavelet reduction unit 17. do. For the picture P(t) to be processed, the noise power detector 12 extracts the frequency resolution coefficients within the spatial diagonal maximum frequency band among the spatial direction frequency bands obtained by the n-th order spatial wavelet packet decomposition. be. Further, the frequency resolution coefficients of each frequency band group in the spatial direction obtained by the n-th order spatial wavelet packet decomposition for the picture P(t) to be processed are obtained by the temporal power fluctuation amount detection unit 13 and the temporal power matching amount detection unit 15. , they are used to detect a temporal power fluctuation amount and a temporal power matching amount, which will be described later in detail.

図2を参照して、より具体的に処理対象のピクチャP(t)に対する空間ウェーブレットパケット分解について説明する。図2は本発明による一実施形態の画像処理装置1における一実施例の画像処理に係る処理対象のピクチャP(t)に対する2階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図であり、放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。この例では、時刻tのフレーム画像全体をピクチャP(t)としているが、時刻tのフレーム画像の一部を示すスライス画像やタイル画像(HEVC規格)をピクチャP(t)として扱うことができる。 Spatial wavelet packet decomposition for a picture P(t) to be processed will be described more specifically with reference to FIG. FIG. 2 is a diagram showing frequency bands obtained by second-order spatial wavelet packet decomposition for a picture P(t) to be processed according to one example of image processing in the image processing apparatus 1 according to one embodiment of the present invention. This is an example in which a so-called 8K/60P moving image (horizontal resolution 8K (7680 pixels)×vertical resolution 4K (4320 pixels)) captured by a camera is processed. In this example, the entire frame image at time t is the picture P(t), but a slice image or tile image (HEVC standard) showing part of the frame image at time t can be treated as the picture P(t). .

図2に示すように、入力動画像における処理対象のピクチャP(t)に対するn=2とした空間方向のみを処理対象とする2階空間ウェーブレットパケット分解では、入力動画像における処理対象のピクチャP(t)に対しそれぞれ水平・垂直方向に2階空間ウェーブレットパケット分解を行う。この場合、水平周波数×垂直周波数で表される図2に図示するような周波数領域に分解されたピクチャP’(i,j,t)が得られ、ピクチャP’(i,j,t)は、2階の空間低周波数帯域LL(i,j,t)、水平高周波数帯域LH(i,j,t)、垂直高周波数帯域HL(i,j,t)、及び対角(水平・垂直)高周波数帯域HH(i,j,t)の各周波数帯域群に分解される(mは各周波数帯域群の群番号であり、iは水平方向の周波数分解係数の空間位相座標を示し、jは垂直方向の周波数分解係数の空間位相座標を示す。)。尚、n階空間ウェーブレットハケット分解における各階間には、パーセバルの法則が成り立つものとなっている。 As shown in FIG. 2, in the second-order spatial wavelet packet decomposition in which only the spatial direction is processed with n=2 for the picture P(t) to be processed in the input video, the picture P(t) to be processed in the input video Second-order spatial wavelet packet decomposition is performed on (t) in the horizontal and vertical directions, respectively. In this case, a picture P'(i,j,t) decomposed into the frequency domain as shown in FIG. 2 represented by horizontal frequency*vertical frequency is obtained. , the second-order spatial low-frequency band LL m (i,j,t), the horizontal high-frequency band LH m (i,j,t), the vertical high-frequency band HL m (i,j,t), and the diagonal ( (horizontal/vertical) high frequency band HH m (i, j, t) is decomposed into each frequency band group (m is the group number of each frequency band group, i is the spatial phase coordinate of the horizontal frequency resolution coefficient and j indicates the spatial phase coordinate of the frequency-resolved coefficients in the vertical direction). Parseval's law holds between each level in the n-level spatial wavelet Hackett decomposition.

図1に示すように、雑音パワー検出部12は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH(i,j,t))の成分(周波数分解係数)を抽出する。そして、雑音パワー検出部12は、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPとして検出し縮退関数設定部16に出力する。 As shown in FIG. 1, the noise power detection unit 12 detects each frequency band of the picture P′(i, j, t), which is the output value from the spatial wavelet packet decomposition unit 11, according to the wavelet packet decomposition order (nth order). A component (frequency resolution coefficient) of the spatial diagonal maximum frequency band (in this example, n=2, space HH 4 (i, j, t)) is extracted from the group. Then, the noise power detection unit 12 detects the power (upper %th power) is regarded as a noise component, detected as a noise power PN , and output to the degeneracy function setting unit 16 .

時間パワー変動量検出部13は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)(aは時刻tに対する相対時刻を示すが、例えばa=1としたときは、直前のフレーム画像における対応する空間位置のピクチャP(t-1)を示す。)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。続いて、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(各周波数帯域内の周波数分解係数の空間位相を示す位置(i,j))で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、該ブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出し、縮退関数設定部16に出力する。尚、空間位相位置(i,j)毎の時間パワー変動量を検出するにあたり、上記のようにブロック領域で処理することでパワー値の精度及びこれに基づく縮退関数の設定値の精度が高くなる。 The temporal power fluctuation amount detection unit 13 is based on each frequency band group of the picture P′ (i, j, t), which is the output value from the spatial wavelet packet decomposition unit 11, according to the wavelet packet decomposition order (nth order), Using a temporal wavelet filter, a picture P(ta) (a is the time t For example, when a = 1, the picture P (t-1) at the corresponding spatial position in the previous frame image is shown.) is used to perform first-order wavelet packet decomposition in the temporal direction, Obtain the frequency resolution coefficients of each frequency band group of the picture P'(i,j,ta). Subsequently, the temporal power fluctuation amount detection unit 13 corresponds to each frequency band group of the picture P′(i, j, t) and each frequency band group of the picture P′(i, j, t−a). At the spatial phase position (position (i, j) indicating the spatial phase of the frequency resolution coefficient in each frequency band), the externally specified block size {Bx, By }, the average value or median value in the block area is obtained as the power of the spatial phase position, and the picture P'(i, j, t) and the picture P'(i, j, t-a) The value obtained by subtracting the power at each spatial phase position (i, j) between the two is detected as the temporal power fluctuation amount for each spatial phase position (i, j) in the picture P′(i, j, t), and the degeneracy function Output to the setting unit 16 . When detecting the temporal power fluctuation amount for each spatial phase position (i, j), the accuracy of the power value and the accuracy of the set value of the degeneration function based on this are increased by processing in the block area as described above. .

空間ウェーブレットパケット分解部14は、本実施形態の画像処理装置1の出力動画像に対し圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定される。そして、空間ウェーブレットパケット分解部14は、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。例えば、空間ウェーブレットパケット分解部14は、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。 The spatial wavelet packet decomposing unit 14 externally designates reference picture set (RPS) information used by a subsequent encoding device (not shown) that performs compression encoding processing on the output moving image of the image processing device 1 of this embodiment. be done. Then, based on the information of this reference picture set (RPS), the spatial wavelet packet decomposition unit 14 extracts one or more pictures P(t) to be processed in the input moving picture to be referenced for encoding. input the reference picture P(k), and perform n-th order spatial wavelet packet decomposition processing on the reference picture P(k) according to the set wavelet packet decomposition order (nth order) (n≧2), The frequency resolution coefficients of each frequency band group in the spatial direction thus obtained are output to the temporal power matching amount detection unit 15 . For example, the spatial wavelet packet decomposing unit 14, regarding the reference picture P(k) in the encoding order one before the picture P(t) to be processed, which is determined based on the information of the reference picture set (RPS), The frequency decomposition coefficients of the frequency band group obtained by applying the second-order spatial wavelet packet decomposition are output to the temporal power matching amount detection unit 15 .

時間パワーマッチング量検出部15は、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出し、縮退関数設定部16に出力する。ここで、類似度評価指数は、SSD(Sum of Squared Difference)値とすることや、SSD値以外にも、SAD(Sum of Absolute Difference)値、NCC(Normalized Cross-Correlation),ZNCC(Zero-means Normalized Cross-Correlation)等を利用できる。尚、空間位相位置(i,j)毎の時間パワーマッチング量を検出するにあたり、上記のようにブロック領域で処理することでマッチング量の精度及びこれに基づく縮退関数の設定値の精度が高くなる。 The temporal power matching amount detection unit 15 detects each spatial For the phase position (i, j), the output value from the spatial wavelet packet decomposition unit 14 for each block of the externally specified block size {Bx, By} centered on each spatial phase position (i, j) Perform block matching for a certain reference picture P′ (i, j, k), search for the matching amount that indicates the minimum similarity evaluation index, and find the minimum matching amount in the picture P′ (i, j, t) A temporal power matching amount for each spatial phase position (i, j) is detected and output to the degenerate function setting unit 16 . Here, the similarity evaluation index may be an SSD (Sum of Squared Difference) value, or, in addition to the SSD value, an SAD (Sum of Absolute Difference) value, NCC (Normalized Cross-Correlation), ZNCC (Zero-means Normalized Cross-Correlation) etc. can be used. In detecting the temporal power matching amount for each spatial phase position (i, j), processing in the block region as described above increases the accuracy of the matching amount and the set value of the degeneracy function based thereon. .

縮退関数設定部16は、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する。尚、縮退関数設定部16における縮退関数の設定において、雑音パワーPは雑音除去する縮退関数の入力値範囲が規定され、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして設定される。 The degeneracy function setting unit 16 sets the noise power P N in the picture P′(i,j,t) obtained from the noise power detection unit 12 and the picture P′(i,j,t) obtained from the temporal power fluctuation amount detection unit 13 . t) for each spatial phase position (i, j) and for each spatial phase position (i, j) for picture P′ (i, j, t) obtained from the temporal power matching amount detection unit 15 Based on the amount of temporal power matching, a degeneration function to be used in the spatial wavelet degeneration unit 17 is set for each spatial phase position (i, j) in all frequency band groups in the picture P'(i, j, t). In setting the degeneracy function in the degeneracy function setting unit 16, the input value range of the degeneracy function for noise removal is defined for the noise power PN , and the larger the value of the time power fluctuation amount, the degeneracy function corresponding to the band limit amount. Further, the larger the value of the time power matching amount, the smaller the slope of the degeneracy function corresponding to the band limiting amount.

空間ウェーブレット縮退部17は、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行する。これにより、空間ウェーブレット縮退部17は、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行い、帯域制限及び雑音除去後の各周波数帯域内の周波数分解係数を再構成部18に出力する。 The spatial wavelet degeneracy unit 17 applies the degeneracy function set by the degeneracy function setting unit 16 to the frequency resolution coefficients of each frequency band group in the picture P′(i, j, t) input from the spatial wavelet packet decomposer 11. is applied to perform the spatial wavelet reduction process. As a result, the spatial wavelet degeneracy unit 17 predicts the encoding difficulty of the input moving image by spatio-temporal analysis, and for each spatial phase position in the frequency domain in each frame image (each picture to be exact) of the input moving image. Adaptively sets a degeneration function that performs noise removal and band limitation to the spatial wavelet degeneration process based on spatial wavelet packet decomposition, and reconstructs the frequency decomposition coefficients in each frequency band after band limitation and noise removal Output to 18.

再構成部18は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する。 The reconstruction unit 18 uses the frequency decomposition coefficients of each frequency band group in the picture P′(i, j, t) band-limited and noise-removed by the spatial wavelet degeneration process according to the wavelet packet decomposition order (nth order). By performing spatial wavelet reconstruction processing and similarly processing each picture in the input moving image, a band-limited and noise-removed output moving image is generated and output to the outside.

〔装置動作〕
以下、より具体的に、図1及び図2に示す本実施形態の画像処理装置1の動作として、図4乃至図6を参照しながら、図3を基に一実施例の画像処理について説明する。
[Device operation]
Hereinafter, as the operation of the image processing apparatus 1 according to the present embodiment shown in FIGS. 1 and 2, image processing according to an embodiment will be described with reference to FIGS. 4 to 6 and based on FIG. .

図3は、本発明による一実施形態の画像処理装置1における一実施例の画像処理を示すフローチャートである。また、図4は本実施形態の画像処理装置1における時間パワー変動量の検出を示す説明図であり、図5は本実施形態の画像処理装置1における時間パワーマッチング量の検出を示す説明図である。尚、図6(a)は参照ピクチャセットを例示する図であり、図6(b),(c)はそれぞれ本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを例示する説明図である。 FIG. 3 is a flow chart showing an example of image processing in the image processing apparatus 1 of one embodiment according to the present invention. 4 is an explanatory diagram showing detection of the temporal power fluctuation amount in the image processing apparatus 1 of this embodiment, and FIG. 5 is an explanatory diagram showing detection of the temporal power matching amount in the image processing apparatus 1 of this embodiment. be. FIG. 6(a) is a diagram illustrating a reference picture set, and FIGS. 6(b) and 6(c) respectively illustrate block matching related to detection of the temporal power matching amount in the image processing apparatus 1 of this embodiment. It is an explanatory diagram for.

まず、画像処理装置1は、空間ウェーブレットパケット分解部11により、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)に対し空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を得る(ステップS1)。 First, the image processing apparatus 1 inputs a picture P(t) to be processed in the input moving image by the spatial wavelet packet decomposition unit 11, and according to the set wavelet packet decomposition order (n order) (n≧2), A picture P(t) to be processed in an input moving image is subjected to spatial wavelet packet decomposition processing, and frequency decomposition coefficients of each frequency band group in the spatial direction obtained by this processing are obtained (step S1).

続いて、画像処理装置1は、雑音パワー検出部12により、図2に示すピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH(i,j,t))の成分(周波数分解係数)を抽出し、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPとして検出する(ステップS2)。 Subsequently, the image processing apparatus 1 causes the noise power detection unit 12 to detect the highest spatial diagonal frequency band (n=2 in this example) among the frequency band groups of the picture P′(i, j, t) shown in FIG. , the components (frequency resolution coefficients) of the space HH 4 (i, j, t)) are extracted, and all components (all frequencies The power that is equal to or higher than a predetermined ratio in the power of the resolution coefficient) (upper α%-th power) is regarded as a noise component and detected as a noise power PN (step S2).

一般に、信号成分のパワーは低周波数帯域に偏在する。一方、熱雑音などの雑音成分のパワーは全周波数帯域群でほぼ一定である。このため、n階空間ウェーブレットパケット分解による空間対角最高周波数帯域内の成分は雑音成分が支配的となる。そこで、雑音パワー検出部12は、空間対角最高周波数帯域の全成分(全周波数分解係数)のパワーをソートして、例えばα=95とすると、その上位95%番目の値を雑音パワーPとする。 In general, the power of signal components is unevenly distributed in the low frequency band. On the other hand, the power of noise components such as thermal noise is almost constant over the entire frequency band group. For this reason, noise components are dominant in the components within the spatial diagonal maximum frequency band due to the n-th order spatial wavelet packet decomposition. Therefore, the noise power detection unit 12 sorts the power of all components (all frequency resolution coefficients) in the spatial diagonal highest frequency band, and if α=95, for example, the top 95% value is the noise power P N and

続いて、画像処理装置1は、時間パワー変動量検出部13により、ピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタFを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。 Subsequently, the image processing apparatus 1 causes the temporal power fluctuation amount detection unit 13 to use the temporal wavelet filter F based on each frequency band group of the picture P'(i, j, t) to , j, t) to which the picture P' ( Obtain the frequency resolution coefficients of each frequency band group of i, j, ta).

例えば、a=1としたとき、ピクチャP(t)(周波数領域ではピクチャP’(i,j,t))が属するフレーム画像に対し直前のフレーム画像における対応する空間位置のピクチャP(t-1)について、ピクチャP’(i,j,t)の各周波数帯域群を基準にした空間位相位置で時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。即ち、1階ウェーブレットパケット分解を行う時間ウェーブレットフィルタFをHaarウェーブレットフィルタとすると、そのタップ長は2となり、図4に示すように、ピクチャP’(i,j,t)の各周波数帯域群に対応する空間位相位置で、時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。 For example, when a=1, the picture P(t− For 1), a picture P'(i, j, t-1) is obtained that is frequency-resolved in the temporal direction at the spatial phase position with reference to each frequency band group of the picture P'(i, j, t). That is, if the temporal wavelet filter F that performs first-order wavelet packet decomposition is a Haar wavelet filter, its tap length is 2, and as shown in FIG. At the corresponding spatial phase position, a temporally frequency-resolved picture P'(i,j,t-1) is obtained.

そして、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(i,j)で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出する(ステップS3)。 Then, the temporal power fluctuation amount detection unit 13 corresponds to each frequency band group of the picture P′(i, j, t) and each frequency band group of the picture P′(i, j, t−a). At the spatial phase position (i, j), the average value or the median value in the block area of the externally specified block size {Bx, By} centered at the spatial phase position (i, j) The power of each spatial phase position (i, j) between the picture P' (i, j, t) and the picture P' (i, j, t-a) is obtained by subtracting the power of the picture P' It is detected as a temporal power fluctuation amount for each spatial phase position (i, j) at (i, j, t) (step S3).

例えば、時間パワー変動量検出部13は、図4に例示するように、或る周波数帯域(図示する例ではHL)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、その空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーと、同空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーとの差分を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワー変動量PHL (i,j,t)として検出する。このように、時間パワー変動量検出部13は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワー変動量を検出する。 For example, as illustrated in FIG. 4, the temporal power fluctuation amount detection unit 13 detects a block size When 3×3 {Bx=3, By=3}, the power indicating the average or median value in the block area of the picture P′(i, j, t) at the spatial phase position (i, j); The difference between the power indicating the average value or the median value in the block area of the picture P'(i, j, t) at the same spatial phase position (i, j) is It is detected as the temporal power fluctuation amount P HL 3 (i, j, t) of the spatial phase position (i, j). In this way, the temporal power fluctuation amount detection unit 13 detects the temporal power fluctuation amount at all spatial phase positions (i, j) in all frequency bands.

続いて、画像処理装置1は、空間ウェーブレットパケット分解部14により、圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定されると、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。 Subsequently, when the spatial wavelet packet decomposition unit 14 externally designates the information of the reference picture set (RPS) used in the subsequent encoding device (not shown) that performs the compression encoding process, the image processing device 1 specifies this information. inputting one or more reference pictures P(k) to be referenced for encoding with respect to the picture P(t) to be processed in the input video based on the information of the reference picture set (RPS); The reference picture P(k) is subjected to n-th order spatial wavelet packet decomposition processing, and the reference picture P′(i,j,k) represented by the frequency decomposition coefficients of each frequency band group in the spatial direction obtained by this to generate

例えば、空間ウェーブレットパケット分解部14は、図5に例示するように、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。 For example, as illustrated in FIG. 5, the spatial wavelet packet decomposing unit 14 uses the coding order of the picture P(t) to be processed, which is determined based on the information of the reference picture set (RPS). For the reference picture P(k), a reference picture P'(i,j,k) represented by the frequency decomposition coefficients of the frequency band group obtained by performing second-order spatial wavelet packet decomposition is generated.

続いて、画像処理装置1は、時間パワーマッチング量検出部15により、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出する(ステップS4)。 Subsequently, the image processing apparatus 1 causes the temporal power matching amount detection unit 15 to detect the picture P′(i, j, t ), for each block of externally specified block size {Bx,By} centered at that spatial phase position (i,j), spatial wavelet Block matching is performed with respect to the reference picture P′ (i, j, k), which is the output value from the packet decomposing unit 14, the matching amount indicating the minimum similarity evaluation index (for example, SSD value) is searched, and the minimum is detected as the temporal power matching amount for each spatial phase position (i, j) in the picture P'(i, j, t) (step S4).

例えば、時間パワーマッチング量検出部15は、図5に例示するように、或る周波数帯域(図示する例ではHL)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、そのピクチャP’(i,j,t)の空間位相位置(i,j)について、参照ピクチャセット(RPS)の情報に基づいて定められる参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワーマッチング量MHL (i,j,t)として検出する。このように、時間パワーマッチング量検出部15は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワーマッチング量を検出する。 For example, as exemplified in FIG. 5 , the temporal power matching amount detection unit 15 detects a block size Assuming 3×3 {Bx=3, By=3}, the spatial phase position (i, j) of the picture P′(i, j, t) is determined based on the information of the reference picture set (RPS) Block matching is performed with respect to the reference picture P'(i, j, k), the matching amount indicating the minimum similarity evaluation index (for example, SSD value) is searched, and the minimum matching amount is obtained from the picture P'(i , j, t) at the spatial phase position (i, j). Thus, the temporal power matching amount detection unit 15 detects the temporal power matching amount at all spatial phase positions (i, j) in all frequency bands.

尚、図6を参照して、参照ピクチャセット、及び本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを説明する。動画像の圧縮符号化技術として、例えばH.264/MPEG-4 AVC,H.265/MPEG-H HEVCなどでは、予測符号化処理前の動画像について複数の画面群に分割した所定グループを設定し、その所定グループ内で、予測符号化法として予め選択された画面間予測符号化処理や画面内予測符号化処理を行う。 Note that reference picture sets and block matching related to detection of the temporal power matching amount in the image processing apparatus 1 of the present embodiment will be described with reference to FIG. As a moving image compression encoding technique, for example, H.264. 264/MPEG-4 AVC, H.264/MPEG-4 AVC. H.265/MPEG-H HEVC, etc., a predetermined group is set by dividing a moving image before predictive coding processing into a plurality of screen groups, and within the predetermined group, an inter-screen predictive code selected in advance as a predictive coding method is applied. encoding processing and intra-screen predictive coding processing.

H.264/MPEG-4 AVCでは、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したGOP(Group of Pictures)を設定する。そして、GOP内の各画面(フレーム、又はスライス画面)について、フレーム内予測符号化処理を行うIピクチャ、時間的に過去の画面から片方向フレーム間予測符号化処理を行うPピクチャ、又は時間的に前後に位置する画面から双方向フレーム間予測符号化処理を行うBピクチャが予め選択される。尚、H.264/MPEG-4 AVCでは、GOP内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。 H. In H.264/MPEG-4 AVC, a GOP (Group of Pictures) obtained by dividing a moving image before predictive coding into a plurality of screen groups is set as the predetermined group. Then, for each screen (frame or slice screen) in the GOP, an I picture for which intra-frame predictive coding processing is performed, a P picture for which unidirectional inter-frame predictive coding processing is performed from a temporally past screen, or a temporally A B-picture to be subjected to bidirectional inter-frame predictive coding processing is selected in advance from the screens located before and after the current picture. In addition, H. In H.264/MPEG-4 AVC, all pictures in a GOP can be compressed by a compression coding method that only performs intra-picture predictive coding.

また、H.265/MPEG-H HEVCにおいても、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したシーケンスを設定する。HEVC規格上ではGOPという概念を導入していないが、このシーケンスがGOPに相当する。そして、シーケンス内の各画面(フレーム画面、スライス画面、又はタイル画面)について、画面内予測符号化処理や画面間予測符号化処理を行う処理ユニットが予め選択される。尚、H.265/MPEG-H HEVCにおいても、シーケンス内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。 Also, H.I. Also in H.265/MPEG-H HEVC, a sequence obtained by dividing a moving image before predictive coding into a plurality of screen groups is set as the predetermined group. Although the HEVC standard does not introduce the concept of GOP, this sequence corresponds to GOP. Then, for each screen (frame screen, slice screen, or tile screen) in the sequence, a processing unit that performs intra-screen predictive encoding processing and inter-screen predictive encoding processing is selected in advance. In addition, H. Also in H.265/MPEG-H HEVC, all the pictures in the sequence can be compressed by the compression coding method of only the intra-picture predictive coding process.

そして、図6(a)に例示するように、圧縮符号化する動画像は、そのフレーム番号で示される各フレーム画像(ここでは、フレーム画像全体をピクチャとして例示)が、いずれのピクチャを参照対象として圧縮符号化を行うかが予め定められ、参照ピクチャセットとして識別できるようになっている。 Then, as illustrated in FIG. 6A, in the moving image to be compression-encoded, each frame image indicated by its frame number (here, the entire frame image is exemplified as a picture) refers to any picture. It is determined in advance whether compression encoding is performed as a set, and can be identified as a reference picture set.

そこで、画像処理装置1は、時間パワーマッチング量検出部15により、ピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、ブロックサイズ{Bx,By}のブロック毎に、例えば1枚の参照ピクチャP’(i,j,k)に対するときは図6(b)に示すように、或いは2枚の参照ピクチャP’(i,j,k1),P’(i,j,k2)に対するときは図6(c)に示すように、予め定めた探索範囲内でブロックマッチングを行って、個々のブロックマッチングで得られるマッチング量(SSD値を例にSSD1,SSD2,…)のうち最小となるマッチング量を時間パワーマッチング量として検出する。尚、当該参照ピクチャセットにおける参照ピクチャP’(i,j,k)が処理対象のピクチャP’(i,j,t)のIピクチャに該当するときは、当該時間パワーマッチング量検出部15の処理は省略するか、或いは、前回の参照ピクチャセットにおけるIピクチャ又は最終の符号化順のピクチャを参照ピクチャP’(i,j,k)として扱うように構成することができる。 Therefore, the image processing apparatus 1 uses the temporal power matching amount detection unit 15 to determine the block size {Bx, By }, for example, for one reference picture P'(i,j,k), as shown in FIG. For P'(i,j,k2), block matching is performed within a predetermined search range as shown in FIG. SSD1, SSD2, . . . ), the smallest matching amount is detected as the temporal power matching amount. Note that when the reference picture P'(i, j, k) in the reference picture set corresponds to the I picture of the picture P'(i, j, t) to be processed, the temporal power matching amount detection unit 15 The processing can be omitted or configured to treat the I picture in the previous reference picture set or the last picture in coding order as the reference picture P'(i,j,k).

続いて、画像処理装置1は、縮退関数設定部16により、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する(ステップS5)。 Subsequently, the image processing apparatus 1 causes the degeneration function setting unit 16 to set the noise power P N in the picture P′(i, j, t) obtained from the noise power detection unit 12 and the noise power P N obtained from the temporal power fluctuation amount detection unit 13 . The amount of temporal power variation for each spatial phase position (i, j) in the picture P′(i, j, t) obtained from the obtained picture P′(i, j, t) and the space in the picture P′(i, j, t) obtained from the temporal power matching amount detection unit 15 Based on the amount of temporal power matching for each phase position (i, j), for each spatial phase position (i, j) in all frequency band groups in the picture P' (i, j, t), a spatial wavelet degeneration unit 17 is set (step S5).

特に、縮退関数設定部16は、雑音パワーPは雑音除去する縮退関数の入力値範囲を規定するものとし、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、縮退関数を設定する。 In particular, the degeneracy function setting unit 16 defines the input value range of the degeneracy function for noise removal by the noise power PN , and the larger the value of the time power fluctuation amount, the more the slope of the degeneracy function corresponding to the band limit amount. Further, the degeneracy function is set so that the larger the value of the time power matching amount, the smaller the slope of the degeneracy function corresponding to the band limit amount.

例えば、図7(a)は、本実施形態の画像処理装置1における一実施例の画像処理に係る縮退関数の説明図である。図7(a)に示す入力xに対する出力yで示される縮退関数は、雑音パワーPの絶対値以下で定まる入力値をゼロ値まで雑音除去するよう縮退関数の入力値範囲を規定するものとし、雑音パワーPの絶対値を超える入力値については、上述した図4に示す空間位相位置(i,j)の時間パワー変動量PHL (i,j,t)と、上述した図5に示す同空間位相位置(i,j)の時間パワーマッチング量MHL (i,j,t)とで定まる帯域制限とし、時間パワー変動量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとする。これは、時間パワー変動量の値が大きいほど、更には時間パワーマッチング量の値が大きいほど、圧縮符号化が難しく符号化に起因する画像劣化が起こりやすいとみなしているためである。尚、β,γは任意に定められる定数である。 For example, FIG. 7A is an explanatory diagram of a degeneration function related to image processing of one example in the image processing apparatus 1 of this embodiment. The degeneracy function indicated by the output y for the input x shown in FIG. 7(a) defines the input value range of the degeneracy function so that the input value determined below the absolute value of the noise power PN is denoised to zero value. , for an input value exceeding the absolute value of the noise power P N , the temporal power fluctuation amount P HL 3 (i, j, t) at the spatial phase position (i, j) shown in FIG. The band limit is determined by the temporal power matching amount M HL 3 (i, j, t) at the same spatial phase position (i, j) shown in , and the degenerate function corresponds to the band limiting amount as the value of the temporal power fluctuation amount increases. Further, the slope of the degeneracy function corresponding to the band limitation amount is made smaller as the value of the amount of time power matching becomes larger. This is because it is considered that the larger the value of the temporal power fluctuation amount, and furthermore the larger the value of the temporal power matching amount, the more difficult compression encoding becomes and the more likely image deterioration due to encoding occurs. β and γ are constants that are determined arbitrarily.

(変形例)
尚、上述した実施形態の例では、雑音パワー、時間パワー変動量及び時間パワーマッチング量を用いて縮退関数の設定を行う例を説明したが、画像処理装置1において、空間ウェーブレットパケット分解部14、及び時間パワーマッチング量検出部15を省略し、雑音パワー、及び時間パワー変動量を用いて縮退関数の設定を行う構成としてもよい。この変形例の縮退関数を図7(b)に例示している。図7(b)に示す例においても、時間パワー変動量の値が大きいほど縮退関数の傾きを小さくするものとし、これにより、比較的多くの動画像において生じる圧縮符号化が難しく符号化に起因する画像劣化が起こりやすい現象を、抑制させることができる。
(Modification)
In the example of the embodiment described above, an example of setting the degeneracy function using the noise power, the amount of temporal power fluctuation, and the amount of temporal power matching has been described. and the temporal power matching amount detection unit 15 may be omitted, and the degeneracy function may be set using the noise power and the temporal power fluctuation amount. The degeneration function of this modification is illustrated in FIG. 7(b). In the example shown in FIG. 7B as well, the slope of the degeneracy function is made smaller as the value of the temporal power fluctuation amount increases. It is possible to suppress the phenomenon in which image deterioration is likely to occur.

続いて、画像処理装置1は、空間ウェーブレット縮退部17により、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行することより、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行う(ステップS6)。 Subsequently, the spatial wavelet degeneracy unit 17 of the image processing apparatus 1 applies the degeneracy function By executing spatial wavelet degeneration processing by applying the degeneration function set by the setting unit 16, each frame image of the input video (accurate , adaptively sets a degeneration function for noise removal and band limitation for each spatial phase position in the frequency domain in each picture), and performs spatial wavelet degeneration processing based on spatial wavelet packet decomposition (step S6).

最終的に、画像処理装置1は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する(ステップS7)。 Finally, the image processing apparatus 1 performs frequency decomposition of each frequency band group in the picture P′(i,j,t) band-limited and noise-removed by the spatial wavelet degeneration process according to the wavelet packet decomposition order (nth order). Spatial wavelet reconstruction processing is performed using the coefficients, and each picture in the input moving image is similarly processed to generate a band-limited and noise-removed output moving image and output it to the outside (step S7).

以上のように、本実施形態の画像処理装置1は、動画像の圧縮符号化処理の前処理として利用し、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。 As described above, the image processing apparatus 1 of the present embodiment is used as a pre-process for compressing and encoding a moving image, and predicts the encoding difficulty of the input moving image by spatio-temporal analysis. Since it is possible to adaptively set a degeneration function that performs noise removal and band limitation for each spatial phase position in the frequency domain in each frame image, it is possible to suppress image corruption in the subsequent compression encoding process. Image coding quality can be improved.

(応用例)
上述した実施形態の例では、空間ウェーブレットパケット分解部11及び空間ウェーブレットパケット分解部14において、n=2とした2階空間ウェーブレットパケット分解で動作するときの例を主として説明したが、n≧3以上とすることもできる。例えば、図8に示すように、n=3とした3階空間ウェーブレットパケット分解で動作させることもできる。図8では放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。尚、図8に示す例では、雑音パワー検出部12は、ピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=3としており、空間HH16(i,j,t))の成分(周波数分解係数)を基に雑音パワーを検出する。n=3とした空間方向を処理対象とする3階空間ウェーブレットパケット分解を用いる画像処理装置1では、より細かく雑音パワー、時間パワー変動量及び時間パワーマッチング量を設定した縮退関数で、動画像に対し雑音除去及び帯域制限を行うことができる。
(Application example)
In the above-described example of the embodiment, the spatial wavelet packet decomposing unit 11 and the spatial wavelet packet decomposing unit 14 mainly explained an example when operating in second-order spatial wavelet packet decomposition with n=2, but n≧3. can also be For example, as shown in FIG. 8, it is also possible to operate with a 3rd order spatial wavelet packet decomposition with n=3. FIG. 8 shows an example in which a so-called 8K/60P moving image (horizontal resolution 8K (7680 pixels)×vertical resolution 4K (4320 pixels)) captured by a broadcast camera is the object of processing. In the example shown in FIG. 8, the noise power detection unit 12 detects the spatial diagonal highest frequency band (n=3 in this example) among the frequency band groups of the picture P′(i, j, t). Noise power is detected based on the component (frequency resolution coefficient) of HH 16 (i, j, t)). In the image processing device 1 using third-order spatial wavelet packet decomposition, which targets the spatial direction with n = 3, the noise power, the temporal power fluctuation amount, and the temporal power matching amount are set more finely. noise cancellation and bandlimiting can be performed on the

以上の実施形態における画像処理装置1は、コンピューターにより構成することができ、画像処理装置1の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、画像処理装置1の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、画像処理装置1の各処理部の有する機能を実現させることができる。更に、画像処理装置1の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、画像処理装置1の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、画像処理装置1の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。 The image processing apparatus 1 in the above embodiment can be configured by a computer, and a program for functioning each processing unit of the image processing apparatus 1 can be preferably used. Specifically, a control unit for controlling each processing unit of the image processing apparatus 1 can be configured by a central processing unit (CPU) in a computer, and a program necessary for operating each processing unit can be At least one memory can be used as a storage unit that stores data as appropriate. That is, the functions of each processing unit of the image processing apparatus 1 can be realized by causing the CPU of such a computer to execute the program. Furthermore, a program for realizing the function of each processing unit of the image processing apparatus 1 can be stored in a predetermined area of the storage unit (memory) described above. Such a storage unit can be configured with a RAM or ROM inside the device, or can be configured with an external storage device (eg, hard disk). Also, such a program can be made up of a part of software (stored in a ROM or an external storage device) on an OS used in a computer. Furthermore, a program for causing such a computer to function as each processing unit of the image processing apparatus 1 can be recorded on a computer-readable recording medium. Also, each processing unit of the image processing apparatus 1 can be configured as a part of hardware or software, and can be realized by combining them.

以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施形態の例では、主として、2階又は3階空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う例を説明したが、4階以上の空間ウェーブレットパケット分解に基づいた空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う処理とすることもできる。従って、本発明に係る画像処理装置1は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。 Although the present invention has been described with reference to specific embodiments, the present invention is not limited to the above-described embodiments, and can be modified in various ways without departing from the technical idea thereof. For example, in the examples of the embodiments described above, examples were mainly described in which noise removal and band limitation were performed using spatial wavelet degeneration based on second or third order spatial wavelet packet decomposition. It can also be a process that denoises and bandlimits using spatial wavelet shrinkage based on . Therefore, the image processing apparatus 1 according to the present invention is not limited to the above-described embodiment examples, but is limited only by the description of the claims.

本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定し、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となるので、特に、動画像符号化を要する用途に有用である。 According to the present invention, by using the image processing apparatus according to the present invention as pre-processing for compression encoding processing of a moving image, while predicting the encoding difficulty of the input moving image by spatio-temporal analysis, input moving image It is possible to adaptively set a degeneration function that performs noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of an image, suppressing image corruption in the subsequent compression coding process, and moving image coding. Since it is possible to improve the quality, it is particularly useful for applications requiring video coding.

1 画像処理装置
11 空間ウェーブレットパケット分解部
12 雑音パワー検出部
13 時間パワー変動量検出部
14 空間ウェーブレットパケット分解部
15 時間パワーマッチング量検出部
16 縮退関数設定部
17 空間ウェーブレット縮退部
18 再構成部
1 Image processing device 11 Spatial wavelet packet decomposing unit 12 Noise power detecting unit 13 Temporal power fluctuation amount detecting unit 14 Spatial wavelet packet decomposing unit 15 Temporal power matching amount detecting unit 16 Degenerate function setting unit 17 Spatial wavelet degenerating unit 18 Reconstructing unit

Claims (4)

動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置であって、
当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、
前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、
前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、
前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、
を備えることを特徴とする画像処理装置。
An image processing device for inputting a moving image and performing image processing using wavelet degeneration based on wavelet packet decomposition,
a spatial wavelet packet decomposition unit that inputs a picture to be processed in the moving image, performs n-th order (n≧2) spatial wavelet packet decomposition processing, and extracts frequency decomposition coefficients of each frequency band group in the spatial direction;
extracting a frequency resolution coefficient of a spatial diagonal maximum frequency band from among the spatial direction frequency band groups for the picture to be processed, and extracting a predetermined ratio of the power of all frequency resolution coefficients in the spatial diagonal maximum frequency band; a noise power detection unit that detects power equal to or higher than the noise component as noise power;
Based on each frequency band group in the spatial direction related to the picture to be processed, in the temporal direction using a picture at a corresponding spatial position in a frame image immediately adjacent to the frame image to which the picture to be processed belongs a temporal power fluctuation amount detection unit that performs first-order wavelet packet decomposition and detects the temporal power fluctuation amount for each spatial phase position regarding the picture to be processed;
Based on the noise power for the picture to be processed and the temporal power fluctuation amount for each spatial phase position, the noise power shall define the input value range of the degeneration function for noise removal, and the temporal power fluctuation amount shall be the a degeneracy function setting unit that sets a degeneracy function for each spatial phase position in all frequency band groups related to the picture to be processed so that the slope of the degeneracy function corresponding to the amount of band limitation decreases as the value increases;
Spatial wavelet degeneration that performs spatial wavelet degeneration processing based on the spatial wavelet packet decomposition processing by applying the degeneration function to the frequency resolution coefficients of each frequency band group related to the picture to be processed and executing the spatial wavelet degeneration processing. Department and
By performing spatial wavelet reconstruction processing using frequency resolution coefficients of each frequency band group band-limited and noise-removed by the spatial wavelet degeneration processing for the picture to be processed, band-limiting and noise-removing for each picture in the moving image a reconstructor that generates a denoised output video image;
An image processing device comprising:
前記時間パワー変動量検出部は、各空間位相位置を中心とする所定ブロックサイズのブロックを基に、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出することを特徴とする、請求項1に記載の画像処理装置。 The temporal power fluctuation amount detection unit detects the temporal power fluctuation amount for each spatial phase position regarding the picture to be processed based on a block of a predetermined block size centered on each spatial phase position, The image processing apparatus according to claim 1. 所定の圧縮符号化処理に係る参照ピクチャセットの情報を基に、当該処理対象のピクチャに対して符号化参照されることになる1枚以上の参照ピクチャを入力し、該参照ピクチャに対しn階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャを生成する第2の空間ウェーブレットパケット分解部と、
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、
前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする、請求項1又は2に記載の画像処理装置。
Based on the information of the reference picture set related to the predetermined compression encoding process, one or more reference pictures to be encoded and referenced for the picture to be processed are input, and the n-th order is applied to the reference picture. a second spatial wavelet packet decomposition unit that performs (n≧2) spatial wavelet packet decomposition processing and generates a reference picture represented by frequency decomposition coefficients of each frequency band group in the spatial direction;
For each spatial phase position in each frequency band group in the spatial direction regarding the picture to be processed, for each block of a predetermined block size centered at each spatial phase position, with frequency resolution coefficients of each frequency band group in the spatial direction Perform block matching on the represented reference picture, search for the matching amount showing the minimum similarity evaluation index, and detect the minimum matching amount as the temporal power matching amount for each spatial phase position regarding the picture to be processed. and a time power matching amount detection unit,
The degeneracy function setting unit removes noise from the noise power based on the noise power for the picture to be processed, the temporal power fluctuation amount for each spatial phase position, and the temporal power matching amount for each spatial phase position. The input value range of the degeneracy function is defined, and the greater the value of the temporal power fluctuation amount, the smaller the slope of the degeneracy function corresponding to the band limitation amount. 3. The method according to claim 1 or 2, wherein a degeneration function is set for each spatial phase position in all frequency band groups related to the picture to be processed, as a slope of the degeneration function corresponding to the amount of band limitation is reduced. The described image processing device.
コンピューターを、請求項1から3のいずれか一項に記載の画像処理装置として機能させるためのプログラム。 A program for causing a computer to function as the image processing apparatus according to any one of claims 1 to 3.
JP2019088513A 2019-05-08 2019-05-08 Image processing device and program Active JP7303661B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019088513A JP7303661B2 (en) 2019-05-08 2019-05-08 Image processing device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019088513A JP7303661B2 (en) 2019-05-08 2019-05-08 Image processing device and program

Publications (2)

Publication Number Publication Date
JP2020184693A JP2020184693A (en) 2020-11-12
JP7303661B2 true JP7303661B2 (en) 2023-07-05

Family

ID=73044619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019088513A Active JP7303661B2 (en) 2019-05-08 2019-05-08 Image processing device and program

Country Status (1)

Country Link
JP (1) JP7303661B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456918B (en) * 2022-11-11 2023-03-24 之江实验室 Image denoising method and device based on wavelet high-frequency channel synthesis

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232892A (en) 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> Threshold-function control-type wavelet shrinkage noise eliminator and program
JP2010239296A (en) 2009-03-30 2010-10-21 Nippon Hoso Kyokai <Nhk> Moving image noise cancellation apparatus, moving regional image noise cancellation apparatus, moving image noise cancellation program, and moving regional image cancellation program
JP2018173857A (en) 2017-03-31 2018-11-08 日本放送協会 Bandwidth limitation device and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232892A (en) 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> Threshold-function control-type wavelet shrinkage noise eliminator and program
JP2010239296A (en) 2009-03-30 2010-10-21 Nippon Hoso Kyokai <Nhk> Moving image noise cancellation apparatus, moving regional image noise cancellation apparatus, moving image noise cancellation program, and moving regional image cancellation program
JP2018173857A (en) 2017-03-31 2018-11-08 日本放送協会 Bandwidth limitation device and program

Also Published As

Publication number Publication date
JP2020184693A (en) 2020-11-12

Similar Documents

Publication Publication Date Title
US7548660B2 (en) System and method of spatio-temporal edge-preserved filtering techniques to reduce ringing and mosquito noise of digital pictures
JP3714944B2 (en) Image coding apparatus and image decoding apparatus
US7804896B2 (en) Content adaptive noise reduction filtering for image signals
JP6729170B2 (en) Image processing system and image decoding device
US8380001B2 (en) Edge adaptive deblocking filter and methods for use therewith
JP2003244702A (en) Filtering method and apparatus for removing blocking artifact
IL230271A (en) Signal processing and inheritance in a tiered signal quality hierarchy
JP2006229411A (en) Image decoder and image decoding method
JP7303661B2 (en) Image processing device and program
JP6915473B2 (en) Coding devices and programs, decoding devices and programs, and image processing systems
JP7290985B2 (en) Image processing device and program
Del Corso et al. MNR: A novel approach to correct MPEG temporal distortions
JP7290968B2 (en) Image processing device and program
JP7071216B2 (en) Bandwidth limiting device and program
JPH08191444A (en) Video signal decoder
JP2005197879A (en) Video signal coding apparatus
Kumar et al. A Novel Blurring based Method for Video Compression
JP2022041172A (en) Band limitation device and program
JP2007538451A (en) Algorithms to reduce artifacts in decoded video
JP2007104515A (en) Video encoding pre-filtering method, apparatus, and program, and computer readable recording medium with the program recorded thereon
Martínez-Rach et al. Perceptually enhanced encoder for high definition video content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230623

R150 Certificate of patent or registration of utility model

Ref document number: 7303661

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150