JP7303661B2 - Image processing device and program - Google Patents
Image processing device and program Download PDFInfo
- Publication number
- JP7303661B2 JP7303661B2 JP2019088513A JP2019088513A JP7303661B2 JP 7303661 B2 JP7303661 B2 JP 7303661B2 JP 2019088513 A JP2019088513 A JP 2019088513A JP 2019088513 A JP2019088513 A JP 2019088513A JP 7303661 B2 JP7303661 B2 JP 7303661B2
- Authority
- JP
- Japan
- Prior art keywords
- spatial
- picture
- processed
- frequency band
- phase position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Picture Signal Circuits (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置及びプログラムに関する。 The present invention relates to an image processing apparatus and program for inputting a moving image and performing image processing using wavelet degeneration based on wavelet packet decomposition.
従来、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて雑音除去を行う技法として、入力画像をウェーブレット変換した周波数分解係数のうち、所定の雑音レベル以下の成分をコアリングすることによりノイズ除去を行うことが知られている(例えば、非特許文献1参照)。 Conventionally, as a technique for removing noise by inputting a moving image and using wavelet degeneration based on wavelet packet decomposition, among the frequency decomposition coefficients obtained by wavelet transforming the input image, noise is generated by coring the components below a predetermined noise level. It is known to remove (see, for example, Non-Patent Document 1).
また、ウェーブレット縮退を用いた画像処理装置として、高周波ノイズ画像と低周波ノイズ画像を抽出し、これらの画像が輝度成分の画像であるか色差成分の画像であるかに応じて分けて統合することで雑音レベルの低減を行う技法が知られている(例えば、特許文献1参照)。
Also, as an image processing device using wavelet degeneration, a high-frequency noise image and a low-frequency noise image are extracted, and these images are divided and integrated according to whether they are images of luminance components or images of color difference components. A technique for reducing the noise level is known (see
上述したように、従来から、非特許文献1や特許文献1などのように、画像に対しウェーブレット縮退を用いて雑音除去する技法が知られている。また、ウェーブレット縮退を用いて帯域制限処理を行う技法もある。
As described above, techniques for removing noise from an image using wavelet degeneration are conventionally known, such as in
一方で、近年、例えば次世代地上波放送として、ハイビジョンを超える超高精細動画像として4Kや8KのSHV(Super Hi-Vision)などの大容量コンテンツサービスを伝送することが検討されている。このような超高精細動画像の伝送にあたって高圧縮符号化を行う際に、空間高周波数帯域成分のパワーが大きいなどの理由で高圧縮符号化が困難な動画像が入力されうることが想定される。この場合、伝送容量としてその入力動画像が持つ膨大な情報量に対する符号化ビットレートが十分ではない事態が生じうるため、圧縮又は伝送に係る符号化に起因する画像破綻が発生する場合がある。 On the other hand, in recent years, for example, as next-generation terrestrial broadcasting, transmission of large-capacity content services such as 4K and 8K SHV (Super Hi-Vision) as ultra-high-definition moving images exceeding high-definition has been considered. When performing high-compression encoding for the transmission of such ultra-high-definition video, it is assumed that video images that are difficult to high-compression-encode due to reasons such as the power of spatial high-frequency band components being large may be input. be. In this case, since the encoding bit rate may not be sufficient for the enormous amount of information that the input moving image has as transmission capacity, image corruption may occur due to encoding related to compression or transmission.
そこで、超高精細動画像に対する高圧縮符号化処理の前段で、非特許文献1や特許文献1などの従来の雑音除去処理や帯域制限処理を行うことで、入力動画像が持つ情報量を削減することができる。
Therefore, prior to high-compression encoding processing for ultra-high-definition video, conventional noise removal processing and band-limiting processing such as those described in Non-Patent
しかし、従来技術を用いて雑音除去処理と帯域制限処理を行う場合に、様々な線形フィルタ処理や非線形フバルタ処理が存在するが、従来技術では、超高精細動画像等の動画像に対し圧縮又は伝送に係る符号化に起因する画像破綻を抑制しつつ動画像品質を劣化させないように、その圧縮符号化処理の前処理として適応的に雑音除去処理と帯域制限処理を行うことができないという問題がある。 However, when performing noise removal processing and band-limiting processing using conventional technology, there are various linear filter processing and nonlinear Fvarta processing. There is a problem that it is not possible to adaptively perform noise reduction processing and band limiting processing as preprocessing of compression coding processing so as to suppress image corruption caused by coding related to transmission and prevent deterioration of moving image quality. be.
このため、超高精細動画像等の動画像に対し圧縮符号化処理の前段でウェーブレット縮退を用いて情報量を削減するにあたり、画像破綻を抑制しつつ動画像品質を劣化させないように雑音除去処理と帯域制限処理を行うフィルタ処理(ウェーブレット縮退に用いる縮退関数)が望まれる。 For this reason, when reducing the amount of information by using wavelet degeneracy in the preceding stage of compression encoding processing for moving images such as ultra-high-definition moving images, noise removal processing is performed so as not to deteriorate the quality of the moving image while suppressing image corruption. and filter processing (degeneration function used for wavelet degeneration) that performs band-limiting processing is desired.
従って、本発明の目的は、圧縮符号化処理の前処理として動画像を入力し、この入力動画像に対しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像破綻を抑制しつつ動画像品質を劣化させないように適応的に雑音除去処理と帯域制限処理を行う画像処理を施し、動画像の圧縮符号化処理に係る画質を向上させる画像処理装置及びプログラムを提供することにある。 Therefore, an object of the present invention is to input a moving image as preprocessing for compression encoding processing, and apply wavelet degeneration based on wavelet packet decomposition to this input moving image to suppress image corruption and prevent deterioration of moving image quality. It is an object of the present invention to provide an image processing apparatus and a program that perform image processing that adaptively performs noise removal processing and band limiting processing as described above, and that improve image quality related to compression encoding processing of moving images.
本発明による一態様の画像処理装置は、動画像の圧縮符号化処理の前段で、入力動画像の雑音除去及び帯域制限を行うにあたり、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行うように構成する。当該縮退関数は、当該空間位相位置毎の時間パワーの変動の大きさを基に、より好適には時間パワーの変動の大きさと、後段の圧縮符号化処理に係る参照ピクチャセットに対応する時間的なマッチング度合い(時間パワーマッチング量)とを基に、雑音除去及び帯域制限を行う。 An image processing apparatus according to one aspect of the present invention predicts the encoding difficulty of an input moving image by spatio-temporal analysis when noise removal and band limitation are performed on the input moving image before compression encoding processing of the moving image. Meanwhile, a degeneration function for performing noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of the input moving image is set, and spatial wavelet degeneration processing based on spatial wavelet packet decomposition is performed. The degeneracy function is based on the magnitude of temporal power fluctuation for each spatial phase position, and more preferably, the magnitude of temporal power fluctuation and the temporal power corresponding to the reference picture set related to the subsequent compression encoding process. Noise removal and band limitation are performed based on the degree of matching (time power matching amount).
即ち、本発明の画像処理装置は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置であって、当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、を備えることを特徴とする。 That is, the image processing apparatus of the present invention is an image processing apparatus that receives a moving image and performs image processing using wavelet degeneration based on wavelet packet decomposition. a spatial wavelet packet decomposition unit that performs spatial wavelet packet decomposition processing of (n≧2) and extracts frequency decomposition coefficients of each frequency band group in the spatial direction; The frequency resolution coefficient of the highest spatial diagonal frequency band is extracted, and the power exceeding a predetermined ratio in the power of all frequency resolution coefficients in the spatial diagonal highest frequency band is regarded as a noise component and detected as noise power. A power detection unit, based on each frequency band group in the spatial direction related to the picture to be processed, detects a picture at a corresponding spatial position in one frame image immediately adjacent to the frame image to which the picture to be processed belongs. a temporal power variation detection unit that performs first-order wavelet packet decomposition in the temporal direction using a temporal power variation detection unit that detects the temporal power variation for each spatial phase position of the picture to be processed; Based on the temporal power fluctuation amount for each spatial phase position, the noise power defines the input value range of the degeneracy function for noise removal, and the larger the temporal power fluctuation amount, the more the degeneracy corresponds to the band limit amount. A degeneracy function setting unit that sets a degeneracy function for each spatial phase position in all frequency band groups related to the picture to be processed, and a frequency decomposition of each frequency band group related to the picture to be processed, as a function that reduces the slope of the function. a spatial wavelet degeneration unit that performs spatial wavelet degeneration processing based on the spatial wavelet packet decomposition processing by applying the degeneration function to the coefficients and performing the spatial wavelet degeneration processing; and the spatial wavelet degeneration unit for the picture to be processed. Performing a spatial wavelet reconstruction process using the frequency resolution coefficients of each frequency band band-limited and noise-removed by the process to generate a band-limited and noise-removed output video for each picture in the video. and a reconstructing unit.
また、本発明の画像処理装置において、前記時間パワー変動量検出部は、各空間位相位置を中心とする所定ブロックサイズのブロックを基に、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出することを特徴とする。 Further, in the image processing apparatus of the present invention, the temporal power fluctuation amount detection unit detects the temporal power fluctuation for each spatial phase position regarding the picture to be processed based on a block of a predetermined block size centered at each spatial phase position. It is characterized by detecting quantity.
また、本発明の画像処理装置において、所定の圧縮符号化処理に係る参照ピクチャセットの情報を基に、当該処理対象のピクチャに対して符号化参照されることになる1枚以上の参照ピクチャを入力し、該参照ピクチャに対しn階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャを生成する第2の空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする。 Further, in the image processing apparatus of the present invention, one or more reference pictures to be encoded-referenced to the picture to be processed are selected based on the information of the reference picture set related to the predetermined compression encoding process. a second spatial wavelet packet for generating a reference picture represented by frequency resolution coefficients of each frequency band group in the spatial direction by performing n-th order (n≧2) spatial wavelet packet decomposition processing on the reference picture A decomposing unit, for each spatial phase position in each spatial direction frequency band group regarding the picture to be processed, for each block of a predetermined block size centered at each spatial phase position, for each spatial direction frequency band group. Perform block matching with respect to the reference picture represented by the frequency resolution coefficient, search for the matching amount showing the minimum similarity evaluation index, and perform temporal power matching for each spatial phase position on the picture to be processed for the minimum matching amount. a temporal power matching amount detection unit for detecting as a quantity, wherein the degeneracy function setting unit detects the noise power for the picture to be processed, the temporal power fluctuation amount for each spatial phase position, and each spatial phase position Based on the time power matching amount, the noise power defines the input value range of the degeneracy function for noise removal, and the larger the value of the time power fluctuation amount, the more the slope of the degeneracy function corresponding to the band limit amount. Assuming that the greater the value of the temporal power matching amount, the smaller the slope of the degeneracy function corresponding to the band limit amount, degeneracy is performed for each spatial phase position in all frequency band groups related to the picture to be processed. It is characterized by setting a function.
更に、本発明のプログラムは、コンピューターを、本発明の画像処理装置として機能させるためのプログラムとして構成する。 Furthermore, the program of the present invention constitutes a program for causing a computer to function as the image processing apparatus of the present invention.
本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。 According to the present invention, by using the image processing apparatus according to the present invention as pre-processing for compression encoding processing of a moving image, while predicting the encoding difficulty of the input moving image by spatio-temporal analysis, input moving image Since it is possible to adaptively set a degeneration function that performs noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of the image, it is possible to suppress image corruption in the subsequent compression encoding process, It is possible to improve the video coding quality.
以下、本発明による一実施形態の画像処理装置1について、図面を参照して詳細に説明する。
An
〔装置構成〕
図1は本発明による一実施形態の画像処理装置1の概略構成を示すブロック図である。本実施形態の画像処理装置1は、圧縮符号化処理の前処理として、動画像を入力し空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて画像処理を行う装置として構成され、空間ウェーブレットパケット分解部11、雑音パワー検出部12、時間パワー変動量検出部13、空間ウェーブレットパケット分解部14、時間パワーマッチング量検出部15、縮退関数設定部16、空間ウェーブレット縮退部17、及び再構成部18を備える。尚、図1に示す例において、画像処理装置1に対しウェーブレットパケット分解階数(n階)を外部指定可能とし、画像処理装置1内の必要とされる各構成要素に対し個別に外部指定するように図示しているが、パラメータとして伝送しながら処理する構成とすることも可能である。
〔Device configuration〕
FIG. 1 is a block diagram showing a schematic configuration of an
空間ウェーブレットパケット分解部11は、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)(t:処理対象とするフレーム画像の時刻)に対し空間ウェーブレットパケット分解処理を施し、これにより抽出される空間方向の各周波数帯域群の周波数分解係数を空間ウェーブレット縮退部17に出力する。尚、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域のうち空間対角最高周波数帯域内の周波数分解係数は雑音パワー検出部12にて抽出される。また、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域群の周波数分解係数は、時間パワー変動量検出部13、及び時間パワーマッチング量検出部15において、それぞれ詳細に後述する時間パワー変動量及び時間パワーマッチング量の検出に用いられる。
The spatial wavelet
図2を参照して、より具体的に処理対象のピクチャP(t)に対する空間ウェーブレットパケット分解について説明する。図2は本発明による一実施形態の画像処理装置1における一実施例の画像処理に係る処理対象のピクチャP(t)に対する2階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図であり、放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。この例では、時刻tのフレーム画像全体をピクチャP(t)としているが、時刻tのフレーム画像の一部を示すスライス画像やタイル画像(HEVC規格)をピクチャP(t)として扱うことができる。
Spatial wavelet packet decomposition for a picture P(t) to be processed will be described more specifically with reference to FIG. FIG. 2 is a diagram showing frequency bands obtained by second-order spatial wavelet packet decomposition for a picture P(t) to be processed according to one example of image processing in the
図2に示すように、入力動画像における処理対象のピクチャP(t)に対するn=2とした空間方向のみを処理対象とする2階空間ウェーブレットパケット分解では、入力動画像における処理対象のピクチャP(t)に対しそれぞれ水平・垂直方向に2階空間ウェーブレットパケット分解を行う。この場合、水平周波数×垂直周波数で表される図2に図示するような周波数領域に分解されたピクチャP’(i,j,t)が得られ、ピクチャP’(i,j,t)は、2階の空間低周波数帯域LLm(i,j,t)、水平高周波数帯域LHm(i,j,t)、垂直高周波数帯域HLm(i,j,t)、及び対角(水平・垂直)高周波数帯域HHm(i,j,t)の各周波数帯域群に分解される(mは各周波数帯域群の群番号であり、iは水平方向の周波数分解係数の空間位相座標を示し、jは垂直方向の周波数分解係数の空間位相座標を示す。)。尚、n階空間ウェーブレットハケット分解における各階間には、パーセバルの法則が成り立つものとなっている。 As shown in FIG. 2, in the second-order spatial wavelet packet decomposition in which only the spatial direction is processed with n=2 for the picture P(t) to be processed in the input video, the picture P(t) to be processed in the input video Second-order spatial wavelet packet decomposition is performed on (t) in the horizontal and vertical directions, respectively. In this case, a picture P'(i,j,t) decomposed into the frequency domain as shown in FIG. 2 represented by horizontal frequency*vertical frequency is obtained. , the second-order spatial low-frequency band LL m (i,j,t), the horizontal high-frequency band LH m (i,j,t), the vertical high-frequency band HL m (i,j,t), and the diagonal ( (horizontal/vertical) high frequency band HH m (i, j, t) is decomposed into each frequency band group (m is the group number of each frequency band group, i is the spatial phase coordinate of the horizontal frequency resolution coefficient and j indicates the spatial phase coordinate of the frequency-resolved coefficients in the vertical direction). Parseval's law holds between each level in the n-level spatial wavelet Hackett decomposition.
図1に示すように、雑音パワー検出部12は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH4(i,j,t))の成分(周波数分解係数)を抽出する。そして、雑音パワー検出部12は、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPNとして検出し縮退関数設定部16に出力する。
As shown in FIG. 1, the noise
時間パワー変動量検出部13は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)(aは時刻tに対する相対時刻を示すが、例えばa=1としたときは、直前のフレーム画像における対応する空間位置のピクチャP(t-1)を示す。)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。続いて、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(各周波数帯域内の周波数分解係数の空間位相を示す位置(i,j))で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、該ブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出し、縮退関数設定部16に出力する。尚、空間位相位置(i,j)毎の時間パワー変動量を検出するにあたり、上記のようにブロック領域で処理することでパワー値の精度及びこれに基づく縮退関数の設定値の精度が高くなる。
The temporal power fluctuation
空間ウェーブレットパケット分解部14は、本実施形態の画像処理装置1の出力動画像に対し圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定される。そして、空間ウェーブレットパケット分解部14は、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。例えば、空間ウェーブレットパケット分解部14は、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。
The spatial wavelet
時間パワーマッチング量検出部15は、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出し、縮退関数設定部16に出力する。ここで、類似度評価指数は、SSD(Sum of Squared Difference)値とすることや、SSD値以外にも、SAD(Sum of Absolute Difference)値、NCC(Normalized Cross-Correlation),ZNCC(Zero-means Normalized Cross-Correlation)等を利用できる。尚、空間位相位置(i,j)毎の時間パワーマッチング量を検出するにあたり、上記のようにブロック領域で処理することでマッチング量の精度及びこれに基づく縮退関数の設定値の精度が高くなる。
The temporal power matching
縮退関数設定部16は、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPNと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する。尚、縮退関数設定部16における縮退関数の設定において、雑音パワーPNは雑音除去する縮退関数の入力値範囲が規定され、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして設定される。
The degeneracy
空間ウェーブレット縮退部17は、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行する。これにより、空間ウェーブレット縮退部17は、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行い、帯域制限及び雑音除去後の各周波数帯域内の周波数分解係数を再構成部18に出力する。
The spatial wavelet degeneracy unit 17 applies the degeneracy function set by the degeneracy
再構成部18は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する。
The
〔装置動作〕
以下、より具体的に、図1及び図2に示す本実施形態の画像処理装置1の動作として、図4乃至図6を参照しながら、図3を基に一実施例の画像処理について説明する。
[Device operation]
Hereinafter, as the operation of the
図3は、本発明による一実施形態の画像処理装置1における一実施例の画像処理を示すフローチャートである。また、図4は本実施形態の画像処理装置1における時間パワー変動量の検出を示す説明図であり、図5は本実施形態の画像処理装置1における時間パワーマッチング量の検出を示す説明図である。尚、図6(a)は参照ピクチャセットを例示する図であり、図6(b),(c)はそれぞれ本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを例示する説明図である。
FIG. 3 is a flow chart showing an example of image processing in the
まず、画像処理装置1は、空間ウェーブレットパケット分解部11により、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)に対し空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を得る(ステップS1)。
First, the
続いて、画像処理装置1は、雑音パワー検出部12により、図2に示すピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH4(i,j,t))の成分(周波数分解係数)を抽出し、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPNとして検出する(ステップS2)。
Subsequently, the
一般に、信号成分のパワーは低周波数帯域に偏在する。一方、熱雑音などの雑音成分のパワーは全周波数帯域群でほぼ一定である。このため、n階空間ウェーブレットパケット分解による空間対角最高周波数帯域内の成分は雑音成分が支配的となる。そこで、雑音パワー検出部12は、空間対角最高周波数帯域の全成分(全周波数分解係数)のパワーをソートして、例えばα=95とすると、その上位95%番目の値を雑音パワーPNとする。
In general, the power of signal components is unevenly distributed in the low frequency band. On the other hand, the power of noise components such as thermal noise is almost constant over the entire frequency band group. For this reason, noise components are dominant in the components within the spatial diagonal maximum frequency band due to the n-th order spatial wavelet packet decomposition. Therefore, the noise
続いて、画像処理装置1は、時間パワー変動量検出部13により、ピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタFを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。
Subsequently, the
例えば、a=1としたとき、ピクチャP(t)(周波数領域ではピクチャP’(i,j,t))が属するフレーム画像に対し直前のフレーム画像における対応する空間位置のピクチャP(t-1)について、ピクチャP’(i,j,t)の各周波数帯域群を基準にした空間位相位置で時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。即ち、1階ウェーブレットパケット分解を行う時間ウェーブレットフィルタFをHaarウェーブレットフィルタとすると、そのタップ長は2となり、図4に示すように、ピクチャP’(i,j,t)の各周波数帯域群に対応する空間位相位置で、時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。 For example, when a=1, the picture P(t− For 1), a picture P'(i, j, t-1) is obtained that is frequency-resolved in the temporal direction at the spatial phase position with reference to each frequency band group of the picture P'(i, j, t). That is, if the temporal wavelet filter F that performs first-order wavelet packet decomposition is a Haar wavelet filter, its tap length is 2, and as shown in FIG. At the corresponding spatial phase position, a temporally frequency-resolved picture P'(i,j,t-1) is obtained.
そして、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(i,j)で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出する(ステップS3)。
Then, the temporal power fluctuation
例えば、時間パワー変動量検出部13は、図4に例示するように、或る周波数帯域(図示する例ではHL3)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、その空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーと、同空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーとの差分を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワー変動量PHL
3(i,j,t)として検出する。このように、時間パワー変動量検出部13は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワー変動量を検出する。
For example, as illustrated in FIG. 4, the temporal power fluctuation amount detection unit 13 detects a block size When 3×3 {Bx=3, By=3}, the power indicating the average or median value in the block area of the picture P′(i, j, t) at the spatial phase position (i, j); The difference between the power indicating the average value or the median value in the block area of the picture P'(i, j, t) at the same spatial phase position (i, j) is It is detected as the temporal power fluctuation amount P HL 3 (i, j, t) of the spatial phase position (i, j). In this way, the temporal power fluctuation
続いて、画像処理装置1は、空間ウェーブレットパケット分解部14により、圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定されると、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。
Subsequently, when the spatial wavelet
例えば、空間ウェーブレットパケット分解部14は、図5に例示するように、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。
For example, as illustrated in FIG. 5, the spatial wavelet
続いて、画像処理装置1は、時間パワーマッチング量検出部15により、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出する(ステップS4)。
Subsequently, the
例えば、時間パワーマッチング量検出部15は、図5に例示するように、或る周波数帯域(図示する例ではHL3)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、そのピクチャP’(i,j,t)の空間位相位置(i,j)について、参照ピクチャセット(RPS)の情報に基づいて定められる参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワーマッチング量MHL
3(i,j,t)として検出する。このように、時間パワーマッチング量検出部15は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワーマッチング量を検出する。
For example, as exemplified in FIG. 5 , the temporal power matching
尚、図6を参照して、参照ピクチャセット、及び本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを説明する。動画像の圧縮符号化技術として、例えばH.264/MPEG-4 AVC,H.265/MPEG-H HEVCなどでは、予測符号化処理前の動画像について複数の画面群に分割した所定グループを設定し、その所定グループ内で、予測符号化法として予め選択された画面間予測符号化処理や画面内予測符号化処理を行う。
Note that reference picture sets and block matching related to detection of the temporal power matching amount in the
H.264/MPEG-4 AVCでは、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したGOP(Group of Pictures)を設定する。そして、GOP内の各画面(フレーム、又はスライス画面)について、フレーム内予測符号化処理を行うIピクチャ、時間的に過去の画面から片方向フレーム間予測符号化処理を行うPピクチャ、又は時間的に前後に位置する画面から双方向フレーム間予測符号化処理を行うBピクチャが予め選択される。尚、H.264/MPEG-4 AVCでは、GOP内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。 H. In H.264/MPEG-4 AVC, a GOP (Group of Pictures) obtained by dividing a moving image before predictive coding into a plurality of screen groups is set as the predetermined group. Then, for each screen (frame or slice screen) in the GOP, an I picture for which intra-frame predictive coding processing is performed, a P picture for which unidirectional inter-frame predictive coding processing is performed from a temporally past screen, or a temporally A B-picture to be subjected to bidirectional inter-frame predictive coding processing is selected in advance from the screens located before and after the current picture. In addition, H. In H.264/MPEG-4 AVC, all pictures in a GOP can be compressed by a compression coding method that only performs intra-picture predictive coding.
また、H.265/MPEG-H HEVCにおいても、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したシーケンスを設定する。HEVC規格上ではGOPという概念を導入していないが、このシーケンスがGOPに相当する。そして、シーケンス内の各画面(フレーム画面、スライス画面、又はタイル画面)について、画面内予測符号化処理や画面間予測符号化処理を行う処理ユニットが予め選択される。尚、H.265/MPEG-H HEVCにおいても、シーケンス内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。 Also, H.I. Also in H.265/MPEG-H HEVC, a sequence obtained by dividing a moving image before predictive coding into a plurality of screen groups is set as the predetermined group. Although the HEVC standard does not introduce the concept of GOP, this sequence corresponds to GOP. Then, for each screen (frame screen, slice screen, or tile screen) in the sequence, a processing unit that performs intra-screen predictive encoding processing and inter-screen predictive encoding processing is selected in advance. In addition, H. Also in H.265/MPEG-H HEVC, all the pictures in the sequence can be compressed by the compression coding method of only the intra-picture predictive coding process.
そして、図6(a)に例示するように、圧縮符号化する動画像は、そのフレーム番号で示される各フレーム画像(ここでは、フレーム画像全体をピクチャとして例示)が、いずれのピクチャを参照対象として圧縮符号化を行うかが予め定められ、参照ピクチャセットとして識別できるようになっている。 Then, as illustrated in FIG. 6A, in the moving image to be compression-encoded, each frame image indicated by its frame number (here, the entire frame image is exemplified as a picture) refers to any picture. It is determined in advance whether compression encoding is performed as a set, and can be identified as a reference picture set.
そこで、画像処理装置1は、時間パワーマッチング量検出部15により、ピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、ブロックサイズ{Bx,By}のブロック毎に、例えば1枚の参照ピクチャP’(i,j,k)に対するときは図6(b)に示すように、或いは2枚の参照ピクチャP’(i,j,k1),P’(i,j,k2)に対するときは図6(c)に示すように、予め定めた探索範囲内でブロックマッチングを行って、個々のブロックマッチングで得られるマッチング量(SSD値を例にSSD1,SSD2,…)のうち最小となるマッチング量を時間パワーマッチング量として検出する。尚、当該参照ピクチャセットにおける参照ピクチャP’(i,j,k)が処理対象のピクチャP’(i,j,t)のIピクチャに該当するときは、当該時間パワーマッチング量検出部15の処理は省略するか、或いは、前回の参照ピクチャセットにおけるIピクチャ又は最終の符号化順のピクチャを参照ピクチャP’(i,j,k)として扱うように構成することができる。
Therefore, the
続いて、画像処理装置1は、縮退関数設定部16により、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPNと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する(ステップS5)。
Subsequently, the
特に、縮退関数設定部16は、雑音パワーPNは雑音除去する縮退関数の入力値範囲を規定するものとし、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、縮退関数を設定する。
In particular, the degeneracy
例えば、図7(a)は、本実施形態の画像処理装置1における一実施例の画像処理に係る縮退関数の説明図である。図7(a)に示す入力xに対する出力yで示される縮退関数は、雑音パワーPNの絶対値以下で定まる入力値をゼロ値まで雑音除去するよう縮退関数の入力値範囲を規定するものとし、雑音パワーPNの絶対値を超える入力値については、上述した図4に示す空間位相位置(i,j)の時間パワー変動量PHL
3(i,j,t)と、上述した図5に示す同空間位相位置(i,j)の時間パワーマッチング量MHL
3(i,j,t)とで定まる帯域制限とし、時間パワー変動量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとする。これは、時間パワー変動量の値が大きいほど、更には時間パワーマッチング量の値が大きいほど、圧縮符号化が難しく符号化に起因する画像劣化が起こりやすいとみなしているためである。尚、β,γは任意に定められる定数である。
For example, FIG. 7A is an explanatory diagram of a degeneration function related to image processing of one example in the
(変形例)
尚、上述した実施形態の例では、雑音パワー、時間パワー変動量及び時間パワーマッチング量を用いて縮退関数の設定を行う例を説明したが、画像処理装置1において、空間ウェーブレットパケット分解部14、及び時間パワーマッチング量検出部15を省略し、雑音パワー、及び時間パワー変動量を用いて縮退関数の設定を行う構成としてもよい。この変形例の縮退関数を図7(b)に例示している。図7(b)に示す例においても、時間パワー変動量の値が大きいほど縮退関数の傾きを小さくするものとし、これにより、比較的多くの動画像において生じる圧縮符号化が難しく符号化に起因する画像劣化が起こりやすい現象を、抑制させることができる。
(Modification)
In the example of the embodiment described above, an example of setting the degeneracy function using the noise power, the amount of temporal power fluctuation, and the amount of temporal power matching has been described. and the temporal power matching
続いて、画像処理装置1は、空間ウェーブレット縮退部17により、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行することより、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行う(ステップS6)。
Subsequently, the spatial wavelet degeneracy unit 17 of the
最終的に、画像処理装置1は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する(ステップS7)。
Finally, the
以上のように、本実施形態の画像処理装置1は、動画像の圧縮符号化処理の前処理として利用し、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。
As described above, the
(応用例)
上述した実施形態の例では、空間ウェーブレットパケット分解部11及び空間ウェーブレットパケット分解部14において、n=2とした2階空間ウェーブレットパケット分解で動作するときの例を主として説明したが、n≧3以上とすることもできる。例えば、図8に示すように、n=3とした3階空間ウェーブレットパケット分解で動作させることもできる。図8では放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。尚、図8に示す例では、雑音パワー検出部12は、ピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=3としており、空間HH16(i,j,t))の成分(周波数分解係数)を基に雑音パワーを検出する。n=3とした空間方向を処理対象とする3階空間ウェーブレットパケット分解を用いる画像処理装置1では、より細かく雑音パワー、時間パワー変動量及び時間パワーマッチング量を設定した縮退関数で、動画像に対し雑音除去及び帯域制限を行うことができる。
(Application example)
In the above-described example of the embodiment, the spatial wavelet
以上の実施形態における画像処理装置1は、コンピューターにより構成することができ、画像処理装置1の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、画像処理装置1の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、画像処理装置1の各処理部の有する機能を実現させることができる。更に、画像処理装置1の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、画像処理装置1の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、画像処理装置1の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。
The
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施形態の例では、主として、2階又は3階空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う例を説明したが、4階以上の空間ウェーブレットパケット分解に基づいた空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う処理とすることもできる。従って、本発明に係る画像処理装置1は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。
Although the present invention has been described with reference to specific embodiments, the present invention is not limited to the above-described embodiments, and can be modified in various ways without departing from the technical idea thereof. For example, in the examples of the embodiments described above, examples were mainly described in which noise removal and band limitation were performed using spatial wavelet degeneration based on second or third order spatial wavelet packet decomposition. It can also be a process that denoises and bandlimits using spatial wavelet shrinkage based on . Therefore, the
本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定し、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となるので、特に、動画像符号化を要する用途に有用である。 According to the present invention, by using the image processing apparatus according to the present invention as pre-processing for compression encoding processing of a moving image, while predicting the encoding difficulty of the input moving image by spatio-temporal analysis, input moving image It is possible to adaptively set a degeneration function that performs noise removal and band limitation for each spatial phase position in the frequency domain in each frame image of an image, suppressing image corruption in the subsequent compression coding process, and moving image coding. Since it is possible to improve the quality, it is particularly useful for applications requiring video coding.
1 画像処理装置
11 空間ウェーブレットパケット分解部
12 雑音パワー検出部
13 時間パワー変動量検出部
14 空間ウェーブレットパケット分解部
15 時間パワーマッチング量検出部
16 縮退関数設定部
17 空間ウェーブレット縮退部
18 再構成部
1
Claims (4)
当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、
前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、
前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、
前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、
を備えることを特徴とする画像処理装置。 An image processing device for inputting a moving image and performing image processing using wavelet degeneration based on wavelet packet decomposition,
a spatial wavelet packet decomposition unit that inputs a picture to be processed in the moving image, performs n-th order (n≧2) spatial wavelet packet decomposition processing, and extracts frequency decomposition coefficients of each frequency band group in the spatial direction;
extracting a frequency resolution coefficient of a spatial diagonal maximum frequency band from among the spatial direction frequency band groups for the picture to be processed, and extracting a predetermined ratio of the power of all frequency resolution coefficients in the spatial diagonal maximum frequency band; a noise power detection unit that detects power equal to or higher than the noise component as noise power;
Based on each frequency band group in the spatial direction related to the picture to be processed, in the temporal direction using a picture at a corresponding spatial position in a frame image immediately adjacent to the frame image to which the picture to be processed belongs a temporal power fluctuation amount detection unit that performs first-order wavelet packet decomposition and detects the temporal power fluctuation amount for each spatial phase position regarding the picture to be processed;
Based on the noise power for the picture to be processed and the temporal power fluctuation amount for each spatial phase position, the noise power shall define the input value range of the degeneration function for noise removal, and the temporal power fluctuation amount shall be the a degeneracy function setting unit that sets a degeneracy function for each spatial phase position in all frequency band groups related to the picture to be processed so that the slope of the degeneracy function corresponding to the amount of band limitation decreases as the value increases;
Spatial wavelet degeneration that performs spatial wavelet degeneration processing based on the spatial wavelet packet decomposition processing by applying the degeneration function to the frequency resolution coefficients of each frequency band group related to the picture to be processed and executing the spatial wavelet degeneration processing. Department and
By performing spatial wavelet reconstruction processing using frequency resolution coefficients of each frequency band group band-limited and noise-removed by the spatial wavelet degeneration processing for the picture to be processed, band-limiting and noise-removing for each picture in the moving image a reconstructor that generates a denoised output video image;
An image processing device comprising:
前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、
前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする、請求項1又は2に記載の画像処理装置。 Based on the information of the reference picture set related to the predetermined compression encoding process, one or more reference pictures to be encoded and referenced for the picture to be processed are input, and the n-th order is applied to the reference picture. a second spatial wavelet packet decomposition unit that performs (n≧2) spatial wavelet packet decomposition processing and generates a reference picture represented by frequency decomposition coefficients of each frequency band group in the spatial direction;
For each spatial phase position in each frequency band group in the spatial direction regarding the picture to be processed, for each block of a predetermined block size centered at each spatial phase position, with frequency resolution coefficients of each frequency band group in the spatial direction Perform block matching on the represented reference picture, search for the matching amount showing the minimum similarity evaluation index, and detect the minimum matching amount as the temporal power matching amount for each spatial phase position regarding the picture to be processed. and a time power matching amount detection unit,
The degeneracy function setting unit removes noise from the noise power based on the noise power for the picture to be processed, the temporal power fluctuation amount for each spatial phase position, and the temporal power matching amount for each spatial phase position. The input value range of the degeneracy function is defined, and the greater the value of the temporal power fluctuation amount, the smaller the slope of the degeneracy function corresponding to the band limitation amount. 3. The method according to claim 1 or 2, wherein a degeneration function is set for each spatial phase position in all frequency band groups related to the picture to be processed, as a slope of the degeneration function corresponding to the amount of band limitation is reduced. The described image processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088513A JP7303661B2 (en) | 2019-05-08 | 2019-05-08 | Image processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088513A JP7303661B2 (en) | 2019-05-08 | 2019-05-08 | Image processing device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020184693A JP2020184693A (en) | 2020-11-12 |
JP7303661B2 true JP7303661B2 (en) | 2023-07-05 |
Family
ID=73044619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019088513A Active JP7303661B2 (en) | 2019-05-08 | 2019-05-08 | Image processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7303661B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115456918B (en) * | 2022-11-11 | 2023-03-24 | 之江实验室 | Image denoising method and device based on wavelet high-frequency channel synthesis |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010232892A (en) | 2009-03-26 | 2010-10-14 | Nippon Hoso Kyokai <Nhk> | Threshold-function control-type wavelet shrinkage noise eliminator and program |
JP2010239296A (en) | 2009-03-30 | 2010-10-21 | Nippon Hoso Kyokai <Nhk> | Moving image noise cancellation apparatus, moving regional image noise cancellation apparatus, moving image noise cancellation program, and moving regional image cancellation program |
JP2018173857A (en) | 2017-03-31 | 2018-11-08 | 日本放送協会 | Bandwidth limitation device and program |
-
2019
- 2019-05-08 JP JP2019088513A patent/JP7303661B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010232892A (en) | 2009-03-26 | 2010-10-14 | Nippon Hoso Kyokai <Nhk> | Threshold-function control-type wavelet shrinkage noise eliminator and program |
JP2010239296A (en) | 2009-03-30 | 2010-10-21 | Nippon Hoso Kyokai <Nhk> | Moving image noise cancellation apparatus, moving regional image noise cancellation apparatus, moving image noise cancellation program, and moving regional image cancellation program |
JP2018173857A (en) | 2017-03-31 | 2018-11-08 | 日本放送協会 | Bandwidth limitation device and program |
Also Published As
Publication number | Publication date |
---|---|
JP2020184693A (en) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7548660B2 (en) | System and method of spatio-temporal edge-preserved filtering techniques to reduce ringing and mosquito noise of digital pictures | |
JP3714944B2 (en) | Image coding apparatus and image decoding apparatus | |
US7804896B2 (en) | Content adaptive noise reduction filtering for image signals | |
JP6729170B2 (en) | Image processing system and image decoding device | |
US8380001B2 (en) | Edge adaptive deblocking filter and methods for use therewith | |
JP2003244702A (en) | Filtering method and apparatus for removing blocking artifact | |
IL230271A (en) | Signal processing and inheritance in a tiered signal quality hierarchy | |
JP2006229411A (en) | Image decoder and image decoding method | |
JP7303661B2 (en) | Image processing device and program | |
JP6915473B2 (en) | Coding devices and programs, decoding devices and programs, and image processing systems | |
JP7290985B2 (en) | Image processing device and program | |
Del Corso et al. | MNR: A novel approach to correct MPEG temporal distortions | |
JP7290968B2 (en) | Image processing device and program | |
JP7071216B2 (en) | Bandwidth limiting device and program | |
JPH08191444A (en) | Video signal decoder | |
JP2005197879A (en) | Video signal coding apparatus | |
Kumar et al. | A Novel Blurring based Method for Video Compression | |
JP2022041172A (en) | Band limitation device and program | |
JP2007538451A (en) | Algorithms to reduce artifacts in decoded video | |
JP2007104515A (en) | Video encoding pre-filtering method, apparatus, and program, and computer readable recording medium with the program recorded thereon | |
Martínez-Rach et al. | Perceptually enhanced encoder for high definition video content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220408 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7303661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |