JP6864557B2 - Encoding device, decoding device, and program - Google Patents
Encoding device, decoding device, and program Download PDFInfo
- Publication number
- JP6864557B2 JP6864557B2 JP2017102924A JP2017102924A JP6864557B2 JP 6864557 B2 JP6864557 B2 JP 6864557B2 JP 2017102924 A JP2017102924 A JP 2017102924A JP 2017102924 A JP2017102924 A JP 2017102924A JP 6864557 B2 JP6864557 B2 JP 6864557B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- reduced image
- frequency
- frequency component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000354 decomposition reaction Methods 0.000 claims description 55
- 238000013139 quantization Methods 0.000 claims description 48
- 238000007906 compression Methods 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 10
- 230000006837 decompression Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 description 25
- 238000000034 method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 6
- 239000000470 constituent Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、符号化装置、復号装置、及びそれらのプログラムに関する。 The present invention relates to a coding device, a decoding device, and a program thereof.
従来、入力画像を縮小した後に、符号化及び復号し、復号した縮小画像を超解像処理して復元する技術が知られている。例えば、特許文献1には、縮小後に符号化・復号した映像を、フレーム間動きベクトルを用いて高解像度化する装置が開示されている。
Conventionally, there is known a technique in which an input image is reduced, then encoded and decoded, and the decoded reduced image is subjected to super-resolution processing to be restored. For example,
また、特許文献2には、データ圧縮を行いつつ、不自然さを感じさせないテクスチャの表現方法を提供する装置が開示されている。具体的には、入力信号を2つの周波数領域のサブバンドに分離して、低周波成分は従来の符号化装置によって符号化し、高周波成分は代表的なテクスチャパラメータを計算するために分析され、計算したテクスチャパラメータを復号側に送信する。そして、復号側で低周波成分を復号し、高周波成分は不自然ではないテクスチャと置き換る。
Further,
しかし、特許文献1に記載の装置においては、動いていない箇所では高解像度化が難しく、また、復号映像のフレーム間動きベクトルを用いて高解像度化することもできるが、高画質な高解像度化を行うには符号化側で入力映像のフレーム間動きベクトルを求めてこれを復号側へ伝送する必要がある、という課題がある。
However, in the apparatus described in
また、特許文献2に記載の装置においては、高周波成分のテクスチャパラメータを伝送する必要があり、また、復号側にテクスチャパラメータに基づく高周波成分のデータベースを用意しておく必要がある、という課題がある。
Further, the apparatus described in
かかる事情に鑑みてなされた本発明の目的は、上記課題を解決し、入力画像を縮小して符号化効率を向上させるとともに、縮小処理及び符号化処理により失われた高周波成分を高画質に超解像復元することが可能な映像符号化装置、映像復号装置、及びプログラムを提供することにある。 An object of the present invention made in view of such circumstances is to solve the above problems, reduce the input image to improve the coding efficiency, and superimpose the high frequency component lost by the reduction process and the coding process in high image quality. It is an object of the present invention to provide a video coding device, a video decoding device, and a program capable of resolving and restoring.
上記課題を解決するため、本発明に係る符号化装置は、入力画像を縮小した後に符号化する符号化装置であって、入力画像に対して周波数分解処理を行って縮小画像を生成する縮小画像生成部と、前記縮小画像に対して量子化処理を行って量子化係数を生成する圧縮部と、前記量子化係数に対して伸張処理を行って縮小画像を復元し、復元縮小画像として出力する伸張部と、前記復元縮小画像に対して周波数分解処理して高周波成分画像を生成し、該高周波成分画像のうち、パワー値が第1の閾値以上となる周波数帯域を使用帯域として決定する使用帯域決定部と、前記量子化係数及び前記使用帯域を示す使用帯域情報を符号化したビットストリームを生成する符号化部と、を備えることを特徴とする。 In order to solve the above problems, the coding device according to the present invention is a coding device that encodes after reducing the input image, and is a reduced image that performs frequency decomposition processing on the input image to generate a reduced image. A generation unit, a compression unit that performs quantization processing on the reduced image to generate a quantization coefficient, and a compression unit that performs decompression processing on the quantization coefficient to restore the reduced image and output it as a restored reduced image. The stretched portion and the restored / reduced image are subjected to frequency decomposition processing to generate a high-frequency component image, and the frequency band in which the power value is equal to or higher than the first threshold value is determined as the used band in the high-frequency component image. It is characterized by including a determination unit and a coding unit that generates a bit stream in which the quantization coefficient and the usage band information indicating the usage band are encoded.
さらに、本発明に係る符号化装置において、前記縮小画像生成部は、前記入力画像に対してn階ウェーブレット分解処理を行って低周波成分画像を生成し、該低周波成分画像の各画素値を整数化して前記縮小画像とし、前記使用帯域決定部は、前記復元縮小画像に対してm階ウェーブレット分解処理を行って前記高周波成分画像を生成することを特徴とする。 Further, in the coding apparatus according to the present invention, the reduced image generation unit performs n-th order wavelet decomposition processing on the input image to generate a low frequency component image, and generates each pixel value of the low frequency component image. The reduced image is converted into an integer, and the band used determination unit is characterized in that the restored and reduced image is subjected to m-th order wavelet decomposition processing to generate the high frequency component image.
さらに、本発明に係る符号化装置において、前記使用帯域決定部は、前記nの値が所定値以上である場合には、前記高周波成分画像のうち、前記パワー値が前記第1の閾値以上であり、且つ周波数が第2の閾値以下となる周波数帯域を前記使用帯域として決定することを特徴とする。 Further, in the coding apparatus according to the present invention, when the value of n is equal to or higher than a predetermined value, the power value of the high frequency component image is equal to or higher than the first threshold value. It is characterized in that a frequency band that is present and whose frequency is equal to or lower than the second threshold value is determined as the band to be used.
さらに、本発明に係る符号化装置において、前記使用帯域決定部は、前記nの値が大きいほど、前記第2の閾値を小さくすることを特徴とする。 Further, in the coding apparatus according to the present invention, the band used determining unit is characterized in that the larger the value of n, the smaller the second threshold value.
また、上記課題を解決するため、本発明に係る復号装置は、縮小された縮小画像を復元した後に超解像処理する復号装置であって、前記縮小画像の量子化係数と、超解像処理で使用する使用帯域を示す使用帯域情報とを取得する取得部と、前記量子化係数を逆量子化処理して前記縮小画像を復元し、復元縮小画像として出力する縮小画像復元部と、前記復元縮小画像に対して周波数分解処理して、前記使用帯域の高周波成分画像を生成し、該高周波成分画像を前記復元縮小画像の高周波成分に割り付けることにより超解像画像を生成する超解像復元部と、を備えることを特徴とする。 Further, in order to solve the above problems, the decoding device according to the present invention is a decoding device that performs super-resolution processing after restoring a reduced reduced image, and has a quantization coefficient of the reduced image and super-resolution processing. An acquisition unit that acquires used band information indicating the used band used in the above, a reduced image restoration unit that restores the reduced image by dequantizing the quantization coefficient and outputs it as a restored reduced image, and the restoration. A super-resolution restoration unit that generates a super-resolution image by performing frequency decomposition processing on a reduced image to generate a high-frequency component image of the used band and allocating the high-frequency component image to the high-frequency component of the restored reduced image. It is characterized by having.
また、上記課題を解決するため、本発明に係る復号装置は、縮小された縮小画像を復元した後に超解像処理する復号装置であって、前記縮小画像の量子化係数を取得する取得部と、前記量子化係数を逆量子化処理して前記縮小画像を復元し、復元縮小画像として出力する縮小画像復元部と、前記復元縮小画像に対して周波数分解処理して高周波成分画像を生成し、該高周波成分画像のうち、パワー値が第1の閾値以上となる周波数帯域を使用帯域として決定する使用帯域決定部と、前記復元縮小画像を周波数分解処理して、前記使用帯域の高周波成分画像を生成し、該高周波成分画像を前記縮小画像の高周波成分に割り付けることにより超解像画像を生成する超解像復元部と、を備えること特徴とする。 Further, in order to solve the above problems, the decoding device according to the present invention is a decoding device that performs super-resolution processing after restoring a reduced reduced image, and includes an acquisition unit that acquires a quantization coefficient of the reduced image. A reduced image restoration unit that reverse-quantizes the quantization coefficient to restore the reduced image and outputs it as a restored reduced image, and a frequency decomposition process on the restored reduced image to generate a high-frequency component image. Among the high-frequency component images, a frequency band in which the power value is equal to or higher than the first threshold value is determined as the used band, and the restored and reduced image is frequency-resolved to obtain a high-frequency component image of the used band. It is characterized by including a super-resolution restoration unit that generates a super-resolution image by generating and allocating the high-frequency component image to the high-frequency component of the reduced image.
さらに、本発明に係る復号装置において、前記超解像復元部は、前記復元縮小画像に対してウェーブレット分解処理を行って前記使用帯域を含む周波数分解画像を生成する周波数分解部と、前記復元縮小画像と、前記周波数分解画像の低周波成分画像との間で類似するブロックの位置関係を示す位置合わせ情報を生成する位置合わせ部と、前記位置合わせ情報に従って、前記復元縮小画像の高周波成分として、前記周波数分解画像の高周波成分画像を割り付けて超解像高周波成分画像を生成する超解像高周波成分割付部と、前記復元縮小画像を低周波成分とし、前記超解像高周波成分画像を高周波成分として周波数再構成処理して前記超解像画像を生成する周波数再構成部と、を備えること特徴とする。 Further, in the decoding device according to the present invention, the super-resolution restoration unit includes a frequency decomposition unit that performs wavelet decomposition processing on the restoration / reduction image to generate a frequency decomposition image including the band used, and the restoration / reduction unit. An alignment unit that generates alignment information indicating the positional relationship of similar blocks between the image and the low-frequency component image of the frequency-resolved image, and as a high-frequency component of the restored and reduced image according to the alignment information. The super-resolution high-frequency component image that allocates the high-frequency component image of the frequency-resolved image to generate the super-resolution high-frequency component image, the restored and reduced image as the low-frequency component, and the super-resolution high-frequency component image as the high-frequency component It is characterized by including a frequency reconstruction unit that performs frequency reconstruction processing to generate the super-resolution image.
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記符号化装置として機能させることを特徴とする。 Further, in order to solve the above problems, the program according to the present invention is characterized in that the computer functions as the coding device.
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記復号装置として機能させることを特徴とする。 Further, in order to solve the above problems, the program according to the present invention is characterized in that the computer functions as the decoding device.
本発明によれば、符号化側において、入力画像を縮小するため、符号化効率を向上させることができる。また、復号側において、符号化側の縮小処理及び符号化処理により失われた高周波成分を、高画質に超解像復元することができる。 According to the present invention, since the input image is reduced on the coding side, the coding efficiency can be improved. Further, on the decoding side, the high frequency component lost by the reduction processing and the coding processing on the coding side can be super-resolution restored with high image quality.
以下、本発明の実施形態について、図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(符号化装置)
図1は、本発明の第1の実施形態に係る符号化装置1の構成例を示すブロック図である。符号化装置1は、入力画像を縮小した後に符号化し、ビットストリームを生成して外部に出力する。図1に示す例では、符号化装置1は、縮小画像生成部10と、圧縮部20と、伸張部30と、使用帯域決定部40と、エントロピー符号化部50とを備える。
(Encoding device)
FIG. 1 is a block diagram showing a configuration example of the
縮小画像生成部10は、入力画像に対して周波数分解(多重解像度分解)処理を行って低周波成分を四捨五入などにより整数化し、縮小画像として生成し、圧縮部20に出力する。縮小率は伝送容量に応じて適宜決定可能である。縮小画像生成部10は、周波数分解として、ウェーブレット分解を用いることができる。n階ウェーブレット分解をした場合には、入力画像の低周波成分画像LLnが生成される。ここで、添え字のnは分解階数を意味する。
The reduced
図2は、縮小画像生成部10の処理例を示す図である。図2では、入力画像に対する1階ウェーブレット分解処理を示している。低周波成分画像LL1の各画素値を四捨五入などにより整数化して縮小画像とする。高周波成分画像LH1,HL1,HH1は使用されないため、縮小画像生成部10から出力しない。図2の例では分解階数n=1であるため、水平方向及び垂直方向の縮小率がともに1/2の縮小画像が生成される。
FIG. 2 is a diagram showing a processing example of the reduced
圧縮部20は、縮小画像生成部10により生成された縮小画像に対して量子化処理を行って量子化係数を生成し、伸張部30及びエントロピー符号化部50に出力する。圧縮部20の処理は、JPEG2000、AVC/H.264、HEVC/H.265などの既知の方式により行う。
The
圧縮部20は、例えば図1に示すように、ブロック分割部21と、減算部22と、変換部23と、量子化部24と、予測部25とを備える。
As shown in FIG. 1, for example, the
ブロック分割部21は、縮小画像生成部10により生成された縮小画像を複数のブロックに分割し、ブロック画像を減算部22、及び予測部25に出力する。ブロックのサイズは可変サイズであってもよく、例えば32×32画素、16×16画素、8×8画素、又は4×4画素とする。
The
減算部22は、ブロック分割部21により生成されたブロック画像の各画素値から、後述する予測部25から入力された予測画像の各画素値を減算して残差ブロック画像を生成し、変換部23に出力する。
The
変換部23は、減算部22から入力された残差ブロック画像に対して直交変換などの変換処理を行って二次元変換処理された変換係数を算出し、ブロックごとの変換係数を量子化部24に出力する。
The
量子化部24は、変換部23から入力されたブロックごとの変換係数を量子化ステップで除算して量子化することにより量子化係数を生成し、伸張部30及びエントロピー符号化部50に出力する。
The
予測部25は、後述する記憶部34に記憶された復元縮小画像を参照してイントラ予測又はインター予測を行って予測画像を生成し、減算部22に出力する。また、イントラ予測を行った場合には選択したイントラ予測モードを示す予測情報をエントロピー符号化部50に出力し、インター予測を行った場合には動きベクトルを示す予測情報をエントロピー符号化部50に出力する。
The
伸張部30は、圧縮部20により生成された量子化係数に対して伸張処理を行って縮小画像を復元し、復元縮小画像として使用帯域決定部40に出力する。伸張部30の処理は、JPEG2000、AVC/H.264、HEVC/H.265などの既知の方式により行う。
The
伸張部30は、例えば図1に示すように、逆量子化部31と、逆変換部32と、加算部33と、記憶部34とを備える。
As shown in FIG. 1, for example, the stretching
逆量子化部31は、量子化部24から入力された量子化係数に対して、量子化ステップを乗ずることによりブロックごとの変換係数を復元し、逆変換部32に出力する。
The
逆変換部32は、逆量子化部31から入力された変換係数に対して、変換部23で行った変換の逆変換を行って残差ブロック画像を復元し、加算部33に出力する。例えば、変換部23が離散コサイン変換を行った場合には、逆変換部32は逆離散コサイン変換を行う。
The inverse transformation unit 32 performs the inverse transformation of the transformation performed by the
加算部33は、逆変換部32から入力された残差ブロック画像と、予測部25から入力された予測画像の各画素値とを加算して復元縮小画像をブロック単位で生成し、記憶部34に出力する。
The
使用帯域決定部40は、復元縮小画像に対して周波数分解処理し、高周波成分画像を生成する。使用帯域決定部40は、周波数分解として、ウェーブレット分解を用いることができる。本実施形態では、m階ウェーブレット分解処理して高周波成分画像LHk,HLk,HHk(k=1〜m)を生成する。そして、使用帯域決定部40は、高周波成分画像LHk,HLk,HHkから、後述する復号装置における超解像処理で使用される帯域である使用帯域αを決定し、使用帯域αを示す使用帯域情報をエントロピー符号化部50に出力する。
The band used
使用帯域決定部40による使用帯域決定方法について、以下に説明する。第1の使用帯域決定方法では、高周波成分画像LHk,HLk,HHkのうち、パワー値が閾値P以上となる周波数帯域を使用帯域αと決定する。パワー値は、例えばRMS(Root Mean Square)値とする。高周波成分画像LHk,HLk,HHkのパワー値のいずれかが閾値P以上であれば、該高周波成分画像LHk,HLk,HHkの周波数帯域全てを使用帯域αとしてもよい。例えば、分解階数m=5で、高周波成分画像LH3とHL4のパワー値が閾値以上であれば、高周波成分画像LH3,HL3,HH3,LH4,HL4,HH4の周波数帯域を使用帯域αと決定する。この場合、使用帯域αを分解階数で示すことも可能なので、α=3,4としてもよい。
The method of determining the used band by the used
次に、第2の使用帯域決定方法では、縮小画像生成部10におけるウェーブレット分解の分解階数nが所定値x(例えば、x=2)以上である場合には、パワー値が閾値P以上であり、且つ周波数が閾値F以下となる周波数帯域を使用帯域αと決定する。この理由は、縮小画像生成部10におけるウェーブレット分解の分解階数nが大きくなると縮小画像に折り返しひずみが生じる。この場合に、復号側で、復元した縮小画像を再度n階ウェーブレット分解して超解像処理するときに高周波成分を使用帯域とすると、画像が劣化するおそれがあるからである。
Next, in the second used band determination method, when the decomposition order n of the wavelet decomposition in the reduced
さらに、第3の使用帯域決定方法では、第2の使用帯域決定方法において、分解階数nが大きいほど閾値Fを小さくする。分解階数が大きいほど、生成される画像の周波数帯域は低くなるため、具体的には、使用帯域を(n+1)階以上の高周波成分画像から決定するようにしてもよい。例えば、第2の使用帯域決定方法で例示したように分解階数m=5で、LH3とHL4のRMS値が閾値P以上であった場合に、n=3であるときには、高周波成分画像LH4,HL4,HH4の周波数帯域を使用帯域αと決定する。 Further, in the third used band determining method, in the second used band determining method, the larger the decomposition rank n, the smaller the threshold value F. The larger the decomposition order, the lower the frequency band of the generated image. Therefore, specifically, the band to be used may be determined from the high frequency component image of the (n + 1) order or higher. For example, when the decomposition order m = 5 and the RMS values of LH 3 and HL 4 are equal to or higher than the threshold value P as illustrated in the second method for determining the band to be used, and n = 3, the high frequency component image LH The frequency bands of 4 , HL 4 , and HH 4 are determined as the used band α.
エントロピー符号化部50は、量子化部24から入力された量子化係数、予測部25から入力された予測情報、及び使用帯域決定部40から入力された使用帯域情報に対してエントロピー符号化を行い、データ圧縮を行ってビットストリームを生成し、符号化装置1の外部に出力する。
The
ここで、上述した符号化装置1として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
Here, a computer can be preferably used to function as the
上述したように、本発明に係る符号化装置及びそのプログラムは、入力画像を縮小した縮小画像を生成するとともに、縮小画像を復元した復元縮小画像の解析を行い、復号側の超解像処理に使用する使用帯域を決定する。これにより、余分な情報(高周波成分のテクスチャパラメータなど)を別途復号側に伝送する必要がなくなり、符号化効率を向上させることが可能となる。 As described above, the coding apparatus and its program according to the present invention generate a reduced image obtained by reducing the input image, analyze the restored reduced image obtained by restoring the reduced image, and perform super-resolution processing on the decoding side. Determine the band to use. As a result, it is not necessary to separately transmit extra information (texture parameters of high frequency components, etc.) to the decoding side, and it is possible to improve the coding efficiency.
(復号装置)
次に、復号装置について説明する。図3は、本発明の第2の実施形態に係る復号装置3の構成例を示すブロック図である。
(Decoding device)
Next, the decoding device will be described. FIG. 3 is a block diagram showing a configuration example of the
復号装置3は、符号化装置1からビットストリームを取得し、縮小された縮小画像を復号した後に超解像処理し、縮小画像よりも解像度の高い超解像画像を生成する。図3に示す例では、復号装置3は、エントロピー復号部(取得部)60と、縮小画像復元部70と、超解像復元部80とを備える。
The
エントロピー復号部60は、符号化装置1のエントロピー符号化部50と対をなし、エントロピー符号化部50で符号化されたビットストリームを復号し、縮小画像の量子化係数、予測処理に必要な情報である予測情報、及び超解像処理に必要な情報である使用帯域情報を取得する。そして、量子化係数を逆量子化部71に出力し、予測情報を予測部75に出力し、使用帯域情報を超解像復元部80に出力する。
The
縮小画像復元部70は、エントロピー復号部60により復号された、縮小画像の量子化係数を入力し、逆量子化処理して縮小画像を復元し、復元縮小画像として超解像復元部80に出力する。図3に示す例では、縮小画像復元部70は、逆量子化部71と、逆変換部72と、加算部73と、記憶部74と、予測部75とを備える。
The reduced
逆量子化部71は、エントロピー復号部60から入力された量子化係数に量子化ステップを乗算してブロックごとの変換係数を復元し、逆変換部72に出力する。なお、量子化ステップは符号化装置1から取得してもよいし、予め符号化装置1と共通の量子化テーブルを有していてもよい。
The
逆変換部72は、逆量子化部71から入力された変換係数に対して逆変換を行って残差ブロック画像を復元し、加算部73に出力する。逆変換は、符号化装置1の逆変換部32と同じ処理である。
The
加算部73は、逆変換部72から入力された残差ブロック画像と、予測部75から入力された予測画像の各画素値とを加算し、復元縮小画像をブロック単位で生成し、記憶部74、及び超解像復元部80に出力する。
The
記憶部74は、加算部73から入力された復号ブロック画像を記憶する。
The
予測部75は、記憶部74に記憶された復元縮小画像を参照し、エントロピー復号部60から入力された予測情報に従って予測処理を行って予測画像を生成し、加算部73に出力する。
The
超解像復元部80は、縮小画像復元部70により復元された縮小画像(復元縮小画像)を、周波数分解処理する。その際に、エントロピー復号部60により復号された使用帯域情報が示す使用帯域αの高周波成分画像を生成し、該高周波成分画像を復元縮小画像の高周波成分に割り付けることにより超解像画像を生成し、復号装置3の外部に出力する。
The
図4は、超解像復元部80の構成例を示すブロック図である。図4に示す例では、超解像復元部80は、周波数分解部81と、位置合わせ部82と、超解像高周波成分割付部83と、周波数再構成部84とを備える。
FIG. 4 is a block diagram showing a configuration example of the
周波数分解部81は、エントロピー復号部60から使用帯域αを取得する。そして、復元縮小画像に対して周波数分解(多重解像度分解)処理を行って使用帯域αを含む周波数分解画像を生成し、位置合わせ部82に出力する。周波数分解部81は、周波数分解処理として、ウェーブレット分解処理を行うことができる。以下の説明では、αが分解階数を示しているものとする。周波数分解画像は、縮小画像の低周波成分画像LLαと、縮小画像の高周波成分画像である水平高周波成分画像LHα、垂直高周波成分画像HLα、及び対角高周波成分画像HHαとからなる。
The
位置合わせ部82は、復元縮小画像と低周波成分画像LLαとの間で対応する位置関係を示す位置合わせ情報(レジストレーション情報)を生成し、超解像高周波成分割付部83に出力する。
The
図5は、位置合わせ部82における位置合わせ処理の概要を示す図である。位置合わせ部82は、例えば復元縮小画像を基準フレームとし、低周波成分画像LLαを参照フレームとして、両フレーム間でブロックマッチングを行い、探索範囲内で類似度(相関性)の最も高いブロックの位置関係を示す位置合わせ情報を生成する。図5ではα=1としているが、αは複数であってもよい。ブロックマッチングは、絶対値誤差和(SAD;Sum of Absolute Difference)、二乗誤差和(SSD;Sum of Squared Difference)などの評価関数を用いて、既知の手法により行われる。また、ブロックマッチングは、例えば式(1)に示すパラボラフィッティング関数を用いた補間処理により、小数画素精度で行う。なお、SAD又はSSDの評価関数値が閾値を超えた場合は、位置合わせ情報として採用しないようにしてもよい。
FIG. 5 is a diagram showing an outline of the alignment process in the
ここで、探索位置における画素位置をxとしたとき、SSD(x)は、画素位置におけるSSD値を表し、より具体的には、SSD(0)は中心位置(SSD値を最小とする位置)におけるSSD値、SSD(−1)は中心位置から−x方向又は−y方向の隣接画素の位置におけるSSD値、SSD(1)は中心位置から+x方向又は+y方向の隣接画素の位置におけるSSD値を表す。式(1)から、水平又は垂直方向の小数画素精度の画素位置(小数画素位置)をそれぞれ算出することができる。 Here, when the pixel position at the search position is x, the SSD (x) represents the SSD value at the pixel position, and more specifically, the SSD (0) is the center position (the position where the SSD value is minimized). SSD (-1) is the SSD value at the position of the adjacent pixel in the −x direction or −y direction from the center position, and SSD (1) is the SSD value at the position of the adjacent pixel in the + x direction or + y direction from the center position. Represents. From the equation (1), the pixel positions (decimal pixel positions) with the decimal pixel accuracy in the horizontal or vertical direction can be calculated respectively.
超解像高周波成分割付部83は、位置合わせ部82により生成された位置合わせ情報に従って、超解像高周波成分画像の高周波成分として、周波数分解部81により生成された高周波成分画像LHα,HLα,HHαを割り付けて超解像高周波成分画像を生成し、周波数再構成部84に出力する。
The super-resolution high-frequency segmentation section 83 uses the high-frequency component images LH α and HL α generated by the frequency-resolving
図6は、超解像高周波成分割付部83の処理の概要を示す図である。超解像高周波成分割付部83は、位置合わせ情報に従って、高周波成分画像LHα,HLα,HHαを、超解像水平成分画像、超解像垂直成分画像、及び超解像対角成分画像に割り付ける。ここで、高周波成分画像LHα,HLα,HHαを割り付ける際には、低周波成分画像LLα内の同じ位相位置の位置合わせ情報に従うこととする。これは、復元縮小画像内のブロックAが低周波成分画像LLα内のブロックBに類似していれば、未知の超解像水平成分画像、超解像垂直成分画像、超解像対角成分画像内における、ブロックAと同じ位相位置のブロックは、高周波成分LHα,HLα,HHα内における、ブロックBと同じ位相位置のブロックとそれぞれ類似する可能性が高いためである。
FIG. 6 is a diagram showing an outline of processing of the super-resolution high-
超解像高周波成分割付部83は、水平、垂直、対角超解像成分として割り付ける候補が複数存在する場合には、それらの値を平均するか、最大事後確率(Maximum a posteriori;MAP)再構成を行い、未知の値を推定する。MAP再構成の詳細については、例えば、E. Levitan and G. Herman: “A maximum a posteriori probability expectation maximization algorithm for image reconstruction in emission tomography”, IEEE Transactions on Medical Imaging, vol. 6, no. 3, pp. 185-192, Sep. 1987.を参照されたい。また、その他の方法として、ML法や、割り付けられた画素の距離に応じた重み付けにより、超解像高周波成分画像を推定してもよい。
When there are multiple candidates to be assigned as horizontal, vertical, and diagonal super-resolution components, the super-resolution high-
周波数再構成部84は、縮小画像復元部70により生成された復元縮小画像を低周波成分とし、超解像高周波成分割付部83により割り付けられた超解像高周波成分画像を高周波成分として、周波数再構成処理して超解像画像を生成し、外部に出力する。なお、周波数分解部81が周波数分解処理としてウェーブレット分解処理を行った場合には、周波数再構成部84は、同じウェーブレットを用いてウェーブレット再構成処理を行う。
The
図7は、周波数再構成部84の処理の概要を示す図である。符号化装置で1階ウェーブレット分解処理が行われていた場合には、周波数再構成部84は、図7に示すように1階ウェーブレット再構成処理を行うことで、縮小画像に対して水平方向の画素数を2倍、垂直方向の画素数を2倍とし、符号化装置1に入力された入力画像と同じサイズ(解像度)の超解像画像を生成する。
FIG. 7 is a diagram showing an outline of processing of the
ここで、上述した復号装置3として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、復号装置3の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
Here, a computer can be preferably used to function as the
上述したように、本発明に係る復号装置及びそのプログラムは、超解像処理で使用する使用帯域情報を符号化側から取得し、復元縮小画像を周波数分解処理して、使用帯域情報に基づく高周波成分画像を生成し、該高周波成分画像を前記復元縮小画像の高周波成分に割り付けることにより超解像画像を生成する。これにより、復号側で高周波成分のデータベースを用意することなく、符号化側の縮小処理及び符号化処理により失われた高周波成分を高画質に超解像復元することができる。また、符号化側の縮小率と復号側の拡大率を逆数とすることにより、符号化側の入力画像の解像度を変えずに高周波成分を付加した超解像画像を復元することができる。 As described above, the decoding device and its program according to the present invention acquire the used band information used in the super-resolution processing from the coding side, perform frequency decomposition processing on the restored reduced image, and perform high frequency based on the used band information. A super-resolution image is generated by generating a component image and allocating the high-frequency component image to the high-frequency component of the restored and reduced image. As a result, it is possible to perform super-resolution restoration of high-frequency components lost by the reduction processing and coding processing on the coding side with high image quality without preparing a database of high-frequency components on the decoding side. Further, by setting the reduction ratio on the coding side and the enlargement ratio on the decoding side as reciprocals, it is possible to restore a super-resolution image to which a high-frequency component is added without changing the resolution of the input image on the coding side.
(変形例)
次に、上述の符号化装置1及び復号装置3の変形例について説明する。上述の実施形態では、符号化側で使用帯域αを決定したが、変形例では復号側で使用帯域αを決定する。
(Modification example)
Next, a modification of the above-mentioned
図8は、符号化装置1の変形例である符号化装置2の構成例を示すブロック図である。図9は、復号装置3の変形例である復号装置4の構成例を示すブロック図である。符号化装置2が使用帯域決定部40を備えない代わりに、復号装置4が使用帯域決定部40を備える。
FIG. 8 is a block diagram showing a configuration example of the
復号装置4は、符号化装置2からビットストリームを取得し、縮小された縮小画像を復号した後に超解像処理し、縮小画像よりも解像度の高い超解像画像を生成する。
The
復号装置4の縮小画像復元部70は、復号装置3と同様に、符号化装置2により生成された、縮小画像のビットストリームを入力し、復号して縮小画像を復元する。そして、復元縮小画像を使用帯域決定部40及び超解像復元部80に出力する。
Similar to the
復号装置4の使用帯域決定部40は、縮小画像復元部70により復元された復元縮小画像に対して周波数分解処理し、高周波成分画像のパワー値(例えば、RMS値)を計算する。そして、パワー値に基づいて使用帯域αを決定し、超解像復元部80に出力する。使用帯域αの決定方法は、上述した符号化装置1における使用帯域決定部40と同様であるため、説明を省略する。
The band used
復号装置4の超解像復元部80は、縮小画像復元部70により復元された復元縮小画像と、使用帯域決定部40により決定された使用帯域αとを用いて、復号装置3と同様に、超解像画像を生成する。
The
ここで、上述した符号化装置2又は復号装置4として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置2又は復号装置4の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
Here, a computer can be preferably used to function as the
変形例では、符号化側が使用帯域情報を出力しない場合でも、復号側で復元縮小画像を解析して超解像処理に使用する使用帯域を決定することにより、高精度な超解像復元を実現することができる。 In the modified example, even if the encoding side does not output the used bandwidth information, the decoding side analyzes the restored and reduced image to determine the used bandwidth used for the super-resolution processing, thereby realizing highly accurate super-resolution restoration. can do.
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiments have been described as typical examples, it will be apparent to those skilled in the art that many modifications and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be construed as being limited by the above-described embodiments, and various modifications and modifications can be made without departing from the scope of claims. For example, it is possible to combine a plurality of constituent blocks described in the configuration diagram of the embodiment into one, or to divide one constituent block.
また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMやDVD−ROMなどの記録媒体であってもよい。 The program may also be recorded on a computer-readable medium. It can be installed on a computer using a computer-readable medium. Here, the computer-readable medium on which the program is recorded may be a non-transient recording medium. The non-transient recording medium is not particularly limited, but may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.
1,2 符号化装置
3,4 復号装置
10 縮小画像生成部
20 圧縮部
21 ブロック分割部
22 減算部
23 変換部
24 量子化部
25 予測部
30 伸張部
31 逆量子化部
32 逆変換部
33 加算部
34 記憶部
40 使用帯域決定部
50 エントロピー符号化部
60 エントロピー復号部(取得部)
70 縮小画像復元部
71 逆量子化部
72 逆変換部
73 加算部
74 記憶部
75 予測部
80 超解像復元部
81 周波数分解部
82 位置合わせ部
83 超解像高周波成分割付部
84 周波数再構成部
1, 2,
70 Reduced
Claims (9)
入力画像に対して周波数分解処理を行って縮小画像を生成する縮小画像生成部と、
前記縮小画像に対して量子化処理を行って量子化係数を生成する圧縮部と、
前記量子化係数に対して伸張処理を行って縮小画像を復元し、復元縮小画像として出力する伸張部と、
前記復元縮小画像に対して周波数分解処理して高周波成分画像を生成し、該高周波成分画像のうち、パワー値が第1の閾値以上となる周波数帯域を使用帯域として決定する使用帯域決定部と、
前記量子化係数及び前記使用帯域を示す使用帯域情報を符号化したビットストリームを生成する符号化部と、
を備えることを特徴とする符号化装置。 A coding device that encodes an input image after it has been reduced.
A reduced image generator that generates a reduced image by performing frequency decomposition processing on the input image,
A compression unit that performs quantization processing on the reduced image to generate a quantization coefficient,
A decompression unit that restores a reduced image by performing decompression processing on the quantization coefficient and outputs it as a restored reduced image.
A frequency band determining unit that generates a high frequency component image by performing frequency decomposition processing on the restored reduced image and determines a frequency band in which the power value is equal to or higher than the first threshold value as a used band among the high frequency component images.
A coding unit that generates a bit stream that encodes the quantization coefficient and the used band information indicating the used band, and
A coding device comprising.
前記使用帯域決定部は、前記復元縮小画像に対してm階ウェーブレット分解処理を行って前記高周波成分画像を生成することを特徴とする、請求項1に記載の符号化装置。 The reduced image generation unit generates a low-frequency component image by performing n-th order wavelet decomposition processing on the input image, and digitizes each pixel value of the low-frequency component image to obtain the reduced image.
The coding apparatus according to claim 1, wherein the band used determining unit performs m-th order wavelet decomposition processing on the restored and reduced image to generate the high-frequency component image.
前記縮小画像の量子化係数と、超解像処理で使用する使用帯域を示す使用帯域情報とを取得する取得部と、
前記量子化係数を逆量子化処理して前記縮小画像を復元し、復元縮小画像として出力する縮小画像復元部と、
前記復元縮小画像に対して周波数分解処理して、前記使用帯域の高周波成分画像を生成し、該高周波成分画像を前記復元縮小画像の高周波成分に割り付けることにより超解像画像を生成する超解像復元部と、
を備えることを特徴とする復号装置。 A decoding device that performs super-resolution processing after restoring a reduced image.
An acquisition unit that acquires the quantization coefficient of the reduced image and the used band information indicating the used band used in the super-resolution processing.
A reduced image restoration unit that reverse-quantizes the quantization coefficient to restore the reduced image and outputs it as a restored reduced image.
The restored reduced image is subjected to frequency decomposition processing to generate a high frequency component image of the band used, and the high frequency component image is assigned to the high frequency component of the restored reduced image to generate a super resolution image. Restoration part and
A decoding device comprising.
前記縮小画像の量子化係数を取得する取得部と、
前記量子化係数を逆量子化処理して前記縮小画像を復元し、復元縮小画像として出力する縮小画像復元部と、
前記復元縮小画像に対して周波数分解処理して高周波成分画像を生成し、該高周波成分画像のうち、パワー値が第1の閾値以上となる周波数帯域を使用帯域として決定する使用帯域決定部と、
前記復元縮小画像を周波数分解処理して、前記使用帯域の高周波成分画像を生成し、該高周波成分画像を前記縮小画像の高周波成分に割り付けることにより超解像画像を生成する超解像復元部と、
を備えること特徴とする復号装置。 A decoding device that performs super-resolution processing after restoring a reduced image.
An acquisition unit that acquires the quantization coefficient of the reduced image, and
A reduced image restoration unit that reverse-quantizes the quantization coefficient to restore the reduced image and outputs it as a restored reduced image.
A frequency band determining unit that generates a high frequency component image by performing frequency decomposition processing on the restored reduced image and determines a frequency band in which the power value is equal to or higher than the first threshold value as a used band among the high frequency component images.
A super-resolution restoration unit that generates a super-resolution image by frequency-resolving the restored and reduced image to generate a high-frequency component image of the band used, and allocating the high-frequency component image to the high-frequency component of the reduced image. ,
A decoding device characterized by the above.
前記復元縮小画像に対してウェーブレット分解処理を行って前記使用帯域を含む周波数分解画像を生成する周波数分解部と、
前記復元縮小画像と、前記周波数分解画像の低周波成分画像との間で類似するブロックの位置関係を示す位置合わせ情報を生成する位置合わせ部と、
前記位置合わせ情報に従って、前記復元縮小画像の高周波成分として、前記周波数分解画像の高周波成分画像を割り付けて超解像高周波成分画像を生成する超解像高周波成分割付部と、
前記復元縮小画像を低周波成分とし、前記超解像高周波成分画像を高周波成分として周波数再構成処理して前記超解像画像を生成する周波数再構成部と、
を備えること特徴とする、請求項5又は6に記載の復号装置。 The super-resolution restoration unit
A frequency decomposition unit that performs wavelet decomposition processing on the restored reduced image to generate a frequency decomposition image including the band used.
An alignment unit that generates alignment information indicating the positional relationship of similar blocks between the restored reduced image and the low-frequency component image of the frequency-resolved image.
According to the alignment information, as the high-frequency component of the restored / reduced image, the high-frequency component image of the frequency-resolved image is assigned to generate a super-resolution high-frequency component image.
A frequency reconstruction unit that generates the super-resolution image by frequency-reconstructing the restored and reduced image as a low-frequency component and the super-resolution high-frequency component image as a high-frequency component.
The decoding apparatus according to claim 5 or 6, wherein the decoding apparatus is provided with.
A program for causing a computer to function as the decoding device according to any one of claims 5 to 7.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017102924A JP6864557B2 (en) | 2017-05-24 | 2017-05-24 | Encoding device, decoding device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017102924A JP6864557B2 (en) | 2017-05-24 | 2017-05-24 | Encoding device, decoding device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018198402A JP2018198402A (en) | 2018-12-13 |
JP6864557B2 true JP6864557B2 (en) | 2021-04-28 |
Family
ID=64663738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017102924A Active JP6864557B2 (en) | 2017-05-24 | 2017-05-24 | Encoding device, decoding device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6864557B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7352364B2 (en) * | 2019-03-22 | 2023-09-28 | 日本放送協会 | Video encoding device, video decoding device and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5514132B2 (en) * | 2011-02-07 | 2014-06-04 | 日本放送協会 | Image reduction device, image enlargement device, and program thereof |
JP6462372B2 (en) * | 2015-01-21 | 2019-01-30 | 日本放送協会 | Super-resolution device and program |
-
2017
- 2017-05-24 JP JP2017102924A patent/JP6864557B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018198402A (en) | 2018-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5727873B2 (en) | Motion vector detection device, encoding device, and program thereof | |
JP4844741B2 (en) | Moving picture coding apparatus and moving picture decoding apparatus, method and program thereof | |
CN110383331B (en) | Non-locally adaptive loop filter processing | |
WO2014105385A1 (en) | Anamorphic stretch image compression | |
US20070160298A1 (en) | Image encoder, image decoder, image encoding method, and image decoding method | |
JP6042899B2 (en) | Video encoding method and device, video decoding method and device, program and recording medium thereof | |
JP2005524352A (en) | Scalable wavelet-based coding using motion compensated temporal filtering based on multiple reference frames | |
US8594189B1 (en) | Apparatus and method for coding video using consistent regions and resolution scaling | |
Tomar et al. | Lossless image compression using differential pulse code modulation and its application | |
CN112789857A (en) | Transform for signal enhancement coding | |
US8855198B2 (en) | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program | |
JP6864557B2 (en) | Encoding device, decoding device, and program | |
Sridhar | A review of the effective techniques of compression in medical image processing | |
KR20200104843A (en) | Apparatus and method for encoding and decoding to image of ultra high definition resoutltion | |
JP5004877B2 (en) | Image encoder, image decoder, image encoding method, image decoding method, and program | |
JP6269137B2 (en) | Moving picture decoding apparatus and program | |
JP6823492B2 (en) | Super-resolution complementary post-filter device and program | |
JP5363581B2 (en) | Video decoding method and video encoding method | |
JP6564315B2 (en) | Encoding device, decoding device, and program | |
JP2005524354A (en) | Wavelet-based coding with motion-compensated temporal filtering based on multiple reference frames | |
JP2007151062A (en) | Image encoding device, image decoding device and image processing system | |
US8526746B1 (en) | Near lossless data compression method using nonuniform sampling | |
JP6388476B2 (en) | Encoding apparatus and program | |
JP2019208090A (en) | Video encoding device, video decoding device, and program | |
Jayanthi et al. | Multi Wavelet Based Image Compression for Tele-Medical Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200331 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6864557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |