JP4743604B2 - Image processing apparatus, image processing method, program, and information recording medium - Google Patents
Image processing apparatus, image processing method, program, and information recording medium Download PDFInfo
- Publication number
- JP4743604B2 JP4743604B2 JP2005296664A JP2005296664A JP4743604B2 JP 4743604 B2 JP4743604 B2 JP 4743604B2 JP 2005296664 A JP2005296664 A JP 2005296664A JP 2005296664 A JP2005296664 A JP 2005296664A JP 4743604 B2 JP4743604 B2 JP 4743604B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- frequency
- gof
- inverse
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動画像の圧縮・伸長の分野に係り、より詳細には、動画像のフレームの集まり(GOF;Group of Frames)毎に時間方向に周波数変換を行った符号を伸長する場合にGOF境界歪みの発生を抑止するための技術に関する。 The present invention relates to the field of moving image compression / decompression, and more specifically, when a code subjected to frequency conversion in the time direction is expanded for each group of moving image frames (GOF: Group of Frames). The present invention relates to a technique for suppressing the occurrence of boundary distortion.
動画像の動きを滑らかにするために補間するフレームの生成に離散ウェーブレット変換を利用する方法が特許文献1に記載されている。この方法においては、動画像の連続したNフレーム毎に時間方向(フレームの並び方向)の離散ウェーブレット変換を行い、生成されたウェーブレット係数中の最低周波数成分の係数値を画素値としたフレームkを得るとともに、次段階の高周波成分除去のための閾値を決定する。次に、このフレームkを元のNフレームに補間したN+1フレームに対し時間方向の離散ウェーブレット変換を行い、生成されたウェーブレット係数中の前記閾値を超える高周波成分を除去する。この高周波成分除去後のウェーブレット係数に対し離散ウェーブレット逆変換を行い、得られたフレームkの画素値からなる補間フレームを生成する。 Japanese Patent Application Laid-Open No. 2004-133826 describes a method that uses a discrete wavelet transform to generate a frame to be interpolated in order to smooth the motion of a moving image. In this method, a discrete wavelet transform in the time direction (frame arrangement direction) is performed every N consecutive frames of a moving image, and a frame k having a coefficient value of the lowest frequency component in the generated wavelet coefficients as a pixel value is obtained. In addition, a threshold value for removing the high-frequency component in the next stage is determined. Next, discrete wavelet transform in the time direction is performed on the N + 1 frame obtained by interpolating the frame k into the original N frame, and high frequency components exceeding the threshold value in the generated wavelet coefficients are removed. Discrete wavelet inverse transform is performed on the wavelet coefficients after removal of the high-frequency components, and an interpolation frame composed of the pixel values of the obtained frame k is generated.
画像をタイル分割し、タイル毎にウェーブレット変換を用いて圧縮するJPEG2000のような方式では、圧縮データから画像を伸長すると、タイル境界に歪みが生ずることがある。特許文献2には、そのような圧縮データの伸長処理において、隣接したタイルのローパス係数とハイパス係数を利用してタイル境界付近のハイパス係数を補正することにより、タイル境界歪みを効果的に除去する方法が記載されている。
In a method such as JPEG2000 in which an image is divided into tiles and compressed using wavelet transform for each tile, when the image is expanded from the compressed data, distortion may occur at the tile boundary. In
高精細の動画像の圧縮方式として、各フレームをJPEG2000で符号化するMotion−JPEG2000がある。この圧縮方式は、個々のフレームを独立して処理できる等の利点があるが、圧縮時にフレーム間差分を用いないため、フレーム間差分を用いるMPEGなどの圧縮方式に比べ、画質の面で必ずしも有利ではない場合があり得る。その対策として、Motion−JPEG2000の動画像のような各フレームが2次元周波数変換された動画像に対し、連続したフレームの集まり(GOF;Group of Flames)毎に時間方向にウェーブレット変換のような周波数変換を行うことによって、動画像を3次元サブバンド符号化する試みがなされている。しかし、このようなGOF単位で時間方向に周波数変換された動画像の符号を伸長した場合に、GOF境界に痙攣するように揺らぐGOF境界歪み(jerk)が発生するという問題が指摘されている(例えば非特許文献1参照)。 As a high-definition moving image compression method, there is Motion-JPEG2000 which encodes each frame with JPEG2000. This compression method has the advantage that individual frames can be processed independently. However, since the difference between frames is not used during compression, it is not always advantageous in terms of image quality compared to a compression method such as MPEG that uses the difference between frames. It may not be. As a countermeasure, for a moving image in which each frame such as a Motion-JPEG2000 moving image is two-dimensionally frequency-converted, a frequency such as wavelet transform in the time direction for each group of consecutive frames (GOF: Group of Flames). Attempts have been made to three-dimensionally encode moving images by performing conversion. However, it has been pointed out that a GOF boundary distortion (jerk) that fluctuates like a GOF boundary occurs when the code of a moving image frequency-converted in the time direction is expanded in such a GOF unit ( For example, refer nonpatent literature 1).
本発明は、GOF毎に時間方向に周波数変換された動画像の符号を伸長する際の問題点であるGOF境界歪みを効果的に抑制するための画像処理装置及び方法を提供することにある。 An object of the present invention is to provide an image processing apparatus and method for effectively suppressing GOF boundary distortion, which is a problem when decompressing a code of a moving image frequency-converted in the time direction for each GOF.
請求項1の発明は、動画像のフレームの集まり(以下、GOF)毎に時間方向に周波数変換することにより生成された周波数係数に対し時間方向の逆周波数変換を行う逆周波数変換手段、前記逆周波数変換手段により逆周波数変換される周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正手段を有することを特徴とする画像処理装置である。 According to a first aspect of the present invention, there is provided an inverse frequency conversion means for performing an inverse frequency conversion in the time direction on a frequency coefficient generated by performing frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF). A low frequency coefficient when a high frequency coefficient adjacent to a GOF boundary in a frequency coefficient subjected to inverse frequency conversion by the frequency conversion means is not subjected to GOF division prior to the inverse frequency conversion. An image processing apparatus comprising coefficient correction means for correcting to be equal to an inverse frequency conversion value using only
請求項2の発明は、動画像のフレームの集まり(以下、GOF)毎に時間方向に階層的に周波数変換することにより生成された周波数係数に対し、時間方向の逆周波数変換を行う逆周波数変換手段、前記逆周波数変換手段により逆周波数変換される特定階層以下の周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正手段を有することを特徴とする画像処理装置である。 According to the second aspect of the present invention, an inverse frequency transform that performs an inverse frequency transform in the time direction on a frequency coefficient generated by performing a frequency transform hierarchically in the time direction for each group of moving image frames (hereinafter referred to as GOF). A high frequency coefficient adjacent to a GOF boundary in a frequency coefficient of a specific layer or lower that is reverse frequency converted by the reverse frequency conversion means, prior to the reverse frequency conversion, an inverse frequency conversion value centered on the high frequency coefficient is GOF. An image processing apparatus comprising coefficient correction means for correcting to be equal to an inverse frequency conversion value using only a low frequency coefficient when no division is performed.
請求項3の発明は、請求項1又は2の発明に係る画像処理装置であって、前記周波数変換は5×3ウェーブレット変換であり、前記逆周波数変換は5×3ウェーブレット逆変換であり、前記係数補正手段は、前記逆周波数変換手段により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列
L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を
H2=(1/3)H1−(2/3)L2+(2/3)L3
により算出することを特徴とする画像処理装置である。
The invention of
L1 H1 L2 H2 L3 H3 L4 H4
(However, L1, L2, L3, and L4 are low frequency coefficients, H1, H2, H3, and H4 are high frequency coefficients, and there is a boundary between two GOFs temporally continuous between H2 and L3, and L1 , H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), the correction value of the high-frequency coefficient H2 adjacent to the GOF boundary
H2 = (1/3) H1- (2/3) L2 + (2/3) L3
The image processing apparatus is characterized by being calculated by the following.
請求項4の発明は、請求項1又は2の発明に係る画像処理装置であって、前記周波数変換は9×7ウェーブレット変換であり、前記逆周波数変換は9×7ウェーブレット逆変換であり、前記係数補正手段は、前記逆周波数変換手段により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列
H0 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H0,H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、H0,L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を
H2=(-0.0535H0+0.15644H1+0.09127L1-0.59127L2+0.59127L3-0.09127L4)/0.60295
により算出することを特徴とする画像処理装置である。
The invention of
H0 L1 H1 L2 H2 L3 H3 L4 H4
(However, L1, L2, L3, and L4 are low frequency coefficients, H0, H1, H2, H3, and H4 are high frequency coefficients, and there are two temporally continuous GOF boundaries between H2 and L3. H0, L1, H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), and the high-frequency coefficient H2 adjacent to the GOF boundary Correction value
H2 = (-0.0535H0 + 0.15644H1 + 0.09127L1-0.59127L2 + 0.59127L3-0.09127L4) /0.60295
The image processing apparatus is characterized by being calculated by the following.
請求項5の発明は、請求項1乃至4のいずれか1項の発明に係る画像処理装置であって、前記係数補正手段によるGOF境界に隣接する高周波係数に対する補正は、量子化ステップ数が所定値より小さい場合にのみ施されることを特徴とする画像処理装置である。 A fifth aspect of the present invention is the image processing apparatus according to any one of the first to fourth aspects of the present invention, wherein the correction of the high frequency coefficient adjacent to the GOF boundary by the coefficient correction means has a predetermined number of quantization steps. An image processing apparatus that is applied only when the value is smaller than the value.
請求項6の発明は、請求項1乃至5のいずれか1項の発明に係る画像処理装置であって、前記係数補正手段によるGOF境界に隣接する高周波係数に対する補正は、利用者によりGOF境界歪み抑制が指定された場合にのみ施されることを特徴とする画像処理装置である。 A sixth aspect of the present invention is the image processing apparatus according to any one of the first to fifth aspects of the present invention, wherein the correction of the high frequency coefficient adjacent to the GOF boundary by the coefficient correcting means is performed by a user by a GOF boundary distortion. An image processing apparatus that is applied only when suppression is designated.
請求項7の発明は、請求項1乃至6のいずれか1項の発明に係る画像処理装置であって、前記係数補正手段は、GOF境界に隣接する高周波係数の補正値が当該高周波係数の補正前の値が属していた量子化区間からはみ出た場合に、当該高周波係数の補正値に近い側の当該量子化区間の端の値へと当該高周波係数の補正値を修正するクリッピング処理を行うことを特徴とする画像処理装置である。 A seventh aspect of the present invention is the image processing apparatus according to any one of the first to sixth aspects of the present invention, wherein the coefficient correction means is configured such that a correction value of a high frequency coefficient adjacent to a GOF boundary is a correction value of the high frequency coefficient. Clipping processing to correct the correction value of the high-frequency coefficient to the value at the end of the quantization section closer to the correction value of the high-frequency coefficient when the previous value belongs to the quantization section An image processing apparatus characterized by the above.
請求項8の発明は、動画像のフレームの集まり(以下、GOF)毎に時間方向に周波数変換することにより生成された周波数係数に対し、時間方向の逆周波数変換を行う逆周波数変換工程、前記逆周波数変換工程により逆周波数変換される周波数係数中のGOFに隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正工程を有することを特徴とする画像処理方法である。 The invention according to claim 8 is a reverse frequency conversion step of performing reverse frequency conversion in the time direction on a frequency coefficient generated by performing frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF), The high frequency coefficient adjacent to the GOF in the frequency coefficient subjected to the reverse frequency conversion in the reverse frequency conversion process is the low frequency coefficient when the reverse frequency conversion value centered on the high frequency coefficient is not subjected to the GOF division prior to the reverse frequency conversion. An image processing method characterized by having a coefficient correction step of correcting so as to be equal to the inverse frequency conversion value using only .
請求項9の発明は、動画像のフレームの集まり(以下、GOF)毎に時間方向に階層的に周波数変換することにより生成された周波数係数に対し、時間方向の逆周波数変換を行う逆周波数変換工程、前記逆周波数変換工程により逆周波数変換される特定階層以下の周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正工程を有することを特徴とする画像処理方法である。 The invention according to claim 9 is an inverse frequency transform that performs inverse frequency transformation in the time direction on a frequency coefficient generated by hierarchical frequency transformation in the time direction for each group of moving image frames (hereinafter referred to as GOF). The reverse frequency conversion value centered on the high frequency coefficient is set to GOF prior to the reverse frequency conversion of the high frequency coefficient adjacent to the GOF boundary in the frequency coefficient below the specific layer that is reverse frequency converted by the reverse frequency conversion step. It is an image processing method characterized by having a coefficient correction process which corrects so that it may become equal to the inverse frequency conversion value using only the low frequency coefficient when not dividing.
請求項10の発明は、請求項8又は9の発明に係る画像処理方法であって、
前記周波数変換は5×3ウェーブレット変換であり、前記逆周波数変換は5×3ウェーブレット逆変換であり、
前記係数補正工程は、前記逆周波数変換工程により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列
L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を
H2=(1/3)H1−(2/3)L2+(2/3)L3
により算出することを特徴とする画像処理方法である。
The invention of
The frequency transform is a 5 × 3 wavelet transform, and the inverse frequency transform is a 5 × 3 wavelet inverse transform;
The coefficient correction step includes a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before the reverse frequency conversion is performed by the reverse frequency conversion step.
L1 H1 L2 H2 L3 H3 L4 H4
(However, L1, L2, L3, and L4 are low frequency coefficients, H1, H2, H3, and H4 are high frequency coefficients, and there is a boundary between two GOFs temporally continuous between H2 and L3, and L1 , H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), the correction value of the high-frequency coefficient H2 adjacent to the GOF boundary
H2 = (1/3) H1- (2/3) L2 + (2/3) L3
It is an image processing method characterized by calculating by the following.
請求項11の発明は、請求項8又は9の発明に係る画像処理方法であって、
前記周波数変換は9×7ウェーブレット変換であり、前記逆周波数変換は9×7ウェーブレット逆変換であり、
前記係数補正工程は、前記逆周波数変換工程により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列
H0 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H0,H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、H0,L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を
H2=(-0.0535H0+0.15644H1+0.09127L1-0.59127L2+0.59127L3-0.09127L4)/0.60295
により算出することを特徴とする画像処理方法である。
The invention of
The frequency transform is a 9 × 7 wavelet transform, and the inverse frequency transform is a 9 × 7 wavelet inverse transform;
The coefficient correction step includes a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before the reverse frequency conversion is performed by the reverse frequency conversion step.
H0 L1 H1 L2 H2 L3 H3 L4 H4
(However, L1, L2, L3, and L4 are low frequency coefficients, H0, H1, H2, H3, and H4 are high frequency coefficients, and there are two temporally continuous GOF boundaries between H2 and L3. H0, L1, H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), and the high-frequency coefficient H2 adjacent to the GOF boundary Correction value
H2 = (-0.0535H0 + 0.15644H1 + 0.09127L1-0.59127L2 + 0.59127L3-0.09127L4) /0.60295
It is an image processing method characterized by calculating by the following.
請求項12の発明は、請求項8乃至11のいずれか1項の発明に係る画像処理方法であって、
前記係数補正工程によるGOF境界に隣接する高周波係数に対する補正は、量子化ステップ数が所定値より小さい場合にのみ施されることを特徴とする画像処理方法である。
The invention of
In the image processing method, the high-frequency coefficient adjacent to the GOF boundary in the coefficient correction step is corrected only when the number of quantization steps is smaller than a predetermined value.
請求項13の発明は、請求項8乃至12のいずれか1項の発明に係る画像処理方法であって、
前記係数補正工程によるGOF境界に隣接する高周波係数に対する補正は、利用者によりGOF境界歪み抑制が指定された場合にのみ施されることを特徴とする画像処理方法である。
The invention of claim 13 is an image processing method according to any one of claims 8 to 12,
The image processing method is characterized in that the correction for the high-frequency coefficient adjacent to the GOF boundary in the coefficient correction step is performed only when the user specifies GOF boundary distortion suppression.
請求項14の発明は、請求項8乃至12のいずれか1項の発明に係る画像処理方法であって、
前記係数補正工程は、GOF境界に隣接する高周波係数の補正値が当該高周波係数の補正前の値が属していた量子化区間からはみ出た場合に、当該高周波係数の補正値に近い側の当該量子化区間の端の値へと当該高周波係数の補正値を修正するクリッピング処理を行うことを特徴とする画像処理方法である。
The invention of
In the coefficient correction step, when the correction value of the high-frequency coefficient adjacent to the GOF boundary protrudes from the quantization section to which the value before the correction of the high-frequency coefficient belonged, the coefficient on the side close to the correction value of the high-frequency coefficient An image processing method characterized by performing a clipping process for correcting the correction value of the high-frequency coefficient to the end value of the conversion interval.
請求項15の発明は、請求項1乃至7のいずれか1項記載の画像処理装置の逆周波数変換手段及び係数補正手段としてコンピュータを機能させるプログラムである。 A fifteenth aspect of the invention is a program that causes a computer to function as an inverse frequency conversion unit and a coefficient correction unit of the image processing apparatus according to any one of the first to seventh aspects.
請求項16の発明は、請求項1乃至7のいずれか1項記載の画像処理装置の逆周波数変換手段及び係数補正手段としてコンピュータを機能させるプログラムが記録されたコンピュータ読み取り可能な情報記録媒体である。 According to a sixteenth aspect of the present invention, there is provided a computer-readable information recording medium on which a program for causing a computer to function as an inverse frequency converting unit and a coefficient correcting unit of the image processing apparatus according to any one of the first to seventh aspects is recorded. .
請求項1〜14の発明によれば、時間方向の逆周波数変換に先立って、GOF境界近傍の高周波係数についてGOF境界歪み抑制のための補正を施すため、GOF境界歪みの目立たない動画像の再生が可能である。 According to the first to fourteenth aspects of the present invention, the correction for suppressing the GOF boundary distortion is performed on the high-frequency coefficient in the vicinity of the GOF boundary prior to the inverse frequency conversion in the time direction. Is possible.
なお、GOF境界歪み抑制のために補正される高周波係数とは、具体的には、後記実施形態において説明するようなGOF境界に隣接する高周波係数と、GOF境界近傍であるがGOF境界に隣接しない高周波係数である。補正の効果が高いのはGOF境界に隣接する高周波係数であるので、GOF境界に隣接する高周波係数に対してのみ補正を施すようにしてもよい。 Note that the high-frequency coefficient corrected to suppress the GOF boundary distortion is specifically a high-frequency coefficient adjacent to the GOF boundary as described in an embodiment below, and a vicinity of the GOF boundary but not adjacent to the GOF boundary. It is a high frequency coefficient. Since the correction effect is high for the high frequency coefficient adjacent to the GOF boundary, the correction may be performed only for the high frequency coefficient adjacent to the GOF boundary.
また、GOF境界近傍の高周波係数に対するGOF境界歪み抑制のための補正とは、GOF境界に隣接した係数を中心とした逆周波数変換値が、GOF分割しない場合の低周波数係数のみを用いた逆周波数変換値と略等しくなるような補正であり、その補正式は適用される周波数変換の種類に依存する。後記実施形態において、JPEG2000に規定されている2種類のウェーブレット変換の場合の補正式を示す。 Further, the correction for suppressing the GOF boundary distortion with respect to the high-frequency coefficient near the GOF boundary is the reverse frequency using only the low frequency coefficient when the inverse frequency transform value centered on the coefficient adjacent to the GOF boundary is not GOF divided. The correction is approximately equal to the conversion value, and the correction formula depends on the type of frequency conversion to be applied. In a later-described embodiment, correction equations in the case of two types of wavelet transforms defined in JPEG2000 are shown.
また、請求項2,5,9,12の発明によれば、GOF境界歪み抑制のための処理量を削減し、効率的処理によりGOF境界歪み抑制を達成することができる。また、請求項6,13の発明によれば、利用者がGOF境界歪み抑制を望まない場合には、GOF境界歪み抑制のための係数補正処理を行わないことにより、動画像再生処理を高速化することができる効果がある。
In addition, according to the inventions of
請求項15,16の発明によれば、請求項1〜7の発明に係る画像処理装置をコンピュータを利用し容易に実現することができる。
According to the invention of
JPEG2000により画像をタイル分割して圧縮した符号を伸長すると、圧縮率が高い場合にタイル境界歪みが目立つことがある。前記特許文献2記載のタイル境界歪み除去(デタイル)方法は、伸長処理においてウェーブレット係数の状態でタイル境界歪みを除去しようとするものであり、そのメカニズムを理解すると以下に説明する本発明の実施の形態の理解が容易になるであろう。
When a code obtained by dividing and compressing an image by JPEG2000 is expanded, tile boundary distortion may be conspicuous when the compression rate is high. The tile boundary distortion removal (detiling) method described in
そこで、まず、JPEG2000のウェーブレット変換・逆変換、タイル境界歪みの発生要因などとともに、上記タイル境界歪み除去方法の具体例について説明する。 First, a specific example of the tile boundary distortion removal method will be described together with the JPEG2000 wavelet transform / inverse transform, the cause of tile boundary distortion, and the like.
上記タイル境界歪み除去方法は、ウェーブレット係数空間での画像復元に類する手法である。画像復元では、失われた情報を復元するために、ある経験的な拘束条件を採用し、その条件に基づいて復元すべき解を算出する。前記特許文献2の方法においては、
近似1:タイル境界が生じるのは圧縮率が高い場合であり、タイリングの有無にかかわ らず全てのハイパス係数は0に量子化される。
The tile boundary distortion removal method is a method similar to image restoration in a wavelet coefficient space. In image restoration, in order to restore lost information, a certain empirical constraint condition is adopted, and a solution to be restored is calculated based on the condition. In the method of
Approximation 1: A tile boundary occurs when the compression ratio is high, and all high-pass coefficients are quantized to 0 regardless of tiling.
近似2:タイリングした場合のローパス係数は、タイリングしない場合のローパス係数 に等しい。
という近似を採用し、
{(0に量子化されたが)補正されたハイパス係数を用いて逆ウェーブレット変換をした 場合のタイル境界の画素値}={ハイパス係数が0の場合の、タイリングをせずに逆 ウェーブレット変換をした場合の同じ位置の画素値}
という式から、ハイパス係数の補正値を算出している(0に量子化されたハイパス係数に対し、0でない補正値を算出する過程は画像復元である)。
Approximation 2: The low-pass coefficient when tiling is equal to the low-pass coefficient without tiling.
Adopting the approximation
{Tile boundary pixel value when inverse wavelet transform is performed using corrected high-pass coefficient (= quantized to 0)} = {Inverse wavelet transform without tiling when high-pass coefficient is 0 Pixel value at the same position when
From this equation, the correction value of the high pass coefficient is calculated (the process of calculating the correction value other than 0 for the high pass coefficient quantized to 0 is image restoration).
以下、JPEG2000に規定されている5×3ウェーブレット変換を例にとり、上記補正式の算出について説明する。 Hereinafter, the calculation of the correction equation will be described by taking 5 × 3 wavelet transform defined in JPEG2000 as an example.
図1乃至図4は、16×16のモノクロの画像に対して、5x3変換と呼ばれるウェーブレット変換(順変換)を2次元(垂直方向および水平方向)で施す過程の例を示したものである。 FIGS. 1 to 4 show an example of a process of performing wavelet transformation (forward transformation) called 5 × 3 transformation in two dimensions (vertical direction and horizontal direction) on a 16 × 16 monochrome image.
図1の様にxy座標をとり、あるxについて、y座標がyである画素の画素値をP(y)(0≦y≦15)と表す。JPEG2000では、まず垂直方向(Y座標方向)に、y座標が奇数
(y=2i+1)の画素を中心にハイパスフィルタを施して係数C(2i+1)を得る。次に、y座標が偶数(y=2i)の画素を中心にローパスフィルタを施して係数C(2i)を得る(これを全てのx座標について行う)。
As shown in FIG. 1, an xy coordinate is taken, and a pixel value of a pixel whose y coordinate is y is expressed as P (y) (0 ≦ y ≦ 15) for a certain x. In JPEG 2000, first, a coefficient C (2i + 1) is obtained by applying a high-pass filter in the vertical direction (Y-coordinate direction) around a pixel having an odd y-coordinate (y = 2i + 1). Next, a coefficient C (2i) is obtained by applying a low-pass filter around a pixel having an even y coordinate (y = 2i) (this is performed for all x coordinates).
ここで、ハイパスフィルタは式(1)で表され、ローパスフィルタは式(2)で表される。式中の記号|_x_|はxのフロア関数(実数xを、xを越えず、かつ、xに最も近い整数に置換する関数)を示している。
式(1) C(2i+1)=P(2i+1)−|_(P(2i)+P(2i+2))/2_|
式(2) C(2i)=P(2i)+|_(C(2i-1)+C(2i+1)+2)/4_|
Here, the high-pass filter is expressed by equation (1), and the low-pass filter is expressed by equation (2). The symbol | _x_ | in the equation indicates a floor function of x (a function that replaces the real number x with an integer that does not exceed x and is closest to x).
Formula (1) C (2i + 1) = P (2i + 1) − | _ (P (2i) + P (2i + 2)) / 2_ |
Formula (2) C (2i) = P (2i) + | _ (C (2i-1) + C (2i + 1) +2) / 4_ |
なお、画像の端部においては、中心となる画素に対して隣接画素群が存在しないことがあり、この場合は図6に示した「ミラリング」と呼ばれる手法によって不足する画素値を補うことになる。ミラリングは、文字通り境界を中心として画素値を線対称に折り返し、折り返した値を隣接画素群の値とみなす処理である。 Note that there may be no adjacent pixel group at the edge of the image with respect to the central pixel. In this case, the insufficient pixel value is compensated by a technique called “mirroring” shown in FIG. . The mirroring is a process that literally folds back the pixel value with the boundary as the center, and regards the folded value as the value of the adjacent pixel group.
簡単のため、ハイパスフィルタで得られる係数をH、ローパスフィルタで得られる係数をL、と表記すれば、前記垂直方向の変換によって図1の画像は図2のような係数の配列へと変換される。 For the sake of simplicity, if the coefficient obtained by the high-pass filter is denoted by H and the coefficient obtained by the low-pass filter is denoted by L, the image in FIG. 1 is converted into an array of coefficients as shown in FIG. The
続いて、図2の係数配列に対して、水平方向に、x座標が奇数(y=2i+1)の係数を中心にハイパスフィルタを施し、次にx座標が偶数(x=2i)の係数を中心にローパスフィルタを施す(これを全てのyについて行う)。この場合、前記式(1),(2)中のP(2i)等は係数値を表すものと読み替える。簡単のため、
前記L係数を中心にローパスフィルタを施して得られる係数をLL、
前記L係数を中心にハイパスフィルタを施して得られる係数をHL、
前記H係数を中心にローパスフィルタを施して得られる係数をLH、
前記H係数を中心にハイパスフィルタを施して得られる係数をHH、
と表記すれば、図2の係数配列は、図3の様な係数配列へと変換される。ここで、同一の記号を付した係数群はサブバンドと呼ばれる。すなわち、図3は4つのサブバンドで構成される。
Subsequently, a high-pass filter is applied to the coefficient array of FIG. 2 in the horizontal direction around the coefficient whose x coordinate is odd (y = 2i + 1), and then the coefficient whose x coordinate is even (x = 2i). A low pass filter is applied centering on (this is done for all y). In this case, P (2i) and the like in the expressions (1) and (2) are read as those representing coefficient values. For simplicity,
The coefficient obtained by applying a low pass filter around the L coefficient is LL,
The coefficient obtained by applying a high-pass filter around the L coefficient is HL,
The coefficient obtained by applying a low-pass filter around the H coefficient is LH,
HH is a coefficient obtained by applying a high-pass filter around the H coefficient,
2 is converted into a coefficient array as shown in FIG. Here, the coefficient group which attached | subjected the same symbol is called a subband. That is, FIG. 3 is composed of four subbands.
以上で、1回のウェーブレット変換(1回のデコンポジション(分解))が終了し、LL係数だけを集めると(図4の様にサブバンド毎に係数を集め、LLサブバンドだけ取り出すと)、ちょうど原画像の1/2の解像度の“画像”が得られる(このように、サブバンド毎に分類することをデインターリーブと呼び、図3のような状態に配置することをインターリーブすると表現する)。 When one wavelet transform (one decomposition (decomposition)) is completed and only LL coefficients are collected (collecting coefficients for each subband as shown in FIG. 4 and extracting only the LL subbands), An “image” having a resolution of 1/2 that of the original image can be obtained (in this way, classification for each subband is called deinterleaving, and arrangement in the state shown in FIG. 3 is expressed as interleaving). .
また、2回目のウェーブレット変換は、上記LLサブバンドを原画像と見なして、上記と同様の変換を行えばよい。この場合、並べ替えを行うと、模式的な図5が得られる。図4及び図5の係数の接頭の1や2は、係数が何回のウェーブレット変換で得られたかを示しており、デコンポジションレベルと呼ばれる。なお、以上の議論において、1次元のみのウェーブレット変換をしたい場合には、いずれかの方向だけの処理を行えばよい。 In the second wavelet transform, the above LL subband may be regarded as an original image and the same transformation as described above may be performed. In this case, when rearrangement is performed, a schematic FIG. 5 is obtained. The coefficient prefixes 1 and 2 in FIGS. 4 and 5 indicate how many times the coefficient has been obtained by the wavelet transform, and are called decomposition levels. In the above discussion, when only one-dimensional wavelet transform is desired, processing in only one direction may be performed.
一方、ウェーブレット逆変換は、図3の様なインターリーブされた係数の配列に対して、まず水平方向に、x座標が偶数(x=2i)の係数を中心に逆ローパスフィルタを施し、次に、x座標が奇数(x=2i+1)の係数を中心に逆ハイパスフィルタを施す(これを全てのyについて行う)。ここで、逆ローパスフィルタは式(3)で表され、逆ハイパスフィルタは式(4)で表される。ウェーブレット順変換の場合と同様に、画像の端部において中心となる係数に対して隣接係数群が存在しないことがあり、この場合も図6のミラリングによって係数値を適宜補うことになる。
式(3) P(2i)=C(2i)−|_(C(2i-1)+C(2i+1)+2)/4_|
式(4) P(2i+1)=C(2i+1)+|_(P(2i)+P(2i+2))/2_|
On the other hand, in the wavelet inverse transform, an inverse low-pass filter is first applied to the array of interleaved coefficients as shown in FIG. 3 in the horizontal direction, centering on the coefficient whose x coordinate is an even number (x = 2i). An inverse high-pass filter is applied around a coefficient whose x coordinate is an odd number (x = 2i + 1) (this is performed for all y). Here, the inverse low-pass filter is represented by Expression (3), and the inverse high-pass filter is represented by Expression (4). As in the case of the wavelet forward transformation, there may be no adjacent coefficient group for the central coefficient at the edge of the image. In this case as well, the coefficient value is appropriately compensated by the mirroring in FIG.
Formula (3) P (2i) = C (2i) − | _ (C (2i−1) + C (2i + 1) +2) / 4_ |
Formula (4) P (2i + 1) = C (2i + 1) + | _ (P (2i) + P (2i + 2)) / 2_ |
これにより、図3の係数配列は図2のような係数配列に変換(逆変換)される。続いて、垂直方向に、y座標が偶数(y=2i)の係数を中心に逆ローパスフィルタを施し、次に、y座標が奇数(y=2i+1)の係数を中心に逆ハイパスフィルタを施せば(これを全てのxについて行う)、1回のウェーブレット逆変換が終了し、図1の画像に戻る(再構成される)ことになる。なお、ウェーブレット変換が複数回施されている場合は、図1をLLサブバンドとみなし、HL等の他の係数を利用して同様の逆変換を繰り返せばよい。 As a result, the coefficient array in FIG. 3 is converted (inversely converted) into a coefficient array as shown in FIG. Subsequently, in the vertical direction, an inverse low-pass filter is applied centering on a coefficient whose y coordinate is an even number (y = 2i), and then an inverse high pass filter is centered on a coefficient whose y coordinate is an odd number (y = 2i + 1). If this is performed (this is performed for all x), one wavelet inverse transformation is completed, and the image of FIG. 1 is returned (reconstructed). When wavelet transformation is performed a plurality of times, FIG. 1 is regarded as an LL subband, and similar inverse transformation may be repeated using other coefficients such as HL.
以上のように、5x3ウェーブレット逆変換ではL,H,L,Hの順にインターリーブした係数列に対し、偶数位置中心に逆ローパスフィルタをかけ、奇数位置中心に逆ハイパスフィルタをかける。 As described above, in the inverse 5 × 3 wavelet transform, the inverse low-pass filter is applied to the center of the even position and the inverse high-pass filter is applied to the center of the odd position for the coefficient sequence interleaved in the order of L, H, L, and H.
さて、前記フィルタの式(1)〜(4)をフロア関数を省略して展開すれば明らかなように、順変換と逆変換ではタップ数は逆転し、フィルタ係数もインターリーブされる。 As apparent from the expansion of the filter equations (1) to (4) by omitting the floor function, the number of taps is reversed in the forward transformation and the inverse transformation, and the filter coefficients are also interleaved.
このため、順変換のフィルタ係数が
ハイパス(HIGH): -0.5,1,-0.5
ローパス(LOW): -0.125,0.25,0.75,0.25,-0.125
の場合、逆変換のフィルタ係数は
逆ローパス(LOW): -0.25,1,-0.25
逆ハイパス(HIGH): -0.125,0.5,0.75,0.5,-0.125
となる(ここでは、フロア関数部分を考慮せずにフィルタ係数を表現している)。
For this reason, the forward conversion filter coefficient is high-pass (HIGH): -0.5, 1, -0.5
Low pass (LOW): -0.125, 0.25, 0.75, 0.25, -0.125
In case of, the inverse transform filter coefficient is inverse low pass (LOW): -0.25, 1, -0.25
Reverse high pass (HIGH): -0.125, 0.5, 0.75, 0.5, -0.125
(Here, the filter coefficient is expressed without considering the floor function part).
「タイリングをしない場合で、かつハイパス係数が全て0のとき(近似1)」、インターリーブされた係数列
L1 H1 L2 H2 L3 H3
において、H2位置中心に逆ハイパスフィルタをかけた値は、
-0.125H1+0.5L2+0.75H2+0.5L3−0.125H3=0.5L2+0.5L3 ‥‥(i)
となる。
“When tiling is not performed and all the high-pass coefficients are 0 (approximate 1)”, an interleaved coefficient sequence
L1 H1 L2 H2 L3 H3
The value obtained by applying an inverse high-pass filter to the center of the H2 position is
-0.125H1 + 0.5L2 + 0.75H2 + 0.5L3-0.125H3 = 0.5L2 + 0.5L3 (i)
It becomes.
一方、上記係数が、2つのタイルに分割されてから算出されたもので、H2位置がタイル境界であるとする。この場合、L1,H1,L2,H2は左側のタイルの係数、L3,H3は右側のタイルの係数になる。ここで、H2は、順変換(3タップのハイパスフィルタ)時にミラリングの影響を受けており、補正の対象となる係数である。タイリングは、各タイル内の画素だけを用いてウェーブレット変換を行う処理、あるいは、各タイル内の係数だけを用いて逆ウェーブレット変換を行う処理であるため、ミラリングによって左タイルの係数
L1 H1 L2 H2
を右側に補った場合
L1 H1 L2 H2 L2 H1
となる。
On the other hand, it is assumed that the coefficient is calculated after being divided into two tiles, and the H2 position is a tile boundary. In this case, L1, H1, L2, and H2 are coefficients of the left tile, and L3 and H3 are coefficients of the right tile. Here, H2 is a coefficient that is affected by mirroring during forward conversion (a 3-tap high-pass filter) and is a correction target. Tiling is a process that performs wavelet transform using only the pixels in each tile, or a process that performs inverse wavelet transform using only the coefficients in each tile.
L1 H1 L2 H2
Is supplemented to the right
L1 H1 L2 H2 L2 H1
It becomes.
よって、H2位置を中心に逆ハイパスフィルタをかけた値は、
-0.125H1+0.5L2+0.75H2+0.5L2−0.125H1=-0.25H1+L2+0.75H2‥‥(ii)
となる。
Therefore, the value obtained by applying an inverse high-pass filter around the H2 position is
-0.125H1 + 0.5L2 + 0.75H2 + 0.5L2-0.125H1 = -0.25H1 + L2 + 0.75H2 (ii)
It becomes.
デタイルのためには、(i)=(ii)を狙うため、
式(iii) H2=1/3H1−2/3L2+2/3L3
を得る。これが、タイル境界に隣接し、順変換時にミラリングの影響を受けたハイパス係数に対する「補正式」である。ただし、この補正値の算出時には、タイリングした係数しか存在しないため、L2は左タイルの係数、L3は右タイルの係数を使用する(近似2)。
In order to detil, in order to aim (i) = (ii)
Formula (iii) H2 = 1 / 3H1-2 / 3L2 + 2 / 3L3
Get. This is a “correction formula” for a high-pass coefficient that is adjacent to the tile boundary and affected by mirroring during forward conversion. However, since only the tiled coefficients exist when calculating the correction value, L2 uses the left tile coefficient and L3 uses the right tile coefficient (approximate 2).
タイル境界に隣接するローパス係数(L3)に関しても同様な立式が可能であり、その結果、H3の補正式として
式(iv) H3=0
を得ることができる。ただし、デコンポジションレベル1の場合は、H3はミラリングの誤差を含まないため補正しない(デコンポジションレベル2以上の場合は、H3に隣接するL3自体が、デコンポジションレベル1でミラリングの影響を受けているため補正する)。
The same equation can be used for the low-pass coefficient (L3) adjacent to the tile boundary. As a result, the equation (iv) H3 = 0 is used as a correction equation for H3.
Can be obtained. However, in the case of
JPEG2000に規定された非可逆の9×7ウェーブレットの場合についても、上記と同様な考え方で補正式を導出できる。すなわち、インターリーブされた係数列
H0 L1 H1 L2 H2 L3 H3 L4 H4
において、H2とL3の間がタイル境界である場合、次の補正式が得られる。
式(v) H2=(-0.0535H0+0.15644H1+0.09127L1-0.59127L2
+0.59127L3-0.09127L4)/0.60295
式(vi) H3=(0.05754L2-0.05754L4+0.03372H4)/0.53372
ただし、9×7変換の場合、デコンポジションレベル1の場合も補正してよい。
For the irreversible 9 × 7 wavelet defined in JPEG2000, a correction formula can be derived based on the same concept as described above. That is, the interleaved coefficient sequence
H0 L1 H1 L2 H2 L3 H3 L4 H4
In the case where the boundary between H2 and L3 is a tile boundary, the following correction formula is obtained.
Formula (v) H2 = (-0.0535H0 + 0.15644H1 + 0.09127L1-0.59127L2
+ 0.59127L3-0.09127L4) /0.60295
Formula (vi) H3 = (0.05754L2-0.05754L4 + 0.03372H4) /0.53372
However, in the case of 9 × 7 conversion, the case of the
次に、4タイル分割、デコンポジションレベル2のJPEG2000の符号の伸長処理を例に、上に述べたデタイル処理の流れを具体的に説明する。図7乃至図14は、デタイル処理の説明のための係数配列図である。なお、伸長処理は、符号のエントロピー復号、復号された各サブバンド係数の逆量子化、2次元の逆ウェーブレット変換、逆色空間変換の順に処理が進むが、その2次元逆ウェーブレット変換の過程でデタイル処理が実行される。
Next, the flow of the detiling process described above will be described in detail by taking, as an example, the decompression process of the JPEG 2000 code of four tile division and
図7は逆量子化後の4タイル分の係数配列を示しており、デコンポジションレベル2の係数2LL〜2HHはインターリーブされている。5x3変換が用いられている場合、図8に示した列Aの係数(H2対応)が式(iii)で補正され、列Bの係数(H3対応)が式(iv)で補正される。9x7変換の場合は、列Aの係数が式(v)で補正され、列Bの係数が式(vi)で補正される。このような補正後の係数に対し、水平方向の逆ウェーブレット変換が行われる(JPEG2000では、ウェーブレット変換(順変換)は垂直方向、水平方向の順に行われるため、逆変換は水平方向、垂直方向の順に行われる)。この水平方向逆変換後の係数配列を図9に示す。
FIG. 7 shows a coefficient array for four tiles after inverse quantization, and coefficients 2LL to 2HH of the
次に、デコンポジションレベル2の係数のうち、図10に示す行Cの係数(H2対応)と行Dの係数(H3対応)を補正する。5x3変換の場合、行Cの係数は式(iii)で補正され、行Dの係数は式(iv)で補正される。9x7変換の場合、行Cの係数は式(v)で補正され、行Dの係数は式(vi)で補正される。このような補正後の係数に対し、垂直方向の逆ウェーブレット変換が行われ、図11の様なデコンポジションレベル1の係数がデインターリーブされた状態になる。係数をインターリーブすると図12のようになる。
Next, among the coefficients at
図12に示すデコンポジションレベル1の係数のうち、5x3変換の場合は、図13に示す列Eの係数を式(iii)で補正する。先に述べたように5×3変換の場合、デコンポジションレベル1では、列Fの係数はミラリングの誤差を含まないため補正不要である。一方、9x7変換の場合、列Eの係数が式(v)で補正され、列Fの係数が式(vi)で補正される。このような補正後に水平方向の逆ウェーブレット変換が行われ、図14の状態になる。そして、5x3変換の場合、図14の行Gの係数が式(iii)で補正される。9x7変換の場合、行Gの係数が式(v)で補正され、行Hの係数が式(vi)で補正される。補正後の係数に対し垂直方向の逆ウェーブレット変換が行われる。これでデタイル処理と2次元逆ウェーブレット変換処理が終了した。
In the case of 5 × 3 conversion among the coefficients at
<本発明の実施形態の説明>
以下、本発明の実施の形態について説明する。図15は本発明の実施形態を説明するためのブロック図である。図15に示す画像処理装置は、動画像のフレームデータを取り込み、それを圧縮した符号を出力し、また圧縮された動画像の符号を取り込み、それを伸長したフレームデータを出力する機能を持つもので、色変換・逆変換部1、3次元ウェーブレット変換・逆変換部2、量子化・逆量子化部4、エントロピー符号化・復号化部5、符号形成・タグ処理部6から構成される。
<Description of Embodiment of the Present Invention>
Embodiments of the present invention will be described below. FIG. 15 is a block diagram for explaining an embodiment of the present invention. The image processing apparatus shown in FIG. 15 has a function of taking in moving image frame data, outputting a compressed code, and taking in a compressed moving image code, and outputting the decompressed frame data. The color conversion /
圧縮処理時の動作の概略は次の通りである。動画像のフレームデータは色変換・逆色変換部1に入力される(フレームデータをタイル分割して処理することも可能であるが、ここでは説明を簡単にするためタイル分割はなされないものとする)。色変換・逆色変化部1で、フレームデータ(例えばRGBデータ)はYCbCrなどの輝度・色差データに変換される。変換後の各コンポーネントのデータは、3次元ウェーブレット変換・逆変換部2によって、時間方向(フレーム並び方向)を含む3次元の順ウェーブレット変換を適用されてウェーブレット係数データへ変換される。各コンポーネントのウェーブレット係数データは量子化・逆量子化部4で量子化された後、エントロピー符号化・復号化部5でエントロピー符号化される。そして、符号形成・タグ処理部6によって、必要なエントロピー符号からパケットが生成され、それが所定の順番に並べられるとともに必要なタグやタグ情報を付加されることにより符号が形成され、外部に出力される。
The outline of the operation at the time of compression processing is as follows. The frame data of the moving image is input to the color conversion / inverse color conversion unit 1 (the frame data can be processed by being divided into tiles, but here, for the sake of simplicity, the tile division is not performed. To do). The color conversion / reverse
伸長処理時の動作の概略は次の通りである。動画像の圧縮された符号は、符号形成・タグ処理部6に入力され、コンポーネント毎の符号に分離される。各コンポーネントの符号はエントロピー符号化・復号化部5によりエントロピー復号化され、ウェーブレット係数データに戻される。このウェーブレット係数データは量子化・逆量子化部4で逆量子化されてから3次元ウェーブレット変換・逆変換部2に入力され、3次元の逆ウェーブレット変換を適用される。3次元ウェーブレット変換・逆変換部2は係数補正手段2を備えており、時間方向の逆ウェーブレット変換の過程で、係数補正手段2によりGOF境界付近のハイパス係数に対しGOF境界歪みを抑制するための係数補正処理を施す。このような時間方向の逆ウェーブレット変換の際の係数補正処理が本発明の最大の特徴部分である。
The outline of the operation during the decompression process is as follows. The compressed code of the moving image is input to the code forming /
以下、本発明の2つの実施形態について、より具体的に説明する。ここでは、ウェーブレット変換として、JPEG2000標準の5×3変換又は9×7変換が用いられるものとして説明する。 Hereinafter, two embodiments of the present invention will be described more specifically. Here, a description will be given assuming that the JPEG2000 standard 5 × 3 conversion or 9 × 7 conversion is used as the wavelet conversion.
[実施形態1]
本実施形態について、まず圧縮処理時の3次元ウェーブレット変換・逆変換部2の処理を説明する。
[Embodiment 1]
Regarding the present embodiment, the processing of the three-dimensional wavelet transform /
図16は、3次元ウェーブレット変換・逆変換部2の圧縮処理時の機能的構成を示すブロック図であり、21はフレーム内2次元順ウェーブレット変換手段、22は時間方向順ウェーブレット変換手段である。
FIG. 16 is a block diagram showing a functional configuration during the compression process of the three-dimensional wavelet transform /
圧縮処理時には、図17に模式的に示すような動画像のフレームデータ(色変換後)がフレーム内2次元順ウェーブレット変換手段21に順次入力し、各フレームデータに2次元順ウェーブレット変換が適用される。2階層(デコンポジションレベル2)までの2次元順ウェーブレット変換の結果を図18に模式的に示す。このような2次元順ウェーブレット変換の結果は時間方向順ウェーブレット変換手段22に入力し、連続した所定数のフレームの集まり(GOF)を単位として、時間方向に順ウェーブレット変換が適用される。2階層(デコンポジションレベル2)までの時間方向順ウェーブレット変換の結果を図19に模式的に示す。 During compression processing, moving image frame data (after color conversion) as schematically shown in FIG. 17 is sequentially input to the intra-frame two-dimensional order wavelet transform means 21, and the two-dimensional order wavelet transform is applied to each frame data. The FIG. 18 schematically shows the result of the two-dimensional forward wavelet transform up to two layers (decomposition level 2). The result of such a two-dimensional forward wavelet transform is input to the time direction forward wavelet transform means 22, and the forward wavelet transform is applied in the time direction in units of a predetermined number of consecutive frames (GOF). FIG. 19 schematically shows the result of time-direction wavelet transform up to two layers (decomposition level 2).
図20は、このような3次元順ウェーブレット変換処理のフローチャートである。フレーム内2次元順ウェーブレット変換手段21において、step1,2,3,4,5,6の処理ループで、GOFの先頭フレームから最終フレームまで、1フレーム単位で2次元(縦方向、横方向)の順ウェーブレット変換が行われる。すなわち、step1で垂直方向の順ウェーブレット変換が行われ、次にstep2で水平方向の順ウェーブレット変換が行われることにより、デコンポジションレベル1のウェーブレット係数データが生成される。2階層以上の順ウェーブレット変換が適用される場合には、デコンポジションレベル1のウェーブレット係数データのLL係数データに対しstep1,2による2次元順ウェーブレット変換が行われ、デコンポジションレベル2のウェーブレット係数データが生成される。所定の階層までの変換が終わると(step3,Yes)、次のフレームに対し同様の2次元順ウェーブレット変換が行われる。
FIG. 20 is a flowchart of such a three-dimensional forward wavelet transform process. In the intra-frame two-dimensional forward wavelet transform means 21, in the processing loop of
GOFの最終フレームに対する所定階層までの2次元ウェーブレット変換が終了すると(step5,Yes)、時間方向順ウェーブレット変換手段22において、step7,8,9の処理ループで、GOFの先頭フレームから最終フレームまでの対応した係数列に対し時間方向の1次元順ウェーブレット変換が行われる(ウェーブレット係数は時間方向にL,H,L,H...の順になる)。2階層以上の時間方向順ウェーブレット変換が適用される場合には、ウェーブレット係数をデインターリーブし(L係数とH係数をまとめること)、L係数データに対しフレームの同じ位置の係数を用いて時間方向の順ウェーブレット変換が繰り返される。所定階層まで変換が終了すると(step7,Yes)、1つのGOFに対する3次元順ウェーブレット変換が完了する。
When the two-dimensional wavelet transform up to a predetermined layer for the GOF final frame is completed (
次に、本実施形態における伸長処理時の3次元ウェーブレット変換部2の処理について説明する。
Next, the process of the three-dimensional
図21は、3次元ウェーブレット変換・逆変換部2の伸長処理時の機能的構成を示すブロック図であり、3は係数補正手段、31は時間方向逆ウェーブレット変換手段、32はフレーム内2次元逆ウェーブレット変換手段である。
FIG. 21 is a block diagram showing a functional configuration of the three-dimensional wavelet transform /
伸長処理時には、エントロピー符号化・復号化部5で復号され、量子化・逆量子化部4で逆量子化されたウェーブレット係数データが3次元ウェーブレット変換・逆変換部2に入力し、最高階層(最も高いデコンポジションレベル)より下位階層へ向かって3次元逆ウェーブレット変換が実行される。本実施形態では、まず時間方向逆ウェーブレット変換手段31で各GOFのウェーブレット係数データに対し時間方向の逆ウェーブレット変換が行われるが、その各階層の逆ウェーブレット変換に先立ってGOF境界歪みを抑制するための係数補正が係数補正手段3によって行われる。このような係数補正及び時間方向の逆ウェーブレット変換が最下階層まで繰り返された結果(各フレーム毎のウェーブレット係数データ)に対し、フレーム内2次元逆ウェーブレット変換手段32によって、最高階層から下位階層へ向かって2次元逆ウェーブレット変換が行われ、GOF境界歪みが抑制されたフレームデータが生成される。このフレームデータは色変換されたものであるので、色変換・逆色変換部1で逆色変換されることにより元の表色系のフレームデータに戻される。
During the decompression process, the wavelet coefficient data decoded by the entropy encoding /
図23は、このような2次元逆ウェーブレット変換手段32による処理フローを示すフローチャートである。この処理は、時間方向逆ウェーブレット変換及び係数補正が終わったGOFの先頭フレームから最終フレームへ向かって、フレーム毎に実行される。step21で、最高階層のウェーブレット係数データに対し2次元逆ウェーブレット変換が適用され、次位階層のLL係数データが生成される。圧縮時の順ウェーブレット変換は垂直方向、水平方向の順に変換が行われたため、伸長時の逆ウェーブレット変換は水平方向、垂直方向の順に行われる。生成されたLL係数データを含む次位階層のウェーブレット係数データに対し、同様の2次元逆ウェーブレット変換が適用される。最低階層まで2次元逆ウェーブレット変換が行われてフレームデータに戻されたならば(step22,Yes)、処理の対象を次フレームに進め(step25)、同様の2次元逆ウェーブレット変換が行われる。このような2次元逆ウェーブレットがGOFの最終フレームまで終了すると(step24,Yes)、1つのGOFの全フレームのデータが復元されたことになる。
FIG. 23 is a flowchart showing a processing flow by such a two-dimensional inverse wavelet transform means 32. This process is executed for each frame from the first frame of the GOF after the time direction inverse wavelet transform and coefficient correction to the last frame. In
以上に説明した、以下にさらに詳細に説明する本実施形態に係る画像処理装置は、例えば図44に示すようなCPU1000、メモリ1001、ハードディスク装置1002、ディスプレイ装置1004、キーボードやマウスのようなポインティングデバイス等のユーザ入力装置1003、ネットワーク経由の通信のための通信インターフェース1005などをバス1006で接続したようなコンピュータの資源を利用して実現することができる。すなわち、このようなコンピュータを、図15に示す各部1,2,4,5,6として機能させるプログラムをメモリ1001にロードし、CPU1000に実行させることにより、本実施形態に係る画像処理装置としてコンピュータを動作させることができる。このようなプログラム、及び、それが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などのコンピュータが読み取り可能な情報記録(記憶)媒体も本発明に包含される。コンピュータ上では、圧縮処理と伸長処理は例えば次のような流れで実行される。
The image processing apparatus according to the present embodiment described above in further detail below includes a
圧縮処理の場合、動画像のフレームデータは例えばハードディスク装置1002よりメモリ1001に読み込まれる。このフレームデータに対し、前述のような色変換、3次元順ウェーブレット変換、量子化、エントロピー符号化、符号形成の各処理が実行される。生成された動画像の符号はハードディスク装置1002に保存され、あるいは、通信インターフェース1005より外部装置へ送信される。
In the case of compression processing, moving image frame data is read into the
伸長処理の場合、動画像の符号は例えばハードディスク装置1002よりメモリ1001に読み込まれ、あるいは、通信インターフェース1005からネットワーク経由で受信されてメモリ1001に読み込まれる。この符号に対し、エントロピー復号、逆量子化、係数補正を含む時間方向逆ウェーブレット変換とフレーム内2次元逆ウェーブレット変換、逆色変換の各処理が実行される。復元された動画像のフレームデータは、ハードディスク装置1002に保存され、あるいはディスプレイ装置1004に表示される。
In the decompression process, the moving image code is read into the
次に、伸長処理時における係数補正手段3及び時間方向逆ウェーブレット変換手段31の処理に関し、5つの実施例を挙げてさらに説明する。なお、説明の便宜上、特に断らない限り、圧縮時におけるフレーム内順ウェーブレット変換と時間方向順ウェーブレット変換はそれぞれ2階層(デコンポジションレベル2)まで行われたものとする。
Next, the processing of the
(実施形態1の実施例1)
本実施形態に係る実施例1について図22、図24〜図27により説明する。図22は、係数補正及び時間方向逆ウェーブレット変換の処理フローを示すフローチャートである。時間方向の最高階層のウェーブレット係数データに関し、GOF境界歪みを抑制するために、GOF境界に隣接したハイパス係数と、GOF境界近傍の境界に隣接しないハイパス係数の補正を係数補正手段3で行う(step11,step12)。この係数補正後の最高階層の係数データに対し時間方向の逆ウェーブレット変換を時間方向逆ウェーブレット変換手段31で行う(step13)。階層を1つ下げ(step15)、その階層のウェーブレット係数に対し同様の係数補正を行い(step11,step12)、この補正後の係数データに対し時間方向の逆ウェーブレット変換を行う(step13)。時間方向のデコンポジションレベル1のウェーブレット係数まで上記処理が繰り返され、GOF内の各フレームの2次元ウェーブレット係数データに戻ると(step14,Yes)、係数補正と時間方向逆ウェーブレット変換の処理は終了する。
(Example 1 of Embodiment 1)
Example 1 according to this embodiment will be described with reference to FIGS. 22 and 24 to 27. FIG. 22 is a flowchart showing a processing flow of coefficient correction and time direction inverse wavelet transform. With respect to the wavelet coefficient data of the highest hierarchy in the time direction, in order to suppress the GOF boundary distortion, the coefficient correction means 3 corrects the high-pass coefficient adjacent to the GOF boundary and the high-pass coefficient not adjacent to the boundary near the GOF boundary (step 11). , Step 12). The time direction inverse wavelet transform is performed on the coefficient data of the highest layer after the coefficient correction by the time direction inverse wavelet transform means 31 (step 13). The layer is lowered by one (step 15), the same coefficient correction is performed on the wavelet coefficients of that layer (
このような処理の内容を、図24の(a)に示すような3次元ウェーブレット係数データを例にして説明する。なお、ここではウェーブレット変換としてJPEG2000の5×3変換が用いられるものとするが、9×7変換が用いられる場合も、係数補正式が異なる以外は同様である。また、ここでは、フレーム内2LLサブバンド係数に対応した時間方向ウェーブレット係数の補正及び逆ウェーブレット変換を例にして説明するが、フレーム内の他のサブバンド係数に対応した時間方向ウェーブレット係数についても同様に考えればよい。
The contents of such processing will be described with reference to three-dimensional wavelet coefficient data as shown in FIG. Here,
まず、時間方向のデコンポジションレベル2の係数2L,2Hをインターリーブする(2L同士、2H同士まとまっていたものを2L,2H,2L,2H…の順に配置しなおす)。インターリーブ後の係数2L,2Hに関し、図24の(b)に点線で示すGOF境界に隣接するハイパス係数(2LL2H(t6))と、GOF境界近傍の境界に隣接しないハイパス係数(2LL2H(t10))を補正する。ハイパス係数の補正式は図26に示す通りである。
First, the
なお、9×7変換の場合の補正式は
2LL2H(t6)=(-0.0535x2LL2H(t2)+0.15644x2LL2H(t2)+0.09127x2LL2L(t0)
-0.59127x2LL2L(t4)+0.591272x2LL2L(t8)-0.09127x2LL2L(t10))/0.60295
2LL2H(t10)=(0.05754x2LL2L(t4)-0.05754x2LL2L(t8)+0.03372x2LL2H(t14))/0.53372
となる。
The correction formula for 9x7 conversion is
2LL2H (t6) = (-0.0535x2LL2H (t2) + 0.15644x2LL2H (t2) + 0.09127x2LL2L (t0)
-0.59127x2LL2L (t4) + 0.591272x2LL2L (t8) -0.09127x2LL2L (t10)) / 0.60295
2LL2H (t10) = (0.05754x2LL2L (t4) -0.05754x2LL2L (t8) + 0.03372x2LL2H (t14)) / 0.53372
It becomes.
フレーム内の2LH,2HL,2HH,1LH,1HL,1HHサブバンド係数に対応した時間方向のデコンポジションレベル2のウェーブレット係数に対しても同様の係数補正がなされる。補正式も同様である。
The same coefficient correction is performed on the wavelet coefficients of the
このような係数補正後のデコンポジションレベル2のウェーブレット係数に対し、時間方向の逆ウェーブレット変換を行う。図24(b)のデコンポジションレベル2のウェーブレット係数の場合、その逆ウェーブレット変換により図24(c)に示すようなデコンポジションレベル1の係数(2LL1L)が生成される。
The inverse wavelet transform in the time direction is performed on the wavelet coefficient at the
次に、時間方向のデコンポジションレベル1のウェーブレット係数に対する係数補正と逆ウェーブレット変換を行う。図25はその説明のための図である。図25(a)に示すのデコンポジションレベル1の係数1L,1Hをインターリーブし、図25(b)に示すGOF境界に隣接したハイパス係数(2LL1H(t7))と、GOF境界近傍の境界に隣接しないハイパス係数(2LL1H(t9))を補正する。係数補正式は図27に示す通りである。5×3変換の場合、デコンポジションレベル1のGOF境界に隣接しないハイパス係数(2LL1H(t9))はミラリングの影響を受けていないので補正しない。ただし、9×7変換ではGOF境界に隣接しないハイパス係数(2LL1H(t9))もミラリングの影響を受けているので補正する。
Next, coefficient correction and inverse wavelet transform are performed on the wavelet coefficients of the
9×7変換の場合の補正式は
2LL1H(t7)=(-0.0535x2LL1H(t3)+0.15644x2LL1H(t5)+0.09127x2LL1L(t4)
-0.59127x2LL1L(t6)+0.591272x2LL1L(t9)-0.09127x2LL1L(t11))/0.60295
2LL1H(t9)=(0.05754x2LL1L(t6)-0.05754x2LL1L(t8)+0.03372x2LL1H(t11))/0.53372
となる。
The correction formula for 9x7 conversion is
2LL1H (t7) = (-0.0535x2LL1H (t3) + 0.15644x2LL1H (t5) + 0.09127x2LL1L (t4)
-0.59127x2LL1L (t6) + 0.591272x2LL1L (t9) -0.09127x2LL1L (t11)) / 0.60295
2LL1H (t9) = (0.05754x2LL1L (t6) -0.05754x2LL1L (t8) + 0.03372x2LL1H (t11)) / 0.53372
It becomes.
フレーム内の2LH,2HL,2HH,1LH,1HL,1HHサブバンド係数に対応した時間方向のデコンポジションレベル1のウェーブレット係数に対しても同様の係数補正がなされる。補正式も同様である。
The same coefficient correction is performed on the wavelet coefficients of the
このような係数補正後のデコンポジションレベル1のウェーブレット係数に対し、時間方向の逆ウェーブレット変換を行う。図25(b)のデコンポジションレベル1のウェーブレット係数の場合、その逆ウェーブレット変換により、図25(c)に示すようなデコンポジションレベル0のデータ、つまり、フレーム内2次元ウェーブレット係数に戻ることになる。
The inverse wavelet transform in the time direction is performed on the wavelet coefficient of the
なお、前記補正式は一例であり、動画におけるGOF境界歪みの抑制に寄与するのであれば他の補正式を用いてもよい。また、本実施例では、GOF境界近傍のGOF境界に隣接しないハイパス係数も補正の対象としたが、その補正によるGOF境界歪みの抑制効果はGOF境界に隣接するハイパス係数の補正による効果に比べると小さいため、GOF境界に隣接しないハイパス係数を補正の対象から外すことも可能である。 The correction formula is an example, and other correction formulas may be used as long as they contribute to the suppression of GOF boundary distortion in a moving image. In this embodiment, the high-pass coefficient not adjacent to the GOF boundary near the GOF boundary is also subject to correction. However, the effect of suppressing the GOF boundary distortion by the correction is compared with the effect of correcting the high-pass coefficient adjacent to the GOF boundary. Since it is small, it is possible to exclude a high-pass coefficient that is not adjacent to the GOF boundary from the correction target.
また、GOF境界近傍のフレームの動き量を推定し、その動き量が所定値より小さいときにGOF境界歪み抑制のための係数補正を行い、その動き量が所定値より大きいときにGOF境界歪み抑制のための係数補正を行わないような制御を行ってもよい。なお、フレームの動き量の推定には、公知の方法を用いればよい。 Also, the motion amount of the frame near the GOF boundary is estimated, and when the motion amount is smaller than a predetermined value, coefficient correction for suppressing the GOF boundary distortion is performed, and when the motion amount is larger than the predetermined value, the GOF boundary distortion is suppressed. Control may be performed so as not to perform coefficient correction. A known method may be used to estimate the amount of motion of the frame.
また、GOF境界近傍のフレームの動き量に応じて、GOG境界近傍の係数に対する補正の度合いを段階的にまたは連続的に制御するようにしてもよい。例えば、GOF境界近傍のフレームの動き量をkとして、補正前の係数の値をx0、その補正後の係数の値をx1とするとき、GOF境界近傍のフレームの動き量を考慮した係数の値をxとすると、
x=(1-k)・x0+k・x1
とするなどが考えられる(動き量kを線形補間のパラメータとする)。
Further, the degree of correction for the coefficient near the GOG boundary may be controlled stepwise or continuously in accordance with the amount of motion of the frame near the GOF boundary. For example, when the motion amount of the frame near the GOF boundary is k, the coefficient value before correction is x0, and the coefficient value after correction is x1, the coefficient value considering the motion amount of the frame near the GOF boundary Where x is
x = (1-k) x0 + k x1
(The amount of motion k is used as a parameter for linear interpolation).
以上の変形態様は、後記各実施例につても同様である。 The above-described deformation modes are the same for the examples described later.
(実施形態1の実施例2)
本実施形態に係る実施例2について図28と図29により説明する。図28は、係数補正及び時間方向逆ウェーブレット変換の処理フローを示すフローチャートである。図28と図22を比較すれば明らかなように、step11,12により補正されたハイパス係数に対するクリッピング処理のステップ(step31,32)が追加されることが、本実施形態に係る前記実施例1と相違する点である。このクリッピング処理は係数補正手段3により実行される。
(Example 2 of Embodiment 1)
Example 2 according to this embodiment will be described with reference to FIGS. FIG. 28 is a flowchart showing a processing flow of coefficient correction and time direction inverse wavelet transform. As is clear from a comparison between FIG. 28 and FIG. 22, the step (
図29はクリッピング処理の説明図である。このクリッピング処理では、GOF境界抑制による係数の補正値が、その係数の量子化区間をはみ出た場合に、係数値を量子化区間の近い方の端の値に戻す。図29の例の場合、逆量子化後の係数値(補正前)は量子化区間[Q,2Q]の中にあり、当該係数の補正値が0であるので、そのクリップ値は量子区間の近い方のQとなる。 FIG. 29 is an explanatory diagram of clipping processing. In this clipping process, when the correction value of the coefficient due to the GOF boundary suppression protrudes from the quantization interval of the coefficient, the coefficient value is returned to the value at the end closer to the quantization interval. In the case of the example in FIG. 29, the coefficient value after dequantization (before correction) is in the quantization interval [Q, 2Q], and the correction value of the coefficient is 0. The closer Q.
(実施形態1に係る実施例3)
本実施形態に係る実施例3について図30〜32により説明する。図32は、係数補正及び時間方向逆ウェーブレット変換の処理フローを示すフローチャートである。図32と図28を比較すれば明らかなように、係数の量子化ステップ数と閾値thQの比較判定ステップstep41が追加され、量子化ステップ数>閾値thQと判定された場合にのみ係数補正が行われるが、そうでない場合にはstep11,31,12,32はスキップされることが本実施形態に係る前記実施例2と相違する。
(Example 3 according to Embodiment 1)
Example 3 according to this embodiment will be described with reference to FIGS. FIG. 32 is a flowchart showing a processing flow of coefficient correction and time direction inverse wavelet transform. As is apparent from a comparison between FIG. 32 and FIG. 28, a coefficient quantization step number and threshold thQ comparison determination step step 41 is added, and coefficient correction is performed only when it is determined that the quantization step number> threshold thQ. However, if not, steps 11, 31, 12 and 32 are skipped, which is different from Example 2 according to the present embodiment.
量子化ステップ数>閾値thQ以下の場合に係数補正(したがって補正値のクリッピング処理も)を行わない理由は次の通りである。 The reason why the coefficient correction (and therefore the correction value clipping process) is not performed when the number of quantization steps> threshold thQ or less is as follows.
図30は圧縮率が小さい場合のクリッピング処理の説明図面である。一般に圧縮率が小さいときには量子化ステップ数が小さい。よって、図30の例は量子化ステップ数が小さい例と考えることができる。 FIG. 30 is an explanatory diagram of clipping processing when the compression rate is small. Generally, when the compression rate is small, the number of quantization steps is small. Therefore, the example of FIG. 30 can be considered as an example in which the number of quantization steps is small.
図30のように量子化前の係数値(原信号)が2Qと3Qの間にあるとき(Qは量子化ステップ数)、この係数は2Q+(3/8)Qの値に逆量子化される(リコンストラクションパラメータが3/8の場合)。5×3変換の場合(ウェーブレットの基底関数がR5x3の場合)を例にとると、前記のように2Q+(3/8)Qの位置に逆量子化された係数は0に補正され(GOF境界に隣接しない係数の場合)、次にクリッピングにより2Qの位置に戻される。量子化ステップ数Qの値が小さいと、補正前の値とクリップ後の値の差は(3/8)Qである。よって、量子化ステップ数Qが十分小さければ補正前の値とクリップ後の値の差(3/8)Qは、さほど目立たないような微小な値になる。すなわち、量子化ステップ数Qが所定閾値thQ以下の場合には、GOF境界歪み抑制のための係数補正を行っても効果は小さいので、本実施例では係数補正とクリッピング処理を行わないようにすることにより、GOF境界歪み抑制のための処理量の削減を図っている。 When the coefficient value (original signal) before quantization is between 2Q and 3Q as shown in FIG. 30 (Q is the number of quantization steps), this coefficient is dequantized to a value of 2Q + (3/8) Q. (When the reconstruction parameter is 3/8) Taking the case of 5 × 3 transformation (when the wavelet basis function is R5x3) as an example, the coefficient dequantized to the position of 2Q + (3/8) Q as described above is corrected to 0 (GOF boundary) If the coefficient is not adjacent to), it is then clipped back to the 2Q position. If the value of the quantization step number Q is small, the difference between the value before correction and the value after clipping is (3/8) Q. Therefore, if the number of quantization steps Q is sufficiently small, the difference (3/8) Q between the value before correction and the value after clipping is a minute value that is not so noticeable. That is, when the number Q of quantization steps is equal to or less than the predetermined threshold thQ, even if coefficient correction for suppressing GOF boundary distortion is small, the coefficient correction and clipping processing are not performed in this embodiment. Thus, the amount of processing for suppressing GOF boundary distortion is reduced.
図31は圧縮率が大きい場合のクリッピング処理の説明図である。一般に圧縮率が大きいときには量子化ステップ数が大きい。よって、図の例は量子化ステップ数が大きい例と考えることができる。図のように量子化前の係数値(原信号)がQと2Qの間にあるとき、この係数はQ+(3/8)Qの位置に逆量子化される(リコンストラクションパラメータが3/8の場合)。ウェーブレットの基底関数がR5x3の場合を例にとると、前記のようにQ+(3/8)Qの位置に逆量子化された係数は0に補正され(GOF境界に隣接しない係数の場合)、次にクリッピングによりQの位置に戻される。補正前の値とクリップ後の値の差は(3/8)Qである。量子化ステップ数Qが大きければ、補正前の値とクリップ後の値の差(3/8)Qはかなり大きな値になる。よって、本実施例では、量子化ステップ数Qが所定の閾値thQより大きい場合には、GOF境界歪み抑制のための係数補正を行うわけである。 FIG. 31 is an explanatory diagram of clipping processing when the compression rate is large. In general, when the compression ratio is large, the number of quantization steps is large. Therefore, the example in the figure can be considered as an example in which the number of quantization steps is large. As shown in the figure, when the coefficient value (original signal) before quantization is between Q and 2Q, this coefficient is dequantized to the position of Q + (3/8) Q (the reconstruction parameter is 3/8) in the case of). Taking the case where the wavelet basis function is R5x3 as an example, the coefficient inversely quantized at the position of Q + (3/8) Q as described above is corrected to 0 (in the case of a coefficient not adjacent to the GOF boundary), Next, it is returned to the position Q by clipping. The difference between the value before correction and the value after clipping is (3/8) Q. If the number Q of quantization steps is large, the difference (3/8) Q between the value before correction and the value after clipping becomes a considerably large value. Therefore, in this embodiment, when the quantization step number Q is larger than the predetermined threshold thQ, coefficient correction for suppressing GOF boundary distortion is performed.
(実施形態1に係る実施例4)
図33は、本実施形態に係る実施例4における係数補正及び時間方向逆ウェーブレット変換の処理フローを示すフローチャートである。図33と図28を比較すれば明らかなように、デコンポジションレベル(階層数)と所定の閾値thlevの比較判定ステップstep51が追加され、閾値thlev以下のデコンポジションレベルの係数に対してのみGOF境界歪み抑制のための係数補正とその補正値のクリッピング処理(step11,31,12,32)を行うことが、本実施形態に係る前記実施例2と相違する。
(Example 4 according to Embodiment 1)
FIG. 33 is a flowchart showing a processing flow of coefficient correction and time-direction inverse wavelet transform in Example 4 according to the present embodiment. As is clear from a comparison between FIG. 33 and FIG. 28, a comparison
閾値thlevより高いデコンポジションレベルで係数補正を行わない理由は次の通りである。一つは、高いデコンポジションレベルの低周波係数はローパス処理を繰り返しかけられているので、もともと補正されているような状態であり、その係数をさらに補正してもGOF境界歪みを抑制する効果は少ないので、所定の閾値thlevより高いデコンポジションレベルを係数補正の対象外とすることにより、GOF境界歪み抑制を効率的に実現しようとするものである。もう一つは、高いデコンポジションレベルの係数補正の副作用は多くのフレームに及ぶため、所定の閾値より高いデコンポジションレベルを係数補正の対象から外すことにより、係数補正の副作用が及ぶ範囲を限定しようとするものである。もう一つは、高いデコンポジションレベルにおいては、画像によっては係数の数が足りなくなり、そもそも係数補正そのものが不可能である場合があるからである。 The reason why coefficient correction is not performed at a decomposition level higher than the threshold thlev is as follows. One is that the low frequency coefficient with a high decomposition level is repeatedly subjected to low-pass processing, so that it is originally corrected, and even if the coefficient is further corrected, the effect of suppressing the GOF boundary distortion is not effective. Since there are few, it is going to implement | achieve GOF boundary distortion suppression efficiently by excluding the decomposition level higher than predetermined threshold value thlev from the object of coefficient correction. The other is that the side effects of coefficient correction at a high decomposition level extend over many frames, so let's limit the range of side effects of coefficient correction by excluding decomposition levels higher than a predetermined threshold from the target of coefficient correction. It is what. Another reason is that at a high decomposition level, the number of coefficients may be insufficient depending on the image, and coefficient correction itself may not be possible in the first place.
なお、閾値thlev以下のデコンポジションレベルに関し、前記実施例3と同様に量子化ステップ数に応じて係数補正を制御するようにしてもよく、かかる態様も本実施例に包含される。 It should be noted that coefficient correction may be controlled in accordance with the number of quantization steps in the same manner as in the third embodiment with respect to the decomposition level equal to or lower than the threshold thlev, and this aspect is also included in this embodiment.
(実施形態1に係る実施例5)
図34は、本実施形態に係る実施例5における係数補正及び時間方向逆ウェーブレット変換の処理フローを示すフローチャートである。図34と図28を比較すれば明らかなように、利用者からの補正指定の有無を判定するステップstep61が追加され、補正指定が有る場合にのみGOF境界歪み抑制のための係数補正とその補正値のクリッピング処理(step11,31,12,32)を行うようにしたことが、本実施形態に係る前記実施例2と相違する。このようにするのは、利用者によってはGOF境界歪み抑制のための処理時間の増加を望まない場合もあるため、そのような場合にはGOF境界歪み抑制のための処理をスキップして処理を高速化するほうが合理的であるからである。
(Example 5 according to Embodiment 1)
FIG. 34 is a flowchart showing a processing flow of coefficient correction and time-direction inverse wavelet transform in Example 5 according to the present embodiment. As apparent from a comparison between FIG. 34 and FIG. 28,
図35により、利用者による補正指定の方法の一例を説明する。ここでは、本実施形態に係る画像処理装置をコンピュータを利用し実現する場合を想定している。 An example of a correction designation method by the user will be described with reference to FIG. Here, it is assumed that the image processing apparatus according to the present embodiment is realized using a computer.
図35の上側の図に示すように、圧縮された動画像を伸長して表示したり編集したい場合には、「ファイル」メニューの「開く」を選択してファイルを指定することにより、当該動画像の圧縮ファイルを開くことができる。このようにしてファイルを開く前に、例えば「プロパティ」を選択することにより、下側の図に示すようにGOF境界歪み抑制機能の有無を指定できるようにすることができる。ここで「有り」が選択された場合には、開いた圧縮ファイルの伸長処理においてGOF境界歪み抑制のための処理を実行し、「無し」が選択された場合には圧縮ファイルの伸長処理においてGOF境界歪み抑制のための処理を実行しない。 As shown in the upper diagram of FIG. 35, when the compressed moving image is to be displayed and edited, the movie is selected by selecting “Open” from the “File” menu and specifying the file. Can open compressed image files. Thus, before opening the file, for example, by selecting “property”, it is possible to designate whether or not the GOF boundary distortion suppression function is present as shown in the lower diagram. When “Yes” is selected here, processing for suppressing GOF boundary distortion is executed in the decompression processing of the opened compressed file, and when “No” is selected, GOF is executed in the decompression processing of the compressed file. Does not execute processing for suppressing boundary distortion.
なお、ファイルを開く方法には各種のパラメータを指定できる構成になっていることが望ましい。例えば、デコードする階層数、コンポーネント、画質、位置などをタブ設定してそれを選び設定することができる。そのタブの一つに「GOF境界歪み抑制処理」を含めるようにしてもよい。タブの「GOF境界歪み処理」を選ぶと、下側の図のように、GOF境界抑制機能の「有り」「無し」を選択できるようにし、「有り」を選択すると「高品質モード(または高画質モード)」と「高速モード」を選択することができるというような構成にしてもよい。この場合、例えば、高速モードならばGOF境界に隣接するハイパス係数のみを補正し、高画質モードならばGOF境界に隣接するハイパス係数とGOF境界近傍のGOF境界に隣接しないハイパス係数の両方について補正するというような構成にしてもよい。 In addition, it is desirable that the method for opening a file has a configuration in which various parameters can be designated. For example, the number of hierarchies to decode, components, image quality, position, etc. can be set as tabs and selected. One of the tabs may include “GOF boundary distortion suppression processing”. If you select “GOF Boundary Distortion” on the tab, you can select “Yes” or “No” for the GOF boundary suppression function as shown in the figure below, and if “Yes” is selected, “High Quality Mode (or High The image quality mode) and the high speed mode may be selected. In this case, for example, only the high-pass coefficient adjacent to the GOF boundary is corrected in the high-speed mode, and both the high-pass coefficient adjacent to the GOF boundary and the high-pass coefficient not adjacent to the GOF boundary near the GOF boundary are corrected in the high-quality mode. It may be configured as follows.
なお、本実施例においても、前記実施例3,4と同様に量子化ステップ数及び/又はデコンポジションレベルに応じて係数補正を制御するようにしてもよく、かかる態様も本実施例に包含される。 Also in the present embodiment, the coefficient correction may be controlled in accordance with the number of quantization steps and / or the composition level as in the third and fourth embodiments, and this aspect is also included in the present embodiment. The
[実施形態2]
本実施形態について、まず圧縮処理時の3次元ウェーブレット変換・逆変換部2の処理を説明する。
[Embodiment 2]
Regarding the present embodiment, the processing of the three-dimensional wavelet transform /
図36は、3次元ウェーブレット変換・逆変換部2の圧縮処理時の機能的構成を示すブロック図であり、21はフレーム内2次元順ウェーブレット変換手段、22は時間方向順ウェーブレット変換手段である。
FIG. 36 is a block diagram showing a functional configuration during the compression process of the three-dimensional wavelet transform /
圧縮処理時には、図17に模式的に示すような動画像のフレームデータ(色変換後)が時間方向順ウェーブレット変換手段22に入力し、連続した所定数のフレームの集まり(GOF)を単位として、時間方向に順ウェーブレット変換が適用される。2階層(デコンポジションレベル2)までの時間方向順ウェーブレット変換の結果を図38に模式的に示す。このような時間方向順ウェーブレット変換の結果がフレーム内2次元順ウェーブレット変換手段21に入力され、それぞれのフレーム(時間方向ウェーブレット係数データ)について垂直方向・水平方向の順に順ウェーブレット変換が施される。
At the time of compression processing, moving image frame data (after color conversion) as schematically shown in FIG. 17 is input to the time direction forward
図37は、このような順ウェーブレット変換処理の流れを示すフローチャートである。step101,102,103は時間方向の順ウェーブレット変換の処理ループを構成している。step104,105,106,107は1つのフレーム内の2次元順ウェーブレット変換の処理ループを構成している。この処理ループがGOFの最後のフレームまで実行されると(step108,Yes)、1つのGOFに対する3次元順ウェーブレット変換処理を終了する。
FIG. 37 is a flowchart showing the flow of such forward wavelet transform processing. Steps 101, 102, and 103 form a processing loop for forward wavelet transform in the time direction.
次に、本実施形態における伸長処理時の3次元ウェーブレット変換・逆変換部2の処理について説明する。
Next, the process of the three-dimensional wavelet transform /
図39は、3次元ウェーブレット変換・逆変換部2の伸長処理時の機能的構成を示すブロック図であり、3は係数補正手段、31は時間方向逆ウェーブレット変換手段、32はフレーム内2次元逆ウェーブレット変換手段である。
FIG. 39 is a block diagram showing a functional configuration of the three-dimensional wavelet transform /
伸長処理時には、エントロピー符号化・復号化部5で復号され、量子化・逆量子化部4で逆量子化されたウェーブレット係数データが3次元ウェーブレット変換・逆変換部2に入力し、最高階層(最も高いデコンポジションレベル)より下位階層へ向かって3次元逆ウェーブレット変換が実行される。
During the decompression process, the wavelet coefficient data decoded by the entropy encoding /
本実施形態では、まずフレーム内2次元逆ウェーブレット変換手段32によって、それぞれのフレームに対し最高階層から下位階層へ向かって2次元逆ウェーブレット変換が行われる。このフレーム内2次元逆ウェーブレット変換の処理フローは図23に示す通りである。次に、時間方向逆ウェーブレット変換手段31で最高階層から下位階層へ向かって時間方向の逆ウェーブレット変換が行われるが、その各階層の逆ウェーブレット変換に先立ってGOF境界歪みを抑制するための係数補正が係数補正手段3によって行われることにより、GOF境界歪みが抑制されたフレームデータが再生される。このフレームデータは色変換されたものであるので、色変換・逆色変換部1で逆色変換されることにより元の表色系のフレームデータに戻される。
In this embodiment, first, the intra-frame two-dimensional inverse wavelet transform means 32 performs two-dimensional inverse wavelet transform on each frame from the highest layer to the lower layer. The processing flow of this intra-frame two-dimensional inverse wavelet transform is as shown in FIG. Next, the time direction inverse wavelet transform means 31 performs the time direction inverse wavelet transform from the highest layer to the lower layer, and coefficient correction for suppressing the GOF boundary distortion prior to the inverse wavelet transform of each layer. Is performed by the coefficient correction means 3, and the frame data in which the GOF boundary distortion is suppressed is reproduced. Since this frame data has been subjected to color conversion, the color conversion / reverse
以上に説明した、以下にさらに詳細に説明する本実施形態に係る画像処理装置は、例えば図44に示すようなコンピュータの資源を利用して実現することができる。すなわち、このようなコンピュータを、図15に示す各部1,2,4,5,6として機能させるプログラムをメモリ1001にロードし、CPU1000に実行させることにより、本実施形態に係る画像処理装置としてコンピュータを動作させることができる。このようなプログラム、及び、それが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などのコンピュータが読み取り可能な情報記録(記憶)媒体も本発明に包含される。コンピュータ上では、圧縮処理と伸長処理は例えば次のような流れで実行される。
The image processing apparatus according to the present embodiment described above in further detail described above can be realized using, for example, computer resources as shown in FIG. That is, by loading a program that causes such a computer to function as the
圧縮処理の場合、動画像のフレームデータは例えばハードディスク装置1002よりメモリ1001に読み込まれる。このフレームデータに対し、前述のような色変換、3次元順ウェーブレット変換、量子化、エントロピー符号化、符号形成の各処理が実行される。生成された動画像の符号はハードディスク装置1002に保存され、あるいは、通信インターフェース1005より外部装置へ送信される。
In the case of compression processing, moving image frame data is read into the
伸長処理の場合、動画像の符号は例えばハードディスク装置1002よりメモリ1001に読み込まれ、あるいは、通信インターフェース1005からネットワーク経由で受信されてメモリ1001に読み込まれる。この符号に対し、エントロピー復号、逆量子化、フレーム内2次元逆ウェーブレット変換と係数補正を含む時間方向逆ウェーブレット変換逆色変換の各処理が実行される。復元された動画像のフレームデータは、ハードディスク装置1002に保存され、あるいはディスプレイ装置1004に表示される。
In the decompression process, the moving image code is read into the
次に、伸長処理時における係数補正手段3及び時間方向逆ウェーブレット変換手段31の処理に関し、5つの実施例を挙げてさらに説明する。なお、説明の便宜上、特に断らない限り、時間方向順ウェーブレット変換は2階層(デコンポジションレベル2)まで行われたものとする。
Next, the processing of the
(実施形態2の実施例1)
本実施形態に係る実施例1における係数補正及び時間方向逆ウェーブレット変換の処理フローは図22に示す通りであり、これは前記実施形態1に係る実施例1に関連して説明済みであるので、その説明は繰り返さない。
(Example 1 of Embodiment 2)
The processing flow of the coefficient correction and the time-direction inverse wavelet transform in Example 1 according to the present embodiment is as shown in FIG. 22, and since this has been described in relation to Example 1 according to
この処理の内容を、図40の(a)に模式的に示す時間方向ウェーブレット係数データを例にして説明する。なお、ここではウェーブレット変換としてJPEG2000の5×3変換が用いられるものとするが、9×7変換が用いられる場合も、係数補正式が異なる以外は同様である。
The contents of this processing will be described using the time direction wavelet coefficient data schematically shown in FIG. Here,
まず、時間方向のデコンポジションレベル2の係数2L,2Hをインターリーブする(2L同士、2H同士まとまっていたものを2L,2H,2L,2H…の順に配置しなおす)。インターリーブ後の係数2L,2Hに関し、図40の(b)に点線で示すGOF境界に隣接するハイパス係数(f62H(t6))と、GOF境界近傍の境界に隣接しないハイパス係数(f102H(t10))を補正する。ハイパス係数の補正式は図42に示す通りである。
First, the
なお、9×7変換の場合の補正式は
f62H(t6)=(-0.0535xf22H(t2)+0.15644xf22H(t2)+0.09127xf02L(t0)
-0.59127xf42L(t4)+0.591272xf82L(t8)-0.09127xf102L(t10))/0.60295
f102H(t10)=(0.05754xf42L(t4)-0.05754xf82L(t8)+0.03372xf142H(t14))/0.53372
となる。
The correction formula for 9x7 conversion is
f62H (t6) = (-0.0535xf22H (t2) + 0.15644xf22H (t2) + 0.09127xf02L (t0)
-0.59127xf42L (t4) + 0.591272xf82L (t8) -0.09127xf102L (t10)) / 0.60295
f102H (t10) = (0.05754xf42L (t4) -0.05754xf82L (t8) + 0.03372xf142H (t14)) / 0.53372
It becomes.
このような係数補正後のデコンポジションレベル2のウェーブレット係数に対し、時間方向の逆ウェーブレット変換を行う。図40(b)のデコンポジションレベル2のウェーブレット係数の場合、その逆ウェーブレット変換により図40(c)に示すようなデコンポジションレベル1の係数(1L)が生成される。
The inverse wavelet transform in the time direction is performed on the wavelet coefficient at the
次に、時間方向のデコンポジションレベル1のウェーブレット係数に対する係数補正と逆ウェーブレット変換を行う。図41はその説明のための図である。図41(a)に示すのデコンポジションレベル1の係数1L,1Hをインターリーブし、図41(b)に示すGOF境界に隣接したハイパス係数(f71H(t7))と、GOF境界近傍の境界に隣接しないハイパス係数(f91H(t9))を補正する。係数補正式は図43に示す通りである。5×3変換の場合、デコンポジションレベル1のGOF境界に隣接しないハイパス係数(f91H(t9))はミラリングの影響を受けていないので補正しない。ただし、9×7変換ではGOF境界に隣接しないハイパス係数(f91H(t9))もミラリングの影響を受けているので補正する。
Next, coefficient correction and inverse wavelet transform are performed on the wavelet coefficients of the
9×7変換の場合の補正式は
f71H(t7)=(-0.0535xf31H(t3)+0.15644xf51H(t5)+0.09127xf41L(t4)
-0.59127xf61L(t6)+0.591272xf91L(t9)-0.09127xf111L(t11))/0.60295
f91H(t9)=(0.05754xf61L(t6)-0.05754xf81L(t8)+0.03372xf111H(t11))/0.53372
となる。
The correction formula for 9x7 conversion is
f71H (t7) = (-0.0535xf31H (t3) + 0.15644xf51H (t5) + 0.09127xf41L (t4)
-0.59127xf61L (t6) + 0.591272xf91L (t9) -0.09127xf111L (t11)) / 0.60295
f91H (t9) = (0.05754xf61L (t6) -0.05754xf81L (t8) + 0.03372xf111H (t11)) / 0.53372
It becomes.
このような係数補正後のデコンポジションレベル1のウェーブレット係数に対し、時間方向の逆ウェーブレット変換を行う。図41(b)のデコンポジションレベル1のウェーブレット係数の場合、その逆ウェーブレット変換により、図41(c)に示すようなデコンポジションレベル0のデータ、つまり、フレームデータに戻ることになる。
The inverse wavelet transform in the time direction is performed on the wavelet coefficient of the
なお、前記補正式は一例であり、動画におけるGOF境界歪みの抑制に寄与するのであれば他の補正式を用いてもよい。また、本実施例では、GOF境界近傍のGOF境界に隣接しないハイパス係数も補正の対象としたが、その補正によるGOF境界歪みの抑制効果はGOF境界に隣接するハイパス係数の補正による効果に比べると小さいため、GOF境界に隣接しないハイパス係数を補正の対象から外すことも可能である。 The correction formula is an example, and other correction formulas may be used as long as they contribute to the suppression of GOF boundary distortion in a moving image. In this embodiment, the high-pass coefficient not adjacent to the GOF boundary near the GOF boundary is also subject to correction. However, the effect of suppressing the GOF boundary distortion by the correction is compared with the effect of correcting the high-pass coefficient adjacent to the GOF boundary. Since it is small, it is possible to exclude a high-pass coefficient that is not adjacent to the GOF boundary from the correction target.
また、GOF境界近傍のフレームの動き量を推定し、その動き量が所定値より小さいときにGOF境界歪み抑制のための係数補正を行い、その動き量が所定値より大きいときにGOF境界歪み抑制のための係数補正を行わないような制御を行ってもよい。なお、フレームの動き量の推定には、公知の方法を用いればよい。 Also, the motion amount of the frame near the GOF boundary is estimated, and when the motion amount is smaller than a predetermined value, coefficient correction for suppressing the GOF boundary distortion is performed, and when the motion amount is larger than the predetermined value, the GOF boundary distortion is suppressed. Control may be performed so as not to perform coefficient correction. A known method may be used to estimate the amount of motion of the frame.
また、GOF境界近傍のフレームの動き量に応じて、GOG境界近傍の係数に対する補正の度合いを段階的にまたは連続的に制御するようにしてもよい。例えば、GOF境界近傍のフレームの動き量をkとして、補正前の係数の値をx0、その補正後の係数の値をx1とするとき、GOF境界近傍のフレームの動き量を考慮した係数の値をxとすると、
x=(1-k)・x0+k・x1
とするなどが考えられる(動き量kを線形補間のパラメータとする)。
Further, the degree of correction for the coefficient near the GOG boundary may be controlled stepwise or continuously in accordance with the amount of motion of the frame near the GOF boundary. For example, when the motion amount of the frame near the GOF boundary is k, the coefficient value before correction is x0, and the coefficient value after correction is x1, the coefficient value considering the motion amount of the frame near the GOF boundary Where x is
x = (1-k) x0 + k x1
(The amount of motion k is used as a parameter for linear interpolation).
以上の変形態様は、後記各実施例につても同様である。 The above-described deformation modes are the same for the examples described later.
(実施形態2に係る実施例2)
本実施形態に係る実施例2における係数補正及び時間方向逆ウェーブレット変換の処理フローは図28示す通りである。すなわち、本実施例では、前記実施形態1に係る実施例2と同様に、係数補正手段3はハイパス係数の補正値に対しクリッピング処理を行う。
(Example 2 according to Embodiment 2)
The processing flow of coefficient correction and time direction inverse wavelet transform in Example 2 according to the present embodiment is as shown in FIG. That is, in this example, as in Example 2 according to the first embodiment, the
(実施形態2に係る実施例3)
本実施形態に係る実施例3における係数補正及び時間方向逆ウェーブレット変換の処理フローは図32に示す通りである。すなわち、本実施例では、前記実施形態1に係る実施例3と同様に、量子化ステップ数が所定の閾値thQを越えるか否かの判定を行い、量子化ステップ数が閾値thQを越える場合にのみ係数補正を行う。
(Example 3 according to Embodiment 2)
The processing flow of coefficient correction and time-direction inverse wavelet transform in Example 3 according to the present embodiment is as shown in FIG. That is, in this example, as in Example 3 according to the first embodiment, it is determined whether the number of quantization steps exceeds a predetermined threshold thQ, and when the number of quantization steps exceeds the threshold thQ. Only coefficient correction is performed.
(実施形態2に係る実施例4)
本実施形態に係る実施例4における係数補正及び時間方向逆ウェーブレット変換の処理フローは図33に示す通りである。すなわち、本実施例では、前記実施形態1に係る実施例4と同様に、デコンポジションレベルが所定の閾値thlevを越えるか否かの判定を行い、閾値thlev以下のデコンポジションレベルについてのみ係数補正を行う。
(Example 4 according to Embodiment 2)
The processing flow of coefficient correction and time-direction inverse wavelet transform in Example 4 according to the present embodiment is as shown in FIG. That is, in this example, as in Example 4 according to the first embodiment, it is determined whether the decomposition level exceeds a predetermined threshold value thlev, and coefficient correction is performed only for the decomposition level equal to or lower than the threshold value thlev. Do.
なお、本実施例においても、量子化ステップ数に応じて係数補正を制御するようにしてもよく、かかる態様も本実施例に包含される。 Also in this embodiment, the coefficient correction may be controlled according to the number of quantization steps, and this aspect is also included in this embodiment.
(実施形態2に係る実施例5)
本実施形態に係る実施例5における係数補正及び時間方向逆ウェーブレット変換の処理フローは図34に示す通りである。すなわち、本実施例では、前記実施形態1に係る実施例5と同様に、利用者からのGOF境界歪み抑制のための係数補正指示の有無を判定し、係数補正指示がある場合にのみGOF境界歪み抑制のための係数補正を行う。
(Example 5 according to Embodiment 2)
The processing flow of the coefficient correction and the time direction inverse wavelet transform in Example 5 according to the present embodiment is as shown in FIG. That is, in this example, as in Example 5 according to the first embodiment, the presence / absence of a coefficient correction instruction for suppressing GOF boundary distortion from the user is determined, and only when there is a coefficient correction instruction, the GOF boundary is determined. Coefficient correction for distortion suppression is performed.
利用者が指示を与える方法については、前記実施形態1に係る実施例5に関連して説明したので、その説明は繰り返さない。なお、本実施例においても、GOF境界抑制機能の「有り」「無し」を選択できるようにし、「有り」を選択すると「高品質モード(または高画質モード)」と「高速モード」を選択することができるというような構成にしてもよい。この場合、例えば、高速モードならばGOF境界に隣接するハイパス係数のみを補正し、高画質モードならばGOF境界に隣接するハイパス係数とGOF境界近傍のGOF境界に隣接しないハイパス係数の両方について補正するというような構成にしてもよい。 The method for giving an instruction by the user has been described in connection with Example 5 according to the first embodiment, and therefore the description thereof will not be repeated. Also in the present embodiment, “present” and “none” of the GOF boundary suppression function can be selected, and when “present” is selected, “high quality mode (or high image quality mode)” and “high speed mode” are selected. It may be configured to be able to. In this case, for example, only the high-pass coefficient adjacent to the GOF boundary is corrected in the high-speed mode, and both the high-pass coefficient adjacent to the GOF boundary and the high-pass coefficient not adjacent to the GOF boundary near the GOF boundary are corrected in the high-quality mode. It may be configured as follows.
なお、本実施例においても、前記実施例3,4と同様にデコンポジションレベル及び/又は量子化ステップ数に応じて係数補正を制御するようにしてもよく、かかる態様も本実施例に包含される。 Also in the present embodiment, the coefficient correction may be controlled according to the decomposition level and / or the number of quantization steps as in the third and fourth embodiments, and this aspect is also included in the present embodiment. The
以上、本発明に係る画像処理装置について説明したが、以上の説明は本発明に係る画像処理方法の説明でもあることは明らかである。よって、本発明に係る画像処理方法の説明は繰り返さない。 Although the image processing apparatus according to the present invention has been described above, it is obvious that the above description is also the description of the image processing method according to the present invention. Therefore, the description of the image processing method according to the present invention will not be repeated.
以上の説明においては時間方向の周波数変換としてウェーブレット変換が用いられたが、ウェーブレット変換以外の周波数変換を用いる場合にも本発明は適用し得るものである。また、以上の説明においてはフレーム内ウェーブレット変換(一般的には周波数変換)は2次元について行われたが、1次元に行う場合にも本発明を適用可能である。さらには、フレーム内ウェーブレット変換(一般的には周波数変換)を行わず、GOF単位の時間方向ウェーブレット変換(一般的には周波数変換)のみを行う場合にも本発明を適用可能である。 In the above description, wavelet transformation is used as frequency transformation in the time direction, but the present invention can also be applied to cases where frequency transformation other than wavelet transformation is used. In the above description, the intra-frame wavelet transform (generally frequency transform) is performed in two dimensions. However, the present invention can also be applied to the case of performing in one dimension. Furthermore, the present invention can also be applied to the case where only the time direction wavelet transform (generally frequency conversion) in units of GOF is performed without performing the intra-frame wavelet transform (generally frequency conversion).
1 色変換・逆色変換部
2 3次元ウェーブレット変換・逆変換部
3 係数補正手段
4 量子化・逆量子化部
5 エントロピー符号化・復号化部
6 符号形成・タグ処理部
21 フレーム内2次元順ウェーブレット変換手段
22 時間方向順ウェーブレット変換手段
31 時間方向逆ウェーブレット変換手段
32 フレーム内2次元逆ウェーブレット変換手段
1 color conversion / inverse
Claims (16)
前記逆周波数変換手段により逆周波数変換される周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正手段、
を有することを特徴とする画像処理装置。 Inverse frequency conversion means for performing reverse frequency conversion in the time direction on a frequency coefficient generated by performing frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF);
The high frequency coefficient adjacent to the GOF boundary in the frequency coefficient subjected to inverse frequency conversion by the inverse frequency conversion means is low when the inverse frequency conversion value centered on the high frequency coefficient is not subjected to GOF division prior to the inverse frequency conversion. Coefficient correction means for correcting to be equal to the inverse frequency conversion value using only the frequency coefficient ;
An image processing apparatus comprising:
前記逆周波数変換手段により逆周波数変換される特定階層以下の周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正手段、
を有することを特徴とする画像処理装置。 Inverse frequency conversion means for performing reverse frequency conversion in the time direction on the frequency coefficient generated by hierarchical frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF);
Prior to the inverse frequency conversion, the inverse frequency conversion value centered on the high frequency coefficient is subjected to GOF division before the inverse frequency conversion of the high frequency coefficient adjacent to the GOF boundary in the frequency coefficient below the specific layer to be inverse frequency converted by the inverse frequency conversion means. Coefficient correction means for correcting to be equal to the inverse frequency conversion value using only the low frequency coefficient when not
An image processing apparatus comprising:
前記係数補正手段は、前記逆周波数変換手段により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列 The coefficient correction means is a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before being subjected to inverse frequency conversion by the inverse frequency conversion means.
L1 H1 L2 H2 L3 H3 L4 H4 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を(However, L1, L2, L3, and L4 are low frequency coefficients, H1, H2, H3, and H4 are high frequency coefficients, and there is a boundary between two GOFs temporally continuous between H2 and L3, and L1 , H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), the correction value of the high-frequency coefficient H2 adjacent to the GOF boundary
H2=(1/3)H1−(2/3)L2+(2/3)L3 H2 = (1/3) H1- (2/3) L2 + (2/3) L3
により算出することを特徴とする請求項1又は2記載の画像処理装置。The image processing apparatus according to claim 1, wherein the image processing apparatus is calculated by:
前記係数補正手段は、前記逆周波数変換手段により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列 The coefficient correction means is a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before being subjected to inverse frequency conversion by the inverse frequency conversion means.
H0 L1 H1 L2 H2 L3 H3 L4 H4 H0 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H0,H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、H0,L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を(However, L1, L2, L3, and L4 are low frequency coefficients, H0, H1, H2, H3, and H4 are high frequency coefficients, and there are two temporally continuous GOF boundaries between H2 and L3. H0, L1, H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), and the high-frequency coefficient H2 adjacent to the GOF boundary Correction value
H2=(-0.0535H0+0.15644H1+0.09127L1-0.59127L2+0.59127L3-0.09127L4)/0.60295 H2 = (-0.0535H0 + 0.15644H1 + 0.09127L1-0.59127L2 + 0.59127L3-0.09127L4) /0.60295
により算出することを特徴とする請求項1又は2記載の画像処理装置。The image processing apparatus according to claim 1, wherein the image processing apparatus is calculated by:
前記逆周波数変換工程により逆周波数変換される周波数係数中のGOFに隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正工程、
を有することを特徴とする画像処理方法。 A reverse frequency conversion step of performing reverse frequency conversion in the time direction on a frequency coefficient generated by performing frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF);
Prior to the inverse frequency conversion , the high frequency coefficient adjacent to the GOF in the frequency coefficient subjected to the inverse frequency conversion in the inverse frequency conversion step is a low frequency when the inverse frequency conversion value centering on the high frequency coefficient is not subjected to the GOF division. A coefficient correction step for correcting to be equal to the inverse frequency conversion value using only the coefficient;
An image processing method comprising:
前記逆周波数変換工程により逆周波数変換される特定階層以下の周波数係数中のGOF境界に隣接する高周波係数を、その逆周波数変換に先だって、当該高周波係数を中心とした逆周波数変換値がGOF分割をしない場合の低周波係数のみを用いた逆周波数変換値と等しくなるように補正する係数補正工程、
を有することを特徴とする画像処理方法。 A reverse frequency conversion step of performing reverse frequency conversion in the time direction on a frequency coefficient generated by hierarchical frequency conversion in the time direction for each group of moving image frames (hereinafter referred to as GOF);
Prior to the inverse frequency conversion, the inverse frequency conversion value centered on the high frequency coefficient is divided into GOF divisions before the inverse frequency conversion of the high frequency coefficient adjacent to the GOF boundary in the frequency coefficient below the specific layer that is inverse frequency converted by the inverse frequency conversion step. A coefficient correction step for correcting to be equal to the inverse frequency conversion value using only the low frequency coefficient when not ,
An image processing method comprising:
前記係数補正工程は、前記逆周波数変換工程により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列 The coefficient correction step includes a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before the reverse frequency conversion is performed by the reverse frequency conversion step.
L1 H1 L2 H2 L3 H3 L4 H4 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を(However, L1, L2, L3, and L4 are low frequency coefficients, H1, H2, H3, and H4 are high frequency coefficients, and there is a boundary between two GOFs temporally continuous between H2 and L3, and L1 , H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), the correction value of the high-frequency coefficient H2 adjacent to the GOF boundary
H2=(1/3)H1−(2/3)L2+(2/3)L3 H2 = (1/3) H1- (2/3) L2 + (2/3) L3
により算出することを特徴とする請求項8又は9記載の画像処理方法。The image processing method according to claim 8, wherein the image processing method is calculated by:
前記係数補正工程は、前記逆周波数変換工程により逆周波数変換される前のインターリーブされたGOF境界近傍の周波数係数の系列 The coefficient correction step includes a sequence of frequency coefficients in the vicinity of the interleaved GOF boundary before the reverse frequency conversion is performed by the reverse frequency conversion step.
H0 L1 H1 L2 H2 L3 H3 L4 H4 H0 L1 H1 L2 H2 L3 H3 L4 H4
(ただし、L1,L2,L3,L4は低周波係数であり、H0,H1,H2,H3,H4は高周波係数であり、H2とL3の間に時間的に連続した2つのGOFの境界があり、H0,L1,H1,L2,H2は時間的に早い側のGOFに属し、L3,H3,L4,H4は時間的に遅い側のGOFに属する)において、GOF境界に隣接する高周波係数H2の補正値を(However, L1, L2, L3, and L4 are low frequency coefficients, H0, H1, H2, H3, and H4 are high frequency coefficients, and there are two temporally continuous GOF boundaries between H2 and L3. H0, L1, H1, L2, and H2 belong to the GOF on the earlier side in time, and L3, H3, L4, and H4 belong to the GOF on the later side in time), and the high-frequency coefficient H2 adjacent to the GOF boundary Correction value
H2=(-0.0535H0+0.15644H1+0.09127L1-0.59127L2+0.59127L3-0.09127L4)/0.60295 H2 = (-0.0535H0 + 0.15644H1 + 0.09127L1-0.59127L2 + 0.59127L3-0.09127L4) /0.60295
により算出することを特徴とする請求項8又は9記載の画像処理方法。The image processing method according to claim 8, wherein the image processing method is calculated by:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005296664A JP4743604B2 (en) | 2005-07-15 | 2005-10-11 | Image processing apparatus, image processing method, program, and information recording medium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005206666 | 2005-07-15 | ||
JP2005206666 | 2005-07-15 | ||
JP2005296664A JP4743604B2 (en) | 2005-07-15 | 2005-10-11 | Image processing apparatus, image processing method, program, and information recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007049664A JP2007049664A (en) | 2007-02-22 |
JP4743604B2 true JP4743604B2 (en) | 2011-08-10 |
Family
ID=37852102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005296664A Expired - Fee Related JP4743604B2 (en) | 2005-07-15 | 2005-10-11 | Image processing apparatus, image processing method, program, and information recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4743604B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8731062B2 (en) * | 2008-02-05 | 2014-05-20 | Ntt Docomo, Inc. | Noise and/or flicker reduction in video sequences using spatial and temporal processing |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6813387B1 (en) * | 2000-02-29 | 2004-11-02 | Ricoh Co., Ltd. | Tile boundary artifact removal for arbitrary wavelet filters |
JP2004056260A (en) * | 2002-07-17 | 2004-02-19 | Ricoh Co Ltd | Image decoder, image processor, program, recording medium and image decoding method |
JP2004064190A (en) * | 2002-07-25 | 2004-02-26 | Ricoh Co Ltd | Image processing apparatus, method, program, and recording medium |
-
2005
- 2005-10-11 JP JP2005296664A patent/JP4743604B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007049664A (en) | 2007-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7609899B2 (en) | Image processing apparatus, image processing method, and recording medium thereof to smooth tile boundaries | |
US7577308B2 (en) | Image data generation with reduced amount of processing | |
US8116581B2 (en) | Efficient image representation by edges and low-resolution signal | |
JP2010022006A (en) | Image data processing method | |
JP2012109957A (en) | Geometrical image representation and compression | |
EP3373584B1 (en) | Content adaptive and art directable scalable video coding | |
JP4209631B2 (en) | Encoding device, decoding device, and compression / decompression system | |
KR100901178B1 (en) | Moving picture encoding method and device, and moving picture decoding method and device | |
JP2004304656A (en) | Image compression apparatus and method, program, and recording medium | |
JP4592562B2 (en) | Image decoding device | |
WO2006046550A1 (en) | Image encoding method and device, image decoding method, and device | |
JP4743604B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4726040B2 (en) | Encoding processing device, decoding processing device, encoding processing method, decoding processing method, program, and information recording medium | |
JP2005252434A (en) | Motion picture processor, processing method and program, and information recording medium | |
JP2002344732A (en) | Image expansion method for conversion code, program and recording medium | |
JP4266195B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4117886B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4219302B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4753297B2 (en) | Image processing apparatus, detile processing method, program, and information recording medium | |
JP4780646B2 (en) | Image processing system, server device, client device, program, and information recording medium | |
JP4446445B2 (en) | Encoding apparatus and encoding method | |
JP4124436B2 (en) | Motion estimation device, program, storage medium, and motion estimation method | |
JP4663489B2 (en) | Image processing apparatus, detiling method, program, and information recording medium | |
JP2005142673A (en) | Image processing method and apparatus | |
JP4107660B2 (en) | Image processing apparatus, image processing method, program, and information recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110427 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110428 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4743604 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |