JP2010067157A - Image processor - Google Patents
Image processor Download PDFInfo
- Publication number
- JP2010067157A JP2010067157A JP2008234870A JP2008234870A JP2010067157A JP 2010067157 A JP2010067157 A JP 2010067157A JP 2008234870 A JP2008234870 A JP 2008234870A JP 2008234870 A JP2008234870 A JP 2008234870A JP 2010067157 A JP2010067157 A JP 2010067157A
- Authority
- JP
- Japan
- Prior art keywords
- image
- interpolation
- mode
- enlargement
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 73
- 230000008569 process Effects 0.000 claims description 33
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 230000001052 transient effect Effects 0.000 claims description 20
- 230000002441 reversible effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
Description
本発明は、圧縮された符号として与えられた画像を復号して表示する画像処理装置に係り、特に、表示画像の拡大操作が可能な画像処理装置に関する。 The present invention relates to an image processing apparatus that decodes and displays an image given as a compressed code, and more particularly to an image processing apparatus that can perform an enlargement operation of a display image.
画像データベース内の画像を閲覧する場合、ユーザが目的とする画像を検索する必要がある。画像を検索する手法としては、検索対象画像の画像名(ファイル名)が既知であれば、画像名の一覧から検索する場合もあるが、多くの場合はサムネイルの一覧表示が使用される。例えば、文書画像を検索する場合、キーワード検索した後にキーワードにヒットした候補画像をサムネイル一覧表示して、最終的に検索対象画像を選択する方法や、最初からサムネイル一覧表示のみを使用して検索対象画像を探し出したりする方法が用いられている。このようなサムネイル一覧表示では、解像度を落とした縮小画像の状態なので画像の詳細な内容を把握する事が難しいため、画像を拡大表示させる必要がある。 When browsing an image in the image database, the user needs to search for a target image. As a method of searching for an image, if the image name (file name) of the search target image is known, the image may be searched from a list of image names. In many cases, a list display of thumbnails is used. For example, when searching for a document image, a candidate image that has been hit by a keyword after a keyword search is displayed in a thumbnail list, and finally a search target image is selected. A method of searching for an image is used. In such a thumbnail list display, it is difficult to grasp the detailed contents of the image because it is a reduced image state with a reduced resolution, so it is necessary to display the image in an enlarged manner.
このように画像の拡大表示が必要とされる場合は少なくない。しかし、通常、画像は圧縮された符号として記憶・伝送されるため、低解像度から段階的に高い解像度へと拡大操作を行った場合に、ある解像度の画像を得るための符号の復号処理を行い、次に、より高い解像度の画像を得るための符号の復号処理を行い、というように連続して何度も復号処理を行うのでは処理に時間がかかり、高速なズーミングが難しい。そこで、拡大操作の途中では低解像度の復号画像を画像補間により拡大した画像を表示する「過渡的なズーミング表示動作」を行い、拡大操作が終了した時点で、最終的な高解像度の画像表示に必要な符号の復号処理を行い、復号した高解像度画像で表示を更新するという手法が用いられる(例えば特許文献1を参照)。 There are many cases where enlargement display of an image is required in this way. However, since an image is usually stored and transmitted as a compressed code, a code decoding process is performed to obtain an image of a certain resolution when an enlargement operation is performed from a low resolution to a high resolution in stages. Next, if a code decoding process for obtaining an image with a higher resolution is performed, and the decoding process is performed many times in succession, the process takes time, and high-speed zooming is difficult. Therefore, during the enlargement operation, a “transient zooming display operation” that displays an image obtained by enlarging the low-resolution decoded image by image interpolation is performed, and when the enlargement operation is completed, the final high-resolution image display is performed. A technique of performing necessary code decoding processing and updating the display with the decoded high-resolution image is used (see, for example, Patent Document 1).
上に述べた「過渡的なズーミング表示動作」による補間拡大画像から、高解像度の復号画像の表示へと切り替えた瞬間に、画像が全体的にずれる、もしくは揺れる現象が起きることがある。本発明の目的は、そのような画像の「ずれ」もしくは「揺れ」の発生を抑えることにある。 There may be a phenomenon in which the entire image shifts or shakes at the moment of switching from the interpolated enlarged image by the “transient zooming display operation” described above to the display of a decoded image of high resolution. An object of the present invention is to suppress the occurrence of such “shift” or “sway” of an image.
まず、従来、過渡的ズーミング表示動作で表示された補間拡大画像から高解像度復号画像に置き換わった瞬間に画像がずれたり、揺れたりするように見える現象の発生メカニズムについて簡単に説明する。 First, a mechanism of occurrence of a phenomenon that appears to be shifted or shaken at the moment when an interpolation enlarged image displayed by a transient zooming display operation is replaced with a high-resolution decoded image will be briefly described.
例えばJPEG2000のロスレス圧縮モードは、5/3フィルタによる可逆な離散ウェーブレット変換(DWT:Discrete Wavelet Transform)を用いており、垂直方向、水平方向にそれぞれ1次元可逆離散ウェーブレット変換がかけられる。通常は離散ウェーブレット変換後のダウンサンプリングを考慮して計算を省いたリフティング演算が用いられる、このリフティング演算は以下のような式で与えられる。 For example, the lossless compression mode of JPEG2000 uses a reversible discrete wavelet transform (DWT) using a 5/3 filter, and a one-dimensional reversible discrete wavelet transform is applied in the vertical direction and the horizontal direction, respectively. Usually, a lifting operation that omits the calculation in consideration of the downsampling after the discrete wavelet transform is used. This lifting operation is given by the following equation.
垂直、水平方向にリフティング演算を行った後に、図4のようにデインターリーブされサブバンドに分けられる。図4において、LLは垂直水平ともに低周波の成分、HLは垂直方向の低周波成分から水平方向の高周波成分を抽出した信号、LHは垂直方向の高周波成分から水平方向の低周波成分を抽出した信号、HHは垂直水平ともに高周波成分を抽出した信号である。 After performing the lifting operation in the vertical and horizontal directions, it is deinterleaved and divided into subbands as shown in FIG. In FIG. 4, LL is a low frequency component in both the vertical and horizontal directions, HL is a signal obtained by extracting a horizontal high frequency component from a vertical low frequency component, and LH is a horizontal low frequency component extracted from a vertical high frequency component. A signal, HH, is a signal obtained by extracting high-frequency components in both vertical and horizontal directions.
低解像度の画像を生成するときはLLの成分のみを使う。ズーミング中に低解像度の画素値を使って補間拡大するということは、このLL成分の値を画素値として画像補間することに他ならない。 When generating a low-resolution image, only the LL component is used. Interpolating and enlarging using low-resolution pixel values during zooming is nothing other than image interpolation using the LL component values as pixel values.
ここで簡単のために信号を1次元に限定して考える。図5に示すような1次元のオリジナルデータに5/3可逆DWTを施し低周波成分を抜き出すと、図6のようになる。抜き出された低周波成分がズーミング前の画素値であり、この画素値を使って2倍に補間拡大するものとする。 Here, for simplicity, the signal is limited to one dimension. When 5/3 reversible DWT is applied to the one-dimensional original data as shown in FIG. 5 to extract low frequency components, the result is as shown in FIG. The extracted low frequency component is a pixel value before zooming, and the pixel value is used to perform interpolation enlargement twice.
画像補間方法として、ニアレストネイバーを用いた場合のオリジナルデータとの比較を図7に示す。ニアレストネイバーでは、オリジナルデータの偶数番目の画素と同じ値をその隣の奇数番目の画素にも使うので、そもそも画質が汚い印象を与えるうえに、高解像度の画像を重ねたときに奇数番目の画素値が本来の値に修正される形になるため、左にずれるように見える。1次元データで左にずれて見える現象は、2次元の画像では左上にずれて見えることになる。 FIG. 7 shows a comparison with original data in the case of using a nearest neighbor as an image interpolation method. Nearest neighbor uses the same value as the even-numbered pixel of the original data for the odd-numbered pixel next to it, so in addition to giving the impression that the image quality is dirty, the odd-numbered pixel when overlapping high-resolution images in the first place Since the pixel value is corrected to the original value, it appears to shift to the left. A phenomenon that appears to be shifted to the left in the one-dimensional data appears to be shifted to the upper left in the two-dimensional image.
5/3可逆DWTを2回適用し、抜き出された低周波成分をニアレストネイバー法で補間拡大したデータとオリジナルデータを比較すると図8のようになり、さらにオリジナルデータとのズレが大きく見える。 When the 5/3 reversible DWT is applied twice and the extracted low-frequency component is interpolated and expanded by the nearest neighbor method and compared with the original data, the result is as shown in FIG. .
ここまではニアレストネイバーを用いる例について説明したが、複数の参照画素の値を用いた演算により補間画素の値を決定する画像補間法を用いる場合も同様の現象が生じる。そのような画像補間法として広く使われているバイリニア法で補間拡大したデータは、通常、図9のようになり、補間拡大したデータに比べてオリジナルデータ(高解像度の画像)は全体的に左側にずれる。 The example using the nearest neighbor has been described so far, but the same phenomenon occurs when using an image interpolation method that determines the value of an interpolation pixel by calculation using the values of a plurality of reference pixels. The data that has been interpolated and enlarged by the bilinear method widely used as such an image interpolation method is usually as shown in FIG. 9, and the original data (high-resolution image) is generally on the left side compared to the data that has been interpolated and enlarged. Sneak away.
このことについて、さらに説明する。バイリニア法では、補間画素の4近傍の参照画素の値から線形近似によって補間画素値を決める。入力画像f(i,j)を水平、垂直方向にA倍する場合、4つの参照画素(左上のものをf00、右上のものをf10、左下のものをf01、右下のものをf11とする)などを次式のように定義する。 This will be further described. In the bilinear method, an interpolation pixel value is determined by linear approximation from the values of reference pixels in the vicinity of 4 of the interpolation pixel. When the input image f (i, j) is multiplied by A in the horizontal and vertical directions, four reference pixels (the upper left one is f00, the upper right one is f10, the lower left one is f01, and the lower right one is f11). ) Etc. are defined as follows:
ここで、バイリニア法では、参照画素と補間画素の位置が同一の格子を使って示されているのではなく、図10に示すように、参照画素が、補間拡大画像の画素の格子点の間に配置されるのが通常である(図10はA=2の例である)。したがって、この場合、例えば補間画素g00の値は次式で計算される。 Here, in the bilinear method, the position of the reference pixel and the interpolation pixel is not shown using the same grid, but as shown in FIG. 10, the reference pixel is located between the grid points of the pixels of the interpolation enlarged image. (FIG. 10 shows an example of A = 2). Therefore, in this case, for example, the value of the interpolation pixel g00 is calculated by the following equation.
このような参照画素の配置は、参照画素をオリジナルデータ(高解像度の画像)の2×2画素の中央に仮想的に存在する代表画素のように扱っていることを意味する。しかるに、5/3可逆DWTで得られる低周波成分は、ダウンサンプリングされる画素を中心とした画素から計算されており、いわば偶数番目の画素値に近い値が低周波成分となるため、5/3可逆DWTで得られる低周波成分を用いて、図10のような補間画像の格子点の間に参照画素を配置するような画像補間を行うと、図9に見られるように、オリジナルデータ(高解像度の画像)と補間拡大画像の間にギャップが生じてしまい、補間拡大画像に高解像度画像を上書き表示した時に、画像が左上にずれたように見えてしまうわけである。 Such an arrangement of the reference pixels means that the reference pixels are handled like representative pixels that exist virtually in the center of 2 × 2 pixels of the original data (high resolution image). However, the low-frequency component obtained by the 5/3 reversible DWT is calculated from the pixels centered on the down-sampled pixel, so that a value close to the even-numbered pixel value becomes the low-frequency component. When image interpolation is performed such that reference pixels are arranged between lattice points of an interpolated image as shown in FIG. 10 using low frequency components obtained by 3 reversible DWT, as shown in FIG. A gap is generated between the high-resolution image) and the interpolated enlarged image, and when the high-resolution image is overwritten and displayed on the interpolated enlarged image, the image appears to be shifted to the upper left.
このような画像の「ずれ」もしくは「揺れ」は、参照画素を図11のように補間拡大画像の画素の格子点上に配置することで防止することができる(図11ではA=2としている)。このように参照画素を配置する場合、補間画素g00,g10,g01,g11の算出式は次のように表され、偶数番目の補間画素値として参照画素の値がそのまま使われ、奇数番目の補間画素の値は両隣の参照画素の値を用いて決定される。 Such “shift” or “shake” of the image can be prevented by arranging the reference pixel on the grid point of the pixel of the interpolation enlarged image as shown in FIG. 11 (A = 2 in FIG. 11). ). When the reference pixels are arranged in this way, the calculation formulas for the interpolation pixels g00, g10, g01, and g11 are expressed as follows, and the value of the reference pixel is used as the even-numbered interpolation pixel value, and the odd-numbered interpolation is performed. The pixel value is determined using the values of the reference pixels on both sides.
このように、補間拡大画像の画素の格子点上に参照画素を配置してバイリニア法により補間拡大を施した結果は、図12のようになり、オリジナルデータとほぼ同じ変化をしている。したがって、補間拡大画像に高解像度画像を上書きした瞬間のずれ、もしくは揺れは目立たない。 As described above, the result of performing the interpolation enlargement by the bilinear method by arranging the reference pixel on the lattice point of the pixel of the interpolation enlarged image is as shown in FIG. 12, and changes almost the same as the original data. Therefore, the momentary shift or shake of overwriting the high-resolution image on the interpolated enlarged image is inconspicuous.
なお、JPEG2000では、周波数変換として5/3可逆DWTと9/7非可逆DWTを使用できるが、そのいずれを選択するとしても、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する変換である点で共通している。 In JPEG2000, 5/3 reversible DWT and 9/7 irreversible DWT can be used as frequency conversion. Regardless of which one is selected, pixels of a low resolution image are obtained from an odd number of pixel values of a high resolution image. This is common in that it is a transformation that generates a value.
次に、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式の画像符号の場合について説明する。このような符号化方式の例として、現在標準化が進められているJPEG−XRがある。 Next, a description will be given of a case of an image code of an encoding method in which conversion for generating a pixel value of a low resolution image from an even number of pixel values of a high resolution image is used. An example of such an encoding method is JPEG-XR, which is currently being standardized.
JPEG−XRによる画像符号の場合、1つの符号から、最高解像度及び1/4のスケールの画像を得られる符号と、1/16のスケールの画像を得られる符号とを抜き出すことができる。JPEG−XRの画像符号の場合、図13に示すような周波数階層となっており、4画素×4画素のブロック単位で直交変換を行った後の係数を、4×4ブロック(マクロブロック)単位で集めたものを最高解像度の係数HPとし、マクロブロックの各ブロックの係数のDC成分を集めたものを1段階低い解像度の係数LPとし、LPに対して4×4の単位で直交変換した結果得られるDC成分を最も低い解像度の係数DCとして扱う。 In the case of an image code based on JPEG-XR, a code that can obtain an image with the highest resolution and a 1/4 scale and a code that can obtain an image with a 1/16 scale can be extracted from one code. In the case of a JPEG-XR image code, the frequency hierarchy is as shown in FIG. 13, and the coefficient after orthogonal transformation is performed in units of 4 × 4 pixel blocks is expressed in units of 4 × 4 blocks (macro blocks). The result of the orthogonal transformation in units of 4x4 with respect to LP as the coefficient HP of the highest resolution and the coefficient DC of the coefficient of each block of the macroblock as the coefficient LP of one step lower resolution. Treat the resulting DC component as the lowest resolution coefficient DC.
ここで、LPは4画素×4画素の各ブロックを平坦化したようなものを表す係数であるので、LPのみを使って復号した低い解像度の画像をバイリニア法で補間拡大した画像に、HP係数を全て使って復号した高解像度の画像を上書きした時に画像のずれを生じさせないためには、JPEG2000の場合とは逆に、図10に示すように、補間拡大画像の画素の格子点の間に参照画素を配置して補間拡大を行えばよい。
同様の符号の別の例としてFlashPix符号がある。
Here, LP is a coefficient representing a flattened block of 4 pixels × 4 pixels. Therefore, an HP coefficient is added to an image obtained by interpolating and enlarging a low resolution image decoded using only LP using the bilinear method. In order to prevent the image from being shifted when the high-resolution image decoded using all of the above is overwritten, contrary to the case of JPEG2000, as shown in FIG. Interpolation enlargement may be performed by arranging reference pixels.
Another example of a similar code is the FlashPix code.
以上では、圧縮された画像が解像度スケーラブルの符号として与えられる場合を想定して説明した。しかし、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する解像度変換により得られた複数の異解像度画像それぞれの独立した符号の集まりとして与えられる圧縮画像は、JPEG2000符号などと同様に、補間拡大画像の画素の格子点上に参照画素を配置して補間拡大を行えば、補間拡大画像を高解像度の復号画像で上書き表示した際の画像のずれが目立たなくなる。一方、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する解像度変換により得られた複数の異解像度画像それぞれの独立した符号の集まりとして与えられる圧縮画像は、JPEG−XR符号などと同様に扱うことができ、補間拡大画像の画素の格子点の間に参照画素を配置して補間拡大を行うとよい。 In the above description, it is assumed that a compressed image is given as a resolution scalable code. However, a compressed image given as a collection of independent codes of a plurality of different resolution images obtained by resolution conversion that generates pixel values of a low resolution image from odd pixel values of a high resolution image is a JPEG2000 code. Similar to the above, if reference enlargement is performed by arranging reference pixels on the pixel grid points of the interpolation enlarged image, the image shift when the interpolation enlarged image is overwritten with the high-resolution decoded image becomes inconspicuous. On the other hand, a compressed image given as a collection of independent codes of a plurality of different resolution images obtained by resolution conversion that generates pixel values of a low resolution image from an even number of pixel values of a high resolution image is JPEG- It can be handled in the same way as an XR code or the like, and interpolation enlargement may be performed by arranging reference pixels between lattice points of pixels of the interpolation enlarged image.
以上、画像補間法としてバイリニア法を例にしたが、バイキュービック法などが用いられる場合も同様である。 As described above, the bilinear method is taken as an example of the image interpolation method, but the same applies when the bicubic method or the like is used.
本発明は、以上の考察に基づき、過渡的なズーミング表示動作による補間拡大画像から高解像度の復号画像の表示へと切り替えた瞬間の画像のずれもしくは揺れの発生を抑えた画像処理装置を実現するものであり、その特徴は次の通りである。 Based on the above considerations, the present invention realizes an image processing device that suppresses the occurrence of image shift or shaking at the moment of switching from an interpolated enlarged image by a transient zooming display operation to a display of a high-resolution decoded image. The features are as follows.
請求項1記載の発明は、
拡大操作の対象である符号の復号処理により得られた復号画像を表示している状態でユーザによる拡大操作が始まると、当該拡大操作の継続中、当該復号画像の補間拡大処理を行い、それにより得た補間拡大画像を表示させる過渡的ズーミング表示動作を行い、当該拡大操作が終了すると拡大操作の対象である符号の復号処理を行い、それにより得た拡大後の復号画像を、当該過渡的ズーミング表示動作の最後に表示された補間拡大画像に上書きする形で表示する画像処理装置であって、
前記補間拡大処理は、補間拡大画像の各画素の値を複数の参照画素の値を用いた演算により決定する画像補間法による処理であり、
前記補間拡大処理を行う補間拡大手段は、参照画素と補間拡大画像の画素との位置関係に関連した動作モードとして、補間拡大画像の画素の格子点の間に参照画素を配置するAモード、又は、補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択可能であり、
ユーザの指示に従って、前記補間拡大手段の動作モードとして前記Aモード、Bモードのいずれかを選択するモード選択手段を有することを特徴とする画像処理装置である。
The invention described in
When the enlargement operation by the user is started in a state where the decoded image obtained by the decoding process of the code that is the target of the enlargement operation is displayed, an interpolation enlargement process of the decoded image is performed while the enlargement operation is continued. A transient zooming display operation for displaying the obtained interpolated enlarged image is performed, and when the enlargement operation is completed, the code that is the target of the enlargement operation is decoded, and the obtained decoded image is converted to the transient zooming An image processing apparatus for displaying in an overwritten form on the interpolation enlarged image displayed at the end of the display operation,
The interpolation enlargement process is a process by an image interpolation method that determines the value of each pixel of the interpolation enlarged image by calculation using the values of a plurality of reference pixels.
The interpolation enlargement means for performing the interpolation enlargement process is an A mode in which the reference pixels are arranged between the lattice points of the pixels of the interpolation enlarged image as an operation mode related to the positional relationship between the reference pixels and the pixels of the interpolation enlarged image, or The B mode in which the reference pixel is arranged on the lattice point of the pixel of the interpolation enlarged image can be selected.
An image processing apparatus comprising mode selection means for selecting either the A mode or the B mode as an operation mode of the interpolation enlargement means in accordance with a user instruction.
請求項2記載の発明は、
拡大操作の対象である符号の復号処理により得られた復号画像を表示している状態でユーザによる拡大操作が始まると、当該拡大操作の継続中、当該復号画像の補間拡大処理を行い、それにより得た補間拡大画像を表示させる過渡的ズーミング表示動作を行い、当該拡大操作が終了すると拡大操作の対象である符号の復号処理を行い、それにより得た拡大後の復号画像を、当該過渡的ズーミング表示動作の最後に表示された補間拡大画像に上書きする形で表示する画像処理装置であって、
前記補間拡大処理は、補間拡大画像の各画素の値をその近傍の複数の参照画素の値を用いた演算により決定する画像補間法による処理であり、
前記補間拡大処理を行う補間拡大手段は、参照画素と補間拡大画像の画素との位置関係に関連した動作モードとして、補間拡大画像の画素の格子点の間に参照画素を配置するAモード、又は、補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択可能であり、
前記補間拡大手段の動作モードとして前記Aモード、Bモードのいずれかを自動的に選択するモード選択手段を有することを特徴とする画像処理装置である。
The invention according to
When the enlargement operation by the user is started in a state where the decoded image obtained by the decoding process of the code that is the target of the enlargement operation is displayed, an interpolation enlargement process of the decoded image is performed while the enlargement operation is continued. A transient zooming display operation for displaying the obtained interpolated enlarged image is performed, and when the enlargement operation is completed, the code that is the target of the enlargement operation is decoded, and the obtained decoded image is converted to the transient zooming An image processing apparatus for displaying in an overwritten form on the interpolation enlarged image displayed at the end of the display operation,
The interpolation enlargement process is a process by an image interpolation method that determines the value of each pixel of the interpolation enlarged image by calculation using the values of a plurality of reference pixels in the vicinity thereof,
The interpolation enlargement means for performing the interpolation enlargement process is an A mode in which the reference pixels are arranged between the lattice points of the pixels of the interpolation enlarged image as an operation mode related to the positional relationship between the reference pixels and the pixels of the interpolation enlarged image, or The B mode in which the reference pixel is arranged on the lattice point of the pixel of the interpolation enlarged image can be selected.
An image processing apparatus comprising mode selection means for automatically selecting one of the A mode and B mode as an operation mode of the interpolation enlargement means.
請求項3記載の発明は、請求項2記載の発明に係る画像処理装置において、
前記モード選択手段は、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号が拡大操作の対象である場合には、前記補間拡大手段の動作モードとしてBモードを選択し、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号が拡大操作の対象である場合には、前記補間拡大手段の動作モードとしてAモードを選択することを特徴とする。
According to a third aspect of the present invention, in the image processing apparatus according to the second aspect of the present invention,
The mode selection means, when a resolution scalable code by an encoding method using a conversion that generates a pixel value of a low resolution image from an odd number of pixel values of a high resolution image is an object of an enlargement operation, The B mode is selected as the operation mode of the interpolation enlarging means, and the resolution scalable code by the encoding method using the conversion that generates the pixel value of the low resolution image from the even number of pixel values of the high resolution image is enlarged. In the case of A, the A mode is selected as the operation mode of the interpolation enlarging means.
請求項4記載の発明は、請求項2記載の発明に係る画像処理装置において、
前記モード選択手段は、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には、前記補間拡大手段の動作モードとしてBモードを選択し、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には、前記補間拡大手段の動作モードとしてAモードを選択することを特徴とする。
According to a fourth aspect of the present invention, in the image processing apparatus according to the second aspect of the present invention,
In the mode selection means, an independent code of each of a plurality of different resolution images obtained by resolution conversion that generates pixel values of a low resolution image from an odd number of pixel values of a high resolution image is an object of an enlargement operation. In this case, the B mode is selected as the operation mode of the interpolation enlargement means, and a plurality of different resolution images obtained by resolution conversion for generating pixel values of a low resolution image from an even number of pixel values of a high resolution image. When each independent code is an object of the enlargement operation, the A mode is selected as the operation mode of the interpolation enlargement means.
請求項5記載の発明は、請求項3又は4に記載の発明に係る画像処理装置において、
拡大操作の対象が複数ある場合、それら対象ごとに、前記モード選択手段は前記補間拡大手段の動作モードとしてAモード又はBモードのいずれかを自動的に選択することを特徴とする。
According to a fifth aspect of the present invention, in the image processing apparatus according to the third or fourth aspect of the present invention,
When there are a plurality of enlargement operation targets, the mode selection means automatically selects either the A mode or the B mode as the operation mode of the interpolation enlargement means for each target.
本発明によれば、過渡的なズーミング表示動作による補間拡大画像から高解像度の復号画像の表示へと切り替えた瞬間の画像のずれもしくは揺れの発生を抑えることが可能な画像処理装置を実現することができる。 According to the present invention, it is possible to realize an image processing apparatus capable of suppressing the occurrence of image shift or shaking at the moment of switching from an interpolated enlarged image by a transient zooming display operation to a display of a high-resolution decoded image. Can do.
図1は、本発明の一実施形態に係る画像処理装置を説明するためのブロック図である。この画像処理装置は、画像の符号を記憶するための符号記憶部100、符号記憶部100に記憶されている符号を読み込んで復号処理を行い復号画像を出力する復号部102、この復号画像を一時的に記憶するための復号画像記憶部104、復号画像記憶部104より復号画像を読み込んで補間拡大処理を行い補間拡大画像を出力する補間拡大部106、この補間拡大画像を一時的に記憶するための補間拡大画像記憶部108、復号画像記憶部104又は補間拡大画像記憶部108に記憶されている画像を画面に表示する表示部110、復号部102や補間拡大部106、表示部110の制御を行う制御部112、ユーザが拡大操作などを行うためのユーザ操作部114を有する。表示部110の画面には、画像が1つだけ表示されることも複数が同時に表示されることもある。ユーザは、ユーザ操作部114による拡大操作により、画面に表示されている1つの画像だけを拡大表示させることも複数の画像を同時に拡大表示させることもできる。
FIG. 1 is a block diagram for explaining an image processing apparatus according to an embodiment of the present invention. The image processing apparatus includes a
符号記憶部100に記憶される符号としては、通常、JPEG2000符号、JPEG−XR符号、FlashPix符号のような解像度スケーラブルの符号が想定される。ただし、高い解像度の画像に低い解像度へと変換する解像度変換を適用することに得られた複数の異解像度画像それぞれの独立した符号(例えばJPEG符号)の集まりであってもよい。
As codes stored in the
補間拡大部106は、補間画素値をその近傍の複数の参照画素の値を用いた演算により決定する画像補間法、例えばバイリニア法を利用するものである。そして、補間拡大部106は、参照画素と補間拡大画像の画素との位置関係に関連した動作モードとして、図10に例示したように補間拡大画像の画素の格子点の間に参照画素を配置するAモードを選択することも、図11に例示したように補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択することもできる。
The
制御部112は、補間拡大部106をA,Bモードのいずれで動作させるかのモード選択を行うモード選択部116を含んでいる。このモード選択は、ユーザからの指示に基づいて行わせることも、対象とする符号に応じて自動的に行わせることも可能である。
The
このような画像処理装置は、例えば、図2に示すようなCPU200、メモリ202、ディスプレイ204、マウス206、キーボード208、ハードディスク210、ネットワーク・インターフェース212などから構成される一般的なコンピュータを利用しソフトウェアによって実現される。各記憶部100,104,108としてはメモリ202の特定の記憶域が利用される。ユーザ操作部114としては例えばマウス206が利用され、ユーザの拡大操作は例えばマウス206のホイールを回転させる操作である。表示される画像の符号は、ハードディスク210に蓄積されているものであったり、ネットワーク・インターフェース212を通じリモート・サーバ等からダウンロードされたものであったりする。
Such an image processing apparatus uses, for example, a general computer including a
例えば、解像度スケーラブルの符号の復号処理により得られた低解像度の復号画像(復号画像記憶部104に記憶されている)が表示部110の画面に表示されている状態でユーザの拡大操作が行われる場合の動作について、図3の状態遷移図を参照し、説明する。
For example, the user's enlargement operation is performed in a state where a low-resolution decoded image (stored in the decoded image storage unit 104) obtained by the decoding process of the resolution scalable code is displayed on the screen of the
拡大操作の対象である符号の復号処理により得られた低解像度の復号画像が表示されている操作待ちの状態S0で、ユーザがユーザ操作部114で拡大操作を開始すると、制御部112は拡大操作中の状態S1に遷移する。この拡大操作とは、ここではマウス206のホイールを回転させる操作であるとする。
When the user starts the enlargement operation with the
状態S1では、制御部112は、補間拡大部106に、拡大倍率を指定して復号画像記憶部104内の復号画像の補間拡大処理を行わせて補間拡大画像を補間拡大画像記憶部108に出力させ、この補間拡大画像を表示部110の画面に表示させる。拡大操作が継続中は、拡大倍率を徐々に上げて補間拡大処理と補間拡大画像の表示を繰り返し行わせる。すなわち、過渡的ズーミング表示動作が行われるわけである。
In state S <b> 1, the
ユーザの拡大操作が終了すると(具体的にはマウス206のホイールからユーザが指を離すと)、制御部112は状態S2に遷移する。制御部112は、当該符号について、過渡的ズーミング表示動作の最後で表示された補間拡大画像のサイズに対応した高い解像度の画像(拡大後の画像)を得るための復号処理を復号部102に実行させ、復号部102より出力され復号画像記憶部104に記憶されている高解像度の復号画像を、表示部110の画面に、それまで表示されていた補間拡大画像に上書きする形で表示させる。この処理が終わると、操作待ち状態S0に戻る。
When the user's enlargement operation is completed (specifically, when the user releases his / her finger from the wheel of the mouse 206), the
さて、過渡的ズーミング表示動作において補間拡大部106がAモード、Bモードのいずれのモードで動作するかはモード選択部116で選択される。拡大操作の対象となる符号の符号化方式が予め決まっているような場合、その符号化方式に適した特定のモードをモード選択部116で選択させるように、ユーザ側で例えばユーザ操作部114の操作を通じて予め指示することができる。
The
すなわち、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号、例えばJPEG2000符号が拡大操作の対象である場合には(もしくは、同様の解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には)、補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択するように指示すればよい。このようなモード選択を行えば、過渡的ズーミング表示動作で最後に表示された補間拡大画像に高解像度復号画像を上書き表示した時の画像のずれは目立たなくなる。 In other words, when a resolution scalable code such as a JPEG2000 code using an encoding method that uses a conversion that generates a pixel value of a low resolution image from an odd number of pixel values of a high resolution image is the target of an enlargement operation ( Alternatively, in the case where independent codes of a plurality of different resolution images obtained by the same resolution conversion are objects of enlargement operation), the B mode in which the reference pixels are arranged on the lattice points of the pixels of the interpolation enlarged image is selected. It only has to be instructed to select. If such a mode is selected, the image shift when the high-resolution decoded image is overwritten and displayed on the interpolated enlarged image displayed last in the transient zooming display operation becomes inconspicuous.
一方、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号、例えばJPEG−XR符号やFlashPix符号が拡大操作の対象である場合には(もしくは、同様の解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には)、補間拡大画像の画素の格子点の間に参照画素を配置するAモードを選択するように指示すればよい。このようなモード選択を行えば、過渡的ズーミング表示動作の最後に表示された補間拡大画像に高解像度復号画像を上書き表示した時の画像のずれ、もしくは揺れは目立たなくなる。 On the other hand, a resolution scalable code such as a JPEG-XR code or a FlashPix code is used as an enlargement operation by an encoding method in which a conversion for generating a pixel value of a low resolution image from an even number of pixel values of a high resolution image is used. In some cases (or in the case where independent codes of a plurality of different resolution images obtained by the same resolution conversion are the targets of the enlargement operation), the reference pixel is between the lattice points of the interpolated enlarged image pixels. May be instructed to select the A mode in which to place the If such a mode selection is performed, the image shift or shake when the high resolution decoded image is overwritten and displayed on the interpolated enlarged image displayed at the end of the transient zooming display operation becomes inconspicuous.
また、ユーザはユーザ操作部114の操作を通じて、モード選択部116で、拡大操作の対象となる符号に適したモードを自動的に選択させるように指示することができる。この場合、モード選択部116では、高い解像度の画像の奇数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号、例えばJPEG2000符号が拡大操作の対象である場合には(もしくは同様の解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には)Bモードを自動選択し、高い解像度の画像の偶数個の画素値から低い解像度の画像の画素値を生成する変換が用いられる符号化方式による解像度スケーラブルの符号、例えばJPEG−XR符号やFlashPix符号が拡大操作の対象である場合には(もしくは、同様の解像度変換により得られた複数の異解像度画像それぞれの独立した符号が拡大操作の対象である場合には)Aモードを自動選択する。
In addition, the user can instruct the
このような自動的なモード選択は、例えば、符号のヘッダに記述されている符号化方式に関する情報や、符号のヘッダに予め記述したモード選択に関する情報、あるいは、符号ごとにA,Bモードのいずれを適用するかを管理するために用意したテーブルの情報などを参照することにより、容易に行うことができる。そして、このような自動的なモード選択を行わせるならば、対象とする符号の符号化方式などをユーザが意識しなくとも、過渡的ズーミング表示動作で表示された補間拡大画像に高解像度復号画像を上書き表示した時の画像のずれ、もしくは揺れを目立たなくすることができる。 Such automatic mode selection is, for example, information on the encoding method described in the code header, information on the mode selection previously described in the code header, or A or B mode for each code. This can be easily done by referring to information in a table prepared for managing whether to apply. If such automatic mode selection is performed, the high-resolution decoded image is displayed on the interpolated enlarged image displayed by the transient zooming display operation without the user being aware of the encoding method of the target code. It is possible to make the shift or shake of the image inconspicuous when overwritten.
なお、ユーザの拡大操作により、表示部110の画面に表示されている複数の画像を同時に拡大表示させることもできる。このように拡大操作の対象が複数ある場合においても、モード選択部116により、過渡的ズーミング表示における補間拡大処理のモードを拡大操作の対象ごとに適切に選択することにより、補間拡大画像に高解像度復号画像を上書き表示した際の画像のずれを目立たなくすることができる。拡大操作の対象に符号化方式などの異なる画像が混在している場合には、画像ごとに適したモードを選択させる必要があるが、これは上述の自動的なモード選択により可能である。
A plurality of images displayed on the screen of the
なお、本発明は以上に述べた実施形態のみに限定されるものではなく、様々に変形して実施し得るものである。 The present invention is not limited to the above-described embodiment, and can be implemented with various modifications.
100 符号記憶部
102 復号部
104 復号画像記憶部
106 補間拡大部
108 補間拡大画像記憶部
110 表示部
112 制御部
114 ユーザ操作部
116 モード選択部
100
Claims (5)
前記補間拡大処理は、補間拡大画像の各画素の値を複数の参照画素の値を用いた演算により決定する画像補間法による処理であり、
前記補間拡大処理を行う補間拡大手段は、参照画素と補間拡大画像の画素との位置関係に関連した動作モードとして、補間拡大画像の画素の格子点の間に参照画素を配置するAモード、又は、補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択可能であり、
ユーザの指示に従って、前記補間拡大手段の動作モードとして前記Aモード、Bモードのいずれかを選択するモード選択手段を有することを特徴とする画像処理装置。 When the enlargement operation by the user is started in a state where the decoded image obtained by the decoding process of the code that is the target of the enlargement operation is displayed, an interpolation enlargement process of the decoded image is performed while the enlargement operation is continued. A transient zooming display operation for displaying the obtained interpolated enlarged image is performed, and when the enlargement operation is completed, the code that is the target of the enlargement operation is decoded, and the obtained decoded image is converted to the transient zooming. An image processing apparatus for displaying in an overwritten form on the interpolation enlarged image displayed at the end of the display operation,
The interpolation enlargement process is a process by an image interpolation method that determines the value of each pixel of the interpolation enlarged image by calculation using the values of a plurality of reference pixels.
The interpolation enlargement means for performing the interpolation enlargement process is an A mode in which the reference pixels are arranged between the lattice points of the pixels of the interpolation enlarged image as an operation mode related to the positional relationship between the reference pixels and the pixels of the interpolation enlarged image, or The B mode in which the reference pixel is arranged on the lattice point of the pixel of the interpolation enlarged image can be selected.
An image processing apparatus comprising mode selection means for selecting either the A mode or the B mode as an operation mode of the interpolation enlargement means in accordance with a user instruction.
前記補間拡大処理は、補間拡大画像の各画素の値をその近傍の複数の参照画素の値を用いた演算により決定する画像補間法による処理であり、
前記補間拡大処理を行う補間拡大手段は、参照画素と補間拡大画像の画素との位置関係に関連した動作モードとして、補間拡大画像の画素の格子点の間に参照画素を配置するAモード、又は、補間拡大画像の画素の格子点上に参照画素を配置するBモードを選択可能であり、
前記補間拡大手段の動作モードとして前記Aモード、Bモードのいずれかを自動的に選択するモード選択手段を有することを特徴とする画像処理装置。 When the enlargement operation by the user is started in a state where the decoded image obtained by the decoding process of the code that is the target of the enlargement operation is displayed, an interpolation enlargement process of the decoded image is performed while the enlargement operation is continued. A transient zooming display operation for displaying the obtained interpolated enlarged image is performed, and when the enlargement operation is completed, the code that is the target of the enlargement operation is decoded, and the obtained decoded image is converted to the transient zooming. An image processing apparatus for displaying in an overwritten form on the interpolation enlarged image displayed at the end of the display operation,
The interpolation enlargement process is a process by an image interpolation method that determines the value of each pixel of the interpolation enlarged image by calculation using the values of a plurality of reference pixels in the vicinity thereof,
The interpolation enlargement means for performing the interpolation enlargement process is an A mode in which the reference pixels are arranged between the lattice points of the pixels of the interpolation enlarged image as an operation mode related to the positional relationship between the reference pixels and the pixels of the interpolation enlarged image, or The B mode in which the reference pixel is arranged on the lattice point of the pixel of the interpolation enlarged image can be selected.
An image processing apparatus comprising mode selection means for automatically selecting one of the A mode and B mode as an operation mode of the interpolation enlargement means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008234870A JP5019477B2 (en) | 2008-09-12 | 2008-09-12 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008234870A JP5019477B2 (en) | 2008-09-12 | 2008-09-12 | Image processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010067157A true JP2010067157A (en) | 2010-03-25 |
JP5019477B2 JP5019477B2 (en) | 2012-09-05 |
Family
ID=42192668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008234870A Expired - Fee Related JP5019477B2 (en) | 2008-09-12 | 2008-09-12 | Image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5019477B2 (en) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05189532A (en) * | 1992-01-17 | 1993-07-30 | N T T Data Tsushin Kk | Still picture control system |
JPH10198337A (en) * | 1997-01-09 | 1998-07-31 | Canon Inc | High speed aspect ratio zooming and thumbnail operation using compression and ceiling |
JPH10336494A (en) * | 1997-05-29 | 1998-12-18 | Seiko Epson Corp | Digital camera with zoom display function |
JP2000293676A (en) * | 1999-04-01 | 2000-10-20 | Canon Inc | Picture displaying device and method |
JP2002044427A (en) * | 2000-07-27 | 2002-02-08 | Mitsubishi Electric Corp | Image processor and processing method |
JP2004515984A (en) * | 2000-12-07 | 2004-05-27 | トムソン ライセンシング ソシエテ アノニム | Encoding method and apparatus for displaying a zoomed MPEG2 encoded image |
JP2004274630A (en) * | 2003-03-11 | 2004-09-30 | Ricoh Co Ltd | Image data generating apparatus, image data generating method, and recording medium |
JP2006139697A (en) * | 2004-11-15 | 2006-06-01 | Fuji Photo Film Co Ltd | Image processor and image processing method |
JP2007288446A (en) * | 2006-04-14 | 2007-11-01 | Toshiba Corp | Moving image decoding device |
-
2008
- 2008-09-12 JP JP2008234870A patent/JP5019477B2/en not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05189532A (en) * | 1992-01-17 | 1993-07-30 | N T T Data Tsushin Kk | Still picture control system |
JPH10198337A (en) * | 1997-01-09 | 1998-07-31 | Canon Inc | High speed aspect ratio zooming and thumbnail operation using compression and ceiling |
JPH10336494A (en) * | 1997-05-29 | 1998-12-18 | Seiko Epson Corp | Digital camera with zoom display function |
JP2000293676A (en) * | 1999-04-01 | 2000-10-20 | Canon Inc | Picture displaying device and method |
JP2002044427A (en) * | 2000-07-27 | 2002-02-08 | Mitsubishi Electric Corp | Image processor and processing method |
JP2004515984A (en) * | 2000-12-07 | 2004-05-27 | トムソン ライセンシング ソシエテ アノニム | Encoding method and apparatus for displaying a zoomed MPEG2 encoded image |
JP2004274630A (en) * | 2003-03-11 | 2004-09-30 | Ricoh Co Ltd | Image data generating apparatus, image data generating method, and recording medium |
JP2006139697A (en) * | 2004-11-15 | 2006-06-01 | Fuji Photo Film Co Ltd | Image processor and image processing method |
JP2007288446A (en) * | 2006-04-14 | 2007-11-01 | Toshiba Corp | Moving image decoding device |
Also Published As
Publication number | Publication date |
---|---|
JP5019477B2 (en) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2118847B1 (en) | Method for processing a digital image | |
JP5194776B2 (en) | Information display system, information display method and program | |
JP2008140361A (en) | Image processing apparatus or image processing method | |
WO2010038337A1 (en) | Image processing device and image processing method | |
JP2007067917A (en) | Image data processing apparatus | |
CN101512595B (en) | Image scaling method | |
JP4450322B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP2012249145A (en) | Image processing device, image processing method, and program | |
JP2011210013A (en) | Image filing system | |
JP5019477B2 (en) | Image processing device | |
JP4030014B2 (en) | Image display device and program thereof | |
JP2009181450A (en) | Image processing device, image processing method, and image-processing program | |
JP2005094212A (en) | Image processor and processing method, computer program, and computer readable storage medium | |
US9361852B2 (en) | Media reproduction device | |
JP5331432B2 (en) | Image processing apparatus and image processing method | |
JP4809412B2 (en) | Image processing apparatus and image processing method | |
JP2009182933A (en) | Image processing system and image processing method | |
JP2006340300A (en) | Signal processing method, signal processing apparatus, signal processing program and information recording medium | |
JP4688164B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4189956B2 (en) | Image data generation apparatus and image data generation method | |
JP4274187B2 (en) | Display data decompression method, display data compression / decompression method, display data decompression device, and display data compression / decompression device | |
JP2005235029A (en) | Image demagnification method and device, and program | |
WO2009150795A1 (en) | Image reproduction device | |
JP6118623B2 (en) | Image processing apparatus and program | |
JP5141886B2 (en) | Image processing apparatus, image processing method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110613 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120606 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5019477 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |