JP4450322B2 - Image processing apparatus, image processing method, program, and information recording medium - Google Patents
Image processing apparatus, image processing method, program, and information recording medium Download PDFInfo
- Publication number
- JP4450322B2 JP4450322B2 JP2005104853A JP2005104853A JP4450322B2 JP 4450322 B2 JP4450322 B2 JP 4450322B2 JP 2005104853 A JP2005104853 A JP 2005104853A JP 2005104853 A JP2005104853 A JP 2005104853A JP 4450322 B2 JP4450322 B2 JP 4450322B2
- Authority
- JP
- Japan
- Prior art keywords
- interest
- region
- page
- setting
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 52
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000012937 correction Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006837 decompression Effects 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004321 preservation Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
本発明は、符号化(圧縮)されたマルチページ文書における各ページの関心領域の画像を効率的にアクセスする技術に関する。 The present invention relates to a technique for efficiently accessing an image of a region of interest on each page in an encoded (compressed) multi-page document.
多段解像度の画像に対するアクセスに関してはFlashPix(登録商標)が知られている(特許文献1参照)。これについて、図23を参照し説明する。 Regarding access to multi-resolution images, FlashPix (registered trademark) is known (see Patent Document 1). This will be described with reference to FIG.
図23(a)はFlashPixによる多段解像度のファイルの格納構造を示してかり、X方向に画素数C、Y方向に画素数Rで表される画像はそれぞれ(C/2,R/2)、(C/4,R/4),(C/8,R/8)の解像度で格納される。 FIG. 23A shows a storage structure of a multi-resolution file by FlashPix. Images represented by the number of pixels C in the X direction and the number of pixels R in the Y direction are (C / 2, R / 2), respectively. Stored at a resolution of (C / 4, R / 4), (C / 8, R / 8).
図23(b)は、(C/8,R/8)の縮小画像から、注目した領域(図では煙突の部分)についてズーム0(Z0)、ズーム1(Z1)、ズーム2(Z2)、ズーム3(Z3)と順次解像度を向上させることができる様子を示している。 FIG. 23 (b) shows zoom 0 (Z0), zoom 1 (Z1), zoom 2 (Z2), and zoomed out from the reduced image of (C / 8, R / 8) for the region of interest (the chimney portion in the figure). It shows how the resolution can be improved sequentially with zoom 3 (Z3).
このように、Flashpixは、多段解像度画像を容易にアクセスできるため、デジタルカメラで撮影した全体画像を解像度縮小し、注目領域をズームアップして見るような用途に使用されている。 Thus, Flashpix can easily access multi-stage resolution images, and is therefore used for applications such as reducing the resolution of an entire image taken with a digital camera and zooming in on a region of interest.
また、マルチページ文書を取り扱うことができる製品として”RICOH Ridoc Manager Pro”がある。この製品の場合、マルチページ文書の各ページを順にアクセスし、各ページのパンチ穴を削除する編集を行う場合には、まず1ページ目について解像度z1までズームし、解像度が不足ならば解像度z2までさらにズームし、それでも解像度不足ならば解像度z3までズームする。解像度が十分ならば、パンチ穴の領域を指定して、パンチ穴を削除する処理を行う。これを終わると、2ページ目に移動し、1ページ目と同様な操作を繰り返す。このように、各ページのパンチ穴の位置がほぼ一定しているにもかかわらず、パンチ穴の削除のために各ページに対し同じ操作を繰り返すことは効率的とはいえない。 “RICOH Ridoc Manager Pro” is a product that can handle multi-page documents. In the case of this product, each page of a multi-page document is accessed in order, and when editing is performed to delete punch holes in each page, first the first page is zoomed to the resolution z1, and if the resolution is insufficient, the resolution is z2 Zoom further, and if the resolution is still insufficient, zoom to the resolution z3. If the resolution is sufficient, the punch hole area is designated and the punch hole is deleted. When this is finished, the second page is moved and the same operation as the first page is repeated. As described above, it is not efficient to repeat the same operation on each page in order to delete the punch holes, even though the positions of the punch holes on each page are almost constant.
マルチページ文書に対して、例えば各ページのパンチ穴、ページ端の影、原稿を読み取るスキャナのコンタクトガラスの傷や汚れによるノイズなどの削除を行う場合、各ページにおいて注目すべき領域(関心領域)の位置はほぼ同じである場合が多い。また、前後のページが両面原稿などの場合でも、それぞれの関心領域には一定の位置関係がある。 When deleting multi-page documents, such as punch holes on each page, shadows on the edge of the page, and noise caused by scratches and dirt on the contact glass of the scanner that reads the document, areas to be noted on each page (regions of interest) The positions of are often the same. Further, even when the preceding and following pages are double-sided originals, the respective regions of interest have a certain positional relationship.
本発明は、以上に鑑み、マルチページ文書の各ページの関心領域を効率的にアクセスすることができるようにした画像処理装置及び方法を提供することを目的とする。 In view of the above, an object of the present invention is to provide an image processing apparatus and method capable of efficiently accessing a region of interest of each page of a multi-page document.
請求項1の発明は、ブロック単位で伸長可能に圧縮されたマルチページ文書の符号デー
タを記憶するための符号記憶手段と、前記マルチページの処理対象ページを移動させるペ
ージ移動手段と、関心領域のオフセット位置及びサイズの設定を含む設定データを記憶す
るための設定記憶手段と、前記設定記憶手段に記憶されている設定データを修正するため
の設定修正手段と、前記設定記憶手段に記憶されている関心領域のオフセット位置及びサ
イズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶
されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長
する関心領域伸長手段と、前記関心領域伸長手段により伸長された関心領域画像を画面表
示する画像表示手段とを有し、さらに
前記ページ移動手段により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定手段と、該推定手段により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え手段とを有する、
ことを特徴とする画像処理装置である。
According to the first aspect of the present invention, code storage means for storing code data of a multi-page document compressed so as to be expandable in block units, page moving means for moving a processing target page of the multi-page, Setting storage means for storing setting data including settings of offset position and size, setting correction means for correcting setting data stored in the setting storage means, and stored in the setting storage means Based on the setting of the offset position and size of the region of interest and the display screen size of the region of interest image, the region of interest image is expanded from the code of the block related to the region of interest of the processing target page stored in the code storage means. It includes a region of interest expanding means, and image display means for extended region of interest image screen displayed by the region of interest expansion means, La
When the page to be processed is moved by the page moving means, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. An estimation means for estimating the offset position of the region of interest with respect to, and a rewriting means for rewriting the setting of the offset position of the region of interest stored in the setting storage means with the offset position estimated by the estimation means,
An image processing apparatus characterized by this.
請求項2の発明は、請求項1の発明に係る画像処理装置であって、前記設定記憶手段に記憶される設定データとマルチページ文書とを独立したファイルとして関連付けする手段を有することを特徴とする画像処理装置である。 A second aspect of the invention is an image processing apparatus according to the first aspect of the invention, characterized by comprising means for associating setting data stored in the setting storage means and a multi-page document as independent files. An image processing apparatus.
請求項3の発明は、請求項1の発明に係る画像処理装置であって、前記設定記憶手段に記憶されている設定データに対するユーザのアクセス権を設定する手段を有することを特徴とする画像処理装置である。 According to a third aspect of the present invention, there is provided the image processing apparatus according to the first aspect of the present invention, further comprising means for setting a user access right to the setting data stored in the setting storage means. Device.
請求項4の発明は、請求項1の発明に係る画像処理装置であって、マルチページ文書の処理対象ページの全体画像を伸長する手段を有し、該手段により伸長された全体画像及び関心領域が前記画像表示手段により画面表示されることを特徴とする画像処理装置である。 A fourth aspect of the invention is an image processing apparatus according to the first aspect of the invention, comprising means for expanding an entire image of a processing target page of a multi-page document, the entire image expanded by the means, and a region of interest. Is displayed on the screen by the image display means.
請求項5の発明は、ブロック単位で伸長可能に圧縮されたマルチページ文書の符号データを符号記憶手段に記憶させる工程と、前記マルチページの処理対象ページを移動させるページ移動工程と、関心領域のオフセット位置及びサイズの設定を含む設定データを設定記憶手段に記憶させる工程と、前記設定記憶手段に記憶されている設定データを修正する工程と、前記設定記憶手段に記憶されている関心領域のオフセット位置及びサイズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長する関心領域伸長工程と、前記関心領域伸長工程により伸長された関心領域画像を画像表示手段に画像表示させる工程とを有し、さらに
前記ページ移動工程により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定工程と、該推定工程により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え工程とを有する、
ことを特徴とする画像処理方法である。
According to a fifth aspect of the present invention, there is provided a step of storing code data of a multi-page document compressed so as to be expandable in block units in a code storage means, a page moving step of moving a processing target page of the multi-page, A step of storing setting data including setting of an offset position and size in a setting storage unit; a step of correcting setting data stored in the setting storage unit; and an offset of a region of interest stored in the setting storage unit A region-of-interest expansion step of expanding a region-of-interest image from the code of a block related to the region of interest of the processing target page stored in the code storage unit based on the setting of the position and size and the display screen size of the region-of-interest image When, and a step of displaying an image on the image display means region of interest image expanded by the region of interest elongation step, and To
When the page to be processed is moved by the page moving step, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. An estimation step of estimating the offset position of the region of interest with respect to, and a rewriting step of rewriting the setting of the offset position of the region of interest stored in the setting storage means by the offset position estimated by the estimation step,
An image processing method characterized by this.
請求項6の発明は、ブロック単位で伸長可能に圧縮されたマルチページ文書の符号データを記憶するための符号記憶手段、前記マルチページの処理対象ページを移動させるページ移動手段、関心領域のオフセット位置及びサイズの設定を含む設定データを記憶するための設定記憶手段、前記設定記憶手段に記憶されている設定データを修正する設定修正手段、前記設定記憶手段に記憶されている関心領域のオフセット位置及びサイズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長する関心領域伸長手段、前記関心領域伸長手段により伸長された関心領域画像を画面表示する画像表示手段としてコンピュータを機能させ、さらに
前記ページ移動手段により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定手段、及び、該推定手段により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え手段として該コンピュータを機能させるプログラムである。
The invention of claim 6, page movement means for moving the code storage means for storing code data of multi-page documents stretchable compressed in block units, the processing target page of the multi-page, the offset position of the region of interest and setting storage means for storing setting data including a setting of size, the setting setting modifying means for modifying the setting data stored in the storage means, and the offset position of the region of interest stored in the setting storage unit A region-of-interest extension unit that expands a region-of-interest image from a code of a block related to the region of interest of the processing target page stored in the code storage unit based on the size setting and the display screen size of the region-of-interest image ; a computer as an image display means function is displayed on the screen region of interest image that is expanded by the region of interest extending means , Further
When the page to be processed is moved by the page moving means, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. The computer functions as an estimation unit that estimates the offset position of the region of interest with respect to and the rewriting unit that rewrites the offset position setting of the region of interest stored in the setting storage unit with the offset position estimated by the estimation unit It is a program.
請求項7の発明は、請求項6の発明に係るプログラムが記録された、コンピュータが読み取り可能な情報記録媒体である。 A seventh aspect of the invention is a computer-readable information recording medium on which a program according to the sixth aspect of the invention is recorded.
請求項1,5の発明によれば、マルチページ文書のページを移動した時に、移動前の関心領域のオフセット位置及びサイズの設定を移動後のページに対し継承させることにより、各ページの関心領域がほぼ同じ位置にあるような場合には、例えば、1ページ目で関心領域のオフセット位置及びサイズ(これにより表示される関心領域画像の解像度が決まる)を設定したならば、2ページ目以降の各ページについては迅速に所望の解像度の関心領域画像を表示させることができる。しかも、関心領域画像は、関心領域に関連したブロックの符号から伸長されるため、画像全体の符号を伸長する場合に比べ、極めて高速に関心領域画像を伸長可能である。また、原稿サイズの違うページが混在したマルチページ文書に対しても、自動的に関心領域のオフセット位置を推定することにより、所望解像度の関心領域画像を迅速に表示させることができる。請求項2の発明によれば、マルチページ文書と設定データとを独立したファイルとして管理することができるため、例えば、マルチページ文書をサーバに保存し、設定データをサーバ又は画像処理装置側に保存するなど、システムの柔軟性が向上する。請求項3の発明によれば、適切にアクセス権を設定し、複数のユーザで設定データを共有することが可能となる。請求項4の発明によれば、全体画像と関心領域が画面表示されるため、ユーザにとって関心領域のオフセット位置などの確認又は修正が確実容易となる。請求項6,7の発明によれば、請求項1の発明に係る画像処理装置を、コンピュータを利用し容易に実現することが可能になる、等々の効果を得られる。
According to the invention of
本発明で処理されるマルチページ文書は、各ページの画像が複数のブロックに分割され、ブロック単位で伸長可能な符号化方式により符号化(圧縮)されたものである。このような符号化方式の代表例がJPEG2000であり、以下に説明する本発明の実施形態においてもJPEG2000で符号化されたマルチページ文書を対象とするので、ここでJPEG2000の概要を説明する。ただし、本発明は、JPEG2000以外の符号化方式により符号化されたマルチページ文書に対しても適用し得るものである。 The multi-page document processed by the present invention is an image in which each page image is divided into a plurality of blocks and is encoded (compressed) by an encoding method that can be expanded in units of blocks. A representative example of such an encoding method is JPEG2000, and an embodiment of the present invention described below also deals with a multi-page document encoded with JPEG2000, so the outline of JPEG2000 will be described here. However, the present invention can also be applied to a multi-page document encoded by an encoding method other than JPEG2000.
[JPEG2000の概要]
JPEG2000の符号化(圧縮)は概ね図1に示すような流れで行われる。まず、画像は矩形のブロックであるタイルに分割される(分割数≧1)。タイルは圧縮伸長プロセスを実行する際の基本単位となる。各タイルは、輝度・色差のコンポ−ネントへ色変換される。RGB画像データなどの場合には、ダイナミックレンジの半分を減ずるDCレベルシフトも施される。以下の処理はコンポーネント別に実行される。
[Outline of JPEG2000]
JPEG2000 encoding (compression) is generally performed as shown in FIG. First, an image is divided into tiles that are rectangular blocks (number of divisions ≧ 1). A tile is a basic unit for executing a compression / decompression process. Each tile is color-converted to a luminance / color difference component. In the case of RGB image data or the like, a DC level shift that reduces half of the dynamic range is also performed. The following processing is executed for each component.
タイルは2次元ウェーブレット変換によってサブバンドに分割される。図2にデコンポジションレベル数が3の場合におけるサブバンド分割の様子を示している。タイル画像(デコンポジションレベル0)に対して2次元ウェーブレット変換を1回を施すことにより、デコンポジションレベル1のサブバンド(1LL,1HL,1LH,1HH)に分割する。次に、この階層の低周波成分である1LLサブバンドの係数に対して2回目の2次元ウェーブレット変換を施すことにより、デコンポジションレベル2のサブバンド(2LL,2HL,2LH,2HH)に分割する。同様に、この階層の低周波成分である2LLサブバンドの係数に対して3回目の2次元ウェーブレット変換を施すことにより、デコンポジションレベル3のサブバンド(3LL,3HL,3LH,3HH)に分割する。かくして、図3に示すように1つの3LLサブバンドと、各デコンポジションレベルのHL,LH,HHサブバンドが生成される。図3には各サブバンドの解像度レベルも示されている。
A tile is divided into subbands by a two-dimensional wavelet transform. FIG. 2 shows a state of subband division when the number of decomposition levels is three. The tile image (decomposition level 0) is divided into sub-bands (1LL, 1HL, 1LH, 1HH) of
JPEG2000では、ウェーブレット変換として可逆の5×3変換と非可逆の9×7変換が規定されている。9×7変換が用いられる場合には、ウェーブレット変換係数に対しサブバンド毎に線形量子化が施される。 In JPEG2000, reversible 5 × 3 conversion and irreversible 9 × 7 conversion are defined as wavelet conversion. When the 9 × 7 transform is used, linear quantization is performed on the wavelet transform coefficient for each subband.
次に、各サブバンドはプレシンクトとよばれる矩形に分割される(図4参照)。プレシンクトとは、サブバンドを矩形に分割したものであり、HL、LH、HHサブバンドのプレシンクトは3つで1まとまりである。ただし、LLサブバンドを分割したプレシンクトは1つで1まとまりである。プレシンクトは、大まかには画像中の場所(Position)を表すものである。プレシンクトはサブバンドと同じサイズにすることも可能である。プレシンクトをさらに矩形に分割したものがコードブロックである(図4参照)。よって、画像≧タイル>サブバンド≧プレシンクト≧コードブロックの大小関係となる。 Next, each subband is divided into rectangles called precincts (see FIG. 4). The precinct is obtained by dividing a subband into rectangles, and three precincts of the HL, LH, and HH subbands are grouped into one. However, one precinct obtained by dividing the LL subband is one. A precinct roughly represents a position in an image. The precinct can be the same size as the subband. A code block is obtained by further dividing the precinct into rectangles (see FIG. 4). Therefore, the size relationship of image ≧ tile> subband ≧ precinct ≧ code block is established.
以上の分割の後、指定された符号化の順番により符号化の対象となるビットが定められ、その対象ビット周辺のビットからコンテキストが生成され、このコンテキストを利用し算術符号化の一種であるMQ符号化と呼ばれるエントロピー符号化(ビットプレーン符号化)が、コードブロック単位で上位ビットプレーンから下位ビットプレーンへと順に行われる。 After the above division, bits to be encoded are determined according to a specified encoding order, a context is generated from bits around the target bits, and MQ, which is a kind of arithmetic encoding using this context. Entropy encoding (bit plane encoding) called encoding is performed in order from the upper bit plane to the lower bit plane in units of code blocks.
そして、生成されたエントロピー符号より不要な符号を破棄し、必要な符号をまとめてパケットを生成する。最後に、パケットを並べ、必要なタグ及びタグ情報を付加したコードストリーム(符号化データ)を形成する。コードストリームは、図5に示すように、先頭と各タイルを構成する部分タイルの先頭に、メインヘッダ、タイルパートヘッダと呼ばれるタグ情報が付加され、その後に各タイルの符号化データ(パケット列)が続き、終端にタグが置かれた構造である。 Then, unnecessary codes are discarded from the generated entropy code, and packets are generated by collecting necessary codes. Finally, the packets are arranged to form a code stream (encoded data) to which necessary tags and tag information are added. As shown in FIG. 5, in the code stream, tag information called main header and tile part header is added to the head and the head of the partial tiles constituting each tile, and then the encoded data (packet string) of each tile Followed by a tag at the end.
パケットは、プレシンクトに含まれる全てのコードブロックから、ビットプレーンの符号の一部を取り出して集めたもの(例えば、全てのコードブロックのMSBから3枚目までのビットプレーンの符号を集めたもの)にパケットヘッダをつけたものである。パケットヘッダには、当該パケットに含まれる符号に関する情報が含まれ、各パケットは独立に扱うことができる。全てのプレシンクト(=全てコードブロック=全てのサブバンド)のパケットを集めると、画像全域の符号の一部(例えば、画像全域のウェーブレット係数の、MSBから3枚目までのビットプレーンの符号)ができるが、これをレイヤと呼ぶ。レイヤは、大まかには画像全体のビットプレーンの符号の一部であるから、復号されるレイヤ数が増えれば画質は上がることになる。したがって、パケットは、どのコンポ−ネントに属するか、どの解像度レベルに属するか、どのプレシンクトに属するか、どのレイヤに属するか、という4つの属性を有する。 Packets are collected by extracting a part of the code of the bit plane from all code blocks included in the precinct (for example, collecting the codes of the MSB to the third bit plane of all code blocks) With a packet header. The packet header includes information about codes included in the packet, and each packet can be handled independently. When packets of all precincts (= all code blocks = all subbands) are collected, a part of the code of the entire image (for example, the code of the wave plane coefficients of the entire image from the MSB to the third bit plane) This can be done, but this is called a layer. Since the layer is roughly a part of the code of the bit plane of the entire image, the image quality increases as the number of layers to be decoded increases. Therefore, a packet has four attributes, which component belongs to, which resolution level belongs to which precinct, and which layer belongs to.
図6はタイル分割の例を示す。この例のようにタイル分割された場合、コードストリームは、図7に模式的に示すように、タグSOC、メインヘッダMHに続けて、左上のタイル00から右下のタイル54へとタイルパート(タイルの符号)が順に並び、タグEOCで終わる構造となる。したがって、図8(a)に示すような画像の原点(0,0)からのオフセット位置(x,y)で横サイズwidth×縦サイズheightの領域の画像を表示したい場合には、図8(b)に示すようにタイル(00,01,02,10,11,12)の符号のみを伸長すればよい。なお、タイルより小さいブロックであるプレシンクトを単位として必要な符号を選び伸長することも可能である。また、パケットは解像度レベルの属性を持つため、解像度レベルで伸長する符号を選択することにより、伸長画像の解像度レベルを制御することができる。
FIG. 6 shows an example of tile division. When tiles are divided as in this example, the code stream is divided into tile parts (from the upper
本発明においては、後述のように、マルチページ文書の各ページの関心領域の画像表示を高速化するため、上記のような必要なブロック、必要な解像度レベルの符号を選択的に伸長する関心領域伸長手段が用いられる。 In the present invention, as will be described later, in order to speed up the image display of the region of interest of each page of the multi-page document, the region of interest that selectively expands the necessary block and the code of the necessary resolution level as described above. An extension means is used.
[実施形態の説明]
図9は本発明の実施形態を説明するためのブロック図である。ここに示す画像処理装置は、その全体的動作の制御などを司るシステム制御手段10、処理対象のマルチページ文書の符号データを入力する符号入力手段11、入力されたマルチページ文書の符号データを記憶するための符号記憶手段12、マルチページ文書の各ページの関心領域へのアクセスのための情報が設定される設定ファイルを記憶するための設定記憶手段14、関心領域の画像表示のための関心領域伸長手段16と関心領域描画制御手段20、マルチページ文書の各ページの全体画像を伸長するための全体画像伸長手段23、伸長された画像等を画面表示するための画像表示手段21、ユーザが各種の指示を入力するためのユーザ入力手段22を備える。また、マルチページ文書のファイルと独立した別ファイルとして設定ファイルを管理できるようにし、また、あるユーザによる設定ファイルの設定内容を他のユーザからも利用できるにするため、マルチページ文書ファイルと設定ファイルとを関連付けるための関連付け手段13を備える。また、設定記憶手段14内の設定ファイルを複数のユーザ間で共有できるようにするため、当該設定ファイルに対するアクセス権の設定や修正をする設定書き込み手段15を備える。また、設定ファイルの内容は、関心領域オフセット位置24(関心領域の画像原点からの横方向オフセット位置及び縦方向オフセット位置)、関心領域サイズ25(関心領域の横方向サイズ(幅)と縦方向サイズ(高さ))、ページ設定26(両面原稿、集約原稿等の原稿の種類、原稿のサイズ、原稿の読取解像度など)、継承/非継承切替27(以前のページの設定を継承するかしないかを制御するためのフラグ)からなる。ページ毎に継承/非継承切替を制御するためのフラグをページ設定26にセットする態様も本発明に含まれる。
[Description of Embodiment]
FIG. 9 is a block diagram for explaining an embodiment of the present invention. The image processing apparatus shown here stores system control means 10 for controlling the overall operation, code input means 11 for inputting code data of a multi-page document to be processed, and code data of the input multi-page document. Code storage means 12 for setting, setting storage means 14 for storing information for setting information for accessing the region of interest of each page of the multi-page document, region of interest for displaying the image of the region of interest The expansion unit 16 and the region-of-interest
このような画像処理装置は、典型的には、図10に示すようなCPU100、メモリ101、ハードディスク装置102、入力装置103(例えばキーボードやマウス等のポインティングデバイス)、ディスプレイ装置104、ネットワーク・インターフェース105などからなるコンピュータを利用しプログラムにより実現される。すなわち、図9に示す各手段としてコンピュータを機能させるためのプログラムがメモリ101にロードされ、それがCPU100により実行されることにより、コンピュータは図9に示す画像処理装置として動作する。この場合に、画像処理装置をネットワーク110上のサーバ111に対しクライアントとして動作させることができる。この場合、マルチページ文書のファイルや設定ファイルの保存場所としては、ローカルなハードディスク装置102を用いることもサーバ111の備えるハードディスク装置などを用いることも可能である。なお、コンピュータを本発明に係る画像処理装置として動作させるためのプログラム、及び、同プログラムが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などのコンピュータが読み取り可能な情報記録(記憶)媒体も本発明に包含される。
Such an image processing apparatus typically includes a
図11は、本発明の画像処理装置の動作を説明するためのフローチャートである。ただし、マルチページ文書の符号データ及び設定ファイルの入力の過程は図11には示されていない。以下、図11を参照して動作を説明する。 FIG. 11 is a flowchart for explaining the operation of the image processing apparatus of the present invention. However, the process of inputting the code data of the multi-page document and the setting file is not shown in FIG. The operation will be described below with reference to FIG.
<基本的動作の説明>
まず、全ページについて、原稿サイズは均一で、両面原稿でも集約原稿でもないマルチページ文書を処理対象とし、設定ファイルの内容が未設定の状態である時の動作を説明する。
<Description of basic operation>
First, for all pages, an operation when a multi-page document that has a uniform document size and is neither a double-sided document nor an aggregated document is processed, and the contents of the setting file are not set will be described.
先ずstep1で、システム制御手段10は、全体画像伸長手段23により符号記憶手段12に記憶されているマルチページ文書の符号から各ページの低解像度のサムネイル画像を伸長させ、そのサムネイル画像を画像表示手段21によって画面表示させる。図12は画面表示例であり、画面上の左側に縦方向に並んだ表示ウィンドウにサムネイル画像がページ順に表示される。
First, in
次にstep4で、システム制御手段10は、全体画像伸長手段23により1ページ目(P1)の符号からサムネイル画像より高い解像度の全体画像を伸長させ、この全体画像を画像表示手段21により、画面上の例えば図12中の右側の全体画像表示ウィンドウに表示させる。この時に、全体画像伸長手段23は、1ページ目の符号データのメインヘッダより、当該ページについてのパラメータ(片面原稿/両面原稿/集約原稿の別、集約原稿の場合の集約の種類、原稿サイズ、原稿読取解像度など)を取得し、これはシステム制御手段10に渡されて保持される。
Next, at
なお、設定ファイル内の関心領域オフセット位置24と関心領域サイズ25は設定書き込み手段15によりユーザ毎にアクセス権が設定され、アクセス権を有するユーザのみが読み出しと書き込みが可能である。一方、設定ファイル内のページ設定26と継承/非継承切替27は全てのユーザに共有され、どのユーザもアクセス可能であるが、ページ設定は初期設定後は読み出しのみが可能となる。
Note that the area of interest offset
次にstep8で、システム制御手段10は、設定書き込み手段15を介して、設定記憶手段14内の設定ファイルのページ設定26に対し、step4で全体画像伸長手段23より渡されて保持している1ページ目(P1)のパラメータをセットし、また、関心領域オフセット位置24に初期値として(0,0)をセットする。また、この段階ではページ画像全体が関心領域として扱われるため、システム制御手段10は、当該ページの画像サイズ(当該ページのメインヘッダより取得されている)を初期値として、設定書き込み手段15を介して関心領域サイズ25にセットする。なお、ページ設定26の1ページ目の設定内容は、以後の処理において書き換えられることはない。
Next, at
次にstep9で、システム制御手段10は関心領域の表示画面サイズを関心領域描画制御手段20にセットする。例えば、関心領域画像の表示のための別の表示ウィンドウをポップアップさせる場合には、そのウィンドウの縦方向と横方向のサイズをセットする。ここでは、このようにポップアップ・ウインドウに関心領域画像を表示させるものとして以後説明するが、図12の右側の全体画像表示ウィンドウに、関心領域の画像を上書き表示することも可能であり、この場合は当該ウィンドウの縦方向サイズと横方向サイズをセットする。その結果、関心領域伸長手段16内のブロック伸長制御手段17に対し、関心領域描画制御手段20により関心領域表示画面サイズが通知され、また、設定ファイル内の関心領域オフセット位置24の内容すなわちオフセット位置(0,0)と関心領域サイズ25の内容すなわち当該ページの画像サイズが通知される。
Next, at step 9, the
次にstep10で、ブロック伸長制御手段17において、通知された関心領域のサイズ及びオフセット位置、並びに当該ページのメインヘッダの内容とから、関心領域に関係したm×n個のタイル群(ブロック群)を選択し、選択したタイル群を最高解像度レベルまで伸長した場合の画像サイズを計算し内部にセットする。この段階では、ページ画像全体が関心領域であるため、全タイルが選択され、その画像サイズはメインヘッダから直ちに得られる。
Next, at
次に、step11で、ブロック伸長制御手段17において、関心領域の伸長すべき解像度レベルを算出する。すなわち、関心領域の表示画面サイズをfx(横)×fy(縦)、関心領域を最高解像度まで伸長した時の画像サイズをFx(横)×Fy(縦)とし、それらの対応したサイズ比Fx/fx、Fy/fyを求め、その小さいほうの値又は大きいほうの値(ratio)から、伸長すべき解像度レベルlevelを次式
level=int(log2(ratio))...式(1)
により求める。なお、intは整数化する関数であり、整数化の仕方は切り上げ、切り捨て、四捨五入のいずれでも構わない。
Next, at
Ask for. Note that int is a function for converting to an integer, and the method of converting to an integer may be rounded up, rounded down, or rounded off.
次のstep12で、ブロック伸長制御手段17は、解像度レベルlevelをブロック伸長手段18に指示し、選択した各タイルの符号をブロック伸長手段18へ送り、解像度レベルlevelまでの伸長を実行させる。各タイルの伸長画像データは伸長画像記憶手段19のブロックに対応した領域に書き込まれる。選択したブロック群の解像度レベルlevelまでの伸長が終了すると、終了通知が関心領域描画制御手段20へ送られ、当該処理ステップは終了する。
At the
次のstep13で、関心領域描画制御手段20は、伸長画像記憶手段19より関心領域の画像データを画像表示手段21へ転送し、関心領域の表示ウィンドウに関心領域画像を表示させる。より具体的には、画像表示手段21の備える関心領域表示ウインドウ用のビデオRAM領域(例えば図10中のメモリ101の特定領域)へ関心領域画像データを転送する。
In the
次のstep14で、システム制御手段10は画像表示手段21の画面上で、関心領域
のさらなるズーム(ここでは拡大させるズームインを意味する)が必要かユーザに確認を
求める。例えば、YesボタンとNoボタンなどを画面に表示させ、ユーザ入力手段22
の例えばマウスを用いてボタンを選択させる。そのYesボタンの選択などにより、さら
なるズームを指示されると(step14,Yes)、step5に戻る。
At the
For example, a button is selected using a mouse. Due selection of the Yes button is instructed to further zoom (
step5で、システム制御手段10は、関心領域オフセット位置24及び関心領域サイズ25の設定内容に従って関心領域を表す枠を全体画像とオーバーラップさせた形で画像表示手段21に表示させる(図12参照)。ただし、この段階では関心領域枠は全体画像の縁と一致する形で表示される。
At
step6で、システム制御手段10は画像表示手段21の画面上で、関心領域の現在の設定でよいかユーザに確認を求める。例えば、YesボタンとNoボタンなどを画面に表示させ、ユーザ入力手段22の例えばマウスを用いてボタンを選択させる(図13参照)。そのNoボタンの選択などにより関心領域の設定変更を指示されると(step6,No)、step7に進む。
In step 6, the
step7で、ユーザは、ユーザ入力手段22のマウスなどを利用し、対話的に関心領
域の位置とサイズを変更する操作を行う。そして、step5で修正後の関心領域を表す
枠が全体画像とともに表示される。この修正で、関心領域のサイズを縮小するならば、以
後の処理で関心領域の画像がズームされることになる。なお、step7で関心領域の追
加や削除を行うこともできる。
In
ユーザが関心領域に対しOKを指示すると(step6,Yes)、step8で、システム制御手段10は、ユーザにより指定された関心領域のサイズとオフセット位置を、設定書き込み手段15を介し設定ファイルの関心領域サイズ25と関心領域オフセット位置24にセットする。
When the user instructs OK to the region of interest (step 6, Yes), in
次のstep9で、システム制御手段10は、関心領域の表示画面サイズ(表示ウィンドウのサイズ)が変化した時には、そのサイズを関心領域描画制御手段20にセットし直す。関心領域描画制御手段20により、関心領域表示画面サイズと、関心領域オフセット位置24及び関心領域サイズ25の内容がブロック伸長制御手段17に通知される。
At the next step 9, when the display screen size of the region of interest (the size of the display window) changes, the
次のstep10で、ブロック伸長制御手段17において、通知された関心領域のサイズ及びオフセット位置、並びに当該ページのメインヘッダの内容とから、関心領域に関係したm×n個のタイル群(ブロック群)を選択し、選択したタイル群を最高解像度レベルまで伸長した場合の画像サイズを計算し内部にセットする。
In the
次に、step11で、ブロック伸長制御手段17において、関心領域の伸長すべき解像度レベルlevelを前記式(1)により算出する。
Next, at
次のstep12で、ブロック伸長制御手段17は、解像度レベルlevelをブロック伸長手段18に指示し、選択した各タイルの符号をブロック伸長手段18へ送り、解像度レベルlevelまでの伸長を実行させる。各タイルの伸長画像データは伸長画像記憶手段19のブロックに対応した領域に書き込まれる。選択したブロック群の解像度レベルlevelまでの伸長が終了すると、終了通知が関心領域描画制御手段20へ送られ、当該処理ステップは終了する。
At the
次のstep13で、関心領域描画制御手段20は、伸長画像記憶手段19より関心領域の画像データを画像表示手段21へ転送し、関心領域の表示ウィンドウに関心領域画像を表示させる。
In the
次のstep14で、システム制御手段10は画像表示手段21の画面上で、関心領域
をさらにズームが必要かユーザに確認を求める。さらなるズームを指示されると(ste
p14,Yes)、step5に戻る。
At the
p14, Yes), returns to the step5.
以上のようにして、ユーザが関心領域のさらなるズームは必要でないことが指示されると(step14,No)、step15に進み、ユーザは関心領域に対する画像編集、例えばパンチ穴の削除処理などを行うことができる。
As described above, when the user is instructed that further zooming of the region of interest is not necessary (
図14の(a),(b),(c)は、以上の処理により関心領域画像が順次ズームされて表示される様子を示している。 (A), (b), and (c) of FIG. 14 show how the region-of-interest images are sequentially zoomed and displayed by the above processing.
なお、図11には明示されていないが、step14の確認のための画面などで、ユーザはユーザ入力手段22を介して継承/非継承切替27の設定を指示することができる。この指示が入力された場合、システム制御手段10は、設定書き込み手段15を介し、設定ファイルの継承/非継承切替27をセットする。ここでは、1ページ目の処理中に継承/非継承切替27が「継承」にセットされたものとして以後説明する。
Although not explicitly shown in FIG. 11, the user can instruct setting of inheritance / non-inheritance switching 27 via the user input means 22 on a screen for confirmation of
step15を終了すると、step16に進み、システム制御手段10は画像表示手段21の画面上でユーザに次ページへの移動を確認する。
When
次ページへの移動がマウスなどを利用して指示されると(step16,Yes)、この段階では設定ファイルの継承/非継承切替27が「継承」にセットされているため(step3,Yes)、step5に進む。
When movement to the next page is instructed using a mouse or the like (step 16, Yes), the setting file inheritance / non-inheritance switching 27 is set to “inherit” at this stage (
step5で、システム制御手段10は、全体画像伸長手段23により2ページ目(p2)の全体画像を伸長させて画面表示させるとともに、設定ファイルの関心領域オフセット位置24及び関心領域サイズ25の内容に対応した関心領域の枠を全体画像にオーバーラップさせて表示させる。この際に、2ページ目のパラメータが全体画像伸長手段23により取得されてシステム制御手段10に保持される。
In
ユーザがOKを入力すると(step6,Yes)、step8で、システム制御手段10は、設定書き込み手段15を介し、2ページ目のパラメータを設定ファイルのページ設定26にセットする。この場合、関心領域サイズ25と関心領域オフセット位置24は変更がない。
When the user inputs OK (step 6, Yes), in
次のstep9で、システム制御手段10は、関心領域の表示画面サイズ(表示ウィンドウのサイズ)が変化した時には、そのサイズを関心領域描画制御手段20にセットし直す。関心領域描画制御手段20により、関心領域表示画面サイズと、関心領域オフセット位置24及び関心領域サイズ25の内容がブロック伸長制御手段17に通知される。
At the next step 9, when the display screen size of the region of interest (the size of the display window) changes, the
次のstep10で、ブロック伸長制御手段17において、通知された関心領域のサイズ及びオフセット位置、並びに当該ページのメインヘッダの内容とから、関心領域に関係したm×n個のタイル群(ブロック群)を選択し、選択したタイル群を最高解像度レベルまで伸長した場合の画像サイズを計算し内部にセットする。
In the
次に、step11で、ブロック伸長制御手段17において、関心領域の伸長すべき解像度レベルlevelを前記式(1)により算出する。
Next, at
次のstep12で、ブロック伸長制御手段17は、解像度レベルlevelをブロック伸長手段18に指示し、選択した各タイルの符号をブロック伸長手段18へ送り、解像度レベルlevelまでの伸長を実行させる。各タイルの伸長画像データは伸長画像記憶手段19のブロックに対応した領域に書き込まれる。選択したブロック群の解像度レベルlevelまでの伸長が終了すると、終了通知が関心領域描画制御手段20へ送られ、当該処理ステップは終了する。
At the
次のstep13で、関心領域描画制御手段20は、伸長画像記憶手段19より関心領域の画像データを画像表示手段21へ転送し、関心領域の表示ウィンドウに関心領域画像を表示させる。
In the
かくして、1ページ目についての最終的な関心領域のオフセット位置及びサイズ(ズーム率)と同じ条件で、2ページ目の関心領域の画像が表示される。すなわち、1ページ目では例えば図14の(a),(b),(c)のように関心領域をズームしたが、2ページ目については、(a),(b)に対応した(d),(e)のズーム過程を経ることなく、直ちに(f)のようにズームされた関心領域画像が表示される。 Thus, the image of the region of interest on the second page is displayed under the same conditions as the offset position and size (zoom rate) of the final region of interest for the first page. That is, in the first page, the region of interest is zoomed as shown in FIGS. 14A, 14B, and 14C, for example, the second page corresponds to (a) and (b) (d). , (E), the zoomed region of interest image is immediately displayed as shown in (f) without going through the zoom process.
このように、以前のページにおける関心領域オフセット位置24及び関心領域サイズ25の設定内容が継承されることにより、例えば各ページの同じ位置のパンチ穴の部分の画像を拡大表示して削除するような編集作業を効率的に行うことができるようになる。
In this way, the setting contents of the region of interest offset
なお、ページを移動する時に、関心領域のオフセット位置・サイズの確認の手順をスキップしたい場合に「デフォルト」を指示することができる。デフォルト指示をした場合には、step2からstep8へジャンプし、step8ではページ設定26のセットのみが行われる。
It should be noted that “default” can be instructed when it is desired to skip the procedure for checking the offset position / size of the region of interest when moving the page. When the default instruction is given, the process jumps from
step16でユーザが次ページに移動しない旨を指示すると、当該マルチページ文書に対する処理は終了する。図9には明示されていないが、システム制御手段10は、終了処理において設定記憶手段14上の設定ファイルを例えばハードディスク装置102(図10)に保存する。保存された設定ファイルは、同じマルチページ文書が入力された時に、関連付け手段13の作用により設定記憶手段14に読み込まれて再利用される。この再利用の場合、マルチページ文書の1ページ目の処理で直ちにstep5に進み、全体画像と関心領域の枠が表示されることになる。デフォルト指示をすることにより、関心領域確認ステップであるstep5,6をスキップさせることもできる。
When the user instructs not to move to the next page in step 16, the processing for the multi-page document ends. Although not explicitly shown in FIG. 9, the
<原稿サイズに違いがある場合の動作>
直前のページと原稿サイズが異なるページを処理する場合、step5を最初に実行する際に、システム制御手段10は関心領域オフセット位置にセットされているオフセット位置を直前ページとの原稿サイズ比に応じて推定し、推定したオフセット位置を用いて関心領域の枠を表示する。ただし、関心領域サイズは変更しない。
<Operation when there is a difference in document size>
When processing a page having a document size different from that of the immediately preceding page, when executing
例えば、図16に示すように、1ページ目(P1)はA4サイズであり、2ページ目(P2)はA4サイズと同じ幅の方形の原稿であり、画像をズームしたい部分であるパンチ穴は両ページとも縦方向の中心から等距離にあるとする。2ページ目の縦方向の中心と1ページ目の縦方向の中心とを一致させる(中央揃え)場合、
Roff.y(2)=(Isiz.h(1)−Roff.y(1)−Rsiz.h(1))×Isiz.h(2)/Isiz.h(1)
により、2ページ目(P2)の関心領域の縦方向オフセット位置Roff.y(2)を計算する。ただし、Isiz.h(1)、Roff.y(1)、Rsiz.h(1)は、1ページ目の縦方向サイズ、関心領域の縦方向オフセット位置、関心領域の縦方向サイズであり、Isiz.h(2)は2ページ目の縦方向サイズである。パンチ穴の大きさは変わらないため、関心領域サイズは変更しない。
For example, as shown in FIG. 16, the first page (P1) is an A4 size, the second page (P2) is a square document having the same width as the A4 size, and the punch hole that is the portion where the image is to be zoomed is Assume that both pages are equidistant from the center in the vertical direction. When aligning the vertical center of the second page with the vertical center of the first page (center alignment)
Roff.y (2) = (Isiz.h (1) −Roff.y (1) −Rsiz.h (1)) × Isiz.h (2) /Isiz.h (1)
Thus, the vertical offset position Roff.y (2) of the region of interest on the second page (P2) is calculated. However, Isiz.h (1), Roff.y (1), and Rsiz.h (1) are the vertical size of the first page, the vertical offset position of the region of interest, and the vertical size of the region of interest. .h (2) is the vertical size of the second page. Since the punch hole size does not change, the region of interest size is not changed.
なお、2ページ目と1ページ目の原稿の横サイズも異なる場合、2ページ目の関心領域の横方向オフセット位置も変倍する。すなわち、
Roff.x(2)=(Isiz.w(1)−Roff.x(1)−Rsiz.w(1))×Isiz.w(2)/Isiz.w(1)
により、2ページ目の関心領域の横方向オフセット位置Roff.x(2)を計算する。ただし、Isiz.w(1)、Roff.x(1)、Rsiz.w(1)は1ページ目の横方向サイズ、関心領域の横方向オフセット位置、関心領域の横方向サイズてせあり、Isiz.w(2)は2ページ目の横方向サイズである。
When the horizontal size of the second page and the first page is different, the horizontal offset position of the region of interest on the second page is also scaled. That is,
Roff.x (2) = (Isiz.w (1) −Roff.x (1) −Rsiz.w (1)) × Isiz.w (2) /Isiz.w (1)
Thus, the horizontal offset position Roff.x (2) of the region of interest on the second page is calculated. However, Isiz.w (1), Roff.x (1), and Rsiz.w (1) are the horizontal size of the first page, the horizontal offset position of the region of interest, and the horizontal size of the region of interest. .w (2) is the horizontal size of the second page.
なお、2ページ目を1ページ目と上端又は下端を揃える場合にも同様にしてオフセット位置の推定が可能である。 Note that the offset position can be similarly estimated when the second page is aligned with the first page and the upper or lower end.
<解像度に違いがある場合の動作>
処理しようとするページの解像度と、その前ページの解像度が異なる場合には、解像度比により関心領域のオフセット位置が推定される。図18はその説明図であり、右側が当該ページの関心領域、左側が前ページの関心領域である。
<Operation when there is a difference in resolution>
If the resolution of the page to be processed is different from the resolution of the previous page, the offset position of the region of interest is estimated from the resolution ratio. FIG. 18 is an explanatory diagram of the region of interest on the right side and the region of interest of the previous page on the left side.
すなわち、当該ページの関心領域の横方向と縦方向のオフセット位置Roff.x,Roff.yは
Roff.x=(前ページのRoff.x)×(当該ページの解像度)/(前ページの解像度)
Roff.x=(前ページのRoff.y)×(当該ページの解像度)/(前ページの解像度)
により計算される。このような推定は、当該ページについてstep5が最初に実行される時にシステム制御手段10で行われる。
That is, the horizontal and vertical offset positions Roff.x and Roff.y of the region of interest on the page are
Roff.x = (Roff.x of the previous page) × (resolution of the page) / (resolution of the previous page)
Roff.x = (Roff.y on the previous page) x (resolution of the page) / (resolution of the previous page)
Is calculated by Such estimation is performed by the system control means 10 when
<両面原稿の場合の動作>
両面原稿の場合には、隣接ページ間で関心領域のオフセット位置を左右又は上下に反転させる必要がある。左右反転か上下反転かはスキャナによる原稿読取方向による。
<Operation for double-sided document>
In the case of a double-sided document, the offset position of the region of interest needs to be reversed left and right or up and down between adjacent pages. Whether the horizontal reversal or vertical reversal depends on the original reading direction by the scanner.
例えば、図12と図13に見られるように、1ページ目(P1)と2ページ目(P2)が両面原稿の各面であり、1ページ目の左端に位置するパンチ穴と、2ページ目の右端に位置するパンチ穴とは左右対称の位置関係にある。 For example, as shown in FIG. 12 and FIG. 13, the first page (P1) and the second page (P2) are each side of a double-sided document, and the punch hole located at the left end of the first page and the second page And the punch hole located at the right end of the left and right are symmetrical.
この場合、図15に示すように、原稿横サイズIsiz.w、1ページ目の関心領域の横方向オフセット位置Roff.x、関心領域横サイズRsiz.wから、
2ページ目の関心領域の横方向オフセット位置=Isiz.w−Roff.x−Rsiz.w
を計算することができる。
In this case, as shown in FIG. 15, from the document horizontal size Isiz.w, the horizontal offset position Roff.x of the region of interest on the first page, and the region of interest horizontal size Rsiz.w,
Horizontal offset position of the region of interest on the second page = Isiz.w−Roff.x−Rsiz.w
Can be calculated.
オフセット位置を上下反転する場合には、原稿縦サイズIsiz.h、1ページ目の関心領域の縦方向オフセット位置Roff.y、関心領域縦サイズRsiz.hから、
2ページ目の関心領域の縦方向オフセット位置=Isiz.h−Roff.y−Rsiz.h
を計算することができる。
To flip the offset position upside down, from the document vertical size Isiz.h, the vertical offset position Roff.y of the region of interest on the first page, the region of interest vertical size Rsiz.h,
Vertical offset position of the region of interest on the second page = Isiz.h-Roff.y-Rsiz.h
Can be calculated.
このようなオフセット位置の推定は、当該ページについてstep5が最初に実行され
る時にシステム制御手段10により行われる。
Estimation of such an offset position is performed by the
<集約画像ページの場合の動作>
当該ページが複数枚の原稿の画像を1ページに集めた集約ページで、その前ページが1枚の原稿の等倍画像のページである場合には、前ページに対する関心領域オフセット位置24及び関心領域サイズ25の内容を基に、当該ページの関心領域を個数を集約原稿数分だけ増加し、それぞれの各関心領域のオフセット位置及びサイズを推定する。これとは逆に、当該ページが等倍画像のページで、その前ページが集約ページである場合には、前ページに対する関心領域オフセット位置24及び関心領域サイズ25の内容を基に、当該ページの関心領域の個数を減らし、それぞれの関心領域のオフセット位置とサイズを推定する。
<Operation for aggregated image page>
If the page is an aggregate page in which images of a plurality of documents are collected in one page, and the previous page is a page of an equal-size image of one document, the region of interest offset
前者の例として、図17の左端の図に示すような4面集約のページが処理対象で、その前ページが等倍画像のページである場合を考える。この4面集約ページ中の上段の2面は両面原稿の画像で、その左側の面では左端にパンチ穴が位置し、右側の面では右端にパンチ穴が位置する。4面集約ページの下段の2面も同様の両面原稿の画像である。 As an example of the former, let us consider a case where a four-page consolidated page as shown in the leftmost diagram of FIG. 17 is a processing target, and the previous page is a page of an equal-size image. The upper two sides of the four-page consolidated page are images of a double-sided document. A punch hole is located at the left end on the left side, and a punch hole is located at the right end on the right side. The lower two pages of the four-page consolidated page are similar double-sided original images.
4面集約ページの上段の左側の面の関心領域(図17中の上段中央の図)の横方向のオフセット位置Roff(0).xと縦方向のオフセット位置Roff(0).yは、
Roff(0).x=(Isiz.w-Roff.x-Rsiz.w)/2
Roff(0).y=(Isiz.h-Roff.y-Rsiz.h)/2
により計算される。ただし、Isiz.wとIsiz.hは前ページの幅と高さ、Roff.xとRoff.yは前ページの関心領域の横方向オフセット位置と縦方向オフセット位置、Rsiz.wとRsiz.hは前ページの関心領域の幅と高さである。
The offset position Roff (0) .x in the horizontal direction and the offset position Roff (0) .y in the vertical direction of the region of interest on the left side of the upper left side of the four-page consolidated page (the upper middle figure in FIG. 17) are
Roff (0) .x = (Isiz.w-Roff.x-Rsiz.w) / 2
Roff (0) .y = (Isiz.h-Roff.y-Rsiz.h) / 2
Is calculated by However, Isiz.w and Isiz.h are the width and height of the previous page, Roff.x and Roff.y are the horizontal offset position and vertical offset position of the region of interest on the previous page, and Rsiz.w and Rsiz.h are The width and height of the region of interest on the previous page.
また、上段の右側の面の関心領域(図17中の上段右の図)の横方向と縦方向のオフセット位置Roff(1).x,Roff(1).yは
Roff(1).x=Isiz.w/2+(Isiz.w-Roff.x-Rsiz.w)/2
Roff(1).y=(Isiz.h-Roff.y-Rsiz.h)/2
により計算される。
Also, the offset positions Roff (1) .x, Roff (1) .y in the horizontal and vertical directions of the region of interest on the right side of the upper stage (the upper right figure in FIG. 17) are
Roff (1) .x = Isiz.w / 2 + (Isiz.w-Roff.x-Rsiz.w) / 2
Roff (1) .y = (Isiz.h-Roff.y-Rsiz.h) / 2
Is calculated by
また、下段の左側の面の関心領域(図17中の下段中央の図)の横方向と縦方向のオフセット位置Roff(2).x,Roff(2).yは
Roff(2).x=(Isiz.w-Roff.x-Rsiz.w)/2
Roff(2).y=Isiz.h/2+(Isiz.h-Roff.y-Rsiz.h)/2
により計算される。
In addition, the offset positions Roff (2) .x and Roff (2) .y in the horizontal and vertical directions of the region of interest on the left side of the lower stage (the lower middle figure in FIG. 17) are
Roff (2) .x = (Isiz.w-Roff.x-Rsiz.w) / 2
Roff (2) .y = Isiz.h / 2 + (Isiz.h-Roff.y-Rsiz.h) / 2
Is calculated by
また、下段の右側の面の関心領域(図17中の下段右側の図)のオフセット位置は
Roff(3).x=Isiz.w/2+(Isiz.w-Roff.x-Rsiz.w)/2
Roff(3).y=Isiz.h/2+(Isiz.h-Roff.y-Rsiz.h)/2
により計算される。
Also, the offset position of the region of interest on the right side of the lower stage (the figure on the lower right side in FIG. 17) is
Roff (3) .x = Isiz.w / 2 + (Isiz.w-Roff.x-Rsiz.w) / 2
Roff (3) .y = Isiz.h / 2 + (Isiz.h-Roff.y-Rsiz.h) / 2
Is calculated by
また、各面の関心領域の横方向と縦方向のサイズRsiz.w,Rsiz.hは、各面のサイズと等倍原稿サイズとの比により変倍される。すなわち、
Rsiz.w=Rsiz.w/2
Rsiz.h=Rsiz.h/2
により計算される。
Also, the horizontal and vertical sizes Rsiz.w and Rsiz.h of the region of interest on each surface are scaled according to the ratio between the size of each surface and the same size original size. That is,
Rsiz.w = Rsiz.w / 2
Rsiz.h = Rsiz.h / 2
Is calculated by
以上の集約ページに対する関心領域のオフセットとサイズの推定は、当該ページに対しstep5を最初に実行する際にシステム制御手段10で行われる。
The estimation of the offset and size of the region of interest for the aggregated page is performed by the system control means 10 when
ここで、集約画像のページとして、等倍後集約、集約後等倍、集約後集約(上記4面集約がこの例)のいずれのページをも包含するものである。 Here, the page of the aggregated image includes any page of aggregate after equal magnification, equal magnification after aggregation, and aggregation after aggregation (the above-mentioned four-surface aggregation is this example).
なお、以上においては、マルチページ文書の各ページのパンチ穴を削除する場合を例に説明したが、これはあくまで例にすぎない。例えば、各ページのコーナーなどの特定位置にあるステープル痕を除去するような場合にも、その領域を効率的にアクセスすることができることは明らかである。さらに、デジタルカメラで撮影した複数枚の画像の例えば中央部分を関心領域としてズーム表示するような目的にも本発明に係る画像処理装置は好適である。このように本発明は、多様な目的に適用し効果を得られるものである。 In the above description, the case of deleting punch holes in each page of a multi-page document has been described as an example, but this is only an example. For example, even when a staple mark at a specific position such as a corner of each page is removed, the area can be accessed efficiently. Furthermore, the image processing apparatus according to the present invention is also suitable for the purpose of zoom-displaying, for example, a central portion of a plurality of images taken with a digital camera as a region of interest. As described above, the present invention can be applied to various purposes to obtain effects.
[クライアント・サーバ環境における態様について]
設定データとマルチページ文書は独立したファイルとして扱うことができる。したがって、サーバ・クライアント環境において、本発明の画像処理装置をクライアントに実装する場合、図19又は図20に模式的に示すように設定ファイル(設定データ)をクライアント側に保存する態様も可能であるし、図21に模式的に示すようにマルチページ文書のファイルが保存されているサーバ側に設定ファイルを保存する態様も可能である。後者の態様では、クライアント側でマルチページ文書の各ページの符号と、その設定ファイルをサーバ側から受信し、また、修正された設定ファイルをサーバに送信し保存させることになる。
[About aspects in client / server environments]
Setting data and multi-page documents can be handled as independent files. Therefore, when the image processing apparatus of the present invention is mounted on a client in a server / client environment, a mode in which a setting file (setting data) is stored on the client side as schematically shown in FIG. 19 or 20 is also possible. However, as schematically shown in FIG. 21, a mode in which the setting file is stored on the server side where the multi-page document file is stored is also possible. In the latter mode, the code of each page of the multi-page document and its setting file are received from the server side on the client side, and the corrected setting file is transmitted to the server for storage.
また、図22に模式的に示すように、カスケード接続された複数のサーバ中の1つのサーバ(1)に設定ファイルを保存する態様も可能である。この態様において、例えば1つのマルチページ文書がサーバ(1)とサーバ(2)に分散した形で保存されている場合、クライアント側でサーバ(1)に保存されているマルチページ文書の各ページをサーバ(1)より取り込んで処理し、サーバ(1)に保存されているページを越えてページ移動する時には、必要なページをサーバ(2)より取り込み処理する形をとることもできる。 In addition, as schematically illustrated in FIG. 22, a configuration in which the setting file is stored in one server (1) among a plurality of servers connected in cascade is also possible. In this aspect, for example, when one multi-page document is stored in a distributed form on the server (1) and the server (2), each page of the multi-page document stored on the server (1) is stored on the client side. When the page is moved beyond the page stored in the server (1) after being fetched from the server (1), the necessary page can be fetched from the server (2).
10 システム制御手段
11 符号入力手段
12 符号記憶手段
13 関連付け手段
14 設定記憶手段
15 設定書き込み手段
16 関心領域伸長手段
17 ブロック伸長制御手段
18 ブロック伸長手段
19 伸長画像記憶手段
20 関心領域描画制御手段
21 画像表示手段
22 ユーザ入力手段
23 全体画像伸長手段
DESCRIPTION OF
Claims (7)
前記マルチページ文書の処理対象ページを移動させるページ移動手段と、
関心領域のオフセット位置及びサイズの設定を含む設定データを記憶するための設定記憶手段と、
前記設定記憶手段に記憶されている設定データを修正するための設定修正手段と、
前記設定記憶手段に記憶されている関心領域のオフセット位置及びサイズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長する関心領域伸長手段と、
前記関心領域伸長手段により伸長された関心領域画像を画面表示する画像表示手段と、
を有し、さらに
前記ページ移動手段により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定手段と、該推定手段により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え手段とを有することを特徴とする画像処理装置。 Code storage means for storing code data of a multi-page document compressed so as to be expandable in block units;
Page moving means for moving a processing target page of the multi-page document ;
Setting storage means for storing setting data including the setting of the offset position and size of the region of interest;
Setting correction means for correcting the setting data stored in the setting storage means;
Blocks related to the region of interest of the processing target page stored in the code storage unit based on the setting of the offset position and size of the region of interest stored in the setting storage unit and the display screen size of the region of interest image A region of interest extension means for expanding a region of interest image from the sign of
Image display means for displaying a region of interest image expanded by the region of interest expansion means;
And further
When the page to be processed is moved by the page moving means, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. An estimation means for estimating the offset position of the region of interest with respect to, and a rewriting means for rewriting the setting of the offset position of the region of interest stored in the setting storage means with the offset position estimated by the estimation means An image processing apparatus.
前記マルチページ文書の処理対象ページを移動させるページ移動工程と、 A page moving step of moving a processing target page of the multi-page document;
関心領域のオフセット位置及びサイズの設定を含む設定データを設定記憶手段に記憶させる工程と、 Storing setting data including setting of the offset position and size of the region of interest in the setting storage means;
前記設定記憶手段に記憶されている設定データを修正する工程と、 Modifying the setting data stored in the setting storage means;
前記設定記憶手段に記憶されている関心領域のオフセット位置及びサイズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長する関心領域伸長工程と、 Blocks related to the region of interest of the processing target page stored in the code storage unit based on the setting of the offset position and size of the region of interest stored in the setting storage unit and the display screen size of the region of interest image A region-of-interest extension step of expanding a region-of-interest image from the sign of
前記関心領域伸長工程により伸長された関心領域画像を画像表示手段に画像表示させる工程とを有し、さらに A step of causing the image display means to display an image of the region of interest image expanded by the region of interest expansion step, and
前記ページ移動工程により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定工程と、該推定工程により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え工程とを有することを特徴とする画像処理方法。When the page to be processed is moved by the page moving step, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. An estimation step of estimating the offset position of the region of interest with respect to, and a rewriting step of rewriting the setting of the offset position of the region of interest stored in the setting storage means with the offset position estimated by the estimation step Image processing method.
前記マルチページ文書の処理対象ページを移動させるページ移動手段、 Page moving means for moving a processing target page of the multi-page document;
関心領域のオフセット位置及びサイズの設定を含む設定データを記憶するための設定記憶手段、 Setting storage means for storing setting data including the setting of the offset position and size of the region of interest;
前記設定記憶手段に記憶されている設定データを修正するための設定修正手段、 Setting correction means for correcting the setting data stored in the setting storage means;
前記設定記憶手段に記憶されている関心領域のオフセット位置及びサイズの設定、並びに関心領域画像の表示画面サイズに基づいて、前記符号記憶手段に記憶されている処理対象ページの関心領域に関連したブロックの符号から関心領域画像を伸長する関心領域伸長手段、及び Blocks related to the region of interest of the processing target page stored in the code storage unit based on the setting of the offset position and size of the region of interest stored in the setting storage unit and the display screen size of the region of interest image A region-of-interest extension means for expanding a region-of-interest image from the sign of
前記関心領域伸長手段により伸長された関心領域画像を画面表示する画像表示手段としてコンピュータを機能させ、 Causing the computer to function as image display means for displaying the region-of-interest image expanded by the region-of-interest extension means;
さらにfurther
前記ページ移動手段により処理対象ページが移動させられた時に、移動前後のページの原稿サイズが異なる場合に、該移動前のページについての関心領域のオフセット位置の設定に基づいて、該移動後のページに対する関心領域のオフセット位置を推定する推定手段、及び、該推定手段により推定されたオフセット位置により前記設定記憶手段に記憶されている関心領域のオフセット位置の設定を書き換える書き換え手段として該コンピュータを機能させるプログラム。When the page to be processed is moved by the page moving means, if the document size of the page before and after the movement is different, the page after the movement is set based on the setting of the offset position of the region of interest for the page before the movement. And an estimator for estimating the offset position of the region of interest with respect to the computer, and a rewrite unit for rewriting the offset position of the region of interest stored in the setting storage unit with the offset position estimated by the estimator. program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005104853A JP4450322B2 (en) | 2005-03-31 | 2005-03-31 | Image processing apparatus, image processing method, program, and information recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005104853A JP4450322B2 (en) | 2005-03-31 | 2005-03-31 | Image processing apparatus, image processing method, program, and information recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006287625A JP2006287625A (en) | 2006-10-19 |
JP4450322B2 true JP4450322B2 (en) | 2010-04-14 |
Family
ID=37409051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005104853A Expired - Fee Related JP4450322B2 (en) | 2005-03-31 | 2005-03-31 | Image processing apparatus, image processing method, program, and information recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4450322B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104284048A (en) * | 2013-07-03 | 2015-01-14 | 柯尼卡美能达株式会社 | Image displaying apparatus for displaying preview images |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5299861B2 (en) * | 2008-12-25 | 2013-09-25 | 日立コンシューマエレクトロニクス株式会社 | Image display device |
JP2011116040A (en) * | 2009-12-04 | 2011-06-16 | Canon Inc | Image forming apparatus, method for controlling the same, and program |
JP7306150B2 (en) * | 2019-08-09 | 2023-07-11 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
JP7342518B2 (en) * | 2019-08-21 | 2023-09-12 | 富士フイルムビジネスイノベーション株式会社 | Image processing device and image processing program |
JP7358841B2 (en) * | 2019-08-23 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | Image processing device and image processing program |
-
2005
- 2005-03-31 JP JP2005104853A patent/JP4450322B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104284048A (en) * | 2013-07-03 | 2015-01-14 | 柯尼卡美能达株式会社 | Image displaying apparatus for displaying preview images |
US9767530B2 (en) | 2013-07-03 | 2017-09-19 | Konica Minolta, Inc. | Image displaying apparatus for displaying preview images |
CN104284048B (en) * | 2013-07-03 | 2017-09-29 | 柯尼卡美能达株式会社 | Show the image display device of preview image |
Also Published As
Publication number | Publication date |
---|---|
JP2006287625A (en) | 2006-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4111268B2 (en) | Thumbnail image display method, server computer, client computer, and program | |
JP4128438B2 (en) | Image processing apparatus, program, storage medium, and image editing method | |
JP4293740B2 (en) | Image compression device | |
JP2008140361A (en) | Image processing apparatus or image processing method | |
JP4450322B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4349816B2 (en) | Image processing apparatus, image compression apparatus, image processing method, image compression method, program, and recording medium | |
JP2004254298A (en) | Image processing device, program, and storage medium | |
EP1439710A1 (en) | Apparatus and method for image processing | |
JP3952459B2 (en) | Image processing apparatus, program, storage medium, and image processing method | |
JP2004186871A (en) | Image processing apparatus, imaging apparatus, program, and storage medium | |
JP4640942B2 (en) | Server device | |
JP4609918B2 (en) | Image processing system, image processing method, program, and information recording medium | |
JP4723543B2 (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP2007014002A (en) | Image processing apparatus, image processing program and recording medium | |
JP2004133443A (en) | Image processing device, image display, program, storage medium, method of processing image and image display system | |
JP4859014B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4014085B2 (en) | Image processing apparatus, program, and storage medium | |
JP4732251B2 (en) | Code conversion apparatus and program | |
JP4874941B2 (en) | Image processing apparatus and image processing method | |
JP2002369202A (en) | Image compression device, image expansion device, image compressing method, image expanding method, program and recording medium stored with the program | |
JP4688164B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
JP4280508B2 (en) | Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method | |
JP4374063B2 (en) | Image processing apparatus, program, and storage medium | |
JP2004096695A (en) | Image processing apparatus, image display device, program, storage medium, and image processing method | |
JP4067460B2 (en) | Image decoding apparatus, program, storage medium, and image decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100121 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140205 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |