JP2010011455A - Image-forming device - Google Patents
Image-forming device Download PDFInfo
- Publication number
- JP2010011455A JP2010011455A JP2009148053A JP2009148053A JP2010011455A JP 2010011455 A JP2010011455 A JP 2010011455A JP 2009148053 A JP2009148053 A JP 2009148053A JP 2009148053 A JP2009148053 A JP 2009148053A JP 2010011455 A JP2010011455 A JP 2010011455A
- Authority
- JP
- Japan
- Prior art keywords
- image
- area information
- document
- image area
- watermark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
本発明は、複数世代のコピー原稿であっても高精度な像域識別結果を得ることができ、また、高機能な電子ファイルを得ることができる技術に関する。 The present invention relates to a technique capable of obtaining a highly accurate image area identification result even for a plurality of generations of copy originals and obtaining a highly functional electronic file.
従来プリンタ、MFP或いは画像形成装置(以下複写機と略称する。)等では、原稿を走査して読み取った原画像データを画像に再生する際、画像のタイプを識別する像域識別を実施する。そして、その像域識別結果に基づいて各種画像のタイプに適した画像処理(原画像データのフィルタ処理等)を実行した後、プリント装置に出力している。 Conventional printers, MFPs, image forming apparatuses (hereinafter abbreviated as “copiers”), and the like perform image area identification that identifies the type of image when reproducing original image data read by scanning a document. Based on the image area identification result, image processing suitable for various image types (such as filtering of original image data) is executed, and then output to the printing apparatus.
ここで、原稿画像の各領域における画像のタイプを決定する理由は、例えば同じ原稿上にあっても、文字領域と図形領域とでは夫々異なるフィルタ処理を施す必要があるためである。原稿画像を複数の領域に分離して領域毎に画像のタイプを識別する方法としては特許文献1に開示された技術が知られている。
Here, the reason for determining the image type in each area of the document image is that, for example, even on the same document, it is necessary to perform different filter processes for the character area and the graphic area. As a method for separating a document image into a plurality of regions and identifying the type of image for each region, a technique disclosed in
一方、電子メールやWebサービス等のネットワークの普及に伴い、電子ファイルをネットワークを介して送信・配布する頻度が増加している。この際、電子ファイルをワープロソフトやプレゼンテーションソフトの出力ファイル形式で配布すると容易に改竄されてしまう。このような改竄を防ぐ簡易的な方法として、一旦プリントアウトした画像をスキャン入力し、JPEG/TIFF/PDFなどの画像ファイルに変換して配布することが行われている。しかし、画像ファイルのままでは検索等の再利用が困難、ファイル容量が大きい等の短所がある。 On the other hand, with the spread of networks such as e-mail and Web services, the frequency of sending and distributing electronic files via the network is increasing. At this time, if the electronic file is distributed in the output file format of word processing software or presentation software, it is easily falsified. As a simple method for preventing such falsification, an image once printed out is scanned in, converted into an image file such as JPEG / TIFF / PDF, and distributed. However, there are disadvantages such as that it is difficult to reuse the search if the image file remains, and the file capacity is large.
そこで、検索などの再利用を図るために、例えば特許文献1で提案されている画像識別処理を用いて入力画像から文字領域を抽出し、抽出された文字領域にOCR処理をすることでキーワード検索が可能なファイルを作成することができる。
また、ファイル容量を小さくするために、入力画像を文字領域及び自然画像領域に領域分割し、文字領域、自然画像領域それぞれに適した手法で画像データを圧縮することで高圧縮・高画質な画像再現を実現する方法も提案されている(例えば、特許文献2参照)。
Therefore, in order to reuse the search or the like, for example, a character area is extracted from the input image using the image identification process proposed in
In addition, in order to reduce the file capacity, the input image is divided into character areas and natural image areas, and the image data is compressed by a method suitable for each of the character areas and natural image areas, thereby achieving high-compression and high-quality images. A method for realizing reproduction has also been proposed (see, for example, Patent Document 2).
このように画像識別処理を用いて入力画像を文字像域および自然画像像域に領域分割を行うことで、検索等の再利用、ファイル容量の高圧縮などを実現することが可能となる。しかし、一般に完璧な識別技術というものは存在せず、常に誤識別が発生する可能性がある。 As described above, by dividing the input image into the character image area and the natural image image area by using the image identification process, it is possible to realize reuse of search and the like, high compression of the file capacity, and the like. However, generally there is no perfect identification technique, and there is a possibility that misidentification always occurs.
特に複写機で何世代もコピーを繰り返したコピー原稿は、オリジナル原稿と比べて画質が劣化することは良く知られている。そのため、このようなコピー原稿を読取った世代コピー画像に対する像域識別結果はオリジナル原稿に対する像域識別結果と比較して識別精度が低くなっている。 In particular, it is well known that a copy original that has been copied for many generations by a copying machine is deteriorated in image quality as compared with an original original. For this reason, the image area identification result for the generation copy image obtained by reading such a copy document has a lower identification accuracy than the image area identification result for the original document.
このことは、複写機によるコピー原稿に限らずプリンタによる出力原稿においても同様である。即ち、プリントアウトされた画像をスキャン入力し、高機能な電子ファイルを作成する際、その画像識別処理で誤識別が生じる可能性がある。 This applies not only to the copy original by the copying machine but also to the output original by the printer. That is, when a printed image is scanned and input to create a highly functional electronic file, there is a possibility that erroneous identification may occur in the image identification process.
本発明は斯かる事情に鑑みてなされたものであって、複数世代のコピー原稿であっても高精度な像域識別結果を得ることができ、また、高機能な電子ファイルを得ることができる技術を提供することを目的とする。 The present invention has been made in view of such circumstances, and can obtain a highly accurate image area identification result even for a plurality of generations of copy originals, and can obtain a highly functional electronic file. The purpose is to provide technology.
上記課題を解決するための本発明は、文書画像を入力して画像データである入力文書画像を生成する文書画像入力手段と、前記文書画像のそれぞれの像域について作成された像域情報を入力する像域情報入力手段と、前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、前記入力文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段とを有する画像形成装置である。 In order to solve the above-mentioned problems, the present invention inputs document image input means for generating an input document image as image data by inputting a document image, and image area information created for each image area of the document image. Image area information input means, watermark image forming means for forming a watermark image in which the image area information is embedded, and watermarked document image composition for synthesizing the input document image and the watermark image to form a watermarked document image An image forming apparatus.
また本発明は、文書データを入力する文書データ入力手段と、前記文書データから画像データである文書画像を形成する文書画像形成手段と、前記文書データ中のそれぞれの像域について作成された像域情報を入力する像域情報入力手段と、前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、前記文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段とを有する画像形成装置である。 The present invention also provides a document data input means for inputting document data, a document image forming means for forming a document image which is image data from the document data, and an image area created for each image area in the document data. Image area information input means for inputting information, watermark image forming means for forming a watermark image in which the image area information is embedded, and a watermarked document for synthesizing the document image and the watermark image to form a watermarked document image An image forming apparatus having image composition means.
本発明によれば、複数世代のコピー原稿であっても高精度な像域識別結果を得ることができ、また、高機能な電子ファイルを得ることができる。 According to the present invention, a highly accurate image area identification result can be obtained even for a copy document of a plurality of generations, and a highly functional electronic file can be obtained.
[第1の実施の形態]
図1は、第1の実施の形態の画像形成装置の構成を示すブロック図である。図2は、第1の実施の形態の画像形成装置の概略の動作を示すフローチャートである。
以下、図1及び図2を参照しつつ画像形成装置の構成と動作を説明する。
[First embodiment]
FIG. 1 is a block diagram illustrating a configuration of the image forming apparatus according to the first embodiment. FIG. 2 is a flowchart showing a schematic operation of the image forming apparatus according to the first embodiment.
Hereinafter, the configuration and operation of the image forming apparatus will be described with reference to FIGS. 1 and 2.
画像形成装置は、文書画像入力手段101、像域情報入力手段102、透かし画像形成手段103、透かし文書合成手段104を備えている。 The image forming apparatus includes document image input means 101, image area information input means 102, watermark image formation means 103, and watermark document composition means 104.
動作201において、文書画像入力手段101は、文書画像を入力する。ここで文書画像入力手段101は、例えば、MFPや複写機に搭載されているスキャナであり、入力される文書画像は紙原稿である。動作202において、像域情報入力手段102は入力される文書画像を元に予め作成されている像域情報を入力する。
In
図3は、入力される文書画像及び像域情報の内容を示す図である。図3(1)の文書画像301は、タイトル302,本文303及び自然画像304の像域を含んでいる。この文書画像301から像域情報を抽出するために、例えば、図3(2)の文書画像305に示したように、ユーザが画面を見ながらマウス等で各像域(306,307,308)を矩形で囲み、キーボード等から各属性を指定する。
FIG. 3 is a diagram showing the contents of the input document image and image area information. A
このようにユーザに指定された各像域の矩形座標位置と属性とから、図3(3)に示す像域情報309が作成され、像域情報入力手段102に入力される。像域情報としては、属性(タイトル/本文/自然画像)とその座標位置(310、311、312)である。
なお、本実施の形態では像域情報として座標位置と、タイトル/本文/自然画像の属性を入力しているが、例えば文字属性の像域であれば文字色や文字コード、自然画像であれば風景画像/人物画像などの情報も像域情報として入力することが可能である。
As described above, the
In this embodiment, the coordinate position and the title / text / natural image attributes are input as image area information. For example, in the case of an image area of character attributes, the character color, character code, and natural image are input. Information such as landscape images / person images can also be input as image area information.
動作203において、透かし画像形成手段103は、像域情報入力手段102により抽出された像域情報を埋め込んだ透かし画像を形成する。更に、動作204において、透かし文書合成手段104は、文書画像入力手段101から出力された文書画像と、透かし画像形成手段103から出力された透かし画像を合成し、透かし情報が埋め込まれた画像を形成する。
In
透かし画像の形成及び透かし情報が埋め込まれた画像の形成に関しては、既に様々な手法が開示されている。例えば特開2003−101762号公報に記載の技術では、文書の背景に所定の方法で黒画素を埋め込むことで文書に情報を埋め込む。 Various methods have already been disclosed for the formation of watermark images and images with embedded watermark information. For example, in the technique described in Japanese Patent Application Laid-Open No. 2003-101762, information is embedded in a document by embedding black pixels in a predetermined method in the background of the document.
図4は、特開2003−101762号公報に記載の技術を用いた画像形成方法を説明する図である。
文書画像入力手段101から文書画像401を出力し、像域情報入力手段102から出力された像域情報を透かし画像形成手段103により透かし画像402に変換し、文書画像401と透かし画像402を透かし文書合成手段104により合成して透かし情報が埋め込まれた文書403を得る。
FIG. 4 is a diagram for explaining an image forming method using the technique described in Japanese Patent Application Laid-Open No. 2003-101762.
The
次に、第1の実施の形態の画像形成装置を用いて得られた透かし情報が埋め込まれた文書から、高画質な世代コピーを得る方法を説明する。
図5は、第1の実施の形態の画像形成装置に対応する画像処理装置の構成を示すブロック図である。
Next, a method for obtaining a high-quality generation copy from a document in which watermark information obtained using the image forming apparatus according to the first embodiment is embedded will be described.
FIG. 5 is a block diagram illustrating a configuration of an image processing apparatus corresponding to the image forming apparatus according to the first embodiment.
文書画像入力手段501は、紙に出力された上述の像域情報が透かし画像として埋め込まれた文書画像を入力する。ここで文書画像入力手段501は、MFPや複写機のスキャナ等である。次に透かし情報抽出手段502は、埋め込まれた像域情報を抽出する。ここで用いられる透かし情報を抽出する技術は、例えば上述の特開2003−101762号公報に記載の技術を用いることができる。
続いて画像処理手段503は、文書画像入力手段501から出力された文書画像に対して、抽出された像域情報を用いて像域ごとに適した画像処理を施す。
The document
Subsequently, the
図6は、画像処理手段503により施される画像処理の例を示す図である。画像処理の例としては、フィルタ処理や階調処理がある。例えば、自然画像に対しては画像出力時の網点との干渉によるモアレを防ぐために入力画像の網点を潰すためのぼかしフィルタ処理を施し、文字画像に対しては文字のエッジを強調するためにエッジ強調フィルタを施す。また、階調処理においても、自然画像は解像性よりも階調性を重視するため低線数の階調処理を施し、文字画像は解像性を重視するために高線数の階調処理を施す。
FIG. 6 is a diagram illustrating an example of image processing performed by the
最後に画像出力手段504は、画像処理された画像を出力する。画像を出力する手段としては、MFPや複写機のプリント部がある。
Finally, the
以上述べた通り、劣化しているコピー画像を対象として像域識別するのではなく、透かしとして埋め込まれた情報から像域情報を得ることで、正確な像域識別結果を使用することが出来る。また、透かしから得られた像域情報を図1に示す像域情報入力手段102に入力し直すことで、何世代コピーしても高精度な像域識別結果を得ることが可能となる。 As described above, an accurate image area identification result can be used by obtaining image area information from information embedded as a watermark instead of identifying an image area for a deteriorated copy image. Further, by inputting again the image area information obtained from the watermark into the image area information input means 102 shown in FIG. 1, it is possible to obtain a highly accurate image area identification result regardless of how many generations are copied.
図7は、第1の実施の形態の画像形成装置に対応する画像処理装置の他の構成を示すブロック図である。この画像処理装置では、透かし情報が埋め込まれた文書から、高圧縮な電子ファイルを得る。 FIG. 7 is a block diagram showing another configuration of the image processing apparatus corresponding to the image forming apparatus of the first embodiment. In this image processing apparatus, a highly compressed electronic file is obtained from a document in which watermark information is embedded.
文書画像入力手段701は、紙に出力された上述の像域情報が透かし画像として埋め込まれた文書画像を入力する。次に透かし情報抽出手段702は、埋め込まれた像域情報を抽出する。続いて画像分割手段703は、抽出された像域情報を用いて文書画像入力手段701から出力された文書画像を文字画像と自然画像に分割する。
The document
分割された文字画像と自然画像をそれぞれに適した方法で画像圧縮することにより、高画質・高圧縮を実現する。例えば、文字画像を圧縮するための第1の圧縮手段704としては、2値画像しか扱えないが劣化しない(可逆である)MMR圧縮を用いる。また、自然画像を圧縮するための第2の圧縮手段705としては、画像の高周波成分は失われるが、階調性のある画像に適したJPEG圧縮を用いる。最後に画像結合手段706は、圧縮された文字画像と圧縮された自然画像を結合する。
High-quality and high-compression can be achieved by compressing the divided character images and natural images using methods suitable for each. For example, as the
以上述べたように劣化しているコピー画像を像域識別せずに、埋め込まれた像域情報を用いて画像処理することで高画質で高圧縮な画像ファイルを得ることが可能となる。 As described above, it is possible to obtain a high-quality and highly-compressed image file by performing image processing using the embedded image area information without identifying an image area of a copy image that has deteriorated.
[第2の実施の形態]
図8は、第2の実施の形態の画像形成装置の構成を示すブロック図である。図9は、第2の実施の形態の画像形成装置の概略の動作を示すフローチャートである。
以下、図8及び図9を参照しつつ画像形成装置の構成と動作を説明する。
[Second Embodiment]
FIG. 8 is a block diagram illustrating a configuration of the image forming apparatus according to the second embodiment. FIG. 9 is a flowchart illustrating a schematic operation of the image forming apparatus according to the second embodiment.
The configuration and operation of the image forming apparatus will be described below with reference to FIGS.
画像形成装置は、文書データ入力手段801、文書画像形成手段802、像域情報入力手段803、透かし画像形成手段804、透かし文書合成手段805を備えている。 The image forming apparatus includes document data input means 801, document image formation means 802, image area information input means 803, watermark image formation means 804, and watermark document composition means 805.
動作901において、文書データ入力手段901は、文書データを入力する。ここで入力される文書データはPC上のアプリケーションファイル、アプリケーションより出力されるGDI、プリンタドライバから出力されるPDL(ページ記述言語)などである。
In
動作902において、文書画像形成手段802は、入力された文書データからGDI・PDL・ラスタデータ等の画像データを形成する。文書画像形成手段802はPC上のアプリケーションやプリンタドライバ、RIP(ラスタイメージプロセッサ)などである。
In
図10は、文書画像形成手段802がRIPである場合の入力される文書データと出力する文書画像データを示す図である。入力される文書データは主にプリンタドライバが作成したPDLであり、図10(1)の文書データ1001が具体例である。この文書データ1001は、文字像域データ1002,1003と自然画像像域データ1004とを含んでいる。
FIG. 10 is a diagram showing input document data and output document image data when the document
RIPである文書画像形成手段802は、文書画像データとしてラスタ画像を出力する。図10(2)に示すラスタ画像1005がその具体例である。ラスタ画像1005中の文字画像データ1006,1007は、それぞれ入力PDLの文字像域データ1002, 1003から形成される文字の文書画像であり、PDLに記述されているフォント名・フォントサイズ・文字の表示位置・文字色・文字列サイズ・文字列データ(文字コード)などの情報に従いビットマップ画像を形成する。
A document
また、ラスタ画像1005中の自然画像データ1008は入力PDLの自然画像データ1004から形成される自然画像の文書画像であり、画象の大きさ・位置・色情報・ビット数・圧縮方式・画像データ(ビットマップデータ)などの情報に従いビットマップ画像を形成する。通常、このように形成されたラスタ画像はプリントエンジンを介して紙へと出力される。
The
図8に示す像域情報入力手段803、透かし画像形成手段804、透かし文書合成手段805は、図1に示す第1の実施の形態に対応する各手段と同様に処理する。すなわち、動作903において、像域情報入力手段803は、文書データを元にユーザによって作成された像域情報を入力し、動作904において、透かし画像形成手段804は、像域情報を埋め込んだ透かし画像を形成する。動作905において、透かし文書合成手段805は、透かし情報が埋め込まれた合成画像を形成する。
The image area
図5、図7で説明した画像処理装置を用いれば、本第2の実施の形態の画像形成装置でプリント出力した文書画像を何世代コピーしても高画質な画像及び高画質・高圧縮な電子ファイルを得ることが可能となる。 If the image processing apparatus described with reference to FIGS. 5 and 7 is used, a high-quality image and high-quality / high-compression can be obtained regardless of how many generations of document images printed by the image forming apparatus according to the second embodiment are copied. An electronic file can be obtained.
[第3の実施の形態]
図11は、第3の実施の形態の画像形成装置の構成を示すブロック図である。画像形成装置は、文書画像入力手段1101、画像識別手段1102、透かし画像形成手段1103、透かし文書合成手段1104を備えている。
[Third embodiment]
FIG. 11 is a block diagram illustrating a configuration of an image forming apparatus according to the third embodiment. The image forming apparatus includes document image input means 1101, image identification means 1102, watermark image formation means 1103, and watermark document composition means 1104.
第3の実施の形態は画像識別手段1102を有している点で第1の実施の形態と異なっている。即ち、第3の実施の形態では像域情報はユーザが作成するのではなく、入力される文書画像の像域を自動的に識別して像域情報を抽出する点で第1の実施の形態と異なっている。
The third embodiment is different from the first embodiment in that it includes an
図12は、第3の実施の形態の画像識別手段1102により得られる像域情報を示す図である。図12(1)は入力される文書画像1201を示している。図12(2)は、画像識別手段1102により得られた像域情報1205である。文書画像1201から文字画像・自然画像等の像域を識別する手段には既に公知の技術があり、画像識別手段1102としては、例えば、特開2005−39430号公報に提案されている技術を用いることができる。
FIG. 12 is a diagram illustrating image area information obtained by the
本第3の実施の形態では、画質が劣化していないオリジナル原稿(文書画像)に対して画像識別処理をした結果を用いて画像を合成している。そのため、常に高精度な像域識別結果を使用することが可能である。このことにより、何世代コピーしても高精度な像域識別結果を得ることが可能である。また、高画質・高圧縮な電子ファイルを得ることも可能となる。 In the third embodiment, an image is synthesized using the result of image identification processing performed on an original document (document image) whose image quality has not deteriorated. Therefore, it is possible to always use a highly accurate image area identification result. This makes it possible to obtain a highly accurate image area identification result regardless of how many generations are copied. Also, it is possible to obtain an electronic file with high image quality and high compression.
[第4の実施の形態]
図13は、第4の実施の形態の画像形成装置の構成を示すブロック図である。
画像形成装置は、文書データ入力手段1301、文書画像形成手段1302、像域情報抽出手段1303、透かし画像形成手段1304、透かし文書合成手段1305を備えている。
[Fourth embodiment]
FIG. 13 is a block diagram illustrating a configuration of an image forming apparatus according to the fourth embodiment.
The image forming apparatus includes document data input means 1301, document image formation means 1302, image area information extraction means 1303, watermark image formation means 1304, and watermark document composition means 1305.
第4の実施の形態は像域情報抽出手段1303を有している点で第2の実施の形態と異なっている。即ち、第4の実施の形態では像域情報はユーザが作成するのではなく、入力される文書データの像域を自動的に識別して像域情報を抽出する点で第2の実施の形態と異なっている。
The fourth embodiment is different from the second embodiment in that an image area
像域情報抽出手段1303は、入力される文書データから特定の像域情報を抽出する。像域情報抽出手段1303は、アプリケーション内やプリンタドライバ内、RIP内で実現される。
図14は、像域情報抽出手段1303がRIP内で実装される場合の具体的な抽出方法と抽出情報の例を示す図である。図14(1)は、入力される文書データ1401を示している。文書データ1401はPDLである。文書データ1401には、文字列1402、文字列1403、文字列1404の3行の文字列と自然画像1405を含んでいる。
The image area
FIG. 14 is a diagram illustrating an example of a specific extraction method and extraction information when the image area
像域抽出手段1303は、PDLから像域の属性・座標・文字色などを抽出する。図14(2)は抽出された像域情報1406を示している。
具体的には、像域抽出手段1303は、文書データ1401中の文字列データ1402から、第1像域の像域情報1407を抽出すると共に、第1像域の属性を文字と特定している。また、像域抽出手段1303は、文字列データ1402の位置情報と文字列サイズ情報から、第1像域の左下座標(x1,y1)と右上座標(x2,y2)の組が(20, 70)−(80,90)であることも特定している。更に像域抽出手段1303は、文字列データ1402中の文字色情報から第1像域の文字色も抽出する。
An image
Specifically, the image
同様の処理を文字列1403、1404と自然画像1405に対しても繰り返すことで像域情報1406が生成される。
尚、本実施の形態で抽出した像域情報は像域の属性・座標・文字色であるが、これに限定するものではなく、文書データに記述されている情報、および、その情報に処理を加えることで得られる情報であれば抽出可能である。
Similar processing is repeated for the
Note that the image area information extracted in the present embodiment includes image area attributes, coordinates, and character colors. However, the present invention is not limited to this, and the information described in the document data and the information are processed. Any information obtained by adding can be extracted.
第4の実施の形態では、文書データを用いて正確な像域情報を抽出する。従って、画像識別処理を用いることによる誤識別を回避することができる。この結果、何世代コピーしても高精度な像域識別結果を得ることが可能である。また、高画質・高圧縮な電子ファイルを得ることも可能となる。 In the fourth embodiment, accurate image area information is extracted using document data. Accordingly, erroneous identification due to the use of the image identification processing can be avoided. As a result, it is possible to obtain a highly accurate image area identification result regardless of how many generations are copied. Also, it is possible to obtain an electronic file with high image quality and high compression.
[第5の実施の形態]
図15は、第5の実施の形態の画像形成装置の構成を示すブロック図である。画像形成装置は、文書画像入力手段1501、画像識別手段1502、像域情報編集手段1503、透かし画像形成手段1504、透かし文書合成手段1505を備えている。
[Fifth embodiment]
FIG. 15 is a block diagram illustrating a configuration of an image forming apparatus according to the fifth embodiment. The image forming apparatus includes a document
第5の実施の形態では、像域情報編集手段1503を有している点で、第3の実施の形態と異なっている。像域情報を組み込んで形成される画像から高機能な電子データを得る際、文字画像・写真画像の情報だけではなく更に詳細な情報が必要とされる場合がある。例えば、文字領域を識別すると共に、「タイトル」という属性まで識別できれば、タイトルの領域にOCR処理をし、その結果からファイル名を付けるといった高度な処理が可能となる。
The fifth embodiment is different from the third embodiment in that an image area
しかし、このような詳細な情報を得ようとした場合、画像識別手段1502には非常に高度な技術が要求される。このため、詳細情報を出力できなかったり、あるいは、誤識別を発生させてしまう場合がある。
また、透かし等を用いて埋め込める情報量には制限がある。そのため、優先順位を付けずに、例えば、像域情報抽出手段1303(図13)により抽出された順番で情報を埋め込んでいくと、その文書を顕著に表す重要な像域情報を埋め込めない可能性がある。
However, in order to obtain such detailed information, the image identification means 1502 requires a very advanced technique. For this reason, detailed information may not be output or erroneous identification may occur.
In addition, there is a limit to the amount of information that can be embedded using a watermark or the like. Therefore, for example, if information is embedded in the order extracted by the image area information extraction unit 1303 (FIG. 13) without assigning priorities, there is a possibility that important image area information notably representing the document cannot be embedded. There is.
図16は、像域情報編集手段1503の機能を説明する図である。図16(1)は、入力された文書画像1601である。図16(2)は、画像識別手段1502により出力された像域情報1606を示している。図16(3)は、ユーザにより必要な情報が付与されたり、あるいは別の情報に書き換えられたり、優先順位を付けられたりして編集された像域情報1618を示している。なお、本実施の形態では、像域情報1606は優先順位の高い順番に記述されるものとする。
FIG. 16 is a diagram for explaining the function of the image area
画像識別手段1502により出力された像域情報1606は単純に文書を上→下、左→右の順番で走査した順に記述されている。まず、像域情報付与の例を説明する。一般に画像識別処理において像域が重なっている場合には誤識別を起こしやすい。そこで、文書画像1601にある自然画像1605の中の文字“MFP”は誤識別による抽出漏れで抽出出来なかったとする。この場合、ユーザが像域情報1618を編集し、文字列“MFP”を第5像域としてその属性情報1625と位置情報1626を付加する。
The
次に、像域情報削除の例を示す。本実施の形態の画像形成装置により形成した画像を再利用する際に、特に文字色の記述がない場合は黒文字であるという規則が既にある場合、“黒文字”という情報は不要である。そのため、像域情報1606の第1像域、第3像域の文字色情報(1609,1615)は像域情報1618から削除されている。
Next, an example of image area information deletion will be shown. When reusing an image formed by the image forming apparatus according to the present embodiment, if there is already a rule that the character is black unless there is a description of the character color, the information “black character” is unnecessary. Therefore, the character color information (1609, 1615) of the first image area and the third image area of the
続いて情報書き換えの例を示す。像域情報1606においてはどのような文字像域もその属性は単なる“文字”としか抽出されていない。それに対し編集後の像域情報1618では“タイトル”、“本文”と更に詳細な分類(1619,1621,1623)がされている。
Next, an example of information rewriting is shown. In the
最後に優先順位の書き換えの例を示す。本実施の形態では、自然画像像域より文字画像像域を優先し、更に文字色情報の優先度を最も低くしている。その結果、像域情報1618では自然画像像域情報1627,1628の優先順位が低く、第2像域の文字色1629が最も優先順位が低くなっている。
Finally, an example of rewriting priority is shown. In the present embodiment, the character image area is prioritized over the natural image area, and the priority of the character color information is the lowest. As a result, in the
像域情報編集手段1503は、予め決められた優先度の順に情報を選択し、透かし画像形成手段1504が、限界の情報量までの情報を埋め込んだ透かし画像を作成する。例えば、4個分の像域情報しか埋めこめられない場合には、第1像域の属性情報(1619)、位置情報(1620)、第2像域の属性情報(1621)、位置情報(1622)の4つの像域情報のみを埋め込んだ透かし画像を作成する。
The image area
なお、像域情報編集手段1503は、ユーザとの間で、例えば、コントロールパネルを介して情報授受を行って、像域情報を編集する。図17は、像域情報の編集の一例を示す図である。ユーザが文書画像1701中の領域(1702、1703、1704)のいずれかを指定して、属性の編集を行うことを入力すると、プルダウンメニュー1705が表示される。そこで、ユーザはこのプルダウンメニューから、タイトル、本文、文字、自然画像などを選択するとその選択された情報が像域情報1618に反映される。
The image area
第5の実施の形態では、重要な像域情報の優先度を高くしているため精度の高い像域情報を使用することが可能となる。このことにより、何世代コピーしても高精度な像域識別結果を得ることが可能である。また、高画質・高圧縮な電子ファイルを得ることも可能となる。 In the fifth embodiment, since the priority of important image area information is increased, it is possible to use highly accurate image area information. This makes it possible to obtain a highly accurate image area identification result regardless of how many generations are copied. Also, it is possible to obtain an electronic file with high image quality and high compression.
[第6の実施の形態]
図18は、第6の実施の形態の画像形成装置の構成を示すブロック図である。
画像形成装置は、文書データ入力手段1801、文書画像形成手段1802、像域情報抽出手段1803、像域情報編集手段1804、透かし画像形成手段1805、透かし文書合成手段1806を備えている。
[Sixth embodiment]
FIG. 18 is a block diagram illustrating a configuration of an image forming apparatus according to the sixth embodiment.
The image forming apparatus includes document data input means 1801, document
第6の実施の形態は像域情報編集手段1804を有している点で第4の実施の形態と異なっている。
The sixth embodiment is different from the fourth embodiment in that an image area
入力される文書データには画像を形成するためのデータのみを含んでいる場合が多い。そのため、後で高機能な電子データを得ようとしたときには別の情報が必要となる場合がある。
また、透かし等を用いて像域情報を埋め込む際、埋め込める情報量には制限がある。そのため、優先順位を付けずに、例えば、像域情報抽出手段1803により抽出された順番に像域情報を埋め込んでいくと、その文書を顕著に表す重要な像域情報を埋め込めない可能性がある。
In many cases, the input document data includes only data for forming an image. For this reason, when trying to obtain highly functional electronic data later, other information may be required.
Further, when embedding image area information using a watermark or the like, there is a limit to the amount of information that can be embedded. Therefore, for example, if image area information is embedded in the order extracted by the image area
図19は、像域情報編集手段1804の機能を説明する図である。図19(1)は、入力された文書データ1901を示している。図19(2)は、像域情報抽出手段1803により出力された像域情報1906を示している。図19(3)は、ユーザにより必要な情報が付与されたり、あるいは別の情報に書き換えられたり、優先順位を付けられたりして編集された像域情報1918を示している。なお、本実施の形態では、像域情報1906は優先順位の高い順番に記述されるものとする。
FIG. 19 is a diagram illustrating the function of the image area
第6の実施の形態の像域情報編集手段1804は、第5の実施の形態の像域情報編集手段1503と同様に動作する。従って、その詳細の説明は省略する。
第6の実施の形態では、重要な像域情報の優先度を高くしているため精度の高い像域情報を使用することが可能となる。このことにより、何世代コピーしても高精度な像域識別結果を得ることが可能である。また、高画質・高圧縮な電子ファイルを得ることも可能となる。
The image area
In the sixth embodiment, since the priority of important image area information is increased, it is possible to use highly accurate image area information. This makes it possible to obtain a highly accurate image area identification result regardless of how many generations are copied. Also, it is possible to obtain an electronic file with high image quality and high compression.
[第7の実施の形態]
図20は、第7の実施の形態の画像形成装置の構成を示すブロック図である。
画像形成装置は、文書データ入力手段2001、文書画像形成手段2002、像域情報抽出手段2003、像域情報編集手段2004、透かし画像形成手段2005、透かし文書合成手段2006を備えている。
[Seventh embodiment]
FIG. 20 is a block diagram illustrating a configuration of an image forming apparatus according to the seventh embodiment.
The image forming apparatus includes a document
第7の実施の形態と第6の実施の形態とでは像域情報編集手段2004(1804)の機能が異なっている。第6の実施の形態の像域情報編集手段1804は、ユーザが直接指定した優先順位に基づいて編集するのに対し、第7の実施の形態の像域情報編集手段2004は、事前に決めた規則に則って自動的に指定される優先順位に基づいて編集する。
The functions of the image area information editing unit 2004 (1804) are different between the seventh embodiment and the sixth embodiment. The image area
図21は、像域情報編集手段2004の機能を説明する図である。図21(1)は、入力された文書データ2101である。図21(2)は、像域情報抽出手段2003により出力された像域情報2106を示している。図21(3)は、事前に決めた規則に則って自動的に指定される優先順位に基づいて編集された像域情報2118を示している。
FIG. 21 is a diagram for explaining the function of the image area
続いて、像域情報編集手段2004の動作について説明する。
像域情報編集手段2004は予め決められた規則に則って、例えば、像域識別する際に誤識別が起こりやすい順に、像域情報の優先順位をつける。
一般的に複数のオブジェクトに重なりがある場合、像域識別は非常に難しい。図21(1)の文書データ2101の例では、像域2102と像域2105との像域識別は難しい。そこで、重なりのある像域情報の優先順位を高くする。
Next, the operation of the image area
The image area
In general, when there are overlapping objects, it is very difficult to identify the image area. In the example of the
図21(2)の像域情報2106によれば、それぞれの像域の左下座標(x1,y1)及び右上座標(x2,y2)の座標値は判明している。そこで、領域A及び領域Bの座標を調べて下記条件が成立する場合、領域A及び領域Bには重なり有りと判断し、優先順位を高くする。
According to the
条件: (yA1<yB1<yA2 または yA1<yB2<yA2) かつ
(xA1<xB1<xA2 または xA1<xB2<xA2)
但し、領域Aの左下座標−右上座標の組を(xA1,yA1)−(xA2,yA2)、
領域Bの左下座標−右上座標の組を(xB1,yB1)−(xB2,yB2)とする。
Condition: (yA1 <yB1 <yA2 or yA1 <yB2 <yA2) and
(XA1 <xB1 <xA2 or xA1 <xB2 <xA2)
However, the set of the lower left coordinate-upper right coordinate of the region A is (xA1, yA1)-(xA2, yA2),
A set of the lower left coordinate and the upper right coordinate of the region B is defined as (xB1, yB1)-(xB2, yB2).
また、フォントサイズが小さな文字領域も像域識別が難しい。そこで、像域情報としてフォントサイズが抽出されている場合には、そのフォントサイズがある閾値より小さい場合に優先順位を上げる。図21(2)の像域情報2106に示したように、像域情報にフォントサイズが直接記述されていない場合でも、例えば、像域属性が文字であって、その像域の幅・高さいずれかが閾値より小さい場合、即ち像域座標の関係が下式に当てはまる場合は、小文字領域と判断し優先順位を上げる。
In addition, it is difficult to identify an image area even in a character area having a small font size. Therefore, when the font size is extracted as the image area information, the priority is increased when the font size is smaller than a certain threshold value. As shown in the
x2−x1 < th または y2−y1 < th
なお、thはある閾値を表す。
x2-x1 <th or y2-y1 <th
Note that th represents a certain threshold value.
また、ここでは優先順位を付け替える場合について具体例を挙げて説明した。しかし、第7の実施の形態では、優先順位の付け替えのみに限定されない。第3の実施の形態と同様に、例えばある閾値よりサイズが大きな文字像域の属性はロゴに置き換える、ある閾値よりサイズが小さな自然画像の属性情報は削除するなどの規則に則り、像域情報の付与・置き換え・削除等の編集が可能である。 Further, here, the case of changing the priority order has been described with a specific example. However, the seventh embodiment is not limited to only changing the priority order. Similar to the third embodiment, the image area information conforms to the rules such as replacing the attribute of a character image area having a size larger than a certain threshold value with a logo or deleting the attribute information of a natural image having a size smaller than a certain threshold value. Editing such as assigning, replacing, and deleting is possible.
透かし画像形成手段2005は、像域情報編集手段2004で決めた優先度の順に情報を選択して限界の情報量までの情報を埋め込んだ透かし画像を作成する。
The watermark
第7の実施の形態では、重要な像域情報の優先度を高くしているため精度の高い像域情報を使用することが可能となる。このことにより、何世代コピーしても高精度な像域識別結果を得ることが可能である。また、高画質・高圧縮な電子ファイルを得ることも可能となる。 In the seventh embodiment, since the priority of important image area information is increased, it is possible to use highly accurate image area information. This makes it possible to obtain a highly accurate image area identification result regardless of how many generations are copied. Also, it is possible to obtain an electronic file with high image quality and high compression.
以上説明した各実施の形態によれば、コピー出力、あるいはプリント出力を再度コピー出力する際に従来の手法と比べて高画質なコピー出力を得ることができる。あるいは、プリント出力、コピー出力をスキャン入力して再電子ファイル化する際に高機能な電子ファイルを得ることができる。 According to each embodiment described above, it is possible to obtain a high-quality copy output as compared with the conventional method when copy output or print output is copied again. Alternatively, a highly functional electronic file can be obtained when a print output and a copy output are scanned and converted into an electronic file.
続いて、上述の画像形成装置で形成された画像から透かし情報を抽出する画像処理装置について説明する。 Next, an image processing apparatus that extracts watermark information from an image formed by the above-described image forming apparatus will be described.
[第1の実施の形態]
図22は、第1の実施の形態の画像処理装置の構成を示すブロック図である。図23は、第1の実施の形態の画像処理装置の概略の動作を示すフローチャートである。
以下、図1及び図2を参照しつつ画像処理装置の構成と動作を説明する。
[First embodiment]
FIG. 22 is a block diagram illustrating a configuration of the image processing apparatus according to the first embodiment. FIG. 23 is a flowchart illustrating a schematic operation of the image processing apparatus according to the first embodiment.
Hereinafter, the configuration and operation of the image processing apparatus will be described with reference to FIGS. 1 and 2.
画像処理装置は、文書画像入力手段2201、透かし情報抽出手段2202、画像識別手段2203を備えている。
The image processing apparatus includes a document
動作2301において、文書画像入力手段2201は文書画像を入力する。ここで文書画像入力手段2201は、MFPや複写機に搭載されているスキャナ等である。入力される文書画像は画像形成装置を用いて像域情報を透かし画像として合成した文書画像を紙などに出力したものである。
In
像域情報を透かし画像として合成する上述の画像形成装置の例を、以下に簡単に説明する。
図24は、画像形成装置の構成を示すブロック図である。
画像形成装置は、文書画像入力手段2401、像域情報入力手段2402、透かし画像形成手段2403、透かし文書合成手段2404を備えている。
An example of the above-described image forming apparatus that synthesizes image area information as a watermark image will be briefly described below.
FIG. 24 is a block diagram illustrating a configuration of the image forming apparatus.
The image forming apparatus includes a document
文書画像入力手段2401は、文書画像を入力する。ここで文書画像入力手段2401は、例えば、MFPや複写機に搭載されているスキャナであり、入力される文書画像は紙原稿である。像域情報入力手段2402は入力される文書画像を元に予め作成されている像域情報を入力する。
The document
図25は、入力される文書画像及び像域情報の内容を示す図である。図25(1)の文書画像2501は、タイトル2502,本文2503及び自然画像2504の像域を含んでいる。この文書画像2501から像域情報を抽出するために、例えば、図25(2)の文書画像2505に示したように、ユーザが画面を見ながらマウス等で各像域(2506,2507,2508)を矩形で囲み、キーボード等から各属性を指定する。
FIG. 25 is a diagram showing the contents of the input document image and image area information. A
このようにユーザに指定された各像域の矩形座標位置と属性とから、図25(3)に示す像域情報2509が作成され、像域情報入力手段2402に入力される。像域情報としては、属性(タイトル/本文/自然画像)とその座標位置(2510、2511、2512)である。
なお、本実施例では像域情報として座標位置と、タイトル/本文/自然画像の属性を入力しているが、例えば文字属性の像域であれば文字色や文字コード、自然画像であれば風景画像/人物画像などの情報も像域情報として入力することが可能である。
Thus,
In this embodiment, the coordinate position and the title / text / natural image attributes are input as the image area information. For example, if the image area has a character attribute, the character color or character code is used. Information such as images / person images can also be input as image area information.
透かし画像形成手段2403は、像域情報入力手段2402により抽出された像域情報を埋め込んだ透かし画像を形成する。更に、透かし文書合成手段2404は、文書画像入力手段2401から出力された文書画像と、透かし画像形成手段2403から出力された透かし画像を合成し、透かし情報が埋め込まれた画像を形成する。
The watermark
透かし画像の形成及び透かし情報が埋め込まれた画像の形成に関しては、既に様々な手法が開示されている。例えば特開2003−101762号公報に記載の技術では、文書の背景に所定の方法で黒画素を埋め込むことで文書に情報を埋め込む。 Various methods have already been disclosed for the formation of watermark images and images with embedded watermark information. For example, in the technique described in Japanese Patent Application Laid-Open No. 2003-101762, information is embedded in a document by embedding black pixels in a predetermined method in the background of the document.
図26は、特開2003−101762号公報に記載の技術を用いた画像形成方法を説明する図である。
文書画像入力手段2401から出力された文書画像2601に対し、像域情報入力手段2402から出力された像域情報を透かし画像形成手段2403により透かし画像2602に変換し、文書画像2601と透かし画像2602を透かし文書合成手段2404により合成して透かし情報が埋め込まれた文書2603を得る。
FIG. 26 is a diagram illustrating an image forming method using the technique described in Japanese Patent Laid-Open No. 2003-101762.
For the
図23に戻り、動作2302において透かし情報抽出手段2202(図22)が入力された文書画像から透かし画像として埋め込まれている像域情報を抽出する。なお、透かし情報を抽出するための技術としては、例えば、特開2003−101762号公報に記載の技術等を用いることができる。
Returning to FIG. 23, in
図27は、入力された文書画像に埋め込まれた透かし画像から抽出した像域情報を示す図である。図27(1)は入力された文書画像2701を示している。この文書画像2701は、図24に示す画像形成装置に図25(1)の文書画像2501を入力し、図25(3)の像域情報2509を埋め込んだ透かし画像を合成して形成したものとする。
FIG. 27 is a diagram showing image area information extracted from a watermark image embedded in an input document image. FIG. 27A shows the
透かし情報抽出手段2202により抽出された、文書画像に埋め込まれた像域情報が図27(2)の像域情報2705である。この像域情報2705は、画像形成装置により埋め込まれていた図25(3)の像域情報2509であり、そのまま抽出できる。
Image area information embedded in the document image extracted by the watermark
動作2303においてYesの場合、すなわち入力文書画像に像域情報が透かし画像で埋め込まれていた場合には、動作2304において、透かし情報抽出手段2202により抽出された像域情報2705を本実施の形態の画像処理装置の出力とする。
If Yes in
一方、動作2303においてNoの場合、すなわち入力文書画像に透かし画像が埋め込まれていなかったために、透かし情報抽出手段202が像域情報を抽出できなかった場合には、動作2305において、画像識別手段2203により入力文書画像の像域識別を行い、その像域情報を本実施の形態の画像処理装置の出力とする。なお、画像識別手段としては、例えば、特開2003−87562号公報に記載の技術を用いる。
On the other hand, if No in
図28は、画像識別手段2203により得られた像域情報を示す図である。図28(1)は、入力文書画像2801を示している。画像識別手段2203は、入力画像中の文字領域・自然画像領域を識別し、それぞれの領域の属性・座標位置を図28(2)に示す像域情報2805として出力する。
FIG. 28 is a diagram showing image area information obtained by the
第1の実施の形態の画像処理装置によれば、透かし画像が埋め込まれていない画像に対しては従来と同精度の像域情報を得ることが出来、既に像域情報が透かし画像で埋め込まれた文書画像に対しては、画像識別を行わずに像域情報を得ることが可能である。従って、高精度な識別情報を得ることができる。 According to the image processing apparatus of the first embodiment, it is possible to obtain image area information with the same accuracy as the conventional image with respect to an image in which the watermark image is not embedded, and the image area information is already embedded with the watermark image. It is possible to obtain image area information for a document image without performing image identification. Therefore, highly accurate identification information can be obtained.
次に、第1の実施の形態の画像処理装置を用いて得られる像域情報の利用方法として、高画質な世代コピーを得る装置の構成と動作を図29を参照しつつ説明する。
上述の画像形成装置を用いて像域情報が透かし画像として埋め込まれた文書画像を紙に出力する。文書画像入力手段2901が紙に出力された文書画像を入力する。ここで文書画像入力手段2901はMFPや複写機のスキャナ等である。
Next, as a method for using the image area information obtained by using the image processing apparatus according to the first embodiment, the configuration and operation of an apparatus for obtaining a high-quality generation copy will be described with reference to FIG.
A document image in which image area information is embedded as a watermark image is output to paper using the image forming apparatus described above. A document
次に、第1の実施の形態の画像処理装置2902を用いて埋め込まれた像域情報を抽出する。続いて画像処理手段2903が、入力された文書画像に対して、抽出された像域情報を用いて像域ごとに適した画像処理を施す。
Next, the embedded image area information is extracted using the
図30は、画像処理手段2903により施される画像処理例を示す図である。画像処理の例としては、フィルタ処理や階調処理がある。例えば、自然画像に対しては画像出力時の網点との干渉によるモアレを防ぐために入力画像の網点を潰すためのぼかしフィルタ処理を施す。文字画像に対しては文字のエッジを強調するためにエッジ強調フィルタを施す。また、階調処理においても、自然画像は解像性よりも階調性を重視するため低線数の階調処理を施し、文字画像は解像性を重視するために高線数の階調処理を施す。
FIG. 30 is a diagram illustrating an example of image processing performed by the
画像処理手段2903による画像処理の後、画像出力手段2904が画像を出力する。画像出力手段2904としては、MFPや複写機のプリント部がある。
After the image processing by the
以上述べた通り、劣化しているコピー画像に対して像域識別するのではなく、透かしとして埋め込まれた情報から像域情報を得ることで、正確な像域識別結果を使用することが出来る。また、第1の実施の形態の画像処理装置から得られた像域情報を、再度、図24に示す画像形成装置に入力し直すことで、何世代コピーしても高精度な像域識別結果を得ることが可能となる。 As described above, an accurate image area identification result can be used by obtaining image area information from information embedded as a watermark instead of identifying an image area for a deteriorated copy image. Further, the image area information obtained from the image processing apparatus according to the first embodiment is input again to the image forming apparatus shown in FIG. Can be obtained.
更に、第1の実施の形態の画像処理装置を用いて得られた像域情報の他の利用方法として、高圧縮な電子ファイルを得る装置の構成と動作を図31を参照しつつ説明する。
文書画像入力手段3101が像域情報が埋め込まれた文書画像を入力し、第1の実施の形態の画像処理装置3102が埋め込まれた像域情報を抽出する。次に画像分割手段3103が抽出された像域情報を用いて入力された文書画像を文字画像と自然画像に分割する。
Furthermore, as another method of using the image area information obtained by using the image processing apparatus of the first embodiment, the configuration and operation of an apparatus for obtaining a highly compressed electronic file will be described with reference to FIG.
The document
分割された文字画像と自然画像をそれぞれに適した方法で画像圧縮することで、高画質・高圧縮を実現する。例えば、文字画像を圧縮するための第1の圧縮手段3104は、2値画像しか扱えないが劣化しない(可逆である)MMR圧縮を用いる。また、自然画像を圧縮するための第2の圧縮手段3105は、画像の高周波成分は失われるが、階調性のある画像に適したJPEG圧縮を用いる。
High-quality and high-compression can be achieved by compressing the divided character images and natural images using methods suitable for each. For example, the first compression means 3104 for compressing a character image uses MMR compression that can handle only a binary image but does not deteriorate (reversible). Further, the
最後に画像結合手段3106が、前記圧縮文字画像と前記圧縮自然画像を結合する。
Finally, an
以上述べたように像域識別を行わず、埋め込まれた像域情報を用いると高精度な像域情報を得られるため高画質で高圧縮な画像ファイルを得ることが可能となる。 As described above, if the embedded image area information is used without performing image area identification, high-accuracy image area information can be obtained, so that an image file with high image quality and high compression can be obtained.
[第2の実施の形態]
図32は、第2の実施の形態の画像処理装置の構成を示すブロック図である。画像処理装置は、文書画像入力手段3201、透かし情報抽出手段3202、画像識別手段3203、像域情報合成手段3204を備えている。
[Second Embodiment]
FIG. 32 is a block diagram illustrating a configuration of an image processing apparatus according to the second embodiment. The image processing apparatus includes document image input means 3201, watermark information extraction means 3202, image identification means 3203, and image area information synthesis means 3204.
第2の実施の形態の画像処理装置は、入力文書画像の透かし情報の有無に関わらず画像識別を行うことと、像域情報合成手段3204を有する点で第1の実施の形態と異なっている。
一般に透かし画像に埋め込むことのできる情報量には限りがあり、必要な像域情報が全て透かし画像に埋め込まれていない場合もある。そこで、第2の実施の形態の画像処理装置は透かし画像の有無に関わらず画像識別を行い、透かし画像から得られた第1の像域情報と画像識別により生成した第2の像域情報を、像域情報合成手段3204により合成し出力する。
The image processing apparatus according to the second embodiment is different from the first embodiment in that image identification is performed regardless of the presence / absence of watermark information of an input document image and that image area information synthesizing means 3204 is provided. .
In general, the amount of information that can be embedded in a watermark image is limited, and all necessary image area information may not be embedded in the watermark image. Therefore, the image processing apparatus according to the second embodiment performs image identification regardless of the presence or absence of the watermark image, and uses the first image area information obtained from the watermark image and the second image area information generated by the image identification. The image area information synthesizing means 3204 synthesizes and outputs.
第2の実施の形態の画像処理装置をどのような目的に使用するかによって、像域情報合成手段3204による最適な合成方法が異なる。
例えば、全文検索用のOCR処理の前処理として第2の実施の形態の画像処理装置を使用する場合では、文字領域を過抽出することよりも、文字領域の抽出漏れを発生させることが不具合としての度合が大きいと考えられる。そこで、像域情報合成手段3204は、第1の像域情報と第2の像域情報に含まれる全ての領域を出力するように動作する。
The optimum combining method by the image area
For example, in the case where the image processing apparatus according to the second embodiment is used as pre-processing for OCR processing for full-text search, it is a problem that omission of character area extraction occurs rather than overextraction of character areas. The degree of is thought to be large. Therefore, the image area
また、高圧縮な電子ファイルを作成するために第2の実施の形態の画像処理装置を使用する場合、文字領域には2値化処理を行うので、自然画像を“文字領域”と誤って識別すると、文字抽出漏れよりも画質不具合による影響が大きくなる。そのため、像域情報合成手段3204は、信頼度の低い領域情報は破棄するように動作する。
In addition, when the image processing apparatus according to the second embodiment is used to create a highly compressed electronic file, since the binarization process is performed on the character area, the natural image is erroneously identified as the “character area”. As a result, the influence of the image quality defect becomes larger than the character extraction omission. Therefore, the image area
更に、文字画像を優先したコピア用の識別信号生成に第2の実施の形態の画像処理装置を使用する際には、まず領域毎に文字用の画像処理/自然画像用の画像処理とを切り替える必要がある。そのため領域に重複が許されず、かつ、自然画像領域を文字画像と間違うことよりも文字領域を自然画像領域と間違うことの方が画質不具合の度合が大きい。従って、像域情報合成手段3204は、領域に重複があり、かつ、その属性が異なった場合には文字属性の領域を優先するように動作する。
Further, when the image processing apparatus according to the second embodiment is used for generating a copier identification signal giving priority to a character image, first, switching between character image processing and natural image image processing is performed for each region. There is a need. For this reason, overlapping of areas is not permitted, and the degree of image quality defects is greater when a character area is mistaken for a natural image area than when a natural image area is mistaken for a character image. Accordingly, the image area
図33は、第2の実施の形態の画像処理装置をOCR前処理として使用する際の像域情報合成手段3204の動作例を示す図である。図33(1)は、入力文書画像3301を示している。図33(2)は、透かし画像から抽出された第1の像域情報3305を示している。図33(3)は、画像識別手段3303により生成された第2の像域情報3308を示している。図33(4)は、第1の像域情報3305と第2の像域情報3308を合成して生成された第3の像域情報3311を示している。
FIG. 33 is a diagram illustrating an operation example of the image area
図33に示した例では、像域情報合成手段3204は、第1の像域情報3305と第2の像域情報3308を単純に合成している。すなわち、第1の像域情報3305中の第1領域3306と第2領域3307が第3の像域情報3311の第1領域3312、第2領域3313となり、第2の像域情報3308中の第1領域3309と第2領域3310が第3の像域情報3311の第3領域3314、第4領域3315となっている。
In the example shown in FIG. 33, the image area
図34は、第2の実施の形態の画像処理装置を高圧縮ファイル作成のために使用する際の像域情報合成手段3204の動作例を示す図である。図34(1)は、入力文書画像3401を示している。図34(2)は、透かし画像から抽出された第1の像域情報3405を示している。図34(3)は、画像識別手段3203により生成された第2の像域情報3408を示している。図34(4)は、第1の像域情報3405と第2の像域情報3408を合成して生成された第3の像域情報3411を示している。
FIG. 34 is a diagram illustrating an operation example of the image area
図34に示した例では、第1の像域情報3405中の領域と第2の像域情報3408中の領域で座標位置に重なりがある場合は第1の像域情報3405中の領域を採用し、第2の像域情報3408中の領域を破棄している。例えば、第1の像域情報3405中の第1領域3406と第2像域情報3408中の第1領域3409に重なりがある。従って、第2像域情報3408中の第1領域3409を破棄して合成した第3の像域情報3411が出力される。
In the example shown in FIG. 34, when there is an overlap in the coordinate position between the area in the first
なお、2つの領域、領域Aと領域Bの重なりの有無は、例えば下式に当てはまるか否かで判定する。
(yA1<yB1<yA2 または yA1<yB2<yA2) かつ
(xA1<xB1<xA2 または xA1<xB2<xA2)
但し、領域Aの左下座標−右上座標の組を(xA1,yA1)−(xA2,yA2)、領域Bの左下座標−右上座標の組を(xB1,yB1)−(xB2,yB2)とする。
Note that the presence or absence of overlap between the two regions, region A and region B, is determined by whether or not the following formula is satisfied, for example.
(YA1 <yB1 <yA2 or yA1 <yB2 <yA2) and
(XA1 <xB1 <xA2 or xA1 <xB2 <xA2)
However, a set of the lower left coordinate and the upper right coordinate of the area A is (xA1, yA1)-(xA2, yA2), and a set of the lower left coordinate and the upper right coordinate of the area B is (xB1, yB1)-(xB2, yB2).
図35は、第2の実施の形態の画像処理装置をコピア用識別信号生成に使用する際の像域情報合成手段3204の動作例を示す図である。図35(1)は、入力文書画像3501を示している。図35(2)は、透かし画像から抽出された第1の像域情報3505を示している。図35(3)は、画像識別手段3203により生成された第2の像域情報3508を示している。図35(4)は、第1の像域情報3505と第2の像域情報3508を合成して生成された第3の像域情報3511を示している。
FIG. 35 is a diagram illustrating an operation example of the image area
図35に示した例では、第1の像域情報3505中の第1領域3506(文字列“TITLE”)と第2の像域情報3508中の第1領域3509(文字列“TITLE”)で座標位置に重なりがある。そこで、その属性が“文字”である第2の像域情報3508中の領域3509を採用し、その属性が“自然画像”である第1の像域情報3505中の領域3506を破棄する。すなわち、第1の像域情報3505中の第2領域3507と第2の像域情報3508中の第1領域3509、第2領域3510を採用して第3の像域情報3511として出力する。
In the example shown in FIG. 35, the first area 3506 (character string “TITLE”) in the first
なお、像域情報合成手段3204の動作として3例を説明したが、この例に限られるものではない。より高精度な像域情報を得るために第1の像域情報と第2の像域情報の両方に存在する領域のみを採用する等、他の動作例も考えられる。
Although three examples have been described as the operation of the image area
また、上述の第3の像域情報中に領域を記述する順序は、第1の像域情報中の領域の後に第2の像域情報中の領域を記述する単純なものである。しかし、第2の実施の形態の画像処理装置の出力をコピア用識別信号に使用する場合、コピアの画像処理は副走査の順方向にしか処理できない。従って、第3の像域情報中の領域も副走査の順方向に並べ替える必要がある。例えば、図35(4)の第3の像域情報3511の例では、上を副走査の先頭とすると、第2領域、第3領域、第1領域の順に並び替える。
Further, the order of describing the areas in the third image area information is simple as describing the areas in the second image area information after the areas in the first image area information. However, when the output of the image processing apparatus of the second embodiment is used as a copier identification signal, copier image processing can be performed only in the forward direction of sub-scanning. Therefore, it is necessary to rearrange the areas in the third image area information in the sub-scanning forward direction. For example, in the example of the third
以上説明した第2の実施の形態によれば、第1の実施の形態と同様に、透かし画像が埋め込まれていない画像に対しては従来と同精度の像域情報を得ることが出来、既に像域情報が透かし画像で埋め込まれた文書画像に対しては、透かし画像中の像域情報では不足している像域情報を画像識別手段で生成した像域情報で補うことにより高精度な識別情報を得ることが可能である。 According to the second embodiment described above, as in the first embodiment, image area information with the same accuracy as in the past can be obtained for an image in which a watermark image is not embedded. For document images in which image area information is embedded with a watermark image, the image area information that is lacking in the image area information in the watermark image is supplemented with the image area information generated by the image identification means, thereby enabling high-precision identification. Information can be obtained.
[第3の実施の形態]
図36は、第3の実施の形態の画像処理装置の構成を示すブロック図である。画像処理装置は、文書画像入力手段3601、透かし情報抽出手段3602、画像識別手段3603、像域情報合成手段3604を備えている。
[Third embodiment]
FIG. 36 is a block diagram illustrating a configuration of an image processing apparatus according to the third embodiment. The image processing apparatus includes a document
第3の実施の形態の画像処理装置は、画像識別手段3603が透かし情報から抽出した第1の像域情報中に記載されていない領域のみに対して画像識別を行う点で第2の実施の形態と異なっている。
The image processing apparatus according to the third embodiment is different from the second embodiment in that the
図37は、第3の実施の形態の画像処理装置により得られる像域情報の例を示す図である。図37(1)は、入力文書画像3701を示している。図37(2)は、透かし画像から抽出された第1の像域情報3705を示している。図37(3)は、画像識別手段3603により生成された第2の像域情報3708を示している。図37(4)は、第1の像域情報3705と第2の像域情報3708を合成して生成された第3の像域情報3710を示している。
FIG. 37 is a diagram illustrating an example of image area information obtained by the image processing apparatus according to the third embodiment. FIG. 37A shows an
透かし情報抽出手段3602が抽出した結果である第1の像域情報3705には第1領域3706として“TITLE”という文字領域と、第2領域3707としてMFPが撮影されている自然画像が抽出されている。しかし、透かし情報抽出手段3602は、入力文書画像3701中の文字列“ABC”を抽出していない。
The first
画像識別手段3603は、第1の像域情報3705中の第1領域3706・第2領域3707で表される領域以外の箇所に対して識別処理を実行する。そして、文字列“ABC”を第1領域3709として含む第2の像域情報3708を生成する。像域情報合成手段3604は、得られた第1の像域情報3705と第2の像域情報3708を合成し、第3の像域情報3710を生成する。
The
以上説明した第3の実施の形態によれば、第2の実施の形態と同様に、透かし画像が埋め込まれていない画像に対しては従来と同精度の像域情報を得ることが出来、既に像域情報が透かし画像で埋め込まれた文書画像に対しては、透かし画像中の像域情報では不足している像域情報を画像識別手段で生成した像域情報で補うことにより高精度な識別情報を得ることが可能である。更に透かし画像から得られた像域情報中に領域が無かった箇所のみを識別するので第2の実施の形態と比較して高速に処理することが可能となる。 According to the third embodiment described above, as in the second embodiment, image area information with the same accuracy as the conventional technique can be obtained for an image in which a watermark image is not embedded. For document images in which image area information is embedded with a watermark image, the image area information that is lacking in the image area information in the watermark image is supplemented with the image area information generated by the image identification means, thereby enabling high-precision identification. Information can be obtained. Furthermore, since only a portion where there is no area in the image area information obtained from the watermark image is identified, it is possible to perform processing at a higher speed than in the second embodiment.
[第4の実施の形態]
図38は、第4の実施の形態の画像処理装置の構成を示すブロック図である。画像処理装置は、文書画像入力手段3801、透かし情報抽出手段3802、画像識別手段3803、像域情報合成手段3804を備えている。
[Fourth embodiment]
FIG. 38 is a block diagram illustrating a configuration of an image processing apparatus according to the fourth embodiment. The image processing apparatus includes document image input means 3801, watermark information extraction means 3802, image identification means 3803, and image area information synthesis means 3804.
第4の実施の形態の画像処理装置は、透かし情報から抽出した第1の像域情報中に存在する領域のみを対象として画像識別手段3803が識別処理を行い、第1の像域情報に不足している情報を補う点で第3の実施の形態と異なっている。
In the image processing apparatus according to the fourth embodiment, the
図39は、第4の実施の形態の画像処理装置により得られる像域情報の例を示す図である。図39(1)は、入力文書画像3901を示している。図39(2)は、透かし画像から抽出された第1の像域情報3905を示している。図39(3)は、画像識別手段3803により生成された第2の像域情報3909を示している。図39(4)は、第1の像域情報3905と第2の像域情報3909を合成して生成された第3の像域情報3912を示している。
FIG. 39 is a diagram illustrating an example of image area information obtained by the image processing apparatus according to the fourth embodiment. FIG. 39 (1) shows an
透かし情報抽出手段3802が抽出した結果である第1の像域情報3905には第1領域3906、第2領域3907、第3領域3908の3つの領域が含まれており、その領域を表す情報として座標位置と“文字”/“自然画像”という属性情報が存在する。例えば、第4の実施の形態の画像処理装置から出力する像域情報に文字色情報が必要な場合、画像識別手段3803は第1像域3905中の文字領域である第1領域3906・第2領域3907に対してのみ識別処理を行い、文字色情報を抽出して含む第2の像域情報3909を生成する。
The first
文字色を抽出する方法として、例えば次のような処理を行う。
1:文字領域をGrayscale化する。単純に(R+G+B)/3等で求めても良いし、輝度変換によりも求めても良い。
2:2値化により白黒化する。2値化の閾値は適当な固定閾値を用いてもよいし、Grayscale画像のヒストグラムから算出した適応的な値を用いても良い。
3:2値画像の白画素数と黒画素数を数える。数の少なかった色の画素を文字画素とする。
As a method for extracting the character color, for example, the following processing is performed.
1: The character area is grayscaled. It may be obtained simply by (R + G + B) / 3 or by luminance conversion.
2: Convert to black and white by binarization. As the binarization threshold, an appropriate fixed threshold may be used, or an adaptive value calculated from the histogram of the Grayscale image may be used.
3: Count the number of white pixels and black pixels in the binary image. Let the pixel of the color with few numbers be a character pixel.
4:原画像中の文字画素と判断された画素のRGB値の平均値を求める。この平均値を文字色とする。 4: An average value of RGB values of pixels determined to be character pixels in the original image is obtained. This average value is used as the character color.
像域情報合成手段3804は、得られた第1の像域情報3905と第2の像域情報3909を合成し、第3の像域情報3912を生成する。
The image area
なお、第4の実施の形態においては、第1の像域情報中に存在する領域にのみ画像識別を行う処理について説明してきた。しかし、例えば第3の実施の形態に説明した技術と組み合わせて、第1の像域情報中に存在する領域については文字色識別のみを行い、第1の像域情報に存在しない領域に付いては、領域の座標位置・属性・属性が文字であった場合には文字色の識別を行うという処理も考えられる。 Note that, in the fourth embodiment, the process of performing image identification only on the area existing in the first image area information has been described. However, for example, in combination with the technique described in the third embodiment, only the character color identification is performed for the area existing in the first image area information, and the area not existing in the first image area information is attached. For example, if the coordinate position / attribute / attribute of the region is a character, a process of identifying the character color is also conceivable.
以上説明した第4の実施の形態によれば、第3の実施の形態と同様に、透かし画像が埋め込まれていない画像に対しては従来と同精度の像域情報を得ることが出来、既に像域情報が透かし画像で埋め込まれた文書画像に対しては、透かし画像中の像域情報では不足している像域情報を画像識別手段で生成した像域情報で補うことにより高精度な識別情報を得ることが可能である。 According to the fourth embodiment described above, as in the third embodiment, image area information with the same accuracy as the conventional technique can be obtained for an image in which a watermark image is not embedded. For document images in which image area information is embedded with a watermark image, the image area information that is lacking in the image area information in the watermark image is supplemented with the image area information generated by the image identification means, thereby enabling high-precision identification. Information can be obtained.
なお、第1乃至第4の実施の形態に係る画像処理装置では、図24の画像形成装置で形成した透かし画像が含まれた画像を入力したが、この形態に限られず、第1乃至第7の実施の形態の画像形成装置により形成された画像を用いても良い。 In the image processing apparatuses according to the first to fourth embodiments, an image including a watermark image formed by the image forming apparatus in FIG. 24 is input. However, the present invention is not limited to this form, and the first to seventh An image formed by the image forming apparatus of the embodiment may be used.
なお、以上説明した第1乃至第4の実施の形態に係る画像処理装置は、次のように表すことができる。 The image processing apparatuses according to the first to fourth embodiments described above can be expressed as follows.
[付記1](透かしから像域情報を抽出する)
文書画像を入力する文書画像入力手段と、
前記入力された文書画像に埋め込まれた透かし画像から像域情報を抽出する透かし情報抽出手段、
とを有することを特徴とする画像処理装置。
[Appendix 1] (Extract image area information from watermark)
A document image input means for inputting a document image;
Watermark information extracting means for extracting image area information from a watermark image embedded in the input document image;
An image processing apparatus comprising:
[付記2](透かしから像域情報を抽出する)
請求項1の画像処理装置において、
前記入力された文書画像に埋め込まれた透かし画像から抽出された像域情報は、
その座標の基準位置(左下基準,左上基準etc.)、長さの単位(cm,inch,etc.)が埋め込まれている。
[Appendix 2] (Extract image area information from watermark)
The image processing apparatus according to
Image area information extracted from the watermark image embedded in the input document image is:
A reference position of the coordinates (lower left reference, upper left reference etc.) and a unit of length (cm, inch, etc.) are embedded.
[付記3](透かしがなかった場合は識別処理をする)
文書画像を入力する文書画像入力手段と、
前記入力された文書画像に像域情報が透かし画像として埋められていた場合、埋め込まれた透かし画像から像域情報を抽出する透かし情報抽出手段と、
前記入力された文書画像に透かし画像が埋め込まれていなかった場合に入力文書画像の像域を識別する画像識別手段、
とを有することを特徴とする画像処理装置。
[Appendix 3] (If there is no watermark, an identification process is performed)
A document image input means for inputting a document image;
When image area information is embedded as a watermark image in the input document image, watermark information extracting means for extracting image area information from the embedded watermark image;
Image identifying means for identifying an image area of the input document image when a watermark image is not embedded in the input document image;
An image processing apparatus comprising:
[付記4](透かし情報と識別結果とを合成する)
文書画像を入力する文書画像入力手段と、
前記入力された文書画像に像域情報が透かし画像として埋められていた場合、埋め込まれた透かし画像から第1の像域情報を抽出する透かし情報抽出手段と、
入力された文書画像の像域を識別し第2像域情報を生成する画像識別手段と、
第1の像域情報と第2の像域情報を合成し第3の像域情報を生成する像域情報合成手段、
とを有することを特徴とする画像処理装置。
[Appendix 4] (Combining watermark information and identification result)
A document image input means for inputting a document image;
Watermark information extraction means for extracting first image area information from the embedded watermark image when image area information is embedded as a watermark image in the input document image;
Image identifying means for identifying the image area of the input document image and generating second image area information;
Image area information combining means for combining the first image area information and the second image area information to generate third image area information;
An image processing apparatus comprising:
[付記5](透かし画像から抽出した領域については像域識別を行わない)
文書画像を入力する文書画像入力手段と、
前記入力された文書画像に像域情報が透かし画像として埋められていた場合、埋め込まれた透かし画像から第1の像域情報を抽出する透かし情報抽出手段と、
前記入力された文書画像の前記第1の像域情報においてどの領域にも含まれていない位置の像域を識別し第2像域情報を生成する画像識別手段と、
第1の像域情報と第2の像域情報を合成し第3の像域情報を生成する像域情報合成手段、
とを有することを特徴とする画像処理装置。
[Appendix 5] (Image areas are not identified for areas extracted from watermark images)
A document image input means for inputting a document image;
Watermark information extraction means for extracting first image area information from the embedded watermark image when image area information is embedded as a watermark image in the input document image;
Image identifying means for identifying an image area at a position not included in any area in the first image area information of the input document image and generating second image area information;
Image area information combining means for combining the first image area information and the second image area information to generate third image area information;
An image processing apparatus comprising:
[付記6](透かしから抽出した領域は、透かしにない情報のみ(文字色等)を識別処理で生成する)
文書画像を入力する文書画像入力手段と、
前記入力された文書画像に像域情報が透かし画像として埋められていた場合、埋め込まれた透かし画像から第1の像域情報を抽出する透かし情報抽出手段と、
第1の像域情報内の領域に対して画像識別を行い、第1の像域情報にはない種類の情報である第2の像域情報を生成する画像識別手段と、
第1の像域情報と第2の像域情報を合成し第3の像域情報を生成する像域情報合成手段、
とを有することを特徴とする画像処理装置。
[Appendix 6] (Region extracted from watermark generates only information that is not in the watermark (character color, etc.) by identification processing)
A document image input means for inputting a document image;
Watermark information extraction means for extracting first image area information from the embedded watermark image when image area information is embedded as a watermark image in the input document image;
Image identifying means for performing image identification on an area in the first image area information and generating second image area information which is a type of information not included in the first image area information;
Image area information combining means for combining the first image area information and the second image area information to generate third image area information;
An image processing apparatus comprising:
[付記7](本提案画像処理装置の使い方(コピーor高圧縮ファイル)に応じて、合成方法を変える)
請求項4、請求項5、請求項6に記載の画像処理装置において、
像域情報合成手段は、前記画像処理装置の使用方法(コピー用識別/高圧縮ファイル用識別/OCR前処理)に応じてその合成方法を変える。
[Appendix 7] (Combination method is changed depending on how to use the proposed image processing device (copy or highly compressed file))
In the image processing device according to
The image area information synthesis means changes the synthesis method according to the usage method of the image processing apparatus (copy identification / high compression file identification / OCR preprocessing).
[付記8](透かし情報と識別結果の重複を許して全て出力する)
請求項4、請求項5、請求項6に記載の画像処理装置において、
前記像域情報合成手段は、第1の像域情報と第2像域情報に含まれている領域情報を全て第3の像域情報に含ませる。
[Appendix 8] (Allows duplicate output of watermark information and identification results)
In the image processing device according to
The image area information synthesizing unit includes all the area information included in the first image area information and the second image area information in the third image area information.
[付記9](透かし情報を重視。像域識別結果と重なりがあった場合は、識別結果の方を破棄する)
請求項4、請求項5、請求項6に記載の画像処理装置において、
前記像域情報合成手段は、第1の像域情報内の領域と第2像域情報内の領域の座標位置に重なりがあった場合、該領域については第1の像域情報の領域を採用し第2の像域情報の領域を破棄する。
[Appendix 9] (Watermark information is emphasized. If there is an overlap with the image area identification result, the identification result is discarded)
In the image processing device according to
When there is an overlap in the coordinate position of the area in the first image area information and the area in the second image area information, the image area information combining unit adopts the area of the first image area information for the area. The area of the second image area information is discarded.
[付記10](領域の属性(文字であるか否か)を重視。重なりがあった場合は、優先属性の領域のみ残す)
請求項4、請求項5、請求項6に記載の画像処理装置において、
前記像域情報合成手段は、予め領域の属性による重要度を決めておき、第1の像域情報内の領域と第2像域情報内の領域の座標位置に重なりがあり、かつ、それぞれの属性が異なった場合、該領域については第1の像域情報と第2の像域情報で優先度が低い属性情報を有する方の像域情報を破棄する。
[Appendix 10] (Area attribute (whether it is a character or not) is emphasized. If there is an overlap, only the priority attribute area remains)
In the image processing device according to
The image area information synthesizing means determines the importance according to the attribute of the area in advance, the coordinate positions of the area in the first image area information and the area in the second image area information overlap, and each If the attributes are different, the image area information of the first image area information and the second image area information having attribute information with lower priority is discarded for the area.
[付記11](像域情報を合成する際に、領域の順番を自由に入れ替える)
請求項4、請求項5、請求項6に記載の画像処理装置において、
前記像域情報合成手段は、第1の像域情報と第2の像域情報を合成した第3の像域情報中の領域情報は、その記述順を自由に置き換えられる。
[Appendix 11] (When combining image area information, the order of the areas can be freely changed)
In the image processing device according to
The image area information combining means can freely replace the description order of the area information in the third image area information obtained by combining the first image area information and the second image area information.
[付記12](透かし情報と像域識別結果とで一致した領域のみを出力する)
請求項4、請求項5、請求項6に記載の画像処理装置において、
前記像域情報合成手段は、第1の像域情報内の領域と第2像域情報内の領域の座標位置を調べ、一致した領域のみを第3の像域情報に採用する。
[Supplementary Note 12] (Only the area where the watermark information and the image area identification result match is output)
In the image processing device according to
The image area information synthesizing unit examines the coordinate positions of the area in the first image area information and the area in the second image area information, and adopts only the matched area as the third image area information.
本発明は、像域情報が埋め込まれた文書画像から正確な像域識別結果を得る技術に関する。この技術を用いると何世代にも渡り正確な像域識別結果を用いた世代コピーが可能となる。また、より高画質・高機能な電子ファイルを作成可能となる。 The present invention relates to a technique for obtaining an accurate image area identification result from a document image in which image area information is embedded. When this technology is used, generational copying using an accurate image area identification result for many generations becomes possible. In addition, it is possible to create an electronic file with higher image quality and higher functionality.
尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage.
Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
本発明は、複数世代のコピー原稿であっても高精度な像域識別結果を得ることができ、また、高機能な電子ファイルを得ることができる画像形成装置、画像処理装置を製造し、使用する産業で利用することができる。 The present invention manufactures and uses an image forming apparatus and an image processing apparatus that can obtain a highly accurate image area identification result even for a plurality of generations of copy originals and can obtain a highly functional electronic file. Can be used in industry.
101…文書画像入力手段、102…像域情報入力手段、103…画像形成手段、104…文書合成手段、501…文書画像入力手段、502…情報抽出手段、503…画像処理手段、504…画像出力手段、701…文書画像入力手段、702…情報抽出手段、703…画像分割手段、704…第1の圧縮手段、705…第2の圧縮手段、706…画像結合手段、801…文書データ入力手段、802…文書画像形成手段、803…像域情報入力手段、804…画像形成手段、805…文書合成手段、1101…文書画像入力手段、1102…画像識別手段、1103…画像形成手段、1104…文書合成手段、1301…文書データ入力手段、1302…文書画像形成手段、1303…像域情報抽出手段、1304…画像形成手段、1305…文書合成手段、1501…文書画像入力手段、1502…画像識別手段、1503…像域情報編集手段、1504…画像形成手段、1505…文書合成手段、1801…文書データ入力手段、1802…文書画像形成手段、1803…像域情報抽出手段、1804…像域情報編集手段、1805…画像形成手段、1806…文書合成手段。
DESCRIPTION OF
Claims (10)
前記文書画像のそれぞれの像域について作成された像域情報を入力する像域情報入力手段と、
前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記入力文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 A document image input means for inputting a document image and generating an input document image as image data;
Image area information input means for inputting image area information created for each image area of the document image;
Watermark image forming means for forming a watermark image in which the image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the input document image and the watermark image to form a watermarked document image.
前記文書データから画像データである文書画像を形成する文書画像形成手段と、
前記文書データ中のそれぞれの像域について作成された像域情報を入力する像域情報入力手段と、
前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 Document data input means for inputting document data;
Document image forming means for forming a document image which is image data from the document data;
Image area information input means for inputting image area information created for each image area in the document data;
Watermark image forming means for forming a watermark image in which the image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the document image and the watermark image to form a watermarked document image.
前記入力文書画像中のそれぞれの像域を識別して像域情報を生成する像域識別手段と、
前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記入力文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 A document image input means for inputting a document image and generating an input document image as image data;
Image area identifying means for identifying each image area in the input document image and generating image area information;
Watermark image forming means for forming a watermark image in which the image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the input document image and the watermark image to form a watermarked document image.
前記文書データから画像データである文書画像を形成する文書画像形成手段と、
前記文書データ中のそれぞれの像域について像域情報を抽出する像域情報抽出手段と、
前記像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 Document data input means for inputting document data;
Document image forming means for forming a document image which is image data from the document data;
Image area information extracting means for extracting image area information for each image area in the document data;
Watermark image forming means for forming a watermark image in which the image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the document image and the watermark image to form a watermarked document image.
前記入力文書画像中のそれぞれの像域を識別して像域情報を生成する像域識別手段と、
前記像域情報を所定の規則に従って編集する像域情報編集手段と、
前記編集された像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記入力文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 A document image input means for inputting a document image and generating an input document image as image data;
Image area identifying means for identifying each image area in the input document image and generating image area information;
Image area information editing means for editing the image area information according to a predetermined rule;
Watermark image forming means for forming a watermark image in which the edited image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the input document image and the watermark image to form a watermarked document image.
前記文書データから画像データである文書画像を形成する文書画像形成手段と、
前記文書データ中のそれぞれの像域について像域情報を抽出する像域情報抽出手段と、
抽出した像域情報を所定の規則に従って編集する像域情報編集手段と、
前記編集された像域情報を埋め込んだ透かし画像を形成する透かし画像形成手段と、
前記文書画像と前記透かし画像とを合成し透かし入り文書画像を形成する透かし入り文書画像合成手段
とを有することを特徴とする画像形成装置。 Document data input means for inputting document data;
Document image forming means for forming a document image which is image data from the document data;
Image area information extracting means for extracting image area information for each image area in the document data;
Image area information editing means for editing the extracted image area information according to a predetermined rule;
Watermark image forming means for forming a watermark image in which the edited image area information is embedded;
An image forming apparatus comprising: a watermarked document image synthesizing unit that combines the document image and the watermark image to form a watermarked document image.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7601808P | 2008-06-26 | 2008-06-26 | |
US7601608P | 2008-06-26 | 2008-06-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010011455A true JP2010011455A (en) | 2010-01-14 |
Family
ID=41600286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009148053A Pending JP2010011455A (en) | 2008-06-26 | 2009-06-22 | Image-forming device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010011455A (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09284579A (en) * | 1996-04-15 | 1997-10-31 | Canon Inc | Color signal processor and copying device |
JP2004274632A (en) * | 2003-03-11 | 2004-09-30 | Ricoh Co Ltd | Image processing apparatus, method and recording medium |
JP2006087075A (en) * | 2004-08-20 | 2006-03-30 | Ricoh Co Ltd | Image processor, image processing method and image processing program |
JP2007043662A (en) * | 2005-07-01 | 2007-02-15 | Fuji Xerox Co Ltd | Image forming apparatus and image processor |
-
2009
- 2009-06-22 JP JP2009148053A patent/JP2010011455A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09284579A (en) * | 1996-04-15 | 1997-10-31 | Canon Inc | Color signal processor and copying device |
JP2004274632A (en) * | 2003-03-11 | 2004-09-30 | Ricoh Co Ltd | Image processing apparatus, method and recording medium |
JP2006087075A (en) * | 2004-08-20 | 2006-03-30 | Ricoh Co Ltd | Image processor, image processing method and image processing program |
JP2007043662A (en) * | 2005-07-01 | 2007-02-15 | Fuji Xerox Co Ltd | Image forming apparatus and image processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4861711B2 (en) | Image processing apparatus, image compression method, image compression program, and recording medium | |
JP4772888B2 (en) | Image processing apparatus, image forming apparatus, image processing method, program, and recording medium thereof | |
US8503036B2 (en) | System and method of improving image quality in digital image scanning and printing by reducing noise in output image data | |
JP5180670B2 (en) | Image processing apparatus and image processing method | |
JP4903034B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5137759B2 (en) | Image processing device | |
US20090284801A1 (en) | Image processing apparatus and image processing method | |
JP2009272834A (en) | Image processing apparatus and image encoding method | |
JP4819723B2 (en) | Information extraction apparatus, information extraction method, information extraction program, and recording medium | |
WO2013108757A1 (en) | Image processing device, image forming device, program and storage medium | |
JP2007067932A (en) | Image processing apparatus and method thereof | |
JP5178490B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP2005107691A (en) | Image processing apparatus, method and program, and storage medium | |
US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
JP2003189096A (en) | Image processing apparatus | |
US8270722B2 (en) | Image processing with preferential vectorization of character and graphic regions | |
JP3899872B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
US8577132B2 (en) | Electronic document generation system, electronic document generation method, and program | |
JP2007088912A (en) | Image processing apparatus and program | |
JP4710672B2 (en) | Character color discrimination device, character color discrimination method, and computer program | |
JP2007005907A (en) | Image processing method, image processor, image processing program, and recording medium | |
JP7134045B2 (en) | Image processing device, image processing method, and program | |
JP2010011455A (en) | Image-forming device | |
JP2008193234A (en) | Image processor, control method of image processor and control program of image processor | |
JP2005151455A (en) | Image processor, information processor, these control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120327 |