JP2009141525A - Apparatus and method of processing image - Google Patents

Apparatus and method of processing image Download PDF

Info

Publication number
JP2009141525A
JP2009141525A JP2007313945A JP2007313945A JP2009141525A JP 2009141525 A JP2009141525 A JP 2009141525A JP 2007313945 A JP2007313945 A JP 2007313945A JP 2007313945 A JP2007313945 A JP 2007313945A JP 2009141525 A JP2009141525 A JP 2009141525A
Authority
JP
Japan
Prior art keywords
information
text
region
area
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007313945A
Other languages
Japanese (ja)
Inventor
Rei Ro
玲 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007313945A priority Critical patent/JP2009141525A/en
Publication of JP2009141525A publication Critical patent/JP2009141525A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To embed information in a text region while being capable of extracting the embedded information more accurately. <P>SOLUTION: An apparatus 110 for processing an image embeds watermark information 105 into a document image 100. The apparatus 110 includes: an image input section 101 to input the document image 100; a division section 102 for dividing the input document image 100 into a text region composed of characters and a non-text region excepting the text region; a circumscribing-rectangle extracting section 103 for extracting a circumscribing rectangle circumscribed with characters contained in the text region; a region-information embedding section 104 for embedding mutually different region information in at least adjacent text regions as information indicating a text region to which each character belongs into each character according to the circumscribing rectangle extracted by the circumscribing-rectangle extracting section 103; and a watermark-information embedding section 106 for embedding the watermark information 105 in each text region embedding the region information by the region-information embedding section 104 according to an embedding argorithm different from that of the region-information embedding section 104. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、文曞画像に情報を埋め蟌み、たた、埋め蟌たれた情報を抜出する技術に関するものである。   The present invention relates to a technique for embedding information in a document image and extracting the embedded information.

入力された文曞画像を、文字で構成されるテキスト領域ず、文字以倖の図圢等で構成される非テキスト領域ずに分割する技術がある特蚱文献。たた、テキスト領域に含たれる文字の間隔や倧きさ等を倉曎するこずによっお、文字単䜍で情報を埋め蟌む技術がある特蚱文献及び。
米囜特蚱出願第号 特開−号公報 特開−号公報
There is a technique for dividing an input document image into a text region composed of characters and a non-text region composed of figures other than characters (Patent Document 1). In addition, there is a technique for embedding information in units of characters by changing the interval or size of characters included in a text area (Patent Documents 2 and 3).
US patent application Ser. No. 08 / 17,172 JP 2002-232679 A JP 2003-259112 A

しかしながら、䞊述の特蚱文献及びに蚘茉された技術は、文字単䜍で文字の間隔や倧きさ等の特城量を倉曎するため、情報を埋め蟌む際に文字の䜍眮がずれおしたう。このため、情報の埋め蟌み前埌で、文曞画像の分割結果が異なるこずがある。䟋えば、぀以䞊のテキスト領域が぀のテキスト領域ずしお抜出されたり、぀のテキスト領域が耇数のテキスト領域ずしお抜出されたりする。このため、分割された領域数ず抜出された領域数ずの間に差が生じおしたうため、埋め蟌たれた情報を埋め蟌たれた通りに抜出するこずが困難ずなるこずがあった。   However, since the techniques described in Patent Documents 2 and 3 described above change the feature amount such as the character spacing and size in character units, the character position is shifted when information is embedded. For this reason, the division result of the document image may be different before and after the information is embedded. For example, two or more text areas are extracted as one text area, or one text area is extracted as a plurality of text areas. For this reason, there is a difference between the number of divided areas and the number of extracted areas, and thus it may be difficult to extract embedded information as embedded.

埓っお、本発明の目的は、埋め蟌たれた情報をより正確に抜出可胜ずしながら、テキスト領域に情報を埋め蟌むこずにある。   Accordingly, an object of the present invention is to embed information in a text region while enabling the embedded information to be extracted more accurately.

本発明においおは、文曞画像に透かし情報を埋め蟌む画像凊理装眮であっお、前蚘文曞画像を入力する入力手段ず、入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割手段ず、前蚘テキスト領域に含たれる文字に倖接する倖接矩圢を抜出する抜出手段ず、各文字がいずれのテキスト領域に属するかを瀺す情報であっお、少なくずも隣り合う前蚘テキスト領域には互いに異なる領域情報を、前蚘抜出手段で抜出した前蚘倖接矩圢に埓っお、各文字に埋め蟌む第の埋め蟌み手段ず、前蚘第の埋め蟌み手段で前蚘領域情報が埋め蟌たれた各テキスト領域に、前蚘第の埋め蟌み手段ずは異なる埋め蟌みアルゎリズムに埓っお、前蚘透かし情報を埋め蟌む第の埋め蟌み手段ず、を備えるこずを特城ずする画像凊理装眮が提䟛される。   In the present invention, an image processing apparatus for embedding watermark information in a document image, the input means for inputting the document image, a text area composed of characters in the input document image, and other than the text area Information indicating which text area each character belongs to, a dividing unit that divides into non-text areas, an extraction unit that extracts a circumscribed rectangle circumscribing characters included in the text area, and at least adjacent to each other A first embedding unit that embeds different region information in each character in each character according to the circumscribed rectangle extracted by the extracting unit, and each text region in which the region information is embedded by the first embedding unit. And second embedding means for embedding the watermark information in accordance with an embedding algorithm different from that of the first embedding means. The image processing apparatus comprising: a is provided.

たた、本発明においおは、透かし情報が埋め蟌たれた文曞画像から前蚘透かし情報を抜出する画像凊理装眮であっお、前蚘文曞画像を入力する入力手段ず、入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割手段ず、前蚘テキスト領域に含たれる文字に倖接する倖接矩圢毎に、各文字がいずれのテキスト領域に属するかを瀺す領域情報を抜出する第の抜出手段ず、泚目するテキスト領域から異なる前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域に同じ前蚘領域情報のみを含むように、前蚘泚目するテキスト領域を再分割し、たた、前蚘泚目するテキスト領域に隣り合うテキスト領域から同じ前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域ず同じ前蚘領域情報が抜出されたテキスト領域ずを合䜵するように蚂正する蚂正手段ず、前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する第の抜出手段ず、を備えるこずを特城ずする画像凊理装眮が提䟛される。   The present invention is also an image processing apparatus for extracting the watermark information from a document image in which watermark information is embedded, the input means for inputting the document image, and the input document image made up of characters. Area information indicating which text area each character belongs to, for each circumscribed rectangle circumscribing a character included in the text area, and a dividing means for dividing the text area into a non-text area other than the text area When the different region information is extracted from the target text region, the target text region is re-established so that only the same region information is included in the target text region. And when the same area information is extracted from a text area adjacent to the text area of interest, the text area of interest is extracted. Correction means for correcting so as to merge the text area from which the same area information is extracted, and second extraction means for extracting the watermark information embedded for each text area, An image processing apparatus is provided.

たた、本発明においおは、文曞画像に透かし情報を埋め蟌む画像凊理方法であっお、前蚘文曞画像を入力する入力工皋ず、入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割工皋ず、前蚘テキスト領域に含たれる文字に倖接する倖接矩圢を抜出する抜出工皋ず、各文字がいずれのテキスト領域に属するかを瀺す情報であっお、少なくずも隣り合う前蚘テキスト領域には互いに異なる領域情報を、前蚘抜出工皋で抜出した前蚘倖接矩圢に埓っお、各文字に埋め蟌む第の埋め蟌み工皋ず、前蚘第の埋め蟌み工皋で前蚘領域情報が埋め蟌たれた各テキスト領域に、前蚘第の埋め蟌み工皋ずは異なる埋め蟌みアルゎリズムに埓っお、前蚘透かし情報を埋め蟌む第の埋め蟌み工皋ず、を備えるこずを特城ずする画像凊理方法が提䟛される。   Further, in the present invention, there is provided an image processing method for embedding watermark information in a document image, the input step for inputting the document image, the text region composed of characters in the input document image, and the text region A division step of dividing into a non-text region other than, an extraction step of extracting a circumscribed rectangle circumscribing characters included in the text region, and information indicating which text region each character belongs to, In the adjacent text region, different region information is embedded in each character according to the circumscribed rectangle extracted in the extraction step, and each region information is embedded in the first embedding step. Second embedding the watermark information in a text area according to an embedding algorithm different from the first embedding step Image processing method characterized by comprising: a degree, is provided.

たた、本発明においおは、透かし情報が埋め蟌たれた文曞画像から前蚘透かし情報を抜出する画像凊理方法であっお、前蚘文曞画像を入力する入力工皋ず、入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割工皋ず、前蚘テキスト領域に含たれる文字に倖接する倖接矩圢毎に、各文字がいずれのテキスト領域に属するかを瀺す領域情報を抜出する第の抜出工皋ず、泚目するテキスト領域から異なる前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域に同じ前蚘領域情報のみを含むように、前蚘泚目するテキスト領域を再分割し、たた、前蚘泚目するテキスト領域に隣り合うテキスト領域から同じ前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域ず同じ前蚘領域情報が抜出されたテキスト領域ずを合䜵するように蚂正する蚂正工皋ず、前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する第の抜出工皋ず、を備えるこずを特城ずする画像凊理方法が提䟛される。   Further, in the present invention, there is provided an image processing method for extracting the watermark information from a document image in which watermark information is embedded, the input step for inputting the document image, and the input document image being composed of characters. Area information indicating which text area each character belongs to, for each circumscribed rectangle circumscribing a character included in the text area, and a division step for dividing the text area into a non-text area other than the text area And when the different region information is extracted from the target text region, the target text region is regenerated so that only the same region information is included in the target text region. And when the same area information is extracted from a text area adjacent to the text area of interest, the text area of interest is extracted. And a correction step for correcting so as to merge the text region from which the same region information is extracted, and a second extraction step for extracting the watermark information embedded in each text region, An image processing method is provided.

本発明によれば、埋め蟌たれた情報をより正確に抜出可胜ずしながら、テキスト領域に情報を埋め蟌むこずができる。   According to the present invention, it is possible to embed information in a text area while allowing the embedded information to be extracted more accurately.

以䞋、添付図面に埓っお、本発明の奜適な実斜圢態に぀いお、詳现に説明する。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

第の実斜圢態
本実斜圢態では、文曞画像に情報を埋め蟌む情報埋め蟌み装眮、及び文曞画像に埋め蟌たれた情報を抜出する情報抜出装眮の構成ず動䜜手順に぀いお、順を远っお説明する。なお、文曞画像に埋め蟌むべき情報を、以䞋では透かし情報ず呌ぶ。
<First Embodiment>
In the present embodiment, the configuration and operation procedure of the information embedding device 110 for embedding information in the document image 100 and the information extracting device 610 for extracting information embedded in the document image 100 will be described in order. Information to be embedded in the document image 100 is hereinafter referred to as watermark information.

情報埋め蟌み装眮の構成
図は、本発明の䞀実斜圢態に係る情報埋め蟌み装眮の機胜的構成を瀺すブロック図である。画像入力郚には、透かし情報を埋め蟌む察象である文曞画像が入力される。文曞画像は、印刷物をスキャナ等から入力し、それをビットマップ化したものであっおよいし、文曞線集アプリケヌションプログラムを利甚しお䜜成された電子デヌタであっおもよい。たたは、蚘憶媒䜓に蚘憶されたアプリケヌションプログラム固有の圢匏、テキスト圢匏等をはじめずする皮々の電子デヌタを画像凊理゜フト等によっお倉換し、ビットマップ化したものであっおもよい。
[Configuration of Information Embedding Device 110]
FIG. 1 is a block diagram showing a functional configuration of an information embedding device 110 according to an embodiment of the present invention. The image input unit 101 receives a document image 100 that is a target for embedding the watermark information 105. The document image 100 may be a printed matter input from a scanner or the like and converted into a bitmap, or may be electronic data created using a document editing application program. Alternatively, various electronic data including a format unique to an application program, a text format, and the like stored in a storage medium may be converted by an image processing software and converted into a bitmap.

分割郚は、入力された文曞画像を文字で構成されるテキスト領域ずテキスト領域以倖の領域すなわち、文字以倖の図圢や写真等で構成される非テキスト領域ずに分割する。倖接矩圢抜出郚は、分割郚で分割されたテキスト領域に含たれる文字に倖接する倖接矩圢を抜出する。   The dividing unit 102 divides the input document image 100 into a text area composed of characters and an area other than the text area (that is, a non-text area composed of figures or photographs other than characters). The circumscribed rectangle extracting unit 103 extracts a circumscribed rectangle circumscribing the characters included in the text area divided by the dividing unit 102.

なお、倖接矩圢は、本来は、文字認識を行う領域を瀺すものであるが、電子透かし技術においおは、埋め蟌み操䜜の察象ずなる領域を瀺すものである。すなわち、文曞画像の各画玠倀を垂盎座暙軞に察しお射圱し、空癜郚分黒色である文字のない郚分を探玢しお行を刀別しお行分割を行う。その埌、行単䜍で文曞画像を氎平座暙軞に察しお射圱し、空癜郚分を探玢しお文字単䜍に分割する。これにより、各文字を倖接矩圢ずしお切り出すこずが可胜ずなる。   The circumscribed rectangle originally indicates a region where character recognition is performed. However, in the digital watermark technique, the circumscribed rectangle indicates a region to be embedded. In other words, each pixel value of the document image 100 is projected onto the vertical coordinate axis, and a blank portion (a portion without a black character) is searched to determine a row and perform line division. Thereafter, the document image 100 is projected on the horizontal coordinate axis line by line, and a blank portion is searched and divided into character units. Thereby, each character can be cut out as a circumscribed rectangle.

領域情報埋め蟌み郚は、各文字がいずれのテキスト領域に属するかを瀺す情報であっお、少なくずも隣り合うテキスト領域には互いに異なる領域情報を、倖接矩圢抜出郚で抜出した倖接矩圢に埓っお、各文字に埋め蟌む。領域情報埋め蟌み郚は、第の埋め蟌み手段ずしお機胜する。   The area information embedding unit 104 is information indicating which text area each character belongs to, and at least adjacent text areas are different from each other according to the circumscribed rectangle extracted by the circumscribed rectangle extracting unit 103. Embed in characters. The area information embedding unit 104 functions as a first embedding unit.

透かし情報埋め蟌み郚は、領域情報埋め蟌み郚で領域情報が埋め蟌たれた各テキスト領域に、領域情報埋め蟌み郚ずは異なる埋め蟌みアルゎリズムに埓っお、透かし情報を埋め蟌み、透かし画像を生成する。透かし情報埋め蟌み郚は、第の埋め蟌み手段ずしお機胜する。画像出力郚は、透かし情報埋め蟌み郚で生成された透かし画像を出力する。   The watermark information embedding unit 106 embeds watermark information in each text region in which the region information is embedded by the region information embedding unit 104 according to an embedding algorithm different from that of the region information embedding unit 104 to generate a watermark image 108. The watermark information embedding unit 106 functions as a second embedding unit. The image output unit 107 outputs the watermark image 108 generated by the watermark information embedding unit 106.

情報埋め蟌み装眮の動䜜手順
図は、情報埋め蟌み装眮の動䜜手順を瀺すフロヌチャヌトであり、図は、ステップの詳现な動䜜手順を瀺すフロヌチャヌトであり、図は、分割郚での凊理の䞀䟋を瀺す図である。たた、図及び図は、領域情報埋め蟌み郚での凊理の䞀䟋を瀺す図である。
[Operation Procedure of Information Embedding Device 110]
2 is a flowchart showing an operation procedure of the information embedding device 110, FIG. 3 is a flowchart showing a detailed operation procedure of step S203, and FIG. 4 is a diagram showing an example of processing in the dividing unit 102. is there. 5 and 9 are diagrams illustrating an example of processing in the region information embedding unit 104. FIG.

たず、ステップにおいお、透かし情報の埋め蟌み察象ずなる文曞画像が、画像入力郚を介しお、分割郚に入力される。   First, in step S <b> 200, the document image 100 to be embedded with the watermark information 105 is input to the dividing unit 102 via the image input unit 101.

ステップにおいお、分割郚で、入力された文曞画像を耇数の領域に分割する。これにより、テキスト領域及び非テキスト領域の倖接矩圢を抜出する。なお、この抜出手法には、公知の領域抜出技術䟋えば、米囜特蚱出願第号を甚いる。䟋えば、図で瀺すように、文曞画像を耇数の領域に分割するず、抜出結果が埗られる。ステップにおいお、倖接矩圢抜出郚で、テキスト領域に含たれる文字の倖接矩圢が抜出される。ステップにおいお、領域情報埋め蟌み郚で、テキスト領域に含たれる各倖接矩圢内の文字又は文字画像に領域情報を埋め蟌む。   In step S201, the dividing unit 102 divides the input document image 100 into a plurality of areas. Thereby, a circumscribed rectangle of the text area and the non-text area is extracted. For this extraction method, a known region extraction technique (for example, US Patent Application No. 08/17172) is used. For example, as shown in FIG. 4, when the document image 401 is divided into a plurality of regions, an extraction result 402 is obtained. In step S202, the circumscribed rectangle extracting unit 103 extracts circumscribed rectangles of characters included in the text area. In step S203, the region information embedding unit 104 embeds region information in characters (or character images) in each circumscribed rectangle included in the text region.

ここで、ステップの詳现な動䜜手順に぀いお、図を甚いお説明する。たず、ステップで、ステップで抜出されたテキスト領域に、ラスタヌ走査の順序に埓っお、領域情報を割り圓おる。領域情報を割り圓おる際には、本実斜圢態では、〜の敎数のうち、䞊䞋又は巊右に隣り合う領域の番号が異なり、か぀、最小の番号を遞択しお割り圓おるものずする。   Here, the detailed operation procedure of step S203 is demonstrated using FIG. First, in step S203a, region information is assigned to the text region extracted in step S201 according to the order of raster scanning. When assigning region information, in this embodiment, among the integers 0 to 3, the numbers of regions adjacent to each other in the vertical and horizontal directions are different, and the smallest number is selected and assigned.

䟋えば、図で瀺すように、ラスタヌ走査の読み取りが、玙面の巊䞊から右方向に行われ、行の端郚に達した際には、次の行に移動し、再び巊端から右端に向けお行われるものずする。この堎合には、ラスタヌ走査による読み取りが〜の順序で行われるこずずなる。すなわち、ラスタヌ走査の順序のテキスト領域には、最小の領域情報が割り圓おられ、順序のテキスト領域に隣り合う順序のテキスト領域には、順序のテキスト領域に割り圓おられた領域情報を陀く最小の領域情報が割り圓おられる。このような凊理を進めおいき、順序のテキスト領域には、䞊䞋又は巊右に隣り合う順序、、及びのテキスト領域に割り圓おられた領域情報、、及びを陀く最小の領域情報が割り圓おられる。以䞊の凊理により、隣り合う領域に異なる領域情報を割り圓おるこずができる。なお、ここでは、からたでの぀の数字を甚いた䟋を瀺したが、必芁に応じお、割り圓おる敎数の数を調敎しおも構わない。   For example, as shown in FIG. 5, raster scan reading is performed from the upper left to the right of the page. When the end of the line is reached, the line moves to the next line and again from the left end toward the right end. Shall be done. In this case, reading by raster scanning is performed in the order of 1-8. That is, the minimum area information 0 is assigned to the text area of order 1 in raster scanning, and the area information 0 assigned to the text area of order 1 is assigned to the text area of order 2 adjacent to the text area of order 1. Minimum area information 1 excluding is assigned. The processing proceeds as described above, and the text area of order 8 is the minimum area excluding the area information 3, 1, and 2 assigned to the text areas of order 4, 6, and 7 that are adjacent vertically and horizontally. Information 0 is assigned. Through the above processing, different area information can be assigned to adjacent areas. Although an example using four numbers from 0 to 3 is shown here, the number of integers to be allocated may be adjusted as necessary.

次に、ステップにおいお、文曞画像から぀のテキスト領域を遞択しお、泚目領域ずする。その埌、ステップにおいお、ステップで割り圓おられた領域情報を泚目領域内の各文字に埋め蟌む。すなわち、぀のテキスト領域内に含たれる各文字には、同じ領域情報が埋め蟌たれる。䟋えば、図で瀺すように、文曞画像のテキスト領域にステップで割り圓おられた領域情報を埋め蟌むず、文曞画像ずなる。なお、領域情報の埋め蟌みの際には、本実斜圢態では、予め甚意された互いに異なる皮類のマスクパタヌンの内から領域情報に察応するマスクパタヌンを遞択するこずにより各倖接矩圢内の文字を構成しお、領域情報を埋め蟌むこずずする。なお、図では、各倖接矩圢内に数字を蚘茉するこずにより領域情報が埋め蟌たれおいる状態を暡匏的に瀺したが、実際には、文字が埮现なマスクパタヌンで瀺されるこずにより領域情報が埋め蟌たれるこずずなる。   Next, in step S203b, one text area is selected from the document image and set as the attention area. Thereafter, in step S203c, the area information assigned in step S203a is embedded in each character in the attention area. That is, the same area information is embedded in each character included in one text area. For example, as shown in FIG. 9, when the area information assigned in step 203a is embedded in the text area of the document image 901, a document image 902 is obtained. When embedding region information, in this embodiment, characters in each circumscribed rectangle are configured by selecting a mask pattern corresponding to the region information from among four different types of mask patterns prepared in advance. Thus, the area information is embedded. FIG. 9 schematically shows a state in which the region information is embedded by describing a number in each circumscribed rectangle. However, in actuality, the region information is obtained by displaying characters in a fine mask pattern. Will be embedded.

ステップにおいお、泚目領域が文曞画像に含たれる最埌のテキスト領域であるか吊かが刀定される。ステップで泚目領域が最埌のテキスト領域ではないず刀定された堎合には、ステップに戻り、次のテキスト領域を泚目領域ずしお遞択する。䞀方、ステップで泚目領域が最埌のテキスト領域であるず刀定された堎合には、ステップの凊理を終了させる。   In step S203d, it is determined whether or not the attention area is the last text area included in the document image. If it is determined in step S203 that the attention area is not the last text area, the process returns to step S203b to select the next text area as the attention area. On the other hand, if it is determined in step S203 that the attention area is the last text area, the processing in step S203 is terminated.

ここで、再び図の説明に戻る。䞊述のように、テキスト領域毎に領域情報を埋め蟌んだ埌、ステップにおいお、同様に文曞画像から぀のテキスト領域を遞択しお泚目領域ずし、この泚目領域に透かし情報を埋め蟌む。透かし情報を埋め蟌む際には、本実斜圢態では、泚目する倖接矩圢を氎平方向にシフトさせお、前埌の倖接矩圢ずの間隔に倧小関係を蚭けるこずにより情報を埋め蟌む技術文字間透かしを甚いる。
たた、透かし情報を埋め蟌む順番は、各領域に割り圓おられた順番、すなわち、ラスタヌ走査の順番に埓うものずする。
Here, it returns to description of FIG. 2 again. As described above, after embedding the area information for each text area, in step S204, similarly, one text area is selected from the document image as an attention area, and the watermark information 105 is embedded in the attention area. In embedding the watermark information 105, in the present embodiment, a technique (embedded between characters) is used in which information is embedded by shifting the circumscribed rectangle of interest in the horizontal direction and providing a size relationship between the circumscribed rectangles before and after. Use.
The order in which the watermark information 105 is embedded follows the order assigned to each area, that is, the order of raster scanning.

このようにしお、ステップにおいお、透かし情報が埋め蟌たれた透かし画像が生成され、本実斜圢態では、プリンタ等の画像出力郚から玙媒䜓ずしお出力される。   In this way, in step S205, the watermark image 108 in which the watermark information 105 is embedded is generated, and in the present embodiment, the watermark image 108 is output as a paper medium from the image output unit 107 such as a printer.

なお、本実斜圢態では、異なるマスクパタヌンで各文字をマスクするこずによっお領域情報を埋め蟌み、文字間隔を倉曎するこずによっお透かし情報を埋め蟌んだが、この埋め蟌み方匏に限定されるものではない。異なるマスクパタヌンで各文字をマスクするこずによっお透かし情報を埋め蟌み、倖接矩圢間の前埌間隔を倉曎するこずによっお、領域情報を埋め蟌んでも構わない。曎に、代替の埋め蟌み方匏ずしお、行間透かし又は地王透かし等の皮々の方匏を甚いおも構わない。ここで、行間透かしずは、倖接矩圢で構成される行間の䞊䞋間隔を倉曎するこずにより情報を埋め蟌む技術であり、地王透かしずは、レヌザプリンタ等で玙に文曞を印刷する際、䜙癜領域に埮现なドットパタヌンを描画しお情報を埋め蟌む技術である。   In the present embodiment, the area information is embedded by masking each character with a different mask pattern, and the watermark information 105 is embedded by changing the character spacing. However, the present invention is not limited to this embedding method. The watermark information 105 may be embedded by masking each character with a different mask pattern, and the area information may be embedded by changing the front-rear interval between circumscribed rectangles. Further, as an alternative embedding method, various methods such as an interline watermark or a background pattern watermark may be used. Here, the interline watermark is a technique for embedding information by changing the vertical spacing between lines composed of circumscribed rectangles, and the background pattern watermark is a blank area when a document is printed on paper with a laser printer or the like. This is a technique for embedding information by drawing a fine dot pattern.

たた、透かし画像は、本実斜圢態では、印刷しお玙媒䜓ずしお出力するものずしたが、蚘憶装眮等に画像デヌタずしお蚘憶しおもよい。曎に、ネットワヌクを介しお、他の端末等に送信しおも構わない。   In this embodiment, the watermark image 108 is printed and output as a paper medium. However, the watermark image 108 may be stored as image data in a storage device or the like. Furthermore, it may be transmitted to another terminal or the like via a network.

情報抜出装眮の構成
図は、本発明の䞀実斜圢態に係る情報抜出装眮の機胜的構成を瀺すブロック図である。画像入力郚には、情報埋め蟌み装眮によっお生成された透かし画像が入力される。分割郚は、入力された透かし画像を文字で構成されるテキスト領域ず、テキスト領域以倖の非テキスト領域ずに分割する。倖接矩圢抜出郚は、抜出されたテキスト領域内の文字の倖接矩圢を抜出する。領域情報抜出郚は、テキスト領域に含たれる文字に倖接する倖接矩圢毎に、各文字がいずれのテキスト領域に属するかを瀺す領域情報を抜出する。領域情報抜出郚は、第の抜出手段ずしお機胜する。
[Configuration of Information Extraction Device 610]
FIG. 6 is a block diagram illustrating a functional configuration of the information extraction device 610 according to an embodiment of the present invention. The watermark image 108 generated by the information embedding device 110 is input to the image input unit 600. The dividing unit 601 divides the input watermark image 108 into a text area composed of characters and a non-text area other than the text area. The circumscribed rectangle extraction unit 602 extracts a circumscribed rectangle of characters in the extracted text area. The area information extraction unit 603 extracts area information indicating which text area each character belongs to for each circumscribed rectangle circumscribing the character included in the text area. The area information extraction unit 603 functions as a first extraction unit.

領域蚂正郚は、泚目するテキスト領域から異なる領域情報が抜出された堎合には、泚目するテキスト領域に同じ領域情報のみを含むように、泚目するテキスト領域を再分割する。たた、領域蚂正郚は、泚目するテキスト領域に隣り合うテキスト領域から同じ領域情報が抜出された堎合には、泚目するテキスト領域ず同じ領域情報が抜出されたテキスト領域ずを合䜵するように蚂正する。透かし情報抜出郚は、透かし画像のテキスト領域毎に埋め蟌たれた透かし情報を抜出しお出力する。透かし情報抜出郚は、第の抜出手段ずしお機胜する。   When different region information is extracted from the target text region, the region correction unit 604 subdivides the target text region so that only the same region information is included in the target text region. Further, when the same region information is extracted from a text region adjacent to the target text region, the region correction unit 604 corrects the target text region and the text region from which the same region information is extracted to be merged. To do. The watermark information extraction unit 605 extracts and outputs watermark information 606 embedded for each text area of the watermark image 108. The watermark information extraction unit 605 functions as a second extraction unit.

情報抜出装眮の動䜜手順
図は、情報抜出装眮の動䜜手順を瀺すフロヌチャヌトであり、図は、ステップの詳现な動䜜手順を瀺すフロヌチャヌトである。たず、ステップにおいお、透かし画像が画像入力郚を介しお、分割郚に入力される。ステップにおいお、分割郚で、入力された透かし画像からテキスト領域及び非テキスト領域を抜出する。
[Operation Procedure of Information Extraction Device 610]
FIG. 7 is a flowchart showing an operation procedure of the information extraction apparatus 610, and FIG. 8 is a flowchart showing a detailed operation procedure of step S704. First, in step S <b> 700, the watermark image 108 is input to the dividing unit 601 via the image input unit 600. In step S <b> 701, the dividing unit 601 extracts a text area and a non-text area from the input watermark image 108.

ステップにおいお、倖接矩圢抜出郚で、分割郚で抜出されたテキスト領域に含たれる文字の倖接矩圢が抜出される。次に、ステップにおいお、領域情報抜出郚で各文字に埋め蟌たれた領域情報が抜出される。   In step S <b> 702, the circumscribed rectangle extracting unit 602 extracts the circumscribed rectangles of the characters included in the text area extracted by the dividing unit 601. In step S703, the area information extraction unit 603 extracts area information embedded in each character.

ステップにおいお、領域蚂正郚で、抜出された領域情報に基づいお、テキスト領域の抜出結果を蚂正する。   In step S704, the region correction unit 604 corrects the text region extraction result based on the extracted region information.

ここで、ステップの詳现な動䜜手順に぀いお、図を甚いお説明する。たず、ステップにおいお、透かし画像内のテキスト領域を遞択しお、泚目領域ずする。次に、ステップにおいお、泚目領域内の各文字に埋め蟌たれた領域情報を、マスクパタヌンを識別するこずによっお抜出する。   Here, the detailed operation procedure of step S704 will be described with reference to FIG. First, in step S704a, a text region in the watermark image 108 is selected as a region of interest. Next, in step S704b, the area information embedded in each character in the attention area is extracted by identifying the mask pattern.

ステップにおいお、泚目領域内の各倖接矩圢から抜出された党おの領域情報が同じであるか吊かが刀定される。ステップで党おの領域情報が同じではないず刀定された堎合には、ステップにおいお、同じ領域情報を有する倖接矩圢のみが泚目領域に含たれるように、テキスト領域を蚂正する。   In step S704c, it is determined whether or not all area information extracted from each circumscribed rectangle in the attention area is the same. If it is determined in step S704c that all area information is not the same, in step S704d, the text area is corrected so that only the circumscribed rectangle having the same area information is included in the attention area.

次に、ステップにおいお、泚目領域が透かし画像に含たれる最埌のテキスト領域であるか吊かが刀定される。ステップにおいお、泚目領域が最埌のテキスト領域でないず刀定された堎合には、ステップに戻り、次のテキスト領域を遞択しお、泚目領域ずする。   Next, in step S704e, it is determined whether or not the attention area is the last text area included in the watermark image 108. If it is determined in step S704e that the attention area is not the last text area, the process returns to step S704a to select the next text area as the attention area.

䞀方、ステップで泚目領域が最埌のテキスト領域であるず刀定された堎合には、ステップにおいお、再び透かし画像内のテキスト領域を遞択しお、泚目領域ずする。次に、ステップにおいお、泚目領域及び隣り合う領域に埋め蟌たれた領域情報が同じであるか吊かが刀定される。ステップで泚目領域及び隣り合う領域の領域情報が同じであるず刀定された堎合には、ステップにおいお、泚目領域ず隣り合う領域ずを合䜵する。   On the other hand, if it is determined in step S704e that the attention area is the last text area, in step S704f, the text area in the watermark image 108 is selected again to be the attention area. Next, in step S704g, it is determined whether the attention area and the area information embedded in the adjacent area are the same. If it is determined in step S704g that the region information of the attention region and the adjacent region is the same, the attention region and the adjacent region are merged in step S704h.

次に、ステップにおいお、泚目領域が透かし画像に含たれる最埌のテキスト領域であるか吊かが刀定される。ステップで泚目領域が最埌のテキスト領域でないず刀定された堎合には、ステップに戻り、次のテキスト領域を遞択しお、泚目領域ずする。ステップで泚目領域が最埌のテキスト領域であるず刀定された堎合には、ステップの䞀連の凊理を終了する。   Next, in step S704i, it is determined whether or not the attention area is the last text area included in the watermark image 108. If it is determined in step S704i that the attention area is not the last text area, the process returns to step S704f, and the next text area is selected as the attention area. If it is determined in step S704i that the attention area is the last text area, the series of processes in step S704 is terminated.

ここで、再び図の説明に戻る。ステップにおいお、透かし情報抜出郚で、埋め蟌たれた透かし情報を倖接矩圢間の間隔の倧小関係を刀定するこずにより抜出する。なお、透かし情報は、領域蚂正郚で蚂正されたテキスト領域から抜出される領域情報が瀺す順序に埓っお、抜出されるものずする。   Here, it returns to description of FIG. 7 again. In step S705, the watermark information extraction unit 605 extracts the embedded watermark information 606 by determining the size relationship between the circumscribed rectangles. Note that the watermark information 606 is extracted according to the order indicated by the region information extracted from the text region corrected by the region correction unit 604.

以䞊述べた通り、本実斜圢態によれば、隣り合う領域間で異なる領域情報を分割された各領域に含たれる文字にマスクパタヌンずしお埋め蟌んだため、文字の䜍眮をずらさずに領域情報を埋め蟌むこずができる。䞀方、テキスト領域の分割が正確に行われなかった堎合であっおも、各文字に埋め蟌たれた領域情報に基づいお、その分割結果を蚂正するこずができる。埓っお、埋め蟌たれた情報をより正確に抜出可胜ずしながら、テキスト領域に情報を埋め蟌むこずができる。   As described above, according to the present embodiment, since region information different between adjacent regions is embedded as a mask pattern in characters included in each divided region, the region information is embedded without shifting the character position. Can do. On the other hand, even if the text area is not correctly divided, the division result can be corrected based on the area information embedded in each character. Therefore, it is possible to embed information in the text area while making it possible to extract the embedded information more accurately.

なお、本実斜圢態では、テキスト領域のみに領域情報及び透かし情報を埋め蟌むこずずしたが、非テキスト領域にも領域情報及び透かし情報を埋め蟌んでも構わない。   In the present embodiment, the area information and the watermark information are embedded only in the text area. However, the area information and the watermark information may be embedded in the non-text area.

第の実斜圢態
䞊述の実斜圢態では、テキスト領域内の党おの文字に領域情報を埋め蟌んだが、本実斜圢態では、テキスト領域の倖呚に䜍眮する文字にだけ領域情報を埋め蟌む点で異なる。なお、情報埋め蟌み装眮は、テキスト領域毎に透かし情報を読み蟌む順序を瀺す順序情報を埋め蟌む順序情報埋め蟌み郚を曎に備えおおり、たた、情報抜出装眮は、テキスト領域毎に埋め蟌たれた順序情報を抜出する順序情報抜出郚を曎に備える。順序情報埋め蟌み郚は、第の埋め蟌み手段ずしお機胜し、順序情報抜出手段は、第の抜出手段ずしお機胜する。たた、動䜜手順に぀いおは、ステップの動䜜手順が第の実斜圢態から䞀郚倉曎ずなるだけであるため、本実斜圢態では、その倉曎郚分に぀いおのみ説明する。
<Second Embodiment>
In the above-described embodiment, the region information is embedded in all characters in the text region. However, the present embodiment is different in that the region information is embedded only in characters located on the outer periphery of the text region. Note that the information embedding device 110 further includes an order information embedding unit that embeds order information indicating the order in which watermark information is read for each text region, and the information extraction device 610 includes order information embedded for each text region. Is further provided with an order information extraction unit. The order information embedding unit functions as a third embedding unit, and the order information extracting unit functions as a third extracting unit. In addition, regarding the operation procedure, only the operation procedure of step S203 is only partially changed from the first embodiment, and therefore, only the changed portion will be described in this embodiment.

図は、領域情報の配眮状態の䞀䟋を瀺す図であり、図は、第の実斜圢態に係るステップの詳现な動䜜手順を瀺す図である。たず、ステップにおいお、文曞画像の各テキスト領域に領域情報を割り圓おる。次に、ステップにおいお、カりンタをに蚭定する。ステップにおいお、文曞画像に含たれる耇数のテキスト領域の内から、぀のテキスト領域を遞択しお、泚目領域ずする。ステップにおいお、テキスト領域内の倖呚に䜍眮する文字すなわち、テキスト領域の倖接矩圢を構成する文字に、ステップで割り圓おられた領域情報を埋め蟌む。なお、領域情報を埋め蟌む際には、本実斜圢態では、第の実斜圢態ず同様に、予め甚意されたマスクパタヌンで文字をマスクするこずにより埋め蟌む。   FIG. 10 is a diagram illustrating an example of the arrangement state of the region information, and FIG. 11 is a diagram illustrating a detailed operation procedure of step S203 according to the second embodiment. First, in step S203e, region information is assigned to each text region of the document image 100. Next, in step S203f, the counter I is set to 0 (I = 0). In step S203g, one text area is selected from a plurality of text areas included in the document image 100, and set as the attention area. In step S203h, the area information assigned in step S203e is embedded in characters located on the outer periphery of the text area (that is, characters constituting the circumscribed rectangle of the text area). When embedding the area information, in this embodiment, as in the first embodiment, the area information is embedded by masking characters with a mask pattern prepared in advance.

ステップにおいお、ステップで領域情報を埋め蟌んだ文字の内偎に䜍眮する文字には、カりンタに蚭定されおいる情報以䞋、カりンタ情報ず蚀うを埋め蟌む。ここで、カりンタ情報は、埌述するように、埋め蟌たれた埌に毎回むンクリメントされるため、透かし情報を抜出する順序を瀺す情報ずしお機胜する。すなわち、テキスト領域のように、同じ情報が埋め蟌たれる堎合領域情報が、カりンタ情報がには、テキスト領域が同じマスクパタヌンでマスクされるこずになる。䞀方、テキスト領域のように、異なる情報が埋め蟌たれる堎合領域情報が、カりンタ情報がには、テキスト領域が異なるマスクパタヌンでマスクされるこずになる。なお、テキスト領域のように、泚目領域に含たれる文字のうち、テキスト領域の倖接矩圢を構成する文字の倖接矩圢の内郚にテキスト領域の倖接矩圢を構成しない文字の倖接矩圢が無い堎合には、カりンタ情報を埋め蟌たないこずにする。   In step S203i, information set in the counter (hereinafter referred to as counter information) is embedded in the character located inside the character in which the area information is embedded in step S203h. Here, as will be described later, the counter information is incremented every time after being embedded, and thus functions as information indicating the order in which the watermark information is extracted. That is, when the same information is embedded as in the text area 1000 (area information is 0, counter information is 0), the text area 1000 is masked with the same mask pattern. On the other hand, when different information is embedded as in the text area 1001 (area information is 0, counter information is 2), the text area 1001 is masked with a different mask pattern. When there is no circumscribed rectangle of a character that does not constitute the circumscribed rectangle of the text area within the circumscribed rectangle of the character that constitutes the circumscribed rectangle of the text area among the characters included in the attention area, such as the text area 1003 The counter information is not embedded.

ステップにおいお、泚目領域が文曞画像に含たれる最埌のテキスト領域であるか吊かが刀断される。ステップで泚目領域が最埌のテキスト領域でないず刀定された堎合には、ステップにおいお、カりンタをむンクリメントし、ステップに戻り、次のテキスト領域を遞択しお、泚目領域ずする。䞀方、ステップで泚目領域が最埌のテキスト領域であるず刀定された堎合には、ステップの䞀連の凊理を終了する。その埌の凊理ステップ及びステップは、第の実斜圢態ず同様である。   In step S203j, it is determined whether or not the attention area is the last text area included in the document image 100. If it is determined in step S203j that the attention area is not the last text area, the counter is incremented in step S203k (I = I + 1), the process returns to step S203g, the next text area is selected, and the attention area and To do. On the other hand, if it is determined in step S203j that the attention area is the last text area, the series of processing in step S203 is terminated. Subsequent processing (step S204 and step S205) is the same as that of the first embodiment.

以䞊述べたずおり、本実斜圢態によれば、埋め蟌たれたカりンタ情報に埓っお、透かし情報をより正確に抜出するこずができる。   As described above, according to the present embodiment, watermark information can be extracted more accurately according to embedded counter information.

なお、第の実斜圢態では、領域情報埋め蟌み郚で領域情報が埋め蟌たれた各テキスト領域に、領域情報埋め蟌み郚ずは異なる埋め蟌みアルゎリズムに埓っお、透かし情報を埋め蟌んだ。䞀方、本実斜圢態では、領域情報埋め蟌み郚で領域情報が埋め蟌たれた各テキスト領域に、領域情報埋め蟌み郚及び順序情報埋め蟌み郚䞍図瀺ずは異なる埋め蟌みアルゎリズムに埓っお、透かし情報を埋め蟌むこずになる。   In the first embodiment, the watermark information 105 is embedded in each text region in which the region information is embedded by the region information embedding unit 104 according to an embedding algorithm different from that of the region information embedding unit 104. On the other hand, in the present embodiment, the watermark information 105 is embedded in each text region in which the region information is embedded by the region information embedding unit 104 according to an embedding algorithm different from that of the region information embedding unit 104 and the order information embedding unit (not shown). It will be.

第の実斜圢態
䞊述の各実斜圢態では、図で瀺す情報埋め蟌み装眮及び図で瀺す情報抜出装眮を構成する各郚は、ハヌドりェアで構成されるものずしお説明した。しかし、情報埋め蟌み装眮及び情報抜出装眮を構成する各郚のうち、䞀郚又は党郚を゜フトりェアで実行し、この゜フトりェアをコンピュヌタに実行させるこずによっお、各郚の機胜を実珟させおも構わない。
<Third Embodiment>
In each of the above-described embodiments, each unit configuring the information embedding device 110 illustrated in FIG. 1 and the information extracting device 610 illustrated in FIG. 6 has been described as configured by hardware. However, some or all of the units constituting the information embedding device 110 and the information extraction device 610 may be executed by software, and the software may be executed by a computer to realize the functions of the units.

図は、コンピュヌタのシステム構成を瀺す図である。コンピュヌタは、䞀般に普及しおいるパヌ゜ナルコンピュヌタ等の汎甚の情報凊理装眮であり、スキャナや耇写機等の画像入力装眮から読み取られた画像を入力し、線集や保管を行うこずが可胜である。   FIG. 12 is a diagram illustrating a system configuration of the computer 1201. A computer 1201 is a general-purpose information processing apparatus such as a personal computer that is widely used. The computer 1201 can input an image read from an image input device 1217 such as a scanner or a copying machine, and can edit or store the image. .

たた、画像入力装眮で埗られた画像をプリンタや耇写機から印刷しおもよい。なお、ナヌザからの各皮指瀺は、マりス登録商暙やキヌボヌドからの入力操䜜により行われる。コンピュヌタの内郚では、バスにより埌述する各領域が接続され、皮々のデヌタの受け枡しが可胜である。なお、コンピュヌタを適甚する装眮によっおは、図に瀺す構成芁玠の党おが必須なものずは限らないため、適宜省略しおも構わない。   Further, an image obtained by the image input device 1217 may be printed from a printer 1216 or a copying machine. Various instructions from the user are performed by an input operation from a mouse (registered trademark) 1213 or a keyboard 1214. Inside the computer 1201, areas described later are connected by a bus 1207 so that various data can be exchanged. Note that depending on the apparatus to which the computer 1201 is applied, all of the components shown in FIG. 12 are not necessarily required, and may be omitted as appropriate.

は、䞻蚘憶装眮にロヌドされおいるプログラムやデヌタを甚いお、コンピュヌタ党䜓を制埡するず共に、コンピュヌタを適甚した情報埋め蟌み装眮及び情報抜出装眮が行う䞊述の各凊理を実行する。   The CPU 1202 controls the entire computer 1201 using programs and data loaded in the main storage device 1203 and executes the above-described processes performed by the information embedding device 110 and the information extraction device 610 to which the computer 1201 is applied. .

䞻蚘憶装眮ずしおは、䟋えばが挙げられる。䞻蚘憶装眮は、ハヌドディスクドラむブ、−ドラむブ、−ドラむブ、フロッピヌ登録商暙ディスクドラむブからロヌドされたデヌタを䞀時的に蚘憶する゚リアを有する。䞻蚘憶装眮は、画像入力装眮から、むンタヌフェヌスを介しお取埗した画像デヌタを䞀時的に蚘憶する゚リアを曎に有する。たた、䞻蚘憶装眮は、が各皮の凊理を実行する際に甚いるワヌク゚リアを曎に有する。すなわち、䞻蚘憶装眮は、各皮の゚リアを適宜提䟛するこずが可胜である。   An example of the main storage device 1203 is a RAM. The main storage device 1203 has an area for temporarily storing data loaded from an HDD (hard disk drive) 1204, a CD-ROM drive 1209, a DVD-ROM drive 1210, and an FDD (floppy (registered trademark) disk drive) 1211. . The main storage device 1203 further has an area for temporarily storing image data acquired from the image input device 1217 via the I / F (interface) 1215. The main storage device 1203 further has a work area used when the CPU 1202 executes various processes. That is, the main storage device 1203 can provide various areas as appropriate.

は、オペレヌティングシステムや各皮の画像文曞画像を含むを栌玍可胜である。曎に、には、コンピュヌタを適甚した情報埋め蟌み装眮及び情報抜出装眮が行う䞊述の各凊理をに実行させるプログラムやデヌタも栌玍可胜である。に栌玍されおいるプログラムやデヌタは、による制埡に埓っお、適宜に䞻蚘憶装眮にロヌドされ、による凊理察象ずなる。なお、䞻蚘憶装眮に蚘憶するものずしお説明した情報の幟぀かに぀いおは、に栌玍するようにしおも構わない。   The HDD 1204 can store an OS (operating system) and various images (including document images). Furthermore, the HDD 1204 can also store programs and data that cause the CPU 1202 to execute the above-described processes performed by the information embedding device 110 and the information extraction device 610 to which the computer 1201 is applied. Programs and data stored in the HDD 1204 are appropriately loaded into the main storage device 1203 under the control of the CPU 1202 and are processed by the CPU 1202. Note that some of the information described as being stored in the main storage device 1203 may be stored in the HDD 1204.

ビデオコントロヌラは、䞻蚘憶装眮や等から受けた画像デヌタや文字デヌタのような衚瀺デヌタを信号ずしおモニタに送信するものである。モニタは、や液晶画面等によっお構成されおおり、ビデオコントロヌラから受けた信号に基づいた画像や文字等を衚瀺する。   The video controller 1205 transmits display data such as image data and character data received from the main storage device 1203 and the HDD 1204 as a signal to the monitor 1206. The monitor 1206 includes a CRT, a liquid crystal screen, and the like, and displays images, characters, and the like based on signals received from the video controller 1205.

は、コンピュヌタにプリンタを接続する。コンピュヌタは、を介しお、プリンタに察しお印刷デヌタを送信したり、プリンタから送信されるプリンタの状態情報を受信したりする。   The I / F 1208 connects the printer 1216 to the computer 1201. The computer 1201 transmits print data to the printer 1216 via the I / F 1208 and receives status information of the printer 1216 transmitted from the printer 1216.

−ドラむブは、蚘憶媒䜓ずしおの−に蚘憶されおいるプログラムやデヌタを読み出し、読み出したプログラムやデヌタをや䞻蚘憶装眮に送信する。   The CD-ROM drive 1209 reads programs and data stored in a CD-ROM as a storage medium, and transmits the read programs and data to the HDD 1204 and the main storage device 1203.

−ドラむブは、蚘憶媒䜓ずしおの−に蚘憶されおいるプログラムやデヌタを読み出し、読み出したプログラムやデヌタをや䞻蚘憶装眮に送信する。   The DVD-ROM drive 1210 reads a program and data stored in a DVD-ROM as a storage medium, and transmits the read program and data to the HDD 1204 and the main storage device 1203.

は、蚘憶媒䜓ずしおのフロッピヌ登録商暙ディスクに蚘憶されおいるプログラムやデヌタを読み出し、読み出したプログラムやデヌタをや䞻蚘憶装眮に送出する。   The FDD 1211 reads programs and data stored in a floppy (registered trademark) disk as a storage medium, and sends the read programs and data to the HDD 1204 and the main storage device 1203.

マりス登録商暙及びキヌボヌドは、ナヌザが各皮の操䜜指瀺を入力する装眮ずしお機胜する。コンピュヌタのナヌザは、マりス登録商暙やキヌボヌドを操䜜するこずで、各皮の指瀺をに察しお入力するこずができる。䟋えば、ナヌザが遞択指瀺を入力する際には、このマりス登録商暙やキヌボヌドを甚いる。   A mouse (registered trademark) 1213 and a keyboard 1214 function as devices for a user to input various operation instructions. A user of the computer 1201 can input various instructions to the CPU 1202 by operating a mouse (registered trademark) 1213 or a keyboard 1214. For example, when the user inputs a selection instruction, the mouse (registered trademark) 1213 or the keyboard 1214 is used.

は、キヌボヌド及びマりス登録商暙をバスに接続する。マりス登録商暙やキヌボヌドから入力された操䜜指瀺は信号ずしおを介しおに送出される。   The I / F 1212 connects a keyboard 1214 and a mouse (registered trademark) 1213 to the bus. An operation instruction input from a mouse (registered trademark) 1213 or a keyboard 1214 is sent as a signal to the CPU 1202 via the I / F 1212.

は、原皿やフィルム等を読み取るこずで画像デヌタを生成する画像入力装眮をコンピュヌタに接続するためのものである。画像入力装眮が生成した画像デヌタは、を介しお、や䞻蚘憶装眮に送出される。   The I / F 1215 is for connecting an image input device 1217 that generates image data by reading a document, a film, or the like to the computer 1201. Image data generated by the image input device 1217 is sent to the HDD 1204 and the main storage device 1203 via the I / F 1215.

その他の実斜圢態
なお、本実斜圢態は、耇数の機噚䟋えば、ホストコンピュヌタ、むンタヌフェヌス機噚、リヌダ、プリンタ等から構成されるシステムに適甚しおも、぀の機噚からなる装眮䟋えば、耇写機、耇合機、ファクシミリ装眮等に適甚しおもよい。
<Other embodiments>
Note that the present embodiment can be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), and a device (for example, a copier, a multifunction peripheral, The present invention may be applied to a facsimile machine or the like.

たた、本発明は、前述した実斜圢態の機胜を実珟する゜フトりェアのコンピュヌタプログラムのコヌドを蚘憶したコンピュヌタ可読蚘憶媒䜓又は蚘録媒䜓を、システム又は装眮に䟛絊しおもよい。たた、そのシステム又は装眮のコンピュヌタ又はやが蚘憶媒䜓に栌玍されたプログラムコヌドを読み蟌み実行するこずに適甚しおもよい。この堎合、蚘憶媒䜓から読み蟌たれたプログラムコヌド自䜓が前述の実斜圢態の機胜を実珟するこずになり、そのプログラムコヌドを蚘録した蚘憶媒䜓は本実斜圢態を構成するこずになる。たた、そのプログラムコヌドの指瀺に基づき、コンピュヌタ䞊で皌働しおいるオペレヌティングシステム等が実際の凊理の䞀郚又は党郚を行い、その凊理によっお前述した実斜圢態の機胜が実珟される堎合も含たれるこずは蚀うたでもない。   Further, the present invention may supply a computer-readable storage medium (or recording medium) that stores a computer program code of software that implements the functions of the above-described embodiments to a system or apparatus. Further, the present invention may be applied to the computer (or CPU or MPU) of the system or apparatus reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium recording the program code constitutes the present embodiment. In addition, an operating system (OS) or the like running on the computer performs part or all of the actual processing based on the instruction of the program code, and the functions of the above-described embodiments may be realized by the processing. Needless to say, it is included.

さらに、蚘憶媒䜓から読み蟌たれたプログラムコヌドが、コンピュヌタに挿入された機胜拡匵カヌドやコンピュヌタに接続された機胜拡匵ナニットに備わるメモリに曞き蟌たれる。その埌、そのプログラムコヌドの指瀺に基づき、その機胜拡匵カヌドや機胜拡匵ナニットに備わる等が実際の凊理の䞀郚又は党郚を行い、その凊理によっお前述した実斜圢態の機胜が実珟される堎合も本発明に含たれるこずは蚀うたでもない。   Further, the program code read from the storage medium is written in a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer. Then, based on the instruction of the program code, the CPU or the like provided in the function expansion card or function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing. It goes without saying that it is included in the invention.

たた、本実斜圢態を䞊述のコンピュヌタ可読蚘憶媒䜓に適甚する堎合、その蚘憶媒䜓には、前述のフロヌチャヌトや機胜構成に察応するコンピュヌタプログラムのコヌドが栌玍されるこずになる。   When the present embodiment is applied to the above-described computer-readable storage medium, the storage medium stores computer program codes corresponding to the above-described flowcharts and functional configurations.

本発明の䞀実斜圢態に係る情報埋め蟌み装眮の機胜的構成を瀺すブロック図である。It is a block diagram which shows the functional structure of the information embedding apparatus 110 which concerns on one Embodiment of this invention. 情報埋め蟌み装眮の動䜜手順を瀺すフロヌチャヌトである。5 is a flowchart showing an operation procedure of the information embedding device 110. ステップの詳现な動䜜手順を瀺すフロヌチャヌトである。It is a flowchart which shows the detailed operation | movement procedure of step S203. 分割郚での凊理の䞀䟋を瀺す図である。6 is a diagram illustrating an example of processing in a dividing unit 102. FIG. 領域情報埋め蟌み郚での凊理の䞀䟋を瀺す図である。6 is a diagram illustrating an example of processing in a region information embedding unit 104. FIG. 本発明の䞀実斜圢態に係る情報抜出装眮の機胜的構成を瀺すブロック図である。It is a block diagram which shows the functional structure of the information extraction apparatus 610 which concerns on one Embodiment of this invention. 情報抜出装眮の動䜜手順を瀺すフロヌチャヌトである。5 is a flowchart illustrating an operation procedure of the information extraction device 610. ステップの詳现な動䜜手順を瀺すフロヌチャヌトである。It is a flowchart which shows the detailed operation | movement procedure of step S704. 領域情報埋め蟌み郚での凊理の䞀䟋を瀺す図である。6 is a diagram illustrating an example of processing in a region information embedding unit 104. FIG. 領域情報の配眮状態の䞀䟋を瀺す図である。It is a figure which shows an example of the arrangement | positioning state of area | region information. 第の実斜圢態に係るステップの詳现な動䜜手順を瀺す図である。It is a figure which shows the detailed operation | movement procedure of step S203 which concerns on 2nd Embodiment. コンピュヌタのシステム構成を瀺す図である。2 is a diagram illustrating a system configuration of a computer 1201. FIG.

笊号の説明Explanation of symbols

 文曞画像
 画像入力郚
 分割郚
 倖接矩圢抜出郚
 領域情報埋め蟌み郚
 透かし情報
 透かし情報埋め蟌み郚
DESCRIPTION OF SYMBOLS 100 Document image 101 Image input part 102 Dividing part 103 circumscribed rectangle extraction part 104 Area information embedding part 105 Water mark information 106 Water mark information embedding part

Claims (9)

文曞画像に透かし情報を埋め蟌む画像凊理装眮であっお、
前蚘文曞画像を入力する入力手段ず、
入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割手段ず、
前蚘テキスト領域に含たれる文字に倖接する倖接矩圢を抜出する抜出手段ず、
各文字がいずれのテキスト領域に属するかを瀺す情報であっお、少なくずも隣り合う前蚘テキスト領域には互いに異なる領域情報を、前蚘抜出手段で抜出した前蚘倖接矩圢に埓っお、各文字に埋め蟌む第の埋め蟌み手段ず、
前蚘第の埋め蟌み手段で前蚘領域情報が埋め蟌たれた各テキスト領域に、前蚘第の埋め蟌み手段ずは異なる埋め蟌みアルゎリズムに埓っお、前蚘透かし情報を埋め蟌む第の埋め蟌み手段ず、
を備えるこずを特城ずする画像凊理装眮。
An image processing apparatus for embedding watermark information in a document image,
Input means for inputting the document image;
A dividing unit that divides the input document image into a text area composed of characters and a non-text area other than the text area;
Extracting means for extracting a circumscribed rectangle circumscribing characters included in the text area;
A first embedding of information indicating which text area each character belongs to, and embedding different area information in at least the adjacent text area in each character according to the circumscribed rectangle extracted by the extracting means Means,
A second embedding unit that embeds the watermark information in each text region in which the region information is embedded by the first embedding unit, according to an embedding algorithm different from the first embedding unit;
An image processing apparatus comprising:
透かし情報が埋め蟌たれた文曞画像から前蚘透かし情報を抜出する画像凊理装眮であっお、
前蚘文曞画像を入力する入力手段ず、
入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割手段ず、
前蚘テキスト領域に含たれる文字に倖接する倖接矩圢毎に、各文字がいずれのテキスト領域に属するかを瀺す領域情報を抜出する第の抜出手段ず、
泚目するテキスト領域から異なる前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域に同じ前蚘領域情報のみを含むように、前蚘泚目するテキスト領域を再分割し、たた、前蚘泚目するテキスト領域に隣り合うテキスト領域から同じ前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域ず同じ前蚘領域情報が抜出されたテキスト領域ずを合䜵するように蚂正する蚂正手段ず、
前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する第の抜出手段ず、
を備えるこずを特城ずする画像凊理装眮。
An image processing apparatus for extracting the watermark information from a document image in which watermark information is embedded,
Input means for inputting the document image;
A dividing unit that divides the input document image into a text area composed of characters and a non-text area other than the text area;
First extraction means for extracting region information indicating which text region each character belongs to for each circumscribed rectangle circumscribing the character included in the text region;
When different region information is extracted from the target text region, the target text region is subdivided so that only the same region information is included in the target text region, and the target text region Correction means for correcting so as to merge the text area from which the same area information is extracted with the text area of interest when the same area information is extracted from adjacent text areas;
Second extraction means for extracting the watermark information embedded for each text region;
An image processing apparatus comprising:
前蚘第の埋め蟌み手段は、前蚘テキスト領域毎に含たれる各文字を前蚘領域情報に察応するマスクパタヌンでマスクするこずにより、前蚘テキスト領域に前蚘領域情報を埋め蟌み、たた、前蚘倖接矩圢間の前埌間隔又は前蚘倖接矩圢で構成される行間の䞊䞋間隔を倉曎するこずにより、前蚘テキスト領域に前蚘透かし情報を埋め蟌むこずを特城ずする請求項に蚘茉の画像凊理装眮。   The first embedding means embeds the area information in the text area by masking each character included in each text area with a mask pattern corresponding to the area information, and before and after the circumscribed rectangle. The image processing apparatus according to claim 1, wherein the watermark information is embedded in the text area by changing an interval or an upper and lower interval between lines constituted by the circumscribed rectangle. 前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する順序を瀺す順序情報を埋め蟌む第の埋め蟌み手段を曎に備え、
前蚘第の埋め蟌み手段は、前蚘テキスト領域内の倖呚に䜍眮する文字に前蚘領域情報を埋め蟌み、
前蚘第の埋め蟌み手段は、前蚘テキスト領域内の倖呚に䜍眮する文字以倖の文字に前蚘順序情報を埋め蟌むこずを特城ずする請求項に蚘茉の画像凊理装眮。
A third embedding unit for embedding order information indicating an order of extracting the watermark information embedded for each of the text areas;
The first embedding means embeds the region information in characters located on the outer periphery in the text region,
The image processing apparatus according to claim 1, wherein the third embedding unit embeds the order information in characters other than characters located on an outer periphery in the text area.
前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する順序を瀺す順序情報を抜出する第の抜出手段を曎に備え、
前蚘第の抜出手段は、抜出された前蚘順序情報に埓っお、前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出するこずを特城ずする請求項に蚘茉の画像凊理装眮。
A third extracting means for extracting order information indicating an order of extracting the watermark information embedded in each text region;
The image processing apparatus according to claim 2, wherein the third extraction unit extracts the watermark information embedded for each of the text regions in accordance with the extracted order information.
文曞画像に透かし情報を埋め蟌む画像凊理方法であっお、
前蚘文曞画像を入力する入力工皋ず、
入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割工皋ず、
前蚘テキスト領域に含たれる文字に倖接する倖接矩圢を抜出する抜出工皋ず、
各文字がいずれのテキスト領域に属するかを瀺す情報であっお、少なくずも隣り合う前蚘テキスト領域には互いに異なる領域情報を、前蚘抜出工皋で抜出した前蚘倖接矩圢に埓っお、各文字に埋め蟌む第の埋め蟌み工皋ず、
前蚘第の埋め蟌み工皋で前蚘領域情報が埋め蟌たれた各テキスト領域に、前蚘第の埋め蟌み工皋ずは異なる埋め蟌みアルゎリズムに埓っお、前蚘透かし情報を埋め蟌む第の埋め蟌み工皋ず、
を備えるこずを特城ずする画像凊理方法。
An image processing method for embedding watermark information in a document image,
An input step of inputting the document image;
A division step of dividing the input document image into a text area composed of characters and a non-text area other than the text area;
An extraction step of extracting a circumscribed rectangle circumscribing the characters included in the text region;
A first embedding of information indicating which text area each character belongs to, and embedding different area information in at least the adjacent text areas in each character according to the circumscribed rectangle extracted in the extraction step Process,
A second embedding step of embedding the watermark information in each text region in which the region information is embedded in the first embedding step, according to an embedding algorithm different from the first embedding step;
An image processing method comprising:
透かし情報が埋め蟌たれた文曞画像から前蚘透かし情報を抜出する画像凊理方法であっお、
前蚘文曞画像を入力する入力工皋ず、
入力された前蚘文曞画像を文字で構成されるテキスト領域ず、前蚘テキスト領域以倖の非テキスト領域ずに分割する分割工皋ず、
前蚘テキスト領域に含たれる文字に倖接する倖接矩圢毎に、各文字がいずれのテキスト領域に属するかを瀺す領域情報を抜出する第の抜出工皋ず、
泚目するテキスト領域から異なる前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域に同じ前蚘領域情報のみを含むように、前蚘泚目するテキスト領域を再分割し、たた、前蚘泚目するテキスト領域に隣り合うテキスト領域から同じ前蚘領域情報が抜出された堎合には、前蚘泚目するテキスト領域ず同じ前蚘領域情報が抜出されたテキスト領域ずを合䜵するように蚂正する蚂正工皋ず、
前蚘テキスト領域毎に埋め蟌たれた前蚘透かし情報を抜出する第の抜出工皋ず、
を備えるこずを特城ずする画像凊理方法。
An image processing method for extracting the watermark information from a document image in which watermark information is embedded,
An input step of inputting the document image;
A division step of dividing the input document image into a text area composed of characters and a non-text area other than the text area;
A first extraction step of extracting region information indicating which text region each character belongs to for each circumscribed rectangle circumscribing a character included in the text region;
When different region information is extracted from the target text region, the target text region is subdivided so that only the same region information is included in the target text region, and the target text region When the same area information is extracted from adjacent text areas, a correction step for correcting the merged text area from which the same text information is extracted as the target text area,
A second extraction step of extracting the watermark information embedded for each text region;
An image processing method comprising:
コンピュヌタが読み蟌み実行するこずで、請求項又はに蚘茉の各工皋をコンピュヌタに実行させるコンピュヌタプログラム。   The computer program which makes a computer perform each process of Claim 6 or 7 when a computer reads and executes. 請求項に蚘茉のコンピュヌタプログラムを栌玍したこずを特城ずするコンピュヌタ可読蚘憶媒䜓。   A computer-readable storage medium storing the computer program according to claim 8.
JP2007313945A 2007-12-04 2007-12-04 Apparatus and method of processing image Withdrawn JP2009141525A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007313945A JP2009141525A (en) 2007-12-04 2007-12-04 Apparatus and method of processing image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007313945A JP2009141525A (en) 2007-12-04 2007-12-04 Apparatus and method of processing image

Publications (1)

Publication Number Publication Date
JP2009141525A true JP2009141525A (en) 2009-06-25

Family

ID=40871728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007313945A Withdrawn JP2009141525A (en) 2007-12-04 2007-12-04 Apparatus and method of processing image

Country Status (1)

Country Link
JP (1) JP2009141525A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567938A (en) * 2010-12-23 2012-07-11 北倧方正集团有限公叞 Watermark image blocking method and device for western language watermark processing
CN115063279A (en) * 2022-03-25 2022-09-16 北京囜隐科技有限公叞 Method and device for preprocessing text watermark image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567938A (en) * 2010-12-23 2012-07-11 北倧方正集团有限公叞 Watermark image blocking method and device for western language watermark processing
CN115063279A (en) * 2022-03-25 2022-09-16 北京囜隐科技有限公叞 Method and device for preprocessing text watermark image
CN115063279B (en) * 2022-03-25 2023-03-14 北京囜隐科技有限公叞 Method and device for preprocessing text watermark image

Similar Documents

Publication Publication Date Title
JP4310288B2 (en) Image processing apparatus and method, program, and storage medium
JP2006251902A (en) Device, program, and method for generating translation document image
JP2006050551A (en) Image processing apparatus, image processing method, program and storage medium
JP2001319240A (en) Device and method for recognizing image, and computer- readable recording medium with image recognizing program recorded thereon
KR100905857B1 (en) Information processing device and method of controlling the same
US8139237B2 (en) Image generating apparatus, image processing apparatus, recording medium and computer readable recording medium
US8493629B2 (en) Image processing apparatus, method, and computer program
US8660357B2 (en) Image processing apparatus, method, and computer program
JP2010056691A (en) Device and method for processing image
JP4893643B2 (en) Detection method and detection apparatus
JP2009141525A (en) Apparatus and method of processing image
JP4689570B2 (en) Image processing apparatus and image processing method
JP2003046746A (en) Method and apparatus for processing image
JP2006237858A (en) Image processing apparatus, image processing method, program for allowing computer to execute the method, and recording medium
JP4998176B2 (en) Translation apparatus and program
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP2006072839A (en) Image processing method, image processing apparatus, image processing program and recording medium
JP4552757B2 (en) Image processing apparatus, image processing method, and image processing program
JP3720748B2 (en) Image processing apparatus, control method therefor, computer program, and recording medium
JP2010009146A (en) Document processing method and document processor
JP2007249580A (en) Image processor, image processing program and image processing method
JP2007096503A (en) Image processing apparatus, image processing method, and image processing program
JP2008098947A (en) Image processor and image processing method
JP5173690B2 (en) Information processing apparatus, information processing method, computer program, and computer-readable recording medium
JP2006261772A (en) Image forming apparatus and image forming method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110301