JP2009111984A - Information processing apparatus and method, computer program and computer-readable recording medium - Google Patents
Information processing apparatus and method, computer program and computer-readable recording medium Download PDFInfo
- Publication number
- JP2009111984A JP2009111984A JP2008237188A JP2008237188A JP2009111984A JP 2009111984 A JP2009111984 A JP 2009111984A JP 2008237188 A JP2008237188 A JP 2008237188A JP 2008237188 A JP2008237188 A JP 2008237188A JP 2009111984 A JP2009111984 A JP 2009111984A
- Authority
- JP
- Japan
- Prior art keywords
- information
- character
- electronic document
- image
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Processing (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、文書へ情報を埋め込む技術に関する。 The present invention relates to a technique for embedding information in a document.
文書に情報を埋め込み、埋め込んだ情報(一般に、透かし情報と呼ばれる。)を抽出する技術は、文書のセキュリティを向上させるために有用である。 A technique for embedding information in a document and extracting the embedded information (generally called watermark information) is useful for improving the security of the document.
例えば、文字画像の配置位置を調整することで文書画像に透かし情報を埋め込み、その文書画像を印刷文書として出力する。その出力された印刷文書をスキャナ等で取り込むことで文書画像として、その文書画像から透かし情報を抽出するものである(特許文献1)。この技術では、複写によって文字画像の配置位置が変化しにくいため、複写耐性を持つ。 For example, watermark information is embedded in the document image by adjusting the arrangement position of the character image, and the document image is output as a print document. The output print document is captured by a scanner or the like, and watermark information is extracted from the document image as a document image (Patent Document 1). This technique has copy resistance because the arrangement position of the character image is not easily changed by copying.
一方、ページ記述によって記述されたテキストを含む電子文書データの配置情報を変更して透かし情報を埋め込んだ後、その電子文書データから透かし情報を抽出するものである(特許文献2)。ここで、ページ記述された電子文書データはプリンタに対して出力を指示するための言語である。文字や図形等を各プリンタに応じた最適な文字質や画質で印刷することができ、一般的なレーザープリンタで利用されている。特許文献1の技術では文書画像に対して透かし情報の埋め込みを行うため、最適な文字質や画質で印刷できない。従って、ページ記述された電子文書データに対しての埋め込みが必要と考えられる。
しかしながら、特許文献1の技術は、文書画像上で透かし情報を埋め込むものであり、電子文書データとして出力するには文書画像から電子文書データへの変換が必要である。この変換を行う際、ブロックセレクションや光学文字認識(以下、OCR)等を行うが、OCRによる誤差又はアウトラインフォントの描画処理時に文字質を向上させるヒンティング処理の影響等で文字間隔が変化してしまうことがある。そのため、文書画像上で透かし情報を埋め込み、埋め込み後に電子データを変換したものから、埋め込まれていた透かし情報が正しく抽出できない場合があった。また、上記の変換の処理量が多い。 However, the technique of Patent Document 1 embeds watermark information on a document image, and conversion from a document image to electronic document data is necessary to output it as electronic document data. When this conversion is performed, block selection, optical character recognition (hereinafter referred to as OCR), etc. are performed, but the character spacing changes due to an error due to OCR or the effect of hinting processing that improves the character quality during outline font drawing processing. It may end up. For this reason, there is a case where the embedded watermark information cannot be correctly extracted from the watermark information embedded in the document image and the electronic data converted after the embedding. In addition, the amount of processing of the conversion is large.
一方、特許文献2の技術は、電子文書データ上で透かし情報を埋め込むものであるため、それを印刷文書として出力した場合に、文書画像上で電子文書データに埋め込まれた透かし情報と同一の透かし情報を抽出することができない場合が多い。
On the other hand, since the technique of
従って、本発明の目的は、電子文書データに対して、構成画像の配置を操作する透かし情報の埋め込み及び、その印刷文書から埋め込まれた透かし情報を抽出可能である情報の埋め込み技術を提供することにある。 Therefore, an object of the present invention is to provide an information embedding technique capable of embedding watermark information for manipulating the arrangement of constituent images in electronic document data and extracting the embedded watermark information from the printed document. It is in.
上記課題を解決するため、本発明に係る情報処理装置は、入力された電子文書データに情報を埋め込む情報処理装置であって、前記電子文書データから文書画像を生成する画像生成手段と、前記生成された文書画像中の各構成画像のレイアウト情報を検出する検出手段と、前記検出されたレイアウト情報に基づいて、各構成画像の配置を正規化するための正規化情報を算出する算出手段と、前記算出された正規化情報に基づいて、前記電子文書データを変更し、変更された電子文書データに情報を埋め込む埋め込み手段と、を備える。 In order to solve the above-described problems, an information processing apparatus according to the present invention is an information processing apparatus that embeds information in input electronic document data, and includes an image generation unit that generates a document image from the electronic document data, and the generation Detection means for detecting layout information of each component image in the document image, and calculation means for calculating normalization information for normalizing the arrangement of each component image based on the detected layout information; Embedding means for changing the electronic document data based on the calculated normalization information and embedding information in the changed electronic document data.
また、本発明に係る情報処理方法は、入力された電子文書データに情報を埋め込む情報処理方法であって、前記電子文書データから文書画像を生成する画像生成工程と、前記生成された文書画像中の各構成画像のレイアウト情報を検出する検出工程と、前記検出されたレイアウト情報に基づいて、各構成画像の正規化するための正規化情報を算出する算出工程と、前記算出された正規化情報に基づいて、前記電子文書データを変更し、変更された電子文書データに情報を埋め込む埋め込み工程と、を有する。 An information processing method according to the present invention is an information processing method for embedding information in input electronic document data, and includes an image generation step of generating a document image from the electronic document data, and the generated document image A detection step of detecting layout information of each component image, a calculation step of calculating normalization information for normalizing each component image based on the detected layout information, and the calculated normalization information And changing the electronic document data and embedding information in the changed electronic document data.
本発明によれば、電子文書データに対して、構成画像の配置を操作する透かし情報の埋め込み、その印刷文書から、埋め込まれた透かし情報を抽出可能である情報の埋め込み技術を提供することができる。 According to the present invention, it is possible to provide an information embedding technique capable of embedding watermark information for manipulating the arrangement of constituent images in electronic document data and extracting the embedded watermark information from the printed document. .
以下、添付図面に従って、本発明に係る実施形態を詳細に説明する。 Embodiments according to the present invention will be described below in detail with reference to the accompanying drawings.
<第1の実施形態>
図1は、本発明の第1の実施形態及び第2の実施形態に係る透かし情報埋め込み装置100の概念的な構成図である。
<First Embodiment>
FIG. 1 is a conceptual configuration diagram of a watermark information embedding device 100 according to the first embodiment and the second embodiment of the present invention.
透かし情報埋め込み装置(情報処理装置)100は、入力された電子文書データAから文書画像を生成し、文書画像に基づいて、電子文書データAを変更し、電子文書データAに透かし情報Bを埋め込む装置である。なお、文書画像は文字を含んだ画像データ(例えば、ビットマップ形式データ)とし、電子文書データはそれ以外のテキストデータとする。また、透かし情報埋め込み装置100は、ページ記述された電子文書データ(以下、ページ記述データ)Aを入力する電子文書データ入力部101を有する。また、電子文書データ入力部101によって入力されたページ記述データAから文書画像を生成する文書画像生成部102を有する。また、文書画像生成部102によって生成された文書画像中の各文字画像の外接矩形に関するレイアウト情報を検出する文書解析部103を有する。文書画像生成部102は、文書解析部103がレイアウト情報を検出可能である解像度で文書画像を生成する。また、文書解析部103で検出されたレイアウト情報に基づいて、注目する外接矩形(以下、注目矩形と言う。)と、この注目矩形に隣接する外接矩形との間における間隔を正規化するための正規化情報を算出する正規化情報算出部104を有する。
The watermark information embedding device (information processing device) 100 generates a document image from the input electronic document data A, changes the electronic document data A based on the document image, and embeds the watermark information B in the electronic document data A. Device. The document image is image data including characters (for example, bitmap format data), and the electronic document data is other text data. The watermark information embedding device 100 has an electronic document
さらに、電子文書データ入力部101で入力された電子文書データを変更部105で正規化情報に基づいて変更する。さらに、透かし情報Bを入力する透かし情報入力部106と、透かし情報入力部106から入力された透かし情報Bに基づいて、電子文書データ上の正規化された間隔を調整することにより、透かし情報Bを埋め込む埋め込み部107を有する。さらに、透かし情報Bが埋め込まれた埋め込み文書印刷物Cとして出力する出力部108を有する。
Further, the electronic document data input by the electronic document
図2は、第1の実施形態及び第2の実施形態に係る透かし情報埋め込み装置100の動作手順を示すフローチャートであり、図3は、文字間隔の組の例を示す図である。 FIG. 2 is a flowchart showing an operation procedure of the watermark information embedding device 100 according to the first and second embodiments, and FIG. 3 is a diagram showing an example of a set of character intervals.
まず、ステップS201において、ページ記述データAが電子文書データ入力部101に入力される。ページ記述データAは、プリンタに描画を指示したり、モニタに表示させたりするためのデータである。例えば、PS(Post Script)、XPS(XML Paper Specification)、及びPDF(Portable Document Format)が挙げられる。なお、ここでは、ページ記述データの例を示すが、ページ記述データ以外の電子文書データ、例えば、テキストファイルにも適用可能である。
First, in step S 201, page description data A is input to the electronic document
ステップS202において、文書画像生成部102でページ記述データAから文書画像を生成する。なお、文書画像の解像度は正規化情報を誤りなく算出可能であるならば、生成時の規定の解像度よりも低くして良い。これによって、処理の高速化や画像を記憶する領域の削減が図れる。例えば、生成時の解像度create_dpiは次のように設定できる。まず、いくつかのページ記述データから文書画像を生成し、以下で説明する文字間隔の最小値space_minを求めておく。そして、規定の解像度order_dpiをspace_minを割った値以上で設定できる一番低い解像度を生成時の解像度create_dpiとする。つまり、order_dpiが600、space_minが4とすると、create_dpiは600/4=150dpiとなる。この方法では、最小の文字間隔が縮小によって消滅し把握できなくなることはない。従って、正規化情報を誤りなく算出できる。
In step S202, the document
ステップS203において、生成された文書画像から外接矩形(文字領域)が検出される。外接矩形は、図3で示すように、文字に外接する矩形である。また、外接矩形は、本来、文字認識を行う領域を示すものであるが、透かし情報技術においては、埋め込み操作の対象となる文字領域を示すものである。 In step S203, a circumscribed rectangle (character area) is detected from the generated document image. The circumscribed rectangle is a rectangle circumscribing the character as shown in FIG. The circumscribed rectangle originally indicates an area where character recognition is performed. In the watermark information technique, the circumscribed rectangle indicates a character area to be embedded.
外接矩形を検出する際には、まず、文書画像の各画素値を垂直座標軸に対して射影し、空白部分(黒色である文字のない部分)を探索して行を判別して行分割を行う。その後、行単位で文書画像を水平座標軸に対して射影し、空白部分を探索して文字単位に分割する。これにより、各文字を外接矩形で切り出すことが可能となり、外接矩形を検出することができる。 When detecting a circumscribed rectangle, first, each pixel value of the document image is projected onto the vertical coordinate axis, and a line is divided by searching for a blank portion (a portion without a black character) to determine a row. . Thereafter, the document image is projected on the horizontal coordinate axis line by line, and a blank portion is searched and divided into characters. Thereby, each character can be cut out by a circumscribed rectangle, and the circumscribed rectangle can be detected.
このようにして、外接矩形が検出された場合には、ステップS204において、外接矩形から文書画像の文字間隔が算出される。なお、文字間隔は、例えば、図3のP又はSで示すように、注目矩形と、注目矩形に隣接する外接矩形と、の間の間隔のことである。その後、ステップS204で算出された文字間隔に基づいて、ステップS205において、文字間隔を正規化するための正規化情報を算出する。なお、ステップS205の詳細については後述する。 When the circumscribed rectangle is detected in this way, the character spacing of the document image is calculated from the circumscribed rectangle in step S204. Note that the character spacing is, for example, the spacing between the target rectangle and the circumscribed rectangle adjacent to the target rectangle, as indicated by P or S in FIG. After that, based on the character spacing calculated in step S204, normalization information for normalizing the character spacing is calculated in step S205. Details of step S205 will be described later.
ステップS206において、ステップ205で算出された正規化情報に基づいて、ページ記述データを変更する。なお、ステップS206の詳細については後述する。次に、ステップS207において、埋め込むべき透かし情報Bが透かし情報入力部106から入力され、変更されたページ記述データ上の文字間隔を調整することによって、透かし情報Bが埋め込まれる。なお、ステップS207の詳細については後述する。
In step S206, the page description data is changed based on the normalization information calculated in
最後に、ステップS208において、透かし情報Bが埋め込まれた埋め込み文書印刷物Cが出力される。 Finally, in step S208, the embedded document printed matter C in which the watermark information B is embedded is output.
[正規化情報算出部104(ステップS205)]
図4は、第1の実施形態に係る正規化情報算出部104の動作手順を示すフローチャートである。正規化情報算出部104での処理は、注目矩形と、注目矩形の前に隣接する外接矩形(以下、前矩形と言う。)及び注目矩形の後ろに隣接する外接矩形(以下、後矩形と言う。)と、の間の文字間隔を調整する。なお、図3で示すように、注目矩形と前矩形との間の文字間隔をP、注目矩形と後矩形との間の文字間隔をSとする。
[Normalized information calculation unit 104 (step S205)]
FIG. 4 is a flowchart showing an operation procedure of the normalized
まず、ステップS205aにおいて、注目矩形に隣接する前後の文字間隔の組P、Sを選択する。P、Sは、例えば、ある行の外接矩形の数が30である場合(但し、文字数が30であるとは限らない。)には、その行の両端の外接矩形は除外し、偶数番目の外接矩形に着目する。 First, in step S205a, a pair P and S of character intervals before and after adjacent to the target rectangle are selected. For example, when the number of circumscribed rectangles in a line is 30 (however, the number of characters is not necessarily 30), P and S exclude the circumscribed rectangles at both ends of the line, and even-numbered Focus on the circumscribed rectangle.
電子文書データ入力部101から入力されたページ記述データAにおいて、前述の文字間隔P、Sに対応し、ページ記述データ上の文字間隔を操作できる値である次の文字までの距離をA0、B0とする。なお、A0、B0は、例えば、図6で示すように、ページ記述データ601内で数値化されて表現される。また、文字とA0、B0との対応関係を図14に示す。図14のように、例えば、A0は「デ」の描画開始位置から「ジ」の描画開始位置までの距離を示しており、その距離は44pixelである。なお、ページ記述データの種類によっては次の文字までの距離ではなく、ページ記述データ上の文字間隔そのものであったりするが、文字間隔を操作できる値であれば、本発明が適用できるのはいうまでもない。
In the page description data A input from the electronic document
次に、ステップS205bにおいて、PとSとの値が等しいか否かが判断される。ステップS205bで、PとSとの値が等しいと判断された場合には、ステップS205cに進み、PとSとの値が等しくないと判断された場合には、ステップS205dに進む。 Next, in step S205b, it is determined whether or not the values of P and S are equal. If it is determined in step S205b that the values of P and S are equal, the process proceeds to step S205c. If it is determined that the values of P and S are not equal, the process proceeds to step S205d.
ステップS205cにおいて、ページ記述データ上の値であるA0、B0のそれぞれに対応する正規化情報であるX、Yの値を0とする。 In step S205c, the values of X and Y that are normalization information corresponding to the values A0 and B0 on the page description data are set to zero.
ステップS205dにおいて、文字間隔P及びSの値の平均値Z=(P+S)/2を算出する。なお、ページ記述データAの文字間隔において、小数点以下を使用しない場合には、Zは小数点以下の切り捨て、切り上げ等の処理が行われる。 In step S205d, an average value Z = (P + S) / 2 of the character spacings P and S is calculated. Note that in the character spacing of the page description data A, when the decimal part is not used, Z is subjected to processing such as rounding down or rounding up.
ステップS205eにおいて、P及びSの値とZを用いて、X及びYをそれぞれX=Z−P、Y=Z−Sとして算出する。
最後に、ステップS205fにおいて、注目矩形が文書画像の最終の外接矩形であるか否かを判断する。注目矩形が最終の外接矩形であると判断された場合には、ステップS205を終了し、注目矩形が最終の外接矩形ではないと判断された場合には、ステップS205aに戻る。
In step S205e, using the values of P and S and Z, X and Y are calculated as X = Z−P and Y = Z−S, respectively.
Finally, in step S205f, it is determined whether the target rectangle is the final circumscribed rectangle of the document image. If it is determined that the target rectangle is the final circumscribed rectangle, step S205 is ended. If it is determined that the target rectangle is not the final circumscribed rectangle, the process returns to step S205a.
[変更部105(ステップS206)]
図5は、第1の実施形態に係る変更部105の動作手順を示すフローチャートである。変更部105は、上述の算出した正規化情報に基づいて、次の文字までの距離を変更する。その結果としてページ記述データ上の文字間隔が正規化される。
[Change unit 105 (step S206)]
FIG. 5 is a flowchart showing an operation procedure of the changing
まず、ステップS206aにおいて、隣接する前後の文字間隔の組P、Sに対応した文字情報である次の文字までの距離A0、B0を選択する。 First, in step S206a, distances A0 and B0 to the next character, which is character information corresponding to the adjacent character spacing sets P and S, are selected.
次に、ステップS206bにおいて、変更後の次の文字までの距離A1、B1をA1=A0+α×X、B1=B0+α×Yとして算出し、データ内容を変更する。ここで、αは文書画像をページ記述データに対応させる係数である、予め設定した値でもよいし、新たに入力した値でもよい。 Next, in step S206b, the distances A1 and B1 to the next character after the change are calculated as A1 = A0 + α × X and B1 = B0 + α × Y, and the data content is changed. Here, α may be a preset value or a newly input value that is a coefficient for associating the document image with the page description data.
最後に、ステップS206cにおいて、P、Sに対応した文字情報が最後であるか否かを判断する。ステップS206cで、文字情報が最後であると判断された場合には、ステップS206が終了し、文字情報が最後でないと判断された場合には、ステップS206aに戻る。 Finally, in step S206c, it is determined whether or not the character information corresponding to P and S is the last. If it is determined in step S206c that the character information is the last, step S206 is ended. If it is determined that the character information is not the last, the process returns to step S206a.
以上より、文字間隔が正規化されるため、ページ記述データから文字間隔の情報を得られなくとも埋め込みが可能になる。 As described above, since the character spacing is normalized, it is possible to embed even if character spacing information cannot be obtained from the page description data.
[埋め込み部107(ステップS207)]
図15は、第1の実施形態に係る埋め込み部107の動作手順を示すフローチャートである。埋め込み部107は、ページ記述データ上の隣接する前後の文字間隔の大小関係を次の文字までの距離を用いて操作し、ページ記述データAに透かし情報Bを挿入する。
[Embedding unit 107 (step S207)]
FIG. 15 is a flowchart showing an operation procedure of the embedding
まず、ステップS207aにおいて、次の文字までの距離A1、B1を選択する。ステップS207bにおいて、透かし情報入力部106より入力された透かし情報Bのビット列の中から埋め込むべき透かしビットを選択する。本実施形態では、透かし情報Bは、0又は1のビット列として構成される。
First, in step S207a, distances A1 and B1 to the next character are selected. In step S207b, a watermark bit to be embedded is selected from the bit string of the watermark information B input from the watermark
次に、ステップS207cにおいて、ステップS207bで選択され、埋め込まれた透かしビットが1であるか否かを判断する。ステップS207cで、埋め込まれた透かしビットが1であると判断された場合には、ステップS207dにおいて、B1に対応した文字間隔よりもA1に対応した文字間隔の方が大きくなるように、透かし情報の埋め込みを行う。すなわち、埋め込み後の次の文字までの距離A2、B2をA2=A1+γ、B2=B2−γとして算出し、透かし情報の埋め込みを行う。ここで、γは任意の正の値である。 Next, in step S207c, it is determined whether or not the watermark bit selected and embedded in step S207b is 1. If it is determined in step S207c that the embedded watermark bit is 1, in step S207d, the watermark information of the watermark information is set so that the character interval corresponding to A1 is larger than the character interval corresponding to B1. Perform embedding. That is, the distances A2 and B2 to the next character after embedding are calculated as A2 = A1 + γ and B2 = B2-γ, and watermark information is embedded. Here, γ is an arbitrary positive value.
一方、ステップS207cで、埋め込まれた透かしビットが1ではない、すなわち、埋め込まれた透かしビットが0であると判断された場合には、ステップS207eに進む。ここでは、B1に対応した文字間隔よりもA1に対応した文字間隔の方が小さくなるように、透かし情報の埋め込みを行う。すわなち、埋め込み後の次の文字までの距離A2、B2をA2=A1−γ、B2=B2+γとして算出し、透かし情報の埋め込みを行う。なお、ステップS207d及びステップS207eにおいて、次の文字までの距離の増減を任意の正の値であるγで操作した。この結果、文書画像中における注目矩形を移動する操作と同様の効果が得られる。 On the other hand, if it is determined in step S207c that the embedded watermark bit is not 1, that is, the embedded watermark bit is 0, the process proceeds to step S207e. Here, the watermark information is embedded so that the character interval corresponding to A1 is smaller than the character interval corresponding to B1. That is, the distances A2 and B2 to the next character after embedding are calculated as A2 = A1−γ and B2 = B2 + γ, and watermark information is embedded. In steps S207d and S207e, the increase / decrease of the distance to the next character was manipulated with an arbitrary positive value γ. As a result, the same effect as the operation of moving the target rectangle in the document image can be obtained.
これにより、ページ記述データ上の隣接する前後の文字間隔の大小関係を調整することによって、文字間隔の1組毎に1ビットの透かし情報(0又は1)が挿入される。例えば、1行に文字が30ある場合には、14ビット(=30/2−1)の透かし情報Bを埋め込むことができる。 Thus, by adjusting the size relationship between adjacent character intervals on the page description data, 1-bit watermark information (0 or 1) is inserted for each set of character intervals. For example, when there are 30 characters in one line, 14-bit (= 30 / 2-1) watermark information B can be embedded.
なお、本実施形態では、偶数番目の文字の位置を調整することでページ記述データに透かし情報Bを埋め込んだが、隣接する文字で位置を調整しなければよいため、奇数番目の文字の位置を調整することでページ記述データに透かし情報Bを埋め込んでもよい。 In this embodiment, the watermark information B is embedded in the page description data by adjusting the position of the even-numbered character. However, the position of the odd-numbered character is adjusted because it is not necessary to adjust the position with the adjacent character. By doing so, the watermark information B may be embedded in the page description data.
また、本実施形態では、文字の1つ置きに透かし情報Bを埋め込んだ。すなわち、埋め込み対象の文字の間に埋め込み対象外の文字を1つ設けた。これは、連続する文字に順番に透かし情報Bを埋め込んだ場合には、1つの文字間隔が隣接する文字同士で共有する状態となり、また、制御できるのが常に一つの次の文字までの距離となるためである。このため、徐々に誤差が累積されてしまい、レイアウト(配置情報)に大きく影響してしまうことによるものである。ただし、本発明は、文字間隔を用いて情報を埋め込む手法であれば、説明した手順に限定されるものではない。 In the present embodiment, the watermark information B is embedded every other character. That is, one non-embedding character is provided between the characters to be embedded. This is because when watermark information B is sequentially embedded in consecutive characters, one character interval is shared between adjacent characters, and the distance to one next character can always be controlled. It is to become. For this reason, errors are gradually accumulated, which greatly affects the layout (placement information). However, the present invention is not limited to the described procedure as long as information is embedded using character spacing.
最後に、ステップS207fにおいて、ページ記述データ上の文字情報が最後であるか否かを判断する。ステップS207fで、ページ記述データ上の文字情報が最後であると判断された場合には、ステップS207が終了し、ページ記述データ上の文字情報が最後でないと判断された場合には、ステップS207aに戻る。 Finally, in step S207f, it is determined whether or not the character information on the page description data is the last. If it is determined in step S207f that the character information on the page description data is the last, step S207 is terminated. If it is determined that the character information on the page description data is not the last, the process proceeds to step S207a. Return.
図6は、本実施形態におけるページ記述データの変化例を示す図である。まず、電子文書データ入力部101に入力された電子文書データが入力される。ここで、入力される電子文書データの一例が、ページ記述データ601である。また、ページ記述データ601中で、前述の文字間隔P及びSを操作できる値である次の文字までの距離を示す部分が次の文字までの距離データ601a、601bで示す部分である。ここでは、次の文字までの距離データ601a、601bの内で任意に選定した次の文字までの距離A0、B0に着目して説明する。
FIG. 6 is a diagram illustrating a change example of the page description data in the present embodiment. First, the electronic document data input to the electronic document
次に、変更部105において、文書画像中の文字間隔を正規化するための正規化情報に基づいて、電子文書データが変更される。ここで、変更された電子文書データの一例が、ページ記述データ602である。また、ページ記述データ602中で、次の文字までの距離データ601a、601bに対応する部分が次の文字までの距離データ602a、602bである。また、次の文字までの距離A0、B0に対応する部分が次の文字までの距離A1、B1であり、次の文字までの距離は、A0からA1、及びB0からB1に変更されたことがわかる。
Next, the
次に、埋め込み部107において、変更部105において変更された電子文書データに透かし情報Bが埋め込まれる。ここで、透かし情報埋め込み後の電子文書データの一例が、ページ記述データ603である。また、ページ記述データ602中で、次の文字までの距離データ602a、602bに対応する部分が603a、603bである。また、次の文字までの距離A1、B1に対応する部分が次の文字までの距離A2、B2であり、次の文字までの距離は、A1からA2、及びB1からB2に変更されたことがわかる。
Next, the embedding
図7は、第1の実施形態に係る透かし情報抽出装置(情報処理装置)700の構成図である。画像入力部701には、埋め込み文書印刷物Cが入力される。検出部702は、画像入力部701に入力された文書画像から文字の位置関係を解析する。透かし情報抽出部703は、文字の位置関係(文字間隔の大小関係)に埋め込まれた透かし情報Dを抽出して出力する。
FIG. 7 is a configuration diagram of a watermark information extraction apparatus (information processing apparatus) 700 according to the first embodiment. An embedded document print C is input to the
図8は、透かし情報抽出部703の動作手順を示すフローチャートである。まず、ステップS801において、透かし情報が埋め込まれた文書画像を入力する。スキャナ等の画像入力部701から埋め込み文書印刷物Cの文書画像が読込まれる。
FIG. 8 is a flowchart showing an operation procedure of the watermark information extraction unit 703. First, in step S801, a document image in which watermark information is embedded is input. The document image of the embedded document printed matter C is read from the
ステップS802において、検出部702で文書画像から外接矩形を検出する。次に、ステップS803において、検出部702で文字間隔を外接矩形から算出する。なお、算出手順は、透かし情報を埋め込む処理と同様に行うことができる。最後に、ステップS804において、透かし情報抽出部703で透かし情報を抽出する。この抽出処理は、注目矩形に隣接する前後の文字間隔の組P1、S1の大小関係によって、1組毎に1ビット(0又は1)の情報が抽出される。
In step S802, the
本実施形態によれば、文書画像の文字間隔の情報を電子文書データに反映させた後で、電子文書データ上で透かし情報を埋め込む。したがって、電子文書データに対して文字間隔を操作することで透かし情報を埋め込み、その印刷文書から透かし情報を抽出できる。また、文書画像上で埋め込み、ブロックセレクションやOCR等の処理を行ない、処理後の文書画像を電子文書データに変換するよりも文字間隔の誤差が発生しにくく、処理量が少ない。 According to this embodiment, after reflecting the character spacing information of the document image in the electronic document data, the watermark information is embedded in the electronic document data. Therefore, it is possible to embed watermark information by manipulating the character spacing for the electronic document data and extract the watermark information from the printed document. In addition, character spacing errors are less likely to occur and the amount of processing is smaller than when embedding on a document image, processing such as block selection or OCR, and converting the processed document image into electronic document data.
なお、本実施形態では、正規化情報を用いて電子文書データを変更した後に、透かし情報の埋め込みを行なった。しかしながら、文書画像の文字間隔の関係から正規化せずに透かし情報の埋め込みを直接行なっても良い。 In this embodiment, watermark information is embedded after electronic document data is changed using normalization information. However, the watermark information may be directly embedded without normalization because of the character spacing of the document image.
なお、本実施形態では、正規化情報算出から透かし情報の埋め込みまでの各処理を文書全体で行った。しかしながら、文書の行毎に前述の各処理を行っても良い。これによって、処理結果を記憶する領域の削減が図れる。 In the present embodiment, each process from normalization information calculation to watermark information embedding is performed on the entire document. However, the above-described processes may be performed for each line of the document. As a result, the area for storing the processing results can be reduced.
なお、本実施形態では、文字間隔を調整することによって透かし情報を埋め込む手法を説明したが、本発明は、行間隔を調整することによって透かし情報を埋め込む手法にも適用することができる。その場合は、本実施形態において、文字の外接矩形を処理対象である構成画像としたが、一行分の文字が含まれる外接矩形を、処理対象である構成画像とすればよい。 In this embodiment, the method of embedding watermark information by adjusting the character spacing has been described. However, the present invention can also be applied to a method of embedding watermark information by adjusting the line spacing. In this case, in the present embodiment, the circumscribed rectangle of the character is the component image to be processed, but the circumscribed rectangle including the character for one line may be the component image to be processed.
また、本発明は、文字間隔や行間隔を調整するだけでなく、図形と文字との間の間隔や、図形と図形との間の間隔を調整する場合にも適用することができる。また、本発明は、間隔を調整して情報を埋め込むだけでなく、図形や文字のサイズを変化させたり、これらの位置を調整することによって、透かし情報を埋め込む方式にも適用することができる。 The present invention can be applied not only to adjusting the character spacing and line spacing but also to adjusting the spacing between graphics and characters and the spacing between graphics and graphics. The present invention can be applied not only to embedding information by adjusting the interval, but also to a method of embedding watermark information by changing the size of a figure or character or adjusting the position thereof.
[第1の実施形態の変形例]
上述の第1の実施形態では、正規化情報算出部104において、文書画像から順々に文字間隔の組PとSを選択して正規化情報を算出した。しかしながら、図17に示すようにページ記述データ(1701)が認識する文字領域(1701a、1701b)と文書画像(1702)が認識する文字領域(1702a、1702b)とが異なる場合がある。この原因としては、例えば、1702cのようにブロックセレクションの結果、図の一部が文字として誤って認識する場合等が挙げられる。このような場合、ページ記述データに存在しない文字間隔を用いて正規化してしまう。その結果、透かし情報を埋め込むことができない。
[Modification of First Embodiment]
In the first embodiment described above, the normalization
そこで、ページ記述データにおいて文字コードが存在する行の座標と一致する座標を持つ行のみに対して、正規化情報を算出する。従って、ページ記述データの各行に透かし情報を埋め込むことができる確率が高くなる。 Therefore, normalization information is calculated only for lines having coordinates that match the coordinates of the lines in which character codes exist in the page description data. Therefore, the probability that watermark information can be embedded in each row of page description data is increased.
図16は、第1の実施形態の変形例に係る正規化情報算出部104の動作手順を示すフローチャートである。なお、ステップS206jからステップS206mの各処理はそれぞれステップS205bからステップS205eまでの各処理と同様であるため、説明を省略する。
FIG. 16 is a flowchart illustrating an operation procedure of the normalized
まず、ステップS206gにおいて、文書画像の行を選択する。例えば文書画像の右上に近い行から順々に選択する。 First, in step S206g, a line of a document image is selected. For example, selection is made in order from the line near the upper right of the document image.
ステップS206hにおいて、S206gで選択した行の始めの座標と一致する座標を持つ行がページ記述データに存在するか否かを判定する。文書画像における行の始めの座標は例えば、図17の1702dのような行の最初の文字の座標(水平座標=「741」、垂直座標=「5585」等)である。一方、ページ記述データにおける行の始めの座標は例えば、図17の1701dのように文字コードが存在する行の最初の数字(水平座標=「729」、垂直座標=「5584」等)で示される。ここで、座標の単位は文書画像及びページ記述データともにpixelである。なお、文字コードは存在しない図17の1701cのような絵に相当する部分の座標は除外する。これによって、文字部分のみに透かし情報の埋め込みが可能になる。ただし、ページ記述データの種類によっては文字部分のみに座標が割り当てられている場合も考えられる。その場合は、ページ記述データの全ての座標を判定対象とすればよい。 In step S206h, it is determined whether or not there is a line in the page description data having a coordinate that coincides with the first coordinate of the line selected in S206g. The coordinates of the beginning of the line in the document image are, for example, the coordinates of the first character of the line such as 1702d in FIG. 17 (horizontal coordinates = “741”, vertical coordinates = “5585”, etc.). On the other hand, the coordinates of the beginning of the line in the page description data are indicated by, for example, the first number (horizontal coordinate = “729”, vertical coordinate = “5584”, etc.) of the line where the character code exists as shown by 1701d in FIG. . Here, the unit of coordinates is pixel for both the document image and the page description data. Note that the coordinates of a portion corresponding to a picture such as 1701c in FIG. This makes it possible to embed watermark information only in the character portion. However, depending on the type of page description data, the coordinates may be assigned only to the character portion. In that case, all the coordinates of the page description data may be determined.
座標が一致するか否かの判定において、ページ記述データの座標と文書画像の座標には文書画像の生成方法によって、多少の誤差が生じると考えられる。従って、誤差を考慮して、例えば、座標差が20以下なら同じ行と判定する。誤差を考慮して図17では、文書画像1702の水平座標=「741」、垂直座標=「5585」とページ記述データ1701の水平座標=「729」、垂直座標=「5584」が一致すると判定できるため、行が存在することが分かる。
In determining whether or not the coordinates match, it is considered that some errors occur between the coordinates of the page description data and the coordinates of the document image depending on the document image generation method. Therefore, considering the error, for example, if the coordinate difference is 20 or less, it is determined that the same row. In consideration of the error, it can be determined in FIG. 17 that the horizontal coordinate = “741” and the vertical coordinate = “5585” of the
また、ページ記述データの各行の座標データは、例えばステップS201のページ記述データ読み込み時に全て取得しメモリ等に予め保持される。ただし、ステップS206hの処理で逐次座標データを探索してもよい。 Further, the coordinate data of each line of the page description data is acquired, for example, when the page description data is read in step S201, and is stored in advance in a memory or the like. However, the coordinate data may be searched sequentially in the process of step S206h.
ステップS206hにおいて、行が存在する場合は、ステップS206iにおいて、行の始めから順々に文字間隔の組PとSを選択し、ステップS206jからステップS206mまでの各処理を場合に応じて行なう。そして、ステップS206nにおいて、行の終わりか否かを判定し、行の終わりまで処理を行ない、ステップS206oに進む。ステップS206oにおいて文書の終わりか否かを判定する。文書の終わりではないなら、ステップS206gに進み、文書の終わりなら、ステップS206を終了する。一方、S206hにおいて、行が存在しない場合は、ステップS206oに進む。 In step S206h, if there is a line, character spacing sets P and S are selected in order from the beginning of the line in step S206i, and the processes from step S206j to step S206m are performed according to circumstances. In step S206n, it is determined whether or not it is the end of the line, processing is performed until the end of the line, and the process proceeds to step S206o. In step S206o, it is determined whether or not it is the end of the document. If it is not the end of the document, the process proceeds to step S206g, and if it is the end of the document, step S206 is ended. On the other hand, if there is no row in S206h, the process proceeds to step S206o.
<第2の実施形態>
上述の第1の実施形態では、変更部105において、ページ記述データ中の文字がどんな文字であっても、文字間隔を無条件に文書画像からの正規化情報によって変更した。そのため、ページ記述データ中に句読点が混在する場合には、句読点前後の文字間隔も変更されるため、文書として不自然になる場合がある。
<Second Embodiment>
In the first embodiment described above, the changing
図9は、句読点前後における文字間隔の組の例を示す図である。本実施形態では、第1の実施形態と異なり、句読点の直後の文字間隔を含む文字間隔の組を変更せず、かつ、この文字間隔の組には透かし情報を埋め込まない。 FIG. 9 is a diagram showing an example of character spacing sets before and after punctuation marks. In the present embodiment, unlike the first embodiment, the set of character intervals including the character interval immediately after the punctuation mark is not changed, and the watermark information is not embedded in the set of character intervals.
例えば、注目矩形904の直後の文字間隔Sを含む文字間隔P、Sの組とそれに対応する次の文字までの距離A0、B0の組は、901、902が該当する。これらの文字間隔の組には、透かし情報を埋め込まないこととなる。また、透かし情報を抽出する際には、埋め込み対象としない外接矩形の前後の文字間隔の組は除外して行う。
For example, 901 and 902 correspond to a set of character intervals P and S including a character interval S immediately after the
第2の実施形態に係る透かし情報埋め込み装置は、上述した第1の実施形態と同様の構成であるが、変更部105(ステップS206)及び埋め込み部107(ステップS207)での処理は、下記の点で異なる。 The watermark information embedding device according to the second embodiment has the same configuration as that of the first embodiment described above, but the processing in the changing unit 105 (step S206) and the embedding unit 107 (step S207) is as follows. It is different in point.
[変更部105(ステップS206)]
図10は、第2の実施形態に係る変更部105の動作手順を示すフローチャートである。まず、ステップS206dにおいて、隣接する前後の文字間隔の組P、Sに対応した文字情報である次の文字までの距離A0、B0を選択する。
[Change unit 105 (step S206)]
FIG. 10 is a flowchart illustrating an operation procedure of the changing
次に、ステップS206eにおいて、ページ記述データAの句読点位置情報に基づいて、A0又はB0が句読点の直後の文字間隔に対応する次の文字までの距離であるか否かが判断される。なお、句読点位置情報は、例えば、文字コードで示される。ステップS206eにおいて、A0又はB0が句読点の直後の文字間隔に対応する次の文字までの距離であると判断されない場合には、ステップS206fに進む。そして、ステップS206eにおいて、A0又はB0が句読点の直後の文字間隔に対応する次の文字までの距離であると判断された場合には、ステップS206gに進む。 Next, in step S206e, based on the punctuation mark position information of the page description data A, it is determined whether A0 or B0 is the distance to the next character corresponding to the character spacing immediately after the punctuation mark. The punctuation mark position information is indicated by a character code, for example. If it is not determined in step S206e that A0 or B0 is the distance to the next character corresponding to the character spacing immediately after the punctuation mark, the process proceeds to step S206f. In step S206e, if it is determined that A0 or B0 is the distance to the next character corresponding to the character spacing immediately after the punctuation mark, the process proceeds to step S206g.
ステップS206fにおいて、変更後の次の文字までの距離A1、B1をA1=A0+α×X、B1=B0+α×Yとして算出し、データ内容を変更する。 In step S206f, the distances A1 and B1 to the next character after the change are calculated as A1 = A0 + α × X and B1 = B0 + α × Y, and the data content is changed.
一方、ステップS206gにおいて、A1=A0、B1=B0とする。すなわち、データ内容は変更されない。 On the other hand, in step S206g, A1 = A0 and B1 = B0. That is, the data content is not changed.
最後に、ステップS206hにおいて、P、Sに対応した文字情報が最後であるか否かを判断する。ステップS206hで、文字情報が最後であると判断された場合には、ステップS206が終了し、文字情報が最後でないと判断された場合には、ステップS206dに戻る。 Finally, in step S206h, it is determined whether or not the character information corresponding to P and S is the last. If it is determined in step S206h that the character information is the last, step S206 ends. If it is determined that the character information is not the last, the process returns to step S206d.
[埋め込み部107(ステップS207)]
図11は、第2の実施形態に係る埋め込み部107の動作手順を示すフローチャートである。まず、ステップS207gにおいて、次の文字までの距離A1、B1を選択する。
[Embedding unit 107 (step S207)]
FIG. 11 is a flowchart showing an operation procedure of the embedding
ステップS207hにおいて、ページ記述データAの句読点位置情報に基づいて、A1又はB1が句読点の直後の文字間隔に対応する次の文字までの距離であるか否かが判断される。ステップS207hにおいて、A1又はB1が句読点の直後の文字間隔に対応する次の文字までの距離であると判断されない場合には、ステップS207iに進む。そして、ステップS207hにおいて、A1又はB1が句読点の直後の文字間隔に対応する次の文字までの距離であると判断された場合には、ステップS206mに進む。 In step S207h, based on the punctuation mark position information of the page description data A, it is determined whether A1 or B1 is the distance to the next character corresponding to the character spacing immediately after the punctuation mark. If it is not determined in step S207h that A1 or B1 is the distance to the next character corresponding to the character interval immediately after the punctuation mark, the process proceeds to step S207i. If it is determined in step S207h that A1 or B1 is the distance to the next character corresponding to the character spacing immediately after the punctuation mark, the process proceeds to step S206m.
ステップS207iにおいて、埋め込むべき透かしビットを選択する。次に、ステップS207jにおいて、埋め込んだ透かしビットが1であるか否かを判断する。ステップS207jで埋め込んだ透かしビットが1であると判断された場合には、ステップS207kに進み、埋め込んだ透かしビットが1ではないと判断された場合には、ステップS207lに進む。 In step S207i, a watermark bit to be embedded is selected. Next, in step S207j, it is determined whether or not the embedded watermark bit is 1. If it is determined that the watermark bit embedded in step S207j is 1, the process proceeds to step S207k. If it is determined that the embedded watermark bit is not 1, the process proceeds to step S207l.
ステップS207kにおいて、B1に対応した文字間隔よりもA1に対応した文字間隔の方が大きくなるように、埋め込み後の次の文字までの距離A2、B2をA2=A1+γ、B2=B2−γとして算出し、透かし情報の埋め込みを行う。一方、ステップS207lにおいて、B1に対応した文字間隔よりもA1に対応した文字間隔の方が小さくなるように、埋め込み後の次の文字までの距離A2、B2をA2=A1−γ、B2=B2+γとして算出し、透かし情報の埋め込みを行う。 In step S207k, distances A2 and B2 to the next character after embedding are calculated as A2 = A1 + γ and B2 = B2-γ so that the character spacing corresponding to A1 is larger than the character spacing corresponding to B1. Then, watermark information is embedded. On the other hand, in step S207l, the distances A2 and B2 to the next character after embedding are set to A2 = A1-γ and B2 = B2 + γ so that the character spacing corresponding to A1 is smaller than the character spacing corresponding to B1. And watermark information is embedded.
一方、ステップS207mにおいて、A2=A1、B2=B1とする。すなわち、透かし情報の埋め込みは行なわれない。 On the other hand, in step S207m, A2 = A1 and B2 = B1. That is, watermark information is not embedded.
最後に、ステップS207nにおいて、ページ記述データ上の文字情報が最後であるか否かを判断する。ステップS207nで、ページ記述データ上の文字情報が最後であると判断された場合には、ステップS207が終了し、ページ記述データ上の文字情報が最後でないと判断された場合には、ステップS207gに戻る。 Finally, in step S207n, it is determined whether or not the character information on the page description data is the last. If it is determined in step S207n that the character information on the page description data is the last, step S207 is ended. If it is determined that the character information on the page description data is not the last, the process proceeds to step S207g. Return.
図12は、第2の実施形態に係る透かし情報抽出部703の動作手順を示すフローチャートである。透かし情報抽出装置700は、第1実施形態と同様であるが、抽出処理において、句読点に関する処理を追加する。 FIG. 12 is a flowchart showing an operation procedure of the watermark information extraction unit 703 according to the second embodiment. The watermark information extraction apparatus 700 is the same as that in the first embodiment, but adds processing related to punctuation marks in the extraction processing.
まず、ステップS1201において、透かし情報が埋め込まれた文書画像を読込む。スキャナ等の画像入力部701から入力される。
First, in step S1201, a document image in which watermark information is embedded is read. Input from an
ステップS1202において、文書画像から外接矩形を検出する。ステップS1203において、外接矩形のサイズ等に基づいて、句読点を検出する。ステップS1202及びステップS1203の処理は、検出部702で行われる。
In step S1202, a circumscribed rectangle is detected from the document image. In step S1203, punctuation marks are detected based on the size of the circumscribed rectangle. The processing in steps S1202 and S1203 is performed by the
ステップS1204において、前述した句読点の直後の文字間隔を含む文字間隔の組を除いた文字間隔を検出部702で算出する。算出方法は、埋め込み部107の処理と同様である。
In step S1204, the
ステップS1205において、透かし情報抽出部703で透かし情報を抽出する。この抽出処理は、隣接する前後の文字間隔の組P1、S1の大小関係によって、1組毎に1ビット(0又は1)の情報が抽出される。 In step S1205, the watermark information extraction unit 703 extracts watermark information. In this extraction process, 1-bit (0 or 1) information is extracted for each set depending on the size relationship between adjacent sets P1 and S1 of the character spacing before and after.
なお、上述の第1、第2の実施形態では、隣接する前後の文字間隔の大小関係を調整することで透かし情報を埋め込んだ。しかし、各文字間隔を閾値と比較することにより透かし情報を挿入するか否かを判定する場合には、各々の対応する文書画像内の文字間隔の情報のみを付加するだけで本発明を適用することができる。 In the first and second embodiments described above, watermark information is embedded by adjusting the size relationship between adjacent character spacings. However, when determining whether or not to insert watermark information by comparing each character interval with a threshold value, the present invention is applied only by adding only the character interval information in each corresponding document image. be able to.
<第3の実施形態>
本実施形態では、第1の実施形態に係る種々の処理をコンピュータに実行させる。図13は、第3の実施形態に係るコンピュータの基本的な構成図である。例えば、コンピュータにおいて、全ての機能を実行する場合には、各機能構成をコンピュータプログラムで表現し、コンピュータに読込ませることによって、コンピュータで第1の実施形態の全ての機能を実現することができる。
<Third Embodiment>
In the present embodiment, the computer executes various processes according to the first embodiment. FIG. 13 is a basic configuration diagram of a computer according to the third embodiment. For example, when all functions are executed in a computer, all the functions of the first embodiment can be realized by a computer by expressing each function configuration by a computer program and causing the computer to read the functions.
CPU1301は、RAM1302やROM1303に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体を制御する。また、CPU1301は、上記の第1実施形態及び第2実施形態で説明した各処理を行う。
The
RAM1302は、外部記憶装置1308から読込まれたコンピュータプログラムやデータ、他のコンピュータシステム1314からI/F(インターフェース)1315を介して、ダウンロードしたプログラムやデータを一時的に記憶する記憶領域を備える。また、RAM1302は、CPU1301が各種の処理を行うために必要な処理領域を備える。
The
ROM1303は、コンピュータの機能プログラムや設定データ等を記憶する。ディスプレイ制御装置1304は、画像や文字等をディスプレイ1305に表示させるための制御処理を行う。ディスプレイ1305は、CRTや液晶画面等の表示装置であり、画像や文字等を表示する。
The
操作入力デバイス1306は、キーボードやマウス等、CPU1301に各種の指示を入力することのできるデバイスにより構成される。I/O1307は、操作入力デバイス1306を介して入力された各種の指示等をCPU1301に通知する。
The
外部記憶装置1308は、ハードディスク等の大容量情報記憶装置として機能し、OS(オペレーティングシステム)や上記各実施形態に係る処理をCPU1301に実行させるためのコンピュータプログラム、入出力原稿画像等を記憶する。外部記憶装置1308への情報の書き込みや外部記憶装置1308からの情報の読み出しは、I/O1309を介して行われる。
The
プリンタ1310は、文書や画像を出力する。出力データは、I/O1313を介してRAM1302、もしくは外部記憶装置1308から送信される。なお、プリンタとしては、例えば、インクジェットプリンタ、レーザビームプリンタ、熱転写型プリンタ、ドットインパクトプリンタ等が挙げられる。
The
スキャナ1312は、文書や画像を読み取る。入力データは、I/O1313を介してRAM1302、もしくは外部記憶装置1308に送信される。
The
バス1316は、CPU1301、ROM1303、RAM1302、I/O1311、I/O1309、ディスプレイ制御装置1304、I/F1315、I/O1307、I/O1313をつないでネットワークを形成する。
A
なお、本実施形態では、コンピュータが、スキャナやプリンタでの処理を除く処理を行っているが、スキャナやプリンタが、内部に設けられた専用のハードウェア回路を用いて、コンピュータで行う処理を代わりに行ってもよい。 In this embodiment, the computer performs processing excluding the processing by the scanner or printer. However, the scanner or printer uses a dedicated hardware circuit provided in the interior to replace the processing performed by the computer. You may go to
なお、上記第1乃至第3実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならない。すなわち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形態で実施することができる。 The first to third embodiments are merely examples of implementation in carrying out the present invention, and the technical scope of the present invention should not be interpreted in a limited manner. . That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.
<その他の実施形態>
なお、本実施形態は、複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、複合機、ファクシミリ装置等)に適用してもよい。
<Other embodiments>
Note that this embodiment can be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), but an apparatus (for example, a copier, a multifunction device, The present invention may be applied to a facsimile machine or the like.
また、前述の実施形態では、これらの機能を実現するソフトウェアのプログラムコードを記録したコンピュータ可読記録媒体(又は記憶媒体)をシステム又は装置に供給する。この場合に、そのシステム又は装置のコンピュータ(又はCPUやMPU)が記録媒体に格納されたプログラムコードを読込み実行することによっても達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本実施形態を構成することになる。 In the above-described embodiment, a computer-readable recording medium (or storage medium) that records program codes of software that realizes these functions is supplied to the system or apparatus. In this case, it goes without saying that this can also be achieved by the computer (or CPU or MPU) of the system or apparatus reading and executing the program code stored in the recording medium. In this case, the program code itself read from the recording medium realizes the functions of the above-described embodiment, and the recording medium on which the program code is recorded constitutes the present embodiment.
また、本発明はこれだけでなく、そのプログラムコードの指示に基づいて、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。 The present invention is not limited to this, and an operating system (OS) or the like running on a computer performs part or all of the actual processing based on an instruction of the program code. The case where the function is realized is also included.
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づいて、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, the program code read from the recording medium is written in a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer. Thereafter, the CPU of the function expansion card or function expansion unit performs part or all of the actual processing based on the instruction of the program code, and the functions of the above-described embodiments may be realized by the processing. Needless to say, it is included.
本実施形態を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートや機能構成に対応するプログラムコードが格納されることになる。 When this embodiment is applied to the recording medium, the recording medium stores program codes corresponding to the flowcharts and functional configurations described above.
Claims (11)
前記電子文書データから文書画像を生成する画像生成手段と、
前記生成された文書画像中の各構成画像のレイアウト情報を検出する検出手段と、
前記検出されたレイアウト情報に基づいて、各構成画像の配置を正規化するための正規化情報を算出する算出手段と、
前記算出された正規化情報に基づいて、前記電子文書データを変更し、変更された電子文書データに情報を埋め込む埋め込み手段と、
を備えることを特徴とする情報処理装置。 An information processing apparatus for embedding information in input electronic document data,
Image generating means for generating a document image from the electronic document data;
Detecting means for detecting layout information of each component image in the generated document image;
Calculation means for calculating normalization information for normalizing the arrangement of each component image based on the detected layout information;
An embedding means for changing the electronic document data based on the calculated normalization information and embedding information in the changed electronic document data;
An information processing apparatus comprising:
前記算出手段は、前記レイアウト情報に基づいて、前記各構成画像の間隔を算出することを特徴とする請求項1又は2に記載の情報処理装置。 The layout information includes information on the position and size of each component image,
The information processing apparatus according to claim 1, wherein the calculation unit calculates an interval between the component images based on the layout information.
前記検出手段は、前記レイアウト情報に基づいて、前記各文字画像の外接矩形の間隔を算出することを特徴とする請求項3に記載の情報処理装置。 Each of the component images is a circumscribed rectangle of each character image,
The information processing apparatus according to claim 3, wherein the detection unit calculates an interval between circumscribed rectangles of the character images based on the layout information.
前記電子文書データから文書画像を生成する画像生成工程と、
前記生成された文書画像中の各構成画像のレイアウト情報を検出する検出工程と、
前記検出されたレイアウト情報に基づいて、各構成画像の正規化するための正規化情報を算出する算出工程と、
前記算出された正規化情報に基づいて、前記電子文書データを変更し、変更された電子文書データに情報を埋め込む埋め込み工程と、
を有することを特徴とする情報処理方法。 An information processing method for embedding information in input electronic document data,
An image generation step of generating a document image from the electronic document data;
A detection step of detecting layout information of each component image in the generated document image;
A calculation step of calculating normalization information for normalizing each component image based on the detected layout information;
An embedding step for changing the electronic document data based on the calculated normalization information and embedding information in the changed electronic document data;
An information processing method characterized by comprising:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008237188A JP5173690B2 (en) | 2007-10-11 | 2008-09-16 | Information processing apparatus, information processing method, computer program, and computer-readable recording medium |
US12/243,480 US8125691B2 (en) | 2007-10-11 | 2008-10-01 | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007265826 | 2007-10-11 | ||
JP2007265826 | 2007-10-11 | ||
JP2008237188A JP5173690B2 (en) | 2007-10-11 | 2008-09-16 | Information processing apparatus, information processing method, computer program, and computer-readable recording medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009111984A true JP2009111984A (en) | 2009-05-21 |
JP2009111984A5 JP2009111984A5 (en) | 2011-10-27 |
JP5173690B2 JP5173690B2 (en) | 2013-04-03 |
Family
ID=40779922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008237188A Expired - Fee Related JP5173690B2 (en) | 2007-10-11 | 2008-09-16 | Information processing apparatus, information processing method, computer program, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5173690B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001313819A (en) * | 2000-04-27 | 2001-11-09 | Fuji Xerox Co Ltd | Image processor, storage medium |
JP2005253004A (en) * | 2004-03-08 | 2005-09-15 | Canon Inc | Information processing apparatus and method therefor, computer program and computer-readable storage medium |
JP2006166091A (en) * | 2004-12-08 | 2006-06-22 | Canon Inc | Document processor and document processing method |
-
2008
- 2008-09-16 JP JP2008237188A patent/JP5173690B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001313819A (en) * | 2000-04-27 | 2001-11-09 | Fuji Xerox Co Ltd | Image processor, storage medium |
JP2005253004A (en) * | 2004-03-08 | 2005-09-15 | Canon Inc | Information processing apparatus and method therefor, computer program and computer-readable storage medium |
JP2006166091A (en) * | 2004-12-08 | 2006-06-22 | Canon Inc | Document processor and document processing method |
Also Published As
Publication number | Publication date |
---|---|
JP5173690B2 (en) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5934762B2 (en) | Document modification detection method by character comparison using character shape characteristics, computer program, recording medium, and information processing apparatus | |
JP5132438B2 (en) | Image processing apparatus and image processing method | |
US7528986B2 (en) | Image forming apparatus, image forming method, program therefor, and storage medium | |
JP5121599B2 (en) | Image processing apparatus, image processing method, program thereof, and storage medium | |
JP4555212B2 (en) | Watermark information embedding device, watermark information embedding method, and computer program | |
JP2006295606A (en) | Image processor, its processing method, program, and storage medium | |
JP2002352191A (en) | Printing control interface system and method having handwriting discrimination capability | |
US8391607B2 (en) | Image processor and computer readable medium | |
JP2006050551A (en) | Image processing apparatus, image processing method, program and storage medium | |
JP4673200B2 (en) | Print processing system and print processing method | |
KR100905857B1 (en) | Information processing device and method of controlling the same | |
JP5094869B2 (en) | How to print the coding pattern | |
JP2002015280A (en) | Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program | |
JP2021044803A (en) | Image processing device, image processing method, and program | |
JP3728209B2 (en) | Image processing method and apparatus, computer program, and storage medium | |
US8125691B2 (en) | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information | |
US20080304700A1 (en) | Image forming apparatus and method of image forming | |
JP5173690B2 (en) | Information processing apparatus, information processing method, computer program, and computer-readable recording medium | |
JP7147544B2 (en) | Information processing device and information processing method | |
JP4164458B2 (en) | Information processing apparatus and method, computer program, and computer-readable storage medium | |
JP2010105191A (en) | Image processing apparatus | |
JP2010108296A (en) | Information processor and information processing method | |
JP2010103862A (en) | Document processing apparatus and method | |
JP2009141525A (en) | Apparatus and method of processing image | |
JP2019195117A (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110912 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120629 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121227 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5173690 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |