JP2004023566A - Electronic watermark burying apparatus, electronic watermark extracting apparatuses, and method thereof - Google Patents

Electronic watermark burying apparatus, electronic watermark extracting apparatuses, and method thereof Download PDF

Info

Publication number
JP2004023566A
JP2004023566A JP2002177646A JP2002177646A JP2004023566A JP 2004023566 A JP2004023566 A JP 2004023566A JP 2002177646 A JP2002177646 A JP 2002177646A JP 2002177646 A JP2002177646 A JP 2002177646A JP 2004023566 A JP2004023566 A JP 2004023566A
Authority
JP
Japan
Prior art keywords
circumscribed rectangle
circumscribed
digital watermark
parameter
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002177646A
Other languages
Japanese (ja)
Other versions
JP3703445B2 (en
Inventor
Keiichi Iwamura
岩村 恵市
Kitahiro Kaneda
金田 北洋
Takami Eguchi
江口 貴巳
Atsushi Tamaru
田丸 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002177646A priority Critical patent/JP3703445B2/en
Publication of JP2004023566A publication Critical patent/JP2004023566A/en
Application granted granted Critical
Publication of JP3703445B2 publication Critical patent/JP3703445B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an apparatus and a method for burying an electronic watermark which reduce the image quality deterioration of a document image, if data series of the electronic watermark are buried in the document image, and bury the electronic watermark hardly recognizable by the human's eyes. <P>SOLUTION: The method comprises a step for executing a document analysis of a document image to obtain circumscribed rectangles of characters (S601); obtaining two distances d1, d2 between circumscribed rectangles not adjacent to each other from the head of the document (S603), and executing either change process for changing parameters about the size of the circumscribed rectangle or that about the position of the circumscribed rectangle, or a combination thereof so that d1 > d2, if data to be buried are 1 (S605); or executing either of the two change processes or a combination thereof so that d1 < d2, if the data to be buried are 0 (S606). <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像に電子透かしを埋め込む電子透かし埋め込み装置、及び電子透かしが埋め込まされた文書画像から電子透かしを抽出する電子透かし抽出装置、及びそれらの方法に関するものである。
【0002】
【従来の技術】
インターネット上で画像や音声などのディジタルデータを流通させる際の著作権保護の方法として、電子透かしが注目されている。電子透かしは、画像や音声などのディジタルデータに対して、人間が知覚できないように透かし情報を埋め込む技術である。例えば、多値画像に対する電子透かし技術としては、多値画素の濃度の冗長性を利用する種々の方法が知られている。
【0003】
一方、文書画像のような二値画像は冗長度が少なく、電子透かし技術を実現するのが難しい。しかしながら、文書画像特有の特徴を利用した電子透かし方式がいくつか知られている。例えば、行のベースラインを動かす方法(特許第3136061)、単語間空白長を操作する方法(米国特許第6086706、特開平9−186603号公報)、文字間の空白長を操作する方法(King Mongkut大学による”Electronic document data hiding technique using inter−character space”, The 1998 IEEE Asia−Pacific Conf. On Circuits and Systems,1998,pp.419−422.)、中村康弘,松井甲子雄, “和文書へのシール画像による電子透かし”,情報処理学会論文誌 Vol.38 No.11 Nov. 1997.で述べられているような文字を回転して傾斜を変化させるなどが挙げられる。
【0004】
【発明が解決しようとする課題】
しかし文書画像は冗長度が少なく、今まで提案された従来手法は行のベースラインや、語間スペースや文字の回転という1変数の変更によって、情報を埋め込むために変更点が目立つ、すなわち画質劣化が大きいと言う欠点があった。
【0005】
本発明は以上問題に鑑みてなされたものであり、電子透かしのデータ列を埋め込んだ文書画像の画質劣化を軽減する電子透かしの埋め込み装置及びその方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明の電子透かし埋め込み装置は以下の構成を備える。
【0007】
すなわち、文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算手段と、
埋め込むデータに応じて前記第1のパラメータが示す値と第2のパラメータが示す値の大小関係が変化するように、前記組を構成する外接矩形の高さ、前記組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御手段と
を備えることを特徴とする。
【0008】
本発明の目的を達成するために、例えば本発明の電子透かし埋め込み装置は以下の構成を備える。
【0009】
すなわち、文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算手段と、
埋め込むデータに応じて、注目組に対する前記パラメータが示す値と前記平均値の大小関係が変化するように、当該注目組を構成する外接矩形の高さ、当該注目組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御手段と
を備えることを特徴とする。
【0010】
本発明の目的を達成するために、例えば本発明の電子透かし抽出装置は以下の構成を備える。
【0011】
すなわち、上記電子透かし埋め込み装置により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算手段と、
前記第1のパラメータが示す値と第2のパラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出手段と
を備えることを特徴とする。
【0012】
本発明の目的を達成するために、例えば本発明の電子透かし抽出装置は以下の構成を備える。
【0013】
すなわち、上記電子透かし埋め込み装置により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算手段と、
当該平均値と、注目組の前記パラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出手段と
を備えることを特徴とする。
【0014】
本発明の目的を達成するために、例えば本発明の電子透かし埋め込み方法は以下の構成を備える。
【0015】
すなわち、文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算工程と、
埋め込むデータに応じて前記第1のパラメータが示す値と第2のパラメータが示す値の大小関係が変化するように、前記組を構成する外接矩形の高さ、前記組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御工程と
を備えることを特徴とする。
【0016】
本発明の目的を達成するために、例えば本発明の電子透かし埋め込み方法は以下の構成を備える。
【0017】
すなわち、文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算工程と、
埋め込むデータに応じて、注目組に対する前記パラメータが示す値と前記平均値の大小関係が変化するように、当該注目組を構成する外接矩形の高さ、当該注目組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御工程と
を備えることを特徴とする。
【0018】
本発明の目的を達成するために、例えば本発明の電子透かし抽出方法は以下の構成を備える。
【0019】
すなわち、上記電子透かし埋め込み方法により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算工程と、
前記第1のパラメータが示す値と第2のパラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出工程と
を備えることを特徴とする。
【0020】
本発明の目的を達成するために、例えば本発明の電子透かし抽出方法は以下の構成を備える。
【0021】
すなわち、上記電子透かし埋め込み方法により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算工程と、
当該平均値と、注目組の前記パラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出工程と
を備えることを特徴とする。
【0022】
【発明の実施の形態】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
【0023】
[第1の実施形態]
本実施形態に係る電子透かしのデータ列を埋め込む方法について図2を用いて説明する。図2は文書画像において、各文字の隣接していない外接矩形間の距離を用いた本実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【0024】
A〜Gの矩形は文書画像において各文字の外接矩形を示すものであり、文書解析技術を用いて抽出されるものである。各文字の外接矩形とは、文字に外接する矩形であって、文字認識を行う領域を指す情報である。各文字の外接矩形を求める方法としては、まず文書画像の各画素値を垂直座標軸に対して射影し、空白部分(黒色である文字のない部分)を探索して行を判別して行分割を行う。その後、行単位で文書画像を水平座標軸に対して射影し、空白部分を探索して文字単位に分割する。これによって、各文字を外接矩形で切り出すことが可能となる。この方法として例えば特開平6−68301号公報に開示されている方法を挙げることができる。
【0025】
また同図において201は外接矩形A、C間の距離を示し、202は外接矩形B、D間の距離を示し、203は外接矩形D、F間の距離を示し、204は外接矩形E、G間の距離を示す。上述の通り、本実施形態に係る電子透かしのデータ列の埋め込み方法では、これらの距離を、埋め込むデータに応じて変化させる。
【0026】
以下、上述の電子透かしのデータ列の埋め込み方法について説明する。図3に本実施形態に係る電子透かし埋め込み装置として、及び電子透かしのデータ列が埋め込まれた文書画像から電子透かしのデータ列を抽出する電子透かし抽出装置としてのコンピュータの基本構成を示す。なお、上記埋め込み方法、及び抽出方法を実現するために図3に示した各部全てを使用することは必須ではない。
【0027】
同図において、コンピュータ301は一般に普及しているパーソナルコンピュータやワークステーションなどであって、スキャナ317から読み取られた画像を入力し、編集や保管を行うことが可能である。また、スキャナ317から得られた画像をプリンタ316から紙やOHP等の記録媒体に印刷させることができる。尚、ユーザからの各種指示等は、マウス313、キーボード314を用いて入力することができる。
【0028】
コンピュータ301の内部では、バス307により後述する各ブロックが接続され、夫々のブロック間で種々のデータの受け渡しが可能である。MPU302は、コンピュータ301内部の各ブロックの動作を制御すると共に、RAMとしての主記憶装置303に記憶されたプログラムを実行することで後述の電子透かしのデータ列の埋め込みに関する一連の処理、及びこの埋め込み処理により文書画像に埋め込まれた電子透かしのデータ列を抽出する一連の処理を実行する。
【0029】
主記憶装置303は、HDD304,CD−ROMドライブ装置309、DVD−ROMドライブ装置310、FDドライブ装置311等からロードされたプログラムやデータを一時的に記憶するエリアを備えると共に、MPU302が各種の処理を実行するために一時的に処理対象のデータなどを記憶するワークエリアを備える。
【0030】
ハードディスクドライブ(HDD)装置304は、主記憶装置303にロードされるプログラムや文書画像データを予め保存しておいたり、処理後の文書画像データを保存することができる。インタフェース(I/F)315は、原稿やフィルム等に記録された情報を読み取って、画像データを生成するスキャナ317と接続され、スキャナ317で得られた画像データを入力するためのI/Fである。I/F308は、画像データを印刷するプリンタ316と接続され、印刷する画像データをプリンタ316に送信するためのI/Fである。
【0031】
CD−ROMドライブ装置309は、外部記憶媒体の一つであるCD−ROM(CD−R/CD−RW)に記憶されたデータを読み込んだり、あるいは書き出すことができる装置である。FD(フロッピー(登録商標)ディスク)ドライブ装置311はCD−ROMドライブ装置309と同様にFDからデータを読み出したり、FDへデータを書き込んだりすることができる装置である。DVD−ROMドライブ装置310は、FDドライブ装置311と同様に、DVDからデータを読み出したり、DVDへデータを書き込んだりすることができる装置である。尚、上記CD−ROM、FD、DVD−ROM等にプログラム、あるいはプリンタドライバが記憶されている場合には、これらプログラムをHDD304にインストールし、必要に応じて主記憶装置303にロードされるようになっている。
【0032】
I/F312は、マウス313やキーボード314からの入力指示を受け付けるために、これらと接続されるI/Fである。また、モニタ306は、電子透かしのデータ列の抽出処理結果や処理過程を表示することのできる表示装置である。さらに、ビデオコントローラ305は、表示データをモニタ306に送信するための装置である。
【0033】
以上の構成を備えるコンピュータが行う電子透かしのデータ列の埋め込み処理について、同処理のフローチャートを示す図6を参照して説明する。なお、以下の説明では1つ置きの外接矩形間の距離(図2を例に取ると、201と202,203と204)を用いる。また、以下の処理の経過などは適宜モニタ306上に表示しても良い。
【0034】
まず、マウス313もしくはキーボード314を用いたユーザからの指示入力に応じて、電子透かし埋め込みを行う文書画像を主記憶装置303にロードする(ステップS600)。この文書画像は、文書が記録された紙などの記録媒体をスキャナ317により読みとり、読みとった結果をビットマップ化したものとする。
【0035】
しかし文書画像を得る方法はこれに限定されるものではなく、他にも例えば、一般の文書エディタで作成された文書、もしくは上記CD−ROMドライブ装置309,もしくはDVD−ROMドライブ装置310、もしくはFDドライブ装置311から主記憶装置303にロードされた文書のデータを用いてビットマップ化し、文書画像を作成しても良い。また、LANやインターネットなどのネットワークに接続可能なネットワークI/Fを上記装置に備え、ネットワークを介して外部から文書画像を受信し、得ても良い。しかし上記いずれの場合でも、文書画像はビットマップ化されたものである。
【0036】
次に、ビットマップ化された文書画像に対し前述の文書解析を行い、各文字の外接矩形を求める(ステップS601)。次に、ユーザは1,もしくは0からなる電子透かしのデータ列をキーボード314,もしくはマウス313を用いて入力すると、このデータ列はI/F312を介して主記憶装置303に出力され、主記憶装置303に格納される(ステップS602)。
【0037】
次に、文書の先頭から2つの、隣接していない外接矩形間の距離を求め、夫々をd1,d2とする(ステップS603)。図2の例では、上記201の距離を求め、これをd1、202の距離を求め、これをd2とする(ステップS603)。そして埋め込むデータが1である場合、処理をステップS605に進め、d1>d2となるように、以下の2つのパラメータの変更処理のいずれか、もしくはその組み合わせによる処理を行う(ステップS605)。
【0038】
・ 外接矩形Bの列方向の大きさを大きくする、もしくは外接矩形Cの列方向の大きさを小さくする(サイズに関するパラメータの変更)
・ 外接矩形Cの位置を外接矩形D側に移動させる、もしくは外接矩形Bの位置を外接矩形D側に移動させる(位置に関するパラメータの変更)
この2つのパラメータの変更処理のいずれか、もしくはその組み合わせによる処理のどちらを行うかの指示は予め決めていても良いし、ユーザにより入力させても良い。
【0039】
一方、埋め込むデータが0である場合、処理をステップS606に進め、d1<d2となるように、以下の2つのパラメータの変更処理のいずれか、もしくはその組み合わせによる処理を行う(ステップS606)。
【0040】
・ 外接矩形Bの列方向の大きさを小さくする、もしくは外接矩形Cの列方向の大きさを大きくする(サイズに関するパラメータの変更)
・ 外接矩形Cの位置を外接矩形A側に移動させる、もしくは外接矩形Bの位置を外接矩形A側に移動させる(位置に関するパラメータの変更)
この2つのパラメータの変更処理のいずれか、もしくはその組み合わせによる処理のどちらを行うかの指示は予め決めていても良いし、ユーザにより入力させても良い。また、外接矩形の位置、サイズを変更する制御処理に伴って、外接矩形で囲まれている文字の位置、サイズも同様に変更されるものとする。
【0041】
またステップS605、S606による処理は、その変更部分が最も目立たないように、すなわち画質劣化が小さくなるように上記各パラメータを予め調節しておく。
【0042】
特に図2の例では3つおきの外接矩形(図2では外接矩形A、D、G)の位置は変化しないので、3個の外接矩形を単位としてその中のバランスで最も画質劣化のないように、データの埋め込み処理を行う。これにより、外接矩形間のスペース“のみ”を変更する場合に対して人間の視覚的に違和感の無い埋め込みが実現できる。
【0043】
図6に戻って、更に埋め込むデータがある場合には処理をステップS603に戻し、上記処理を繰り返す。例えば埋め込むデータがまだある場合、図2の例では外接矩形D、F間の距離を求め、これをd1とし、更に外接矩形E、G間の距離を求め、これをd2とし、以上の埋め込み処理の説明で、外接矩形A,B,C,Dを夫々外接矩形D,E,F,Gと読み替えて以上の処理を繰り返す。
【0044】
以上の処理により、文書画像に対して電子透かしのデータ列の埋め込みを行うことができる。
【0045】
次に、上記処理により埋め込んだ電子透かしのデータ列の抽出方法について説明する。上述の通り、電子透かしのデータ列を抽出する処理も図3に示したコンピュータにより行われる。図7に上記コンピュータが行う、上記処理により埋め込んだ電子透かしのデータ列の抽出処理のフローチャートを示す。
【0046】
まず、マウス313もしくはキーボード314を用いたユーザからの指示入力に応じて、電子透かしのデータ列が埋め込まれた文書画像(以下、埋め込み画像)を主記憶装置303にロードする(ステップS700)。この埋め込み画像は、上記埋め込み処理による埋め込み画像をプリンタ316によりプリントした紙やOHPなどの記録媒体をスキャナ317により読みとり、読みとった結果をビットマップ化したものとする。しかし、埋め込み画像を得る方法はこれに限定されるものではなく、上記HDD304、もしくはCD−ROMドライブ装置309,もしくはDVD−ROMドライブ装置310、もしくはFDドライブ装置311から主記憶装置303にロードされたものであってもよい。また、LANやインターネットなどのネットワークに接続可能なネットワークI/Fを上記装置に備え、ネットワークを介して外部から受信し、得ても良い。
【0047】
次に、埋め込み画像に対し前述の文書解析を行い、各文字の外接矩形を求める(ステップS701)。本ステップにおける処理は、上記ステップS601における処理内容と同じである。
【0048】
次に、上記201の距離d1と202の距離d2とを求める(ステップS702)。d1>d2の場合(ステップS703)、処理をステップS704に進め、埋め込まれたデータを1として主記憶装置303に記録する(ステップS704)。一方、d1<d2の場合、処理をステップS705に進め、埋め込まれたデータを0として主記憶装置303に記録する(ステップS705)。
【0049】
そして処理対象の外接矩形がまだ残っているかを判断する(ステップS706)。図2の例では外接矩形A,B,C,D以降にまだE,F,Gが残っているので、処理をステップS702に戻し、外接矩形D、F間の距離を求め、これをd1とし、更に外接矩形E、G間の距離を求め、これをd2とし、以上の抽出処理の説明で、外接矩形A,B,C,Dを夫々外接矩形D,E,F,Gと読み替えて以上の処理を繰り返す。また予め電子透かしのデータの個数がわかっている場合には、その個数分のデータが主記憶装置303に記録されたか否かを判断すればよい。
【0050】
そして処理対象の外接矩形が残っていないとステップS706で判断された場合、ステップS704,ステップS705で主記憶装置303に記録されたデータ列を電子透かしのデータ列として得ることができる。以上の処理により、上記方法により電子透かしのデータ列が埋め込まれた文書画像から、このデータ列を抽出することができる。
【0051】
なお、以上の説明では外接矩形A,C間の距離と外接矩形B,D間の距離との大小関係に応じて電子透かしのデータを埋め込んだ後、次に外接矩形D,F間の距離と外接矩形E,G間の距離との大小関係に応じて電子透かしのデータを埋め込んだが、大小関係の比較対象はこれに限定されるものではない。すなわち、例えば、外接矩形A,C間の距離と外接矩形D,F間の距離との大小関係に応じて電子透かしのデータを埋め込んだ後、次に外接矩形B,D間の距離と外接矩形E,G間の距離との大小関係に応じて電子透かしのデータを埋め込んでも良い。
【0052】
また、ある値を初期値として擬似乱数を発生させ、その乱数の値に応じて大小関係の比較対象を選択しても良い。例えば乱数の値が1の場合、外接矩形A,C間の距離と外接矩形B,D間の距離との大小関係に応じて電子透かしのデータを埋め込んだ後、次に外接矩形D,F間の距離と外接矩形E,G間の距離との大小関係に応じて電子透かしのデータを埋め込み処理を行い、乱数の値が2の場合、外接矩形A,C間の距離と外接矩形D,F間の距離との大小関係に応じて電子透かしのデータを埋め込んだ後、次に外接矩形B,D間の距離と外接矩形E,G間の距離との大小関係に応じて電子透かしのデータを埋め込む処理を行うとしてもよい。
【0053】
またここでは4つの距離の組み合わせの一例を用いた電子透かしのデータ列の埋め込み方法について説明したが、外接矩形の数が更に増えると、どの外接矩形間の距離同士の大小関係を用いるかの組み合わせ数は膨大なものとなるため、上記乱数を用いた大小関係の比較対象の選択方法を用いると、上記初期値を鍵として埋め込み側と抽出側で共有すれば、その鍵を知らない第3者はアルゴリズムが公開されても、埋め込まれた情報を抽出することはできなくなり、秘匿性が向上する。
【0054】
また、上記説明では簡単のために隣接しない外接矩形として1つおきの外接矩形を用いて説明したが、上記の電子透かしの埋め込み方法、及び抽出方法が1つおきの外接矩形に限定されないことは明らかである。
【0055】
また上記説明において、埋め込むデータが1の場合、d1>d2となるように、0の場合、d1<d2となるように上記パラメータ処理を行ったが、これに限定されるものではなく、不等号の向きは逆でも良い。すなわち、埋め込むデータが1の場合、d1<d2となるように、0の場合、d1>d2となるように上記パラメータ処理を行っても良い。その場合、当然抽出処理もこれに対応させる必要があり、d1>d2の場合、埋め込まれたデータを0として主記憶装置303に記録し、d1<d2の場合、埋め込まれたデータを1として主記憶装置303に記録する。
【0056】
[第2の実施形態]
本実施形態では、第1の実施形態に係る電子透かしのデータ列の埋め込み方法とは異なる方法で電子透かしのデータ列を文書画像に埋め込む。以下、本実施形態に係る電子透かしのデータ列を文書画像に埋め込む方法及び、この文書画像から電子透かしのデータ列を抽出する方法について説明する。なお、これらの埋め込み方法、抽出方法を実行するコンピュータの基本構成、及び各部の機能については第1の実施形態と同じとする。
【0057】
本実施形態に係る電子透かしのデータ列を埋め込む方法について図1を用いて説明する。図1は文書画像において各文字の隣接していない外接矩形間の距離を用いた本実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【0058】
A〜Gの矩形は文書画像において1行を構成する各文字の外接矩形を示すものであり、第1の実施形態で説明した処理により得られるものである。また同図において101は外接矩形A、C間の距離を示し、102は外接矩形B、D間の距離を示し、103は外接矩形C、E間の距離を示し、104は外接矩形D、F間の距離を示し、105は外接矩形E、G間の距離を示す。上述の通り、本実施形態に係る電子透かしのデータ列の埋め込み方法では、これらの距離を、埋め込むデータに応じて変化させる。
【0059】
次に、コンピュータが行う本実施形態に係る電子透かしのデータ列の埋め込み処理について、同処理のフローチャートを示す図4を参照して説明する。なお、以下の説明では1つ置きの外接矩形間の距離(図1では101乃至105)を用いる。また、以下の処理の経過などは適宜モニタ306上に表示しても良い。
【0060】
なお、ステップS400からステップS402までの各ステップにおける処理は、ステップS600からステップS602までの各ステップにおける処理と同じであるために、その説明を省略する。
【0061】
次に、1行文の各外接矩形間の距離、すなわち、101乃至105の距離の総和を計算し、その平均値pを求める(ステップS403)。具体的には、101乃至105の夫々の距離をx1,x2,x3,x4、x5とすると、その平均値pは
p=(x1+x2+x3+x4+x5)/5
として求める。そして埋め込むデータが1の場合、外接矩形間の距離が平均値よりも長くなるように、外接矩形のサイズに関するパラメータの変更及び/又は位置に関するパラメータの変更を行う(ステップS405)。例えば101の距離を制御対象とする場合、埋め込むデータが1の場合、
・ 外接矩形Cの列方向の大きさを小さくする(サイズに関するパラメータの
変更)
・ 外接矩形Cの位置を外接矩形D側に移動させる(位置に関するパラメータ
の変更)
のいずれか、もしくはその組み合わせによる処理を行う。なお、どちらを行うかの指示は予め決めていても良いし、ユーザにより入力させても良い。
【0062】
一方、埋め込むデータが0の場合、外接矩形間の距離が平均値よりも短くなるように、外接矩形のサイズに関するパラメータの変更及び/又は位置に関するパラメータの変更を行う(ステップS406)。例えば101の距離を制御対象とする場合、埋め込むデータが0の場合、
・ 外接矩形Cの列方向の大きさを大きくする(サイズに関するパラメータの変更)
・ 外接矩形Cの位置を外接矩形B側に移動させる(位置に関するパラメータの変更)
のいずれか、もしくはその組み合わせによる処理を行う。なお、どちらを行うかの指示は予め決めていても良いし、ユーザにより入力させても良い。また、外接矩形の位置、サイズを変更する制御処理に伴って、外接矩形で囲まれている文字の位置、サイズも同様に変更されるものとする。またステップS405,S406による処理は、その変更部分が最も目立たないように、すなわち画質劣化が小さくなるように上記各パラメータを予め調節しておく。
【0063】
そして更に埋め込むデータがある場合には処理をステップS404に戻し、上記処理を繰り返す。例えば埋め込むデータがまだある場合、図1の例では102の距離を制御対象として上記処理を行う。
【0064】
以上の処理により、文書画像に対して電子透かしのデータ列の埋め込みを行うことができる。なお、埋め込むデータ列が1行分の埋め込みで収まらない場合、次の行において同じ処理を繰り返す。
【0065】
そして最後に、上記平均値を鍵としてHDD304に保存する(ステップS408)。ただし、埋め込み処理が複数の行にわたる場合、埋め込み対象となる行すべて、または段落毎など、複数の行に対する隣接しない外接矩形間の長さの平均値を鍵として用いれば、鍵として保存する数を減少させることができる。
【0066】
次に、上記処理により埋め込んだ電子透かしのデータ列の抽出方法について説明する。上述の通り、電子透かしのデータ列を抽出する処理も図3に示したコンピュータにより行われる。図5に上記コンピュータが行う、上記処理により埋め込んだ電子透かしのデータ列の抽出処理のフローチャートを示す。
【0067】
ステップS500,S501の各ステップにおける処理は上記ステップS700,S701の各ステップにおける処理と同じであるために、その説明を省略する。そしてステップS502では、上記ステップS408で鍵としてHDD304に保存された平均値Dを主記憶装置303にロードする(ステップS502)。そして隣接していない外接矩形間の距離dを求める(ステップS503)。この距離dとして最初は図1の例では、d=101の距離とする。
【0068】
そしてd>Dの場合、処理をステップS505に進め、埋め込まれたデータを1として主記憶装置303に記録する(ステップS505)。一方、d<Dの場合、処理をステップS506に進め、埋め込まれたデータを0として主記憶装置303に記録する(ステップS506)。
【0069】
そして処理対象の外接矩形間がまだ残っているかを判断する(ステップS507)。図1の例では101の距離以降にまだ102の距離、103の距離、104の距離、105の距離が残っているので、処理をステップS503に戻し、d=102の距離とし、以上の処理を繰り返す。また予め電子透かしのデータの個数がわかっている場合には、その個数分のデータが主記憶装置303に記録されたか否かを判断すればよい。
【0070】
そして処理対象の外接矩形が残っていないとステップS507で判断された場合、ステップS506,ステップS507で主記憶装置303に記録されたデータ列を電子透かしのデータ列として得ることができる。以上の処理により、上記方法により電子透かしのデータ列が埋め込まれた文書画像から、このデータ列を抽出することができる。
【0071】
本実施形態に係る上記の電子透かしのデータ列の埋め込み方法は、第1の実施形態に係る電子透かしのデータ列の埋め込み方法に対して、同じ文字数が含まれた文書画像に電子透かしのデータ列の埋め込む場合に、より多くの情報量を埋め込むことができる。これは第1の実施形態に係る方法が4つの外接矩形を用いて1つの情報(上記説明では1ビットの情報)を埋め込むに対し、第2の実施形態の方法では2つの外接矩形を用いて1つの情報を埋め込むことができることに起因するものである。
【0072】
しかし文書画像全体が拡大や縮小されている場合、本実施形態に係る上記埋め込み方法は、第1の実施形態に係る埋め込み方法の様な長さの相対的な比較ではなく、平均値という固定値との比較であるため、情報の抽出が困難になる場合が考えられる。しかし、埋め込み時における情報系列がランダムである、すなわち1と0の出現確率が同等である場合、埋め込み時の平均値と、抽出時の平均値は同じであるので、上記ステップS408で、埋め込み時に用いた平均値を鍵として保存せずに、ステップS502では、再度、ステップS403と同様の処理を行い、平均値を計算し直しても良い。
【0073】
情報系列のランダム化は埋め込む情報の暗号処理などにより容易に実現できる。また、埋め込む情報系列の1と0の出現確率の偏りを吸収するために、1行中の全ての外接矩形を用いず、行末の数個分はその偏りの修正用として用いることができる。これは、例えば1行中に埋め込むデータ列に1を示すデータが著しく多い場合、この行の長さが全ての行の長さの平均値に比べて著しく長くなってしまい、明らかに目立ってしまう。
【0074】
そこでこの場合、この1行中のすべての外接矩形間に1を埋め込むのではなく、予め定めた個数(1行中に1を埋め込んだ場合に、上記平均値と比べて著しく長くなったと認識し難いレベルまでの1のデータの個数)分1を埋め込み、残りの外接矩形間には0を埋め込む。0を埋め込むのは、1を多く埋め込むことで上記平均値よりも長くなった1行の長さを短く修正するためである。
【0075】
例えば8個の1からなるデータ列を6個の外接矩形間に埋め込む場合、先頭から4個の外接矩形間に1を埋め込み、最後の2個の外接矩形間に0を埋め込む。そして残りの2個の1は次の行に埋め込む。このようにすることで、1の多いデータ列を埋め込む場合、1行が著しく長くなることはない。
【0076】
また逆に、1行に埋め込むデータ列に0を示すデータが著しく場合、この行の長さが上記平均値よりも著しく短くなってしまい、明らかに目立ってしまう。そこで、上記処理の説明において、1を0,0を1と読み替えた処理を行うことで、0の多いデータ列を埋め込む場合、1行が著しく短くなることはない。
【0077】
なおこの場合、修正用の外接矩形間の個数を埋め込み側と抽出側とで共有しておく必要があり、抽出側では最後の数個の外接矩形から情報を抽出しない。
【0078】
また、上記説明では簡単のために隣接しない外接矩形として1つおきの外接矩形を用いて説明したが、上記の電子透かしの埋め込み方法、及び抽出方法が1つおきの外接矩形に限定されないことは明らかである。
【0079】
また上記説明において、埋め込むデータが1の場合、d>Dとなるように、0の場合、d<Dとなるように上記パラメータ処理を行ったが、これに限定されるものではなく、不等号の向きは逆でも良い。すなわち、埋め込むデータが1の場合、d<Dとなるように、0の場合、d>Dとなるように上記パラメータ処理を行っても良い。その場合、当然抽出処理もこれに対応させる必要があり、d>Dの場合、埋め込まれたデータを0として主記憶装置303に記録し、d<Dの場合、埋め込まれたデータを1として主記憶装置303に記録する。
【0080】
[第3の実施形態]
本実施形態では、上記実施形態に係る電子透かしのデータ列の埋め込み方法とは異なる方法で電子透かしのデータ列を文書画像に埋め込む。以下、本実施形態に係る電子透かしのデータ列を文書画像に埋め込む方法及び、この文書画像から電子透かしのデータ列を抽出する方法について説明する。なお、これらの埋め込み方法、抽出方法を実行するコンピュータの基本構成、及び各部の機能については第1の実施形態と同じとする。
【0081】
本実施形態に係る電子透かしのデータ列を埋め込む方法について図8を用いて説明する。図8は文書画像において隣接した2個ずつの外接矩形において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される面積を用いた本実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【0082】
同図で、801は外接矩形Aの左端と外接矩形Bの右端との距離、802は外接矩形Bの左端と外接矩形Cの右端との距離、803は外接矩形Cの左端と外接矩形Dの右端との距離、804は外接矩形Dの左端と外接矩形Eの右端との距離、805は外接矩形Eの左端と外接矩形Fの右端との距離、806は外接矩形Fの左端と外接矩形Gの右端との距離を示す。また同図においてbは外接矩形Bの高さ、cは外接矩形Cの高さ、dは外接矩形Dの高さ、eは外接矩形Eの高さ、fは外接矩形Fの高さ、gは外接矩形Gの高さを示す。
【0083】
本実施形態に係る電子透かしのデータ列の埋め込み方法は、夫々の外接矩形の組(図8の例では、外接矩形A、Bの組、外接矩形B、Cの組、外接矩形C、Dの組、外接矩形D、Eの組、外接矩形E、Fの組、外接矩形F、Gの組)において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される矩形の面積(図8の例では、801の距離×bで示される面積、802の距離×cで示される面積、803の距離×dで示される面積、804の距離×eで示される面積、805の距離×fで示される面積、806の距離×gで示される面積)を埋め込むデータに応じて変化させる。なお、各組の面積の計算に用いる高さはその組に含まれるどちらの外接矩形の高さを用いても良い。また本実施形態は、1組に含まれる外接矩形の数が2つに限定されるものではない。
【0084】
次に、コンピュータが行う本実施形態に係る電子透かしのデータ列の埋め込み処理について、同処理のフローチャートを示す図9を参照して説明する。また、以下の処理の経過などは適宜モニタ306上に表示しても良い。
【0085】
なお、ステップS900からステップS902までの各ステップにおける処理は、ステップS600からステップS602までの各ステップにおける処理と同じであるために、その説明を省略する。
【0086】
次に、文書の先頭から2つの組の面積を求め、夫々をS1,S2とする(ステップS903)。図8の例では、801の距離×bを求め、これをS1、距離802×cを求め、これをS2とする。そして埋め込むデータが1である場合、処理をステップS905に進め、S1<S2となるように、面積S1を定義する幅と高さ、面積S2を定義する幅と高さの4つのパラメータを変更する(ステップS905)。図8の例では、高さb、距離801,高さc、距離802の4つのパラメータのうち1つ以上を変更して、S1<S2となるようにする。
【0087】
一方、埋め込むデータが0である場合、処理をステップS906に進め、S1>S2となるように、面積S1を定義する幅と高さ、面積S2を定義する幅と高さの4つのパラメータを変更する(ステップS906)。図8の例では、高さb、距離801,高さc、距離802の4つのパラメータのうち1つ以上を変更して、S1<S2となるようにする。また、外接矩形の位置、サイズを変更する制御処理に伴って、外接矩形で囲まれている文字の位置、サイズも同様に変更されるものとする。
【0088】
またステップS905、S906による処理は、その変更部分が最も目立たないように、すなわち画質劣化が小さくなるように上記各パラメータを予め調節しておく。
【0089】
そして更に埋め込むデータがある場合には処理をステップS903に戻し、上記処理を繰り返す。例えば埋め込むデータがまだある場合、図8の例では距離803×dを求め、これを面積S1とし、距離804×eを求め、これをS2として以上の処理を繰り返す。
【0090】
以上の処理により、文書画像に対して電子透かしのデータ列の埋め込みを行うことができる。
【0091】
次に、上記処理により埋め込んだ電子透かしのデータ列の抽出方法について説明する。上述の通り、電子透かしのデータ列を抽出する処理も図3に示したコンピュータにより行われる。図10に上記コンピュータが行う、上記処理により埋め込んだ電子透かしのデータ列の抽出処理のフローチャートを示す。
【0092】
ステップS1000,S1001、S1002の各ステップの処理は、ステップS700,S701、S903の各ステップの処理と同じであるために、その説明を省略する。
【0093】
そしてまず初めはS1は距離801×b、S2は距離802×cとして求め、S1<S2の場合(ステップS1003)、処理をステップS1004に進め、埋め込まれたデータを1として主記憶装置303に記録する(ステップS1004)。一方、S1>S2の場合、処理をステップS1005に進め、埋め込まれたデータを0として主記憶装置303に記録する(ステップS1005)。
【0094】
そして処理対象の外接矩形がまだ残っているかを判断する(ステップS1006)。図8の例では次にS1を距離803×d、S2を距離804×eとし、以上の処理を繰り返す。また予め電子透かしのデータの個数がわかっている場合には、その個数分のデータが主記憶装置303に記録されたか否かを判断すればよい。
【0095】
そして処理対象の外接矩形が残っていないとステップS1006で判断された場合、ステップS1004,ステップS1005で主記憶装置303に記録されたデータ列を電子透かしのデータ列として得ることができる。以上の処理により、上記方法により電子透かしのデータ列が埋め込まれた文書画像から、このデータ列を抽出することができる。
【0096】
なお、本実施形態ではS1,S2として2つの外接矩形による矩形の面積を用いたが、これ以外にも、外接矩形を定義する複数の独立したパラメータを用いて定式化したものを用いても良い。
【0097】
例えば、距離801+bをS1,距離802+cをS2としても良いし、距離801+(b×0.1)をS1,距離802+(c×0.1)をS2としても良い。また801乃至806を左側の外接矩形の左端から右側の外接矩形の右端までの距離とせずに、第1の実施形態と同様に、左側の外接矩形の右端から右側の外接矩形の左端までの距離としてもよい。また、上記面積の比較対象は鍵により指定しても良い。また、各面積に対して情報を埋め込む方法として他にも、第2の実施形態と同様にして、全部の面積の平均値を求め、埋め込む情報が1の場合には埋め込む対象の面積を大きくし、埋め込む情報が0の場合には埋め込む対象の面積を小さくしても良い。
【0098】
また上記説明において、埋め込むデータが1の場合、S1<S2となるように、0の場合、S1>S2となるように上記パラメータ処理を行ったが、これに限定されるものではなく、不等号の向きは逆でも良い。すなわち、埋め込むデータが1の場合、S1>S2となるように、0の場合、S1<S2となるように上記パラメータ処理を行っても良い。その場合、当然抽出処理もこれに対応させる必要があり、S1<S2の場合、埋め込まれたデータを0として主記憶装置303に記録し、S1>S2の場合、埋め込まれたデータを1として主記憶装置303に記録する。
【0099】
[第4の実施形態]
また、上記各実施形態に係る電子透かしのデータ列の埋め込み方法、抽出方法を実行するプログラムをプリンタドライバに適用してもよい。
【0100】
[そのほかの実施形態]
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0101】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0102】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0103】
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0104】
【発明の効果】
以上説明した通り、本発明により、文書画像に電子透かしのデータ列を埋め込んでも、文書画像の画質の劣化を軽減することができ、人間に目に認識しがたく電子透かしの埋め込みを行うことができる。
【図面の簡単な説明】
【図1】文書画像において各文字の隣接していない外接矩形間の距離を用いた本発明の第2の実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【図2】文書画像において、各文字の隣接していない外接矩形間の距離を用いた本発明の第1の実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【図3】本発明の実施形態に係る電子透かし埋め込み装置、電子透かし抽出装置としてのコンピュータの基本構成を示すブロック図である。
【図4】本発明の第2の実施形態に係る電子透かしのデータ列の埋め込み処理のフローチャートを示す図である。
【図5】本発明の第2の実施形態に係る電子透かしのデータ列の抽出処理のフローチャートを示す図である。
【図6】本発明の第1の実施形態に係る電子透かしのデータ列の埋め込み処理のフローチャートを示す図である。
【図7】本発明の第1の実施形態に係る電子透かしのデータ列の抽出処理のフローチャートを示す図である。
【図8】文書画像において隣接した2個ずつの外接矩形において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される面積を用いた本発明の第3の実施形態に係る電子透かしのデータ列を埋め込む方法を説明するための図である。
【図9】本発明の第3の実施形態に係る電子透かしのデータ列の埋め込み処理のフローチャートを示す図である。
【図10】本発明の第3の実施形態に係る電子透かしのデータ列の抽出処理のフローチャートを示す図である。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a digital watermark embedding device for embedding a digital watermark in a document image, a digital watermark extracting device for extracting a digital watermark from a document image in which a digital watermark is embedded, and a method thereof.
[0002]
[Prior art]
2. Description of the Related Art Digital watermarks have attracted attention as a method for protecting copyrights when digital data such as images and sounds are distributed on the Internet. Digital watermarking is a technique for embedding watermark information in digital data such as images and sounds so that humans cannot perceive it. For example, as a digital watermarking technique for a multi-valued image, various methods using the redundancy of the density of a multi-valued pixel are known.
[0003]
On the other hand, a binary image such as a document image has a low degree of redundancy, and it is difficult to implement a digital watermarking technique. However, there are some known digital watermarking systems that use features unique to document images. For example, a method of moving the baseline of a line (Japanese Patent No. 3136061), a method of operating the space length between words (US Pat. No. 6,086,706, Japanese Patent Application Laid-Open No. 9-186603), and a method of operating the space length between characters (King Mongcut) "Electronic document data hiding technique using inter-character space" by The University, The 1998 IEEE Asia-Pacific Conf. Digital Watermark by Image ", Transactions of Information Processing Society of Japan, Vol. 38 No. 11 Nov. 1997. And rotating the character to change the inclination.
[0004]
[Problems to be solved by the invention]
However, the document image has a low degree of redundancy, and the conventional methods proposed up to now have noticeable changes to embed information due to changes in one variable such as line baseline, inter-word space, and character rotation. Had the disadvantage of being large.
[0005]
The present invention has been made in view of the above problems, and an object of the present invention is to provide a digital watermark embedding apparatus and method for reducing image quality deterioration of a document image in which a digital watermark data string is embedded.
[0006]
[Means for Solving the Problems]
In order to achieve the object of the present invention, for example, a digital watermark embedding device of the present invention has the following configuration.
[0007]
That is, an electronic watermark embedding device that embeds an electronic watermark data string in a document image,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. Parameter calculation means for obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between both circumscribed rectangles in a second set different from the first set When,
The height of the circumscribed rectangles constituting the set and the distance between the circumscribed rectangles in the set are changed so that the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter changes according to the data to be embedded. A control unit that controls a character corresponding to a circumscribed rectangle to be changed by changing at least one of them.
[0008]
In order to achieve the object of the present invention, for example, a digital watermark embedding device of the present invention has the following configuration.
[0009]
That is, an electronic watermark embedding device that embeds an electronic watermark data string in a document image,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Average value calculating means for obtaining the average value of the values indicated by all the parameters.
In accordance with the data to be embedded, the height of the circumscribed rectangle constituting the target set and the distance between the circumscribed rectangles in the target set are changed so that the magnitude relationship between the value indicated by the parameter and the average value for the target set changes. A control unit that controls a character corresponding to a circumscribed rectangle to be changed by changing at least one of the rectangles.
[0010]
In order to achieve the object of the present invention, for example, a digital watermark extracting device of the present invention has the following configuration.
[0011]
That is, a digital watermark extracting device for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding device,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. Parameter calculation means for obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between both circumscribed rectangles in a second set different from the first set When,
An extraction unit that expresses the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter by a predetermined value to obtain the value as digital watermark data is provided.
[0012]
In order to achieve the object of the present invention, for example, a digital watermark extracting device of the present invention has the following configuration.
[0013]
That is, a digital watermark extracting device for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding device,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Average value calculating means for obtaining the average value of the values indicated by all the parameters.
An extraction means for expressing the magnitude relationship between the average value and the value indicated by the parameter of the target set by a predetermined value to obtain the value as digital watermark data is provided.
[0014]
In order to achieve the object of the present invention, for example, a digital watermark embedding method of the present invention has the following configuration.
[0015]
That is, a digital watermark embedding method for embedding a digital watermark data string in a document image,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. A parameter calculating step of obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between the two circumscribed rectangles in a second set different from the first set When,
The height of the circumscribed rectangles constituting the set and the distance between the circumscribed rectangles in the set are changed so that the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter changes according to the data to be embedded. A control step of controlling a character corresponding to the circumscribed rectangle to be changed by changing at least one of them.
[0016]
In order to achieve the object of the present invention, for example, a digital watermark embedding method of the present invention has the following configuration.
[0017]
That is, a digital watermark embedding method for embedding a digital watermark data string in a document image,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Calculating, an average value calculating step of calculating an average value of values indicated by all the parameters,
In accordance with the data to be embedded, the height of the circumscribed rectangle constituting the target set and the distance between the circumscribed rectangles in the target set are changed so that the magnitude relationship between the value indicated by the parameter and the average value for the target set changes. A control step of controlling a character corresponding to a circumscribed rectangle to be changed by changing at least one of the rectangles.
[0018]
In order to achieve the object of the present invention, for example, a digital watermark extracting method of the present invention has the following configuration.
[0019]
That is, a digital watermark extraction method for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding method,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. A parameter calculating step of obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between the two circumscribed rectangles in a second set different from the first set When,
An extraction step of expressing the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter as a predetermined value to obtain the value as digital watermark data.
[0020]
In order to achieve the object of the present invention, for example, a digital watermark extracting method of the present invention has the following configuration.
[0021]
That is, a digital watermark extraction method for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding method,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Calculating, an average value calculating step of calculating an average value of values indicated by all the parameters,
An extraction step of expressing a magnitude relationship between the average value and a value indicated by the parameter of the target group by a predetermined value to obtain the value as digital watermark data.
[0022]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described in detail according to preferred embodiments with reference to the accompanying drawings.
[0023]
[First Embodiment]
A method for embedding a data string of a digital watermark according to the present embodiment will be described with reference to FIG. FIG. 2 is a view for explaining a method of embedding a data string of a digital watermark according to the present embodiment using a distance between circumscribed rectangles that are not adjacent to each other in a document image.
[0024]
The rectangles A to G indicate circumscribed rectangles of each character in the document image, and are extracted using a document analysis technique. The circumscribed rectangle of each character is a rectangle circumscribing the character, and is information indicating an area for character recognition. As a method of obtaining a circumscribed rectangle of each character, first, each pixel value of the document image is projected on a vertical coordinate axis, a blank portion (a portion without a black character) is determined, a line is determined, and line division is performed. Do. Thereafter, the document image is projected line by line on the horizontal coordinate axis, a blank portion is searched, and the document image is divided into characters. This makes it possible to cut out each character as a circumscribed rectangle. As this method, for example, a method disclosed in JP-A-6-68301 can be mentioned.
[0025]
In the same figure, 201 indicates the distance between circumscribed rectangles A and C, 202 indicates the distance between circumscribed rectangles B and D, 203 indicates the distance between circumscribed rectangles D and F, and 204 indicates the circumscribed rectangles E and G. Indicates the distance between them. As described above, in the method of embedding the data string of the digital watermark according to the present embodiment, these distances are changed according to the data to be embedded.
[0026]
Hereinafter, a method of embedding the above-described digital watermark data string will be described. FIG. 3 shows a basic configuration of a computer as a digital watermark embedding device according to the present embodiment and a digital watermark extracting device for extracting a digital watermark data sequence from a document image in which the digital watermark data sequence is embedded. It is not essential to use all the units shown in FIG. 3 in order to realize the above-described embedding method and extraction method.
[0027]
In the figure, a computer 301 is a personal computer, a workstation, or the like, which is widely used, and is capable of inputting an image read by a scanner 317 and editing or storing the image. Further, the image obtained from the scanner 317 can be printed from the printer 316 on a recording medium such as paper or OHP. Various instructions and the like from the user can be input using the mouse 313 and the keyboard 314.
[0028]
Inside the computer 301, blocks described later are connected by a bus 307, and various data can be transferred between the respective blocks. The MPU 302 controls the operation of each block in the computer 301 and executes a program stored in the main storage device 303 as a RAM to execute a series of processes related to embedding of a digital watermark data sequence, which will be described later, and this embedding. A series of processing for extracting a data string of a digital watermark embedded in a document image by the processing is executed.
[0029]
The main storage device 303 includes an area for temporarily storing programs and data loaded from the HDD 304, the CD-ROM drive device 309, the DVD-ROM drive device 310, the FD drive device 311 and the like. And a work area for temporarily storing data to be processed in order to execute the processing.
[0030]
A hard disk drive (HDD) device 304 can store a program and document image data loaded in the main storage device 303 in advance, or can store processed document image data. An interface (I / F) 315 is connected to a scanner 317 that reads information recorded on a document or a film and generates image data, and is an I / F for inputting image data obtained by the scanner 317. is there. The I / F 308 is connected to the printer 316 that prints image data, and is an I / F for transmitting the image data to be printed to the printer 316.
[0031]
The CD-ROM drive device 309 is a device that can read or write data stored in a CD-ROM (CD-R / CD-RW), which is one of the external storage media. An FD (floppy (registered trademark) disk) drive device 311 is a device capable of reading data from the FD and writing data to the FD, similarly to the CD-ROM drive device 309. The DVD-ROM drive device 310 is a device that can read data from a DVD and write data to a DVD, like the FD drive device 311. If a program or a printer driver is stored in the CD-ROM, FD, DVD-ROM, or the like, install the program in the HDD 304 and load the program into the main storage device 303 as necessary. Has become.
[0032]
The I / F 312 is an I / F connected to a mouse 313 or a keyboard 314 in order to receive an input instruction therefrom. The monitor 306 is a display device that can display the result of processing for extracting a data string of a digital watermark and the process of processing. Further, the video controller 305 is a device for transmitting display data to the monitor 306.
[0033]
The digital watermark embedding process performed by the computer having the above configuration will be described with reference to FIG. 6 showing a flowchart of the process. In the following description, the distance between alternate circumscribed rectangles (201 and 202, 203 and 204 in FIG. 2 as an example) is used. The progress of the following processing may be displayed on the monitor 306 as appropriate.
[0034]
First, in response to an instruction input from the user using the mouse 313 or the keyboard 314, a document image to be embedded with a digital watermark is loaded into the main storage device 303 (step S600). This document image is obtained by reading a recording medium such as paper on which a document is recorded by the scanner 317 and converting the read result into a bitmap.
[0035]
However, the method of obtaining a document image is not limited to this. For example, a document created by a general document editor, or the above-described CD-ROM drive 309, DVD-ROM drive 310, or FD A document image may be created by bitmapping using the data of the document loaded from the drive device 311 into the main storage device 303. Further, a network I / F that can be connected to a network such as a LAN or the Internet may be provided in the device, and a document image may be received and obtained from outside via the network. However, in any of the above cases, the document image is bit-mapped.
[0036]
Next, the above-described document analysis is performed on the bit-mapped document image to obtain a circumscribed rectangle of each character (step S601). Next, when the user inputs a digital watermark data string consisting of 1 or 0 using the keyboard 314 or the mouse 313, this data string is output to the main storage device 303 via the I / F 312, and 303 (step S602).
[0037]
Next, the distance between two non-adjacent circumscribed rectangles from the head of the document is obtained, and these are set as d1 and d2, respectively (step S603). In the example of FIG. 2, the distance of 201 is obtained, and the distance is d1, and the distance of 202 is obtained, which is d2 (step S603). If the data to be embedded is 1, the process proceeds to step S605, and a process of changing one of the following two parameters or a combination thereof is performed so that d1> d2 (step S605).
[0038]
-Increase the size of the circumscribed rectangle B in the column direction or reduce the size of the circumscribed rectangle C in the column direction (change the parameter related to the size)
-Move the position of the circumscribed rectangle C to the circumscribed rectangle D, or move the position of the circumscribed rectangle B to the circumscribed rectangle D (change the parameter related to the position)
An instruction to perform either of these two parameter change processes or a process based on a combination thereof may be predetermined or may be input by the user.
[0039]
On the other hand, if the data to be embedded is 0, the process proceeds to step S606, and a process based on one of the following two parameter changing processes or a combination thereof is performed so that d1 <d2 (step S606).
[0040]
-Decrease the size of the circumscribed rectangle B in the column direction, or increase the size of the circumscribed rectangle C in the column direction (change the size parameter)
Move the position of the circumscribed rectangle C to the side of the circumscribed rectangle A, or move the position of the circumscribed rectangle B to the side of the circumscribed rectangle A (change the parameter related to the position)
An instruction to perform either of these two parameter change processes or a process based on a combination thereof may be predetermined or may be input by the user. Also, with the control processing for changing the position and size of the circumscribed rectangle, the position and size of the character surrounded by the circumscribed rectangle are also changed in the same manner.
[0041]
In the processing in steps S605 and S606, the above-described parameters are adjusted in advance so that the changed portion is the least noticeable, that is, the image quality deterioration is reduced.
[0042]
In particular, in the example of FIG. 2, the position of every third circumscribed rectangle (in FIG. 2, the circumscribed rectangles A, D, and G) does not change. Then, a data embedding process is performed. As a result, embedding that does not cause a sense of strangeness to human eyes can be realized when the space “only” between the circumscribed rectangles is changed.
[0043]
Returning to FIG. 6, if there is more data to be embedded, the process returns to step S603, and the above process is repeated. For example, if there is still data to be embedded, in the example of FIG. 2, the distance between the circumscribed rectangles D and F is obtained, this is set to d1, the distance between the circumscribed rectangles E and G is further obtained, and this is set to d2. In the above description, the circumscribed rectangles A, B, C, and D are replaced with circumscribed rectangles D, E, F, and G, respectively, and the above processing is repeated.
[0044]
With the above processing, the data string of the digital watermark can be embedded in the document image.
[0045]
Next, a method of extracting a data string of a digital watermark embedded by the above processing will be described. As described above, the process of extracting the data string of the digital watermark is also performed by the computer shown in FIG. FIG. 7 shows a flowchart of a process performed by the computer to extract a data string of a digital watermark embedded by the above process.
[0046]
First, in response to an instruction input from a user using the mouse 313 or the keyboard 314, a document image in which a digital watermark data string is embedded (hereinafter, an embedded image) is loaded into the main storage device 303 (step S700). This embedded image is obtained by reading a recording medium, such as paper or OHP, on which the embedded image obtained by the above-described embedding processing is printed by the printer 316 by the scanner 317, and converting the read result into a bitmap. However, the method of obtaining the embedded image is not limited to this, and the embedded image is loaded into the main storage device 303 from the HDD 304, the CD-ROM drive device 309, the DVD-ROM drive device 310, or the FD drive device 311. It may be something. Further, a network I / F connectable to a network such as a LAN or the Internet may be provided in the above-described device, and may be received and obtained from the outside via the network.
[0047]
Next, the above-described document analysis is performed on the embedded image to obtain a circumscribed rectangle of each character (step S701). The processing in this step is the same as the processing in step S601.
[0048]
Next, the distance d1 of 201 and the distance d2 of 202 are obtained (step S702). If d1> d2 (step S703), the process proceeds to step S704, and the embedded data is recorded as 1 in the main storage device 303 (step S704). On the other hand, if d1 <d2, the process proceeds to step S705, and the embedded data is recorded as 0 in the main storage device 303 (step S705).
[0049]
Then, it is determined whether the circumscribed rectangle to be processed still remains (step S706). In the example of FIG. 2, since E, F, and G still remain after the circumscribed rectangles A, B, C, and D, the process returns to step S702, and the distance between the circumscribed rectangles D and F is obtained. Further, the distance between the circumscribed rectangles E and G is obtained, and this is set as d2. In the above description of the extraction processing, the circumscribed rectangles A, B, C, and D are replaced with the circumscribed rectangles D, E, F, and G, respectively. Is repeated. If the number of pieces of digital watermark data is known in advance, it may be determined whether the number of pieces of data has been recorded in the main storage device 303 or not.
[0050]
If it is determined in step S706 that there is no circumscribed rectangle to be processed, the data sequence recorded in the main storage device 303 in steps S704 and S705 can be obtained as a digital watermark data sequence. With the above processing, this data string can be extracted from the document image in which the digital watermark data string is embedded by the above method.
[0051]
In the above description, after embedding the digital watermark data according to the magnitude relationship between the distance between the circumscribed rectangles A and C and the distance between the circumscribed rectangles B and D, the distance between the circumscribed rectangles D and F is then determined. Although the digital watermark data is embedded according to the magnitude relationship with the distance between the circumscribed rectangles E and G, the comparison target of the magnitude relationship is not limited to this. That is, for example, after embedding digital watermark data in accordance with the magnitude relation between the distance between the circumscribed rectangles A and C and the distance between the circumscribed rectangles D and F, the distance between the circumscribed rectangles B and D and the circumscribed rectangle are then embedded. Digital watermark data may be embedded according to the magnitude relationship with the distance between E and G.
[0052]
Alternatively, a pseudo random number may be generated with a certain value as an initial value, and a comparison target having a magnitude relation may be selected according to the value of the random number. For example, if the value of the random number is 1, after embedding the digital watermark data according to the magnitude relationship between the distance between the circumscribed rectangles A and C and the distance between the circumscribed rectangles B and D, then, Is performed according to the magnitude relationship between the distance between the circumscribed rectangles E and G, and if the value of the random number is 2, the distance between the circumscribed rectangles A and C and the circumscribed rectangles D and F After embedding the digital watermark data in accordance with the magnitude relationship with the distance between them, the digital watermark data is then embedded in accordance with the magnitude relationship between the distance between the circumscribed rectangles B and D and the distance between the circumscribed rectangles E and G. An embedding process may be performed.
[0053]
Although the method of embedding a data string of a digital watermark using an example of a combination of four distances has been described here, when the number of circumscribed rectangles further increases, a combination of which circumscribed rectangles use the magnitude relationship between the distances is used. Since the number is enormous, if the method for selecting the comparison target of the magnitude relation using the random numbers is used, if the initial value is shared between the embedding side and the extracting side as a key, a third party who does not know the key Even if the algorithm is made public, the embedded information cannot be extracted, and the confidentiality is improved.
[0054]
In the above description, every other circumscribed rectangle is described as a non-adjacent circumscribed rectangle for simplicity. However, the method of embedding and extracting the digital watermark is not limited to every other circumscribed rectangle. it is obvious.
[0055]
In the above description, the parameter processing is performed so that d1> d2 when the data to be embedded is 1, and d1 <d2 when the data to be embedded is 0. However, the present invention is not limited to this. The direction may be reversed. That is, the parameter processing may be performed such that d1 <d2 when the data to be embedded is 1, and d1> d2 when the data to be embedded is 0. In this case, the extraction process must also correspond to this. When d1> d2, the embedded data is recorded as 0 in the main storage device 303, and when d1 <d2, the embedded data is set as 1 The information is recorded in the storage device 303.
[0056]
[Second embodiment]
In this embodiment, a digital watermark data string is embedded in a document image by a method different from the digital watermark data string embedding method according to the first embodiment. Hereinafter, a method of embedding a digital watermark data string in a document image and a method of extracting a digital watermark data string from the document image according to the present embodiment will be described. The basic configuration of a computer that executes the embedding method and the extracting method, and the functions of each unit are the same as those in the first embodiment.
[0057]
A method for embedding a digital watermark data string according to the present embodiment will be described with reference to FIG. FIG. 1 is a diagram for explaining a method for embedding a data string of a digital watermark according to the present embodiment using a distance between circumscribed rectangles that are not adjacent to each other in a document image.
[0058]
The rectangles A to G indicate circumscribed rectangles of each character constituting one line in the document image, and are obtained by the processing described in the first embodiment. In the same figure, 101 indicates the distance between circumscribed rectangles A and C, 102 indicates the distance between circumscribed rectangles B and D, 103 indicates the distance between circumscribed rectangles C and E, and 104 indicates the circumscribed rectangles D and F. 105 indicates the distance between the circumscribed rectangles E and G. As described above, in the method of embedding the data string of the digital watermark according to the present embodiment, these distances are changed according to the data to be embedded.
[0059]
Next, a process of embedding a data string of a digital watermark according to the present embodiment performed by a computer will be described with reference to FIG. 4 showing a flowchart of the process. In the following description, the distance between alternate circumscribed rectangles (101 to 105 in FIG. 1) is used. The progress of the following processing may be displayed on the monitor 306 as appropriate.
[0060]
Note that the processing in each step from step S400 to step S402 is the same as the processing in each step from step S600 to step S602, and a description thereof will be omitted.
[0061]
Next, the distance between the circumscribed rectangles of one line sentence, that is, the sum of the distances 101 to 105 is calculated, and the average value p is obtained (step S403). Specifically, assuming that the distances of 101 to 105 are x1, x2, x3, x4, and x5, the average value p is p = (x1 + x2 + x3 + x4 + x5) / 5
Asking. If the data to be embedded is 1, the parameter related to the size of the circumscribed rectangle and / or the parameter related to the position is changed so that the distance between the circumscribed rectangles is longer than the average value (step S405). For example, if the distance of 101 is to be controlled, and the data to be embedded is 1,
-Decrease the size of the circumscribed rectangle C in the column direction (change the size parameter)
・ Move the position of the circumscribed rectangle C to the circumscribed rectangle D (change the parameter related to the position)
, Or a combination thereof. Note that the instruction to perform either may be determined in advance, or may be input by the user.
[0062]
On the other hand, when the data to be embedded is 0, the parameters related to the size of the circumscribed rectangle and / or the parameters related to the position are changed so that the distance between the circumscribed rectangles is shorter than the average value (step S406). For example, if the distance of 101 is to be controlled, and if the data to be embedded is 0,
・ Increase the size of the circumscribed rectangle C in the column direction (change the size parameter)
・ Move the position of the circumscribed rectangle C to the circumscribed rectangle B (change the parameter related to the position)
, Or a combination thereof. Note that the instruction to perform either may be determined in advance, or may be input by the user. Also, with the control processing for changing the position and size of the circumscribed rectangle, the position and size of the character surrounded by the circumscribed rectangle are also changed in the same manner. In the processing in steps S405 and S406, the above-described parameters are adjusted in advance so that the changed portion is the least noticeable, that is, the image quality deterioration is reduced.
[0063]
If there is more data to be embedded, the process returns to step S404, and the above process is repeated. For example, when there is data to be embedded, the above processing is performed with the distance 102 as a control target in the example of FIG.
[0064]
With the above processing, the data string of the digital watermark can be embedded in the document image. If the data string to be embedded does not fit in one row, the same processing is repeated in the next row.
[0065]
Finally, the average value is stored in the HDD 304 as a key (step S408). However, if the embedding process extends over multiple lines, if the average value of the length between non-adjacent circumscribed rectangles for multiple lines, such as all the lines to be embedded or for each paragraph, is used as the key, the number to be stored as a key is reduced. Can be reduced.
[0066]
Next, a method of extracting a data string of a digital watermark embedded by the above processing will be described. As described above, the process of extracting the data string of the digital watermark is also performed by the computer shown in FIG. FIG. 5 shows a flowchart of a process performed by the computer for extracting a data string of a digital watermark embedded by the process.
[0067]
Since the processing in each of the steps S500 and S501 is the same as the processing in each of the steps S700 and S701, the description thereof is omitted. Then, in step S502, the average value D stored in the HDD 304 as a key in step S408 is loaded into the main storage device 303 (step S502). Then, a distance d between circumscribed rectangles that are not adjacent to each other is obtained (step S503). In the example of FIG. 1, initially, the distance d is a distance of d = 101.
[0068]
If d> D, the process proceeds to step S505, and the embedded data is recorded as 1 in the main storage device 303 (step S505). On the other hand, if d <D, the process proceeds to step S506, and the embedded data is recorded as 0 in the main storage device 303 (step S506).
[0069]
Then, it is determined whether or not the circumscribed rectangles to be processed still remain (step S507). In the example of FIG. 1, since the distance of 102, the distance of 103, the distance of 104, and the distance of 105 still remain after the distance of 101, the process returns to step S503, and the distance is set to d = 102. repeat. If the number of pieces of digital watermark data is known in advance, it may be determined whether the number of pieces of data has been recorded in the main storage device 303 or not.
[0070]
If it is determined in step S507 that there is no circumscribed rectangle to be processed, the data sequence recorded in the main storage device 303 in steps S506 and S507 can be obtained as a data sequence of a digital watermark. With the above processing, this data string can be extracted from the document image in which the digital watermark data string is embedded by the above method.
[0071]
The method of embedding a data string of a digital watermark according to the present embodiment is different from the method of embedding a data string of a digital watermark according to the first embodiment in that a data string of a digital watermark is added to a document image containing the same number of characters. When embedding, more information can be embedded. This is because the method according to the first embodiment embeds one piece of information (one-bit information in the above description) using four circumscribed rectangles, while the method according to the second embodiment uses two circumscribed rectangles. This is because one piece of information can be embedded.
[0072]
However, when the entire document image is enlarged or reduced, the embedding method according to the present embodiment is not a relative comparison of lengths as in the embedding method according to the first embodiment, but a fixed value called an average value. Therefore, it may be difficult to extract information. However, when the information sequence at the time of embedding is random, that is, when the appearance probabilities of 1 and 0 are equal, the average value at the time of embedding and the average value at the time of extraction are the same. In step S502, the same processing as step S403 may be performed again to calculate the average again without storing the used average as a key.
[0073]
Randomization of the information sequence can be easily realized by encryption processing of the information to be embedded. Also, in order to absorb the deviation of the appearance probabilities of 1 and 0 of the information sequence to be embedded, all the circumscribed rectangles in one line are not used, and several lines at the end of the line can be used for correcting the deviation. This is because, for example, when data indicating 1 is extremely large in a data string to be embedded in one row, the length of this row is significantly longer than the average value of the lengths of all rows, and is clearly conspicuous. .
[0074]
Therefore, in this case, instead of embedding ones between all the circumscribed rectangles in this one row, it is recognized that a predetermined number (one embeddings in one row becomes considerably longer than the above average value). 1 is embedded for the number of data of 1 up to a difficult level), and 0 is embedded between the remaining circumscribed rectangles. The reason why 0 is embedded is to correct the length of one line longer than the average value by embedding many 1s.
[0075]
For example, when embedding a data string composed of eight 1s between six circumscribed rectangles, 1 is embedded between the four circumscribed rectangles from the beginning, and 0 is embedded between the last two circumscribed rectangles. Then, the remaining two 1s are embedded in the next line. In this way, when embedding a large number of data strings, one row does not become extremely long.
[0076]
Conversely, when data indicating 0 is remarkable in a data string to be embedded in one row, the length of this row becomes significantly shorter than the above average value, which is clearly noticeable. Therefore, in the description of the above process, when a process in which 1 is read as 0 and 0 is read as 1 to embed a data string having many 0s, one row is not significantly shortened.
[0077]
In this case, the number of circumscribed rectangles for correction needs to be shared between the embedding side and the extracting side, and the extracting side does not extract information from the last few circumscribed rectangles.
[0078]
In the above description, every other circumscribed rectangle is described as a non-adjacent circumscribed rectangle for simplicity. However, the method of embedding and extracting the digital watermark is not limited to every other circumscribed rectangle. it is obvious.
[0079]
In the above description, the parameter processing is performed such that d> D when the data to be embedded is 1 and d <D when the data to be embedded is 0. However, the present invention is not limited to this. The direction may be reversed. That is, the parameter processing may be performed such that d <D when the data to be embedded is 1, and d> D when the data to be embedded is 0. In this case, the extraction process must also correspond to this. When d> D, the embedded data is recorded as 0 in the main storage device 303, and when d <D, the embedded data is set as 1 The information is recorded in the storage device 303.
[0080]
[Third Embodiment]
In the present embodiment, a data string of a digital watermark is embedded in a document image by a method different from the method of embedding a data string of a digital watermark according to the above embodiment. Hereinafter, a method of embedding a digital watermark data string in a document image and a method of extracting a digital watermark data string from the document image according to the present embodiment will be described. The basic configuration of a computer that executes the embedding method and the extracting method, and the functions of each unit are the same as those in the first embodiment.
[0081]
A method for embedding a data string of a digital watermark according to the present embodiment will be described with reference to FIG. FIG. 8 shows a data string of a digital watermark according to the present embodiment using an area defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles in two adjacent circumscribed rectangles in the document image. FIG. 6 is a diagram for explaining a method of embedding.
[0082]
In the figure, 801 is the distance between the left end of the circumscribed rectangle A and the right end of the circumscribed rectangle B, 802 is the distance between the left end of the circumscribed rectangle B and the right end of the circumscribed rectangle C, and 803 is the distance between the left end of the circumscribed rectangle C and the circumscribed rectangle D. 804 is the distance between the left end of circumscribed rectangle D and the right end of circumscribed rectangle E, 805 is the distance between the left end of circumscribed rectangle E and the right end of circumscribed rectangle F, 806 is the left end of circumscribed rectangle F and circumscribed rectangle G Indicates the distance to the right end of In the same figure, b is the height of the circumscribed rectangle B, c is the height of the circumscribed rectangle C, d is the height of the circumscribed rectangle D, e is the height of the circumscribed rectangle E, f is the height of the circumscribed rectangle F, g Indicates the height of the circumscribed rectangle G.
[0083]
The method of embedding the data string of the digital watermark according to the present embodiment is performed by using a set of circumscribed rectangles (in the example of FIG. 8, a set of circumscribed rectangles A and B, a set of circumscribed rectangles B and C, and a set of circumscribed rectangles C and D). Set, a set of circumscribed rectangles D and E, a set of circumscribed rectangles E and F, a set of circumscribed rectangles F and G), a rectangle defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles In the example of FIG. 8, the area represented by distance 801 × b, the area represented by distance 802 × c, the area represented by distance 803 × d, the area represented by distance 804 × e, the area represented by distance 804 (Area indicated by distance × f, area indicated by distance × g of 806) is changed according to the data to be embedded. The height used for calculating the area of each set may be the height of any circumscribed rectangle included in the set. Further, in the present embodiment, the number of circumscribed rectangles included in one set is not limited to two.
[0084]
Next, a process of embedding a data string of a digital watermark according to the present embodiment performed by a computer will be described with reference to FIG. 9 showing a flowchart of the process. The progress of the following processing may be displayed on the monitor 306 as appropriate.
[0085]
Note that the processing in each step from step S900 to step S902 is the same as the processing in each step from step S600 to step S602, and a description thereof will be omitted.
[0086]
Next, the area of the two sets from the head of the document is obtained, and these areas are set as S1 and S2 (step S903). In the example of FIG. 8, a distance × b of 801 is obtained, this is S1, a distance 802 × c is obtained, and this is S2. If the data to be embedded is 1, the process proceeds to step S905, and the four parameters of the width and height defining the area S1 and the width and height defining the area S2 are changed so that S1 <S2. (Step S905). In the example of FIG. 8, one or more of the four parameters of height b, distance 801, height c, and distance 802 are changed so that S1 <S2.
[0087]
On the other hand, if the data to be embedded is 0, the process proceeds to step S906, and the four parameters of the width and height defining the area S1 and the width and height defining the area S2 are changed so that S1> S2. (Step S906). In the example of FIG. 8, one or more of the four parameters of height b, distance 801, height c, and distance 802 are changed so that S1 <S2. Also, with the control processing for changing the position and size of the circumscribed rectangle, the position and size of the character surrounded by the circumscribed rectangle are also changed in the same manner.
[0088]
In the processing in steps S905 and S906, the above-described parameters are adjusted in advance so that the changed portion is the least noticeable, that is, the image quality deterioration is reduced.
[0089]
If there is more data to be embedded, the process returns to step S903, and the above process is repeated. For example, if there is data to be embedded, a distance 803 × d is obtained in the example of FIG. 8, this is set as an area S1, a distance 804 × e is obtained, and this is set as S2, and the above processing is repeated.
[0090]
With the above processing, the data string of the digital watermark can be embedded in the document image.
[0091]
Next, a method of extracting a data string of a digital watermark embedded by the above processing will be described. As described above, the process of extracting the data string of the digital watermark is also performed by the computer shown in FIG. FIG. 10 shows a flowchart of a process performed by the computer for extracting a data string of a digital watermark embedded by the above process.
[0092]
The processing of each step of steps S1000, S1001, and S1002 is the same as the processing of each step of steps S700, S701, and S903, and thus description thereof is omitted.
[0093]
Then, first, S1 is obtained as the distance 801 × b and S2 is obtained as the distance 802 × c. If S1 <S2 (step S1003), the process proceeds to step S1004, and the embedded data is recorded as 1 in the main storage device 303. (Step S1004). On the other hand, if S1> S2, the process proceeds to step S1005, and the embedded data is recorded as 0 in the main storage device 303 (step S1005).
[0094]
Then, it is determined whether the circumscribed rectangle to be processed still remains (step S1006). In the example of FIG. 8, next, S1 is set to the distance 803 × d and S2 is set to the distance 804 × e, and the above processing is repeated. If the number of pieces of digital watermark data is known in advance, it may be determined whether the number of pieces of data has been recorded in the main storage device 303 or not.
[0095]
If it is determined in step S1006 that there is no circumscribed rectangle to be processed, the data sequence recorded in the main storage device 303 in steps S1004 and S1005 can be obtained as a data sequence of a digital watermark. With the above processing, this data string can be extracted from the document image in which the digital watermark data string is embedded by the above method.
[0096]
In the present embodiment, S1 and S2 use the area of a rectangle formed by two circumscribed rectangles. However, other than that, a formula formulated using a plurality of independent parameters that define the circumscribed rectangle may be used. .
[0097]
For example, the distance 801 + b may be S1 and the distance 802 + c may be S2, or the distance 801+ (b × 0.1) may be S1 and the distance 802+ (c × 0.1) may be S2. Further, instead of using 801 to 806 as the distance from the left end of the left circumscribed rectangle to the right end of the right circumscribed rectangle, similarly to the first embodiment, the distance from the right end of the left circumscribed rectangle to the left end of the right circumscribed rectangle It may be. The comparison target of the area may be designated by a key. As another method of embedding information in each area, similarly to the second embodiment, an average value of all areas is obtained, and when the information to be embedded is 1, the area to be embedded is increased. When the information to be embedded is 0, the area to be embedded may be reduced.
[0098]
In the above description, the parameter processing is performed such that S1 <S2 when the data to be embedded is 1 and S1> S2 when the data to be embedded is 0. However, the present invention is not limited to this. The direction may be reversed. That is, the parameter processing may be performed such that S1> S2 when the data to be embedded is 1, and S1 <S2 when the data to be embedded is 0. In this case, the extraction process must also correspond to this. When S1 <S2, the embedded data is recorded in the main storage device 303 as 0, and when S1> S2, the embedded data is set as 1 The information is recorded in the storage device 303.
[0099]
[Fourth embodiment]
Further, a program for executing the method for embedding and extracting the data sequence of the digital watermark according to each of the above embodiments may be applied to the printer driver.
[0100]
[Other Embodiments]
An object of the present invention is to supply a recording medium (or a storage medium) on which a program code of software for realizing the functions of the above-described embodiments is recorded to a system or an apparatus, and to provide a computer (or CPU or MPU) of the system or the apparatus. Can be achieved by reading and executing the program code stored in the recording medium. In this case, the program code itself read from the recording medium implements the functions of the above-described embodiment, and the recording medium on which the program code is recorded constitutes the present invention.
[0101]
When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also an operating system (OS) running on the computer based on the instruction of the program code. It goes without saying that a part or all of the actual processing is performed and the functions of the above-described embodiments are realized by the processing.
[0102]
Further, after the program code read from the recording medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the function is executed based on the instruction of the program code. It goes without saying that the CPU included in the expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.
[0103]
When the present invention is applied to the recording medium, the recording medium stores program codes corresponding to the flowcharts described above.
[0104]
【The invention's effect】
As described above, according to the present invention, even when a data string of a digital watermark is embedded in a document image, deterioration of the image quality of the document image can be reduced, and the digital watermark is hardly recognized by human eyes. it can.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining a method for embedding a data string of a digital watermark according to a second embodiment of the present invention using a distance between circumscribed rectangles that are not adjacent to each other in a document image.
FIG. 2 is a diagram for explaining a method for embedding a data string of a digital watermark according to the first embodiment of the present invention using a distance between circumscribed rectangles that are not adjacent to each other in a document image.
FIG. 3 is a block diagram showing a basic configuration of a computer as a digital watermark embedding device and a digital watermark extracting device according to an embodiment of the present invention.
FIG. 4 is a diagram showing a flowchart of a process of embedding a data string of a digital watermark according to a second embodiment of the present invention.
FIG. 5 is a diagram illustrating a flowchart of a process of extracting a data string of a digital watermark according to a second embodiment of the present invention.
FIG. 6 is a diagram showing a flowchart of a process of embedding a data string of a digital watermark according to the first embodiment of the present invention.
FIG. 7 is a diagram showing a flowchart of a digital watermark data string extraction process according to the first embodiment of the present invention.
FIG. 8 shows a third embodiment of the present invention using an area defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles in two adjacent circumscribed rectangles in a document image. FIG. 3 is a diagram for explaining a method of embedding such a digital watermark data sequence.
FIG. 9 is a diagram illustrating a flowchart of a process of embedding a data string of a digital watermark according to a third embodiment of the present invention.
FIG. 10 is a diagram showing a flowchart of a digital watermark data string extraction process according to a third embodiment of the present invention.

Claims (15)

文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算手段と、
埋め込むデータに応じて前記第1のパラメータが示す値と第2のパラメータが示す値の大小関係が変化するように、前記組を構成する外接矩形の高さ、前記組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御手段と
を備えることを特徴とする電子透かし埋め込み装置。
An electronic watermark embedding device that embeds an electronic watermark data sequence in a document image,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. Parameter calculation means for obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between both circumscribed rectangles in a second set different from the first set When,
The height of the circumscribed rectangles constituting the set and the distance between the circumscribed rectangles in the set are changed so that the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter changes according to the data to be embedded. A digital watermark embedding device, comprising: control means for controlling a character corresponding to a circumscribed rectangle to be changed by changing at least one of them.
前記第1のパラメータ、前記第2のパラメータは、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される矩形の面積を示すことを特徴とする請求項1に記載の電子透かし埋め込み装置。The electronic device according to claim 1, wherein the first parameter and the second parameter indicate an area of a rectangle defined by a height of one circumscribed rectangle and a distance between both circumscribed rectangles. Watermark embedding device. 文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算手段と、
埋め込むデータに応じて、注目組に対する前記パラメータが示す値と前記平均値の大小関係が変化するように、当該注目組を構成する外接矩形の高さ、当該注目組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御手段と
を備えることを特徴とする電子透かし埋め込み装置。
An electronic watermark embedding device that embeds an electronic watermark data sequence in a document image,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Average value calculating means for obtaining the average value of the values indicated by all the parameters.
In accordance with the data to be embedded, the height of the circumscribed rectangles constituting the target set and the distance between the circumscribed rectangles in the target set are changed so that the magnitude relationship between the value indicated by the parameter and the average value for the target set changes. Control means for controlling a character corresponding to a circumscribed rectangle to be changed by changing at least one of them.
請求項1又は2に記載の電子透かし埋め込み装置により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算手段と、
前記第1のパラメータが示す値と第2のパラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出手段と
を備えることを特徴とする電子透かし抽出装置。
A digital watermark extracting device for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding device according to claim 1 or 2,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. Parameter calculation means for obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between both circumscribed rectangles in a second set different from the first set When,
An electronic device comprising: an extracting unit that expresses a magnitude relationship between a value indicated by the first parameter and a value indicated by the second parameter by a predetermined value to obtain the value as digital watermark data. Watermark extraction device.
前記第1のパラメータ、前記第2のパラメータは、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される矩形の面積を示すことを特徴とする請求項4に記載の電子透かし抽出装置。5. The electronic device according to claim 4, wherein the first parameter and the second parameter indicate a rectangular area defined by a height of one circumscribed rectangle and a distance between the two circumscribed rectangles. 6. Watermark extraction device. 請求項3に記載の電子透かし埋め込み装置により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出装置であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算手段と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算手段と、
当該平均値と、注目組の前記パラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出手段と
を備えることを特徴とする電子透かし抽出装置。
A digital watermark extracting device for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding device according to claim 3,
Circumscribed rectangle calculation means for finding a circumscribed rectangle of each character constituting the document image,
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Average value calculating means for obtaining the average value of the values indicated by all the parameters.
An electronic watermark extracting apparatus, comprising: an extracting unit that expresses a magnitude relationship between the average value and a value indicated by the parameter of the set of interest with a predetermined value to obtain the value as electronic watermark data. .
文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算工程と、
埋め込むデータに応じて前記第1のパラメータが示す値と第2のパラメータが示す値の大小関係が変化するように、前記組を構成する外接矩形の高さ、前記組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御工程と
を備えることを特徴とする電子透かし埋め込み方法。
A digital watermark embedding method for embedding a digital watermark data string in a document image,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. A parameter calculating step of obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between the two circumscribed rectangles in a second set different from the first set When,
The height of the circumscribed rectangles constituting the set and the distance between the circumscribed rectangles in the set are changed so that the magnitude relationship between the value indicated by the first parameter and the value indicated by the second parameter changes according to the data to be embedded. Controlling a character corresponding to a circumscribing rectangle to be changed by changing at least one of them.
文書画像に対して電子透かしのデータ列を埋め込む電子透かし埋め込み方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算工程と、
埋め込むデータに応じて、注目組に対する前記パラメータが示す値と前記平均値の大小関係が変化するように、当該注目組を構成する外接矩形の高さ、当該注目組における外接矩形間の距離のうち少なくとも一つを変更することで、変更する外接矩形に対応する文字を制御する制御工程と
を備えることを特徴とする電子透かし埋め込み方法。
A digital watermark embedding method for embedding a digital watermark data string in a document image,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Calculating, an average value calculating step of calculating an average value of values indicated by all the parameters,
In accordance with the data to be embedded, the height of the circumscribed rectangles constituting the target set and the distance between the circumscribed rectangles in the target set are changed so that the magnitude relationship between the value indicated by the parameter and the average value for the target set changes. Controlling a character corresponding to a circumscribing rectangle to be changed by changing at least one of them.
請求項7に記載の電子透かし埋め込み方法により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組である第1の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第1のパラメータと、前記第1の組とは異なる第2の組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義される第2のパラメータとを求めるパラメータ計算工程と、
前記第1のパラメータが示す値と第2のパラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出工程と
を備えることを特徴とする電子透かし抽出方法。
A digital watermark extraction method for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding method according to claim 7,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a first set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the first set is defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles. A parameter calculating step of obtaining a first parameter and a second parameter defined by a height of one circumscribed rectangle and a distance between the two circumscribed rectangles in a second set different from the first set When,
An extraction step of expressing a magnitude relationship between a value indicated by the first parameter and a value indicated by the second parameter by a predetermined value to obtain the value as digital watermark data. Watermark extraction method.
請求項8に記載の電子透かし埋め込み方法により電子透かしのデータ列が埋め込まれた文書画像から当該電子透かしのデータ列を抽出する電子透かし抽出方法であって、
前記文書画像を構成する各文字の外接矩形を求める外接矩形計算工程と、
注目外接矩形と、当該注目外接矩形と所定個数離れた位置にある外接矩形との組において、一方の外接矩形の高さと、両方の外接矩形間の距離とで定義されるパラメータを全ての組について求め、全ての当該パラメータが示す値の平均値を求める平均値計算工程と、
当該平均値と、注目組の前記パラメータが示す値との大小関係を所定の値で表現することで、当該値を電子透かしのデータとして得る抽出工程と
を備えることを特徴とする電子透かし抽出方法。
A digital watermark extracting method for extracting a digital watermark data sequence from a document image in which a digital watermark data sequence is embedded by the digital watermark embedding method according to claim 8,
A circumscribed rectangle calculating step of finding a circumscribed rectangle of each character constituting the document image;
In a set of a circumscribed rectangle of interest and a circumscribed rectangle located a predetermined number of positions away from the circumscribed rectangle of interest, the parameters defined by the height of one circumscribed rectangle and the distance between both circumscribed rectangles are set for all sets. Calculating, an average value calculating step of calculating an average value of values indicated by all the parameters,
A digital watermark extraction method, comprising: expressing a magnitude relationship between the average value and a value indicated by the parameter of the set of interest by a predetermined value to obtain the value as digital watermark data. .
コンピュータを、請求項1乃至3のいずれか1項に記載の電子透かし埋め込み装置として機能させることを特徴とするプログラム。A program for causing a computer to function as the digital watermark embedding device according to any one of claims 1 to 3. コンピュータを、請求項4乃至6のいずれか1項に記載の電子透かし抽出装置として機能させることを特徴とするプログラム。A program for causing a computer to function as the digital watermark extraction device according to any one of claims 4 to 6. コンピュータに、請求項7又は8に記載の電子透かし埋め込み方法を実行させるためのプログラム。A program for causing a computer to execute the digital watermark embedding method according to claim 7. コンピュータに、請求項9又は10に記載の電子透かし抽出方法を実行させるためのプログラム。A program for causing a computer to execute the digital watermark extraction method according to claim 9. 請求項11乃至14のいずれか1項に記載のプログラムを格納することを特徴とするコンピュータ読みとり可能な記憶媒体。A computer-readable storage medium storing the program according to any one of claims 11 to 14.
JP2002177646A 2002-06-18 2002-06-18 Digital watermark embedding device, digital watermark extraction device, and methods thereof Expired - Fee Related JP3703445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002177646A JP3703445B2 (en) 2002-06-18 2002-06-18 Digital watermark embedding device, digital watermark extraction device, and methods thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002177646A JP3703445B2 (en) 2002-06-18 2002-06-18 Digital watermark embedding device, digital watermark extraction device, and methods thereof

Publications (2)

Publication Number Publication Date
JP2004023566A true JP2004023566A (en) 2004-01-22
JP3703445B2 JP3703445B2 (en) 2005-10-05

Family

ID=31175629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002177646A Expired - Fee Related JP3703445B2 (en) 2002-06-18 2002-06-18 Digital watermark embedding device, digital watermark extraction device, and methods thereof

Country Status (1)

Country Link
JP (1) JP3703445B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006191520A (en) * 2004-12-08 2006-07-20 Ricoh Co Ltd Device and method for embedding information, device and method for extracting information, document image generating method, printed matter generating method, document image, printed matter and information embedding program, information extraction program and recording medium
CN1326383C (en) * 2004-06-30 2007-07-11 佳能株式会社 Image processing apparatus, image processing method, computer program and computer readable storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07123244A (en) * 1993-09-03 1995-05-12 Toshiba Corp Picture processor
JPH09186603A (en) * 1995-12-28 1997-07-15 Oki Electric Ind Co Ltd Encoding and decoding method utilizing inter-work blank part length of electronic document, method for embedding signing information to electronic document and method for ciphering confidential document
JP2000010478A (en) * 1998-06-26 2000-01-14 Matsushita Electric Ind Co Ltd Signature information embedment apparatus, signature information extraction apparatus, signature information embedment method and signature information extraction method
JP2001053954A (en) * 1999-08-17 2001-02-23 Ntt Data Corp Device and method for embedding information and reading information, digital watermark system and recording medium

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07123244A (en) * 1993-09-03 1995-05-12 Toshiba Corp Picture processor
JPH09186603A (en) * 1995-12-28 1997-07-15 Oki Electric Ind Co Ltd Encoding and decoding method utilizing inter-work blank part length of electronic document, method for embedding signing information to electronic document and method for ciphering confidential document
JP2000010478A (en) * 1998-06-26 2000-01-14 Matsushita Electric Ind Co Ltd Signature information embedment apparatus, signature information extraction apparatus, signature information embedment method and signature information extraction method
JP2001053954A (en) * 1999-08-17 2001-02-23 Ntt Data Corp Device and method for embedding information and reading information, digital watermark system and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1326383C (en) * 2004-06-30 2007-07-11 佳能株式会社 Image processing apparatus, image processing method, computer program and computer readable storage medium
JP2006191520A (en) * 2004-12-08 2006-07-20 Ricoh Co Ltd Device and method for embedding information, device and method for extracting information, document image generating method, printed matter generating method, document image, printed matter and information embedding program, information extraction program and recording medium
JP4532331B2 (en) * 2004-12-08 2010-08-25 株式会社リコー Information embedding device, information extracting device, information embedding method, information extracting method, information embedding program, and information extracting program

Also Published As

Publication number Publication date
JP3703445B2 (en) 2005-10-05

Similar Documents

Publication Publication Date Title
US7548633B2 (en) Data processing apparatus and method, data processing program, and storage medium
US7106884B2 (en) Digital watermark embedding apparatus for document, digital watermark extraction apparatus for document, and their control method
JP2004023565A (en) Electronic watermark burying apparatus, electronic watermark extracting apparatuses, and method thereof
JP2004104494A (en) Electronic watermark embedding device and its control method
JP4194462B2 (en) Digital watermark embedding method, digital watermark embedding apparatus, program for realizing them, and computer-readable storage medium
JP4164463B2 (en) Information processing apparatus and control method thereof
JPWO2007049340A1 (en) Digital watermark embedding and detection
US20060002584A1 (en) Image processing apparatus, image processing method, computer program and computer readable storage medium
JP2006202295A (en) Digital photograph management device, digital photograph management method, and computer-readable recording medium storing computer program
JP3919656B2 (en) Digital watermark embedding device, digital watermark embedding method, digital watermark extraction device, digital watermark extraction method
US7269274B2 (en) Digital watermark embedding method, digital watermark extraction method, digital watermark embedding apparatus, and digital watermark extraction apparatus
JP3703445B2 (en) Digital watermark embedding device, digital watermark extraction device, and methods thereof
JP2006222572A (en) Image processing apparatus, image processing method, and image processing program
JP2006025409A (en) Apparatus and method for image processing
JP4164458B2 (en) Information processing apparatus and method, computer program, and computer-readable storage medium
JP2002232679A (en) Method and device for image processing, computer program, and storage medium
JP3805141B2 (en) Image processing method and apparatus, and storage medium
JP2004247883A (en) Image processing method
JP3884997B2 (en) Digital watermark embedding apparatus, digital watermark extraction apparatus and methods, computer program, and recording medium
JP4871793B2 (en) Information processing apparatus and method
JPH11234502A (en) Digital data book, digital data book processing method, digital data book processing unit, and recording medium recording digital data book processing program
JP3777993B2 (en) Image data processing method, image data processing apparatus, and image data processing program
JP2003008877A (en) Device and method for image processing
JP2010010835A (en) Image processor and image processing method
JP2006261974A (en) Information embedding method, information restoring method, information embedding device and information restoring device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050719

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080729

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110729

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120729

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees